Page 82 - 大数据技术及安全研究
P. 82

大数据技术及安全研究
                     Big Data Technology and Security Research


             全部都采集了,并且能够建立一个预测模型。比如,对于疾病的诊断,当查体后
             会发现一些异常指标时会去咨询医生。医生说肿瘤标志物高时,不代表一定有问
             题。因为单一指标不能确切地说明问题,一些指标应该组合起来看。我们筛选出
             哪些指标作为疾病的生物标记?一定是要依赖数据的。比如,在单一指标筛选时,

             我们需要根据健康人群、良性肿瘤的和恶性肿瘤的不同人群的指标值进行统计分
             布,我们希望找到既是敏感性比较高,同时特异性也比较高的指标,那就可能要
             通过分布图去找它的临界区。但临界值存在误判的可能,单一的指标会产生误判,
             于是我们希望把多项指标结合起来看。比如 3 个参数,需要在三维空间里进行聚

             合分类。在三维空间里,精准的程度要比单一指标的精准程度高很多,这也是我
             们在临床上经常会碰到的一类需求。此外是关于图像处理的。如一个胃癌的癌前
             病变通过计算机来对它进行分类的例子。胃镜检查图像结果分为糜烂、萎缩、溃
             疡、正常 4 种情况,通过机器学习的办法,对大量的病例进行学习,然后用测试

             图像来测试,测试的分辨正确率可达到 90% 以上,在一定程度上可以代替医生,
             从而减轻医生的劳动。再比如,对于肺结节的识别,现在基本上已经可以做到由
             机器把肺结节在 CT 影像上标识出来。对于大量的查体患者来讲,如果机器没有
             发现问题,代表可以通过。有问题的,可以再由人来判读,这也是一类应用模式。

             在医院管理方面,比如绩效的评价,通过全方位信息的整合,可以做出详细的量
             化评价,进而发挥其强劲的作用。另外,在医疗的管理上,因为国外医保对于非
             预期的再住院有一个惩罚措施,所以医院对怎么样预防非预期的再入院非常关注。
             通过大量的再入院人群的分析建立一个模型,然后一名患者入院后,用模型评估

             一下其发生再入院的风险有多高。对风险高的患者提早进行干预,可以大量减少
             非预期的再入院,也就意味着为医院省了钱。再比如,感染的监测是一个典型的
             符合我们说的数据融合分析特征的大数据应用,通过把患者方方面面的信息收集
             起来,微生物学的检验、血常规的检验、有没有发热、一些易感因素、有没有使

             用抗生素,把所有的这些因素汇总起来后,由计算机可以自动地发现潜在的感染
             病例。第四个方面是基础需求在医院里也是大量存在的。第一个基本需求是数据
             的检索,到目前为止,病例数据检索还没有得到很好的解决,特别是缺乏一些面
             向医护人员使用的灵活检索手段。医护人员反映好多数据查不出来、拿不到,复

             杂的条件查不了,另外一些大量的有价值数据隐含在病历文本里,比如症状,描
             述方法不一样,用词不标准,怎么解决?比如对肿瘤患者,我们需要提取他的肿


             ·70·
   77   78   79   80   81   82   83   84   85   86   87