Page 82 - 大数据技术及安全研究
P. 82
大数据技术及安全研究
Big Data Technology and Security Research
全部都采集了,并且能够建立一个预测模型。比如,对于疾病的诊断,当查体后
会发现一些异常指标时会去咨询医生。医生说肿瘤标志物高时,不代表一定有问
题。因为单一指标不能确切地说明问题,一些指标应该组合起来看。我们筛选出
哪些指标作为疾病的生物标记?一定是要依赖数据的。比如,在单一指标筛选时,
我们需要根据健康人群、良性肿瘤的和恶性肿瘤的不同人群的指标值进行统计分
布,我们希望找到既是敏感性比较高,同时特异性也比较高的指标,那就可能要
通过分布图去找它的临界区。但临界值存在误判的可能,单一的指标会产生误判,
于是我们希望把多项指标结合起来看。比如 3 个参数,需要在三维空间里进行聚
合分类。在三维空间里,精准的程度要比单一指标的精准程度高很多,这也是我
们在临床上经常会碰到的一类需求。此外是关于图像处理的。如一个胃癌的癌前
病变通过计算机来对它进行分类的例子。胃镜检查图像结果分为糜烂、萎缩、溃
疡、正常 4 种情况,通过机器学习的办法,对大量的病例进行学习,然后用测试
图像来测试,测试的分辨正确率可达到 90% 以上,在一定程度上可以代替医生,
从而减轻医生的劳动。再比如,对于肺结节的识别,现在基本上已经可以做到由
机器把肺结节在 CT 影像上标识出来。对于大量的查体患者来讲,如果机器没有
发现问题,代表可以通过。有问题的,可以再由人来判读,这也是一类应用模式。
在医院管理方面,比如绩效的评价,通过全方位信息的整合,可以做出详细的量
化评价,进而发挥其强劲的作用。另外,在医疗的管理上,因为国外医保对于非
预期的再住院有一个惩罚措施,所以医院对怎么样预防非预期的再入院非常关注。
通过大量的再入院人群的分析建立一个模型,然后一名患者入院后,用模型评估
一下其发生再入院的风险有多高。对风险高的患者提早进行干预,可以大量减少
非预期的再入院,也就意味着为医院省了钱。再比如,感染的监测是一个典型的
符合我们说的数据融合分析特征的大数据应用,通过把患者方方面面的信息收集
起来,微生物学的检验、血常规的检验、有没有发热、一些易感因素、有没有使
用抗生素,把所有的这些因素汇总起来后,由计算机可以自动地发现潜在的感染
病例。第四个方面是基础需求在医院里也是大量存在的。第一个基本需求是数据
的检索,到目前为止,病例数据检索还没有得到很好的解决,特别是缺乏一些面
向医护人员使用的灵活检索手段。医护人员反映好多数据查不出来、拿不到,复
杂的条件查不了,另外一些大量的有价值数据隐含在病历文本里,比如症状,描
述方法不一样,用词不标准,怎么解决?比如对肿瘤患者,我们需要提取他的肿
·70·

