Page 80 - 大数据技术及安全研究
P. 80

大数据技术及安全研究
                     Big Data Technology and Security Research


             300万人次以上。在这样一个流量下,在未来几年,整个的数据累积可能达到PB级。
                 第二个特点,医疗数据类型结构复杂。和其他行业相比,医疗研究的对象是
             人,由于人的复杂性和诊疗的多样性,导致医疗数据类型多、结构复杂。如患者
             用药、检验结果等结构化数据;病历、检查报告等半结构化的文本数据;还有大

             量的波形数据、影像等非结构化数据。这些非结构化数据恰恰又在医疗数据里占
             较大比例。当对这些数据进行处理时,我们却面临着很大的问题。比如一些自由
             文本、医学影像,我们在做数据分析时,需要从中能够自动提取特征,但就目前
             而言仍然存在着很大的困难。

                 第三个特点,以人为中心的数据整合。所有的这些数据是要为患者医疗服务
             的,以人为中心的医学视角,需要一个人方方面面的数据,将它们整合在一起,
             不管是呈现也好,管理也好,处理也好,都要把它组织到一起。这种集成的要求
             和难度极高,因为不仅仅是研究某一个维度的数据,而是要把这些数据综合起来

             看才能解决医疗问题。
                 第四个特点,医疗数据的周期长。我们关注一个人,从健康档案来说,从他
             出生甚至说从怀孕胚胎开始记录,一直到死亡,整个过程的信息都需要关注。比
             如,一个小女孩患有卵巢肿瘤,做放疗化疗之后,我们希望知道后期结果状况,

             就需要随访,需要随访约 20 年后才能知道疗效、对生育有无影响。实际上,有
             时我们需要掌握患者终生的数据,因此,医疗数据需要保持百年量级的长生命周
             期。在这么长的周期里,其要适应医学技术和信息技术的发展变化。无论是数据
             的管理还是处理,都给我们带来了很大的挑战。

                 (二)医疗大数据利用需求
                 结合调研,我们把医院大数据的利用需求概括为以下 4 个主要方面:
                 第一是在临床诊疗方面。很多科室希望利用大数据来支持临床诊疗辅助决策,
             帮助改进诊断和治疗的方法。比如个性化诊疗、一些疾病的早期诊断。现在的诊

             断往往是等到检查结果出来,看到了实体的占位的病变,或是通过病理检验得到
             了诊断,才确认疾病发生了。实际上,在疾病早期,很多情况下我们还看不到疾
             病时,通过一些也许不是那么直接的、多个结果的融合分析,从而有可能对一些
             疾病进行早期诊断。再比如一些不良事件的预警,手术后不良事件的预警、感染

             早期的一些预警等。
                 第二是在医学研究方面。在临床研究方面有很多需求,比如疾病的相关因素


             ·68·
   75   76   77   78   79   80   81   82   83   84   85