Page 80 - 大数据技术及安全研究
P. 80
大数据技术及安全研究
Big Data Technology and Security Research
300万人次以上。在这样一个流量下,在未来几年,整个的数据累积可能达到PB级。
第二个特点,医疗数据类型结构复杂。和其他行业相比,医疗研究的对象是
人,由于人的复杂性和诊疗的多样性,导致医疗数据类型多、结构复杂。如患者
用药、检验结果等结构化数据;病历、检查报告等半结构化的文本数据;还有大
量的波形数据、影像等非结构化数据。这些非结构化数据恰恰又在医疗数据里占
较大比例。当对这些数据进行处理时,我们却面临着很大的问题。比如一些自由
文本、医学影像,我们在做数据分析时,需要从中能够自动提取特征,但就目前
而言仍然存在着很大的困难。
第三个特点,以人为中心的数据整合。所有的这些数据是要为患者医疗服务
的,以人为中心的医学视角,需要一个人方方面面的数据,将它们整合在一起,
不管是呈现也好,管理也好,处理也好,都要把它组织到一起。这种集成的要求
和难度极高,因为不仅仅是研究某一个维度的数据,而是要把这些数据综合起来
看才能解决医疗问题。
第四个特点,医疗数据的周期长。我们关注一个人,从健康档案来说,从他
出生甚至说从怀孕胚胎开始记录,一直到死亡,整个过程的信息都需要关注。比
如,一个小女孩患有卵巢肿瘤,做放疗化疗之后,我们希望知道后期结果状况,
就需要随访,需要随访约 20 年后才能知道疗效、对生育有无影响。实际上,有
时我们需要掌握患者终生的数据,因此,医疗数据需要保持百年量级的长生命周
期。在这么长的周期里,其要适应医学技术和信息技术的发展变化。无论是数据
的管理还是处理,都给我们带来了很大的挑战。
(二)医疗大数据利用需求
结合调研,我们把医院大数据的利用需求概括为以下 4 个主要方面:
第一是在临床诊疗方面。很多科室希望利用大数据来支持临床诊疗辅助决策,
帮助改进诊断和治疗的方法。比如个性化诊疗、一些疾病的早期诊断。现在的诊
断往往是等到检查结果出来,看到了实体的占位的病变,或是通过病理检验得到
了诊断,才确认疾病发生了。实际上,在疾病早期,很多情况下我们还看不到疾
病时,通过一些也许不是那么直接的、多个结果的融合分析,从而有可能对一些
疾病进行早期诊断。再比如一些不良事件的预警,手术后不良事件的预警、感染
早期的一些预警等。
第二是在医学研究方面。在临床研究方面有很多需求,比如疾病的相关因素
·68·

