Page 254 - 急诊医学与精神疾病的临床理论研究
P. 254
第七章 大数据时代的精神分析
提供更加细致的指标变量。
1. 互联网大数据分析技术
人工智能的发展得益于数据的快速积累。大数据具有数量大、变化大、种类
多、高价值和真实性等特点。社交媒体是众所周知的大数据场景,如 Facebook、
Twitter、微博等,这些场景中的数据主要以文本、图像、视频及文档的形式出现,
具有实时创建、数据量实时增加等特点。此外,在精神病理学研究中使用的电子
健康记录也属于大数据范畴。大数据挖掘技术被用于处理那些传统数据分析技术
无法处理的海量数据。在传统的心理学研究中,研究人员经常使用理论驱动的方
法解释经验数据(即事情是如何发生的),而不是仅仅描述它们(即发生了什么)。
以理论为基础的方法可以增加研究者对因果关系和社会现象潜在机制的理解。随
着深度学习等数据驱动方法与大数据研究的出现,研究者开始采用自下而上的数
据驱动技术对人的行为或特质进行预测。早期互联网大数据研究主要关注社交媒
体积累的大量文本数据,研究者通过大量的互联网发帖内容可以发掘规律。例如:
Zheng 等通过收集 2010—2019 年共 1813218 条微博发帖内容分析人们对同性恋
群体的态度变化,结果发现微博用户在十年间越来越支持和接受同性恋者的权利;
Xu 等对 108914 条微博内容进行文本分析和文本编码后,开发情绪词典测量互联
网上的喜悦、期待、爱、愤怒、焦虑、厌恶、悲伤和惊讶等八种情绪,为社交媒
体大数据的情绪研究建立基础。这些研究都证明大数据自下而上发现规律的实用
性。基于大数据的动态记录特点,大数据挖掘技术还可以对事物的发展趋势进行
机制研究。例如,在基于微博数据的研究中,Cheng 等使用文本分析技术分析 60
万条微博发帖内容,并结合新型冠状病毒感染疫情状况的时间变化研究群体幸福
感,结果发现居住环境对幸福感具有显著影响,且这种影响在疫情防控期间更强。
此外,基于电子健康记录数据,深度学习算法可以揭示传统数据分析方法难以发
现的病理学因素之间的关联。例如,Nemesure 等使用人工神经网络对电子健康
记录大数据进行分析发现,医疗和生理健康指标对抑郁症和焦虑症的影响较大,
这为精神病理学在生理 - 心理因素交互影响方面的理论发展作出贡献。
2. 基于自然语言处理技术的文本数据分析
自然语言处理技术主要研究计算机和人类语言之间的交互,特别是如何通过
编程处理和分析大量的人类语言数据。自然语言处理中的文本分析技术不仅能将
非结构化文本数据转换为有意义的数据,还能进行后续分析。目前,已有研究对
237

