Page 250 - 急诊医学与精神疾病的临床理论研究
P. 250
第七章 大数据时代的精神分析
(三)人工智能技术赋能心理学发展的挑战与应对
1. 数据驱动研究的局限性
虽然一系列实验已经说明,利用人工智能、大数据等技术研究心理学是可行
的,但单独使用自下而上的数据驱动方法可能会导致结果偏差。目前,智能化心
理学的研究一大问题在于缺乏从心理学理论角度出发的假设及实验设计,由此可
能会导致在数据收集过程中对相关变量控制的不足,数据信噪比低,研究结果的
可信度与可重复性较差。例如,Mitchell 等对 Twitter 上人群幸福感的研究,由于
对相关人口学变量控制不足,导致结论出现偏差。这个典型案例表明,完全依赖
数据驱动不足以取得正确的研究结论,自上而下的理论驱动是心理学研究中不可
或缺的重要部分。
2. 大数据研究样本的有偏性
智能化心理学缺乏理论指导的表现是在大数据研究中,由于缺乏必要的样本
设计,导致目前许多大数据研究样本存在偏差。例如,在社交媒体上的言论可能
只是在社交媒体平台上才会出现,互联网中活跃的用户与不活跃的用户本身存在
心理特质的差异。同时,不同社交媒体平台也限制样本的特点,导致样本无法反
映整体人群。目前,深度学习模型还不能明确地捕捉不确定性,这给数据和标签
的迁移学习带来了挑战。尽管利用深度学习预测人类社会行为是可行的,但是这
种方法受限于数据。利用传统的社会行为,实验设计特殊的社会心理行为现象是
必要的。解决这些问题需要在实验设计中考虑样本的偏差,并结合自上而下的理
论驱动。这也是未来研究需要解决的问题。
3. 人工智能赋能心理学挑战的应对
面对人工智能赋能心理学发展的挑战,在未来研究中,应依据严谨的心理学
理论与研究设计对数据进行采集,以增加数据的信噪比,提高数据的价值。在数
据分析过程中,应当基于一定的研究假设进行针对性分析和挖掘。即在心理学研
究框架下,引入大数据收集和分析方法,而非直接采用人工智能分析方法解决心
理学的研究问题。例如,根据 Elragal 等轻量级理论驱动大数据的分析方法,在
保护分析过程免于纯数据驱动研究可能导致偏差的同时,给数据挖掘一定的自由
空间;研究人员在数据收集过程中适当避免相关理论干扰,给予人工智能一定的
自由度,进行超越现有理论收集数据。然而,数据归纳、清理和分析时选择要依
靠经过验证的知识体系和现有的理论基础,从而超越定量分析方法。一个理论框
233

