Page 102 - 心理健康及心理危机
P. 102
Mental Health and Psychological Crisis
心理健康及心理危机
样本、异构等特性设计出相应的有效数据分析方法是当前研究的关键问题之一。
分析流程主要包含特征提取、特征选择、训练分类器、泛化能力测试等。
1. 特征提取
当前常用的神经影像预处理软件包括 SPM,Free Surfer,FSL 等,可从多模
态神经影像中提取不同类型结构和功能特征指标,例如从结构 MRI 数据中,可
提取其灰质体积、皮层厚度和面积等形态学指标作为分类特征;在弥散张量成像
中,可提取其分数各向异性、轴向弥散度、径向弥散度和平均弥散度等参数值为
分类特征。此外,还可构建脑白质结构连接矩阵或通过连接矩阵计算其网络属性
作为特征;从静息态功能性磁共振成像(functional MRI,fMRI)数据中,可计
算区域一致性和低频振幅(amplitude of low-frequency fluctuation,ALFF)等区
域指标,还可计算区域之间的功能连接(functional connectivity,FC),或通过
连接矩阵计算其网络属性作为分类特征。
2. 特征选择
由于样本采集困难,神经影像领域中的数据集通常仅包含几十到几百个样本,
而从神经影像中提取的特征维度却往往很高,一般在几千到几万甚至几十万维。
这些高维影像特征的维度远远大于样本个数,且实际包含了很多与分类问题无关
的特征,若直接使用这些高维特征很可能会影响分类器的性能,导致模型过拟合,
即对新样本的准确预测能力较差。因此将预测模型应用到神经影像数据之前需先
进行特征选择。特征选择的方法主要分为 3 类,即过滤式(filter)、包装式(wrapper)
和嵌入式(embedded)。过滤式通过某些判据衡量每个特征所包含的信息来评估
特征的好坏,典型的判据如类内类间距离(Fisher score),皮尔森相关系数和双
样本 t 检验中的 p 值等;包装式则针对分类问题本身,通过迭代优化特定的分类
算法,找到针对该问题的最佳特征子集,典型方法如递归特征消除法(SVMRFE);
嵌入式方法将特征选择融合在模型训练的过程中,典型方法如决策树。
3. 训练分类器
训练分类器是通过已有数据训练出的分类工具,当新的观察样本输入分类
器后,即可判断其所属类别。分类器依据学习方式可分为监督学习、非监督学
习、半监督学习和强化学习等。目前常用的分类算法包括:支持向量机(support
vector machine,SVM)、决策树、朴素贝叶斯、神经网络、K 近邻等。此外,
由于医学影像数据的复杂性和多样性,采用单一的分类方法往往不够有效,集成
90

