Page 141 - 地球物理探测技术发展与创新
P. 141
第三章 地球物理测井
习技术与自身研究领域的高效融合。
(一)人工智能在测井资料处理解释应用的适用性
人工智能是指利用特定算法获取信息后,执行具有人类特征任务的能力,如
识别物体、声音及从环境中学习以解决其他问题。人工智能的关键在于自动化方
法的设计,即设计出一种学习算法,使计算机能够在没有人类干预或帮助的情况
下自动获取知识。机器学习方法的不断优化,促进了人工智能领域相关技术的发
展。机器学习是计算机科学子领域及统计学研究的领域之一,旨在针对给定数据
设计及训练出具有拆分、排序、转换等能力的特殊算法。根据学习任务的特点,
可分为监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)
和半监督学习(Semi-Supervised Learning)。
训练数据样本包含了输入向量以及对应目标向量的机器学习任务被称为监督
学习。根据学习目标的不同,可分为分类与回归这 2 类任务:分类任务用于为每
个输入向量分配离散标签;回归任务则用于输出 1 个或多个连续变量,以表征输
入变量与目标变量之间的统计关系。诸如支持向量机(Support Vector Machine,
SVM)、人工神经网络(Artificial Neural Network,ANN)、决策树(Decision
Tree)、随机森林(Random Forest)等经典监督学习方法,正逐步被应用到测井
解释作业中。训练数据仅由 1 组输入向量组成、不含对应目标标签的机器学习任
务称为无监督学习。根据学习目标不同,无监督学习任务可分为聚类(Clustering)、
密度估计(Density Estimation)与数据可视化(Visualization)等。聚类任务的目
标是将样本整体划分为若干个由相似对象组成的类簇;密度估计用于确定输入
数据在空间中的分布;数据可视化主要利用降维方法,将数据从高维空间投影
到二维 / 三维空间,供从业人员直观可视。常用无监督方法包括 K-Means 聚类、
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类、主
成分分析(Principal Component Analysis,PCA)等。
为了最大限度提高机器学习任务模式识别能力,可构建具有一定深度的模
型,获取数据更深层次的特征或表征,以提升算法在处理更大数据量、更高维
度的数据集时的准确度和可靠性。这些具有层次结构更为复杂的机器学习方法被
称为深度学习(Deep Learning,DL),包括卷积神经网络(Convolution Neural
Network,CNN)、堆栈自编码网络(Stacked Auto-Encoder Network)、深度置
信网络(Deep Belief Nets)等。还有 1 类模式识别任务利用少量标签数据和大量
129

