Page 121 - 计算机应用软件开发技术研究

P. 121

第四章大数据与机器学习

略，运用合适的学习算法对模型进行训练，最后运用训练好的模型对数据进行分
析预测。
统计机器学习三个要素：

模型（model）：模型在未进行训练前，其可能的参数是多个甚至无穷的，
故可能的模型也是多个甚至无穷的，这些模型构成的集合就是假设空间。
策略（strategy）：即从假设空间中挑选出参数最优的模型的准则。模型的
分类或预测结果与实际情况的误差（损失函数）越小，模型就越好。那么，策略

就是误差最小。
算法（algorithm）：即从假设空间中挑选模型的方法（等同于求解最佳的模
型参数）。机器学习的参数求解通常都会转化为最优化问题，故学习算法通常是
最优化算法，如最速梯度下降法、牛顿法以及拟牛顿法等。

2.基于学习方法的分类
①归纳学习。
符号归纳学习：典型的符号归纳学习有示例学习、决策树学习。
函数归纳学习（发现学习）：典型的函数归纳学习有神经网络学习、示例学

习、发现学习、统计学习。
②演绎学习。
③类比学习：典型的类比学习有案例（范例）学习。
④分析学习：典型的分析学习有解释学习、宏操作学习。

3.基于学习方式的分类
①监督学习（有导师学习）：输入数据中有导师信号，以概率函数、代数函
数或人工神经网络为基函数模型，采用迭代计算方法，学习结果为函数。
②无监督学习（无导师学习）：输入数据中无导师信号，采用聚类方法，学

习结果为类别。典型的无导师学习有发现学习、聚类、竞争学习等。
③强化学习（增强学习）：以环境反馈（奖/惩信号）作为输入，以统计和
动态规划技术为指导的一种学习方法。
4.基于数据形式的分类

①结构化学习：以结构化数据为输入，以数值计算或符号推演为方法。典型
的结构化学习有神经网络学习、统计学习、决策树学习、规则学习。
②非结构化学习：以非结构化数据为输入，典型的非结构化学习有类比学习

·109·

116 117 118 119 120 121 122 123 124 125 126