Page 126 - 大数据背景下网络安全问题研究
P. 126

大数据背景下网络安全问题研究
                    Research on Network Security Issues under the Background of Big Data


                  (2)直接采用数学方法的机器学习
                  主要有统计机器学习,统计机器学习是基于对数据的初步认识以及学习目的的分
             析,选择合适的数学模型,拟定超参数,并输入样本数据,依据一定的策略,运用合
             适的学习算法对模型进行训练,最后运用训练好的模型对数据进行分析预测。
                  统计机器学习三个要素:

                  模型(model):模型在未进行训练前,其可能的参数是多个甚至无穷的,故可
             能的模型也是多个甚至无穷的,这些模型构成的集合就是假设空间。
                  策略(strategy):即从假设空间中挑选出参数最优的模型的准则。模型的分类

             或预测结果与实际情况的误差(损失函数)越小,模型就越好。那么策略就是误差
             最小。
                  算法(algorithm):即从假设空间中挑选模型的方法(等同于求解最佳的模型参
             数)。机器学习的参数求解通常都会转化为最优化问题,故学习算法通常是最优化算

             法,如最速梯度下降法、牛顿法以及拟牛顿法等。
                  2.基于学习方法的分类
                  一是归纳学习:①符号归纳学习:典型的符号归纳学习有示例学习、决策树学

             习。②函数归纳学习(发现学习):典型的函数归纳学习有神经网络学习、示例学
             习、发现学习、统计学习。
                  二是演绎学习。
                  三是类比学习:典型的类比学习有案例(范例)学习。
                  四是分析学习:典型的分析学习有解释学习、宏操作学习。

                  3.基于学习方式的分类
                  (1)监督学习(有导师学习)
                  输入数据中有导师信号,以概率函数、代数函数或人工神经网络为基函数模型,

             采用迭代计算方法,学习结果为函数。
                  (2)无监督学习(无导师学习)
                  输入数据中无导师信号,采用聚类方法,学习结果为类别。典型的无导师学习有
             发现学习、聚类、竞争学习等。

                  (3)强化学习(增强学习)
                  以环境反馈(奖/惩信号)作为输入,以统计和动态规划技术为指导的一种学习
             方法。
                  4.基于数据形式的分类

                  (1)结构化学习
                  以结构化数据为输入,以数值计算或符号推演为方法。典型的结构化学习有神经


             • 114 •
   121   122   123   124   125   126   127   128   129   130   131