Page 120 - 计算机应用软件开发技术研究
P. 120
计算机应用软件开发技术研究
Research on Computer Application Software Development Technology
套数据生态系统的基本雏形已然形成,接下来的发展将趋向于系统内部角色的细
分,也就是市场的细分;系统机制的调整,也就是商业模式的创新;系统结构的
调整,也就是竞争环境的调整等,从而使得数据生态系统复合化程度逐渐增强。
二、机器学习的概念、分类和算法
(一)机器学习的概念
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理
论知识和复杂算法知识,使用计算机作为工具并致力真实实时的模拟人类学习方
式,并将现有内容进行知识结构划分来有效提高学习效率。它是人工智能核心,
是使计算机具有智能的根本途径。
机器学习有下面几种定义:一是机器学习是一门人工智能的科学,该领域的
主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能;二是
机器学习是对能通过经验自动改进的计算机算法的研究;三是机器学习是用数据
或以往的经验,以此优化计算机程序的性能标准。
(二)机器学习的分类
几十年来,研究发表的机器学习的方法种类很多,根据强调侧面的不同可以
有多种分类方法。
1.基于学习策略的分类
(1)模拟人脑的机器学习
符号学习:模拟人脑的宏观心理级学习过程,以认知心理学原理为基础,
以符号数据为输入,以符号运算为方法,用推理过程在图或状态空间中搜索,学
习的目标为概念或规则等。符号学习的典型方法有记忆学习、示例学习、演绎学
习、类比学习、解释学习等。
神经网络学习(或连接学习):模拟人脑的微观生理级学习过程,以脑和神
经科学原理为基础,以人工神经网络为函数结构模型,以数值数据为输入,以数
值运算为方法,用迭代过程在系数向量空间中搜索,学习的目标为函数。典型的
连接学习有权值修正学习、拓扑结构学习。
(2)直接采用数学方法的机器学习
主要有统计机器学习,统计机器学习是基于对数据的初步认识以及学习目
的的分析,选择合适的数学模型,拟定超参数,并输入样本数据,依据一定的策
·108·

