Page 133 - 计算机应用软件开发技术研究
P. 133
第四章 大数据与机器学习
背后的潜在的客观规律,借此最大化数据所能体现的价值。为此,应当切实地结
合机器学习,通过计算机发掘数据,并从中筛选信息,获取相应的知识。只有相
应地发展机器学习,大数据技术的目标才可以获得可以实现的保障。具体而言,
大数据的特征大致如下:一是数据在体量方面极其巨大;二是数据在类型方面极
其繁多;三是数据价值性密度较为低下;四是众多数据需要进行即时快速的处
理。因此,受制于大数据的各种特征,发展机器学习需要从研究方向、主要评测
指标和相关核心技术三个维度出发,具体地结合实际进行。
(一)大数据时代机器学习现状
机器学习属于人工智能领域的关键研究内容,具体而言是指计算机借助经验
调整自身系统性能的行为。人类拥有学习能力,人类的学习行为背后蕴藏着极其
复杂的运行机制,模仿这种运行机制得出的就是机器学习理论的基础。机器学习
的主要研究方向在于通过计算机模拟或是复现人类获取知识进行学习的过程,进
而经由针对既有知识进行解构、创新、再重构的过程,帮助计算机提升状况处理
效率和处理能力,最终帮助计算机从各类数据之中获取相应的知识。
机器学习研究方向大致可以分为三个特点。一是机器学习本质属于跨数学
与计算机学科的交叉研究方向;二是机器学习具有显著的知识集团化特征;三是
近年来机器学习的理论发展和技术革新速度均大大超过传统学科。而研究学习机
制是发展机器学习的基础,且进入大数据时代之后社会各行各业对于数据分析的
需求都在持续增长,更加高效的信息运用方法对于发展机器学习的重要性越发凸
显,逐渐成为促进机器学习发展的主要动力源。
大数据时代,机器学习的发展更加偏向于强调学习行为本身,而机器学习
逐渐成为底层技术和服务技术,研究方向主要体现在以机器学习为基础,针对复
杂多变的各类数据,进行更加深入的分析,并更加有效地运用数据中所包含的信
息。机器学习的发展方向逐渐向智能化的数据分析发展,同时已经为智能化的
数据分析技术提供了关键的基础。此外,身处大数据时代,数据产生速率不断加
快,以至于带来了数量远超从前的数据增长。与此同时,崭新数据分析需求仍在
随着时代的发展持续地出现,如文本理解、文本情感分析、图像搜索与图像理解
和图形及网络数据分析,不仅为机器学习的研究提供了崭新的研究方向,还促使
更多的新型机器学习方法产生并投入实际应用。在对机器学习的研究中,只有切
实地解决是否可以拓展的疑问,才可以更加有效地进行数据分析。大数据时代的
·121·

