Page 66 - 基于深度学习的人工智能技术研究
P. 66
Research on Artificial Intelligence Technology Based on Deep Learning
基于深度学习的人工智能技术研究
里小蜜、蚂蚁金服、优酷等业务。阿里达摩院的语言模型和阅读理解技术也被
用于行业赋能,推进人工智能技术在医疗、电力、金融等行业的落地。据悉,
StructBERT 模型日前被评为全球性能最强的自然语言处理系统。
(二)自然语言处理技术的原理
自然语言处理技术(Natural Language Processing,NLP)是在计算机的支持
下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言
描写。它能够实现人与计算机之间用简单语言进行有效交流的各种理论和方法。
其中自然语言即人类语言,是人类交流的主要工具,也对人类文明产生了深远的
影响。定量化研究就是将实验和以数字为基础的数据联系在一起的研究。自然语
言处理通常通过机器学习进行工作。机器学习系统像其他任何形式的数据一样存
储单词及其组合方式。短语、句子,有时甚至整本书的内容都被输入机器学习引
擎,并在其中使用语法规则或人们的现实语言习惯,或两者兼而有之进行处理。
然后,计算机使用这些数据来查找模式并推断出接下来的结果。自然语言处理技
术在生活中有着许多应用,机器翻译、聊天机器人和其他人工智能的聊天软件,
这些都依赖于语言处理技术在后台运行。
(三)自然语言处理技术的应用
1. 语音识别
语音识别就是让机器通过识别和理解过程把语音信号转变为相应的文本或命
令的一种技术。其原理主要是:通过对声音波形分帧构态,对语言特征进行处理
分析,经由音素系统对其进行相应的算法处理。通常,语音识别有以下 4 种方法:
第一,基于语言学和声学的方法;第二,随机模型;第三,利用人工神经网络;
第四,概率语法分析。语音识别会对收集到的目标进行预处理,其中包括语音信
号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响等多
个步骤,而这些也涉及语音识别技术的算法。把语言变为文字需要提取和匹配,
自学习系统就是对这两个数据库进行训练分析。Sarash Borys 采用随韵律而定的
音位变体模型的言语识别,说明韵律因素在音素建模及其在言语识别应用方面的
重要性。王作英和肖熙等在汉语的语音识别中,利用了音段时长的信息,大大提
高了识别率。但是,总的来说,怎样在汉语自动语音识别的框架中利用语音学知
识仍然是个新的课题与挑战。随着中国科技的进一步发展,自动语音识别这一技
术必然会蒸蒸日上,为中国科技发展服务,为国家奠定科技基础。
58

