Page 122 - 基于深度学习的人工智能技术研究

P. 122

Research on Artificial Intelligence Technology Based on Deep Learning
基于深度学习的人工智能技术研究

三是应用门槛高，算法建模及调参过程复杂烦琐、算法设计周期长、系统实施维
护困难。四是缺乏因果推理能力，图灵奖得主、贝叶斯网络之父 Judea Pearl 指出
当前的深度学习不过只是“曲线拟合”。五是存在可解释性问题，由于内部的参
数共享和复杂的特征抽取与组合，很难解释模型到底学到了什么，但出于安全性

考虑以及伦理和法律的需要，算法的可解释性又是十分必要的。因此，深度学习
仍需解决以上问题。
深度神经网络呈现层数越来越深、结构越来越复杂的发展趋势。为了不断提
升深度神经网络的性能，业界从网络深度和网络结构两方面持续进行探索。神经

网络的层数已扩展到上百层甚至上千层，随着网络层数的不断加深，其学习效果
也越来越好，2015 年微软提出的 ResNet 以 152 层的网络深度在图像分类任务上
准确率首次超过人眼。新的网络设计结构不断被提出，使得神经网络的结构越来
越复杂。如：2014 年谷歌提出了 Inception 网络结构、2015 年微软提出了残差网

络结构、2016 年黄高等人提出了密集连接网络结构，这些网络结构设计不断提
升了深度神经网络的性能。
深度神经网络节点功能不断丰富。为了克服目前神经网络存在的局限性，业
界探索并提出了新型神经网络节点，使得神经网络的功能越来越丰富。2017 年，

杰弗里·辛顿提出了胶囊网络的概念，采用胶囊作为网络节点，理论上更接近人
脑的行为，旨在克服卷积神经网络存在的没有空间分层和推理能力等局限性。
2018 年，DeepMind、谷歌大脑、MIT 的学者联合提出了图网络的概念，定义了
一类新的模块，具有关系归纳偏置功能，旨在赋予深度学习因果推理的能力。

深度神经网络工程化应用技术不断深化。深度神经网络模型大都具有上亿
的参数量和数百兆的占用空间，运算量大，难以部署到智能手机、摄像头和可穿
戴设备等性能和资源受限的终端类设备。为了解决这个问题，业界采用模型压缩
技术降低模型参数量和尺寸，减少运算量。目前采用的模型压缩方法包括对已

训练好的模型做修剪（如剪枝、权值共享和量化等）和设计更精细的模型（如
MobileNet 等）两类。深度学习算法建模及调参过程烦琐，应用门槛高。为了降
低深度学习的应用门槛，业界提出了自动化机器学习（AutoML）技术，可实现
深度神经网络的自动化设计，简化使用流程。

深度学习与多种机器学习技术不断融合发展。深度学习与强化学习融合发展
诞生的深度强化学习技术，结合了深度学习的感知能力和强化学习的决策能力，

114

117 118 119 120 121 122 123 124 125 126 127