Page 48 - 基于深度学习的人工智能技术研究

P. 48

Research on Artificial Intelligence Technology Based on Deep Learning
基于深度学习的人工智能技术研究

机视觉技术的应用能够提升智能化农业机械使用的准确性和高效性，降低农户劳
动强度，提高农作物的产量和质量，有力地提高农户的经济收益，促进中国农业
机械化水平的持续提升，助推乡村振兴。

三、计算机视觉技术应用研究

计算机视觉（Computer Vision，CV）是进入 21 世纪之后非常活跃的研究方向，
随着图像采集设备的不断推陈出新，视觉信息生产的爆炸式增长，机器算力的不
断提升，以及深度神经网络模型的提出，视觉领域的图像处理技术日新月异，所
适用的领域场景在不断拓宽，新的问题在被不断定义。传统的图像采集设备如摄

像机，监控探头，主要采集可见光波段的信息，形成图像或者视频记录下来，其
携带起来比较笨重，采集范围很有限。现如今各种移动设备和专业仪器的加入，
采集的信息已经拓广至各电磁波波段，而由此也促使信息呈爆炸式增长，为计算

机视觉领域算法的训练提供了大量的可用样本，大大降低了获取数据的难度和
成本。
另一方面，GPU（Graphics Processing Unit，图形处理器）的引入，为深度
学习和并行计算插上了强有力的翅膀。以往的纯 CPU 计算，在面对诸如矩阵运算，
像素块卷积时，只能线性的一个接一个执行加减乘除，极大地限制了吞吐速度，

而 GPU 在诞生伊始，为了符合图像和视频的处理场景条件，设计上需要并行处
理各个像素点或者像素块的数学计算，因此天然带有了上千上万个算术逻辑单元
（Arithmetic Logic Unit，ALU），对于处理互不相关独立的数学计算非常方便，

也大大加速了深度学习在计算和推理过程中经常出现的矩阵运算。由于数据和算
力的充足，进入 21 世纪以后，之前几乎被人抛弃的神经网络模型被再次提及，
进化为更大型更多层的深度神经网络，因深度学习的泛化能力强，需要的先验知
识少，同时又能很好地利用目前大量的数据，成为到现在为止占据主导的算法。
（一）研究进展

计算机视觉目前主流的任务有四类：分类（Classiﬁcation）、检测（Detection）、
识别（Identiﬁcation）、分割（Segmentation）。分类，即对一幅图片进行一个整
体的划分，研究者关注在一个图片中占主要部分的物体的类别。分类的范围是

图片的粒度，常见的公开数据集比如 Image Net，MNIST 都是以这样的方式进行
分类，再用于后续的训练和测试。检测，则是对图像中物体进行几何定位，以

43 44 45 46 47 48 49 50 51 52 53