Page 83 - 软件工程与项目管理

P. 83

第三章计算机视觉与大数据

理的一环，其应用的场景范围也会更加丰富。例如在卷积神经网络中的应用，使
计算机视觉的精准度、有效度得到可靠保障，同时也成为多个行业最受欢迎的技
术应用。同时，由于计算机视觉技术涉及的专业领域较广，属于知识密集型产业，
其研究与开发的过程中，对资本、人才、产业等多方面的要求相对较高，伴随着
我国人工智能行业的快速发展，我国的计算机视觉技术发展前景极为广阔，并预

计在 2025 年左右能够形成以北京为核心的计算机视觉技术产业格局。
综上所述，计算机视觉技术在人工智能发展的过程中，得到了有效的利用
和发展，其综合性较强，在各个领域中的应用也有广阔的空间，可以说是未来自

动化与智能技术的主要发展方向。

二、深度学习算法分类

（一）两阶段算法
两阶段算法包含选择候选框和修正目标分类 / 位置两个阶段，对这两个阶段

的不同处理方式，构成了不同的算法方案。
1. R-CNN 算法
2014 年，R. Girshick 等人提出了 R-CNN 算法。R-CNN 算法的思路非常简单，

首先基于 Selective Search 方法从原始图像中筛选出若干候选框，然后将每个候选
框中的图像缩放的固定尺度送入卷积网络提取特征，最后通过支持向量机（SVM）
方法对特征进行分类，判断候选框中的图像是背景还是我们关注的目标类型。在
VOC2007数据集上，R-CNN算法相比之前的检测算法，在性能有了显著的提升（从
33.7% 提升到 58.5%)，是检测算法的一个里程碑式的突破。虽然 R-CNN 在算法

性能上取得了巨大的进展，但弊端也非常明显，因为需要分别从 2000 多个候选
框中提取特征，所以效率非常低，后续各种算法正是为了解决这一问题而提出的
一系列改进方案。

2. SPP-Net 算法
2014 年，何恺明等人提出了 SPP-Net(Spatial Pyramid Pooling Networks，空间
金字塔池化网络）算法。R-CNN 算法要求输入卷积网络用来提取特征的子图像
尺寸固定，比如 Alex-Net 就要求输入的图像大小为固定的 224 像素 ×224 像素，
而SPP-Net算法则去掉了这一限制。SPP-Net算法基于一个空间金字塔池化层（SPP

layer)，无论输入的子图像大小如何，都会将子图像采样成固定大小的图像。在

73
73

78 79 80 81 82 83 84 85 86 87 88