Page 83 - 软件工程与项目管理
P. 83
第三章 计算机视觉与大数据
理的一环,其应用的场景范围也会更加丰富。例如在卷积神经网络中的应用,使
计算机视觉的精准度、有效度得到可靠保障,同时也成为多个行业最受欢迎的技
术应用。同时,由于计算机视觉技术涉及的专业领域较广,属于知识密集型产业,
其研究与开发的过程中,对资本、人才、产业等多方面的要求相对较高,伴随着
我国人工智能行业的快速发展,我国的计算机视觉技术发展前景极为广阔,并预
计在 2025 年左右能够形成以北京为核心的计算机视觉技术产业格局。
综上所述,计算机视觉技术在人工智能发展的过程中,得到了有效的利用
和发展,其综合性较强,在各个领域中的应用也有广阔的空间,可以说是未来自
动化与智能技术的主要发展方向。
二、深度学习算法分类
(一)两阶段算法
两阶段算法包含选择候选框和修正目标分类 / 位置两个阶段,对这两个阶段
的不同处理方式,构成了不同的算法方案。
1. R-CNN 算法
2014 年,R. Girshick 等人提出了 R-CNN 算法。R-CNN 算法的思路非常简单,
首先基于 Selective Search 方法从原始图像中筛选出若干候选框,然后将每个候选
框中的图像缩放的固定尺度送入卷积网络提取特征,最后通过支持向量机(SVM)
方法对特征进行分类,判断候选框中的图像是背景还是我们关注的目标类型。在
VOC2007数据集上,R-CNN算法相比之前的检测算法,在性能有了显著的提升(从
33.7% 提升到 58.5%),是检测算法的一个里程碑式的突破。虽然 R-CNN 在算法
性能上取得了巨大的进展,但弊端也非常明显,因为需要分别从 2000 多个候选
框中提取特征,所以效率非常低,后续各种算法正是为了解决这一问题而提出的
一系列改进方案。
2. SPP-Net 算法
2014 年,何恺明等人提出了 SPP-Net(Spatial Pyramid Pooling Networks,空间
金字塔池化网络)算法。R-CNN 算法要求输入卷积网络用来提取特征的子图像
尺寸固定,比如 Alex-Net 就要求输入的图像大小为固定的 224 像素 ×224 像素,
而SPP-Net算法则去掉了这一限制。SPP-Net算法基于一个空间金字塔池化层(SPP
layer),无论输入的子图像大小如何,都会将子图像采样成固定大小的图像。在
73
73

