Page 83 - 软件工程与项目管理
P. 83

第三章 计算机视觉与大数据



            理的一环,其应用的场景范围也会更加丰富。例如在卷积神经网络中的应用,使
            计算机视觉的精准度、有效度得到可靠保障,同时也成为多个行业最受欢迎的技
            术应用。同时,由于计算机视觉技术涉及的专业领域较广,属于知识密集型产业,
            其研究与开发的过程中,对资本、人才、产业等多方面的要求相对较高,伴随着
            我国人工智能行业的快速发展,我国的计算机视觉技术发展前景极为广阔,并预

            计在 2025 年左右能够形成以北京为核心的计算机视觉技术产业格局。
                 综上所述,计算机视觉技术在人工智能发展的过程中,得到了有效的利用
            和发展,其综合性较强,在各个领域中的应用也有广阔的空间,可以说是未来自

            动化与智能技术的主要发展方向。

                 二、深度学习算法分类

                 (一)两阶段算法
                 两阶段算法包含选择候选框和修正目标分类 / 位置两个阶段,对这两个阶段

            的不同处理方式,构成了不同的算法方案。
                 1. R-CNN 算法
                 2014 年,R. Girshick 等人提出了 R-CNN 算法。R-CNN 算法的思路非常简单,

            首先基于 Selective Search 方法从原始图像中筛选出若干候选框,然后将每个候选
            框中的图像缩放的固定尺度送入卷积网络提取特征,最后通过支持向量机(SVM)
            方法对特征进行分类,判断候选框中的图像是背景还是我们关注的目标类型。在
            VOC2007数据集上,R-CNN算法相比之前的检测算法,在性能有了显著的提升(从
            33.7% 提升到 58.5%),是检测算法的一个里程碑式的突破。虽然 R-CNN 在算法

            性能上取得了巨大的进展,但弊端也非常明显,因为需要分别从 2000 多个候选
            框中提取特征,所以效率非常低,后续各种算法正是为了解决这一问题而提出的
            一系列改进方案。

                 2. SPP-Net 算法
                 2014 年,何恺明等人提出了 SPP-Net(Spatial Pyramid Pooling Networks,空间
            金字塔池化网络)算法。R-CNN 算法要求输入卷积网络用来提取特征的子图像
            尺寸固定,比如 Alex-Net 就要求输入的图像大小为固定的 224 像素 ×224 像素,
            而SPP-Net算法则去掉了这一限制。SPP-Net算法基于一个空间金字塔池化层(SPP

            layer),无论输入的子图像大小如何,都会将子图像采样成固定大小的图像。在


                                                                                    73
                                                                                    73
   78   79   80   81   82   83   84   85   86   87   88