Page 18 - 基于人工智能的图像识别技术研究
P. 18

基于人工智能的图像识别技术研究
                                     Research on Image Recognition Technology Based on Artificial Intelligence


                (一)人工智能的发展高度依赖优质数据

                1.人工智能靠数据和技术双向驱动
                人工智能靠数据和知识“双轮驱动”,数据越多越智能。一方面,数据是人
            工智能、量子计算等新技术发展应用的基础;另一方面,基于数据的预测与决
            策,持续给经济社会发展注入新动能。2016年至今,深度学习(Deep Learning)

            依然是人工智能发展的技术主线。这一技术主要通过给计算机提供大量数据来
            自主学习,找出蕴含的内在规律,进而对新情况新问题进行预判,因此也被称
            为“学习算法”(learning algorithm)。其一方面需要在算法技术上不断取得突

            破,另一方面尤其仰赖优质数据的供养。这两方面有效结合并不断完善的深度学
            习模型,不仅在相关人工智能技术提升中发挥了重要作用,而且在助力其他科
            学研究中也不断取得重大突破。例如,在生命科学领域,人工智能助力生命科学
            攻克近50年都未能突破的蛋白质3D结构难题。以往生物科学家主要通过核磁共

            振、X射线、冷冻电子显微镜等方式重复实验、逐个探索,这类方式存在经济成
            本高、花费时间长等问题,按此种方式识别的蛋白质3D结构尚不足20%。
                1972年,克里斯蒂安·安芬森(Christian Anfinsen)在诺贝尔化学奖获奖感

            言中提出了著名假设:理论上来说,蛋白质的氨基酸序列应该完全决定其结构。
            人工智能通过“技术+数据”的方式在验证这一假设并促进生物科学研究中发挥
            了巨大作用。首先科研人员研发了一种深度学习算法,然后在包含约17万个蛋白

            质序列及其形状的公共数据库中对该算法进行训练。经过优质数据的不断训练,
            该模型预测蛋白质结构的准确性不断提高并取得了重大进展,目前利用该人工智
            能模型单通过氨基酸序列就可较为准确地预测蛋白质3D结构,极大地加速了科

            学研究,并将人类蛋白质3D结构预测范围覆盖到了98.5%。
                2.当前人工智能应用场景对个人信息具有强烈需求
                随着人工智能的发展,其逐渐向大众生活更为密切的领域扩展,智能理财、
            智能语音、智能购物、增强现实、虚拟现实等场景和技术的发展都离不开对个人

            信息的处理。而且,从移动互联网演进到人工智能时代,数据的二元属性将更加
            突出。数据越来越具有私密性,深入用户各个生活场景,覆盖广度和挖掘深度将
            不断增加。也即越与大众生活密切相连,所需的训练数据则越会涉及个人信息。

            出于个人信息蕴含的巨大经济社会价值和信息自由的客观要求,人工智能产业发
            展、政务管理和科技创新都迫切要求通过交易、交换、转移等多种形式使得数据


            10
   13   14   15   16   17   18   19   20   21   22   23