Page 52 - 基于人工智能的图像识别技术研究

P. 52

基于人工智能的图像识别技术研究
Research on Image Recognition Technology Based on Artificial Intelligence

CPU芯片架构绝大部分为控制和缓存单元，更擅长复杂的逻辑控制和通用类型数

据运算，并行计算效率低，在人工智能任务中多用于样本数据预处理操作。
（三）人工智能芯片领域竞赛群雄逐鹿
1.云侧训练市场初步由GPU芯片取得优势
基于大数据量、复杂算法模型的人工智能模型训练阶段多集中在云端处理，

需求高并行、高吞吐量的芯片架构。现阶段，英伟达凭借高性能的GPU芯片占
据应用规模优势，快速推出业内高并行计算能力的TeslaGPU系列产品，其中
V100GPU芯片集成专为人工智能运算设计的大型矩阵乘加计算核心和16G的高带

宽内存，实现每秒120万亿次的峰值运算能力。AMD也加速追赶，2018年6月初
发布首款7nm制程的Radeon Instinct Vega GPU芯片产品，针对云端人工智能市场
研发，设计引入可编程几何流水线、混合精度计算单元等架构技术，内置32G的
高带宽内存，正式产品将于2018年下半年推出。

2.新兴力量借助ASIC芯片创新构筑竞争实力
谷歌面向谷歌云业务需求自研人工智能ASIC系列芯片TPU，并于2017年5月
正式发布第二代产品CloudTPU，采用了脉动阵列架构，增添了浮点计算单元和

高带宽内存，同时具备深度训练和推理能力，CloudTPU于2018年2月初通过谷
歌云平台正式面向客户服务，但开放数量有限且按时收费，每小时成本为6.50
美元。英特尔收购人工智能芯片初创企业Nervana后积极整合推广其训练芯片技

术，推出面向人工智能计算密度优化的ASIC训练芯片，最新SpringCrest芯片产品
将于2019年下半年向用户开放，功耗小于210W。
3.高能效、低时延芯片成为云端推理市场角逐焦点

云端推理平台需求高能效、高吞吐量或低延时的人工智能芯片，主要包括
3类：一是英伟达针对推理市场需求推出TeslaP系列GPU芯片，可提供低时延或
低功耗的推理性能；二是赛灵思和英特尔主导的FPGA芯片凭借灵活架构、高
能效、低延时特性，吸引亚马逊和微软等云服务商进行部署。赛灵思推出基于

FPGA架构的新型多核异构计算平台ACAP，可针对人工智能任务需求，实现硬
件层面低至毫秒级别的高效灵活配置。英特尔收购FPGA厂商Altera后推出了基于
FPGA的专用深度学习加速卡，结合自有CPU芯片打造可编程、高能效比的推理

功能；三是以谷歌为代表的自研ASIC芯片阵营，谷歌于2016年5月最先发布专为
数据中心推理任务定制的ASIC芯片产品TPU，计算核心是矩阵乘加单元，峰值

47 48 49 50 51 52 53 54 55 56 57