Page 48 - 基于人工智能的图像识别技术研究

P. 48

基于人工智能的图像识别技术研究
Research on Image Recognition Technology Based on Artificial Intelligence

（二）人工智能芯片分类

神经网络的训练和预测都需要大量计算，但我们要注意，这两种任务的运算
又是有区别的。在训练过程中，我们相当于只有建造生产线的原材料，对于生产
线具体的流向、交叉、协作都是未知的，只有经过了大量的试错、改进之后整
个生产线才逐渐确定下来；而对于预测过程而言，我们的生产线已经建立且成熟

了，我们要做的只是按部就班地对原材料进行处理。也就是说，训练过程更加的
“普遍”、更加的“泛用”，而预测过程则更加的“专用”“特例化”，这也对
我们的人工智能芯片提出了不同的要求。
1.GPU

图像处理单元（Graphics Processing Unit，GPU）最初是为了进行图像处理而
被开发出来的芯片。图像处理问题与神经网络有着类似的特点：都需要进行大量
的、重复而简单的运算。因此GPU近几年也越来越多地被应用于神经网络问题。

在上文中，我们将CPU比作为一个老教授，而GPU就像是一帮小学生。它的突出
特点是并行、及时处理，逻辑功能弱而计算能力强。我们可以假想这样一个场
景：老教授拿到一个复杂的数学问题后将该问题拆解为若干个简单的计算问题并

下发给小学生们进行计算，在小学生们完成各自的计算任务后将计算结果汇总并
上报给任务传达者。由于GPU出色的计算性能和比较通用的计算结构，它常被用
于神经网络的训练，当前运用较多的就是NVIDIA公司各种产品，如我们常说的

RTX2080等游戏显卡就是一种典型的GPU。
2.ASIC
GPU虽然在计算性能上已经有了很大的提高，但归根结底仍然是一种泛用化

的芯片，在预测问题中很可能存在性能过剩（我们可以理解为工厂为了加速生产
引起了一大批新设备，但在不同的生产任务中需要的设备数量是不一定的，这就
使得在某些生产任务中设备无法得到充分使用，造成浪费），使得我们的芯片发
挥不出他应有的性能；同时，这种通用化的结构设计也使得芯片在面对一些特殊
结构的神经网络时捉襟见肘。而面向具体应用的集成电路（Application Specific

Integrated Circuit，ASIC）就是为了解决这个问题而诞生的，简单来说，当我们
的神经网络训练完成后，其结构也就确定了。我们可以根据这个结构设计专用的

芯片来承载该神经网络，这不仅能够最大效率地发挥芯片性能，更能提升计算速
度，使得预测能够进一步加速。但是要注意的是，芯片设计的成本是比较高的，

43 44 45 46 47 48 49 50 51 52 53