1. 按技术路线分类
目前,人工智能芯片按照技术路线划分,主要分为GPU、FPGA以及ASIC三大类,三类芯片的特点如下表所示。
AI芯片 | 技术特点 | 优势 | 劣势 |
GPU | GPU称为图形处理器,它是显卡的核心单元,是单指令、多数据处理器。GPU采用数量众多的计算单元和超长的流水线,主要处理图像领域的运算加速。代表产品有Nvidia-Tesla v100。 | 优点:相比CPU,由于其多线程结构,拥有较强的并行运算能力,与FPGA和ASIC相比,通用性更强。 | 价格和功耗比FPGA和ASIC要高,并行运算能力在推理端无法完全发挥。 |
FPGA | FPGA称为现场可编程门阵列,用户可根据自身的需求进行重复编程,适用于多指令、单数据流的分析,与GPU相反。FPGA常用于预测阶段,用硬件实现软件算法,因此,在实现复杂算法方面有一定的难度。 | 可对芯片硬件层进行灵活编译,且功耗远远小于CPU和GPU。 | 硬件编程语言难以掌握,单个单元的计算能力比较弱,硬件成本较高,电子管冗余,功耗可进一步压缩。 |
ASIC | ASIC是一种为专门目的而设计的集成电路,是一种实现特定要求而定制的专用AI芯片。除了不能扩展以外,在功耗、可靠性、体积方面都有优势,尤其在要求高性能、低功耗的移动端。 | 针对专门的任务进行架构层的优化设计,可实现PPA最优化设计、量产后成本最低。 | 初始设计投入大,可编程架构设计难度较大,针对性设计会限制芯片通用性。 |
2. 按应用领域分类
从应用领域来划分,A芯片主要可分为云端数据中心AI芯片和智能终端AI芯片;而从功能来划分,又可分为AI训练(Training)芯片和AI推理(Inference)芯片。云端市场目前基本被NVIDIA和Google两大巨头统治,2020年由阿里达摩院所研发的含光800AI芯片也进入云端推理的竞争行列;终端玩家则相对较多,包括Intel、高通、ARM、Imagination、华为、寒武纪等。
AI芯片的应用场景众多,主要包括:数据中心(IDC)、移动终端、智能安防、自动驾驶、智能家居等。
(1) 数据中心
用于云端训练和推理,目前大多数的训练工作都在云端完成。移动互联网的视频内容审核、个性化推荐等都是典型的云端推理应用。Nvidia GPU在训练方面一家独大,在推理方面也保持领先位置。与此同时,FPGA和ASIC因为低功耗、低成本的优势,也在持续抢夺GPU的市场份额。目前云端代表芯片主要有Nvidia-Tesla V100、Nvidia-Tesla T4、华为昇腾910、寒武纪MLU270、阿里达摩院含光800等。
(2) 移动终端
移动终端主要包括手机,以及日渐普及的无人机等。移动终端AI芯片主要用于移动端的推理,解决云端推理因网络延迟带来的用户体验等问题,典型应用如视频特效、语音助手等。移动端AI推理通过在系统芯片(system on chip,SoC)中增加协处理器或专用加速单元来实现。受制于移动终端的电量,对芯片的功耗有严格的限制。代表芯片有Apple A12 Neural Engine和华为麒麟990。
(3) 智能安防
智能安防的主要任务是视频结构化。通过在摄像头终端加入AI芯片,可以实现实时响应、降低带宽压力,此外,也可以将推理功能集成在边缘服务器产品中,以实现对非智能摄像头数据的后台AI推理。AI芯片需要有视频处理和解码能力,主要考虑的是可处理的视频路数以及单路视频结构化的成本。代表芯片有华为Hi3559-AV100、海思昇腾310和比特大陆BM1684等。
(4) 自动驾驶
AI芯片作为无人车的大脑,需要对汽车上大量传感器产生的数据做实时处理,对芯片的算力、功耗、可靠性都有非常高的要求,同时芯片需要满足车规标准,因此设计的难度较大。面向自动驾驶的芯片目前主要有Nvidia Orin、Xavier和Tesla的FSD等。
(5) 智能家居
在AIoT时代,智能家居中的每个设备都需要具备一定的感知、推断以及决策功能。为了得到更好的智能语音交互用户体验,语音AI芯片进入了端侧市场。语音AI芯片相对来说设计难度低,开发周期短。代表芯片有思必驰TH1520和云知声雨燕UniOne等。