AI 的热潮还在持续,AI 的战火自然也在升级。英伟达作为这一波 AI 浪潮中最受关注的公司之一,在很大程度上影响着 AI 的战局。上周在美国举行的 GTC 2019 上,黄仁勋大篇幅介绍了英伟达在 AI 软件和计算力方面的提升,但售价仅为 99 美元(约 664 元人民币)的 Jetson Nano 人工智能计算机却成了最受关注的焦点。本月早些时候的 TensorFlow 开发者峰会上,谷歌也发布售价 149.99 美元(约 1009 元人民币)的 Edge TPU 开发板。
虽然是最受关注的 AI 芯片公司,但 2018 年的英伟达算不上顺利,先是因为矿难导致 GPU 库存高企,后又因中国市场的需求和服务器市场需求低于预期股价受拖累。整个 2018 年,英伟达的市值缩水了近一半。因此,在 AMD 已经抢先发布 7nm GPU 的背景下,外界更加期待英伟达能在 GTC 2019 上发布最新 7nm GPU。
不过,黄仁勋并未发布最新的 7nm GPU,而是花了大量的时间介绍 RTX 和 CUDA-X AI。
CUDA-X AI 把所有英伟达的库整合。根据黄仁勋的说法,CUDA-X AI 解锁了 Tensor Core GPU 的灵活性,能够将机器学习和数据科学工作负载加速多达 50 倍。另外,CUDA-X AI 还可以加速典型 AI 工作流程的每一步,包括用深度学习训练语音和图像识别系统。
英伟达也宣布已经有七家世界级的厂商将推出基于 NVIDIA T4 GPU 和 NVIDIA CUDA-X AI 加速库的服务器,这些服务器都已经针对 CUDA-X AI 进行了特殊优化。亚马逊 AWS 副总裁 Matt Garman 还宣布最新的 EC2 G4 服务器采用了英伟达 T4 Tencor Core GPU,该服务器将在未来几周内可用。
虽然英伟达没有推出性能更强的 GPU,但正在通过 CUDA-X AI 提升其 GPU 在云端的性能和吸引力。即便如此,英伟达的重要客户谷歌还是推出了自主研发的云端 AI 芯片 TPU。
自 2015 年起,谷歌开始在内部使用 TPU 芯,2016 年谷歌首次公开承认 TPU 的存在,2017 年发布了第二代 TPU,TPU 3.0 在 2018 年发布。这意味着,谷歌在云端 AI 芯片市场与英伟达的关系从此前的合作变为了合作竞争的关系。
雷锋网了解到,黄仁勋在谈到谷歌 TPU 时曾强硬的表示对 TPU 的威胁不以为然。谷歌与英伟达在云端 AI 芯片市场的竞争短期内难见结论。但却可以明确他们的芯片竞争已经蔓延到了边缘端。
边缘端的 AI 芯片战
作为老牌芯片巨头,英伟达很早就已经入局边缘计算市场,Jetson 系列的包括用于完全自主机器的 Jetson AGX Xavier 和用于边缘人工智能的 Jetson TX2 已经推出,只是几百甚至上千美元的价格阻挡了不少用户。GTC 2019 推出的同系列 Jetson Nano 之所以关注度很高,关键的原因就是价格。
纵观不同行业发展的历程,产业的爆发除了有技术成熟的因素,产品价格下降到市场可接受的程度也非常关键。GTC 2019 上推出的 Jetson Nano 计算机,价格让然惊喜,外观小巧但性能不低。据悉,Jetson Nano 的性能可达 472 GFLOPS(每秒十亿次浮点运算),耗电量仅为 5 瓦。同时,Jetson Nano 支持高分辨率传感器,可以并行处理多个传感器,并且可在每个传感器流上运行多个现代神经网络。
针对不同的需求,英伟达还推出了两个版本的 Jetson Nano,一个是售价 99 美元的开发者套件,专为开发人员、创客和技术爱好者提供,另一个是售价 129 美元的生产就绪型模块,面向大众市场创建边缘系统的企业。
与英伟达的 Jetson Nano 类似,谷歌本月初发布的搭载 Edge TPU 的开发板 Coral 售价 150 美元。Coral 开发板拥有 1GB 的 LPDDR4 内存和 8GB 的 eMMC 存储,安装 Mendel 版 Linux 或者 Android,可以进行本地的离线运算,性能最高可达 4 万亿次操作。
除了 Coral 开发板,谷歌还发布了一款售价 75 美元的 Coral USB 加速器,同样包含一颗 Edge TPU,可以在任何 64 位 ARM 或 x86 平台的 Debian Linux 上运行。
黄仁勋不认为谷歌的 TPU 是一个威胁,但在边缘端低价产品进展方面两大巨头显得颇有默契。先是谷歌推出搭载 Edge TPU 售价 75 美元和 150 美元的开发板以及加速器。不久后英伟达就推出售价 99 和 129 美元的 Jetson Nano。
不仅售价相互竞争,面向的边缘计算市场也会重叠。英伟达表示,Jetson Nano 可以创建数百万个智能系统,模块面向网络录像机、家用机器人和具有完整分析功能的智能网关等嵌入式应用。英伟达希望能为复杂、稳健、节能的人工智能系统的硬件设计、测试和验证节约时间,缩短总体开发时间让产品更快将推向市场。
Coral 开发板也强调面向嵌入式设备的隐私、低延迟、高效和离线部署。具体的应用方面,谷歌展示了基于 Coral 的一个有趣的图像分类应用。谷歌表示其提供了简单的 API,可在 Edge TPU 设备上执行图像分类,对象检测。这意味着,Edge TPU 看好和图像相关的边缘端应用。
因此,无论是从定位、性能、应用还是售价看,谷歌和英伟达在边缘端又一次正面竞争。
普及 AI 还是革命 AI 芯片初创公司?
谷歌和英伟达的竞争能够在一定程度上促进 AI 的发展,特别是在边缘端。Jetson Nano 和 Coral 开发板的方式能在很大程度上降低 AI 产品开发的难度并加速产品的上市时间,为现有做 AI 应用的公司增加了选择,当然也会想要借助 AI 进行更多创新的公司和个人提供了更加便携的选择,这对 AI 在边缘端的普及具有积极意义。
然而,对于众多 AI 芯片初创公司而言可能是个坏消息。雷锋网(公众号:雷锋网)2018 年曾统计过,创立于国内的 13 家 AI 芯片初创公司有 11 家都布局了自动驾驶和安防领域,并且都是面向边缘端的 AI 芯片。AI 芯片初创公司们之所以大部分都选择 AI 边缘计算市场,是因为在云端,英特尔和英伟达占据绝对的优势地位,初创公司想要在这一领域获得成功难度非常大。
虽然边缘端 AI 给初创公司更大的市场和机遇,但从目前的情况看英伟达在自动驾驶领域也有不错的市场表现。如今,英伟达和谷歌都推出更加简单易用,且价格更易于接受的开发板,AI 芯片初创公司又多了两个竞争对手,并且是实力强大的竞争对手。
更会让 AI 芯片初创公司感到不安的是,由于两大巨头都有云端 AI 芯片,与边缘端的 AI 芯片配合能够实现更强的竞争力。并且,软件在 AI 芯片中的重要作用正被越来越多的人看到,不巧的是英伟达和谷歌都有强大的软件。
文章开篇已经提到,英伟达发布 CUDA-X AI 将提升 GPU 的 AI 性能,但与此同时 Jetson Nano 也是可运行所有人工智能模型的 NVIDIA CUDA-X 人工智能计算机。
谷歌方面,与 Coral 开发板同时发布的还有为移动和嵌入式设备提供的跨平台解决方案 TensorFlow Lite,这个轻量级(Lite)的框架有助于机器学习模型部署在移动和 IoT 设备上的。谷歌表示,经过 TensorFlow Lite 的优化后,CPU 的性能达到原来的 1.9 倍,在 Edge TPU 上的性能最高提升 62 倍。
雷锋网认为,巨头们拥有从云端到终端的 AI 芯片,并且有强大的软件帮助芯片提升硬件的性能,同时还有长期建立的品牌、渠道、市场等方面的优势,这在推动 AI 在边缘端普及的同时,还将与众多的 AI 芯片初创公司产生竞争。
只是,未来仍有诸多不确定性,英伟达、谷歌到底会在多大程度上影响 AI 芯片初创公司?