作者:腾讯新闻知识官,宾夕法尼亚州立大学硕士,芯片工程师扎克萧声
7月20日,寒武纪正式在a股科技创新板挂牌,成为第一款AI芯片,引起业内热议和关注。
据相关数据显示,我国集成电路设计企业超过1500家。而拥有AI芯片的公司相对较少,创办的公司只有20多家。在这些AI芯片公司中,寒武纪最为突出,尤其是最近的IPO,科创上市首日股价暴涨。那么AI芯片是什么,和我们普通的CPU有什么不同?
从原理逻辑来看,AI处理器是一种特殊的芯片,它结合了人工智能技术和机器学习,使芯片的移动设备足够智能,可以模仿人脑,用于优化深度学习AI的工作。它也是一个使用具有特定功能的多个处理器的系统。通用芯片(通用cpu)封装在一个更小的芯片封装中,旨在支持移动应用,并提供支持移动设备应用所需的所有系统功能。
很多时候,各大公司的营销团队都觉得AI(人工智能)这个词非常“前沿和华丽”,于是把它捆绑到几乎任何可能的商业用途中。所以,你一定听说过“人工智能芯片”。实际上是NPU(神经处理单元)的更名版。这些是特殊类型的ASIC(专用集成电路),旨在将机器学习广泛应用于移动市场。
这些ASIC具有特殊的架构设计,使它们能够更快地执行机器学习模型,而不是将数据卸载到服务器,然后等待它的响应。这种执行可能没有那么强大,但是会更快,因为数据和处理中心之间的壁垒更少。
NPU比普通CPU有什么优势?
一般来说,我们可以理解为NPU就是AI芯片,普通芯片就是CPU。
CPU在一般负载环境下会工作得很好,因为它有较高的IPC,可以通过很多串口执行。并且CPU遵循冯诺依曼架构,其核心是存储程序并顺序执行。CPU的架构需要大量的空间来存储缓存和控制单元,相比之下计算单元只占很小一部分,所以在大规模并行计算能力上极其有限,更擅长逻辑控制。
NPU和GPU的亮点在于可以运行多个并行线程。NPU通过一些特殊的硬件级优化升级到另一个层次,比如为一些真正不同的处理核心提供一些容易访问的缓存系统。这些高容量内核比通常的“常规”处理器更简单,因为它们不需要执行许多类型的任务。这一整套的“优化”让NPU的效率更高,这也是为什么会有那么多研发投入ASIC的原因。
机器学习模型处理需要CPU、DSP、GPU、NPU同时同步,这是很多芯片处理单元的共同工作。但这也解释了为什么这样的执行对于移动设备来说是“沉重”的。
NPU的一个优势是大部分时间专注于低精度算法、新的数据流架构或者内存计算能力。与GPU不同,它们更关心吞吐量而不是延迟。
当然,AI算法很重要。在图像识别、CNN卷积网络、语音识别、自然语言处理等领域都常用,主要是RNN,这是两种不同的算法。但本质上都是矩阵或向量的乘加,再配合一些除法、指数等算法。
此外,成熟的AI算法针对卷积运算和加权求和进行了优化。这个过程非常快。就像没有图形硬件的GPU。对于AI芯片,如果确定了具体的目标尺寸,就确定了乘法和加法计算的总次数。比如一万亿次,就好比说,我用AI芯片运行程序,花了我一顿饭就解决了,而CPU需要运行好几周。有时间差距,没有商业公司会浪费时间。
全球AI芯片公司有哪些?
除了寒武纪,国内还有这些知名的AI芯片公司,如比特大陆、地平线、天智智芯、易智电子、发现科技、企名网科技、海思、建安科技等。都经历了从现在到现在的实际测试期,都是现在的情况。每个公司的产品都是独一无二的,在功耗、性能、应用场景上都有自己的风格,能够在中国这个广阔的市场上占据一席之地。
中国人工智能芯片公司正在蓬勃发展。国外AI芯片的发展怎么样?现在让我们来看看那些我们认为是人工智能芯片顶级开发商的公司,虽然排名不分先后——只是那些展示了他们的技术并已经投入生产或即将投入生产的公司。如下所示:
https://www.zhucesz.com/(谷歌母公司)
谷歌母公司敦促在许多领域发展人工智能技术,包括云计算、数据中心、移动设备和台式电脑。也许最值得注意的是它的张量处理单元,这是一个专门为谷歌TensorFlow编程框架设计的ASIC。它主要用于机器学习和深度学习,这是人工智能的两个分支。
谷歌的云TPU应用于数据中心或云解决方案,其大小相当于一张信用卡。然而,边缘TPU是一种不到一美分的硬币,它是专门为一些特定的设备设计的。然而,更密切观察这一市场的分析师表示,谷歌的Edge TPU不太可能在短期内出现在该公司自己的智能手机和平板电脑上,但更有可能用于更高端、企业和昂贵的机器和设备。
2.苹果
苹果多年来一直在开发自己的arm芯片,最终可能会停止使用英特尔等供应商。苹果已经基本摆脱了与高通的纠缠,在未来的人工智能领域,它似乎真的下定决心要走自己的路。
该公司在最新的iphone和ipad上使用了A13“仿生”芯片。该芯片使用苹果的神经引擎,是电路的一部分,不能被第三方应用程序使用。A13仿生芯片比之前的版本速度更快,功耗更低。据报道,A14版本目前正在生产中,今年可能会出现在该公司的更多移动设备上。
3.手臂武器袖子装备
Arm (ArmHoldings)生产的芯片设计已经被包括苹果在内的所有领先科技厂商采用。作为芯片设计商,它不自己做芯片,这让它有了一些优势,就像微软不自己做电脑一样。换句话说,Arm在市场上的影响力很大。目前公司正在沿着三个主要方向研发:项目Trillium,一款“超高效”、可扩展的新型处理器,瞄准机器学习应用;学机器处理器,不言而喻;ARM是神经网络的缩写,是处理TensorFlow的处理器,Caffe是深度学习框架,还有一些其他的结构。
4.英特尔公司
早在20日,据《华尔街日报》报道,芯片巨头英特尔宣布收购初创公司NervanaSystems。英特尔将收购该公司的软件、云计算服务和硬件,从而使产品更好地适应人工智能的发展。但它的一系列人工智能芯片,被称为“神经网络处理器”:人工神经网络通过经验和例子模仿人脑的工作和学习方式,这就是为什么你经常听到机器和深度学习系统需要“训练”。随着之前Nervana的发布,似乎英特尔将优先解决与自然语言过程和深度学习相关的问题。
5.英伟达(Nvidia)
在GPU市场,我们提到GPU处理人工智能任务的速度比CPU快得多,英伟达似乎处于领先地位。同样,该公司似乎在新生的人工智能芯片市场上获得了优势。这两项技术似乎密切相关,英伟达在GPU方面的进步有助于加速其人工智能芯片的发展。事实上,gpu似乎是英伟达人工智能产品的支撑,其芯片组可以称为人工智能加速器。Jetson Xavier于2018年发布,该公司首席执行官黄仁勋在发布会上表示:“这台小小的计算机将成为未来机器人的大脑”。
深度学习似乎是英伟达感兴趣的主要领域。深度学习是更高层次的机器学习。你可以把机器学习看作是利用相对有限的数据集进行的短期学习,而深度学习则是利用长时间收集的大量数据返回结果,这些结果反过来又是为了解决更深层次和潜在的问题。
6.超微半导体
与英伟达一样,AMD是另一家与显卡和GPU密切相关的芯片制造商,部分原因是过去几十年电脑游戏市场的增长和比特币挖矿的增长。AMD提供硬件和软件解决方案,如EPYC cpu和镭龙Instinct gpu的机器学习和深度学习。Epyc是AMD为服务器提供的处理器名称(主要用于数据中心),而镭龙是一款主要面向游戏玩家的图形处理器。AMD提供的其他芯片包括锐龙,或许还有更知名的Athlon。该公司似乎处于人工智能专用芯片开发的相对早期阶段,但鉴于其在GPU领域的相对实力,观察人士认为它将成为该市场的领导者之一。AMD已经签署了一份合同,向美国能源部提供Epyc和镭龙系统,用于建造世界上最快和最强大的超级计算机之一,被称为“前沿”。
7.高通(高通)
高通在智能手机繁荣初期通过与苹果合作赚了很多钱。苹果停止购买其芯片的决定可能会让高通感到受冷落。当然,高通本身在这个领域并不是一个小公司,考虑到未来,它一直在进行一些重大投资。
去年,高通发布了一款新的“云人工智能芯片”,似乎与其在第五代电信网络(5G)中的发展有关。这两项技术被认为是建立自动驾驶汽车和移动计算设备新生态系统的基础。分析师表示,高通是人工智能芯片领域的后来者,但该公司在移动设备市场拥有丰富的经验,这将有助于实现其“让人工智能遍布各地的设备”的目标。
当然,其他大型国际公司,如三星、TSMC、脸书、IBM和LG,也在开发自己的人工智能芯片。谁能先掌握前沿的AI芯片,谁就能在新的经济上升趋势中分得一杯羹。
大公司营销部门描绘的现实与那些公司之外的现实大相径庭。虽然几十年的研究给了我们一种处理信息和分类输入的新方法,比以往任何时候都更快,但我们购买的硬件中并没有真正的AI。所以,哪家芯片公司能抓住市场痛点,先实现应用,就能在人工智能芯片的赛道上获得较大优势。
目前,全球人工智能产业仍在高速发展。不同行业为人工智能的应用提供了广阔的市场前景。商业社会需要人工智能的应用。AI芯片是实现算法的硬件基础,也是未来人工智能时代的战略制高点。全球顶尖公司都会为之而战。然而,由于目前的AI算法往往各有利弊,只有为其设置合适的场景,才能发挥其最佳作用。也希望AI能在今天早上进入普通人的视线。
从产业发展的角度来看,现在还是人工智能芯片的初级阶段,无论是科研还是商业应用,都有不同寻常的创新空间。在应用场景上,具有迭代算法的AI芯片将发展成为具有更高灵活性和适应性的通用智能芯片,这是技术发展的必然方向。神经网络参数更少的计算位宽、分布式存储器更定制化的设计、更稀疏的大规模矢量实现、复杂异构环境下更高的计算效率、更小的体积和更高的能效,计算和存储的一体化将成为未来人工智能芯片的主要特征和发展趋势。
参考资料:
1.《2019年中国IC设计行业投资前景研究报告》
2.人工智能芯片发展现状及趋势[J]科技导报
3.互联网上的图片