< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

一份邀请函引发的中国芯片新猜想

十三 2021-06-28 13:34:51 来源：量子位

“芯云长天”，有点故事

金磊发自凹非寺
量子位报道 | 公众号 QbitAI

云端AI芯片，已经成为兵家必争之地。

据ABI Research统计，从全球市场发展来看，这块“大蛋糕”将在2024年达到191亿美元的规模。

因此，全球范围内的主要芯片玩家们纷至沓来，早早地开始布局于此：

英伟达、谷歌、英特尔、AMD、百度、亚马逊……

经过数年时间的发展，由于英伟达GPU拥有丰富的产品线、强大的软件生态等优势，目前在云端AI芯片市场处于“一家独大”的局面。

但与此同时，GPU对于云端AI芯片也并非完美，存在着功耗大、价格昂贵等问题。

相对的，FPGA和ASIC因其低功耗、可编程等优势，使得一些国外的新晋厂商采取异构计算打法切入，推出了更加适合云端通用计算的AI芯片。例如：

Cerebras Systems、Graphcore、Habana（已被英特尔收购）、Wave Computing等。

随着云计算和AI的结合不断深入，云端AI芯片的市场潜力不容小觑。在国外科技巨头持续发力云端AI芯片之时，中国公司也敏锐地嗅到了这一市场方向，与美国同行们几乎同时起步。

随着深度学习的不断发展，AI越来越多地渗入到数据中心来，渗透率将高达25%-30%，是一个非常庞大的市场。

这就是被市场看作中国芯片黑马——燧原科技所提出的观点。

他们仅耗时18个月，便一次性流片成功，打造了国产AI云端训练芯片——邃思。

可谓是在中国芯片界一战成名。

而就在最近，量子位收到了一张来自燧原科技的邀请函。

起初小编未太在意。

但定睛一看，燧原科技貌似要有大动作了！

从一张邀请函中引发的猜想

初看这份邀请函，最先映入眼帘的便是“芯云长天”这个醒目的标题。

先从“芯云”二字入手：

“芯”应当是指芯片。
“云”则是云端之意。

毕竟燧原科技位居“云端AI芯片”玩家之列，这种解释应当是没错了。

而“长天”二字，原意为：辽阔的天空。

结合前面的“芯”、“云”二字，应当是希望在云端AI芯片的天地中大展宏图。

再来看下邀请函中的第二个细节。

标题文字背后的这些曲线，似乎也有点文章，像是许多条收敛曲线。

咦？把这些元素规整一下，线索来了。

看来想要求解答案，还得从燧原科技的“起点”着手。

公开资料显示，燧原科技是于2018年3月19日，在上海正式成立。

在成立1个月之后，拿到种子轮融资的燧原科技，便马上进入到了研发芯片的阶段。

而仅仅过了20个月，也就是在2019年12月，就发布了自研的第一款云端AI训练芯片邃思DTU，去年9月又宣布其云端训练加速卡“云燧T10”落地商用。

这种速度着实是有些惊人了。

要知道，业界设计一款GPU/CPU，从设计到最后的量产，平均要耗时3年甚至更久。

更何况，邃思DTU还是从无到有地设计了全新的架构、处理器和指令集。

而且这款芯片不仅仅是研发周期短，技术指标也是十分亮眼：

单卡单精度（FP32）算力达20TFLOPS
半精度及混合精度（BF16/FP16）算力80TFLOPS
最大功耗为225W
12nm工艺，2.5D先进封装

而在邃思DTU的基础上，燧原科技分别又在云端训练和推理两大阵营，发布了其自研产品。

训练方面，分别是面向云端数据中心的AI训练加速卡云燧T10和基于OCP（开放计算项目）OAM（开放加速模组）标准设计的AI训练加速模组云燧T11。

在推理方面，燧原科技所推出的产品，则是云燧i10。

它是一款面向云端数据中心的高性能人工智能推理加速卡，可广泛应用于计算机视觉、自然语言处理、语音识别与合成、知识图谱等多类型云端推理场景。

除了硬件上的产品，燧原科技在软件方面也推出了驭算——计算及编程平台。

据公开资料显示，驭算支持主流深度学习框架，并针对邃思芯片进行了特定优化。

整个平台不仅包括常用的算子加速库，还可以为数据中心大规模训练集提供调度机制。

1张云端训练芯片、2款云端训练产品、1款云端推理产品，再加1个计算/编程平台。

这就是燧原科技在成立三年多时间内解锁的成就。

而从这一路发展的路径来看，燧原科技最先攻坚的云端AI芯片中，属于最艰难的部分——训练芯片。

讲真，有被硬核到。

好了，挖完第二条线索，我们继续。

目光暂且移至邀请函的上方，最为醒目的便是这个半圆了。

虽然单看这个形状猜不出太多深层的含义，但直观其颜色和质感，是那种黑科技硬核感没错了。

但俗话说得好：“站得高，看得远”。

把“镜头”抬高一些！

真正的第三条线索，它来了！

与前方绵延的山脉连在一起看，这不就是个数字“2”吗？

现在再结合刚才半圆的黑科技质感，莫非是……

最硬核的芯片要有到动作？

再大胆的猜测，莫非是要把邃思DTU来个升级？

若真如此，那可将会是一个“连锁反应”。

因为最核心的云端AI芯片升级，其训练等产品自然也会在性能上有大幅度的提升。

同时，对大规模算法模型的支持能力也会显著增强；而更进一步的，内存、宽带等属性也得跟上升级的步伐。

但比这些更具意义的一点会是：

在国内，这将会成为首个实现二次迭代的云端训练芯片。

这是因为芯片的种类众多，不同芯片的技术门槛也不一样，AI芯片亦是如此。

而国产AI云端训练芯片，也正如文章开始讲述的那样，由于GPU等芯片的成熟，这个高端细分领域却一直是处于一片空白的状态。

也正如此，国产AI云端训练芯片用“一片蓝海”来形容也是不足为过的。

若是邃思DTU真的能够完成二次迭代，除了解锁“全国首个”之外，更长远的角度来看，更是能让业界看到中国AI芯片设计的高水准。

以上便是量子位“从一张邀请函引发猜想”的故事。

在第一代训练产品“云燧T10”发布的18个月后，上述对于新品的各种猜测，是否会成真，一切答案将在7月7日的产品发布会中揭晓，让我们拭目以待！

AI芯片云端燧原科技芯片设计

十三

一份邀请函引发的中国芯片新猜想

从一张邀请函中引发的猜想

相关阅读

寒武纪，不愁钱路无客户

AI芯片独角兽一年估值翻番！放话“三年超英伟达”，最新融资53亿

AI芯片公司耐能再获李嘉诚4千万美元投资，此前用3D面具攻破刷脸支付

单个半导体器件也能计算XOR，组合后还可分类图像，荷兰华人学者最新研究登上Nature

36岁北航校友打造中国自主AI芯片第一股！挖矿起家，市值百亿

老黄回应英伟达入股英特尔

热门文章

Cursor 9秒删库搞崩公司，然后…写了份检讨

腾讯开源手机端离线翻译模型，仅0.4G，支持33种语言

全球瞩目！斑陌易行闪耀硅谷，T6 无人车开启商用新纪元

火速吃瓜：Kimi K2.6设计能力超越Claude Design

不卷参数卷架构，这个开源模型把图像理解和生成统一了