一份邀请函引发的中国芯片新猜想

“芯云长天”,有点故事

金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

云端AI芯片,已经成为兵家必争之地。

据ABI Research统计,从全球市场发展来看,这块“大蛋糕”将在2024年达到191亿美元的规模。

因此,全球范围内的主要芯片玩家们纷至沓来,早早地开始布局于此:

英伟达、谷歌、英特尔、AMD、百度、亚马逊……

经过数年时间的发展,由于英伟达GPU拥有丰富的产品线、强大的软件生态等优势,目前在云端AI芯片市场处于“一家独大”的局面。

但与此同时,GPU对于云端AI芯片也并非完美,存在着功耗大、价格昂贵等问题。

相对的,FPGA和ASIC因其低功耗、可编程等优势,使得一些国外的新晋厂商采取异构计算打法切入,推出了更加适合云端通用计算的AI芯片。例如:

Cerebras Systems、Graphcore、Habana(已被英特尔收购)、Wave Computing等。

随着云计算和AI的结合不断深入,云端AI芯片的市场潜力不容小觑。在国外科技巨头持续发力云端AI芯片之时,中国公司也敏锐地嗅到了这一市场方向,与美国同行们几乎同时起步。

随着深度学习的不断发展,AI越来越多地渗入到数据中心来,渗透率将高达25%-30%,是一个非常庞大的市场。

这就是被市场看作中国芯片黑马——燧原科技所提出的观点。

他们仅耗时18个月,便一次性流片成功,打造了国产AI云端训练芯片——邃思。

可谓是在中国芯片界一战成名。

而就在最近,量子位收到了一张来自燧原科技的邀请函。

起初小编未太在意。

但定睛一看,燧原科技貌似要有大动作了!

从一张邀请函中引发的猜想

初看这份邀请函,最先映入眼帘的便是“芯云长天”这个醒目的标题。

先从“芯云”二字入手:

  • “芯”应当是指芯片。
  • “云”则是云端之意。

毕竟燧原科技位居“云端AI芯片”玩家之列,这种解释应当是没错了。

而“长天”二字,原意为:辽阔的天空。

结合前面的“芯”、“云”二字,应当是希望在云端AI芯片的天地中大展宏图。

再来看下邀请函中的第二个细节

标题文字背后的这些曲线,似乎也有点文章,像是许多条收敛曲线。

咦?把这些元素规整一下,线索来了。

看来想要求解答案,还得从燧原科技的“起点”着手。

公开资料显示,燧原科技是于2018年3月19日,在上海正式成立。

在成立1个月之后,拿到种子轮融资的燧原科技,便马上进入到了研发芯片的阶段。

仅仅过了20个月,也就是在2019年12月,就发布了自研的第一款云端AI训练芯片邃思DTU,去年9月又宣布其云端训练加速卡“云燧T10”落地商用。

这种速度着实是有些惊人了。

要知道,业界设计一款GPU/CPU,从设计到最后的量产,平均要耗时3年甚至更久。

更何况,邃思DTU还是从无到有地设计了全新的架构、处理器和指令集。

而且这款芯片不仅仅是研发周期短,技术指标也是十分亮眼:

  • 单卡单精度(FP32)算力达20TFLOPS
  • 半精度及混合精度 (BF16/FP16)算力80TFLOPS
  • 最大功耗为225W
  • 12nm工艺,2.5D先进封装

而在邃思DTU的基础上,燧原科技分别又在云端训练推理两大阵营,发布了其自研产品。

训练方面,分别是面向云端数据中心的AI训练加速卡云燧T10和基于OCP(开放计算项目)OAM(开放加速模组)标准设计的AI训练加速模组云燧T11

在推理方面,燧原科技所推出的产品,则是云燧i10

它是一款面向云端数据中心的高性能人工智能推理加速卡,可广泛应用于计算机视觉、自然语言处理、语音识别与合成、知识图谱等多类型云端推理场景。

除了硬件上的产品,燧原科技在软件方面也推出了驭算——计算及编程平台。

据公开资料显示,驭算支持主流深度学习框架,并针对邃思芯片进行了特定优化。

整个平台不仅包括常用的算子加速库,还可以为数据中心大规模训练集提供调度机制。

1张云端训练芯片、2款云端训练产品、1款云端推理产品,再加1个计算/编程平台。

这就是燧原科技在成立三年多时间内解锁的成就。

而从这一路发展的路径来看,燧原科技最先攻坚的云端AI芯片中,属于最艰难的部分——训练芯片。

讲真,有被硬核到。

好了,挖完第二条线索,我们继续。

目光暂且移至邀请函的上方,最为醒目的便是这个半圆了。

虽然单看这个形状猜不出太多深层的含义,但直观其颜色和质感,是那种黑科技硬核感没错了。

但俗话说得好:“站得高,看得远”。

把“镜头”抬高一些!

真正的第三条线索,它来了!

与前方绵延的山脉连在一起看,这不就是个数字“2”吗?

现在再结合刚才半圆的黑科技质感,莫非是……

最硬核的芯片要有到动作?

再大胆的猜测,莫非是要把邃思DTU来个升级?

若真如此,那可将会是一个“连锁反应”。

因为最核心的云端AI芯片升级,其训练等产品自然也会在性能上有大幅度的提升。

同时,对大规模算法模型的支持能力也会显著增强;而更进一步的,内存、宽带等属性也得跟上升级的步伐。

但比这些更具意义的一点会是:

在国内,这将会成为首个实现二次迭代的云端训练芯片。

这是因为芯片的种类众多,不同芯片的技术门槛也不一样,AI芯片亦是如此。

而国产AI云端训练芯片,也正如文章开始讲述的那样,由于GPU等芯片的成熟,这个高端细分领域却一直是处于一片空白的状态。

也正如此,国产AI云端训练芯片用“一片蓝海”来形容也是不足为过的。

若是邃思DTU真的能够完成二次迭代,除了解锁“全国首个”之外,更长远的角度来看,更是能让业界看到中国AI芯片设计的高水准

以上便是量子位“从一张邀请函引发猜想”的故事。

在第一代训练产品“云燧T10”发布的18个月后,上述对于新品的各种猜测,是否会成真,一切答案将在7月7日的产品发布会中揭晓,让我们拭目以待!

版权所有,未经授权不得以任何形式转载及使用,违者必究。