日本超算历时9年重返全球超算榜首,ARM加持夺冠,英特尔今年多线溃败

高性能计算,ARM也是行家

萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI

今年超级计算机的一哥是谁,Summit还是神威?

都不是。

当Top 1上Fugaku的名字跃入眼帘时,大多数人都感到不可思议。

毕竟Fugaku的启用可以说是提前了。

就日本此前公布的信息来看,Fugaku是其原计划在2021年再启用的一台新型超级计算机,而日本前任超级计算机,世界上第一台万兆的超算,如今已经被挤到第18名。

Fugaku译“富岳”,是日本富士山的别名,寓指其新一代超级计算机性能之高、使用领域之广。

△ “富岳”超级计算机

事实上,中国和美国也曾表示在2020至2021年间,会开发出与“富岳”能力相匹的超级计算机,但这次“富岳”的夺冠显然抢先一步。

一定程度上,这次夺冠要归功于“富岳”采用的ARM处理器。

怎么说?先来看看ARM在高性能计算方向上表现出的能力。

ARM发威:做得好低功耗,干得过高性能计算

事实上,此前ARM系列的CPU一直更侧重于为低功耗性能而设计。

例如,在Cortex-M系列微控制器的架构设计上,就支持睡眠模式Sleep-on-exit功能(一旦中断处理完成,微控制器便会返回睡眠模式),能够显著降低处理器能耗,如下图所示。

△ 与Intel 8051相比,Cortex-M系列的能耗明显更低

但显然,ARM的野心不仅仅在低功耗技术上。

此次夺冠的“富岳”,采用ARM的A64FX处理器,体现出了强大的高性能计算能力。

“富岳”核心的浮点运算部分采用了ARM的指令集,同时使用SVE浮点单元,支持512bit位宽浮点运算,大幅度强化了运算能力。

处理器的架构设计也很特别,由48个计算核心,外加4个辅助核心构成。其一共分为4个CMG 单元,每个单元有13个核心。

据了解,这次制作的A64FX处理器采用7纳米FinFET制程技术生产,内含 87.86 亿个晶体管,性能可达 2.7 TFLOPS。

在计算能力上,“富岳”的计算能力达到了415.5千兆次,达到了目前排行第二的超算Summit的2.8倍

莫非属于ARM的时代真的要来临了?

苹果采用ARM自研发芯片,英特尔未来路行何方

无独有偶,ARM除了在高性能计算大秀肌肉,苹果方面也有大动作。

在这次2020 WWDC发布会上,苹果的自研ARM芯片可以说是在“平静的水波中投下了一颗陨石”,激起的远不仅仅是涟漪。

事实上,苹果在 2019 年就曾聘用处理器专家Mike Filippo。作为ARM的前任首席结构师,Mike Filippo参与过Cortex A57/A72/A76三款ARM大核心设计,加入ARM之前还是英特尔的首席架构师。

尽管苹果与英特尔的合作长达15年,但乔布斯也曾说过,一个计算架构如果已使用10 年,基本上就已经达到其性能极限。而如今,15年过去了,“牙膏厂”更是激起了苹果自研芯片的动力。

“富岳”夺冠后,有网友表示,似乎英特尔占据半导体行业的情形即将成为过去式。

英特尔的x86曾经开创了一个时代,但如今,伴随着TMSC推出5nm芯片、采用ARM的超算夺冠、连苹果/Chromebooks/微软都开始使用ARM,似乎x86的时代已经过去。

立刻有网友反驳。

哪怕英特尔的芯片停留在14nm,x86给我的感觉犹在昨日,它的性能甚至超过了某些更小的芯片。更何况,英特尔的10nm芯片要出了。

但无论网友抱持哪一种观点,x86目前仍然是大部分超级计算机的主要处理器体系结构。

在排行前500的超级计算机中,有481个依旧在采用x86运行。相较之下,ARM处理器仅出现在4个TOP 500的系统中。

尽管英特尔庞大的根基和背景表明,其在行业内的地位短期内不会被撼动,但以ARM的发展速度来看,它仍然需要感到一定的危机,并开始尝试突破新的方向。

参考链接https://www.top500.org/news/japan-captures-top500-crown-arm-powered-supercomputer/

版权所有,未经授权不得以任何形式转载及使用,违者必究。