华为「硬」生生把AI搞出暴力美学

仅1年,Atlas900再创纪录

金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

「华为速度」,在AI计算领域到底该如何评价?

一言以蔽之:暴力美学

而且这种速度,由浅及深地拆分来看,可以分为两层

首先,是物理意义上的超高速度

这种能力在刚刚结束的第十六届全国高性能计算学术年会(CCF HPC China 2020),最能直接展现。

在这场全球范围内、高性能计算领域最具影响力的三大顶会之一上,华为Atlas 900凭借其超强的AI算力,打破自己创下的纪录,在ResNet-50上的跑分仅需28秒。

其次,是更深层次的华为AI速度

从2018年华为全联接大会(HC)首次对外宣布AI战略开始,仅仅2年时间,便在技术、产业、人才和生态各方面,展露出了「领军姿态」。

现在,是时候完整揭秘一下华为AI的暴力美学了。

Atlas 900速度如何问鼎业界第一?

Atlas 900,从去年9月诞生开始,便打上了「世界最快AI产品」的标签。

训练ResNet-50只需要59.8秒,比当时排名第二的选手快出了15%之多。

而时隔短短一年,Atlas 900超越自己,再次创造了世界纪录

在HPC大会上,华为昇腾计算业务CTO 周斌介绍道:

Atlas 900凭借其超强的AI算力,使得ResNet-50的训练时间仅需28秒!相比去年59.8秒的测试成绩缩短一半以上,体现了Atlas 900软硬件协同优化的持续演进能力。

△华为昇腾计算业务CTO 周斌

据介绍,集群芯片数量仅为1024颗昇腾910芯片,而其它同类产品在芯片数量方面都要比Atlas要多,甚至达到了2倍。

并且,从单芯片算力来看,昇腾910能够达到320TFLOPS的超高算力。

在算力飞速迭代、发展的今天,Atlas 900能够保持业界第一,离不开其背后的一套「杀手锏」

这套「杀手锏」就是华为AI计算中心解决方案

多样性算力方面,支持GPU和NPU资源统一调度和管理。

除此之外,还提供端边云协同统一运维全栈服务等能力,这就使得Atlas 900在全球范围内具备竞争力。

而这,就是华为在硬件方面的暴力速度。

但在拥有了这样的速度之后,用来做什么,也是一个值得思考的问题。

华为AI发力HPC,Why?

此次大会中,华为昇腾计算业务CTO周斌的一番演讲,道出了问题的答案。

「我们处在爆炸式创新前夜」,这是周斌首先抛出来的一个观点。

以数据量为例,从今年的44ZB,预计到2025年,便会增长到180ZB;智能互联网设备将从340亿增长到1500亿;计算中心AI的工作量将从现在的小于10%,增长到80%……

虽然高性能计算(HPC)在处理海量数据问题时,能够带来一定的优势,但面对如此爆炸性增长,还是远远不够。

新增的大量数据、接入设备,对计算带来了空前的挑战。

对此,周斌在现场抛出了他的观察:

AI和HPC的融合,是未来发展的一大趋势。
AI改变传统HPC计算的求解方法。

例如,2018年入围「Gordon Bell」决赛的6个应用中,有半数用AI+HPC融合的应用示范。

再者,在高性能计算领域著名榜单Top500中,近30%系统拥有加速卡/协处理器。换言之,越来越多的系统配有大量低精度算术逻辑单元,用来支撑人工智能计算能力需求。

尤其榜单前十名都使用AI计算的能力。

并且,「AI+HPC」已经在众多领域崭露头角:

  • 全球气象领域,美国国家大气研究中心(NCAR) 用CNN网络预测冰雹概率, 用82000个不同的风暴样本训练后,测试32000个已知的风暴样本,冰雹预测准确率达88%。
  • 监控地球脉动方面,美国国家航空航天局 (NASA) 开发出通过深度学习网络 DeepSat,用于实现卫星图像分类和分割。
  • 医学领域,佛罗里达大学和北卡罗来纳大学结合使用深度学习,开发出一种神经网络引擎,该引擎能够以超低成本生成计算快速的高精度分子模拟,用于药物研发。

而这些工作、研究,若是仍旧采用传统HPC手段来处理,不仅成本上会有大量的消耗,效率方面也会大打折扣。

一言蔽之,「AI+HPC,让一切皆可计算」

这也正是华为发力HPC的原因,以Atlas 900为代表的「华为速度」也逐渐在此生根发芽。

然而,Atlas 900的速度,也只是华为AI暴力速度的冰山一角。

如何评价华为AI的速度?

暴力美学,为何可以这样评价。

其实,回顾一下华为AI这两年的发展,便可知其一二。

首先,是于技术

华为Atlas人工智能计算解决方案,可以说是近年来华为在AI技术发展中的集大成者。

从2018年首次提出,到现在仅仅2年时间,发展到了「云边端」全场景布局,而且在互联网、金融、能源、制造等众多领域实现了落地。

再以「昇腾AI全栈」为例:

  • AI算子开发方面,「异构计算架构CANN」在两年时间里迭代到了3.0版本。
  • AI模型开发方面,全场景AI计算框架MindSpore在今年3月份正式开源,仅6个月后,便发布1.0版本。
  • AI应用开发方面,MindX 1.0极简易用的特性,能满足那些没有深度开发能力的开发者;以及ModelArts也已步入了3.0时代,从训练数据到模型落地一站式打通。
  • 全流程开发工具链 MindStudio2.0,涵盖了算子开发、模型训练、模型推理、应用开发和应用部署。

当然,以昇腾为基础的AI全栈,也已成型。

而它们的搭建,仅仅才2年时间。

其次,产业维度,一组数据就能说明问题。

以鲲鹏、昇腾为基础的发展过程中,已经涵盖了30万开发者、1000+合作伙伴、3000+解决方案认证,并且还在以每月,甚至是每周的速度在迭代更新。

以如此速度在AI产业大步向前行进,道路的坎坷程度可想而知,而华为却说到做到。

以及,于人才开发者高校

华为已经在70+所高校开设了AI课程,积累了10万+开发者进行AI开发,凝聚出了120多个行业智能化转型解决方案。

今年,华为也会在推进AI技术研发的同时,再度加码生态培育——投入2亿美元发展计算产业生态。

所以这种「暴力美学」,也会更快让高校和产业用得上、用得起、用得好~

版权所有,未经授权不得以任何形式转载及使用,违者必究。