华为「硬」生生把AI搞出暴力美学

十三 2020-09-30 16:08:47 来源：量子位

仅1年，Atlas900再创纪录

金磊发自凹非寺
量子位报道 | 公众号 QbitAI

「华为速度」，在AI计算领域到底该如何评价？

一言以蔽之：暴力美学。

而且这种速度，由浅及深地拆分来看，可以分为两层。

首先，是物理意义上的超高速度。

这种能力在刚刚结束的第十六届全国高性能计算学术年会（CCF HPC China 2020），最能直接展现。

在这场全球范围内、高性能计算领域最具影响力的三大顶会之一上，华为Atlas 900凭借其超强的AI算力，打破自己创下的纪录，在ResNet-50上的跑分仅需28秒。

其次，是更深层次的华为AI速度。

从2018年华为全联接大会（HC）首次对外宣布AI战略开始，仅仅2年时间，便在技术、产业、人才和生态各方面，展露出了「领军姿态」。

现在，是时候完整揭秘一下华为AI的暴力美学了。

Atlas 900速度如何问鼎业界第一？

Atlas 900，从去年9月诞生开始，便打上了「世界最快AI产品」的标签。

训练ResNet-50只需要59.8秒，比当时排名第二的选手快出了15%之多。

而时隔短短一年，Atlas 900超越自己，再次创造了世界纪录。

在HPC大会上，华为昇腾计算业务CTO 周斌介绍道：

Atlas 900凭借其超强的AI算力，使得ResNet-50的训练时间仅需28秒！相比去年59.8秒的测试成绩缩短一半以上，体现了Atlas 900软硬件协同优化的持续演进能力。

据介绍，集群芯片数量仅为1024颗昇腾910芯片，而其它同类产品在芯片数量方面都要比Atlas要多，甚至达到了2倍。

并且，从单芯片算力来看，昇腾910能够达到320TFLOPS的超高算力。

在算力飞速迭代、发展的今天，Atlas 900能够保持业界第一，离不开其背后的一套「杀手锏」。

这套「杀手锏」就是华为AI计算中心解决方案。

多样性算力方面，支持GPU和NPU资源统一调度和管理。

除此之外，还提供端边云协同、统一运维、全栈服务等能力，这就使得Atlas 900在全球范围内具备竞争力。

而这，就是华为在硬件方面的暴力速度。

但在拥有了这样的速度之后，用来做什么，也是一个值得思考的问题。

华为AI发力HPC，Why？

此次大会中，华为昇腾计算业务CTO周斌的一番演讲，道出了问题的答案。

「我们处在爆炸式创新前夜」，这是周斌首先抛出来的一个观点。

以数据量为例，从今年的44ZB，预计到2025年，便会增长到180ZB；智能互联网设备将从340亿增长到1500亿；计算中心AI的工作量将从现在的小于10%，增长到80%……

虽然高性能计算（HPC）在处理海量数据问题时，能够带来一定的优势，但面对如此爆炸性增长，还是远远不够。

新增的大量数据、接入设备，对计算带来了空前的挑战。

对此，周斌在现场抛出了他的观察：

AI和HPC的融合，是未来发展的一大趋势。
AI改变传统HPC计算的求解方法。

例如，2018年入围「Gordon Bell」决赛的6个应用中，有半数用AI+HPC融合的应用示范。

再者，在高性能计算领域著名榜单Top500中，近30%系统拥有加速卡/协处理器。换言之，越来越多的系统配有大量低精度算术逻辑单元，用来支撑人工智能计算能力需求。

尤其榜单前十名都使用AI计算的能力。

并且，「AI+HPC」已经在众多领域崭露头角：

在全球气象领域，美国国家大气研究中心(NCAR) 用CNN网络预测冰雹概率, 用82000个不同的风暴样本训练后，测试32000个已知的风暴样本，冰雹预测准确率达88%。
在监控地球脉动方面，美国国家航空航天局 (NASA) 开发出通过深度学习网络 DeepSat，用于实现卫星图像分类和分割。
在医学领域，佛罗里达大学和北卡罗来纳大学结合使用深度学习，开发出一种神经网络引擎，该引擎能够以超低成本生成计算快速的高精度分子模拟，用于药物研发。

而这些工作、研究，若是仍旧采用传统HPC手段来处理，不仅成本上会有大量的消耗，效率方面也会大打折扣。

一言蔽之，「AI+HPC，让一切皆可计算」。

这也正是华为发力HPC的原因，以Atlas 900为代表的「华为速度」也逐渐在此生根发芽。

然而，Atlas 900的速度，也只是华为AI暴力速度的冰山一角。

如何评价华为AI的速度？

暴力美学，为何可以这样评价。

其实，回顾一下华为AI这两年的发展，便可知其一二。

首先，是于技术。

华为Atlas人工智能计算解决方案，可以说是近年来华为在AI技术发展中的集大成者。

从2018年首次提出，到现在仅仅2年时间，发展到了「云边端」全场景布局，而且在互联网、金融、能源、制造等众多领域实现了落地。

再以「昇腾AI全栈」为例：

AI算子开发方面，「异构计算架构CANN」在两年时间里迭代到了3.0版本。
AI模型开发方面，全场景AI计算框架MindSpore在今年3月份正式开源，仅6个月后，便发布1.0版本。
AI应用开发方面，MindX 1.0极简易用的特性，能满足那些没有深度开发能力的开发者；以及ModelArts也已步入了3.0时代，从训练数据到模型落地一站式打通。
全流程开发工具链 MindStudio2.0，涵盖了算子开发、模型训练、模型推理、应用开发和应用部署。

当然，以昇腾为基础的AI全栈，也已成型。

而它们的搭建，仅仅才2年时间。

其次，产业维度，一组数据就能说明问题。

以鲲鹏、昇腾为基础的发展过程中，已经涵盖了30万开发者、1000+合作伙伴、3000+解决方案认证，并且还在以每月，甚至是每周的速度在迭代更新。

以如此速度在AI产业大步向前行进，道路的坎坷程度可想而知，而华为却说到做到。

以及，于人才、开发者和高校。

华为已经在70+所高校开设了AI课程，积累了10万+开发者进行AI开发，凝聚出了120多个行业智能化转型解决方案。

今年，华为也会在推进AI技术研发的同时，再度加码生态培育——投入2亿美元发展计算产业生态。

所以这种「暴力美学」，也会更快让高校和产业用得上、用得起、用得好~

华为昇腾910 高性能计算

十三

商汤科技日日新大模型亮相巴黎，中国AI共赴奥运之约2024-07-26
智谱AI版Sora来了！人人免费不限次，有手机就能玩，API也开放了2024-07-26
Mac装上字节豆包，艾玛！一下变AI PC了！2024-07-22
英特尔举办2024网络与边缘计算行业大会，推动边缘AI创新发展2024-07-24

华为「硬」生生把AI搞出暴力美学

Atlas 900速度如何问鼎业界第一？

华为AI发力HPC，Why？

如何评价华为AI的速度？

相关阅读

全国“最高”的视觉竞赛，华为Atlas打通遥感图像智能分析任督二脉

华为自研编程语言「仓颉」火上热搜，已正式开启内测，成员辟谣：不是中文编程

华为5G手机芯片被唱衰：美研究机构拆解6款量产机，不谈能力对标高通骁龙X50

53帧变900帧！AI让你不用昂贵的高速摄像机也能制作慢镜头，来自华为｜CVPR 2021

任正非：鸿蒙与苹果系统相媲美应该不需要两到三年

华为最新「天才少年」：博士四年21篇论文，却自称是个「低能儿」

热门文章

雷军：地表最强四门车，小米造！自曝造车起步估值超700亿

陶哲轩在IMO上给AI团队颁奖！他们要做AI数学的ImageNet

给iPhone背面贴个AI录音机，生意老好了

AI视频修复速度10倍提升，过曝变色也能逐帧搞定｜美图国科大新算法

微软蓝屏搞瘫全球，马斯克很生气，原因很尴尬