< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

国产GPU开始造世界！国内首个全栈具身智能仿真平台来了

十三 2026-05-19 15:03:20 来源：量子位

发布MT Lambda

金磊发自凹非寺

量子位 | 公众号 QbitAI

没有新的GPU，没有新的智算卡。

但一家国产GPU厂商，却在一整场发布会的时间里，做了一件非常物理的事儿——

发布首个全栈国产化的具身智能仿真平台。

先来看效果。

这只名叫小飞的机器狗，缓缓走上了舞台。

在走到舞台中央后，只见屏幕里仿真世界的小飞侧空翻了一下，随即，物理世界的小飞便做出了一模一样的动作。

转个身，再来一次，动作依旧是像粘贴复制的似的。

小飞的运动策略是这样的：

100%是在仿真世界中训练出来，并无损迁移到真实物理世界的。

那么它背后这家国产GPU玩家是谁？这个具身智能仿真平台又叫什么？

不卖关子。

正是由摩尔线程新鲜发布的MT Lambda。

刚才小飞的一套操作，可以理解为：

这是首次在全国产的硬件平台上训练出的运控策略，完整部署到全国产的端侧芯片上，第一次实现了Sim-to-Real（仿真到现实）的真机验证。

至此，摩尔线程也就成为了国内唯一打通“大模型训练 — 仿真模拟 — 端侧部署”全链路的GPU企业。

如果说大模型的爆发是依靠海量互联网数据“喂”出来的，那么具身智能的爆发，则迫切需要一个极度真实的虚拟世界。

而现在，国产GPU，开始自己动手造世界了。

更像是一套物理AI训练的流水线

若我们把MT Lambda拆开来看，其实，它更像一条围绕机器人训练展开的流水线。

最上层，是两个平台：MT Lambda-Lab和MT Lambda-Sim。

MT Lambda-Lab更偏具身策略开发与训练，面向强化学习、模仿学习、VLA模型等任务。

对于开发者来说，这一层要解决的是“怎么让智能体学会做事”的问题，即动作策略怎么训练、行为怎么迭代、模型怎么在复杂任务中逐步变得更稳定等等。

MT Lambda-Sim则更偏高保真物理仿真与渲染，负责场景构建、传感器模拟、数据生成和仿真验证。

它关心的是另一个问题：机器人看到的世界、碰到的物体、执行动作后的反馈，能不能尽可能接近真实世界。

这两者合在一起，就构成一条具身智能开发的主链路：数据合成—策略训练—仿真验证—端侧部署。

为什么这条链路重要？因为现实世界太贵了。

张建中在发布会上，便提到了训练一个好的智能体的三大痛点：

首先缺少大量高质量数据，靠人采集、靠遥操作采集，成本都很高；
其次，真机训练风险和代价很高，不可能让机器人或机器狗每天反复摔倒、损坏；
第三，真实场景往往不可控，也不容易泛化，实验室里能跑，换个环境就可能失效。

这几句话其实点出了具身智能行业当下最现实的矛盾，即模型进化很快，物理场景积累很慢。

大模型可以吃互联网数据，但机器人吃的是现实世界的数据。一个杯子从桌边滑落，一块布料被夹爪抓起，一辆车在雨夜里遇到突发障碍，这些任务很难用简单文本描述完整。它们涉及光照、材质、摩擦、碰撞、运动轨迹和传感器反馈。要让机器人真正学会行动，就必须把这些复杂场景低成本、大规模、可复现地生产出来。

MT Lambda的底层能力，就围绕三类引擎展开：物理、渲染、AI。

先看物理引擎。

MT Lambda集成了MuJoCo-Warp-MUSA、Newton-MUSA等开源后端，也包括摩尔线程自研的AlphaCore物理引擎。

它们基于MUSA架构进行并行求解，支持高精度、可微分的物理计算。在典型仿真负载下，整体仿真吞吐效率可实现约30倍提升。

这意味着什么？

对于机器人来说，物理引擎的价值远远不止让画面里的东西动起来。机械臂抓起一个柔性物体，指尖接触时有力的反馈；四足机器人落地时，不同地面材质会改变受力和姿态；自动驾驶仿真里，车辆、行人、障碍物之间的运动关系要符合真实物理规律。仿真如果不准，训练出来的策略就容易在现实中翻车。

再看渲染引擎。

MT Lambda搭载MT Photon光子引擎，融合光线追踪与混合渲染能力，同时引入3DGS和自研AI生成式渲染能力，用来提升仿真画面的真实感、细腻度和渲染效率。

这部分尤其关键。具身智能既要算动作，也要看世界。摄像头、深度相机、激光雷达、触觉传感器等多模态输入，都会影响机器人如何判断环境。渲染越真实，合成数据越接近真实数据，Sim to Real的鸿沟就越有机会缩小。

现场讲到与光轮智能合作时，张建中提到，MTT S5000具备RT Core光线追踪核心，可以带来接近3倍的图形渲染能力提升；在相关测试中，使用MTT S5000 RT Core硬件光线追踪加速渲染，可获得2.7倍性能提升。

最后是AI引擎。

MT Lambda集成深度适配PyTorch的Torch-MUSA框架，配合muSolver、muFFT等加速库，支持VLA模型开发部署，并融合强化学习和模仿学习训练范式。

放到具身智能里，AI引擎对应的是机器人大脑的训练：它要把视觉、语言、动作连接起来，把环境反馈变成下一步决策。

为什么摩尔线程能把“算、仿、渲”装进一个Lambda？

其实，这也是全功能GPU价值被放大的地方。毕竟，全功能GPU在国内本身便是稀缺的。

因为具身智能对芯片的要求，远不止AI矩阵计算。

机器人训练要跑VLA模型、强化学习和模仿学习，这是AI智算；要模拟碰撞、摩擦、动力学和复杂接触，这是科学计算和物理AI；要生成足够真实的训练画面和传感器数据，这是3D渲染；未来还会涉及大量视频数据的采集、传输、生成和回放，这又离不开超高清视频编解码。

TPU、NPU或者一些GPGPU路线，往往更聚焦AI计算或通用计算的某一类任务。它们在特定场景里可以把效率做到很高，但具身智能的问题更杂，既要训练数字大脑，也要构建物理世界，还要把真实画面和传感器反馈一起纳入训练闭环。

摩尔线程之所以能把MT Lambda做成物理、渲染、AI三大引擎一体的平台，底层原因正在于它从成立以来坚持的全功能GPU路线。

按照摩尔线程给出的定义，全功能GPU依托自研MUSA架构，在单颗芯片中同时支持AI计算、图形渲染、物理仿真、科学计算和超高清视频编解码。

换句话说，MT Lambda并非是在一堆割裂工具之上硬拼出来的套件，而是长在全功能GPU和MUSA统一架构上的平台能力。

对于具身智能来说，这种“算、仿、渲”一体化，恰好对应了机器人训练的真实需求，即一边跑AI模型、一边算物理碰撞、一边渲染真实画面。

过去，开发者可能需要在不同硬件、不同软件栈之间切换：AI训练用一套平台，图形渲染用另一套平台，物理仿真又要接第三套工具。数据在不同系统之间搬来搬去，效率低，调试难，误差也会累积。

MT Lambda想做的，是把这些原本割裂的环节尽可能放回同一套底座上。对于开发者而言，更理想的状态是少花时间和底层适配搏斗，把更多精力放在算法、任务和场景本身。

云端、端侧、生态，也开始闭环了

如果说MT Lambda解决的是怎么训练和仿真，那么摩尔线程另一条线索，是把云端、端侧和生态一起补上。

云端，是夸娥（KUAE）智算集群。

在大模型时代，集群首先被理解为训练底座；但到了具身智能时代，它还像一个巨大的机器人训练场。因为仿真数据一旦规模化，需求会迅速膨胀：

一条机械臂轨迹可能要生成多个机位、多种光照、多种材质、多种扰动下的画面；自动驾驶世界模型每周可能生成海量测试里程；人形机器人训练也需要大量并行环境反复试错……

当数据进入百万帧、千万帧规模，底层算力的角色也会从加速器变成一条生产线。

摩尔线程的夸娥智算集群，核心加速单元包括MTT S5000。其中，MTT S5000基于第四代MUSA架构平湖，单卡AI稠密算力最高1000 TFLOPS，配备80GB显存、1.6TB/s显存带宽，支持FP8到FP64全精度计算，同时也是国内极少数同时支持硬件级光线追踪和AI训推的国产GPU。

这类指标放到具身智能语境下，含义会更清楚：FP8、BF16、FP16等能力服务AI训推，光线追踪服务高保真渲染，物理仿真和科学计算能力服务复杂动力学求解。也就是说，具身智能需要多种能力在同一套架构中协同起来。

端侧，则是长江SoC和E300 AI模组。

云端负责大规模训练，仿真平台负责试错和验证，但最终，策略还是要跑到机器人本体上。机器人在真实世界行动，很多时候不能完全依赖云端响应。它需要本地完成感知、决策和控制，尤其在低延迟、高可靠要求的任务中，端侧算力是必须补齐的一环。

基于长江SoC的MTT E300 AI模组提供50 TOPS级本地算力，可直接部署于机器人终端，支持低延迟、高可靠的实时响应。换句话说，云端训练出来的经验，需要通过端侧模组变成机器人身上的即时反应。

这就形成了一个更完整的闭环：云端做大规模训练和并行仿真，MT Lambda完成策略开发、数据合成和仿真验证，E300 AI模组负责把训练结果带到机器人终端执行。

更重要的是，摩尔线程这套布局已经开始进入真实生态验证。

比如，与智源的合作中，RoboBrain 2.5基于MTT S5000千卡集群完成端到端训练。相关验证结果显示，其训练Loss走势与H100集群结果高度重合，差异仅0.62%，并在部分任务表现更优；集群从64卡扩展至1024卡，实现90%以上线性扩展效率。

这类结果的意义在于，它验证了国产算力集群作为具身模型训练底座的可用性。

再比如，与光轮智能的合作，更多指向仿真数据量产。双方依托摩尔线程全功能GPU与夸娥智算集群，结合光轮智能“求解—测量—生成”三位一体的仿真平台，联合打造高置信度仿真数据合成方案。光轮智能的高精度GPU物理求解器已适配MUSA架构，支持刚体、柔体、流体、颗粒等复杂物理过程的高精度实时仿真，相关案例中，核心物理参数仿真准确度达到99%以上。

与小马智行的合作，则把场景扩展到自动驾驶。双方基于MTT S5000和夸娥智算集群，推进世界模型及车端模型训练的适配与验证。小马智行世界模型每周可生成超过100亿公里测试数据，并衍生出大量极端场景。对于自动驾驶来说，长尾场景、极端险境和安全验证，本来就是仿真最能发挥价值的地方。

此外，摩尔线程还与五一视界、光线云等伙伴推进物理AI仿真体系和具身仿真平台建设。无论是4DGS模型训练推理、合成数据生成，还是任务库、仿真计算、虚实验证闭环，本质上都在回答同一个问题：具身智能很难靠单家公司闭门造车，它需要算力、仿真、算法、场景方一起把生态跑通。

这也是摩尔线程这次发布比较值得关注的地方。

它把故事从“我有一颗芯片”，推进到“我能搭一套基础设施”。

从底层MUSA架构和全功能GPU往上搭平台，往下接端侧，横向拉生态。这个打法未必一夜之间改变产业格局，但它已经把国产GPU的战场，从大模型训推进一步推向了物理AI基础设施。

要做的是国产具身智能基础设施

具身智能现在很大的矛盾点在于，模型很快，但场景很慢。

在数字世界里，大模型可以靠海量文本、图片、视频数据持续进化；但在物理世界里，机器人要学会开门、搬箱子、抓柔性物体、穿过复杂路口，每一个动作背后都是真实成本。

真机采集贵，遥操作慢，设备损坏风险高，危险场景不能随便试，长尾情况又难以穷尽。于是，仿真合成数据和Sim to Real闭环，就成了具身智能从实验室走向产业的关键基础设施。

这也是为什么“造世界”会成为具身智能竞争的核心命题。

这里的世界，核心价值不在于游戏意义上的好看，而在于能训练机器人、验证机器人、纠正机器人行为。它既要足够真实，能反映光照、材质、碰撞、摩擦、传感器噪声；也要足够高效，能大规模并行生成数据；还要足够开放，让不同模型、不同机器人、不同场景都能接入。

从这个角度看，摩尔线程的优势很难只用某个单点参数概括，其“全功能GPU+MUSA生态”的技术路线，天然更贴近具身智能的复合需求。

全功能GPU提供AI计算、图形渲染、物理仿真、科学计算和视频编解码等多类能力；MUSA提供统一软件生态；MT Lambda把物理、渲染、AI三大引擎整合起来；夸娥智算集群负责大规模训练和仿真；长江SoC与E300 AI模组把能力带向端侧；外部生态伙伴则补足数据、场景、仿真平台和行业应用。

这条链路的价值在于，具身智能本质上是一项系统工程。

大模型公司可以先拼数字大脑，但机器人公司最终要面对的，是大脑如何控制身体、身体如何理解环境、环境如何被低成本复现。谁能用更低成本、更高效率，给机器人造出足够真实、足够可控、足够大规模的训练世界，谁就更有机会把具身智能从Demo带到真实生产线、道路、家庭和城市空间。

当然，国产具身智能基础设施的建设不会一蹴而就。

无论是仿真真实性、Sim to Real迁移效果、开发者生态成熟度，还是产业客户的大规模采用，都需要持续验证。摩尔线程这套方案能走多远，也要看后续更多真实项目、更多开发者和更多机器人本体的反馈。

但至少从这次发布会看，国产GPU正在进入一个新阶段。

它开始跳出能不能替代某块卡的被动叙事，主动定义新的算力场景：发布会上升级的“小麦”是数字智能体；翻跟头的机器狗“小飞”是物理智能体。当AI从屏幕走向现实，当智能体从会说话走向会行动，底层算力就必须同时理解模型、图形和物理。

张建中在活动中有提到，希望摩尔线程的产品从夸娥到长江，能够赋能所有智能体。

放在具身智能这条线上，这句话可以翻译得更具体一点：云端有大训练场，仿真里有虚拟世界，端侧有小脑执行，生态里有真实场景。

大模型竞争拼的是谁能训练出更强的数字大脑，具身智能竞争还要拼另一件事：谁能先造出一个足够真实的训练世界。

这一次，国产GPU已经开始下场造世界了。

具身智能国产GPU 摩尔线程

十三

国产GPU开始造世界！国内首个全栈具身智能仿真平台来了

更像是一套物理AI训练的流水线

为什么摩尔线程能把“算、仿、渲”装进一个Lambda？

云端、端侧、生态，也开始闭环了

要做的是国产具身智能基础设施

相关阅读

别人都在卷视觉，这家具身公司偏要卷“手感”

国产GPU重大利好！“中国英伟达”千卡集群已就位

加速推进“Robot for AI”战略落地，动易科技完成亿元级天使++轮融资，天使轮累计融资额超2亿元

它石智航用“吉尼斯纪录”交卷真干活的具身大脑，丁文超：从来没有Plan B

对话范浩强：10亿融资之前，我们手搓了5000元“丐版硬件”

Meta最新触觉机械手登Science子刊封面，操作未知物体精度最高提升94%

热门文章

AI步入“自我进化”时代，李彦宏首提AI时代度量衡“DAA”｜Create2026百度AI开发者⼤会速览

华为云创想者大会主题论坛议程公布：释放Agentic AI新布局

商汤善惠烧卖购机器人小店上海“开业”，让机器人真正落地线下零售

人手一个数据库，Kimi背后这套AI基建到底有多能扛？

林俊旸果然创业了！一个“Qwen负责人”头衔值135亿