< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

港股新贵押注物理AI,乐动机器人打造万亿市场空间的核心基础设施

谁能把这个空间高质量地数字化,谁就掌握了下一阶段机器智能的入口。

田晏林 发自 凹非寺
量子位 | 公众号 QbitAI

物理AI发展到现在,所有玩家都奔着同一个方向使劲:

让机器人「读懂」所处的物理环境。

这不仅是具身智能玩家拉开身位的关键,也决定了机器人未来能否进入真实场景,创造商业价值

人类看到一张桌子,会知道它在哪里、是什么材质、能不能移动;看到一个门把手,会自然判断它可以被旋转;面对突然出现的人,会马上调整自己的动作。

但对机器人来说,做出这些看似简单的判断,并不容易。

△AI生成

因为它面对的不是一张图片,而是一个不断变化的三维世界。

想要让机器人真正长出能理解物理世界的「脑子」,不能只依靠参数量更大的基础模型。

机器人大脑需要海量真实物理交互数据做训练燃料。

而高质量视觉感知,正是把现实环境转化为模型可读信息、持续产出训练数据的核心入口

更强的视觉感知持续供给真实世界数据,不断迭代升级机器人的物理世界大脑。

最近登陆港交所主板的乐动机器人,过去十年押注的,就是这样一条路线。

从扫地机器人、物流仓储机器人,到无接触式酒店和餐厅的服务机器人,再到如今的人形机器人、机器狗等新赛道爆发,乐动持续围绕一个底层问题布局:

机器人如何感知空间,并理解环境。

这也让其在多轮机器人产业发展中,逐渐积累了「空间感知技术」的先发优势。

但上市之后,市场关注的不只是这家企业过去的成绩。

大家更想知道,在人人都要机器人「读懂世界」的物理AI时代,智能化的底层地基该怎么打?

机器人竞赛,焦点变了

论机器人行业未来的通用底层刚需,答案离不开一个:环境感知能力。

背后逻辑很好理解。

无论机器人最终落在哪个场景,家庭、酒店、餐厅、仓储、工厂,包括未来要规模化商业落地的人形机器人,它首先要会回答:

  • 我在哪里?
  • 我看到了什么?
  • 眼前的东西意味着什么?
  • 我下一步应该怎么行动?

如果没有对环境的理解,机器人就只能停留在固定场景、固定动作的自动化设备阶段。

就像传统工业机械臂,可以精准完成焊接、搬运等重复任务,但它并不真正「知道」自己面对的是什么。

过去,机器人行业的竞争叙事一直围绕一个词展开:运动能力

谁能走路、谁能避障、谁能抓取、谁能完成复杂动作。

但随着具身智能进入真实应用阶段,这套评价体系开始失效。

下一代机器人要进入真实世界,面对的是大量开放环境和长尾情况

一个随意摆放的物品、一扇半开的门、一个突然移动的人,甚至是光线变化都可能让系统崩溃。

空间变化带来的不确定性,要求机器人具备对世界持续理解的能力。

而理解世界的前提,是感知

△AI生成

特别是进入物理AI时代,「感知」更是连接现实世界与AI模型的必要入口

它负责把复杂的物理世界转化为AI能理解的数据,再交由模型完成认知、决策。

某种程度上,机器人的智能上限,取决于它感知世界的深度

所有空间智能,本质上都依赖同一件事:真实世界数据的持续供给。

没有数据,再强的模型也只是静态能力。

数据一旦断供,所谓泛化能力就会迅速塌缩。

也正因此,行业的竞争焦点正在发生迁移:从「谁的模型更聪明」,变成「谁能持续生产真实世界」

而这本质上就是一件更工业化的事情:把物理世界变成数据流。

这也是感知能力被重新定义的地方。

它不再只是机器人的一个模块,而是整个系统的入口。

一个决定后续所有智能上限的入口。

从传感器到「数据精炼厂」

但想把物理世界变成AI能理解的数据,并没有那么简单。

现实世界的数据,天然就是混乱的。

就像刚从矿井里开采出来的原油。有价值,但不能直接用。

真正决定机器人智能水平的,不只是有没有传感器,而是有没有能力把这些原始信息加工成模型可以理解的「燃料」。

这也是乐动机器人过去十年持续投入的方向。

在公司成立之初,团队就做了一个判断:

机器人未来无论进入家庭、酒店、餐厅、仓库还是工厂,最底层的共性需求一定是理解环境。

乐动机器人董事长周伟告诉量子位,「感知」可分为两层:

第一层是感,负责通过传感器采集环境数据;
第二层是知,通过算法和模型把数据变成机器人对环境、空间和物体的认知。

这意味着,感知从来不是一个单独硬件问题。传感器只是入口。

真正的竞争,在于谁能把入口采集的数据,进一步加工成空间智能

这也是乐动没有停留在硬件公司的原因。

这些年,机器人产业经历过多轮周期:

  • 2017年~2018年,扫地机器人快速普及;
  • 2019年,物流仓储机器人兴起;
  • 2020年~2021年,无接触服务机器人进入酒店、餐厅;
  • 2023年~2024年,割草机器人开始爆发。

到如今,人形机器人、机器狗、无人小车等新方向集中出现。

每一轮机器人浪潮,最终都会回到同一个问题:机器人如何理解自己所在的世界。

乐动踩中的,正是这个长期不变的底层需求。

为了让机器人拥有理解真实世界的最佳能力,乐动的「感知产品」经历过多轮技术迭代。

△AI生成

先说传感器

过去单一传感器时代,视觉解决语义问题,激光雷达解决空间定位问题。

但单一能力始终存在缺陷。

激光雷达知道距离,却不知道那是什么;视觉知道物体,却不一定精准知道空间位置。

而物理世界中的机器人,需要同时回答:这是一个什么东西?它在哪里?我能不能移动它?我应该如何行动?

所以,周伟认为,未来传感器硬件的趋势,必然走向多模态融合。

视觉、激光、深度信息、IMU(惯性测量单元)等不同数据源,需要被统一理解。

再看算法模型。

乐动早期也是依靠工程师人工编写代码。

但这种方式的问题很明显,不仅效率低,而且工程师可以写出100个规则,却很难覆盖真实世界里的第101种情况。

变化发生在AI进入机器人之后。公司完成了从人工规则算法端到端AI模型的范式革新,依靠AI自主学习、自主认知环境。

在周伟看来,硬件负责收集世界,模型负责理解世界。

只有两者结合,才能形成真正的空间智能。

如何把这些不同来源的数据,变成机器人可以学习的语言呢?

乐动自研了LD-SenseWorld灵境物理空间交互大模型。

它不是通用大模型,而是聚焦物理空间智能。核心目标只有一个:让机器人真正理解空间。

它的第一项能力是数据预处理与多模态融合

现实世界的数据来自视觉、激光雷达、IMU等多个通道,但这些信息天然不同步、不同结构。

如果不做统一处理,本质就是噪声叠加。

LD-SenseWorld通过对齐、清洗与融合,把多源数据拉回同一时间与空间基准,形成可用的世界输入。

第二项能力是特征提取与空间Token化。

连续变化的物理世界,必须被转化为机器可学习的离散表达。

系统将位置、距离、物体关系与运动状态等信息压缩为“空间Token”。

相当于为机器人建立一套描述现实的基础语言,让空间本身变得可读、可计算。

第三项能力是语义化与物理一致性注入。

机器人最终不是为了识别,而是为了行动。

仅有结构还不够,机器人还需要理解规则:什么能移动、什么会坠落、人在何种情况下会改变路径。

通过引入物理约束与语义理解,数据不再只是坐标与点云,而是具备因果与行为逻辑的认知输入。

本质上,LD-SenseWorld做的不是建模,而是把混乱无序的数据,加工成可学习的世界「燃料」。

这也是乐动作为「数据精炼厂」的核心所在。

百万台设备,撑起物理AI的数据飞轮

对于物理AI来说,模型只是开始。

真正决定机器人能不能进入现实世界的,是模型背后的数据供给能力。

这也是当前机器人行业最大的挑战。

周伟提到,行业数据来源主要有三类:

仿真数据、实验室或数据工厂数据,以及真实场景落地数据

这里最大的问题,是前两者很难覆盖真实世界里的大量未知情况。

这也是为什么,越来越多机器人公司开始意识到,真正稀缺的不是训练模型的方法,而是训练模型的原料。

特斯拉FSD的优势,本质上来自大量真实道路数据积累。

△AI生成

机器人也一样。

没有真实设备持续运行,就没有持续进化的数据来源。

乐动的路径,是通过构建「物理AI三层核心架构」,给模型落地做底层支撑。

  • 硬件感知层
  • 负责用多模态传感器采集真实世界海量原始数据。
  • 模型层
  • 空间交互大模型负责让机器人理解真实世界,打造真实物理世界的数据精炼厂。
  • 数据层
  • 区别于仿真数据,基于真实设备持续采集,自研大模型持续加工,输出源源不断的结构化、语义化、物理一致性的空间Token,可直接输入世界模型训练。

最终形成从硬件采集数据,到数据训练模型,再到模型反向定义硬件的「数据飞轮」。

这也是乐动和传统硬件公司的区别。

传统硬件公司的逻辑是生产设备——销售设备——结束交易。

但乐动在物理AI时代,通过更多的设备,采集丰富的数据。

“数据越丰富,模型越强。模型越强,产品体验越好。体验越好,又容易推动更多设备进入真实场景。”周伟说。

这是一个不断加速的循环。

△AI生成

乐动已经在这条路上积累了规模化基础

2025年,其核心产品DTOF激光雷达出货量超过400万台。

但乐动拥有的不只是传感器出货量,而是一个持续运行的真实世界数据入口。

据悉,搭载乐动视觉感知技术的设备量已突破2000万台

在乐动的财报里,割草机器人是该公司第二增长引擎。产品目前主要销往欧美、澳洲等高潜力智能花园养护市场。

第三方机构统计,到2030年,全球智能割草机器人市场规模预计将增至62.5亿~100亿美元。

什么概念?这意味着,将有更多源源不断的真实场景数据,等待被乐动收集。

这是「数据精炼厂」成立的基础,也是数据飞轮能够快速起飞的前提。

20年机器人长跑,周伟的「直觉」

回看乐动的发展路径,会发现这并不是一次突然押中的风口,而是一场持续二十年的积累。

1986年的周伟,是机器人行业典型的“少壮派”。

早在大学时期,他就获得了中国机器人足球锦标赛冠军

△乐动机器人董事长周伟

2012年毕业后,周伟与华科的学长郭盖华在深圳共同创立乐行天下。

最初选择体感车行业时,二人的目标就不仅仅是做交通工具,而是想做出更便捷、更张扬个性自由的智能出行机器人

2013年秋,第一款乐行智能平衡车发布,也让乐行成为国内平衡车领域的开创者之一。

2014年,乐行天下完成1亿元的B轮融资。周伟也于2015年入选“福布斯中国30位30岁以下创业者”榜单并成为封面人物。

2017年,周伟和郭盖华两人再次踏上创业征程,乐动机器人成立了。

从乐行天下再到乐动机器人,周伟积累了大量机器人产业经验。

以至于创业多年后,公司遇到难关时,他还能保持技术者的敏锐直觉。

2022年那段时间,国内外宏观环境与资本市场低迷,乐动机器人的经营状况并不乐观。

高研发投入、商业化周期长、订单规模受限,投资者都开始劝周伟降低研发投入,优先保证业务。

但究竟是要短期现金流,还是积累长期技术壁垒?这是科技创业公司常见的典型试题。

顶着投资人的压力,周伟决定all in感知技术。

原因很简单。他认为感知不是一个阶段性需求,而是所有机器人未来都会需要的底层能力。

事实证明,这个判断最终迎来了行业回报。

2024年至2025年,机器人产业进入新一轮爆发期,乐动早期的技术投入开始释放价值。

对外,周伟常半开玩笑说,当初的决定源于一时直觉。

所谓直觉,其实都是长期认知形成的本能。没有二十年机器人领域的功力,恐怕很难做出这般取舍。

One more thing

传统AI和物理AI最大的不同,是后者在面对一个复杂、连续、不断变化的现实空间。

谁能把这个空间高质量地数字化,谁就掌握了下一阶段机器智能的入口。

从这个角度看,乐动正在做的事情,已经不只是提供感知硬件,它更像是在建设一套物理世界的数据加工体系。

让机器人看懂世界,让模型理解世界,再让机器人基于真实世界不断进化。

从传感器产品公司,到物理AI的「感知基础设施平台」,乐动正在完成身份重塑。

版权所有,未经授权不得以任何形式转载及使用,违者必究。