< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

世界模型接棒语言模型，这家公司全球首创物理AGI“双金字塔”体系，通用机器人进入“家庭时代”

思邈 2026-05-28 21:01:16 来源：量子位

12个月冲击物理AGI的“GPT-3时刻”

允中发自凹非寺

量子位 | 公众号 QbitAI

后空翻、跑酷、单手抓举几十公斤……

过去两年，人形机器人最出圈的高光时刻，几乎都发生在精心布光的舞台上。

但镜头之外，有一个更朴素的问题始终悬而未决：它到底什么时候能走进你家，稳稳端起一杯水、收好一桌碗筷、把脏衣篮抱进洗手间？

5月20日，极佳视界没有再用“五年内”这类含糊措辞来搪塞。它把通用人形机器人真机，直接推进了武汉光谷一处真实的居民社区：

那里有人住、有孩子把玩具撒一地、家具随时会被挪动位置。

在发布会现场，极佳视界还首次完整披露了过去三年沉淀下来的“双金字塔”技术体系。

一边是数据金字塔，从互联网视频、真人数据、世界模型模拟器、仿真合成数据一路走到真机数据；

另一边是算法金字塔，围绕世界模拟、动作对齐、经验强化搭建具身基础模型的自我进化路径。

资本市场也已经提前投票。2026年3月至4月，极佳视界在短短一个月内连续完成两轮融资，合计金额约25亿元，并跻身国内首个世界模型“百亿独角兽”。

于是，一个更值得追踪的问题浮出水面：

当100台机器人开始进入真实家庭，当双金字塔体系开始吃到长周期、多变量、带有人类反馈的真机数据，当25亿元融资把研发、量产与场景落地同时推上快车道，物理AGI会不会真的迎来自己的临界点？

务实的轮臂机器人与百台真机进家

极佳视界联合创始人、首席科学家朱政博士，这一次走向台前，身上多了一个新标签：拾光品牌CEO。

作为全场焦点的具身智能C端子品牌，朱政在发布会上留下了一段近乎产品宣言的定调：

AGI不该只停留在屏幕里。我们不是在讲一个遥远的未来故事，而是在把骨子里对物理AGI的信仰，变成真实的产品。

在这款第一代产品——拾光S1的设计哲学里，能清晰看到这家公司对“真实家庭场景”极其具体的解构。

最具视觉冲击力的“全人形+双足”路线，并没有出现在拾光S1身上。相反，它采用了一种更务实的家庭版轮臂构型——下半身轮式底盘，上半身人形双臂。

这是一组带有鲜明产品观的取舍。

毕竟在现阶段，家庭场景对机器人的真实刚需，是稳当地端水、收拾餐具、抱起脏衣篮、把零食递到孩子手上，而不是在客厅里完成酷炫的跑酷动作。

相比之下，轮臂构型在稳定性、安全性、续航以及硬性成本上，显然都更占优势。

面对中国家庭的真实地板宽度、真实门洞尺寸以及真实的预算曲线，拾光S1展现出了一种极为清醒且务实的市场姿态。

而在务实的硬件外壳之下，支撑其运转的是极佳视界自研的具身基础模型（GigaBrain系列）。

该模型实现了从感知、理解到行动的完整闭环，能够自主识别物体与场景、规划路径，并执行包含抓取、对齐、折叠、归类等多步骤的长程任务。

回到硬核的商业化进展上，极佳视界现场宣布：拾光S1已斩获真实家庭场景的百台量产订单，将率先部署于武汉光谷之寓——一处位于光谷的真实居民住宅社区。

具体的落地节奏也已经排定好：

5月31日起：拾光S1真实家庭场景展示体验空间面向公众开放；
第三季度起：正式开启百台规模化运营；
届时：下一代产品拾光S2将同步发布，并开启真实家庭创始版预定通道。

把“100台”这个数字放进全球具身智能的坐标系来看，其含金量并不在于数字本身，而在于“家庭”二字。

纵观全球，Figure AI挺进了宝马工厂，但其家庭场景仍处于试点阶段；1X虽开放过NEO的预订，但实际履约规模仍停留在数十台；Tesla Optimus至今则尚未真正对外部消费者开售。

在主流国内具身智能玩家里，目前能够拿出一份可履约家庭订单的团队，也屈指可数。

究其原因，进工厂和进家庭，完全是两个数量级的难度。

工业工厂是高度结构化的，光线、节拍、物料位置基本恒定。

而家庭场景则是极度的“非结构化”：今天家具被挪动了位置，明天孩子把玩具撒了一地，后天又有客人突然到访……所有的动态变量都在无限叠加。

这也揭示了当前行业最隐秘的痛点——当下具身智能最稀缺的资源，不是算法，也不是单纯的算力，而是在真实家庭里、长周期、多变量、带有人类反馈（RLHF）的真机数据。

这种数据，在实验室里造不出来，在自动化工厂里也补不出来。

一旦第三季度这百台机器人真正跑起来，产生的将是难以被复制的核心数据资产：家庭场景下的真实故障率、用户偏好分布、更具烟火气的长尾任务清单，以及人机交互的真实边界。

这些数据，将成为GigaBrain后续模型迭代不可替代的燃料。

值得注意的是，在C端家庭场景高调破局的同时，极佳视界的B端工业节奏也在平行推进。

就在发布会前不久，极佳视界联合一汽模具、阿里云，完成了国内首个具身智能机器人在真实工业制造场景的全流程落地。

在这场跨界合作中，团队成功将传统自动化方案长达数月的场景适配周期，压缩到了短短几周。

家用求广，工业求深。

左手C端场景的数据飞轮，右手B端工业的标杆落地，极佳视界的双线并行矩阵，至此已初具雏形。

技术方法论：解构物理AGI的“双金字塔”体系

如果说“百台部署”回答了具身智能产品何时落地的破局点，那么“双金字塔”回答的就是另一个更底层、更核心的终极命题：

物理AGI的Scaling Law，究竟该建在什么样的基石之上？

在发布会现场，极佳视界合伙人、研发副总裁叶云首次完整披露了公司过去三年沉淀的技术方法论。

△极佳视界合伙人、研发副总裁叶云

他直言不讳地指出了当前具身智能行业系统性存在、却鲜少被彻底攻克的两大瓶颈：

一是数据侧的“既要又要还要”难题。

真机数据精度高但成本高、规模小；仿真数据可扩展但存在不可忽视的sim-to-real gap（虚实迁移鸿沟）；互联网视频规模极大，却缺乏动作监督。

任何单一数据源，都无法同时满足规模、密度和真实性。

二是算法侧的“小马拉大车”困局。

主流VLA（Vision-Language-Action）范式习惯性将视觉、动作token化后塞进大语言模型，但这套机制天然不擅长处理3D空间信息、物理因果逻辑以及连续动作编码。

针对这两大痛点，极佳视界给出的解法是：将数据与算法分别解构，用结构化的“双金字塔”体系强行破局。

数据金字塔的核心，在于解决模型“喂什么”的问题。

极佳视界将其从底到顶划分为5个层级：

互联网视频数据→真人数据→世界模型模拟器→仿真合成数据→真机数据。

在这套架构中，底层管广度，顶层管精度。

而中间三层，正是工程化空间最大、也是过去整个行业最被低估的“腰部力量”。

分层概念在学术界讨论已两年有余，真正拉开差距的是全栈工程化的落地能力。

极佳视界直接为每一层都掏出了对应的商业化或自研硬核产品：

互联网视频层：YouTube、Panda-70M等公开海量数据的高效复用；
真人数据层：低成本手持数采硬件“U-01”+低成本Ego（第一人称视角）数采硬件“E-01”；
仿真合成与世界模型层：自研具身世界模型平台“GigaWorld-0”；
真机数据层：家庭版轮臂机器人“拾光S1”+低成本真机数采硬件“Maker M01”。

从数据采集、数据生成到模型训练，全链路100%控在极佳视界自己手里。

放眼国内具身智能赛道，能对五层数据做如此系统性、全栈式硬核布局的玩家，目前或许只有极佳视界一家。

一个刚发生的硬核例证是：极佳视界与清华大学合作的研究成果R2RGen，正式被机器人顶级会议RSS 2026录用。

该技术支持机器人在“仅看一条人类演示”的前提下，就能完成一组任务的空间泛化，其1条演示的训练效果可直接媲美25条真人演示。

这正是数据金字塔中，用算法工具实现“真机数据高倍率放大”的典型降维打击。

如果说数据金字塔是筑基，那么算法金字塔解决的就是“怎么学”的自驱路径。

它由底到顶分为三层：世界模拟→动作对齐→经验强化。

在这条路径上，极佳视界交出了一份极其罕见的成绩单：在全球三大最权威的具身智能评测中，同时斩获第一。

1、世界模拟层（GigaWorld-1）

在世界模型权威评测WorldArena上一举击败谷歌、英伟达等国际巨头，登顶全球第一。

它也是全榜单中首个综合得分突破60分大关的具身世界模型。

2、动作对齐层（GigaBrain-0系列/GigaWorld-Policy）

极佳视界在该层打出了两张王牌。

前者在全球规模最大的真机评测RoboChallenge中力压π0.5等顶流模型斩获第一；

后者则在面向家庭场景的RoboCasa365中，击败了NVIDIA GR00T N1.5，成为榜单上首个登顶的世界动作模型（World Action Model）。

3、经验强化层（GigaBrain-0.5M*）

通过“世界模型+强化学习”的双向加持，真正跑通了具身基座模型的自我进化（Self-evolution）。

将世界生成、真机操作、家庭场景泛化这三种本质不同的能力范式，由同一支团队在同一时间节点集中突破，这在行业内极具震撼力。

至此，极佳视界的“双金字塔”完成了它最具里程碑意义的闭环：

它将物理AGI的Scaling Law路径，从纸面上的宏大概念，变成了一套可对照、可复现、可被量化评测的系统化落地方案。

物理AGI的“GPT-3时刻”何时到来？

在发布会现场，极佳视界还扔出了下一代硬件的重磅预告——拾光S2将于2026年第三季度正式发布。

这一次，极佳视界没有单纯卷参数，而是将准心扣在了“真实家庭可用性”这三个字上。

拾光S2三大核心指标的升级路径，清晰可见：

空间瘦身：底盘体积直降60%，极限贴合中国家庭略显狭窄的过道与玄关；
续航跃升：电池续航暴增70%，并全面支持热换电以确保全天候待命；
纵向延展：操作范围扩大40%，最高可执行2.2米高度的纵向家务任务。

对于这次升级，极佳视界联合创始人朱政在现场给出了这样的定义：

S2的核心，不是某个参数变得更漂亮，而是整机开始真正接近真实家庭所需要的“可用性”。

据悉，真实家庭创始版预定通道，也将在发布时同步开启。

相比于硬件的渐进式改良，更具行业风向标意义的，是极佳视界首次公开的基础模型12个月路线图。

这张“明牌”的时间表，直接将具身智能的智能化进程进行了量化：

GigaBrain-1：2026年Q3发布，据称是全球首个基于“双金字塔”体系打造的物理AGI基础模型；
GigaBrain-2：进一步拉满Scaling Law的加速器；
GigaBrain-3：基于1000万小时视频数据+100万小时世界-动作数据训练，直接剑指物理AGI的“GPT-3时刻”。

在大模型发展史上，GPT-3的里程碑意义并不在于模型结构本身，而在于它是Scaling Law首次显现“涌现能力”的临界点。

当数据规模与算力跨过那个神秘的阈值，物理世界的认知就会从量变产生质变。

物理AGI的“GPT-3时刻”在理论上同构——

当数据规模（1000万+100万小时）与算法范式（双金字塔）在临界点交汇，物理智能体将展现出真正意义上的通用性。

这不是指在实验室预设的场景下机械地干十种家务，而是意味着它能够“空降”到任何一户真实家庭，能应对所有突发的意外，并在每一次环境反馈中完成自我进化。

过去两年，行业对于“物理AGI何时到来”的追问，大多得到了“五年内”、“指日可待”等模糊的回应。

极佳视界这次直接掀掉底牌，把宏大命题拆解为两个确定性的交卷时间：需要什么样的体系（双金字塔），以及什么时候到达临界点（12个月）。

这是一个可以被全行业公开检验的答案。

物理AI“梦之队”集结

除了技术，极佳视界更亮眼的莫过于其核心团队：

创始人兼CEO黄冠，清华大学自动化系创新领军工程博士。

曾担任地平线机器人视觉感知技术负责人、鉴智机器人合伙人&算法副总裁，并拥有微软亚洲研究院、三星中国研究院等顶尖研究机构工作经历。

他完整经历了过去十年物理AI的技术和产业发展历程，多次带领团队获得全球权威AI比赛世界冠军，并发布多个全球知名AI成果。

联合创始人兼首席科学家朱政，智源青年学者，发表顶级论文70余篇，引用近2万次。

多篇著作影响力巨大，连续4年入选全球前2%顶尖科学家榜单，多次获得吴文俊自然科学一等奖、最佳学生论文奖、CCF杰出论文奖等荣誉，也是多个顶会领域主席、多项竞赛冠军。

联合创始人孙韶言，曾担任阿里云总监，地平线数据闭环产品线总经理，在物理世界超大规模数据闭环产品和架构方面拥有行业领先的经验。

他主导了业内首个智能驾驶数据闭环系统的落地，有效提升了数据的处理效率，为智能驾驶技术的发展提供了重要的基础设施支持。

合伙人兼工程副总裁毛继明，拥有超过16年的仿真/工程/数据/分布式架构方向的经验。

曾担任百度Apollo仿真和工程负责人，以及曾担任百度、赢彻等T10级别架构师，主导多个自动驾驶与世界模型核心项目的技术开发与落地。在高质量数据生成、端到端自动驾驶架构设计以及分布式系统优化领域有着深厚的积累。

可以说，这支团队完整经历了CV、自动驾驶、具身基模、世界模型等物理AI过去十年的发展历程，并在每个阶段都做出了行业领先的世界级成果。

当他们聚集在一起，就共同造就了这支始终引领具身世界模型技术演进的“梦之队”。

资本侧给出的反馈同样明确。

在2026年3月至4月，短短一个月内，极佳视界连续完成两轮融资，合计金额高达约25亿元，一举跻身国内首个世界模型“百亿独角兽”。

据说，其背后的投资方矩阵，覆盖国内最具代表性的顶尖产业资本（华为哈勃就是其中之一）、头部财务机构与重磅国资平台。

三个悬而未决的问题

事实上，极佳视界给出了一套将算法+数据+本体+场景+商业+时间表全栈打通的物理AGI闭环路径。

往前看，三项全球权威评测冠军证明了算法架构的优越性；

往下看，“百台进社区”印证了工程化的可靠执行力；

往未来看，三代基础模型路线图则给出了明确的航向。

站在当前节点，未来12个月内，至少有三件事值得整个科技界持续追踪：

第一，百台家庭部署能否真正跑出有效数据闭环。

家庭环境下机器人能持续工作多久、故障率与人工介入频次、用户偏好如何回流到模型，这是物理智能领域目前最稀缺的资产积累。

第二，2026年Q3的GigaBrain-1是否能如期发布，并在能力上对得起“双金字塔”体系所许诺的范式优势。

第三，GigaBrain-3是否能在12个月后真正触达“GPT-3时刻”——

或许这是物理AGI赛道目前最具争议、也最具兑现价值的判断。

正如朱政在发布会尾声留下的那句话：

物理AGI服务每一个人的时代，会在一户一户真实家庭中逐渐发生。

大幕已经拉开，这个预言会不会变成现实，我们只需要再等12个月。

世界模型机器人极佳视界物理AGI

思邈

世界模型接棒语言模型，这家公司全球首创物理AGI“双金字塔”体系，通用机器人进入“家庭时代”

务实的轮臂机器人与百台真机进家

技术方法论：解构物理AGI的“双金字塔”体系

物理AGI的“GPT-3时刻”何时到来？

物理AI“梦之队”集结

三个悬而未决的问题

相关阅读

意念操纵机器人成真！李飞飞团队打造，做家务玩游戏样样能行

美国防部用AI消除“战争迷雾”，机器人、无人机全上阵

我造了一件钢铁侠战衣，防弹抗爆，能！上！天！

本周三！机器人与数字化转型应用解析，线上研讨会诚邀你来围观

拥抱机器人智能新时代，首届《科技创变者大会》盛大开幕

AI版《黑客帝国》：无限生成逼真视频，3A画质，还能实时交互

热门文章

2026年世界人工智能大会，7月17-7月20上海举办

刚刚，OpenAI首席未来学家离职！曾被马斯克骂蠢驴

50FPS、成本打掉70%，魔芯MoWorld把世界模型带进产业时代

刚刚，全球首个具身专属的MoE视频模型，开源了！

世界模型首次迎来“小时级”生成！蚂蚁灵波开源LingBot-World 2.0，支持AI原生多人交互