< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”

12个月冲击物理AGI的“GPT-3时刻”

允中 发自 凹非寺

量子位 | 公众号 QbitAI

后空翻、跑酷、单手抓举几十公斤……

过去两年,人形机器人最出圈的高光时刻,几乎都发生在精心布光的舞台上。

但镜头之外,有一个更朴素的问题始终悬而未决:它到底什么时候能走进你家,稳稳端起一杯水、收好一桌碗筷、把脏衣篮抱进洗手间?

5月20日,极佳视界没有再用“五年内”这类含糊措辞来搪塞。它把通用人形机器人真机,直接推进了武汉光谷一处真实的居民社区:

那里有人住、有孩子把玩具撒一地、家具随时会被挪动位置。

在发布会现场,极佳视界还首次完整披露了过去三年沉淀下来的“双金字塔”技术体系。

一边是数据金字塔,从互联网视频、真人数据、世界模型模拟器、仿真合成数据一路走到真机数据;

另一边是算法金字塔,围绕世界模拟、动作对齐、经验强化搭建具身基础模型的自我进化路径。

资本市场也已经提前投票。2026年3月至4月,极佳视界在短短一个月内连续完成两轮融资,合计金额约25亿元,并跻身国内首个世界模型“百亿独角兽”

于是,一个更值得追踪的问题浮出水面:

当100台机器人开始进入真实家庭,当双金字塔体系开始吃到长周期、多变量、带有人类反馈的真机数据,当25亿元融资把研发、量产与场景落地同时推上快车道,物理AGI会不会真的迎来自己的临界点?

务实的轮臂机器人与百台真机进家

极佳视界联合创始人、首席科学家朱政博士,这一次走向台前,身上多了一个新标签:拾光品牌CEO

作为全场焦点的具身智能C端子品牌,朱政在发布会上留下了一段近乎产品宣言的定调:

AGI不该只停留在屏幕里。我们不是在讲一个遥远的未来故事,而是在把骨子里对物理AGI的信仰,变成真实的产品。

在这款第一代产品——拾光S1的设计哲学里,能清晰看到这家公司对“真实家庭场景”极其具体的解构。

最具视觉冲击力的“全人形+双足”路线,并没有出现在拾光S1身上。相反,它采用了一种更务实的家庭版轮臂构型——下半身轮式底盘,上半身人形双臂。

这是一组带有鲜明产品观的取舍。

毕竟在现阶段,家庭场景对机器人的真实刚需,是稳当地端水、收拾餐具、抱起脏衣篮、把零食递到孩子手上,而不是在客厅里完成酷炫的跑酷动作。

相比之下,轮臂构型在稳定性、安全性、续航以及硬性成本上,显然都更占优势。

面对中国家庭的真实地板宽度、真实门洞尺寸以及真实的预算曲线,拾光S1展现出了一种极为清醒且务实的市场姿态。

而在务实的硬件外壳之下,支撑其运转的是极佳视界自研的具身基础模型(GigaBrain系列)

该模型实现了从感知、理解到行动的完整闭环,能够自主识别物体与场景、规划路径,并执行包含抓取、对齐、折叠、归类等多步骤的长程任务

回到硬核的商业化进展上,极佳视界现场宣布:拾光S1已斩获真实家庭场景的百台量产订单,将率先部署于武汉光谷之寓——一处位于光谷的真实居民住宅社区。

具体的落地节奏也已经排定好:

  • 5月31日起:拾光S1真实家庭场景展示体验空间面向公众开放;
  • 第三季度起:正式开启百台规模化运营;
  • 届时:下一代产品拾光S2将同步发布,并开启真实家庭创始版预定通道。

把“100台”这个数字放进全球具身智能的坐标系来看,其含金量并不在于数字本身,而在于“家庭”二字。

纵观全球,Figure AI挺进了宝马工厂,但其家庭场景仍处于试点阶段;1X虽开放过NEO的预订,但实际履约规模仍停留在数十台;Tesla Optimus至今则尚未真正对外部消费者开售。

在主流国内具身智能玩家里,目前能够拿出一份可履约家庭订单的团队,也屈指可数。

究其原因,进工厂和进家庭,完全是两个数量级的难度。

工业工厂是高度结构化的,光线、节拍、物料位置基本恒定。

而家庭场景则是极度的“非结构化”:今天家具被挪动了位置,明天孩子把玩具撒了一地,后天又有客人突然到访……所有的动态变量都在无限叠加。

这也揭示了当前行业最隐秘的痛点——当下具身智能最稀缺的资源,不是算法,也不是单纯的算力,而是在真实家庭里、长周期、多变量、带有人类反馈(RLHF)的真机数据

这种数据,在实验室里造不出来,在自动化工厂里也补不出来。

一旦第三季度这百台机器人真正跑起来,产生的将是难以被复制的核心数据资产:家庭场景下的真实故障率、用户偏好分布、更具烟火气的长尾任务清单,以及人机交互的真实边界。

这些数据,将成为GigaBrain后续模型迭代不可替代的燃料。

值得注意的是,在C端家庭场景高调破局的同时,极佳视界的B端工业节奏也在平行推进。

就在发布会前不久,极佳视界联合一汽模具、阿里云,完成了国内首个具身智能机器人在真实工业制造场景的全流程落地

在这场跨界合作中,团队成功将传统自动化方案长达数月的场景适配周期,压缩到了短短几周

家用求广,工业求深。

左手C端场景的数据飞轮,右手B端工业的标杆落地,极佳视界的双线并行矩阵,至此已初具雏形。

技术方法论:解构物理AGI的“双金字塔”体系

如果说“百台部署”回答了具身智能产品何时落地的破局点,那么“双金字塔”回答的就是另一个更底层、更核心的终极命题:

物理AGI的Scaling Law,究竟该建在什么样的基石之上?

在发布会现场,极佳视界合伙人、研发副总裁叶云首次完整披露了公司过去三年沉淀的技术方法论。

△极佳视界合伙人、研发副总裁叶云

他直言不讳地指出了当前具身智能行业系统性存在、却鲜少被彻底攻克的两大瓶颈:

一是数据侧的“既要又要还要”难题。

真机数据精度高但成本高、规模小;仿真数据可扩展但存在不可忽视的sim-to-real gap(虚实迁移鸿沟);互联网视频规模极大,却缺乏动作监督。

任何单一数据源,都无法同时满足规模、密度和真实性。

二是算法侧的“小马拉大车”困局。

主流VLA(Vision-Language-Action)范式习惯性将视觉、动作token化后塞进大语言模型,但这套机制天然不擅长处理3D空间信息、物理因果逻辑以及连续动作编码。

针对这两大痛点,极佳视界给出的解法是:将数据与算法分别解构,用结构化的“双金字塔”体系强行破局。

数据金字塔的核心,在于解决模型“喂什么”的问题。

极佳视界将其从底到顶划分为5个层级:

互联网视频数据→真人数据→世界模型模拟器→仿真合成数据→真机数据。

在这套架构中,底层管广度,顶层管精度。

而中间三层,正是工程化空间最大、也是过去整个行业最被低估的“腰部力量”。

分层概念在学术界讨论已两年有余,真正拉开差距的是全栈工程化的落地能力

极佳视界直接为每一层都掏出了对应的商业化或自研硬核产品:

  • 互联网视频层:YouTube、Panda-70M等公开海量数据的高效复用;
  • 真人数据层:低成本手持数采硬件“U-01”+低成本Ego(第一人称视角)数采硬件“E-01”;
  • 仿真合成与世界模型层:自研具身世界模型平台“GigaWorld-0”;
  • 真机数据层:家庭版轮臂机器人“拾光S1”+低成本真机数采硬件“Maker M01”。

从数据采集、数据生成到模型训练,全链路100%控在极佳视界自己手里。

放眼国内具身智能赛道,能对五层数据做如此系统性、全栈式硬核布局的玩家,目前或许只有极佳视界一家。

一个刚发生的硬核例证是:极佳视界与清华大学合作的研究成果R2RGen,正式被机器人顶级会议RSS 2026录用。

该技术支持机器人在“仅看一条人类演示”的前提下,就能完成一组任务的空间泛化,其1条演示的训练效果可直接媲美25条真人演示

这正是数据金字塔中,用算法工具实现“真机数据高倍率放大”的典型降维打击。

如果说数据金字塔是筑基,那么算法金字塔解决的就是“怎么学”的自驱路径。

它由底到顶分为三层:世界模拟→动作对齐→经验强化

在这条路径上,极佳视界交出了一份极其罕见的成绩单:在全球三大最权威的具身智能评测中,同时斩获第一

1、世界模拟层(GigaWorld-1)

在世界模型权威评测WorldArena上一举击败谷歌、英伟达等国际巨头,登顶全球第一。

它也是全榜单中首个综合得分突破60分大关的具身世界模型。

2、动作对齐层(GigaBrain-0系列/GigaWorld-Policy)

极佳视界在该层打出了两张王牌。

前者在全球规模最大的真机评测RoboChallenge中力压π0.5等顶流模型斩获第一;

后者则在面向家庭场景的RoboCasa365中,击败了NVIDIA GR00T N1.5,成为榜单上首个登顶的世界动作模型(World Action Model)。

3、经验强化层(GigaBrain-0.5M*)

通过“世界模型+强化学习”的双向加持,真正跑通了具身基座模型的自我进化(Self-evolution)。

世界生成、真机操作、家庭场景泛化这三种本质不同的能力范式,由同一支团队在同一时间节点集中突破,这在行业内极具震撼力。

至此,极佳视界的“双金字塔”完成了它最具里程碑意义的闭环:

它将物理AGI的Scaling Law路径,从纸面上的宏大概念,变成了一套可对照、可复现、可被量化评测的系统化落地方案

物理AGI的“GPT-3时刻”何时到来?

在发布会现场,极佳视界还扔出了下一代硬件的重磅预告——拾光S2将于2026年第三季度正式发布。

这一次,极佳视界没有单纯卷参数,而是将准心扣在了“真实家庭可用性”这三个字上。

拾光S2三大核心指标的升级路径,清晰可见:

  • 空间瘦身:底盘体积直降60%,极限贴合中国家庭略显狭窄的过道与玄关;
  • 续航跃升:电池续航暴增70%,并全面支持热换电以确保全天候待命;
  • 纵向延展:操作范围扩大40%,最高可执行2.2米高度的纵向家务任务。

对于这次升级,极佳视界联合创始人朱政在现场给出了这样的定义:

S2的核心,不是某个参数变得更漂亮,而是整机开始真正接近真实家庭所需要的“可用性”。

据悉,真实家庭创始版预定通道,也将在发布时同步开启。

相比于硬件的渐进式改良,更具行业风向标意义的,是极佳视界首次公开的基础模型12个月路线图

这张“明牌”的时间表,直接将具身智能的智能化进程进行了量化:

  • GigaBrain-1:2026年Q3发布,据称是全球首个基于“双金字塔”体系打造的物理AGI基础模型;
  • GigaBrain-2:进一步拉满Scaling Law的加速器;
  • GigaBrain-3:基于1000万小时视频数据+100万小时世界-动作数据训练,直接剑指物理AGI的“GPT-3时刻”

在大模型发展史上,GPT-3的里程碑意义并不在于模型结构本身,而在于它是Scaling Law首次显现“涌现能力”的临界点。

当数据规模与算力跨过那个神秘的阈值,物理世界的认知就会从量变产生质变。

物理AGI的“GPT-3时刻”在理论上同构——

数据规模(1000万+100万小时)与算法范式(双金字塔)在临界点交汇,物理智能体将展现出真正意义上的通用性

这不是指在实验室预设的场景下机械地干十种家务,而是意味着它能够“空降”到任何一户真实家庭,能应对所有突发的意外,并在每一次环境反馈中完成自我进化。

过去两年,行业对于“物理AGI何时到来”的追问,大多得到了“五年内”、“指日可待”等模糊的回应。

极佳视界这次直接掀掉底牌,把宏大命题拆解为两个确定性的交卷时间:需要什么样的体系(双金字塔),以及什么时候到达临界点(12个月)

这是一个可以被全行业公开检验的答案。

物理AI“梦之队”集结

除了技术,极佳视界更亮眼的莫过于其核心团队:

创始人兼CEO黄冠,清华大学自动化系创新领军工程博士。

曾担任地平线机器人视觉感知技术负责人、鉴智机器人合伙人&算法副总裁,并拥有微软亚洲研究院、三星中国研究院等顶尖研究机构工作经历。

他完整经历了过去十年物理AI的技术和产业发展历程,多次带领团队获得全球权威AI比赛世界冠军,并发布多个全球知名AI成果。

联合创始人兼首席科学家朱政,智源青年学者,发表顶级论文70余篇,引用近2万次。

多篇著作影响力巨大,连续4年入选全球前2%顶尖科学家榜单,多次获得吴文俊自然科学一等奖、最佳学生论文奖、CCF杰出论文奖等荣誉,也是多个顶会领域主席、多项竞赛冠军。

联合创始人孙韶言,曾担任阿里云总监,地平线数据闭环产品线总经理,在物理世界超大规模数据闭环产品和架构方面拥有行业领先的经验。

他主导了业内首个智能驾驶数据闭环系统的落地,有效提升了数据的处理效率,为智能驾驶技术的发展提供了重要的基础设施支持。

合伙人兼工程副总裁毛继明,拥有超过16年的仿真/工程/数据/分布式架构方向的经验。

曾担任百度Apollo仿真和工程负责人,以及曾担任百度、赢彻等T10级别架构师,主导多个自动驾驶与世界模型核心项目的技术开发与落地。在高质量数据生成、端到端自动驾驶架构设计以及分布式系统优化领域有着深厚的积累。

可以说,这支团队完整经历了CV、自动驾驶、具身基模、世界模型等物理AI过去十年的发展历程,并在每个阶段都做出了行业领先的世界级成果。

当他们聚集在一起,就共同造就了这支始终引领具身世界模型技术演进的“梦之队”。

资本侧给出的反馈同样明确。

在2026年3月至4月,短短一个月内,极佳视界连续完成两轮融资,合计金额高达约25亿元,一举跻身国内首个世界模型“百亿独角兽”。

据说,其背后的投资方矩阵,覆盖国内最具代表性的顶尖产业资本(华为哈勃就是其中之一)、头部财务机构与重磅国资平台。

三个悬而未决的问题

事实上,极佳视界给出了一套将算法+数据+本体+场景+商业+时间表全栈打通的物理AGI闭环路径。

往前看,三项全球权威评测冠军证明了算法架构的优越性;

往下看,“百台进社区”印证了工程化的可靠执行力;

往未来看,三代基础模型路线图则给出了明确的航向。

站在当前节点,未来12个月内,至少有三件事值得整个科技界持续追踪:

第一,百台家庭部署能否真正跑出有效数据闭环。

家庭环境下机器人能持续工作多久、故障率与人工介入频次、用户偏好如何回流到模型,这是物理智能领域目前最稀缺的资产积累。

第二,2026年Q3的GigaBrain-1是否能如期发布,并在能力上对得起“双金字塔”体系所许诺的范式优势。

第三,GigaBrain-3是否能在12个月后真正触达“GPT-3时刻”——

或许这是物理AGI赛道目前最具争议、也最具兑现价值的判断。

正如朱政在发布会尾声留下的那句话:

物理AGI服务每一个人的时代,会在一户一户真实家庭中逐渐发生。

大幕已经拉开,这个预言会不会变成现实,我们只需要再等12个月。

版权所有,未经授权不得以任何形式转载及使用,违者必究。