< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

Loop世界模型论文登顶Hugging Face，来自中国一家初创，周鸿祎陆奇都投了

思邈 2026-07-01 15:24:48 来源：量子位

重写“AI如何反复推演世界”

允中发自凹非寺

量子位 | 公众号 QbitAI

Prompt还没退场，Loop已经开始接管AI叙事。

这两周，硅谷开发者圈最热的词之一，是Loop Engineering。

它讲的是一件很“Agent时代”的事：别再手动一轮轮prompt模型了，去设计一个循环系统，让AI自己执行、检查、修正、继续跑，直到任务完成。

传统模式以prompt为核心，现在开始转向以工作流为核心，这也是它突然爆红的原因。

而就在大家热议“怎么让AI自己跑起来”时，另一条更硬的线也在快速升温：Looped World Models（循环世界模型），简称LoopWM。

如果说Loop Engineering解决的是“AI怎么持续干活”，那LoopWM更像是在回答一个上限更高的问题：

AI在持续干活时，能不能做到持续理解、修正、推演它所面对的世界。

这也是为什么，它虽然名字里也有“Loop”，但其展现出的技术含金量和想象空间，明显不是一个量级。

它登上了Hugging Face Papers当日Top1，现已进入了AI社区更广泛的公共讨论。

Loop Engineering为什么突然火了

Loop Engineering为什么会火，其实很好理解。

因为单次对话适合问答，不适合复杂任务。

真要让AI去写代码、调试、调工具、看结果、修bug、再验证，它必须进入一个“行动—观察—推理—继续行动”的闭环。

换句话说，AI不再只是“答你一句”，而是开始“围绕目标持续推进”。

这正是今天Agent热的底层逻辑之一。

Google Chrome工程负责人Addy Osmani，引用过一个挺直白的判断：

你不该再亲自prompt agent，而该去设计那个prompt agent的loop。

在这套叙事里，人从“亲自操作模型的人”，变成“设计自动化系统的人”。

这也是Loop Engineering特别像硅谷热词的地方：它不是一个技巧，是一次身份迁移。

人从提示者，变成了系统设计者。

但问题也随之出现。会循环，不等于会理解。

一个Agent可以不断调接口、读日志、改参数、反复试错，但如果它对环境状态、动态变化、因果关系没有更稳定的建模能力，它仍然更像一个“更勤奋的自动执行器”，而不是真正具备世界理解能力的系统。

也正因此，LoopWM才显得格外关键和重要，它是在重写“AI如何反复推演世界”。

这件事，被一家中国叫脸谱心智的初创公司做了

接下来，让我们深扒一下是谁做了这件事：

论文作者FaceMind Research Asia（脸谱心智），是这篇文章的通讯机构。

据了解，公司已完成数千万元Pre-A轮融资，投资方为星连资本，老股东360超额跟投，陆奇的奇绩创坛也参股了。

公司由95后博士陆弘远及韦怡然创立，团队早期从端侧全模态模型切入，随后将重心转向更底层的世界模型研究。

相比只会生成内容的大模型，世界模型更强调对环境、界面与任务过程的持续理解和预测，这也被视为AI走向GUI Agent、具身智能与机器人场景的重要基础。

围绕这一方向，脸谱心智正通过循环迭代、参数高效的模型架构，提升模型在长时序预测、屏幕理解和具身任务中的稳定性，并已在仿真具身环境、GUI Agent环境和真机机械臂环境中展开验证。

一家年轻公司，正在试着把“理解世界”这件事，做成下一代AI基础设施的一部分。

对此，星连资本合伙人李文珏表示，脸谱心智团队最突出的特点，是兼具扎实的研究能力和复杂工程落地能力。

团队核心成员长期深耕人工智能底层技术，既能对前沿方向形成独立判断，也能快速将研究成果放入真实场景中验证。“我们看好的是一支人才密度高、技术判断前瞻、执行能力很强的团队。”

在李文珏看来，陆弘远身上兼具年轻研究者的探索欲和创业者的行动力，能够带领团队持续挑战高难度问题，并将技术判断转化为明确的研发方向。

△脸谱心智Founder陆弘远

这种创始人特质和团队凝聚力，是星连资本决定投资的重要原因。

脸谱心智的投资方360集团投前负责人向其奇表示：“陆博士是我见过最顶尖的年轻AI研究者之一。”

在他看来，陆弘远关注的并非局部优化，而是模型底层原理和架构创新。

当行业还在讨论世界模型概念时，脸谱心智已经从零训练世界模型，并在多种benchmarking上得到了行业SOTA级别成果。

此后，陆弘远提出的Adam’s Law受到海外头部模型厂商Anthropic的关注和验证，团队最新提出的Loop循环架构则进一步探索世界模型长时序训练问题。

“迭代速度惊人。每次沟通前，我都会先去看他们最新发布的论文和技术报告。”向其奇感慨，从他们身上真正体会到了什么叫做“一次投资，终生学习”。

关于为什么是一家中国的初创公司能做出这样一项工作，陆弘远回答：

中国现在是一个高密度AI人才的国家，这是我们能做出一篇划时代的世界模型工作的主要原因之一。

FaceMind未来也会被更多的国际视野所捕捉，就像他们的工作前几周刚刚在X上被Anthropic/Facebook的投资人Accel点赞了。

论文到底做了什么？

说得直白一点，LoopWM干的事是：

不再让模型一次前向传播就把世界状态“猜完”，而是让它通过共享参数的Transformer模块，对潜在环境状态做反复迭代细化。

这背后有个很实际的矛盾。

要做高质量、长时程的环境模拟，计算必须足够深；但模型一旦做深，参数量和推理成本就会一起飙升。

而且rollout越长，误差越容易层层累积，最后把整个模拟拖垮。

论文里的原话是：

faithful long-horizon simulation demands deep computation, but deeper models are expensive to deploy and prone to compounding errors。（高保真的长时程模拟需要深度计算，但模型越深，部署代价越高，误差累积的风险也随之上升。）

LoopWM的思路是，把“深度”从一次性堆叠，改成循环式复用。

它不用每加深一点能力就新增一大堆参数，而是通过共享参数的transformer block，对同一个latent state（潜空间表示）反复做refinement（细化）。

简单场景少跑几轮，复杂场景多跑几轮，计算深度开始跟随任务复杂度动态变化。

论文把这件事概括成一条新的scaling axis（扩展维度）：iterative latent depth（迭代潜空间深度），独立于模型规模和训练数据之外。

世界模型变强，以后未必只能靠“更大”，也可以靠“更会反复想”。

数字是最有说服力的部分。论文给出的结论包括：

参数效率最高可实现100×提升；
对于简单状态转移，单步推理FLOPs可减少约25×；
在长时程rollout中，整体计算节省最高可达两个数量级。

这些都不是“说法上的优化”，而是直接指向部署成本、推理效率和长程稳定性的核心指标。

根据论文报告，在ScienceWorld基准测试上，LoopWM能在world modelling垂类任务上，比肩参数量高出两个数量级的更大模型。

这意味着它不是“用更大的模型赢了”，而是用更聪明的计算方式赢了部分关键任务。

这不只是Agent升级，是AI认知层在换挡

AI社区里有一种正在变清晰的焦虑：

光会说话不够，光会调工具也不够，真正难的是在长链路、动态环境、复杂反馈里，维持稳定的推演能力。

Loop Engineering对此给出的答案是闭环，让AI能自己推进。

LoopWM走得更远一步：给AI一套机制，让它在推进过程中对世界状态进行反复、稳定、按需的计算。

X上关于LoopWM的讨论，也从侧面说明了这件事的分量

社区的注意力没有停在“100×参数效率”这个口号上，而是落在几个更本质的技术词汇：

shared transformer block（共享Transformer模块）、adaptive compute（自适应计算）、spectral stability（谱稳定性）、deferred decoding（延迟解码）、iterative latent depth（迭代潜空间深度）……

这些词背后指向同一个判断：世界模型可能终于找到了一条比“继续堆参数”更优雅的进化路径。

过去一年，Agent最大的变化，是让AI从“回答工具”变成“执行工具”。

LoopWM指向的变化，则更进一步，是从“执行系统”往“世界建模系统”迈一步。

前者解决效率问题：怎么少点人工、多点自动化。

后者解决的是上限问题：

当AI真正进入机器人、仿真训练、空间交互这类复杂环境，它靠什么维持对世界的连续理解。

李飞飞谈到空间智能时说，今天的大语言模型擅长处理语言，却缺乏对物理世界真正扎根的理解；而世界模型，正是通向这种空间与物理理解的重要基础设施。

LoopWM的意义就在这条线上：它把Loop这个原本属于Agent工作流的概念，第一次明确推进到了world model本体里，换的是一套增长逻辑，不是修修补补。

硅谷先聊热的是Loop Engineering——贴近开发者体验，也更符合“让AI自己跑起来”的叙事。

但把时间拉长，真正值得反复看的，可能反而是Looped World Models这类工作。

因为它试图回答的是，AI在自动运行中，能不能真正理解世界。这一点决定了系统明天能不能长大。

Prompt Engineering定义了AI如何回应人，Loop Engineering定义了AI如何持续做事，而Looped World Models定义的，可能是AI如何在做事时真正理解世界。

论文链接：https://arxiv.org/abs/2606.18208

Loop Engineering 世界模型脸谱心智

思邈

Loop世界模型论文登顶Hugging Face，来自中国一家初创，周鸿祎陆奇都投了

Loop Engineering为什么突然火了

这件事，被一家中国叫脸谱心智的初创公司做了

论文到底做了什么？

这不只是Agent升级，是AI认知层在换挡

相关阅读

世界模型有了开源基座Emu3.5！拿下多模态SOTA，性能超Nano Banana

VLA死了，遥操也死了！英伟达机器人一号位说的

美国视频生成老炮儿，入局世界模型

清华研究生开源大一统世界模型：性能超越硅谷标杆40%！

这么哇塞的世界模型，竟然是开源的！

Meta发布40页报告，具身智能的下一步是「心智世界模型」：能听，能看，能理解，会共情

热门文章

WAVES 2026：今年盛夏，在创投浪潮里，做迎风而立的少数人！

Claude Fable 5分批重新上线！GPT-5.6秒跟

从需求到设计到代码，一个软件全搞定！TRAE Work Design实测来了

谷歌「推理之王」也跑路Meta了，当年还是李飞飞挖来的

科大讯飞发布企业服务Claw平台：一句话搞定需求到方案全流程