量子位智库 | 公众号 AI123All
2024年的创投风口赛道是什么?
各种风向标显示,具身智能机器人,都是名列前茅的火热之星,甚至在2024上海世界人工智能大会(WAIC 2024)现场,最受瞩目的也是具身智能机器人。

实际上,不止在WAIC 2024上,具身智能赛道今年以来新动态不断,屡屡在科技圈掀起广泛讨论。
谷歌发布了RT系列最新机器人模型RT-H,英伟达在GTC大会上推出了人形机器人通用基础模型Projoject GR00T,特斯拉擎天柱(Optimus)机器人从叠衣服、散步到进厂“打工”,就连OpenAI也宣布时隔四年重新组建机器人团队……
除了这些顶流大厂,初创公司更是参与和推动具身智能热潮的主角。近年不断有顶级院校和科技巨头AI/机器人实验室等出身的专家创立具身智能公司;创业公司们频繁更新自家机器人产品的demo视频;具身智能赛道融资状态火热,明星创企单轮融资额破亿屡见不鲜,整体估值水涨船高。
为了呼应市场关切,也为了对具身智能创投做阶段性梳理,量子位智库正式推出最新报告——
《中国具身智能创投报告》。

在该报告中,量子位智库对具身智能的背景现状、技术原理与路线、国内创业格局、融资情况及代表创企、创业者背景等方面进行了梳理,提供系统化参考。
具身智能背景现状
具身智能定义
根据中国计算机协会的定义,「具身智能(Embodied AI)」是一种基于物理身体进行感知和行动的智能系统,它通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。
值得注意的是,本篇报告研究的「具身智能」以通用智能机器人载体为主,不包含无人车等物理形态。
具身智能机器人与普通机器人的区别主要集中在自主性、感知与交互能力、学习与适应能力、应用场景等方面。

具身智能火热现状
具身智能在产业端和学术端都有成果显现。
产业端——科技巨头布局具身智能生态
- 英伟达今年2月宣布成立GEAR(Generalist Embodied Agent Research)实验室,专注通用具身智能体研究;在3月的GTC大会上,英伟达发布人形机器人通用基础模型Project GR00T,以及专为人形机器人打造的新型计算平台Jetson Thor。
- 微软不仅和英伟达、OpenAI一起投资了具身智能明星创企Figure AI,今年5月还与仿人机器人公司Sanctuary AI达成合作,为其提供Azure云资源、加速具身AI研究。
- OpenAI与Figure、1X Technologies 等公司合作开发机器人大模型,并将视觉语言模型加持在Figure 01人形机器人上;同时时隔四年重新组建了自己的机器人团队。
学术端——高校机构研究具身智能系统
- 斯坦福大学李飞飞团队推出VoxPoser,基于环境信息和自然语言命令,通过大语言模型和视觉语言模型的交互,指导系统为机器人生成相应的操作指示地图。李飞飞教授今年也发起「空间智能」方向的创业项目,目标让AI像人类一样对视觉信息进行高级推理。
- 卡内基梅隆大学研发出OmniH2O(Omni Human-to-Humanoid)全身遥控系统,实现全尺寸人形机器人的实时全身远程操作,并用宇树科技的H1-ReS人形机器人做了效果演示。
- 北京大学推出一系列具身智能研究成果,包括具身导航系统DiscussNav、具身大模型ManipLLM、机器人多模态大模型RoboMamba等。
具身智能火热原因:大模型及生成式AI的快速发展
具身智能(Embodied AI)的概念早在1950年就由艾伦·图灵提出,但一直以来被大众看作象牙塔内的学术研究方向,直到近两年随着人工智能技术的进步,尤其是大模型及生成式AI的发展,人们逐渐看到具身智能实际应用的可能性。英伟达CEO黄仁勋和斯坦福李飞飞教授等产业界和学术界的旗帜性人物纷纷为具身智能站台,越来越多的人相信具身智能将成为「人工智能的下一个浪潮」。

具身智能技术原理与路线
技术原理
具身智能本质上是为以机器人为代表的物理实体注入人工智能,使其能感知、学习并与环境动态交互。

技术路线
1、具身智能的算法方案可分为分层决策模型和端到端模型两种路线。
- 分层决策模型
以「Figure 01」为代表,将任务分解成不同层级,以多个神经网络训练,再以流程管线的方式组合。Figure 01顶层接入OpenAI的多模态大模型,提供视觉推理和语言理解;中间层神经网络策略作为小脑进行运动控制并生成动作指令;底层机器人本体接受神经网络策略的动作指令,进行控制执行。

Figure 01线程
分层决策模型的缺点是:不同步骤间的对齐和一致性需解决。
- 端到端模型
以「Google RT-2」为代表,通过一个神经网络完成从任务目标输入到行为指令输出的全过程。首先在大规模互联网数据预训练视觉语言模型,然后在机器人任务上微调,结合机器人动作数据,推出视觉语言动作模型。RT-2不仅负责最上层的感知与规划,还参与中下层的控制与执行,打通了端到端的链路。

RT-2模型控制流程
端到端模型的缺点是:训练数据海量、消耗资源巨大、机器人执行实时性差。
2、具身智能的训练方法可分为模仿学习和强化学习两种路线
- 模仿学习
模仿学习是指智能体通过观察和模仿专家(经验丰富的人类操作者或具有高级性能的系统)的行为来学习任务。
模仿学习优势在于可以快速学习专家策略,无需复杂的探索过程。劣势则是学习到的行为策略受限于专家数据,对于未见过的情况泛化能力较差。
- 强化学习
强化学习是指智能体通过与环境的交互来学习最佳行为策略,以最大化某种累积奖励。
强化学习优势在于能够通过探索环境学习未知的策略,处理高度不确定和动态变化的环境,劣势则是需要大量的探索和试错,学习过程缓慢,且对于复杂任务,设计合适的奖励函数难度较高。
3、具身智能的数据采集可分为基于仿真环境数据和基于真实世界数据两种路线。
- 基于仿真环境的数据采集
基于仿真环境的数据采集,也即Sim2Real(Simulation to Reality),是在仿真环境中学习技能和策略,并迁移到现实世界中。
其优势在于数据可大规模获取,成本低,劣势则是对仿真器要求高,仿真环境与真实世界存在差异,且迁移过程中存在性能下降的情况。
- 基于真实世界数据采集
基于真实世界数据采集,是直接从现实世界数据中学习,包括本体采集、遥操作、动态捕捉、视频学习等方式。
其优势在于数据更真实可靠,劣势则是真实世界数据少、泛化性差,且往往通过机器本体和人采集,成本高、难度大、效率低。
国内具身智能赛道创业格局
具身智能浪潮主要参与者
国内具身智能浪潮的主要参与者包括科技大厂、传统机器人公司和新生代的具身智能创业公司等。其中,数量众多的创业公司们正将最前沿学术研究与产品研发相结合,为具身智能市场释放无限想象力。
1、科技大厂
- 阿里通义千问联合有鹿机器人发布具身智能大模型LPLM。
- 百度为优必选的人形机器人Walker S接入文心大模型。
- 腾讯通过RoboticsX机器人实验室持续研究多模态大模型与机器人的融合。
- 华为成立具身智能创新Lab且与乐聚机器人合作发布盘古具身智能大模型。
- 小米成立独立的人形机器人公司,推出Cyberone机器人。
2、传统机器人公司
- 优必选推出面向工业领域的人形机器人Walker S。
- 宇树科技发布通用人形机器人H1。
- 傅利叶智能发布通用人形机器人GR-1。
- 达闼机器人发布搭载云端大脑的人形机器人XR4。
- 乐聚机器人发布搭载开源鸿蒙系统的人形机器人「夸父」。
3、具身智能创业公司
近两年不断有AI顶级院校和科技巨头AI/机器人实验室出身的专家学者创立或参与创立具身智能企业。
这些初创公司技术实力优越,吸引无数投资,带来更密集的具身智能机器人产品动态更新,是参与和推动这次具身智能浪潮的重要主角。
具身智能创业公司分类及图谱
具身智能创业公司可分为机器人本体(整机)研发商、机器人大模型研发商和机器人数据及系统方案供应商。

具身智能融资梳理
国内创企融资及产品进展梳理


按最新融资所在轮次从后期向前期排列
国外创企融资及产品进展梳理

按最新融资所在轮次从后期向前期排列
国内外具身智能创企特色鲜明
1、相同点
- 国内外具身智能创企背后的投资方往往都有科技大厂参与。
创业公司与微软、英伟达、OpenAI、阿里巴巴、百度等行业巨头一拍即合,主要是因为其在研发、实验过程中持续的资金需求,以及对算力、数据、模型等资源的需求,与科技巨头公司自身对于前沿AGI方向的布局,以及自身业务生态的能力十分匹配。
- 国内外具身智能厂商都选择率先在汽车制造业务中尝试部署机器人。
一是因为潜在需求强,汽车制造流程(尤其是总装环节)有较高的人工成本,长远来看机器人替代有助于降低成本、缓解劳动力紧缺情况,二是因为汽车工厂提供了丰富的实际应用场景,有助于机器人收集数据,进行学习和优化。
- 国内外研发机器人整机的创业公司数量都多于专注机器人大模型及数据领域的创业公司。
整机研发更能形成链路闭环,通过机器人本体在物理环境中的部署,自主采集现实数据,再不断地更新算法模型,优化机器人本体的任务执行。
2、不同点
- 与国外具身智能企业相比,国内创企的融资轮次尚处早期。
国内具身智能市场仍处于相对早期的发展阶段,许多初创公司仍在探索和验证其商业模式的可行性。
- 国内具身智能创企的机器人产品在实际商业环境中进行部署尝试的节奏较慢。
国内制造业的劳动力缺口暂时可控,机器人替代需求并不急迫,同时普通制造企业对机器人在工厂环境工作的失效成本较为审慎。但以优必选Walker S接连合作蔚来、东风柳汽、一汽大众为示范,国内具身智能机器人正在汽车制造、商超及药房分拣补货等场景加速落地。
具身智能创业者背景溯源
创业者学术背景
对具身智能领域的创业者而言,深厚的学术背景往往更是公司在创始阶段取得成功的重要因素。当我们遍览国内知名具身智能创企的创始人们,发现几乎每位创始人或联合创始人都出自业内顶尖院校,且师承相关领域的专家学者。在小小的学术圈子里,创业者们产生了或多或少的交集。
在这些培养出诸多具身智能创业者的顶尖院校中,清华大学、斯坦福大学、普渡大学等派系格外引人注目。


根据当事人访谈、学校官网、领英等互联网公开资料整理
创业者产业背景
在百花齐放的具身智能创业浪潮中,不少创业者除了深厚的学术背景,还有过丰富的产业经历。其中,在智能机器人、自动驾驶两个领域有过从业经历的创业者拥有得天独厚的条件,他们将机器人运动控制技术积累或自动驾驶技术架构迁移到具身智能机器人身上,是具身智能创业的骨干力量。
1、智能机器人背景
- 星尘智能创始人来杰以及联合创始人戴媛均出身于腾讯RoboticsX机器人实验室。
- 众擎机器人创始人赵同阳曾担任小鹏旗下智能机器人公司鹏行智能的总经理。
- 艾欧智能创始人陈相羽则在Robotics X和鹏行智能都有过工作经历,分别负责过四足机器人Max和可骑乘智能机器马的项目。
- 穹彻智能由通用智能机器人公司非夕科技孵化,穹彻智能的核心创始人也是非夕科技的创始人及高管。
- 银河通用联合创始人姚腾洲曾就职于ABB机器人研发中心。
2、自动驾驶背景
- 有鹿机器人的创始人陈俊波博士之前在阿里巴巴达摩院担任自动驾驶实验室的负责人。
- 智平方科技创始人郭彦东博士曾担任小鹏汽车的首席科学家,负责智能车AI视觉及感知相关的研发及应用。
- 星海图创始人高继扬先后在自动驾驶公司Waymo与Momenta工作,将自动驾驶技术架构与具身智能技术架构联系起来。
- 雅可比机器人创始人邱迪聪曾在自动驾驶初创公司ISEE AI工作,研究自动驾驶中行为决策与动作规划和认知科学的结合。
总结
具身智能前路虽远,光明已现
- 具身智能创业公司百花齐放,越来越多顶级院校具身智能领域的专家学者,以及科技公司AI/机器人/自动驾驶实验室的产业从业者,正在投入具身智能创业的浪潮。
- 具身智能整体火热的融资状态短期来看有望延续,但因为产品研发投入高、应用落地周期长,资本未来可能集中于成功可能性更高的头部明星创企,行业马太效应随时间推移而加剧。
- 具身智能机器人公司预计今年年内开始推进各自产品在汽车工厂、商超等实际生产环境中部署和收集数据,从而推动下一阶段的小规模量产和正式商用。
- 具身智能创业公司在技术路线上会继续结合仿真数据和真实数据训练机器人。专注于具身大模型(大脑)、运动控制算法(小脑)、人形机器人本体及零部件(身体)的不同企业,会共同促进具身智能技术的更新与迭代,加速实现具身智能机器人在实际场景中的应用。
参考链接:
[1]
https://x.com/adcock_brett/status/1767913955295744449
[2]
https://robotics-transformer2.github.io/assets/rt2.pdf
完整报告下载地址:
https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f?fromScene=spaceOverview




