楼教主:今天具身智能的状态很像2018年的自动驾驶

”云代驾是伪概念,VLA基本帮不上L4“

一凡 发自 副驾寺

智能车参考 | 公众号 AI4Auto

新一代Robotaxi家族车型亮相,小马智行联合创始人、CTO楼天城对外分享了关于自动驾驶的最新思考,从L2谈到L4,从L4的技术谈到运营,以及自动驾驶后新的AI浪潮:

AGI和具身智能。

在楼教主看来,L2与L4有着本质的不同,“L2无法升维成L4”,L2做的越好,离L4越远,反之亦然,当下L2火热的VLA范式甚至在L4“基本帮不上什么忙”。

作为L4最前沿的落地应用,作为落地应用的最前沿玩家,小马智行Robotaxi进展如何?未来有什么规划?

如何看待今天具身智能的火热?

以下为采访对话实录,经编辑

谈技术:VLA帮不上L4,世界模型用5年了

Q:如何看待VLA?

楼天城:VLA在L4上基本帮不上忙,原因是一个模型有两种东西,一个是能力,还有一个是本身的属性。VLA的属性就是遇到再复杂的情况,它也能给个大差不差的东西,它是一个全科大夫,但是L4要求极端安全,需要的是一个专科大夫。VLA再强也看不了专科病。拿长跑短跑举例子,博尔特可能是一个优秀的短跑运动员,但是你指望他跑长跑肯定不行,因为腿的肌肉都不一样。

运动员有长跑短跑的属性和他能力强不强,这是两码事儿,他可以不断锻炼,让自己变成博尔特这样,但是不表示他长跑就有进步。过去两年我们技术最关键的变革,一个是端到端,一个是世界模型,其实世界模型在机器学习领域有30年的历史了,我们用了大概有5年的时间,Waymo比我们略早一些,百度我觉得时间差不多,我没有意识到大家不知道世界模型,所以我在去年底出来说了这个东西。

具身智能公司都在说这个东西,只要脱离人,不依赖人,独立完成一个事情,基本都要用世界模型的概念。因为它要基于强化学习的概念,要基于世界模型的概念,所以这在机器人领域是一个非常常见的事,我没有意识到这一点,所以就把这个概念带给了市场。

世界模型的理念其实就是学习方式不同,人生有两种学习模式,一种是传统的教育模式,老师怎么做,我怎么比划,这叫模仿学习,这是最常见的学习方式。它的优点是非常方便、快,也没有什么不确定的因素。缺点很明显,你很难超过老师。另一种是强化学习,老师也不会做,但是老师给你创造实验环境,就像我研究生时候,老师给我创造实验环境,让我朝这个方向去努力,自己去摸索,这叫强化学习。

所有L4公司用的都是强化学习,也是为什么我们说世界模型的观念,这是根本的不同,这个事情在行业中有四到五年的共识了,但是我没有意识到大家不是这么想的。

Q:无人驾驶的成本什么时候低于传统司机?

楼天城:新一代车型量产运营后一定能实现。上一代硬件成本还比较贵,所以做不到。这个过程有两个大的里程碑,第一是要去掉人,如果有人的话肯定做不到。第二步就是用车规级量产硬件。这一代车型达到了这两个目的。

Q:如何看待5G云代驾?

楼天城:这是一个伪概念,我从不会以任何方式尝试云代驾的逻辑,在技术上太commonsense了。云代驾对网络要求非常高,相当于我花十倍无人车的钱来雇一个云代驾,而且网络是很不稳定的,一天上午就断好几次网。而且云代驾没有身临其境的感觉,所以它做的判断也是有误差的。小马从没有尝试过任何云代驾的概念,但我们也有远程,你可以认为我们的是一个客服,但是他绝不会操作车,其他家像Waymo也完全没有做过这个东西。

Q:车队到达什么量级可以去方向盘?

楼天城:要过万。这也是我很想发生的事情。

但是我刚刚说的特斯拉的那个还在做。因为我是做技术的,特斯拉按结果来看他还不在桌上,他只是说他某天可以很快到桌上。

一个做技术人的表示,你上了桌再教别人打牌。

谈Robotaxi运营:开城越快,盈利可能越慢

楼天城:我先简单介绍自动驾驶今天的发展现状,今天我们的Robotaxi大概至少跑了50万个小时了,开到了市中心,高快速度,雨天、暴雨也都能跑,所以技术上的驾驶安全性上,2022年底就ready了。

为什么这一次我们讲的都是成本、车规、量产,就是基于这个前提,技术至少我觉得已经是接近满分的状态了,这就是自动驾驶L4发展的状态。

技术路线其实也经历了很多变革,其中一个变革其实就是端到端,这也是两年前的事了,大概在那个时候,我了解到像我们、Waymo、百度都已经用了。今天对L4公司已经是标配了,但是对L2公司不一定,所以有时候因为大家习惯讲L2,会说你有没有端到端,觉得你做的好不好。

刚才说的50万小时,做到这个,那自动驾驶玩家就还在牌桌上,否则可能还在牌桌下。

Q:Robotaxi运营时零件坏了怎么办?

楼天城:我们有冗余,就像飞机上很多零部件会失效,但是飞机也能带我们回家。

Q:现在每辆车日均订单有多少?

楼天城:我们每辆车每天有15单,现在不够高的原因是因为车少,接单的时间会比较长,浪费很多时间。订单量后面会随着车增加会上涨,

Q:这一代套件成本怎么样?

楼天城:相对来说比上一代降低了70%,它全都是车规级的价,比如我们雷达,用的就是理想上的雷达,我们的域控是蔚来上的芯片,都是这些零部件,所以加起来不会特别贵。

Q:这个成本是自动驾驶系统的成本,还是整车?

楼天城:刚才说70%是指自动驾驶的成本,因为整车的话,就像大家出门打车有优享、专车和快车。我们现在有多个平台,也有这方面的考虑,比如用更高端的车。

Q:会完全自己运营,还是会跟什么公司一同运营?

楼天城:现在是一个混合的状态,我们自己有app在运营,我刚刚推荐各位用我们的app,小程序也可以。但是像如祺、高德这样的平台,两个是混合的状态,也帮我们补充一下。

Q:小马出海规划是怎样的?

楼天城:我们现在出海顺序是韩国、新加坡,大陆之外香港,还有中东,还有欧洲,我们都有这样的布局。因为重大政策需要时间来准备,我们就今天开始布局,然后到了几年之后它能够在海外有这样的情况。

Q:为什么现在中国Robotaxi都在出海?

楼天城:今年也许国内有很大的市场,但是三年以后,我还是希望海外是一个巨大的增长点。但是为了三年后海外增长,就得今天开始布局,不能等三年后再布局。

Q:第七代Robotaxi打车定价如何?

楼天城:非常好的问题,简单来说我们会定在一个相对比较高的价格,我一直坚信AI应该提供好的产品,为大家提供高质量的服务,而不是把很多事情卷的价格更低,这是AI的意义。

所以我希望我们的服务是高质量的,然后收一个合理的价格。比如说我提供专车服务收优享的钱,但是肯定是那个级别的,绝不会往下去做,因为这是我们的理念。我一直觉得AI这么多年,如果说只是为了提升效率,并不是AI的目的,AI还是提供高质量的服务,改善我们的生活,提高服务质量。

Q:怎么吸引用户去坐我们的车辆呢?

楼天城:性价比肯定是高的。一定是有好的服务。比如说这是一个私密空间,并且他开车的驾驶能力是非常一致的。有的时候你坐车,可能今天司机和明天司机的体验都不一样,而这个是非常一致的体验,一种好的体验是非常必要的。其次在这个好的体验的前提下,是一个相对还优惠的价格。

我们在北京遇到一个很神奇的用户,他每天中午都打一趟我们的车,起点终点一样,去哪一个地方绕一圈再回来,我就想这个哥们是干吗的呢?我就去找了他,他说他中午想找个地方睡一觉,没有地方打盹,就打我们车睡一觉。我说我们的车还能干这个。

Q:那我们的车未来会给用户提供这样的场景吗?

楼天城:这是产品设计的亮点,但是真正产品改造还是以更多的客户作为主要的策略来源,不会专门为某一个用户去改。

Q:为什么欧洲Robotaxi价格比出租车高很多?

楼天城:其实这个跟出租车公司有关系,不同国家不太一样,像日韩就挺高的,中东不明显,新加坡很高。总体上来说,确实我们出海的很多市场当中单价高,也是很好的吸引我们的地方。至少两三年后,单价对应的是利润,这个还是非常有帮助的。

Q:如果很多IT大厂入局Robotaxi,小马智行如何应对呢?

楼天城:我们有很多时间领先性,大厂要做技术上需要很长时间。比如说我们用了8年时间,大厂就算快一些,比如说用5年时间,但是5年之后,这个市场早就不同了,这个时间差是很难被追上的。我只是说如果说现在新做的话,相对来说IT公司会比车厂做得更好一些,至于说他有没有这个决心是另外一回事。

Q:咱们现在的无人车是在量产车上做一些改款吗?

楼天城:现在的车已经不是这样了,可以说是市面上车的改款,但是不再是人敲的那种东西了。

Q:会不会开城越快,盈利越慢?

楼天城:开城越多是会影响盈利点的。首先是分散,一个区域内的车变少了,服务质量下降了,盈利能力就弱了。其次城市之间的盈利点也不同,为什么我们做北上广深,这就是中国收入最高的四个城市,不同城市司机收入不一样。

为什么我不聚焦一个城市?作为一家初创公司也需要一些曝光量,四个城市的话,大家经常多去去。我在一个城市的话,可能大家一年都不来一次,也有这方面的考虑。单纯从盈利来说你说的是对的,就是太分散之后会影响盈利时间点。

还有一件小事,从驾驶能力上,不同城市之间,在L4领域其实差别不大的。大家说L2的时候,说你能覆盖100个城市、200个城市,500个城市跟10个城市不一样,但是L4不一样。L4哪怕在海外的泛化性都是非常好的。原因是什么?原因是L4关键是解决极端场景的,就是其他那些非常疯疯癫癫的,不太守规矩的人。不同国家正常人开车习惯是不一样的,但是疯子是一样的。所以泛化性是非常好的,为什么不多开城是一个商务决定。

Q:只做北上广深是兼顾了两个方面,既有足够多的车,也可以保证未来有盈利的空间?

楼天城:是的。

Q:Robotaxi量起来后如何监管呢?

楼天城:有自驾办专门来监管这件事情,首先我们是有牌照的,我们要缴税的。他会利用一些已有的法规来监管,比如说定责,比如说牌照怎么发。比如说一个人驾驶证是12分,但是企业不能说12分,但是他会有一个比如说出了事故就扣分,扣没了就考照,除了事故之后如何定损、定责,各地有一套这样的东西。下一步可能会有中央的突破,现在还是在各个城市,但是这方面相对来说都已经很健全了。

Q:今天最新一代有车型基本架构似乎和阿波罗5代差不多,怎么理解?

楼天城:是一个节奏的区别,其实RT 6我估计已经触碰到问题的答案了。对我来说,我更看重先把成本下来再上规模,所以让你觉得上规模比他晚一些,但是我降成本会比他降得早一些,其实是一个错位的点,其实在整个速度上大家是一致的,你看RT 6,先不管他报出多少价格,大家用的东西其实都是这些东西,成本上我们是有共识的。如果你说我们的不同点,我们可能在车规上走得更极致,就是我们现在车上所有的零部件100%都是车规的,其他家一定都没做到。这一点上,Waymo是做得最差的。

Q:那Waymo会掉队吗?

楼天城:只要它还是Waymo,就一时半会儿不会。

谈具身智能:今天的状态就像2018年的自动驾驶

Q:小马自动驾驶的技术未来会不会复用在机器人上?

楼天城:现在我先说“不”,至少我们现在没有任何具身智能的计划,究其原因不是因为技术不通用,而是说真正把一个应用落地,我觉得自动驾驶是机器人领域最好落地的东西,如果说这个做不到,那就无从谈起。而且具身智能需要蜇伏更长的时间。

大家会觉得在中国做技术,这恐怕是一个很难的点,就是一旦一个技术要做到三五年的时间,很难有一个团队在一个地方能够容忍他做那么久把事情做出来。比如说大的互联网公司钱很多,但是不要说三年了,三个月不出东西老板就要找你了。对于我来说我也很累,我今天给投资人讲这个,下一次讲什么?过一年之后我跟投资人说我没有进展,你觉得投资人会怎么想你?所以都有这个压力。所以就需要找真正懂这件事的合作伙伴。

Q:现在有一个说法是具身智能这波浪潮,基本上是自动驾驶失败者联盟,您同意这个说法吗?

楼天城:首先创业失败是很正常的事,所以犯不着叫失败者联盟,创业有一些磕磕碰碰很正常。具身智能今天的状态和自动驾驶2018年的状态非常像,我非常怀念那个时候,做做Demo就行了,但是我也知道到2019年会发生什么,那也就是自动驾驶接下来一年发生的事情。

自动驾驶有一个很重要的红利就是我们蜇伏的那几年刚好是疫情,疫情的时候大家心态比较平比较淡一些,帮助团队撑过了那段真空期。否则在快速发展的时候,今天说人家做了什么,你怎么不做?我说稍等,但是这个等可能就撑不住了。不说别的,我的很多同事,他可以自己相信这件事,他家人也得相信。比如说他老婆问他说你这个有什么进展?看不出来,车还是这样。

Q:越懂技术的人是不是对未来发展越悲观?

楼天城:首先这和懂技术的态度不太一样,做技术的人往往会对结果更敏感,对过程更淡化。但是我先说人工智能的威胁。比如说今天上午介绍过人工智能的分级,人工智能的第一级已经过去了,第二级是Copilot,就是今天的DeepSeek、豆包,它是一种辅助工具,帮助你干事,但是决策还是要自己做。比如说今天的材料很多问题就是DeepSeek给我推荐,但是还是要我来写究竟应该怎么做。第三级就是L4 Robotaxi,就是它来负责,不用人管,它自己解决,叫Agent,具身智能在AI的分级叫Agent。下面一级的AI叫innovation AI,就是AI会自己创造发明,这是一个极其可怕的事情,就是AI做到这里已经很可怕了,AI会自己创新了,你就不知道他要干什么东西了,AI的威胁是源于这个。innovation AI再往后是AI会自己建立体系了,那是真正要开启硅基生命了。其实AI不是前两级有威胁,而是后两级有。我觉得马斯克看到了所以他失望,但是不是今天这些。

Q:所以您是认可AI的威胁?

楼天城:简单来说,我觉得可能人是拦不住的。

Q:所以还是悲观的。

楼天城:这不算悲观,这就是时代发展。说的更夸张点就是优胜劣汰。

Q:AGI这两年有比较好的商业模式吗?能快速实现吗?

楼天城:AGI就是通用人工智能,我觉得它会经历自动驾驶一样的真空期,如何过真空期还要打一个问号,什么叫真空期呢?就是今天具身智能做很多展示,拍很多视频,看着很炫酷,今年OK,那明年呢?明年继续拍,后年呢?它总会到一个大家对于视频,对于demo麻木的状态,去做到下一个节点,也就是真正商业化,需要考虑很多长尾的问题,这个过程中有很长时间的一个真空期:

这三年时间对外展示不了任何进展,这个时候有多少公司能撑过去?非常困难。然后才是应用的价值,大家愿不愿意为它买单,这是另一回事,所以这两个挑战都是自动驾驶曾经遭遇过的,因为我经历过,我知道有多困难,AGI肯定也是躲不掉的。

谈辅助驾驶:L2永远无法升维成L4

Q:L2永远无法升维成L4?

楼天城:简单来说“是”。

刚刚说了模仿和强化其实就是一个原因,但是这是技术怎么做,我还是从产品表现来说。

比如车位到车位,是一种产品的形式,技术上终究会有一些时候要让人来介入。

换句话说,安全有一个及格线,L4的安全及格线很好说,你就可以认为是一个满分线,当然满分线不是无穷大,因为我不撞别人别人会撞我。

我那天在路边停了两分钟,还有一个车就把我撞了,去掉这种跟自己无关事件之后的事故,我们叫满分线,因为满分不可能被超越了,及格线基本就是满分线,L4真正的挑战是在这里。

L2还差得非常远,而且这几年大家讲的都是平权,都是成本,都没有再继续优化这件事情。所以它其实根本过不了L4及格线,而且会越差越远。

究其原因是背后的做法,回到我之前举的长跑、短跑的例子,你腿部肌肉都不一样,你短跑跑得越好,你长跑越难成为专业长跑选手,博尔特永远不会成为专业长跑选手。

Q:车企卷到最后发现L2无路可走,会不会转向L4?

楼天城:任何企业都可以某一天突然决定开始做L4,任何企业都可以。但是单从竞争角度来说,IT公司更擅长。

因为做L4需要很多东西,比如说世界模型,本质上是需要AI的人才和对算力的把握,这些是IT公司更擅长的事情。如果说这些车厂他卷不动L2要做L4的话,他需要从头把L4公司走过的路都走一遍。并不是说因为他有一个什么基础就可以走得更快,因为我刚刚说了,世界模型是一个虚拟世界,真实数据不是干这个的,也不是用来模仿的,所以那些东西没有什么直接的帮助。所以我的观点是任何家都可以做,IT背景的公司可以做得更快。

Q:假设车企放弃L2上和供应商合作,然后来找小马合作,那小马的L4有没有下放的可能?

楼天城:首先小马已经和北汽和广汽合作了。如果是说放到量产车上卖给个人,这是一个非常有价值的市场,但我觉得这个技术上需要更长的时间。Robotaxi是一个,专门控制区域,专门运营,天天车自己看护的业务,还有远程客服,到今天也就只做了几个城市,在这几个城市Robotaxi够了。但是卖给个人是要开全天下的,这个难度不可同日而语。

Q:L3是存在的吗?

楼天城:首先来说L2,L2基本上非常明显导向成本优化了,都在讲平权了,再回到L3,如果想实现比L2更高的功能,确实要考虑不再依赖人,这是对的。但是基于L3本身,还是有很多做法上延续了L2的影子,让大家觉得很像L2延续,但其实大家忽视了非常多L2跟L3不同的地方,关于这一点,有一些太反直觉的东西,之后我们找更合适的场合跟大家分享。

我们仔细思考过L3这件事,但是我觉得现象级L3的思考都还是有非常重的L2的影子,同时大家对L4的理解也有偏差。

Q:如何理解L4是有技术壁垒的?

楼天城:这个壁垒不是说不能做,只是要从头开始做,你要重新再做五年才能达到这个状态,L2不会做着做着突然变成L4。这和长跑、短跑还不太一样,人不能把肌肉卸了,不能返老还童到年轻的时候再来一遍,但是如果说能再来一遍,其实可以变成另外一个运动员。

Q:如果把L4下放到辅助驾驶的话成本会很高?

楼天城:不仅是成本,还有另外一个很大的问题。举个例子,其实人开车开得并不好,我个人是一个围棋爱好者,当年AI就是由AlphaGo这个故事开始的,现在已经叫Master了,我看Master下棋我看不懂的话,我第一反应是我太蠢了,我没看懂它下棋,我水平不够。

今天我们的L4车上已经出现这个情况了,很多人觉得你车怎么不这么开,我说是你开得太差了。但是L2不能这样,因为L2的话,用户绝不会觉得是他自己开得差,因为助手就是要为主人帮好忙。所以L4越做这个东西,这方面会越严重。

就好像L2版的AlphaGo,我推荐你下棋怎么下,但是每一步一定要在你的理解范围之内,所以它变得越智能之后你反而变得越不理解了,那就是一个不好的情况,虽然很少有这个问题,但是确实是这样的。

所以我三个月前说L2做得越好,距离L4越远,其实反面也是的。

Q:你在国内有体验过其他家的智能辅助驾驶吗?

楼天城:经常体验一下大家的智驾的,但我非常清楚智驾的极限,我可不会在智驾里睡觉或者干别的,我个人是各种新能源车都会去尝试。

版权所有,未经授权不得以任何形式转载及使用,违者必究。