首家跟进ChatGPT的自动驾驶公司！毫末官宣DriveGPT认知大模型

昭慧 2023-02-17 16:06:11 来源：量子位

中国自动驾驶公司早就用了“ChatGPT”

曹原发自副驾寺

智能车参考|公众号AI4Auto

ChatGPT自动驾驶版，横空出世。

毫末智行宣布，自动驾驶认知大模型正式升级为DriveGPT，在自动驾驶模型算法方面，全面应用ChatGPT的模型和技术逻辑。

ChatGPT更被人熟知的身份是“会聊天的AI”，底层技术传统上讲属于NLP领域。

但NLP大模型跨界应用到视觉领域，早已有之。比如毫末智行一直提倡的Transformer大模型，最早就诞生于NLP领域。

ChatGPT大火，甚至被比尔盖茨比喻成和互联网诞生一样重要。而一向追逐前沿AI应用的毫末智行，如何把ChatGPT用在自动驾驶上？

从ChatGPT到DriveGPT

毫末智行的自动驾驶认知大模型（人驾自监督认知大模型），正式升级为DriveGPT。

稍微解释一下，毫末的自动驾驶认知大模型采用的是RLHF（人类反馈强化技术）算法，通过不断输入真实人驾接管数据，持续优化自动驾驶决策模型。

也就是说，毫末的这个模型在不断学习千千万万个老司机的驾驶经验，进而帮助模型自己能独立做出最优决策。

而ChatGPT之所以能成为“很会聊天的AI”，也是因为训练的时候使用了RLHF算法，利用人类知识，让模型能判断自己的答案质量，训练自己逐步给出更高质量的回答。

目前，毫末智行已经完成DriveGPT的模型搭建和第一阶段数据跑通，现在的参数规模可以对标GPT-2的水平，大约7.74亿。

ChatGPT的爆火也不过是这几个月的事情，而毫末现在已经有了能落地的进展。

这样的速度背后，其实是AI技术向超大规模数据、超大规模模型演变的大趋势。

毫末智行的自动驾驶模型中，其实早就应用了和ChatGPT相同的模块。

毫末智行的认知决策算法

先看看毫末怎么迭代认知决策算法的。

毫末这套认知决策算法进化分为三个阶段：

第一个阶段，引入个别场景的端到端的模仿学习，直接拟合人驾行为；

第二个阶段，通过认知大模型，引入海量正常人驾数据，通过Prompt的方式实现认知决策的可控、可解释；

第三个阶段，也就是毫末认知决策算法现在处于的阶段，引入真实接管数据，并在大模型中开始使用RLHF算法，让模型学习人驾接管数据。

这其中第三个阶段，就是和ChatGPT训练逻辑类似的阶段，也是能引入这套模式的阶段。

也就是说，当毫末认知决策算法通过拟合、学习人驾数据，具有一定的驾驶决策能力后，毫末构建了一套奖励规则（即奖励模型，reward model）。

在同一个驾驶环境下，如果人类驾驶行为和算法决策一致，不选择接管，计为一个good case；如果人类司机接管了，就计为一个bad case。

通过把good case和bad case这种“好坏”的价值判断模型引入算法训练，能够进一步让算法做出更好的驾驶决策。

目前，毫末智行DriveGPT已经进入算法进化的第二个阶段，接下来就是第三阶段：输入大规模真实接管数据，让模型强化学习人驾数据反馈。

并且，毫末还会把DriveGPT作为云端测评模型，评估车端小模型的驾驶效果。

关于DriveGPT更多重要进展，4月HAOMO AI Day上毫末会进一步公布。

而毫末智行能实现这些目标，离不开背后强大的算力支持。

为什么是毫末智行

毫末在国内应该第一个明确提出自动驾驶重感知轻地图的技术路线。

去年行业的发展验证了毫末的先见之明。

ADAS系统尽量减少高精地图信息的依赖，自然就要求车端的感知识别能力更强大。

在研发端来说，迭代这样的大模型，需要更大的算力来支撑。

今年1月，在毫末举办的AI Day上，这个自动驾驶量产公司宣布自建智算中心MANA OASIS。

通过和字节跳动旗下火山引擎的合作，MANA OASIS算力可达0.67 EFLOPS（每秒6.7×1017次浮点运算）。

智算中心不仅算力几乎全部为自动驾驶服务，架构也根据自动驾驶的业务特性做出调整，计算、存储和通信都具有很强的基础能力。

并且，毫末MANA OASIS还支持千亿参数的AI大模型的完整训练，收敛周期效率得到大大提升。

在AI Day上毫末还宣布了五大模型，除了上文提到的自动驾驶认知大模型（现在叫DriveGPT），还有视频自监督大模型、3D重建大模型、多模态互监督大模型、动态环境大模型，从数据、目标识别准确率、路径预测规划、整体乘坐体验等多个角度共同提升毫末自动驾驶能力。

毫末自建超算，从技术层面解释了为何它能成为第一个真正把ChatGPT相关技术真正在自动驾驶领域应用的玩家。

而从公司整体策略上，支撑毫末在研发端进展迅速的条件，是它以自动驾驶量产上车为核心目标的整体战略，以及背后长城汽车每年百万销量的落地规模支持。

毕竟无论是NLP还是自动驾驶，不断获取大规模低成本的数据获取渠道，才是一切的基础。

说了这么多，毫末智行的技术，体现在乘用车上了吗？

毫末NOH，已经量产上车。

今年毫末智行的目标是实现城市NOH大规模量产上车，即在城市内实现能自动识别红绿灯、人车混行场景，大部分时间不用人类驾驶的高阶智能驾驶功能。

在明年，毫末城市NOH预计会在国内100个城市落地。

无人车往哪里开？智能车真high 毫末智行

昭慧

领克07 EM-P开启预售，预售价18万元起2024-05-07
充电10分钟续航1200公里！丰田官宣固态电池大突破2023-07-10
不降价联盟就活了48小时！有违反垄断精神主动失效，成员各怀鬼胎2023-07-10
16家车企约定不打价格战，特斯拉、比亚迪、蔚小理都参与了2023-07-07

首家跟进ChatGPT的自动驾驶公司！毫末官宣DriveGPT认知大模型

从ChatGPT到DriveGPT

毫末智行的认知决策算法

为什么是毫末智行

相关阅读

苹果造车工程师认罪！跳槽小鹏前窃取芯片机密

启辰发布新能源战略，东风日产开辟第二战场

毫末智行创办2年营收过亿，路测百万公里，放话明年是自动驾驶行业生死线

地平线来了，领航辅助驾驶壁垒破了

特斯拉因幽灵刹车被判定系统缺陷！法院：车留下，并退回全额车款

李书福旗下智能车大脑来了！芯片系统一体，行泊座舱融合，清华系国产芯片上车

热门文章

雷军：地表最强四门车，小米造！自曝造车起步估值超700亿

陶哲轩在IMO上给AI团队颁奖！他们要做AI数学的ImageNet

给iPhone背面贴个AI录音机，生意老好了

AI视频修复速度10倍提升，过曝变色也能逐帧搞定｜美图国科大新算法

微软蓝屏搞瘫全球，马斯克很生气，原因很尴尬