特斯拉FSD V12在美推送!AI算法黑箱端到端控制,摒弃人类规则程序

雨天实测表现不佳

一凡 发自 副驾寺
智能车参考 | 公众号 AI4Auto
特斯拉FSD V12,普通车主也能用了。
特斯拉FSD V12在美推送,不只是特斯拉内部员工,普通车主也有机会体验端到端自动驾驶了,告别传统的规则驱动,驾驶决策交由AI算法生成
尽管FSD V12的更新称得上是“飞跃”,然而实测视频,仍带有Beta后缀的Version 12还称不上是“终极答案”
特斯拉FSD V12在美推送
FSD V12 Beta在美推送,不依赖激光雷达,数据驱动AI算法,媒体演示视频可应对大多场景。
雨夜无保护上坡后左转:
特斯拉FSD V12在美推送!AI算法黑箱端到端控制,摒弃人类规则程序

点击输入图片描述(最多30字)
等待小朋友过完马路再走:
特斯拉FSD V12在美推送!AI算法黑箱端到端控制,摒弃人类规则程序

点击输入图片描述(最多30字)
马路靠边侧方停车:
避让前方车辆突然刹停:
特斯拉FSD V12在美推送!AI算法黑箱端到端控制,摒弃人类规则程序

点击输入图片描述(最多30字)
总体来看,纯视觉的FSD V12 Beta的能力得到很大提升,针对不规则障碍物等的识别很准确,一些细节也还原的很好。
程序兼容性也提高,这次不仅推送给了原来的HW3.0硬件方案,HW4.0也收到了推送。
但是仍然存在不足,比如不依赖激光雷达,目前纯视觉方案在恶劣天气下的表现不够好。
首批测试的博主称,在大雨天气下测试FSD V12 Beta多次出现接管。
这也和大约一个月前马斯克给网友的回复吻合,当时网友在社交平台上催更马斯克,马斯克回应称FSD V12程序在加州表现还不错,但还需要多在雨水多的地区训练
特斯拉FSD V12在美推送!AI算法黑箱端到端控制,摒弃人类规则程序

点击输入图片描述(最多30字)
所以目前推送的v12.1.2版本显然能力还不够完善。发布测试视频的博主随后也表示:
  • FSD Beta v12.1.2(最新版本号)并不能实现自动驾驶。
这可能就是为什么推送的FSD V12依然带有Beta(测试版)后缀,此前马斯克曾公开表示,FSD V12不会是Beta版。
特斯拉FSD V12在美推送!AI算法黑箱端到端控制,摒弃人类规则程序

点击输入图片描述(最多30字)
以及虽然这次确实是推送给了普通车主,而不仅限于特斯拉内部员工,但推送的车主数量还比较小,特斯拉对此还比较谨慎,也许等后面全员推送,正式公测后会将“Beta”移除也说不定。
要是以目前的表现直接落地中国,怕是会让很多人告别“FSD崇拜”。
特斯拉FSD V12在美推送!AI算法黑箱端到端控制,摒弃人类规则程序

点击输入图片描述(最多30字)
不过尽管存在着不足,但是FSD V12的更新仍可以称得上是飞跃,为自动驾驶发展开辟了新道路。
V12和以往FSD版本有什么不同
特斯拉在最新的OTA注解中表示,V12用海量视频数据训练出的端到端神经网络,替换掉了超过30万行C++代码
不再是规则驱动的,而是数据驱动的,这是FSD一大进化。
特斯拉FSD V12在美推送!AI算法黑箱端到端控制,摒弃人类规则程序

点击输入图片描述(最多30字)
所谓规则驱动,就是过去传统的自动驾驶程序在根据感知做出决策时,用程序设定规则,if-else的逻辑判断。
Corner Case(边缘场景)无穷无尽,很难写出一段程序覆盖尽可能多的场景,遇到特殊情况就补一段,长此以往代码的冗余和程序的复杂程度不断提高,系统最后难免被程序员封为“屎山”。
现在转向数据驱动,用大量的视频数据训练神经网络,不断完善模型趋向于人类老司机。
用一位早前参与FSD V12内测的特斯拉员工所说,过去难以优化的问题迎刃而解——(模型)模仿人类就行了。
特斯拉FSD V12在美推送!AI算法黑箱端到端控制,摒弃人类规则程序

点击输入图片描述(最多30字)
FSD V12也不像过去的自动驾驶还要分为三个感知、规划和控制三个模块,用一个统一体实现了端到端,这头输入周边感知到的数据,那头输出驾驶决策。
端到端的神经网络有什么好处?
从研发上来看,过去分成感知、规划和控制,最终是实现把车开好,但三个模块各自的优化目标是不同的,每个模块都会产生bug或是误差,这些误差积累下来会导致最终输出结果出问题。
就好像快过年了咱们一起包饺砸,和馅,和面,下饺子,最终目标是做好这盘饺子,但是馅、面和下饺子各自所追求的目标是不一样的,每一步都可能会出问题,导致最终饺子煮烂了。
特斯拉FSD V12在美推送!AI算法黑箱端到端控制,摒弃人类规则程序

点击输入图片描述(最多30字)
从商业化落地来看,每个模块独有体系和机制,这意味着要针对每个模块投入团队和资金,却不一定能换回升级迭代效率。
而转换成端到端这种单一模型后,工程复杂度没原来高,只需要围绕一个最终目的进行优化,统一可控。模型的主干也可以共享提高计算效率。
端到端也使得纯粹依靠数据完善程序成为可能。
当然,新的突破带来新的问题。
过去分成多个模块,升级优化更灵活,C++程序可解释性也更好,从汇编到到编译,程序运行很清晰。
而端到端自动驾驶是个“黑盒”,解释性不太好,增加了人们对自动驾驶的信任成本。
但正如AI大牛何恺明此前在香港中文大学讲座中谈到的:
你打车遇到的司机师傅是个陌生人,为什么你会信任他?
你信任他是因为他的大脑是可解释的,还是你认为一个训练有素经验丰富的司机应该会开的很稳?
版权所有,未经授权不得以任何形式转载及使用,违者必究。