很久没跟踪Autopilot FSD在北美的测试(针对指定的特邀用户)进展了,刚查了一下,现在最新推送的版本号是2021.4.11.1(Tesla整车软件版本号)其所对应的FSD完全自动驾驶系统的版本号是FSD v8.2。从发布时间上看是2021年的第四周,也就是1月底的最后一周。但从这个时间点之后,在互联网上来自第一批测试用户的反馈却骤然增多,而且积极评价泛滥。如果再兼顾考虑Elon Musk本人在各种渠道所透露出的关于Tesla的信息,这引发了小编的关注,所以我们按照时间线梳理一下,对于迈向全自动驾驶队列中,最特立独行的Tesla和他的纯视觉Autopilot实现,给咱们公众号的读者一个技术概观。
1
2020年底,Elon Musk vs Mathias访谈中关于FSD的部分言论
当然,看到这个具体内容可能很多读者又要嘲笑了,说Musk预测自家Autopilot进入完全自动驾驶Level-5状态已经不是一次两次了,哪次成立了?对,没错。但小编总是感觉随着时间的推移,达成完全自动驾驶的预测总是会越来越真实。毕竟还是需要相信Tesla和Musk手上的数据才是让他们变得自信甚至“口无遮拦”。在这个星球上,在对自动驾驶场景下的视觉数据进行大规模搜集、训练、测试和部署并最终形成反馈的闭环上,没有人比Tesla走得更远的了吧?所以还是要相信方法、数据和数据带来的自信,既不盲目排斥,也不盲目崇拜,Tesla在全视觉自动驾驶系统上走得越远,与我们就越多一种技术选择,这是大大的好事儿。
上面访谈的关键信息有以下几点:
第一:Elon Musk相信,Autopilot FSD的自动驾驶水平要好过人类驾驶员10倍。我相信这不是一个杜撰的倍数关系,而是背后有实际的测试反馈支撑。因此Musk相信在不远的未来,人类想拿到驾驶执照将会越来越难;
第二:Elon Musk认为与其按照Level-4/5的标准去对自动驾驶系统的能力进行区分,不如从可靠性上去对其进行区分,99.9%的Level-4自动驾驶能力,反而可能会导致长时间人类驾驶员处于懈怠状态,而导致在千分之一的需要人工干预的时间占比内无法正常接管车辆,从而导致风险。因此不论哪种Level的自动驾驶系统,六个九的可靠性可能才是最终可以被官方和社群所接受的自动驾驶水准,即99.9999%;
第三:Elon Musk绝对相信,Tesla可以在2021年度内实现Level-5的自动驾驶能力,但具体来说,应该是Tesla可以提供,不代表官方机构会授权和认可;
第四:Elon Musk认为在美国的一些州,Tesla的完全自动驾驶FSD将会得到批准部署和使用。在欧洲的一些国家有希望快速通过审批,比如挪威等,但总的来说,欧盟的而审批将会是非常严格的。
2
2021年1月,Autopilot系统的识别NN覆盖周身全部摄像头
从字面上理解,Elon Musk通过这条推希望传达给消费者、投资者和技术同行们的关键信息,还是遵循他一贯坚持的“第一性原理”:为什么Tesla坚持不用Lidar?因为自动驾驶系统的出发点就是拟人,如果人类不需要眼睛发射激光并接受激光返回所带来障碍物的高精度距离信息也能开车,那么机器必须也可以;为什么Musk敢说FSD在现在这个阶段逐渐好于人类驾驶员的能力呢?因为FSD的大脑——NN神经网络,目前拥有可同时处理8个摄像头的眼睛,而人类没有。
而从技术上理解,在我们以往所关注的公开披露信息中,Karpathy曾经多次谈到过在Autopilot系统中得到大规模应用的“多任务神经网络系统”。由于自动驾驶系统对于道路视觉信息的重度依赖,视觉信号是需要被高度利用的。这种高度利用的核心,一个是“超低时延”,另一个是“高可靠性”,从当前的神经网络技术发展趋势来说,“多任务神经网络”的架构已经被普遍接受,如下图所表述的,Autopilot是如何利用多任务神经网络架构来处理对于“Cut-in/车辆变道”场景的预测能力的建立:
原始的视觉信号来自于车身周围的所有8个摄像头,由于对于视觉信号的普遍处理原则是提取关键信息的同时,尽可能降低信息总的体量,因此基于CNN网络的特征数据处理是必不可少的标准步骤(即每个摄像头都需要这一步)。但如果后续处理,具体到每个不同的“识别和预测任务”,则对于8个摄像头的信息需求,也是不一样的。上图是对于Cut-in车道切入场景的预测任务,需要自车可以观测并预测到左右相邻车道车辆是否和何时会切入本车道,从而提前做出预判和行车轨迹规划。在这个预测任务下,显然,没必要利用到所有的8个摄像头的信息,因为车辆后部的视觉信息对于判断是否有“Cut-in”发生不是特别有价值……当然读者可能会问,主车身后发生突然的、快速的换道操作也是对于主车的安全威胁之一,Maybe。但是对于现在的Autopilot系统架构,他可以考虑的Cut-in场景预测任务中,是同时调用了Main、Narrow、Repeater三种四个摄像头的视觉信息。所以从Cut-in预测任务的NN角度来说,数据搜集、训练、测试和实际部署的NN网络就是上图中的红色部分。这其本质也算是一种对于多个摄像头视觉信息的联合利用,符合Elon Musk的说法。
其实在Autopilot 1.0时代,也就五六年前,Tesla早期的Model S上,实际是安装了Mobileye的单摄像头辅助驾驶ADAS系统的。对比于当下的AutopilotFSD能力,确实1.0阶段是仅仅提供1个摄像头的视觉信号处理的。这还是属于质的提升。同时我们还可以参考Autopilot对于Road Layout的预测和绘制任务,如下图所示。这不同于通常的单一任务,对于道路结构的预测和绘制,是属于地理和时间上的全局任务。按照Tesla公布的信息,Road Layout任务是属于ResNet-50的一种,他完整地利用了车身上的所有8个摄像头的输入信息,强大的道路结构绘制能力,将会使Autopilot对于在陌生区域行驶的把握性更大,也就是适应能力更强。
3
FSD正在搜集大量长尾数据,且用户评价积极
因为FSD的试用范围在第一批主要是面向Tesla的车主中最热衷于自动驾驶技术进步的技术性用户,所以各种信息曝光相对比较火热。在各种各样的用户使用体验上报中,小编选择了这个比较有代表性的长尾现象。下图中的场景表明,Tesla开启FSD,当遇到超长超宽的工程车辆,包含其身后的工程警示车辆(双黄灯闪烁)时,Tesla主车会自动降速跟随,并且在主动换道尝试超车无果的情况下,按照合适的车距跟车,直到警报解除。
在这个完整的过程中,FSD表现得和人类驾驶员的状态很类似,因此给人比较惊艳的体验。车主将其归结为这是Tesla车队广泛接触和搜集长尾的“极限工况”并持续学习和训练的结果。Elon Musk本人也曾经公开表示,只有在真实的物理世界中实际捕获的极限工况,对于自动驾驶系统来说才有真实的验证效力。小编表示赞同的同时,同样认为“仿真”技术依然是有效的训练手段,且成本低廉,问题是如何尽可能搭建逼真的仿真交通环境。
4
3月初,FSD Beta的测试范围快速增长
根据半官方的信息,Autopilot的FSD测试版本用户数大概在1000人辆左右,FSDv8.2版本发放之后,将会在本周末达到峰值,扩展推送到1600-2000人辆左右。目前正在内部走QA测试的FSDv8.3版本,按照Musk的说法,在理论上会比当前的v8.2版本性能提升1000倍!小编也没搞懂这种性能提升的倍数数值是如何得到的,但是可以肯定的是,FSDv8.3版本在通过QA达到发布标准之后,将会进一步扩大测试范围,达到10000人辆。
由于大规模增加了FSD的测试范围,因此Tesla考虑不再使用之前的版本推送方法,而是提供获取测试版本资格的驾驶者,自己主动下载FSD全新版本的能力。“未来十天内,Tesla将在车机UI上提供Download Beta按钮。”按照小编的理解,Tesla的自动驾驶系统演进已经是开弓没有回头路了,既然把使用HDmap和Lidar的道路都给自己堵上了,那么依赖纯视觉的自动驾驶系统就必须沿着ADAS的思路一路走下去,利用Tesla的品牌吸引力尽可能招募越来越多的人类驾驶员入局,从而加快视觉数据的获取速度和自动驾驶系统的迭代节奏。按照另一类说法,自动驾驶所面临的场景数据,越接近长尾末端则效力越低、成本越高。Openpilot的创始人曾经说过,现在针对自动驾驶系统的视觉训练数据不是太少了,而是太多了,处理这些庞大数据的成本增加速度远远快过自动驾驶系统的受益程度。因此,小编认为关键的关键还是Video+NN结构下的NN性能,Andrew Karpathy和他领导的Autopilot AI团队,将是Autopilot战略成功与否的关键。
车右智能
一个一直用心仿真的自动驾驶技术信徒
info@co-driver.ai
备注:
1 插图1来自于推特用户@BogusThought3月3日的推文插图,URL:https://twitter.com/billhuang688/status/1366956000230576130;
2 插图2来自于Elon Musk1月25日的推文截图;
3 插图3/4来自于Andrew Karpahty的技术演讲截图;
4 插图5/6来自于推特用户Whole Mars Catalog的推文插图;