接上期。
我们曾经反复谈论过Tesla车辆传感器了,包括数量和种类。这里再提一次,但是重点在于,Tesla强调了这些传感器的配合使用,实际上可以提供“人车闭环”闭环级别的数据获取。请关注上图中最后一行“Pedal/Steering wheel angle sensor”,这是汽车油门踏板和方向盘转角传感器,是专门从正向记录油门开度和方向角度的传感器,即是为了捕捉驾驶员的“关键驾驶行为”。
这些数据被记录并上传到位于云端的Tesla Autopilot神经网络中,将会作为标准的“人类抉择和动作”而被记录下来,在对照Autopilot神经网络的行为过程中,起决定性作用。
在Identify Objects in Space过程中,Tesla云端的神经网络有条件维护一个具备一定实时性的“上帝视角”数据库。这里所谓的上帝视角请参加以下连续两图。
Tesla位于云端的神经网络(小编推测不应该是用于Autopilot的,因为实时性显然不够)在这个数据处理中,将会搜集每辆上报车辆周围的车辆状态(上图显示为相邻车辆的实际物理尺寸、队形和彼此的间距),如果综合本车的其他传感器(比如radar或者sonars)甚至邻近区域其他Tesla车辆的探测和上报数据,则Tesla位于云端的神经网络可以构建出“上帝视角”的局部。
但Telsa的技术负责人强调这个功能实际上属于Tesla团队内部使用的Debug工具,而不对客户开放。实际上类似结构也没有必要向客户开放,这种数据的真正价值体现在后台仿真和问题复现、分析等环节上,而非自动驾驶直接需要。
从事自动驾驶仿真行业的朋友可能会理解,Tesla搜集类似数据的提炼工作往往比搜集数据工作本身更重要,且更消耗时间。要从广泛可获取的海量车流数据中,甄别出最有价值的交通流“极限工况”并分类总结,是一件非常不容易的工作。但完善的“极限工况”获取,最后返回来对于训练Autopilot自动驾驶算法,效能又是极高的。相当于一个阅历非常丰富的“老司机”在提供其一生中所遇到的所有驾驶危险案例,这样教出来的学生水平自然会比较高。
在针对行人的Control for Pedestrians过程中,Tesla车队上报的海量数据在云端的Autopilot神经网络也得到了充分利用。按照负责人的说法,Tesla的技术思路不是仅仅发现前方路径上的行人目标并执行相应的规避措施(改道、降速或者刹车)就完了,而是经过大量数据(包括多传感器在避让场景下的所有数据分析),而形成一种对于行人可能干扰车辆行驶的趋势分析:即不仅仅看到行人在哪里、也要看到行人要去哪里。
从我们日常驾驶的经验看,类似能力的获取(或者至少说Tesla在积极尝试),这个技术思路十分类似人类的驾驶经验。例如:当你看到有一个孩子在马路边跃跃欲试的时候,你就不能只看交通灯了。因为导致非法穿越马路的不确定因素正在增加,达到人类驾驶员和Autopilot都必须认真考虑的水平上了。
类似的边缘场景似乎除了依赖大车队基数在真实的世界中遍历,靠人类设计并实践(仿真实践)的可能性似乎并不高,也无法做到很全面。这是Tesla的核心优势。
在Learns from Human的过程中,Tesla的技术负责人给出了一个时间轴,表征了Tesla历史上所采取的技术关键点。第一个阶段在2018年年中,是“第三车视角”的驾驶行为观察和交通流量特征的记录和学习。
由于传感器种类和视角的限制,这种方式所真正能获取对于人类行为的观察显然是不够的。如果需要对人类驾驶行为,尤其是何时换道、刹车等行为的观察和学习能达到工程可实施的级别,并为Tesla的Autopilot所用,则非后来的Shadow Mode不可。
2018年末推出的shadow Mode,之前的章节我们曾经论述过了,这里我们谈一些新的关于对于Shadow Mode的理解。
1 Shadow Mode应该只是在Autopilot激活并持续工作的状态下才对驾驶员的接管动作做记录;
2 驾驶员的接管动作被记录下之后,择机上传到云端的Autopilot服务器,其主要用途是对照当时时刻的Autopilot的驾驶选择之间的差异到底在哪里,提供被对比的Autopilot驾驶选择可能不止一种(仔细观察上图及出现了蓝色和红色阴影车辆两种行为下的车辆状态);
3 Tesla将这种差异数学化之后,可以用于Autopilot端到端或者某个模块(规划、动作等)神经网络的具体训练,以调整和优化相关神经网络的模型参数;
4 经过不间断的持续训练之后,Autopilot的行为将达到最优,即最接近人类行为。
当然以上过程必须要考虑的是,Tesla如何处理人类驾驶行为对于塑造Autopilot神经网络的权重问题。因为并非每个人类驾驶员都是合格的驾驶员,要考虑冒险和激进的驾驶风格对于Autopilot模型参数恶化的可能性。
当通过各种数据获取和训练手段不断完善Autopilot的某个功能,比如换道动作,达到符合部署标准的准确性和可靠性之后,Tesla会将其广泛部署而进入Wide Rollout状态。
如上图所示,Wide Rollout阶段实际上也是一个需要驾驶员参与的过程。以换道为例,在Autopilot状态下,自驾系统会给出规划线路上的预期的更换车道的地点选择,如果驾驶员否定,则可以进入人工择机换道状态(类似当前的autopilot版本,通过驾驶员触动转向灯来进入换道状态),同时云端的autopilot神经网络会根据大数据水准分析预测的换道地点是否不合适。这也是一个预测——人工干预——修正的闭环过程。
综上,截止去年4月份,Tesla已经有九百万级别的换道动作搜集和验证过程,考虑到“换道”动作确实是非常关键的驾驶行为,Tesla的如此技术+工程的实现思路,还是值得肯定的。
车右智能
info@co-driver.ai
备注:
1 题图来自于互联网搜索;
2 插图12345678皆来自于特斯拉自动驾驶开放日的公开宣讲资料。