接上期……
除了在上期内容中我们特别介绍的关于“机动车附加自行车”的实际案例,实际上Tesla的这种自我训练方法同样适用于很多种对类似道路情况的机器学习过程。比如:对于道路不明碎片的学习,对于道路上意外闯入的动物得学习、对于道路上各种各样的临时施工的场景的学习。
在上图中,我们可以看到针对“道路不明碎片”的学习输入。基于庞大的特斯拉车队上报信息,各种符合“不明碎片”标准的上报信息(图片和短视频)送到云基础设施之后,被自动甄别算法(可能也是另一种CNN卷积神经网络)所分类,在确认之后执行“Label/标注”动作,然后作为合格的数据,再次被送入Tesla的自动驾驶神经网络的训练过程中去,去修正和完善已有的Tesla自动驾驶算法。
大致的闭环过程可以参考下图:
初始的自动驾驶神经网络模型被送到车端之后,庞大的车队开始进入“使用/试用”阶段,当然现在AutoPilot对外至少还是必须驾驶员手不能离开方向盘的。在这种严格的有人监督环境下,自驾神经模型开始以各种模式开始“运作”(比如影子模式Shadow Mode),并且不断以单车为单位进行各种自动驾驶级别的命令输出……在这个过程中,一旦输出的命令或者模式/语义识别的处于“Inaccuracy”状态(在上图中特意举了在隧道中行驶的场景为例子),则有两种方法进行干预。
第一是局部模式,即以单车为单位,将侦测到的Inaccuracy场景通过网络向上导入到云端的Unit Tests进程中去处理,处理之后的模型更新,会反馈通知到全体车队;
第二则是全局模式,即以整个Tesla自动驾驶训练系统为Inaccuracy扩散范围,快速将问题场景在全体车队内扩散,搜集大量类似信息,并一同上报到自动驾驶神经网络的训练模型内,做统一处理。并最终将处理结果通知给全体车队。
很明显,第二种方法由于综合考量了大量的类似的“极端案例/Conner case”,因此云端的自动驾驶神经网络模型将会得到更充分的锻炼和修正,但是这种处理方法是其他厂商所无法借鉴的,是Tesla的天然竞争壁垒,这也是没办法的事情。
但是细心的行业内的专家可能会发现这种处理方法同样会带来问题,那就是对于大量的上报数据,在Tesla的云平台侧必须要有足够的计算力/人力做Labeling处理,否则类似的训练,可能会因为上报数据的错误分类而导致已有的自动驾驶模型在局部恶化。这个代价是Tesla所不能承受的,因此Tesla也承认这种方法必须要准备足够的人力做“标签/Label”动作,所以是昂贵的且耗时的。
Tesla的AutoPilot后台负责人解释说,他们已经认识到这个问题会随着特斯拉车队的进一步扩张而不断被放大,如果处理不好就无法发挥AutoPilot算法自我演进的最大特色,因此如何降低人力成本、提高训练闭环的自动化比例,是他们当下最重点考虑的任务。例如,在对待邻车道车辆Cut-In和Cut-Out(切入和切出)细分场景,Tesla重点发展了Shadow Mode/影子模式,在神经网络的模型更新中,大幅度提升自动化处理的比例。
对于Shadow Mode的讲解,我们下篇再聊。
车右智能
info@co-driver.ai
备注:
1 题图来自于互联网搜索;
2 插图12皆来自于特斯拉自动驾驶开放日的公开宣讲资料。