别被标题误导了,China town的路况在美国应该就是最复杂的了,而且没有之一。所以小编不是在嘲笑FSD Beta应对复杂路况的能力,而是希望,根据FSD对这个路况适应能力的分析,来看看FSD Beta和纯视觉识别系统在目前阶段的不足。其实还很遗憾的是,提供这个资料的Tesla车主没有沿着这条穿越整个China Town的路段反复多开几次,可以考虑不同时段和不同气象条件下,看看在这个过程中FSD Beta的实际操控是否有真正的提高。【不是小编臆测,确实已经有不少车主测出来在相同路况的场景下,反复的行驶测试,可以实现FSD的“Self-Learning”,并提高通过的准确率和可靠性,不知Autopilot那个大的学习闭环是否真的在起作用。】
测试地点所在的中国城,是San Francisco的Chinatown,道路狭窄,车辆和行人相对于美国的一般路况,是大大密集和随机的(你懂的)。所以从测试车辆的前向看出去,这个城市路况和道路条件,甚至给人的第一感觉,都是和国内比较类似的(咳咳,可能还比国内再好那么一点点)。同时因为是晚高峰,所以道路上的车辆可能还高于日均水平,很明显这位车主就是冲着这个级别的交通场景去的。
话不多说,我们上图如下:
上图为单向四车道(其中有一条公交车辆/出租车辆专用车道,右侧)。前向视野中的左侧出现Road Work标识,并有改道发光标志,但是需要注意的是这里没有部署临时道路施工场景下的反光锥,而是一种白色的隔离桩(黄色箭头所指)。但显然Tesla的Autopilot之前搜集/训练过类似工程隔离装置,因此在车内的驾驶舱显示面板上,可以很清楚看到FSD Beta可以准确识别类似设备并作出规避。
另外可以从驾驶舱显示面板上,可以通过颜色来区分道路上的运动目标(包括车辆和行人)属性。按照小编的统计,大致的颜色分类原则是:
1 同向、同车道的车辆目标,如果被判定为具备跟车条件的,则为绿色(上图中正前方即是这种目标类型);
2 同向、但不同车道的车辆目标,蓝色;
3 对向、但处于车道之内的车辆,黄色;
4 路边泊车(特别是垂直于道路方向的泊车)和其它判别不清楚、特别是不在车道线内的车辆目标,红色;
除此之外还有紫色和其他过渡色,基本不了解其规律。大致可以描述为颜色越深威胁越大,而判别威胁的原则主要还是依据道路标识(车道线是核心)。符合道路标识规范的,例如行驶在车道线内的目标车辆,即便是对向紧邻车道内的车辆,也仅是黄色而非红色;但如果不在车道线内,比如路边的静止泊车,因为Autopilot是无法在瞬间判别车辆意图的,所以是红色。当然,这个不同的颜色标识应该不是为人类驾驶员提供的,小编推测,应该是Autopilot自动驾驶系统中的“识别模块”为“预测模块”提供不同级别的输入……颜色越深,对于这种目标的预测深度和频率就应该格外照顾。
毕竟“预测”是“决策”的前提。
上图中我们再次给出一个车辆识别上的颜色差异。同样是停在路边上的车辆,白色皮卡是停在路边专用泊车位上的(地面有旧金山的泊车专用标识),因此根据我们上述的推测分类原则,被FSD Beta识别为红色(框体);而在最左侧车道上处于临时停车状态的FedEx的白色厢式货车则被识别为蓝色(框体)。图中可以看到FedEx厢式货车一个是在车道上(而非泊车位上),另一个是车尾的刹车灯处于点亮状态,就凭这两个状态即可以基本判定它是一辆基本状态可以预测的运动目标。小编相信不管Tesla的Autopilot用了何种视觉识别/分类的AI算法,最终的原则要体现的就是运动目标的风险级别和预测难易级别。考虑到FSD Beta是一个中间状态版本,显然车内的操控面板UI中的显示信息应该是未做什么裁剪和适配的,所以我们推测的可靠性比较高。
好,这段路程中的第一个FSD Beta被司机接管/Disengagement的状况来了,如下:
当主车穿越一个十字路口时,因为按照导航规划的线路,图中白色箭头所示,车辆需要在下一个十字路口左转(进入Chinatown内街),因此FSD Beta在跨越最后一个十字路口的当口,选择了向左变道(根据常规这是人类司机的惯常做法,因为最左侧车道通常都是最安全的左转车道)。由于路口是没有车道线的,这种状态下就是最考验FSD的视觉识别系统的时候,结果如上图,FSD Beta错误将最左侧一条明显的路边泊车车道(路面有T字形标识)当成了行车道,从而进行了危险的向左机动,迫使驾驶员干预而退出自动驾驶状态。
上图即是主车穿越路口的俯视图。十字路口通常是车道线缺失的,单纯的视觉系统,且同时没有高精地图支撑,就需要车辆需要可以在极短时间内完成对于车道状态的识别。上图中FSD Beta所犯的错误很奇怪,因为路边停车/包括路边停车的地面标识,在美国的城区是一个比较常见的道路场景和标识,不知道为什么在这个路口会识别出现错误(这种错误是致命错误)。当然,此时的人类司机接管会触发FSD Beta将这个接管场景的前后数据信息都上报给Tesla的数据中心,相信这个错误可以得到很好的修成和重新训练。
在转入Chinatown的内城街区之后,道路骤然在视觉上变得更加狭窄和局促,道路上的泊车行为和位置也是千奇百怪,大量不合理停车现象存在。上图显示的是一个单向两车道,右侧是规范的泊车道,但左侧出现非法的停车行为。FSD Beta在这种条件下,已经可以非常灵活自然地做右侧变道并规避。上图中的黄色箭头可以看到路径规划的趋势,已经是折弯转向右侧车道了。
读者可以注意一下,这个Tesla主车主动发起的规避变道并超越的动作,看似很平常的自主变道能力是个非常基础的能力,但也是非常强大的。Tesla自动驾驶系统视觉识别负责人Karpathy曾经有过这样的表述:在Tesla的Autopilot系统实现中,还是尽可能依赖基于神经网络技术的Code2.0方法来完成“识别”功能和其它(没有具体说明)模块的实现,如果我们看具体的案例,我们可以看到,关于对于各种条件下的Parked cars的识别,就是几乎完整依赖code2.0来实现的:
上图左侧代表了传统的Parked cars的识别和判定标准(Code1.0),右侧则是Karpathy所强调的Code2.0实现方式。这其间是有明显的差别的。在传统方法的识别+判别方法中,对于成排的泊车识别需要动用复杂的计算机视觉识别技术和较为复杂的判断逻辑,不是一个很简单的问题。在这个过程中,
第一步,计算机的视觉识别技术,不管是否是基于单纯的计算机图形处理能力还是复用了视觉神经网络DNN技术,要完成图像内容分类/Imagine Classification、高价值目标圈定/Objectives localization、语义分类/Semantic Segmentation和目标分类/Instance segmentation等多种任务;
第二步,但即便能够完成准确实时的Instance segmentation任务,此时自动驾驶系统也只是完成了对于实例/Instance的识别,比如,了解了前方目标是车辆、有几辆、位置如何等等信息,还并不知道对象是否是Parked状态下的车辆。这就需要后续的判别。后续的判别可以是C++主导的Code1.0实现方式,通过抽象并复制复杂的人类判别经验来推断目标的性质,比如:在3秒钟内,识别对象的20个像素未发生位移、AND,具体目标位置在哪个车道还是停车位(划线)内、AND,…..可能还有其它判断准则;这种传统的Code1.0方法,总体来说是脆弱的,因为人类经验不可能穷尽所有场景,而场景是千变万化的,而只能是个逼近,逼近得越好,代表识别准确率的9的个数就越高。如果我们认同这一点,那么我们就完全可以采用Code2.0方案,利用庞大的Tesla Fleet去搜集比人类经验更加可以逼近真实场景的数据,和Code1.0的方案比,其实就是谁能更加逼近终极现实的问题。
所以我们看上图右侧的Code2.0的方案,训练好的模型/神经网络,只要给定输入,他自然会有输出,输出认定目标性质,即可。小编觉得这种蛮力解决方案,也真的就只有Tesla具备落地能力。
所以我们再回到旧金山的狭窄逼仄的街道,Tesla车辆在只有摄像头数据的前提下,可以快速穿梭在街道上,并灵活规避各种障碍物和临停车辆,是个了不起的能力。我们可以这样做一个假设,如果旧金山中国城的上图中左侧车道上的车辆虽然是静止状态,但其实目标车辆并不是处于Parked car状态的车辆(司机离开),而仅仅是因为交通状况(红绿灯或者意外事故)而导致的临停/排队停,那么如果主车贸然变更右侧车道且超越,就有可能无法在变回来左侧车道,从而失去正确通过前方十字路口的机会(比如左侧车道为左转车道)…..类似的假设还可能是很多,如果根据人类经验的决策系统,那么识别系统对于停车状态目标状态的判别就特别重要,它会直接影响到最终的自动驾驶决策输出是否符合乘坐人意愿。
小编当然无法判断这种Code2.0的方案已经到到什么样的可靠性,可能这次对了,下次未见得……但FSD Beta所表现出来的完成度,注意“完成度”,还是非常让人期待的。因为不管你是否愿意承认,其实你知我知,FSD Beta在这个完成度下,剩下的工作就成了不断“喂养数据”去逼近更好的可靠性了。
这篇文章的篇幅有点多了,其实还没讲完,FSD Beta在China twon的表现还是有些问题的,小编争取周末把这篇文章的下半部分写完。
敬请关注。
车右智能
一个一直用心仿真的自动驾驶技术信徒
info@co-driver.ai
备注:
1 题图来自互联网搜索;
2 文中插图1/2/3/5来自于Youtube账号“Whole Mars Catalog”的视频评测截图;
3 文中插图4为Google map所提供的San Francisco China Town的局部地图信息截图;
4 文中插图6为Andrew Karpathy在CVPR2020上的演讲视频截图。
相关专题:
1希望不只是社交媒体的狂欢 ——特斯拉FSD Beta版本的初级分析;
2 建立在纯视觉感知体系上的自动驾驶系统会有什么问题?——特斯拉FSD Beta版本的初级分析;
3FSD Beta对于可行驶区域的感知和绘制能力一流 ——特斯拉FSD Beta版本的初级分析(3);