周末Elon Musk以online的方式远程参加了国内的一个经济发展峰会,并和国内的物理学家薛其坤联合主持了一个“下一个颠覆性创新”为主题的谈话环节。本来主题是“颠覆性创新”,这其实也是Elon Musk同志以及其所创立的一系列创新公司的核心竞争力,但很奇怪,Musk上来先讲的头几句开场白却完全没有和“颠覆性创新”相关,而是特别强调了“中美双方要相互信任,相互合作,因为双方的互补性很强,而互相信任是进一步合作的基础……”等等。小编一开始的反应是这难道是在呼应前一天的中美外交人员在阿拉斯加高层论坛上的不愉快吗?后来才反应过来,Elon Musk应该还没有那么高的政治敏感度,他应该指的是近期发生在中国,关于Tesla身上一系列的不信任和质疑事件:
1 海南Model 3的刹车视频给Tesla车辆的基础机械特性造成了很不好的负面影响,由于问题出现在中国的消费者权益日3月15日之前,所以有很多呼声建议3.15对于Tesla的产品质量问题做集中报道,大家都明白在中国产品被3.15晚会曝光意味着什么;
2 美国正在进行的FSD Betav8.2的测试当中,Elon Musk本人在Twitter上承认在FSD的推广测试中,有利用Cabin camera捕捉车内视觉信息,以判定驾驶员对于路况的关注程度;
3 不太寻常地,国内互联网开始大规模流传Tesla车辆视觉传感器搜集道路信息,并有从事“间谍”活动的嫌疑。照理说Tesla车辆在中国不是一天两天了,Autopilot对于视觉内容的分析,尤其是极端工况的信号处理原理相信大多数人都不是陌生的,或者是第一次所接触的,现在才开始讨论Tesla的涉密问题,有点反常;
4 Youtube上账号为“AI Addict”的用户接连制作并上传了FSD Beta8.2在湾区三个城市的测试视频,因为集中展示了大多数在Dense Urban密集城区条件下的FSD Beta8.2的出错表现。由于这些视频也在国内比较知名的知乎或者公众号上进行了转发和评论,所以造成了比较集中的对于Tesla自动驾驶能力的怀疑。
……
也许还有其他小编不知道的因素吧?但以上这四点比较集中爆发于近一段时间,我想这大概率是Elon Musk在开场白中做澄清的根本原因(或者之一)吧。关于所有这些原因,其具体的内容我们就不展开了,因为有的是在之前的公众号文章中有涉及了,有的是话题太大小编也接不来,所以咱们今天就花点篇幅讨论一下Youtube上的“AI Addict”账号对于FSD Beta的问题集中呈现,到底说明了什么?
AI Addict账号所提供的FSD Beta测试视频发生地都在加州湾区,The Bay Area,美国西海岸加利福尼亚州北部的一个大都会区域,主要城市包括旧金山半岛上的旧金山San Francisco、东部的奥克兰Oakland和南部的圣何塞San Jose。小编虽然不是地理老师,但是大概需要传达给读者的信息是,这部分区域地形上多山,城市群落在山地和大海之间的夹缝空间内构造,所以城市路况在地理上起伏比较大,而且这些城市的发展历史在北美都算是比较早的,所以市内密集区域的道路结构比较复杂,不像美国中西部和南部广阔平原上的横平竖直,这都是客观存在。所以在湾区城市(特别是类似唐人街区域)测试FSD Beta,其所面临的挑战也就特别大。
大概四个月前,小编之前曾经写过一篇公众号也是关于FSD Beta的早期版本在旧金山唐人街的测试驾驶表现评估——《别说China了,China town都搞不定》,是在看过那么多在开阔地带的高速、城市道路环境下Autopilot进入FSD阶段的惊艳表现之后的某种失望。但实际上在每个人类驾驶员被迫干预退出FSD状态的场景下,似乎又都能找到技术解释和某种技术上的理解。Tesla第一不依赖昂贵的Lidar器件,第二不采集和维护“高精度地图“,第三AI技术也不可能一蹴而就达到真正的人类水准…… 所以我们为什么会失望?我们到底在期望什么?还是我们就是眼巴巴地等着各种机会去打Elon Musk的脸?
……没有意义。
所以不论对于Tesla公司或者Musk个人的支持者还是反对者来说,公平地把FSD Beta作为纯视觉自动驾驶系统的技术代表,摒弃或者左或者右的情绪干扰,才有可能真正从不断曝光的各种实地测试细节中,找到对我们最有用的信息。这也是小编希望也会尽力达到的技术评估准则。对于“AI Addict”这个账号对于FSD Beta v8.2版本在湾区三地的实际测试,小编仔细看了全部细节,客观上讲AI Addict不够客观(懂我意思吗?不是说他过分主观,而是不是那么那么的客观),他和他的伙伴进行的测试,有点类似于对于测试中所有负面要素的汇总,是经过剪辑的。尽管考虑到湾区复杂的道路状况和各种极限工况频繁出现,FSD Beta的负面表现也不算太奇怪,但集中在篇幅有限的视频内一起呈现,就会给读者传达一个对于FSD Beta来说非常不公平的体验……小编也注意到了,国内的诸多技术类媒体在转录相关内容并提供新闻稿件的时候,口径就是非常负面的(这并不是100%的事实)。
小编在本文和后续(如果有足够多的技术内容)文章中,也会集中分析FSD Beta的测试失败case,但也会给出自己的判断,试图去解释为什么会出现这样那样的失败现象,希望读者不要给小编贴标签,也不要给自己的思维贴标签,认真看认真批判,认真学习认真进步,这才是我们的初衷。
SanFrancisco /20210310
减速障的处理(Speed Bump):
不记得是哪个品牌了,好像是一个法国品牌的新车,去年在新车上市有一个宣传卖点是智能悬挂系统可以和车载的Camera(前向)系统对接,利用Camera识别前方路面路况,并据此来调节悬挂系统的软硬度(好像叫魔毯)以保证乘客的乘坐体验。后来Elon Musk在Twitter上通过互动也答应过将在Autopilot的新版本中实现对于路面减速障(Speed Bump)的观察和识别,并据此调整车速,同样确保乘客的乘坐体验。在AI Addict提供的San Francisco的测试视频中,这个功能已经实现了…….
【AI addict-2】
视频中显示,当车辆以时速25-30mileph穿越城市街区道路时,如果侦测到前方路面有减速障的标识,会积极干预车速,降到15mph的水平。注意,美国的路障标识有一种形态是如下形态的,因为路障本身是由沥青构成的,所以通过道路表面的白色标识来呈现,所以在观看视频的时候,可以观察到如下路障符号:
对于Model 3和Y的悬挂系统是否是主动可调的小编还不清楚,但是Model S有一款代号叫作Raven的版本,在前后轴上都采用了空气悬挂,因此不难理解对于Tesla来说,根据Camera视觉系统提供的路面信息,进行悬挂的参数可调(阻尼系数),是不难做到的。
环形路口(Roundabout):
环形路口在大概四五个月前FSD Beta刚刚投放测试环境的时候,是最早一批测试者最热衷的测试环境。一个是因为环形路口确实复杂,尤其是美国的环形路口,千奇百怪的;另一个也是因为环形路口在美国实在太多太普遍了。给小编一个感觉,美国的道路系统,如果不考虑封闭和半封闭的高速公路,城区道路系统中最大量存在的道路结构就是环形路口和没有红绿灯的十字、丁字路口(Stop停止标识控制)。从某种角度讲,地广人稀车流量在很多区域内其实并不高,而且人员平均素质相对较高,导致美国常规道路系统里存在大量类似结构,现代化角度不够,但是够用了。
【AI addict-3】
视频中呈现了完整的过程:首先车辆接近环形路口,FSD Beta的车载地图UI呈现出完整的环形路口拓扑(或者来自于Google map,或者来自于Tesla自己建立的常规地图信息),其次车辆识别到红色的Stop标识,完成标准的刹停操作,并开始执行Creep爬行操作,低速进入环形路口结构……但当有自行车违规穿越环形路口的时候,驾驶员干预并退出FSD驾驶状态,刹停车辆。
从小编的眼光看在这个场景下,车速本身极慢,而且并不是没有侦测到自行车目标,驾驶员在这种工况下选择退出FSD自动驾驶状态有些过于敏感了,并不能代表FSD Beta无法处理这种交通状况。与此同时,FSD所表现出来的Creep的进入路口状态是不错的,是每一个自动驾驶厂家都在努力实现的状态,更加符合人类驾驶的习惯,对于道路的利用效率也最高。在MobileyeCES2021的演讲中,Shashua教授也特别提到了自动驾驶系统在路口应该具备必要的Creep状态。
弯道爬坡(Curve climbing)
如我们前面所讲到的,湾区多山,城市内部的部分路面起伏幅度较大,由此可能会产生平时我们所忽略的现象。参考如下视频信息:
【AI addict-1】
在视频中我们可以看到,在明显的坡道(上坡)+弯道环境下,处于FSD Beta自动驾驶状态的车辆发生比较明显的车道内偏移,我们看到的现象是上坡+左转弯道条件下的右偏移,而且幅度不算太小。参照下图红色箭头所指位置,从位于车身中部的摄像头视角看,最接近右侧车道线的时刻,车道线已经接近车头中部,意味着车辆实体的右侧已经接近越线了。在这个条件下,因为距离右侧车辆已经非常靠近了,人类驾驶员选择干预,退出FSD自动驾驶状态。
这是个很奇怪的现象,之前从未关注到。从纯理论的角度讲,车辆的轨迹规划和控制是一个中距离规划+短距离迭代的方法。“中距离规划”是为了保障路径规划有时间上的连续性(或者说延展性),不至于开到位置或者速度、加速度状态的死胡同里出不来;而“短距离迭代”则是在一个合理的范围内根据实时识别结果,快速修正车辆自身的速度、加速度和位置。二者配合可以保障车辆驾乘的安全性和舒适性,这也是一般车辆轨迹规划的基本原理。就凭这个原理,小编感觉此状态下,二车虽然间距很近了,但是实际上FSD应该还在逐步修正,而且Tesla车辆也还有超声波雷达做近距离障碍物识别和规避,应该不至于发生实际剐蹭。
但这个现象毕竟还是发生了,值得探讨。根据百度的一篇关于车道线识别方法的论文,百度讨论并提供了Gen-LaneNet(一种分两阶段实现的3D车道线检测算法)模型,
论文地址:https://arxiv.org/pdf/2003.10656.pdf;
代码地址:
https://github.com/yuliangguo/Pytorch_Generalized_3D_Lane_Detection;
————————————————
根据论文的介绍,【小编注:以下蓝色字体内容为引用CSDN博主AI算法训练营的文章内容,版权文章段落后部做了声明,请关注作者】大多数基于图像的车道线检测方法将车道线检测作为一个2D任务。一个典型的2D车道线检测流程由三个部分组成:
1语义分割组件,为图像中的每个像素分配一个类标签,以指示其是否属于车道;
2空间变换组件,将图像分割输出投射到一个平坦的地面平面上;
3第三部分是提取车道线,通常涉及车道线模型的拟合,具有很强的假设性,例如,拟合二次曲线。
然而,将3D的车道线检测降维成2D的检测任务的假设可能会导致意想不到的问题,例如,当自动驾驶车辆遇到丘陵道路时,二维的车道线检测算法会提供不正确的三维道路感知。
为了克服与平面道路假设相关的缺点,最新的方法已经开始关注复杂的3D车道线结构的感知。具体来说,最新的3D-LaneNet【小编注:注意这里还不是百度的Gen-LaneNet模型方法,而是另外一种通用的主流3D车道线识别模型。】已经引入了一个端到端框架,将图像编码、图像视图和俯视图之间的空间变换、三维曲线提取等三大任务统一在一个网络中。但是,3D-LaneNet在并不恰当的坐标系里使用anchor进行预测;同时,把image segmentation和geometryencoding整合到一个统一的端到端架构里,使得geometry encoding对图像分割结果比较敏感,需要大量3D标注数据才能把网络训练好。3D-LaneNet模型框架如下图所示:
而对于百度提出的Gen-LaneNet,是一种从单个图像检测3D车道线的通用且可扩展的方法。通过在新的坐标系中引入了几何引导的anchor表示车道线新方法,并应用了特定的几何变换以从网络输出直接计算真实的3D车道点。将anchor点表示与基础俯视图特征对齐对于使方法可推广到未观察到的场景至关重要。此外,提出了一种可扩展的两阶段框架,允许对图像分割子网络和几何编码子网络进行独立学习,从而大大减少了学习所需的3D标签数量。得益于价格更实惠的2D数据,当昂贵的3D标签仅限于某些视觉变化时,两阶段框架的性能要优于端到端学习框架。在实验环节进行了广泛的消融研究,以证实Gen-LaneNet在AP和F评分中明显优于现有技术水平,在某些测试集中提升高达13%。
从以上两个网络结构中我们可以看到明显的端到端3D-LaneNet和两阶段模型Gen-LaneNet之间的差别。百度提供的两阶段模型中,明确了“Segmentationbackbone”和“3D-GeoNet”两阶段模型的独立存在,按照百度的说法,这种分离结构,既容易获取真实道路场景下的训练数据,又容易达到更好的3D车道线预测精度,如下图所示:
注意图中左侧部分展示了在Uphill(上坡场景)下,传统的3D-LaneNet和百度的Gen-LaneNet网络对车道线的3D预测结果对比。其中3D坐标体系中显示的最终预测结果,蓝色为车道线真值,而红色为网络的预测值。可以看到3D-LaneNet的预测结果曲度明显较小,无法在上坡和转弯的车道场景下和真实的车道线重合,且偏差较大;对比之下Gen-LaneNet的车道线预测值则与真值基本贴合,特别是在近处区域,基本完全重合。具体的偏离尺度和车道线径向预测如果从物理角度理解这个预测值和真值的偏离,则如下图:
关键点在于,自动驾驶车辆的路径规划(包括车道线跟踪)是在Top-Down俯视图上进行的,如上图中的视角(b)。如果不考虑地形起伏(在湾区地区是一个相对普遍的地貌),那么各种2D或者3D的车道线预测方法,都会忽略(2D方法)车道线的高度,或者预测(3D方法)车道线的高度,因此对于车道线在俯视图上预测的精准度,和对于车道线实际高度信息(z坐标值)的预测准确度,高度值预测越精准,红色预测车道线就能接近贴合车道线真值(蓝色)。
当然小编只是推测,如果FSD Beta的车道线预测方法忽略或者对于车道线3D信息中的高度信息预测有误,就极有可能出现上述视频中的问题,在爬坡且同时转弯的路况下,发生对于车道线的3D信息预测有误,从而造成莫名其妙的偏离车道中心线的驾驶路线。否则很难解释,为啥FSD出现这种错误。当然还有可能是其他原因,在测试视频中,AI Addict表示他认为是FSD导致车辆进入极端工况的速度偏高,所以导致车辆在车道线曲率最大的地方不太容易在控制上收回来
————————————————
版权声明:以上蓝色字体内容来自CSDN博主「AI算法修炼营」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/sinat_17456165/article/details/107650416
爬坡左转弯(Uphill andturn left)
【AI addict-4】
这段视频中所呈现的左转弯过程,发生在比较明显的上坡过程中。我们可以看到,车头在转向左侧的时候,甚至一开始前向摄像头无法捕捉到近处的车道入口,所以发生左转无法进入按照规划中的最左侧车道也就不奇怪了。我们之前一直有讨论Tesla到底是否使用了高精地图来增加对于路口复杂路况(特别是道路结构)的提前预知,先不管有没有,即便有,实际上类似路况也很难处理。除非完全依赖HDmap+HDposition能力,完全不依赖视觉上不可见的车道线结构。更合理的推测是Tesla的自动驾驶系统后台实际上是有地图结构存在的,但并非传统意义上的高精地图,而更类似于Mobileye所描述的那种描述道路结构、红绿灯结构和其它关键语义信息的自动驾驶专用地图。这还是后话了,以后我们会继续讨论这个专题。
以上是在San Francisco的一些关键点的简要分析,后续如果我们可以找到在湾区其他城区驾驶的关键点,会继续提供分析内容。在小编看来,FSD Beta到了v8.2阶段,依然没能在复杂的城区环境中展示出特别的说服力,但确实是展现了持续进步的态势。按照Elon Musk的说法,下一个主要版本(可能是v9.0)会比当前的FSD好“一千倍”,那么好吧,我们拭目以待。
车右智能
一个一直用心仿真的自动驾驶技术信徒
info@co-driver.ai
备注:
1 插图1来自于Google Map的截图(卫星视图);
2 插图2来自于维基百科关于词条“减速带”的描述,URL:https://en.wikipedia.org/wiki/Speed_bump;
3 插图3来自于Youtube账号“AI Addict”所拍摄的FSD Beta v8.2测试视频截图,URL:https://www.youtube.com/watch?v=NfikK9aWrlE;
4 插图4/5/6/7来自于CSDN文章《百度Apollo提出两阶段的3D车道线检测算法》中的截图,水印显示来自于知乎账户“黄浴”,URL:https://blog.csdn.net/sinat_17456165/article/details/107650416;