接上期。
每个圈儿内人都知道,Elon Musk看不上Lidar,不论是技术还是产品化程度。我们这里不会探讨Lidar的产品化问题,因为随着时间的推移,绝大多数的技术产品化都会最终达到市场要求,这个是有大量实践证明的事实。而且关于Lidar的产品化最终可以在达到车规级和普适的成本这两方面上,技术届已经做出了大量的努力。我们能看到的包括:华为宣布进军Lidar产品制造行业、大疆发布低价的车载Lidar产品,以及国内不少初创企业在先后涉及Lidar产品制造业从而大幅度拉低Lidar产品的售价……
这个不是问题。问题在于,Tesla强调的是无需Lidar,Autopilot自动驾驶系统一样可以工作得很好,那么何必费时费力费钱去重复获取周围景物的结构化数据呢?
因此,关于Lidar和Camera作为两个关键传感器,或者说两个技术流派之争,应该首先确认的是,并非Lidar和Camera两种传感器技术的水火不容,而是Camera流派认为没有Lidar也可正常工作,而Lidar的反驳是Camera+Lidar才是最终也是最合理的传感器组合解决方案。
从人类的仿生学角度出发,除了好莱坞的钢铁侠,没有人类需要两眼发射出激光来感知外部世界,而人眼所获取的视觉信号(Vision),足可以保证人类驾驶员操控汽车无虞。这是Camera流派(以Tesla和Mobileye为代表)的技术起点,只是历史上看,Autopilot在某些极端场合下数据获取和处理确实有问题。Tesla不止一次在完全没有减速动作的状态下,装上本应该发现的道路护栏和集装卡车。
这至少说明Camera流派所严重依赖的Vision/视觉信号,在现有的自动驾驶系统里,不能被完整地、高可靠性地得到解读。所以问题出在视觉信号背后的处理系统(神经网络)而非视觉信号本身,即传感器不会出问题(概率极低),而出问题的是背后的神经网络。在Tesla的几次典型的碰撞致死事故中,摄像头不可能看不见横在马路中间的集装箱卡车,但是过大的金属反射面直接致盲了毫米波雷达,而浅色的集装箱涂色又导致视觉信号的处理系统将理解成背景蓝天……(依据事故报告)
如果Tesla真要赢得传感器门派之争,证明Lidar是不必要的昂贵组件,则Tesla必须把技术重点放在后台的神经网络上,提高其辨识度、语义分辨和可靠性,同时还需要证明视觉信息同样具备良好的目标测速和测距能力,至少不逊于昂贵的Lidar点云数据。
而从反方向看,反对Tesla的单纯视觉包打天下的主机厂或者自动驾驶算法提供厂家,则应该将注意力放在Camera+Lidar的传感器融合技术上,通过对于Lidar感知的结构化数据的快速处理,大幅度降低视觉信号对于后台处理的压力,形成完美的组合感知方案。小编想,至少在对周边物体的位置、速度观测上,结构化的点云数据理论上会拥有更高的可靠性,或者相同可靠性下更高的精度。
总之,这是完美和有益的双赛道竞争,而非无休止且毫无意义的口诛笔伐。
所以从Tesla的角度出发,最需要证明的就是Depth from Vision技术(视觉信号中如何提取出结构化位置信息)是否有效和可靠。Tesla的论证,从视觉技术起源和推理思路开始,如下:
人类是天生的立体视觉动物,人类的视觉可以基本实现观测相对于自身的物体运动位置、速度和趋势,这是毫无问题的。人类发达的视觉神经和脑部视觉区域(大脑内的专门区域),弥补了人眼作为传感器的不足。经过高密度的“三角定位”计算,人类可以控制速度高达80-120kmph的车辆。虽然根据我们的实际生活经验,道路驾驶中,部分交通事故和视觉障碍/缺陷相关,比如,倒车的剐蹭、刹车不及的追尾等,但设想一个视觉健全且全神贯注驾驶车辆的司机,类似事故的发生概率必然会很低。因此对于双目视觉系统的技术评估,必须要综合考量其背后的的视觉神经和处理功能。
从动物的角度看,尤其是禽类,同样拥有立体视觉能力,哪怕它们的眼睛是完全在头部的两侧的,也是会在前方保留有重叠区域(当然不是像鱼那种完全不重叠的两侧视角)。因此动物们会通过不停地摆动头部,来扩大自己相对狭小“重叠视场”,从而准确地完成避敌和捕食动作。
有趣的是,在很多物种中,大脑容积是相对有限的。尽管如此,通过Motion/头部运动进行“重叠市场”的弥补,动物们依然可以完成精准的高速运动。
除了双目视觉系统以外,Tesla依旧需要考虑单目视觉系统中所面临的数据结构化问题(速度/位置),因为车身四周的视觉传感器,并不总都是双目摄像头(对于安装和成本要求都相对较高)。
Tesla通过对于后台神经算法的升级,可以满足在单目视觉信息感知的前提下,解读出足够保证性能的结构化数据。基本原理如上图,尽管单镜头获取的图片本身有可能不提供任何位置信息可参考,但是根据我们的认知(对等于神经网络的模型),可以判断图中的铁轨延伸的方向和大致的距离。后台的测距网络的工作基本原理,即是如此。
后期我们会继续分析Tesla的Autopilot自动驾驶算法中关于视觉信号结构化的具体方法。敬请期待!
车右智能
info@co-driver.ai
备注:
1 题图来自于互联网搜索;
2 插图123皆来自于特斯拉自动驾驶开放日的公开宣讲资料。