一套强大的传感器套件+神经网络的计算“大脑”,是保证自动驾驶能够在感知车辆周围环境并做出安全、合理决策的关键。
为了建立强健的神经网络,我们需要大量多样的训练数据。同时,通过真实路测和仿真测试来训练机器学习模型,并不断改进自动驾驶技术。
过去几年,在“人脸识别”、“自动驾驶”、“语音识别”等应用领域崛起的背后,核心依然是要求精准的标注数据。
有数据显示,中国有10万名全职数据标注员和100万名兼职数据标注员,他们用人工标注为人工智能数据训练模型提供最重要的“燃料”。
一些所谓的AI公司,一年在数据采集、标注外包业务上都要支付数百万甚至是数千万的费用。但这种依靠人工的数据标注,依然无法达到100%的精确度。
此外,传统采集及分析数据的过程,大多是通过车队采集、给样本数据贴标签的方式进行——这种方式既费时又费钱。让任务变得更加困难的是,某些情况不太可能经常发生。
为了充分利用边缘场景,并进一步改善自动驾驶系统的感知,一直以来Waymo与来自谷歌大脑的团队合作,扩展自动数据增强研究,并在数据集上进行测试。
一、增加没有新数据的数据集
数据的不断扩充使得自动驾驶训练可以增加数据量和多样性,而不需要额外的收集或标记成本。
扩充数据背后的原理很简单:假设你有一张狗的照片。通过使用各种图像增强操作,如旋转、剪切、镜像、颜色变换等,可以对照片进行变形和变换,但这并不能改变这是一张狗的图像的事实。
这些简单的转换将一张狗的图像转换成许多张,尽管确定使用哪些增强操作组合并应用它们需要大量的手工工程。
利用AutoAugment工具,谷歌大脑设计了一个由扩充策略组成的新搜索空间——扩充操作的组合。他们能够通过强化学习自动探索使用哪些增强策略。
通过从数据本身寻找最优的图像转换策略,谷歌大脑能够改进各种学术数据集上的图像识别任务,并将这些思想扩展到COCO数据集上的对象定位问题。
他们还发现了一种方法,可以大大降低搜索有效数据扩展策略的计算成本,使其成为一种有效且廉价的工具,可以使用它来收集超过2000万英里的公共道路上的自动驾驶数据集。
二、应用到激光雷达点云
在谷歌大脑团队的协作下,Waymo正在扩展这项研究,以自动发现最佳数据增强策略,从而改进现有Waymo Drive系统的感知能力。
在2019年,Waymo开始将自动数据增强技术从RandAugment应用到基于Waymo图像的分类和检测任务中。他们在几个分类器和探测器上取得了显著的进步,包括那些有助于对外来物体(如建筑物和动物)进行分类的分类器。
在基于图像的数据取得成功后,Waymo探讨了自动数据增强策略是否也可以改善激光雷达的3D检测任务。
激光雷达是Waymo的核心传感器之一。它不仅能绘制出300米外的3D环境,还为自动驾驶技术提供了重要的背景数据,告诉系统物体在哪里,它们可能去哪里。
由于Waymo定制设计的激光雷达能够提供详细的三维信息,基于激光雷达的模型是系统的关键,并确保准确地检测和跟踪所有在道路上的物体。
为了提高激光雷达点云检测模型的质量和鲁棒性,通常采用数据增强的方法,但是现有的增强策略由于手工设计而受到限制。由于没有现成的点云扩展解决方案,Waymo决定自主构建一个。
与图像不同,扩大激光雷达点云是一个更复杂的整体维度。因此,用于图像分类和目标检测的自动增强技术的搜索空间不能直接用于点云。
由于三维数据中几何信息的性质,点云的变换通常有大量的参数,包括几何距离、运算强度、采样概率等,而某些图像增强技术,如颜色变换,根本不适用于单色的三维数据。
因此,Waymo创建了一个新的点云扩展搜索空间,以发现专门为点云数据集设计的策略。一种新的激光雷达点云增强策略,创建的搜索空间包括八个增强操作。
每个增强操作都与一个概率和特定的参数相关联。例如,GroundTruthAugmentor有参数表示采样车辆、行人、骑自行车的概率,而GlobalTranslateNoise操作有参数表示平移操作在x、y和z坐标上的畸变大小。
为了自动地为激光雷达点云寻找良好的增强策略,Waymo创建了一种新的自动数据增强算法——基于渐进种群的增强(PPBA)。
PPBA建立在谷歌之前的基于种群的训练(PBT)工作的基础上,Waymo用进化计算训练神经网络,使用的原理类似于达尔文的自然进化论。
PPBA通过缩小每次种群迭代的搜索空间,采用在过去迭代中发现的最佳参数,有效地优化扩展策略。
通过在Waymo的开放数据集中自动增加激光雷达点云的数据,PPBA实现了跨越检测架构的显著性能改进。
开放数据集是迄今为止发布的最大和最多样化的多传感器自动驾驶数据集之一。Waymo的实验还表明,与随机搜索或PBA基线相比,PPBA在寻找数据扩充策略方面更快、更有效。
此外,由于依赖标记激光雷达数据来训练神经网络,PPBA还可以节省标记成本,从而提高数据处理效率,因为一个标记的样本可以变得很多。
Waymo开放数据集上的3D检测实验表明,使用PPBA比不增加训练网络的数据效率高10倍。
三、从实现功能到提升效率
实验表明,将自动数据增强技术应用于激光雷达数据,可以在不增加数据采集和标记的情况下显著提高三维目标检测效果。
数据效率的提高尤其重要,因为这意味着Waymo可以加快训练过程,改善第五代Waymo Drive系统的感知能力。
在这方面,特斯拉也有非常类似的策略来加速场景数据的积累。不过,和Waymo不同的是,特斯拉是基于庞大真实数据加快自动标注效率,Waymo则是基于有限数据的多元化标签效率,从降低对路测收集数据的压力。
特斯拉的创新,是一个名为3D自动标签工具,这被其视为全自动驾驶功能开发的重要组成部分。埃隆·马斯克最近证实,正在完成Autopilot核心基础代码和3D标注的工作,基于其超过22亿英里的真实驾驶数据。
“在标识方面,所有8个摄像头同时使用视频进行标识,比原有系统提升三个数量级的效率。“特斯拉的人工智能主管安德烈•卡帕西(Andrej Karpathy)表示,标注数据是一项成本极高的核心技术。
此前,大多数人工智能及自动驾驶公司采用人工处理方式,但特斯拉一直在尝试不同的机制来完善自动化标注平台。
比如,在预测其他车辆切入本车道场景,特斯拉利用其车队获取此类可能造成事故的数据。然后,这些信息被自动注释并用于训练神经网络,而神经网络又从可识别的模式中自我学习。
当涉及到对象检测时,根据Karpathy的说法,情况也是如此。特斯拉从其车队获取数据,以了解更多关于不同物体和道路上的异常情况。
有了自动3D标注技术,神经网络可以更有效地处理信息,甚至可以学习在路上遇到的最罕见的情况,通常被称为边缘案例。
在过去一年左右的时间里,特斯拉通过3D标注技术的改进,极大地改善了配备了FSD硬件的车辆驾驶视觉化,包括识别交通灯、垃圾桶和道路标记等。
结语:
事实上,不只是特斯拉这么干。
通用汽车旗下自动驾驶汽车子公司Cruise的联合创始人、首席技术官凯尔•沃格特(Kyle Vogt)也曾公开表态,“我们今天要做的,是更多的自动标记。驾驶的有趣之处在于,你可以从一辆车的驾驶方式中推断出很多东西。如果它没有犯任何错误,那么你可以假设很多事情都是正确的。“
在他看来,如果今天自称为人工智能的公司,却依赖于人工给数据贴上标签,那肯定是要被淘汰的。而从去年开始,特斯拉就一直公开强调自动标签技术。
到去年年底,特斯拉将拥有大约70万辆配备环绕摄像头和特斯拉第二代或第三代计算单元的汽车。这些汽车平均每月行驶1000多英里。也就是说,每个月要累积行驶7亿英里。
相比之下,Waymo的车队只有600多辆,却已经是全球最大的自动驾驶测试车队。即使加上加州所有注册的1400多辆自动驾驶车,以70英里每小时全天候行驶,每个月也只能行驶7000万英里。
这就解释了为什么特斯拉走的是对现实数据的自动标注路线,而Waymo寻求的是基于现有数据增加更多数据的路线。不过,两者解决都是传统人工智能大量耗费的人力成本。
显然,在现有AI+自动驾驶领域,仍然存在弱智能和强智能的区分。但是,如果仅从Demo演示来看,你甚至分不出来谁的技术更好。不过,一旦涉及到商业化落地,压缩每个环节的成本就会变的至关重要。