fg电子游艺

DeepMind助力Waymo!提升自动驾驶AI准确率,还能加快模型训练

fg电子 ?

在自动驾驶领域,谷歌Waymo无疑是标杆一样的存在。

Waymo的工程师解释说,AI算法通过重复测试实现自我改进,这是一种基于反馈的不断尝试和调整。因此,模型的性能在很大程度上取决于培训计划。

寻找最佳解决方案通常取决于研究人员和工程师的丰富经验。他们将在训练中仔细选择AI模型,消除性能最差的模型并释放资源,并从一开始就训练新算法。

手动调整自然可以快速产生更好的结果,但这是一个太多的人力。

因此,DeepMind设计了一种自动优化超参数的方法基于进化竞争(PopulationBasedTraining)

基于进化竞争

基于进化竞争,称为PBT,它结合了手动调整和随机搜索的优点。该方法从随机变量(超参数)开始,并训练多个机器学习模型。

模型定期进行评估,并以渐进的方式进行竞争,表现不佳的模型被“后代”(变量的表现较好的成员的副本)取代。

PBT不需要从头开始重新训练,因为每个后代都继承其父网络的状态,并在整个训练过程中主动更新超参数。

换句话说,PBT可以使用大部分资源来训练良好的超参数值。

然而,PBT也并不完美。它倾向于优化当前结果而不考虑长期影响,这不利于后期AI模型。

DeepMind的研究人员通过训练更多组并创建名为利基(niches)的子组来考虑这一点,这些子组的算法只允许它们在内部竞争。最后,该小组通过提供更多独特的模型来鼓励多样性,以在竞争中获得优势。

效果如何

DeepMind和Waymo将PBT应用于行人,自行车和摩托车驾驶员识别任务,以研究是否可以改进召回率(确定的障碍物在场景障碍物总数上的比例)精度(检测到的障碍物的一部分实际上是障碍而不是误报)

最后,他们试图训练一个AI模型。保持召回率超过99%,同时减少误报。

Waymo报告称,这些实验为评估真实世界模型的稳健性提供了“现实”框架,从而为PBT算法选择竞争提供了基础。

实验表明,进化竞争需要快速评估的支持,并且每15分钟评估一次PBT模型。数据中心内数百台分布式机器的并行化使这种需求成为可能。

Waymo还表示,PBT算法可以实现更高的准确率,并将误报率降低24%,同时保持高召回率。

此外,PBT所需的培训时间和计算资源仅为原始培训时间的一半。根据Waymo的说法,PBT已被直接纳入Waymo的技术基础设施。