根据盖乌斯·汽车公司的报道,俄罗斯科技企业yandex与牛津大学和剑桥大学合作,举办了neurips会议( Conference And WorkShoponneuralinformation Processing Systems, 神经新闻解决方案系统大会)上,为了应对机器学习( ml )中的分散迁移问题,发表了使用世界最大的自动驾驶车( av )数据集的“shifts challenge”。

“Yandex推出分布转移挑战加速ML研究 所得成果或可用于AV行业”

(图片来源: berza项目https://t.me/berzaru )

该数据集是在美国、以色列和俄罗斯的各种天气条件下进行自动驾驶技术测试收集的,包括600,000个场景,相当于1,600多个小时的驾驶时间。

yandex指出,克服分散型转移是训练ml模型的重要方面,也是构建在所有环境中稳定工作的模型的重要方面。 这也是在城市街道上行驶的自动驾驶车等“现实生活环境”中运行模型的前提条件。 因此,yandex提出这样的挑战是加快ml行业研究的重要工具。

“Yandex推出分布转移挑战加速ML研究 所得成果或可用于AV行业”

“shifts challenge”有av轨迹预测、机器翻译、天气预报三个竞赛项目。 除了600,000个场景的av数据集外,其他两个项目的参与者还可以访问来自yandex的其他优秀数据集。 邀请av项目的参与者在特定类型的场景中训练运动预测模型,并在不同位置的不同条件下进行测试以进一步改进。 之后,挑战委员会判断各模型。

“Yandex推出分布转移挑战加速ML研究 所得成果或可用于AV行业”

根据模型预测的正确性和在给定情况下推断该预测不确定性的能力,挑战委员会给出了最终排名。 模糊性估计表明模型在多大程度上明确决定了。 这与模型预测的正确性同样重要,对av技术的鲁棒性和可靠性至关重要。

剑桥大学在shifts challenge的共同负责人mark gales说:“随着深度学习的方法变得更加强大,这些方法适用于更有兴趣和多样性的行业。 对这些系统来说,通过“知道什么时候不知道”来防止错误的决定变得越来越重要。 ”

(视频源: berza项目t.me/berzaru )

yandex高级研究科学家、shifts challenge负责人andrey malinin表示:“在开发能够生成准确不确定性估计的稳健模型中,最重要的障碍是庞大多样的数据集的可用性,其中,这些数据集实际上 该行业的许多研究都是在具有合成分布转变的小图像分类数据集上进行的。 不幸的是,这些数据集的好成果一般无法宣传到自动驾驶汽车等大型工业APP领域。 我们的目标是通过发布包含与图像分类不同的任务的实际分布式转移示例的大数据集来解决上述问题。 我希望这能为不确定性估计和鲁棒性研究确立新的标准。 ”

标题:“Yandex推出分布转移挑战加速ML研究 所得成果或可用于AV行业”

地址:http://www.0317jhgd.com//dfqcxw/13796.html