根据盖亚汽车信息,哥伦比亚大学工程学院的研究人员发表了计算机视觉技术,利用人、动物、物体之间的高水平关联,可以更直观地感知机器接下来发生的事件。

哥伦比亚大学计算机科学助理教授carl vondrick说: “通过我们的算法,机器可以更好地预测人类的行为,更好地协调机器和我们的行为。 该研究结果为人机协作、自动驾驶车、辅助技术开辟了越来越多的可能性。 ”

研究人员表示,该算法是迄今为止预测视频中未来几分钟行为的最准确方法。 在拆除了几千个小时的电影、体育比赛、“办公室”等节目后,该系统学会了预测数百个活动,从握手到摸拳。 另一方面,在系统无法预测具体的动作时,会发现联系动作的更高层次的概念,即“问候”。

“哥伦比亚工程学院推出新计算机视觉技术 可使AV预测未知动作”

(照片来源:哥伦比亚大学)

过去预测机器学习的尝试,包括团队的尝试在内,一次只预测了一个动作。 算法决定是否将动作分类为拥抱、击掌、握手甚至“忽略”等非动作。 但是,在模糊性高的情况下,很多机器学习模型中找不到可能的选择项之间的共性。

“哥伦比亚工程学院推出新计算机视觉技术 可使AV预测未知动作”

哥伦比亚大学工程学院博士生didac suris和ruoshi liu的决策从不同的角度看更长的预测问题。 suris说:“未来的一切都不是可以预测的。 如果一个身体不能准确预见会发生什么,他们会谨慎行事,在更高的抽象层面进行预测。 我们的算法是第一个学习抽象推理未来事物的能力的算法。 ”

“哥伦比亚工程学院推出新计算机视觉技术 可使AV预测未知动作”

为此,suris和liu重新讨论了古希腊的数学问题。 在高中,学生很熟悉,学习直观的几何学。 直线是直的,平行线永远不会相交。 大多数机器学习系统也遵守这些。 但是,其他几何图形具有奇怪的、违背直觉的特征,如直线弯曲和三角形膨胀。 suris和liu采用这些罕见的几何结构构建ai模型,整理高级概念,预测未来人类的行为。

“哥伦比亚工程学院推出新计算机视觉技术 可使AV预测未知动作”

麻省理工学院( mit )高级研究科学家、mit -ibm沃森人工智能实验室) watson ai lab )的共同主任aude oliva说:“预测是人类智能的基础。 人类绝对不会犯的错误,机器会犯。 因为,它们缺乏我们抽象的推理能力。 这项工作是填补这一技术差距的重要一步。 ”

“哥伦比亚工程学院推出新计算机视觉技术 可使AV预测未知动作”

研究人员开发的数学框架使机器能够根据事物未来的可预测性来组织事物。 例如,我们知道游泳和跑步都是训练的形式。 这项新技术可以学习如何自己将这些活动分类。 系统可以识别不确定性,在明确的情况下提供更具体的操作,在不确定的情况下提供更一般的预测。

“哥伦比亚工程学院推出新计算机视觉技术 可使AV预测未知动作”

研究人员说,这项技术可以让电脑更接近判断环境,做出细致的决策,而不是预先编程的动作。 该论文的共同作者liu说:“这是在人类和计算机之间建立信任的重要一步。 信任只要机器人能够真正理解人的感受,机器能够理解和预测我们的行为,计算机就能够无缝地协助人们的日常活动。 ”

“哥伦比亚工程学院推出新计算机视觉技术 可使AV预测未知动作”

vondrick说:“与以前相比,新算法对基准任务的预测更准确,但下一步将验证该算法在实验室外是否有效。” 研究人员表示,“如果该系统能够在各种环境下工作,我们很可能会引进机械和机器人,改善我们的安全、健康和保障。 ”。 该小组将继续采用更大的数据集、计算机和其他形式的几何图形以提高算法性能。 vondrick说:“人类的行为经常出乎意料。 我们的算法可以让机器更好地预测他们接下来要做什么。 ”

标题:“哥伦比亚工程学院推出新计算机视觉技术 可使AV预测未知动作”

地址:http://www.0317jhgd.com//dfqcxw/14508.html