一种在足球模拟中为步行机器人生成投篮的Q学习算法

2021-11-26 09:24:02

导读RoboCup原名J赛，是由国际机器人杯合会组织的年度机器人和人工智能(AI)竞赛。在RoboCup期间，机器人将与其他机器人足球锦标赛竞争。比赛的

RoboCup原名J赛，是由国际机器人杯合会组织的年度机器人和人工智能(AI)竞赛。在RoboCup期间，机器人将与其他机器人足球锦标赛竞争。

比赛的想法起源于1992年，当时加拿大不列颠哥伦比亚大学的AlanMackworth教授写了一篇题为“OnSeeingRobots”的论文。1993年，的一个研究小组从这篇论文中汲取灵感，组织了第一届机器人足球比赛。

虽然RoboCup具有很高的娱乐性，但其主要目标是在现实世界中展示机器人和人工智能的进步。参加比赛的机器人系统是全球许多研究人员深入研究的结果。

除了现实世界的比赛，计算机科学家和机器人专家还可以在RoboCup3D足球模拟赛中测试他们的机器人足球计算工具。这本质上是一个在模拟中复制RoboCup环境的平台，充当人工智能技术和旨在踢足球的机器人系统的虚拟“健身房”。

烟台理工学院和RahjuyanDaneshBorazjan大学的研究人员最近开发出一种新技术，可以提高参加足球比赛的机器人边走边射的能力。这项技术发表在SpringerLink的JournalofAmbientIntelligenceandHumanizedComputing上的一篇论文中，基于一种称为Q-learning算法的计算方法。

“参加RoboCup3D赛的球队最重要的目标之一是增加射门次数的能力，”开发该技术的三位研究人员YunLin、YibinSong和AminRezaeipanah在他们的论文中写道。“之所以如此重要，是因为对对手的优势需要强大而精确的射门。”

大多数在模拟中生成镜头的技术都基于两种称为反向运动学(IK)和点分析的方法。这些数学方法既可用于创建计算机动画，也可用于机器人技术，以预测机器人达到给定位置或完成动作所需的关节参数。

“这些方法的假设是机器人和球的位置是固定的，”研究人员在他们的论文中解释道。“但是，拍摄的情况并非总是如此。”

为了克服之前提出的方法的局限性，Lin和他的同事基于Q-learning算法创造了一种新的投篮策略，可以增强机器人在步行时投篮的能力。Q-learning算法是基于强化学习的无模型计算方法。这些算法在代理试图学习如何以最佳方式导航其环境或执行复杂操作的情况下特别有用。

研究人员在他们的论文中写道：“弯曲的路径旨在将机器人移向球，这样它最终就会有一个最佳的射门位置。”“一般来说，RoboCup3D中的视觉感知器有噪声。因此，机器人运动参数，如速度和角度，通过Q-learning算法更精确地调整。最后，当机器人相对于球和目标处于最佳位置时，将IK模块应用到拍摄策略上。”

Lin、Song和Rezaeipanah在一系列实验和模拟中评估了他们的Q学习算法。值得注意的是，他们发现，在大多数参加RoboCupSoccer赛和RoboCup3D赛的球队中，它可以让机器人边走边射球，效果要好得多。最终，它可以显着提高机器人在RoboCup足球比赛中的表现。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时候联系我们修改或删除，多谢

标签：