RoboCup 人形足球机器人动作设计与实现文献综述

 2022-09-25 03:09

{title}{title}

  1. 文献综述(或调研报告):
  2. 引言

足球机器人是一个不断发展的领域,也是人工智能和智能机器人的重要推动力[1]。足球比赛的环境是动态的、实时的,对机器人而言,足球是一个复杂的游戏。足球机器人涵盖了广泛的领域,包括机器人学、物理学、生物学、力学和计算机学等等。当然,这其中也包涵了运动学。

要想机器人在赛场上运动起来,就需要设计机器人的运动动作,包括行走动作和指定动作(主要是踢球)。机器人的动作是通过控制关节按照设计好的轨迹运动实现的,轨迹规划是一个较为复杂的过程,为了简化这个过程,可以将轨迹规划转变为关键帧规划,也就是确定该动作关键的几个位置。将关键帧按顺序排列,便得到了所谓的静态动作序列,然后执行静态动作序列实现机器人的动作。这样做显而易见的优点就是不需要进行轨迹规划,实现难度低。但是缺点也很明显,这样得到的动作生硬,且需要多次调整才能达到预期目标。而动态动作,也就是根据动作需要规划运动轨迹,更加灵活,适应性也更强。表1.1对两种动作方式进行了比较:

表1.1 两种动作方式比较

动作方式

实现难度

调试时间

适应性

流畅性

静态序列

较低

较长

较低

较差

动态生成

较高

较短

较高

较好

两种动作方式在RoboCup赛事中均有所应用。例如曾夺得小型类人组冠军的CIT Brains使用的是动态生成[2],标准平台组的NAO-Team Humboldt采用的是静态动作序列[3]。NAO-Team Humbodt将每个动作描述成一个DFSA(确定性有限状态机),每个节点描述电机的位置,每条边记录两个位置之间的过渡时间和条件。NAO-Team Humboldt同样认为静态动作序列的方法缺少动态,难以用于复杂的动作。

  1. 应用现状

参加2019年RoboCup小型类人组的20只队伍中,技术文档中描述了动态动作的队伍有CIT Brains、EROS、Rhoban和Starkit。以下对这些队伍的动态动作进行叙述:

CIT Brains的踢球动作在2018年及以前采用的都是预先确定好的动作,今年改为了行走踢球[2]。定义好的踢球动作需要在步态动作停止之后花费一定的时间来切换。行走踢球方法将行走曲线和步态轨迹放在同一层次上,可以实现行走与踢球的对接,节省了切换的时间。实现方法上,CIT Brains行走采用了摆线轨迹,而踢球动作采用了贝塞尔曲线,并且通过ZMP(零力矩点)维持动作过程中机器人的稳定。图2.1描述了行走时踢球的调整、接近、击球和接着行走的过程。

图2.1 CIT Brians行走踢球示意图

EROS的行走动作和踢球动作采用的都是线性倒立摆模型[4],其最新研究进展已经将角速度控制融入到关节轨迹控制之中,通过控制加速和减速来使机器人在移动时更加稳定,同时降低机器人倒地后对伺服电机的损伤。

连续三年蝉联小型类人组冠军的Rhoban在2016年及以前也是采用手动调整的方式实现踢球动作[8]。这样得到的踢球动作虽然有力但是实用性很差,并且容易受场地或者机器人变化的影响,而且还需要人为定期逐个机器人进行重新调整。2017年开始Rhoban将踢球动作参数化为笛卡尔坐标系内的多项式样条。首先构建完整的动力学模型计算踢球时的扭矩和零力矩点(ZMP),然后通过CMA-ES黑箱算法(自适应协方差矩阵优化算法)优化样条得到最小化关节扭矩的平衡运动。该方法得到的机器人动作在用力踢球时是不稳定的,踢球效果也远不如2016年及以前采用手动矫正的效果。但是对于普通踢球而言,在没有任何调整的情况下,该动作算法运用于实际机器人上效果和仿真效果基本一致。

此外,Rhoban在2017年更新了步态动作的引擎,从之前使用的的IKWalk换成了现在使用的QuinticWalk。新的步态引擎在原理上和之前的一样,都未采用ZMP和动力学模型[9]。主要的调整部分有五点:一是轨迹改为了五次多项式样条;二是在全向行走和参数更新期间保持连续加速;三是所有相对于躯干的位置和角度都改为了相对于支撑脚的;四是在双足支撑阶段的处理,更加准确的参数值有助于低频、稳定的步态算法的实现;五是在行走启动时,躯干在半个周期内开始摆动以初始化机器人的重量摆动。经过以上调整后机器人的行走更加稳定,但是在轨迹的一些部分还是能观察到龙格现象。

Starkit提到将固定方向的踢球改为机器人自己判断踢球方向,并通过改变脚的位置来改变踢球方向而非改变机器人位置。但是其并没有说明是如何实现的。

上述队伍明确说明了动态动作的使用,还有一些队伍提出了对于动作稳定性和切换速度的改进方案。

Hamburg Bit-Bots and WF Wolves虽然并未说明其动作是如何实现的,但是在其技术文档中提出了两种提高动作稳定性的改进方法[5]。一是基于脚底压力传感器和惯性测量单元的反馈,实现维持机器人的稳定。二是将深度强化学习运用至该领域以达到更好的表现效果。

ITAndroids的步态和踢球采用了基于ZMP的算法,并增加了重力补偿[6]。ITAndroids使用CAD构建质量模型,并通过脚底的压力传感器来改进模型以达到更高的稳定性。除此之外,在2018年ITAndroids添加了躯干控制器,显著的提高了机器人在人造草坪上的行走效果。该躯干控制器使用躯干的角度和角速度作为反馈,使用PD控制驱动关节电机使躯干保持竖直。

Rhoban在动作方面增加了一个接近球后从行走动作向踢球动作的过渡[7]。在机器人接近球的最后阶段,即机器人离球足够近时,计算一个准确的落步,以保证踢球的脚落在球前的正确方向。再根据当前支撑脚和目标姿势计算一到两次调整。计算最后调整部的时候有两个关键点,一是球相对于机器人摄像头的位置必须准确,这就需要获取图像时的要考虑到图像处理过程的延迟。二是调整落步的指令要在一个或半个步态周期结束后执行。预测模型也只是实际模型的粗略估计,要想减小与现实差距还需要使用其他方法。

  1. 总结与展望

动态动作的一开始的生成轨迹向更加稳定、更加快速发展,不少队伍都提出了关于动态动作稳定性的改进方法,例如基于ZMP的调整和基于惯性测量单元和脚底压力传感器的反馈调整;以及不同动作之间的切换更快速的方法,例如行走踢球[13]和计算不同动作间的过渡。动态动作已不再是单纯的追求动作的适应性和流畅性,开始达到更高的标准和要求。改进后的动态动作的效果也会越来越好。

未来动态动作除了目前已有进展的稳定性和快速之外,可能还会向准确性等方面发展,期待动态动作的进一步完善。

  1. 参考文献

[1] Hiroaki Kitano, Minoru Asada, Yasuo Kuniyoshi, Itsuki Noda, Eiichi Osawa, and Hitoshi Matsubara. RoboCup: A challenge problem for AI and robotics. Pages 1 – 19. 1998.

[2] CIT Brains (Kid Size League)

https://submission.robocuphumanoid.org/uploads//

EagleBots_MX-tdp-5c503de1bd77c.pdf

[3] Burkhard, H.D., Holzhauer, F., Krause, T., Mellmann, H., Ritter, C.N.,Welter, O., Xu, Y.: Nao-team humboldt 2009. Technical report, Humboldt Universituml;at zu Berlin (2009)

[4] EROS - Team Description Paper for Humanoid KidSize League, RoboCup 2019

https://submission.robocuphumanoid.org/uploads//EROS-tdp-5c4d7335b9b78.pdf

[5] Hamburg Bit-Bots and WF Wolves Team Description for RoboCup 2019

https://submission.robocuphumanoid.org/uploads//Hamburg_Bit_Bots_and_WF_Wolves-

tdp-5c055f156c238.pdf

[6] ITAndroids Humanoid Team Description Paper for RoboCup 2019

https://submission.robocuphumanoid.org/uploads//ITAndroids-tdp-5c050f1fc2c24.pdf

[7] Rhoban Football Club Team Description Paper Humanoid Kid-Size League, Robocup 2018 Montreal

https://submission.robocuphumanoid.org/uploads//Rhoban-tdp-5c05011865144.pdf

[8] Rhoban Football Club Team Description Paper Humanoid Kid-Size League,Robocup 2017 Nagoya

https://www.robocuphumanoid.org/qualification/2017/22ee18648e39f3f656609d932ab6ccaa70a66929/Rhoban_Fooball_Club_Humanoid_KidSize_regularanddrop_in_2017_TDP.pdf

[9] Rhoban Football Club: RoboCup Humanoid Kid-Size 2017 Champion Team Paper

[10] Beacute;zier curve – Wikipedia

https://en.wikipedia.org/wiki/Bézier_curve#cite_note-Mortenson-1

[11] Vukobratović, Miomir and Borovac, Branislav. Zero-moment point—Thirty five years of its life. International Journal of Humanoid Robotics, Vol. 1, No. 1, pp. 157–173, 2004.

[12] Zero moment point – Wikipedia

https://en.wikipedia.org/wiki/Zero_moment_point#External_links

资料编号:[180763]

  1. 文献综述(或调研报告):
  2. 引言

足球机器人是一个不断发展的领域,也是人工智能和智能机器人的重要推动力[1]。足球比赛的环境是动态的、实时的,对机器人而言,足球是一个复杂的游戏。足球机器人涵盖了广泛的领域,包括机器人学、物理学、生物学、力学和计算机学等等。当然,这其中也包涵了运动学。

要想机器人在赛场上运动起来,就需要设计机器人的运动动作,包括行走动作和指定动作(主要是踢球)。机器人的动作是通过控制关节按照设计好的轨迹运动实现的,轨迹规划是一个较为复杂的过程,为了简化这个过程,可以将轨迹规划转变为关键帧规划,也就是确定该动作关键的几个位置。将关键帧按顺序排列,便得到了所谓的静态动作序列,然后执行静态动作序列实现机器人的动作。这样做显而易见的优点就是不需要进行轨迹规划,实现难度低。但是缺点也很明显,这样得到的动作生硬,且需要多次调整才能达到预期目标。而动态动作,也就是根据动作需要规划运动轨迹,更加灵活,适应性也更强。表1.1对两种动作方式进行了比较:

表1.1 两种动作方式比较

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。