本发明公开了一种盲六足机器人运动策略的训练方法,属于六足机器人运动控制的技术领域;该方法基于盲六足机器人的内传感器获取本体感知信号,该信号可以满足盲六足机器人正常行走的最低要求,并可忽略恶劣天气的影响。使用近端策略优化算法训练盲六足机器人的运动策略,验证了盲六足机器人的马尔可夫性证明算法的可行性。本发明通过Mujoco建立了盲六足机器人在非结构化地面运动的环境,并在环境中通过强化学习算法训练得到运动策略,使盲六足机器人能根据当前环境做出自适应运动;证明该方法能使盲六足机器人在恶劣天气影响下也能稳定行走和简单避障,并通过非结构化地面。