基于CVRL的移动机器人导航控制
摘要:针对移动机器人的导航问题,本文提出一种具有连续向量输出的再励学司算法(Reinforcement Learning with ContinuousVector output:CVRI)。CVRL具有层次结构、低层是单元动作网络层、通过组合动作产生连续向量输出;高层是建立在组合单元动作空间上的Q学习单元,实现组合动作的选择,文中给出了CVRL导航的具体实现,并通过仿真实验验证了其有效性。 PDF下载:
猜你喜欢
|
摘要:针对移动机器人的导航问题,本文提出一种具有连续向量输出的再励学司算法(Reinforcement Learning with ContinuousVector output:CVRI)。CVRL具有层次结构、低层是单元动作网络层、通过组合动作产生连续向量输出;高层是建立在组合单元动作空间上的Q学习单元,实现组合动作的选择,文中给出了CVRL导航的具体实现,并通过仿真实验验证了其有效性。 PDF下载:
猜你喜欢
|