基于深度强化学习的多目标无人机路径规划OA
Multi-target UAV Path Planning Based on Deep Reinforcement Learning
在搜救领域中,透过程序完成半自主或自主飞行控制,无人机能够协助救难人员更好地完成救援任务.搜救任务中涉及到多个目标间的搜索,相比于单目标的搜索问题,需要更复杂的算法或是奖励重塑形式,才能改进其稀疏奖励的问题.此外,搜救任务比起一般的强化学习问题,更讲究时效性.如何利用搜救的先验知识对算法进行改进,从而提高完成任务的效率和训练时间,是机器学习应用的研究重点.针对搜救任务背景,研究了无人机在多目标问题下的路径规划问题.基于分层学习的概念对已有的深度强…查看全部>>
陈昱宏;高飞飞
清华大学 自动化系信息处理研究所,北京100084清华大学 自动化系信息处理研究所,北京100084
信息技术与安全科学
多目标稀疏奖励分层学习室内搜救无人机
《无线电通信技术》 2022 (6)
957-970,14
国家重点研发计划(2018AAA0102401)
评论