- 年份
- 2025(3)
- 2024(3)
- 2023(4)
- 2022(2)
- 2021(3)
- 2020(2)
- 2019(1)
- 2016(1)
- 2006(1)
- 更多...
- 核心收录
- 中国科技论文与引文数据库(CSTPCD)(12)
- 北京大学中文核心期刊目录(北大核心)(9)
- 中国科学引文数据库(CSCD)(2)
- 刊名
- 国防科技大学学报(2)
- 电讯技术(2)
- 空间电子技术(2)
- 兵工自动化(1)
- 太原理工大学学报(1)
- 广西师范大学学报:自然科学版(1)
- 无线电工程(1)
- 无线电通信技术(1)
- 测控技术(1)
- 物联网技术(1)
- 更多...
- 作者单位
- 上海理工大学(1)
- 东南大学(1)
- 中国运载火箭技术研究院(1)
- 华北电力大学(1)
- 哈尔滨工程大学(1)
- 国防科技大学(1)
- 大连海事大学(1)
- 广西大学(1)
- 浙江财经大学(1)
- 福建工程学院(1)
- 更多...
- 语种
- 汉语(20)
- 关键词
- Q-Learning(20)
- 强化学习(7)
- 路径规划(3)
- QoS路由(2)
- 天球网格(2)
- 热力图(2)
- Gazebo仿真(1)
- Mesh网络(1)
- OLSR(1)
- ROS机器人(1)
- 更多...
- 作者
- 周诠(2)
- 肖嵩(2)
- 蔡宇茜(2)
- 马伟(2)
- 丁松(1)
- 丁鲲(1)
- 义余江(1)
- 何嘉颖(1)
- 何荣希(1)
- 储飞黄(1)
- 更多...
相关度
- 相关度
- 发表时间
每页显示10条
- 每页显示10条
- 每页显示20条
- 每页显示30条
已找到 20 条结果
- 基于Q-Learning的自适应容错路由算法的研究北大核心CSCDCSTPCD摘要:提出了使用Q-Learning来构作容错路由算法的方法,利用Q-Learnig算法的自适应性来实现路由容错,在二维格子环境下的实验证明了算法的可行性.算法工作时只需利用源点本地存储的其它节点的状态、互连信息,即可迭代找出一条到达目标节点的容错通路,不增加网络的通信量,不依赖其它的路由控制节点.
- 基于Q-Learning的多功能雷达认知干扰决策方法北大核心CSTPCD摘要:针对多功能雷达和认知电子战的快速发展所导致传统干扰决策方法难以适应现代化战争的问题,提出了一种基于Q-Learning的多功能雷达认知干扰决策方法.通过对比认知思想和干扰决策原理,将Q-Learning运用于认知干扰决策中并提出了认知干扰决策的算法步骤.以某多功能雷达为基础,通过分析其工作状态及对应干扰样式构建雷达状态转移图,通过仿真试验分析了各参数对决策性能的影响,为应对实际战场提供参考.仿真了在新状态加入下的决策过程、实际战场中转…查看全部>>
- 海上无线网状网中基于Q-Learning的自适应路由算法北大核心CSTPCD
- 基于Q-Learning的虚拟机动态伸缩算法摘要:针对大规模云环境中业务量变化时平台服务质量和资源消耗的问题,提出一种基于Q-Learning的虚拟机扩容/缩容决策算法.将该问题转换为马尔科夫决策模型,为了在业务平台服务质量和资源消耗之间取得较好的平衡,智能体根据平台当前状态计算出最佳策略,执行决策并转到下一状态.仿真结果表明,该算法可根据业务量的变化实时作出伸缩决策,并提供最合适的虚拟机资源以满足业务需求,且能提高平台的稳定性.
- 基于强化学习的自适应干扰波形设计摘要:针对传统干扰算法无法适应信号环境变化的问题,提出将Q-Learning算法与"切割"假设法相结合应用到干扰波形设计中,使干扰波形能够达到自适应雷达信号长度变化的效果.该算法主要针对雷达检测环节进行干扰,其中采用恒虚警概率(constant false alarm rate,CFAR)作为环境交互模型,通过强化学习自适应地调整间歇采样信号的采样时间与转发时间,在此基础上对未知长度雷达信号进行"切割"处理以达到最佳干扰的目的.最后进…查看全部>>
- 强化学习在多阶段装备组合规划问题中的应用北大核心CSCDCSTPCD
- 基于Q-Learning的动态BLE Mesh网络高能效路由算法北大核心摘要:针对动态低功耗蓝牙(Bluetooth Low Energy,BLE)Mesh网络规范采用的管理式泛洪路由机制所导致的数据包冗余和高能耗的问题,提出了动态BLE Mesh网络高能效路由算法.通过建立基于Q-Learning的BLE Mesh网络路由模型,将BLE Mesh网络中节点的剩余能量、转发成本、移动因子以及接收信号强度指示(Received Signal Strength Indi-cator,RSSI)纳入到奖励函数的设计中…查看全部>>
- 多约束强化学习最优智能滑翔制导方法北大核心CSTPCD摘要:为提升复杂飞行任务下滑翔制导的自主性,提出一种基于最优制导与强化学习的多约束智能滑翔制导策略.引入三维最优制导以满足终端经纬度、高度以及速度倾角约束.提出基于侧向正弦机动的速度控制策略,研究考虑机动飞行的终端速度解析预测方法.针对速度控制中机动幅值无法离线确定的问题,研究基于强化学习的智能调参方法.该方法基于终端速度设计状态空间,以机动幅值设计动作空间,设计综合终端速度误差与滑翔制导任务的回报函数,采用Q-Learning实现机动幅值…查看全部>>
- 基于Q-Learning的无线区块链广播路由算法CSTPCD摘要:面向无线区块链网络场景,参考常用的区块链逻辑分层,提出一个独立灵活的分层逻辑架构,详细地介绍了每层的工作原理及作用.在现有广播路由算法的基础上结合无线区块链网络场景,针对广播过程中存在的广播冗余及广播总能耗高等缺陷,提出了一种基于Q-Learning的广播路由算法.该算法将无线区块链网络交易信息广播过程描述为多个agent的广播决策问题,通过线下学习、训练,帮助每一个当前广播节点agent做出是否广播的决策.仿真实验结果证明,该…查看全部>>
- 面向延迟容忍服务的高能效传输策略摘要:近年来随着互联网技术与应用的快速发展,互联网用户、无线终端设备急剧增多,对于能源的消耗也在不断增加.如何在保证通信业务质量的前提下,降低能量消耗成为了亟待解决的问题.对此,研究了能源效率(Energy-Efficiency,EE)与延迟容忍(Delay Tolerable,DT)服务时延之间的关系.针对离散信道运用了动态统计规划(Statistical Dynamic Programming,SDP)的方法.针对连续信道引入了近似动态…查看全部>>