《决策与信息》
电信技术论文_基于多智能体模糊深度强化学习的
文章摘要:为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法。针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数。为应对Agent之间的相互影响和动态的环境,引入集中式训练和分散式执行框架。该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各Agent的权重分配问题。采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率。仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性。
文章关键词:
论文分类号:TN914.41;TN973.3
上一篇:企业经济论文_基于产品差异化双寡占供应链下的
下一篇:没有了