虫虫首页| 资源下载| 资源专辑| 精品软件
登录| 注册

您现在的位置是:虫虫下载站 > 资源下载 > 通信网络 > 基于强化学习的飞行自动驾驶仪设计

基于强化学习的飞行自动驾驶仪设计

  • 资源大小:727 K
  • 上传时间: 2013-11-09
  • 上传用户:laotietou
  • 资源积分:2 下载积分
  • 标      签: 化学 飞行 自动驾驶仪

资 源 简 介

  针对强化学习在连续状态连续动作空间中的维度灾难问题,利用BP神经网络算法作为值函数逼近策略,设计了自动驾驶仪。并引入动作池机制,有效避免飞行仿真中危险动作的发生。首先,建立了TD强化学习算法框架;然后根据经验将舵机动作合理分割为若干组,在不同的飞行状态时,调取不同组中的动作;其次,构建了BP神经网络,通过飞行过程中的立即奖赏,更新网络的值函数映射;最后,通过数字仿真验证了强化学习自动驾驶仪的性能,仿真结果表明,该算法具有良好的动态和稳态性能。

相 关 资 源

您 可 能 感 兴 趣 的