针对强化学习在连续状态连续动作空间中的维度灾难问题,利用BP神经网络算法作为值函数逼近策略,设计了自动驾驶仪。并引入动作池机制,有效避免飞行仿真中危险动作的发生。首先,建立了TD强化学习算法框架;然后根据经验将舵机动作合理分割为若干组,在不同的飞行状态时,调取不同组中的动作;其次,构建了BP神经网络,通过飞行过程中的立即奖赏,更新网络的值函数映射;最后,通过数字仿真验证了强化学习自动驾驶仪的性能,仿真结果表明,该算法具有良好的动态和稳态性能。
上传时间: 2013-11-09
上传用户:刘江林1420
这个代码是policy iteration算法关于强化学习的. 请您用winzip 解压缩
标签: iteration policy winzip 代码
上传时间: 2015-04-24
上传用户:lepoke
用java写的一个强化学习程序,猫通过学习学会了抓老鼠。
上传时间: 2016-05-15
上传用户:l254587896
强化学习算法(R-Learning)难得的珍贵资料,在国外找的。分享给大家。
标签: R-Learning 学习算法
上传时间: 2013-12-26
上传用户:yulg
贝叶斯学习与强化学习结合技术的研 详细介绍了强化学习的算法和理论
上传时间: 2017-01-17
上传用户:ynzfm
目的:运用强化学习!多分类器集成!降维方法等最新计算机技术,结合细胞病理知识,设计制作/智能化肺癌细胞病理图像诊断系统0"方法:采集细胞图像,运用基于强化学习的图像分割法将细胞区域从背景中分离出来 运用基于样条和改进2方法对重叠细胞进行分离和重构 提取40个细胞特征用于贝叶斯!支持向量机!紧邻和决策树4种分类器,集成产生肺癌细胞分类结果 建立肺癌细胞病理图库,运用基于等降维方法对细胞进行比对,给予未定型癌细胞分类"结果:/智能化肺癌细胞病理诊断系统0应用于临床随机1200例肺部病灶穿刺细胞学涂片,肺癌识别诊断率94180 ,假阳性率1185 ,假阴性率3135 ,肺癌分类识别率82190 ,核异型细胞识别率74120 "结论:/智能化肺癌早期细胞病理诊断系统0对肺癌细胞涂片诊断率高,克服了肺癌细胞病理诊断过程中取检细胞数量少,重叠细胞识别率低,涂片背景及染色差异等干扰因素,可辅助临床肺部病灶的穿刺细胞病理诊断"
上传时间: 2013-12-16
上传用户:chfanjiang
强化学习的q学习算法,能够通过此算法,使得某种动作不断得到加强,希望对那些想使用Q学习算法的人有所帮助
上传时间: 2014-01-23
上传用户:1079836864
一些强化学习方面的论文,很有用的,有着具体的例子,和算法流程和思路,希望对大家有所帮助
上传时间: 2017-06-23
上传用户:mhp0114
这里是一些关于强化学习的应用和算法,有很好的思路,可以从中举一反三,从而解决自己的问题,希望对大家能有所帮助
上传时间: 2013-12-21
上传用户:天涯
这里是一些关于强化学习的应用和算法,有很好的思路,可以从中举一反三,从而解决自己的问题,希望对大家能有所帮助
上传时间: 2014-01-22
上传用户:1101055045