聯(lián)合隨機性策略的深度強化學習探索方法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大小:679 K
標簽: 強化學習 深度強化學習 探索利用困境
所需積分:0分積分不夠怎么辦?
文檔介紹: 目前深度強化學習算法已經(jīng)可以解決許多復雜的任務(wù),然而如何平衡探索和利用的關(guān)系仍然是強化學習領(lǐng)域的一個基本的難題,為此提出一種聯(lián)合隨機性策略的深度強化學習探索方法。該方法利用隨機性策略具有探索能力的特點,用隨機性策略生成的經(jīng)驗樣本訓練確定性策略,鼓勵確定性策略在保持自身優(yōu)勢的前提下學會探索。通過結(jié)合確定性策略算法DDPG和提出的探索方法,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG)。在多個復雜環(huán)境下的實驗表明,面對探索問題,SGDPG的探索效率和樣本利用率要優(yōu)于DDPG算法。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 88av在线视频 | 欧美精品在线一区 | 亚洲欧美日韩另类精品一区二区三区 | 依人九九 | 日韩乱淫| 免费国产成人高清在线观看视频 | 国产精选在线 | 99精选视频 | 日本久久久久久久 | 日韩一级伦理片 | 国产成人久久精品激情91 | 欧美另类孕交免费观看 | 国产三级小视频 | 日本亚欧乱色视频在线观看 | 欧美一区二区三区在线 | 久久久久久尹人网香蕉 | 欧美成人aaaa免费高清 | 日产国产精品久久久久久 | 日韩欧美一区二区三区免费看 | 99久久久精品免费观看国产 | 黄录像欧美片在线观看 | 久久性久久性久久久爽 | 中国一级性生活片 | 成年人性网站 | 国产真实乱子伦精品视手机观看 | 欧美国产精品不卡在线观看 | 成人网久久 | 九九久久九九久久 | 日韩激情无码免费毛片 | 久久国产免费观看精品3 | 久久久网站亚洲第一 | 成人午夜兔费观看网站 | 欧美亚洲激情视频 | 国产一级性片 | 久久影院yy6080 | 99久久免费国产香蕉麻豆 | 手机看片av| 国产日本精品 | av毛片免费看 | 看免费人成va视频全 | 欧美影院网站视频观看 |