Q-learningアルゴリズムに基づくForward-Backward型学習に関する基礎検討
Q-learningアルゴリズムに基づくForward-Backward型学習に関する基礎検討
カテゴリ: 研究会(論文単位)
論文No: ST13013
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2013/05/31
タイトル(英語): A Basic Study on Forward-Backward Type Learning Based on the Q-learning Algorithm
著者名: 齋藤 雅矩(神奈川大学),増田 和明(神奈川大学),瀬古沢 照治(神奈川大学)
著者名(英語): Saito Masanori(Kanagawa Universiry),Masuda Kazuaki(Kanagawa University),Sekozawa Teruji(Kanagawa Universiry)
キーワード: 機械学習|強化学習|Q-Learning|高速化|Machine Learning|Reinforcement Learning|Q-Learning|Acceleration
要約(日本語): Q-learningは,エージェントが報酬の獲得を通して現在の状態とその状態においてとり得る行動に対する状態行動価値関数(Q値)を増やし,初期状態(スタート)から目標とする状態(ゴール)に到達するための方策を確率的に学習するアルゴリズムである。しかし,Q-learningは正の報酬を与える状態を発見するまでQ値が増加せず,そのために最適な方策を効率よく探索できないため,学習が遅いことが問題視されている。そこで,「学習者が一度でも正の報酬を獲得したら,その報酬を与える状態をゴールと認識できる」ことを想定し,ゴールからスタートへ向かう逆向きの探索を付加的に行い,正の報酬を源とするQ値の増加を促進することを考える。本論文では,上記の概念を取り入れたFW-BW(forward-backward)型Q-learningを提案し,数値実験を通して提案手法の有効性を調べる。
原稿種別: 日本語
PDFファイルサイズ: 990 Kバイト
受取状況を読み込めませんでした
