エージェントの行動履歴の活用による Q-learningの学習効率向上
エージェントの行動履歴の活用による Q-learningの学習効率向上
カテゴリ: 研究会(論文単位)
論文No: ST14032
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2014/12/07
タイトル(英語): Improving effciency of Q-learning by using the agent's action history
著者名: 齋藤 雅矩(神奈川大学),増田 和明(神奈川大学),瀬古沢 照治(神奈川大学)
著者名(英語): Masanori Saito(Kanagawa University),Kazuaki Masuda(Kanagawa University),Teruji Sekozawa(Kanagawa University)
キーワード: 機械学習|強化学習|Q-learning|行動履歴|machine learning|reinforcement learning|Q-learning|action history
要約(日本語): Q学習は試行錯誤探索によって期待報酬を最大化するために、状態行動価値関数(Q値)を更新することにより、最適な方策を学習する手法である。我々は行動選択で行動履歴を用いたQ学習法を提案する。この方法は、エージェントの行動選択において行動の履歴から失敗した行動を回避することによってQ学習の効率を向上させる。
要約(英語): Q-learning is learning the optimal policy by updating in action-state value function(Q-value) to maximize a expectation reward by a trial and error search. we propose a improved Q-learning method by using action history in action selection. this method be able to improving efficiency of Q-learning by avoiding failed stats which agent’s action selection is using recorded action’s history.
原稿種別: 日本語
PDFファイルサイズ: 1,305 Kバイト
受取状況を読み込めませんでした
