エージェントの行動履歴の活用による Q-learningの学習効率向上

¥330 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: ST14032

グループ名: 【C】電子・情報・システム部門システム研究会

発行日: 2014/12/07

タイトル(英語): Improving effciency of Q-learning by using the agent's action history

著者名: 齋藤雅矩(神奈川大学),増田和明(神奈川大学),瀬古沢照治(神奈川大学)

著者名(英語): Masanori Saito(Kanagawa University),Kazuaki Masuda(Kanagawa University),Teruji Sekozawa(Kanagawa University)

要約(日本語): Q学習は試行錯誤探索によって期待報酬を最大化するために、状態行動価値関数（Q値）を更新することにより、最適な方策を学習する手法である。我々は行動選択で行動履歴を用いたQ学習法を提案する。この方法は、エージェントの行動選択において行動の履歴から失敗した行動を回避することによってQ学習の効率を向上させる。

要約(英語): Q-learning is learning the optimal policy by updating in action-state value function(Q-value) to maximize a expectation reward by a trial and error search. we propose a improved Q-learning method by using action history in action selection. this method be able to improving efficiency of Q-learning by avoiding failed stats which agent’s action selection is using recorded action’s history.

原稿種別: 日本語

PDFファイルサイズ: 1,305 Kバイト

販売タイプ PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

エージェントの行動履歴の活用による Q-learningの学習効率向上

エージェントの行動履歴の活用による Q-learningの学習効率向上