深層学習を組み込んだ経験強化型学習に関する実験的考察
深層学習を組み込んだ経験強化型学習に関する実験的考察
カテゴリ: 研究会(論文単位)
論文No: ST16049
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2016/12/02
タイトル(英語): Experimental Results of Exploitation-oriented Learning with Deep Learning
著者名: 宮境 和光(大学改革支援・学位授与機構)
著者名(英語): Kazuteru Miyazaki(National Institution for Academic Degrees and Quality Enhancement of Higher Educatio)
キーワード: 経験強化型学習|強化学習|深層学習|ゲーム問題|Exploitation-oriented Learning|Reinforcement Learning|Deep Learning|Game
要約(日本語): 現在、深層学習が大きな注目を集めている。深層学習と強化学習を組み合わせた手法としてdeep Q-network (DQN)が有名である。DQNに経験強化型学習を組み合わせた手法としてDQNwithPSを提案している。Atari 2600ゲームを題材に、DQNwithPSが、DQNよりも安定的、かつ、より少ない試行錯誤回数で学習できることを示す。
要約(英語): Deep learning has attracted significant interest currently. The deep Q-network (DQN) combined with Q-learning have demonstrated excellent results for several Atari 2600 games. We know DQNwithPS as an exploitation-oriented learning (XoL) method that incorporates deep learning. It aims to reduce the number of trial-and-error searches by combining DQN with a profit sharing method that is an XoL method. In this paper, DQNwithPS is compared to a DQN in Atari 2600 games. We demonstrate that DQNwithPS can learn stably with fewer trial-and-error searches than only using a DQN.
原稿種別: 日本語
PDFファイルサイズ: 1,836 Kバイト
受取状況を読み込めませんでした
