商品情報にスキップ
1 1

深層学習を組み込んだ経験強化型学習に関する実験的考察

深層学習を組み込んだ経験強化型学習に関する実験的考察

通常価格 ¥330 JPY
通常価格 セール価格 ¥330 JPY
セール 売り切れ
税込

カテゴリ: 研究会(論文単位)

論文No: ST16049

グループ名: 【C】電子・情報・システム部門 システム研究会

発行日: 2016/12/02

タイトル(英語): Experimental Results of Exploitation-oriented Learning with Deep Learning

著者名: 宮境 和光(大学改革支援・学位授与機構)

著者名(英語): Kazuteru Miyazaki(National Institution for Academic Degrees and Quality Enhancement of Higher Educatio)

キーワード: 経験強化型学習|強化学習|深層学習|ゲーム問題|Exploitation-oriented Learning|Reinforcement Learning|Deep Learning|Game

要約(日本語): 現在、深層学習が大きな注目を集めている。深層学習と強化学習を組み合わせた手法としてdeep Q-network (DQN)が有名である。DQNに経験強化型学習を組み合わせた手法としてDQNwithPSを提案している。Atari 2600ゲームを題材に、DQNwithPSが、DQNよりも安定的、かつ、より少ない試行錯誤回数で学習できることを示す。

要約(英語): Deep learning has attracted significant interest currently. The deep Q-network (DQN) combined with Q-learning have demonstrated excellent results for several Atari 2600 games. We know DQNwithPS as an exploitation-oriented learning (XoL) method that incorporates deep learning. It aims to reduce the number of trial-and-error searches by combining DQN with a profit sharing method that is an XoL method. In this paper, DQNwithPS is compared to a DQN in Atari 2600 games. We demonstrate that DQNwithPS can learn stably with fewer trial-and-error searches than only using a DQN.

原稿種別: 日本語

PDFファイルサイズ: 1,836 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する