未探索冒険型Q-learningの提案
未探索冒険型Q-learningの提案
カテゴリ: 研究会(論文単位)
論文No: IS17005
グループ名: 【C】電子・情報・システム部門 情報システム研究会
発行日: 2017/03/23
タイトル(英語): Adventure in a non-search state Q- learning
著者名: 河原崎 俊之祐(神奈川大学),瀬古沢 照治(神奈川大学)
著者名(英語): Shunnosuke Kawarasaki(Kanagawa University),Teruji Sekozawa(Kanagawa University)
キーワード: 機械学習|強化学習|Q学習|行動選択|行動履歴|探索|machine learning|reinforcement learning|Q-learning|action select|action histor|search
要約(日本語): Q-learningの利点として、実用的な問題に対して広範囲で適用可能であることが挙げられる。しかし、Q‐learningは、多くの学習時間を必要とし学習が遅いという問題がある。また、学習の高速化を目指し知識利用を重視すると探索が進まないという欠点が生じる。そこで本研究ではエージェントが行動履歴を持ち、予め未知の状態へ冒険的に探索を進めて行く方法を提案する。提案手法は学習の高速化に有効であり最短経路を高速に得ることが確認された。
要約(英語): Q‐learning has the problem that a lot of learning time. We propose adventure in a non-search state Q- learning. In this method, the agent has the action history, and the search is advanced to the unknown state beforehand adventuring. The proposal technique was effective for the speed-up of learning and this method was found the shortest route at high speed.
原稿種別: 日本語
PDFファイルサイズ: 1,211 Kバイト
受取状況を読み込めませんでした
