未探索冒険型Q-learningの提案

¥330 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: IS17005

グループ名: 【C】電子・情報・システム部門情報システム研究会

発行日: 2017/03/23

タイトル(英語): Adventure in a non-search state Q- learning

著者名: 河原崎俊之祐(神奈川大学),瀬古沢　照治(神奈川大学)

著者名(英語): Shunnosuke Kawarasaki(Kanagawa University),Teruji Sekozawa(Kanagawa University)

要約(日本語): Q-learningの利点として、実用的な問題に対して広範囲で適用可能であることが挙げられる。しかし、Q‐learningは、多くの学習時間を必要とし学習が遅いという問題がある。また、学習の高速化を目指し知識利用を重視すると探索が進まないという欠点が生じる。そこで本研究ではエージェントが行動履歴を持ち、予め未知の状態へ冒険的に探索を進めて行く方法を提案する。提案手法は学習の高速化に有効であり最短経路を高速に得ることが確認された。

要約(英語): Q‐learning has the problem that a lot of learning time. We propose adventure in a non-search state Q- learning. In this method, the agent has the action history, and the search is advanced to the unknown state beforehand adventuring. The proposal technique was effective for the speed-up of learning and this method was found the shortest route at high speed.

原稿種別: 日本語

PDFファイルサイズ: 1,211 Kバイト

販売タイプ PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

未探索冒険型Q-learningの提案

未探索冒険型Q-learningの提案