動的環境におけるエントロピー駆動型強化学習適応的状態空間構成による接近

¥440 JPY

セール売り切れ

税込

カテゴリ: 部門大会

論文No: TC9-1

グループ名: 【C】平成25年電気学会電子・情報・システム部門大会講演論文集

発行日: 2013/09/04

タイトル(英語): Entropy-guided Renforcement Learning for Dynamic Environments - Approach by Adaptive State Space Construction

著者名: 永吉雅人(新潟県立看護大学),村尾元(神戸大学),玉置久(神戸大学)

著者名(英語): Masato Nagayoshi(Niigata College of Nursing),Hajime Murao(Kobe University),Hisashi Tamaki(Kobe University)

要約(日本語): 近年，強化学習をエージェントの制御規則の適応的調節・獲得などに応用しようとする試みが盛んであるが，実用性といった観点から，動的環境への適応能力が問題点の一つとなっている．この点に留意し筆者らは，強化学習における動的環境の問題クラスを整理し，環境変化検出法を提案している．さらに筆者らはこれまで，状態空間を予め適切に設計することが難しいという問題に留意し，適応的状態空間構成法を提案している．しかしながら，この方法は学習回数の十分性を評価するパラメータを必要としており，その設定に課題が残されていた．本稿では，上記構成法について学習回数のパラメータに代わりエンロピーを用いた指標を導入し，それと環境変化検出法を組合せた，エンロピー駆動型強化学習法を提案する．さらに，連続状態空間からなる動的経路計画問題を対象として，環境変化時における提案手法の有効性について検討する．

PDFファイルサイズ: 5,439 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

動的環境におけるエントロピー駆動型強化学習 適応的状態空間構成による接近