連続行動空間への適用を考慮したSwitching強化学習の状態空間構成に関する一考察
連続行動空間への適用を考慮したSwitching強化学習の状態空間構成に関する一考察
カテゴリ: 部門大会
論文No: OS4-2
グループ名: 【C】平成22年電気学会電子・情報・システム部門大会講演論文集
発行日: 2010/09/02
タイトル(英語): A Note on State Space Design of Switching Reinforcement Learning for Continuous Action Space
著者名: 永吉 雅人(新潟県立看護大学),村尾 元(神戸大学),玉置 久(神戸大学)
著者名(英語): Masato Nagayoshi(Niigata College of Nursing),Hajime Murao(Kobe University),Hisashi Tamaki(Kobe University)
キーワード: 強化学習|行動空間構成|状態空間構成|エントロピー|シミュレーション|reinforcement learning|action space design|state space design|entropy|simulation
要約(日本語): 強化学習は,実用性といった観点から,状態空間や行動空間を予め適切に設計することが難しい.この点に留意し,状態空間および行動空間を共に適応的構成する計算モデルについての検討を進めており,これまで,状態空間を固定した上で,行動空間に対する適応的構成を試みるため,離散行動空間のための学習器と連続行動空間のための学習器を適宜切り替えるSwitching強化学習を提案している.
本稿では,連続行動空間を有する迷路問題を取り上げた計算機実験を通して,状態空間の構成を変えた提案手法の性能比較を行い,提案手法の状態空間構成について考察する.
PDFファイルサイズ: 3,150 Kバイト
受取状況を読み込めませんでした
