高次元連続状態空間での強化学習における状態フィルタの適応的獲得
高次元連続状態空間での強化学習における状態フィルタの適応的獲得
カテゴリ: 部門大会
論文No: OS5-9
グループ名: 【C】平成16年電気学会電子・情報・システム部門大会講演論文集
発行日: 2004/09/02
タイトル(英語): Adaptive Acquisition of a State Space Filter for Reinforcement Learning with High-Dimensional Continuous Space
著者名: 永吉 雅人(神戸大学),村尾 元(神戸大学),玉置 久(神戸大学),北村 新三(神戸大学)
著者名(英語): Masato Nagayoshi(Kobe University),Hajime Murao(Kobe University),Hisashi Tamaki(Kobe University),Shinzo Kitamura(Kobe University)
キーワード: 強化学習|状態空間構成|状態フィルタ|エントロピー|シミュレーション|reinforcement learning|state space design|state space filter|entropy|simulation
要約(日本語): 強化学習は,エージェントの制御規則を適応的に調節・獲得する場合などへの応用が盛んであるが,その実用化に際して,状態空間を予め適切に設計することが難しいという点が問題点の一つとなっている.この点に留意し,エージェントへの状態入力と行動学習の間に状態フィルタを定義・導入した計算モデルについての検討を進めており,本研究ではエントロピーを用いた状態フィルタの一実現法を提案する.さらに,高次元連続状態空間における強化学習問題の例題として迷路問題を取り上げ,冗長なセンサをもつエージェントを用いた計算機実験を通して状態フィルタの比較・検討を行い,提案手法の有効性・可能性について検討する.
PDFファイルサイズ: 1,066 Kバイト
受取状況を読み込めませんでした
