1
/
の
1
オブザーバを用いた複数モデルベース強化学習
オブザーバを用いた複数モデルベース強化学習
通常価格
¥440 JPY
通常価格
セール価格
¥440 JPY
単価
/
あたり
税込
カテゴリ: 全国大会
論文No: 3-111
グループ名: 【全国大会】平成16年電気学会全国大会論文集
発行日: 2004/03/17
タイトル(英語): Multiple Model-based Reinforcement Learning using Observer
著者名: 河村 哲男(早稲田大学),内田 健康(早稲田大学)
著者名(英語): Kawamura Tetsuo(Waseda University),Uchida Kenko(Waseda University)
キーワード: 強化学習|オブザーバ|複数モデル
要約(日本語): 環境もしくは制御対象の予測モデルと強化学習コントローラを組としたモジュールを並列に配置し,それらを適応的に切り替え,組み合わせる強化学習システム“Multiple Model-based Reinforcement Learning(MMRL)”が銅谷氏等により提案されている.ここで,このモデルベース強化学習は,行動に必要な状態変数はすべて観測可能という仮定のもとで定式化されているが,実問題では,ノイズやセンサの能力が不十分なため,状態観測に不確実性や不完全性が存在することが多い.そこで,オブザーバを用いて状態変数を再現することにより,測定不可能な状態変数を推定するアプローチを考える.そして,それを強化学習と組み合わせた“オブザーバを用いた複数モデルベース強化学習”を提案する.
原稿種別: 日本語
PDFファイルサイズ: 1,330 Kバイト
受取状況を読み込めませんでした
