オブザーバを用いた複数モデルベース強化学習

¥440 JPY

セール売り切れ

税込

カテゴリ: 全国大会

論文No: 3-111

グループ名: 【全国大会】平成16年電気学会全国大会論文集

発行日: 2004/03/17

タイトル(英語): Multiple Model-based Reinforcement Learning using Observer

著者名: 河村哲男(早稲田大学),内田健康(早稲田大学)

著者名(英語): Kawamura Tetsuo(Waseda University),Uchida Kenko(Waseda University)

キーワード: 強化学習|オブザーバ|複数モデル

要約(日本語): 環境もしくは制御対象の予測モデルと強化学習コントローラを組としたモジュールを並列に配置し,それらを適応的に切り替え,組み合わせる強化学習システム“Multiple Model-based Reinforcement Learning(MMRL)”が銅谷氏等により提案されている.ここで,このモデルベース強化学習は,行動に必要な状態変数はすべて観測可能という仮定のもとで定式化されているが,実問題では,ノイズやセンサの能力が不十分なため,状態観測に不確実性や不完全性が存在することが多い.そこで,オブザーバを用いて状態変数を再現することにより,測定不可能な状態変数を推定するアプローチを考える.そして,それを強化学習と組み合わせた“オブザーバを用いた複数モデルベース強化学習”を提案する.

原稿種別: 日本語

PDFファイルサイズ: 1,330 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 2

数量

詳細を表示する

国/地域

オブザーバを用いた複数モデルベース強化学習

オブザーバを用いた複数モデルベース強化学習