{"product_id":"ieej-zt043111","title":"オブザーバを用いた複数モデルベース強化学習","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e全国大会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003e3-111\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【全国大会】平成16年電気学会全国大会論文集\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2004\/03\/17\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eMultiple Model-based Reinforcement Learning using Observer\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e河村 哲男(早稲田大学),内田 健康(早稲田大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eKawamura Tetsuo(Waseda University),Uchida Kenko(Waseda University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e強化学習|オブザーバ|複数モデル\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e環境もしくは制御対象の予測モデルと強化学習コントローラを組としたモジュールを並列に配置し,それらを適応的に切り替え,組み合わせる強化学習システム“Multiple Model-based Reinforcement Learning(MMRL)”が銅谷氏等により提案されている.ここで,このモデルベース強化学習は,行動に必要な状態変数はすべて観測可能という仮定のもとで定式化されているが,実問題では,ノイズやセンサの能力が不十分なため,状態観測に不確実性や不完全性が存在することが多い.そこで,オブザーバを用いて状態変数を再現することにより,測定不可能な状態変数を推定するアプローチを考える.そして,それを強化学習と組み合わせた“オブザーバを用いた複数モデルベース強化学習”を提案する.\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e1,330 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格440円\/会員価格220円） \/ A4 \/ 2","offer_id":46396627779823,"sku":"IEEJ-ZT043111-PDF","price":440.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_5d055f13-d6c0-4273-be51-ee52ae8d7cd1.png?v=1744815099","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-zt043111","provider":"電気学会 電子図書館","version":"1.0","type":"link"}