{"product_id":"ieej-ct11tc06001","title":"強化学習における状態・行動空間の適応的共構成法―動的環境への適用―","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e部門大会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eTC6-1\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】平成23年電気学会電子・情報・システム部門大会講演論文集\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2011\/09\/07\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eAdaptive Co-construction of State and Action Spaces for Reinforcement Learning - Application to Dynamic Environment -\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e永吉 雅人(新潟県立看護大学),村尾 元(神戸大学),玉置 久(神戸大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eMasato Nagayoshi(Niigata College of Nursing),Hajime Murao(Kobe University),Hisashi Tamaki(Kobe University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e強化学習|適応的共構成|動的環境|状態・行動空間構成|エントロピー|Reinforcement Learning|Adaptive Co-construction|Dynamic Environment|State and Action Spaces Design|Entropy\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e強化学習は、実用性といった観点から、状態空間や行動空間を予め適切に設計することが難しい。この点に留意し、状態空間および行動空間を共に適応的構成する計算モデルについての検討を進めており、これまで、状態空間と行動空間の適応的共構成法を提案している。本稿では、動的環境下におけるロボットナビゲーション問題を対象とした計算機実験を通して、提案手法の有効性と実問題への適用可能性について検討する。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e4,106 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格440円\/会員価格220円） \/ A4 \/ 5","offer_id":46406441926895,"sku":"IEEJ-CT11TC06001-PDF","price":440.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_1a086b3d-9228-4966-a635-209578d7bd92.png?v=1745138617","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-ct11tc06001","provider":"電気学会 電子図書館","version":"1.0","type":"link"}