{"product_id":"ieej-st13122","title":"強化学習における状態空間と行動空間の相互作用を生み出す適応的共構成法","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST13122\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2013\/11\/24\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eThe adaptive co-construction method which gives rise to interactions between state and action spaces\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e永吉 雅人(新潟県立看護大学),村尾 元(神戸大学),玉置 久(神戸大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eNagayoshi Masato(Niigata College of Nursing),Murao Hajime(Kobe University),Tamaki Hisashi(Kobe University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e強化学習|状態・行動空間共構成法|空間間相互作用|エントロピー|reinforcement learning|co-construction of state and action spaces|interactions between state and action spaces|entropy\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e筆者らは、強化学習における状態空間と行動空間の適応的共構成法を提案している。しかしながら、この方法は学習回数の十分性を評価するにあたり2つの閾値を設定する必要があり、その設定に課題が残っていた。本稿では、学習回数の十分性を評価するための2つの閾値を必要としないように、エントロピーを用いた指標を導入し、新たな状態空間と行動空間の適応的共構成法を提案する。さらに、空間間の相互作用に注目してその効果と性能を検討する。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e511 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 5","offer_id":46385015750895,"sku":"IEEJ-ST13122-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_05789c76-9891-4dce-a825-23953ec8c12e.png?v=1744332292","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-st13122","provider":"電気学会 電子図書館","version":"1.0","type":"link"}