{"product_id":"ieej-st12012","title":"緩やかに変化する環境での強化学習","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST12012\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2012\/12\/01\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eReinforcement learning in a slowly changing environment\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e永吉 雅人(新潟県立看護大学),村尾 元(神戸大学),玉置 久(神戸大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eNagayoshi Masato(Niigata College of Nursing),Murao Hajime(Kobe University),Tamaki Hisashi(Kobe University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e強化学習|動的環境|環境変化検出|エントロピー|reinforcement learning|dynamic environment|detection of environmental changes|entropy\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e　筆者らは、強化学習における動的環境の問題クラスを整理し、環境変化の一検出法を提案している。　本稿では、従来対象とされてきた激しく変化する環境を対象とするのではなく、システムの老朽化を想定して、緩やかに変化する環境における提案手法の適応性能を検討する。具体的には、経路計画問題を対象とした計算機実験を通して、最適経路が壁によって緩やかに延びていく環境において適応性能を検討する。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e576 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 6","offer_id":46380736741615,"sku":"IEEJ-ST12012-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_8ac8b81c-de32-4114-a04f-a5fef8efb845.png?v=1744204689","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-st12012","provider":"電気学会 電子図書館","version":"1.0","type":"link"}