{"product_id":"ieej-st13012","title":"環境変化の発生時期を考慮した強化学習","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST13012\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2013\/05\/31\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eReinforcement learning taking account a timing of the appearance of environmental cahnges\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e永吉 雅人(新潟県立看護大学),村尾 元(神戸大学),玉置 久(神戸大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eNagayoshi Masato(Niigata College of Nursing),Murao Hajime(Kobe University),Tamaki Hisashi(Kobe University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e強化学習|動的環境|環境変化の発生時期|環境変化検出|エントロピー|reinforcement learning|dyanmic environment|timing of the appearance of environmental changes|detection of environmental change|entropy\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e近年，強化学習をエージェントの制御規則の適応的調節・獲得などに応用しようとする試みが盛んであるが，実用性といった観点から，動的環境への適応能力が問題点の一つとなっている．具体的には，過去の学習内容が新しい環境への適応を阻害する可能性があり，このような場合，新しい環境に適応するには多くの試行錯誤を必要とする．この点に留意し筆者らは，まず，強化学習における動的環境の問題クラスを整理し，環境変化の一検出法を提案している．本稿では，まずボルツマン選択法を用いた行動選択確率のエントロピーによって学習初期、学習中期、学習後期の3つの時期を定義する。その上で、環境変化の発生時期によって、環境変化検出法のパラメータを切替えることにより、検出精度の向上とそれによる変化適応性能の向上を試みる。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e747 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 6","offer_id":46385017127151,"sku":"IEEJ-ST13012-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_a6f59a60-915c-4ba5-ac9f-18174dd2830d.png?v=1744332330","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-st13012","provider":"電気学会 電子図書館","version":"1.0","type":"link"}