環境変化の発生時期を考慮した強化学習

¥330 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: ST13012

グループ名: 【C】電子・情報・システム部門システム研究会

発行日: 2013/05/31

タイトル(英語): Reinforcement learning taking account a timing of the appearance of environmental cahnges

著者名: 永吉雅人(新潟県立看護大学),村尾元(神戸大学),玉置久(神戸大学)

著者名(英語): Nagayoshi Masato(Niigata College of Nursing),Murao Hajime(Kobe University),Tamaki Hisashi(Kobe University)

要約(日本語): 近年，強化学習をエージェントの制御規則の適応的調節・獲得などに応用しようとする試みが盛んであるが，実用性といった観点から，動的環境への適応能力が問題点の一つとなっている．具体的には，過去の学習内容が新しい環境への適応を阻害する可能性があり，このような場合，新しい環境に適応するには多くの試行錯誤を必要とする．この点に留意し筆者らは，まず，強化学習における動的環境の問題クラスを整理し，環境変化の一検出法を提案している．本稿では，まずボルツマン選択法を用いた行動選択確率のエントロピーによって学習初期、学習中期、学習後期の3つの時期を定義する。その上で、環境変化の発生時期によって、環境変化検出法のパラメータを切替えることにより、検出精度の向上とそれによる変化適応性能の向上を試みる。

原稿種別: 日本語

PDFファイルサイズ: 747 Kバイト

販売タイプ PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

環境変化の発生時期を考慮した強化学習

環境変化の発生時期を考慮した強化学習