商品情報にスキップ
1 1

環境変化の発生時期を考慮した強化学習

環境変化の発生時期を考慮した強化学習

通常価格 ¥330 JPY
通常価格 セール価格 ¥330 JPY
セール 売り切れ
税込

カテゴリ: 研究会(論文単位)

論文No: ST13012

グループ名: 【C】電子・情報・システム部門 システム研究会

発行日: 2013/05/31

タイトル(英語): Reinforcement learning taking account a timing of the appearance of environmental cahnges

著者名: 永吉 雅人(新潟県立看護大学),村尾 元(神戸大学),玉置 久(神戸大学)

著者名(英語): Nagayoshi Masato(Niigata College of Nursing),Murao Hajime(Kobe University),Tamaki Hisashi(Kobe University)

キーワード: 強化学習|動的環境|環境変化の発生時期|環境変化検出|エントロピー|reinforcement learning|dyanmic environment|timing of the appearance of environmental changes|detection of environmental change|entropy

要約(日本語): 近年,強化学習をエージェントの制御規則の適応的調節・獲得などに応用しようとする試みが盛んであるが,実用性といった観点から,動的環境への適応能力が問題点の一つとなっている.具体的には,過去の学習内容が新しい環境への適応を阻害する可能性があり,このような場合,新しい環境に適応するには多くの試行錯誤を必要とする.この点に留意し筆者らは,まず,強化学習における動的環境の問題クラスを整理し,環境変化の一検出法を提案している.本稿では,まずボルツマン選択法を用いた行動選択確率のエントロピーによって学習初期、学習中期、学習後期の3つの時期を定義する。その上で、環境変化の発生時期によって、環境変化検出法のパラメータを切替えることにより、検出精度の向上とそれによる変化適応性能の向上を試みる。

原稿種別: 日本語

PDFファイルサイズ: 747 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する