1
/
の
1
有用な既知の方策を部分的に再利用する矯正的Q-learning
有用な既知の方策を部分的に再利用する矯正的Q-learning
通常価格
¥330 JPY
通常価格
セール価格
¥330 JPY
単価
/
あたり
税込
カテゴリ: 研究会(論文単位)
論文No: ST11026
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2011/12/03
タイトル(英語): A Reformative Q-learning which Partially Reuses Useful Known Policies
著者名: 斎藤 雅矩(神奈川大学),増田 和明(神奈川大学),栗原 謙三(神奈川大学)
著者名(英語): Saito Masanori(Kanagawa University),Masuda Kazuaki(Kanagawa University),Kurihara Kenzo(Kanagawa University)
キーワード: 機械学習|強化学習|Q学習|再学習|Machine Learning|Reinforcement Learning|Q-Learning|Relearning
要約(日本語): 本研究では,環境が変化する学習問題において,「環境(報酬)が似ている問題に対して獲得される方策は似ている」という仮説を立て,環境変化前の方策を修正するだけで変更後の方策を効率よく獲得することを目的とした再学習法,すなわち「矯正的Q-learning(reformative Q-learning)」を提案する。
原稿種別: 日本語
PDFファイルサイズ: 1,216 Kバイト
受取状況を読み込めませんでした
