商品情報にスキップ
1 1

有用な既知の方策を部分的に再利用する矯正的Q-learning

有用な既知の方策を部分的に再利用する矯正的Q-learning

通常価格 ¥330 JPY
通常価格 セール価格 ¥330 JPY
セール 売り切れ
税込

カテゴリ: 研究会(論文単位)

論文No: ST11026

グループ名: 【C】電子・情報・システム部門 システム研究会

発行日: 2011/12/03

タイトル(英語): A Reformative Q-learning which Partially Reuses Useful Known Policies

著者名: 斎藤 雅矩(神奈川大学),増田 和明(神奈川大学),栗原 謙三(神奈川大学)

著者名(英語): Saito Masanori(Kanagawa University),Masuda Kazuaki(Kanagawa University),Kurihara Kenzo(Kanagawa University)

キーワード: 機械学習|強化学習|Q学習|再学習|Machine Learning|Reinforcement Learning|Q-Learning|Relearning

要約(日本語): 本研究では,環境が変化する学習問題において,「環境(報酬)が似ている問題に対して獲得される方策は似ている」という仮説を立て,環境変化前の方策を修正するだけで変更後の方策を効率よく獲得することを目的とした再学習法,すなわち「矯正的Q-learning(reformative Q-learning)」を提案する。

原稿種別: 日本語

PDFファイルサイズ: 1,216 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する