有用な既知の方策を部分的に再利用する矯正的Q-learning

¥330 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: ST11026

グループ名: 【C】電子・情報・システム部門システム研究会

発行日: 2011/12/03

タイトル(英語): A Reformative Q-learning which Partially Reuses Useful Known Policies

著者名: 斎藤雅矩(神奈川大学),増田和明(神奈川大学),栗原謙三(神奈川大学)

著者名(英語): Saito Masanori(Kanagawa University),Masuda Kazuaki(Kanagawa University),Kurihara Kenzo(Kanagawa University)

要約(日本語): 本研究では，環境が変化する学習問題において，「環境（報酬）が似ている問題に対して獲得される方策は似ている」という仮説を立て，環境変化前の方策を修正するだけで変更後の方策を効率よく獲得することを目的とした再学習法，すなわち「矯正的Q-learning（reformative Q-learning）」を提案する。

原稿種別: 日本語

PDFファイルサイズ: 1,216 Kバイト

販売タイプ PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

有用な既知の方策を部分的に再利用する矯正的Q-learning

有用な既知の方策を部分的に再利用する矯正的Q-learning