{"product_id":"ieej-st11026","title":"有用な既知の方策を部分的に再利用する矯正的Q-learning","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST11026\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2011\/12\/03\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eA Reformative Q-learning which Partially Reuses Useful Known Policies\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e斎藤 雅矩(神奈川大学),増田 和明(神奈川大学),栗原 謙三(神奈川大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eSaito Masanori(Kanagawa University),Masuda Kazuaki(Kanagawa University),Kurihara Kenzo(Kanagawa University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e機械学習|強化学習|Ｑ学習|再学習|Machine Learning|Reinforcement Learning|Q-Learning|Relearning\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e本研究では，環境が変化する学習問題において，「環境（報酬）が似ている問題に対して獲得される方策は似ている」という仮説を立て，環境変化前の方策を修正するだけで変更後の方策を効率よく獲得することを目的とした再学習法，すなわち「矯正的Q-learning（reformative Q-learning）」を提案する。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e1,216 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 6","offer_id":46376747008239,"sku":"IEEJ-ST11026-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_5db17a25-72b5-4679-b116-eb13458d37f8.png?v=1744114606","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-st11026","provider":"電気学会 電子図書館","version":"1.0","type":"link"}