{"product_id":"ieej-zt163022","title":"領域価値関数を組み込んだQ-learning手法の提案","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e全国大会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003e3-022\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【全国大会】平成28年電気学会全国大会論文集\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2016\/03\/05\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eImproving Q-learning by including the area value fuction\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e河原崎 俊之祐(神奈川大学),瀬古沢 照治(神奈川大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eKawarasaki Shunnosuke(Kanagawa University),Sekozawa Teruji(Kanagawa University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e機械学習,強化学習,Q-learning,TD-learning\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e機械学習の分野において、エージェントが環境との相互作用を通して「賢い」行動を獲得する手法が研究されている。そのなかでも，代表的なものとしてQ‐learningがある。Q-learningの大きな利点として、実用的な問題に対して広範囲で適用可能であることが挙げられる。しかし、Q‐learningは、多くの学習時間を必要とし学習が遅いという問題がある。そこで、本研究では従来のQ‐learningに領域価値関数を活用することによってQ‐learningの高速化を目指す。遷移先の領域価値関数を把握することで危険な領域への行動を避け失敗行動を選択しないようにする。提案手法はオリジナルのQ‐learningよりも少ない時間で有用な方策を得ることが確認でき、学習の高速化に有効である。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e380 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格440円\/会員価格220円） \/ A4 \/ 2","offer_id":46400791544047,"sku":"IEEJ-ZT163022-PDF","price":440.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_11421731-dca0-42df-8d32-0d4a0154bdc9.png?v=1744929181","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-zt163022","provider":"電気学会 電子図書館","version":"1.0","type":"link"}