1
/
の
1
領域価値関数を組み込んだQ-learning手法の提案
領域価値関数を組み込んだQ-learning手法の提案
通常価格
¥440 JPY
通常価格
セール価格
¥440 JPY
単価
/
あたり
税込
カテゴリ: 全国大会
論文No: 3-022
グループ名: 【全国大会】平成28年電気学会全国大会論文集
発行日: 2016/03/05
タイトル(英語): Improving Q-learning by including the area value fuction
著者名: 河原崎 俊之祐(神奈川大学),瀬古沢 照治(神奈川大学)
著者名(英語): Kawarasaki Shunnosuke(Kanagawa University),Sekozawa Teruji(Kanagawa University)
キーワード: 機械学習,強化学習,Q-learning,TD-learning
要約(日本語): 機械学習の分野において、エージェントが環境との相互作用を通して「賢い」行動を獲得する手法が研究されている。そのなかでも,代表的なものとしてQ‐learningがある。Q-learningの大きな利点として、実用的な問題に対して広範囲で適用可能であることが挙げられる。しかし、Q‐learningは、多くの学習時間を必要とし学習が遅いという問題がある。そこで、本研究では従来のQ‐learningに領域価値関数を活用することによってQ‐learningの高速化を目指す。遷移先の領域価値関数を把握することで危険な領域への行動を避け失敗行動を選択しないようにする。提案手法はオリジナルのQ‐learningよりも少ない時間で有用な方策を得ることが確認でき、学習の高速化に有効である。
原稿種別: 日本語
PDFファイルサイズ: 380 Kバイト
受取状況を読み込めませんでした
