商品情報にスキップ
1 1

エキスパートのデータを利用できる強化学習に関する研究

エキスパートのデータを利用できる強化学習に関する研究

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: PS4-3

グループ名: 【C】平成28年電気学会電子・情報・システム部門大会講演論文集

発行日: 2016/08/31

タイトル(英語): A study on reinforcement learning using the data of expert

著者名: 坂本 和也(松江工業高等専門学校),幸田 憲明(松江工業高等専門学校)

著者名(英語): Kazuya Sakamoto|Noriaki Kouda

キーワード: 逆強化学習|運動制御|Inverse reinforcement learning|Motion control

要約(日本語): ロボットが自律的に最適な行動を獲得させることができる強化学習の研究が行われている.これは,動作の良し悪しによって与えられる報酬と呼ばれるスカラー量を手がかりに学習を進めていくものである.これまでどの状態の時に報酬をどのくらい与えるかについては使用者が予め決定するものであったが,複雑な動作を獲得させたい問題では,良好な学習結果が得られる報酬を決定することが困難な場合がある.そこで最適な行動を得やすくするために報酬を推定する手法として逆強化学習が提案されている.逆強化学習では,最も良好な行動のQ値とそれに準じた行動のQ値を基に決定される制約条件から各状態での報酬を求めることができる.今回は周回コースやなどの運動を制御する問題を取り上げ,逆強化学習の性能について基本的な調査を行った結果について報告する.

PDFファイルサイズ: 494 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する