エキスパートのデータを利用できる強化学習に関する研究

¥440 JPY

セール売り切れ

税込

カテゴリ: 部門大会

論文No: PS4-3

グループ名: 【C】平成28年電気学会電子・情報・システム部門大会講演論文集

発行日: 2016/08/31

タイトル(英語): A study on reinforcement learning using the data of expert

著者名: 坂本和也(松江工業高等専門学校),幸田憲明(松江工業高等専門学校)

著者名(英語): Kazuya Sakamoto|Noriaki Kouda

キーワード: 逆強化学習|運動制御|Inverse reinforcement learning|Motion control

要約(日本語): ロボットが自律的に最適な行動を獲得させることができる強化学習の研究が行われている．これは，動作の良し悪しによって与えられる報酬と呼ばれるスカラー量を手がかりに学習を進めていくものである．これまでどの状態の時に報酬をどのくらい与えるかについては使用者が予め決定するものであったが，複雑な動作を獲得させたい問題では，良好な学習結果が得られる報酬を決定することが困難な場合がある．そこで最適な行動を得やすくするために報酬を推定する手法として逆強化学習が提案されている．逆強化学習では，最も良好な行動のQ値とそれに準じた行動のQ値を基に決定される制約条件から各状態での報酬を求めることができる．今回は周回コースやなどの運動を制御する問題を取り上げ，逆強化学習の性能について基本的な調査を行った結果について報告する．

PDFファイルサイズ: 494 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 2

数量

詳細を表示する

国/地域

エキスパートのデータを利用できる強化学習に関する研究

エキスパートのデータを利用できる強化学習に関する研究