1
         / 
        の
        1
      
      
    エキスパートのデータを利用できる強化学習に関する研究
エキスパートのデータを利用できる強化学習に関する研究
通常価格
          
            ¥440 JPY
          
      
          通常価格
          
            
              
                
              
            
          セール価格
        
          ¥440 JPY
        
      
      
        単価
        
          
          /
           あたり 
          
          
        
      
    税込
 
カテゴリ: 部門大会
論文No: PS4-3
グループ名: 【C】平成28年電気学会電子・情報・システム部門大会講演論文集
発行日: 2016/08/31
タイトル(英語): A study on reinforcement learning using the data of expert
著者名: 坂本 和也(松江工業高等専門学校),幸田 憲明(松江工業高等専門学校)
著者名(英語): Kazuya Sakamoto|Noriaki Kouda
キーワード: 逆強化学習|運動制御|Inverse reinforcement learning|Motion control
要約(日本語): ロボットが自律的に最適な行動を獲得させることができる強化学習の研究が行われている.これは,動作の良し悪しによって与えられる報酬と呼ばれるスカラー量を手がかりに学習を進めていくものである.これまでどの状態の時に報酬をどのくらい与えるかについては使用者が予め決定するものであったが,複雑な動作を獲得させたい問題では,良好な学習結果が得られる報酬を決定することが困難な場合がある.そこで最適な行動を得やすくするために報酬を推定する手法として逆強化学習が提案されている.逆強化学習では,最も良好な行動のQ値とそれに準じた行動のQ値を基に決定される制約条件から各状態での報酬を求めることができる.今回は周回コースやなどの運動を制御する問題を取り上げ,逆強化学習の性能について基本的な調査を行った結果について報告する.
PDFファイルサイズ: 494 Kバイト
受取状況を読み込めませんでした
