転移強化学習における環境適応性能向上を目的とした転移率自動調整法
転移強化学習における環境適応性能向上を目的とした転移率自動調整法
カテゴリ: 部門大会
論文No: MC1-4
グループ名: 【C】2021年電気学会電子・情報・システム部門大会
発行日: 2021/09/08
タイトル(英語): Automatic Transfer Rate Adjustment Method for Improving Environmental Adaptation in Transfer Reinforcement Learning
著者名: 佐藤 弘和(東京工芸大学),池 勇勳(北陸先端科学技術大学院大学),藤井 浩光(千葉工業大学),河野 仁(東京工芸大学)
著者名(英語): Hirokazu Sato (Tokyo Polytechnic University),Yonghoon Ji (Japan Advanced Institute of Science and Technology),Hiromitsu Fujii (Chiba Institute of Technology),Hitoshi Kono (Tokyo Polytechnic University)
キーワード: 強化学習|転移学習|レスキューロボット|LiDAR|Reinforcement learning|Transfer learning|Rescue robot|LiDAR
要約(日本語): 現在,災害現場などの情報収集でレスキューロボットが用いられているが,基本的にコントローラ操作などの遠隔操作で制御され,操作は訓練が必須である.そのため,ロボットが自律的に学習,動作することで人間の訓練が不要になると考えられる.ロボットの行動制御に強化学習と,学習した知識を再利用した転移学習を用いることが有用であると考えられるが過学習などの悪影響を受ける.転移学習において既存知識に頼りすぎてしまう過学習を回避するために,再利用度合いを調整する転移率を用いるが,これまで転移率はヒトの経験により設定されている.本発表では,転移率を環境とのインタラクションにより調整される関数として実装し,学習中に転移率を調整する手法を提案する.2次元グリッドワールドで強化学習した知識となるQ関数を,疑似的な3次元グリッドワールドに転移する実験の評価の結果について報告する.
PDFファイルサイズ: 957 Kバイト
受取状況を読み込めませんでした
