転移強化学習のためのPCクラスタを用いた再利用知識選択アルゴリズムの開発
転移強化学習のためのPCクラスタを用いた再利用知識選択アルゴリズムの開発
カテゴリ: 部門大会
論文No: MC1-5
グループ名: 【C】2021年電気学会電子・情報・システム部門大会
発行日: 2021/09/08
タイトル(英語): Development of Reusing Knowledge Selection Algorithm Using PC Cluster for Transfer Reinforcement Learning
著者名: 坂本 裕都(東京工芸大学),河野 仁(東京工芸大学),温 文(東京大学),藤井 浩光(千葉工業大学),鈴木 剛(東京電機大学)
著者名(英語): Yuto Sakamoto (Tokyo Polytechnic University),Hitoshi Kono (Tokyo Polytechnic University),Wen Wen (The University of Tokyo),Hiromitsu Fujii (Chiba Institute of Technology),Tsuyoshi Suzuki (Tokyo Denki University)
キーワード: 強化学習|転移学習|PCクラスタ|知識選択|自律運転|Reinforcement learning|Transfer learning|PC Cluster|Knowledge selection|Autonomous driving
要約(日本語): 近年,少子高齢化などの問題により,人の代わりにタスクを遂行する知能ロボットが期待されている.知能ロボットには学習アルゴリズムが有用とされており,自ら試行錯誤的に行動することで最適解を学習し,方策として獲得する強化学習がある.学習時間短縮のために,方策を別のタスクで再利用する転移学習という手法が存在する.転移学習はタスクや環境に応じて適した方策を用いなければ効果が得られないため環境やタスクに応じて適した方策を効率的に選択するために活性化拡散モデルを活用した知識選択手法であるSAP-net が提案されているが,実装時に計算時間が長いという課題が存在する.計算時間の低減にはPCクラスタによる並列計算が有用であると考えられ,本発表ではSAP-netのためのPCクラスタを用いた方策選択アルゴリズムの開発と,シニアカーを用いた自律運転システムについて報告する.
PDFファイルサイズ: 1,210 Kバイト
受取状況を読み込めませんでした
