商品情報にスキップ
1 1

階層型強化学習と方策蒸留を用いた車両速度追従制御

階層型強化学習と方策蒸留を用いた車両速度追従制御

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 全国大会

論文No: 3-086

グループ名: 【全国大会】令和3年電気学会全国大会論文集

発行日: 2021/03/01

タイトル(英語): Vehicle Velocity Tracking using Hierarchical Reinforcement Learning and Policy Distillation

著者名: 夏有輝也(横浜国立大学),濱上知樹(横浜国立大学),菅家正康(明電舎),吉田健人(明電舎),庭川誠(明電舎)

著者名(英語): Yukiya Natsu (Graduate School of Engineering Science, Yokohama National University),Tomoki Hamagami (Faculty of Engineering, Yokohama National University),Masayasu Kanke (MEIDENSHA CORPORATION),Kento Yoshida (MEIDENSHA CORPORATION),Makoto Niwakawa (MEIDEN

キーワード: 階層型強化学習|方策蒸留|車両速度追従制御|ドライブロボット|深層強化学習|転移学習|Hierarchical Reinforcement Learning|Policy Distillation|Vehicle Velocity Tracking Control|Driving Robot|Deep Reinforcement Learning|Transfer Learning

要約(日本語): 少ないサンプル数で方策の学習が可能な強化学習を用いた速度追従制御を提案する。強化学習を用いた制御は,少ない誤差で追従可能だが,多くの試行を必要とする。提案手法では,階層型強化学習を用いて事前に異なる車両間の共通知識を下位方策として事前学習し,その知識を転移することで学習に必要なサンプル数を削減する。また,知識の転移だけでは,事前に学習した下位方策次第で実現可能な行動が制限され,追従精度の改善に限界がある。そこで,方策蒸留により方策構造を非階層型に変更し,単一方策を用いた強化学習により追加学習することで,さ

原稿種別: 日本語

PDFファイルサイズ: 541 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する