階層型強化学習と方策蒸留を用いた車両速度追従制御

¥440 JPY

セール売り切れ

税込

カテゴリ: 全国大会

論文No: 3-086

グループ名: 【全国大会】令和3年電気学会全国大会論文集

発行日: 2021/03/01

タイトル(英語): Vehicle Velocity Tracking using Hierarchical Reinforcement Learning and Policy Distillation

著者名: 夏有輝也（横浜国立大学）,濱上知樹（横浜国立大学）,菅家正康（明電舎）,吉田健人（明電舎）,庭川誠（明電舎）

著者名(英語): Yukiya Natsu (Graduate School of Engineering Science, Yokohama National University),Tomoki Hamagami (Faculty of Engineering, Yokohama National University),Masayasu Kanke (MEIDENSHA CORPORATION),Kento Yoshida (MEIDENSHA CORPORATION),Makoto Niwakawa (MEIDEN

要約(日本語): 少ないサンプル数で方策の学習が可能な強化学習を用いた速度追従制御を提案する。強化学習を用いた制御は，少ない誤差で追従可能だが，多くの試行を必要とする。提案手法では，階層型強化学習を用いて事前に異なる車両間の共通知識を下位方策として事前学習し，その知識を転移することで学習に必要なサンプル数を削減する。また，知識の転移だけでは，事前に学習した下位方策次第で実現可能な行動が制限され，追従精度の改善に限界がある。そこで，方策蒸留により方策構造を非階層型に変更し，単一方策を用いた強化学習により追加学習することで，さ

原稿種別: 日本語

PDFファイルサイズ: 541 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 2

数量

詳細を表示する

国/地域

階層型強化学習と方策蒸留を用いた車両速度追従制御

階層型強化学習と方策蒸留を用いた車両速度追従制御