{"product_id":"ieej-zt20213-086","title":"階層型強化学習と方策蒸留を用いた車両速度追従制御","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e全国大会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003e3-086\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【全国大会】令和3年電気学会全国大会論文集\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2021\/03\/01\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eVehicle Velocity Tracking using Hierarchical Reinforcement Learning and Policy Distillation\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e夏有輝也（横浜国立大学）,濱上知樹（横浜国立大学）,菅家正康（明電舎）,吉田健人（明電舎）,庭川誠（明電舎）\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eYukiya Natsu (Graduate School of Engineering Science, Yokohama National University),Tomoki Hamagami (Faculty of Engineering, Yokohama National University),Masayasu Kanke (MEIDENSHA CORPORATION),Kento Yoshida (MEIDENSHA CORPORATION),Makoto Niwakawa (MEIDEN\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e階層型強化学習|方策蒸留|車両速度追従制御|ドライブロボット|深層強化学習|転移学習|Hierarchical Reinforcement Learning|Policy Distillation|Vehicle Velocity Tracking Control|Driving Robot|Deep Reinforcement Learning|Transfer Learning\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e少ないサンプル数で方策の学習が可能な強化学習を用いた速度追従制御を提案する。強化学習を用いた制御は，少ない誤差で追従可能だが，多くの試行を必要とする。提案手法では，階層型強化学習を用いて事前に異なる車両間の共通知識を下位方策として事前学習し，その知識を転移することで学習に必要なサンプル数を削減する。また，知識の転移だけでは，事前に学習した下位方策次第で実現可能な行動が制限され，追従精度の改善に限界がある。そこで，方策蒸留により方策構造を非階層型に変更し，単一方策を用いた強化学習により追加学習することで，さ\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e541 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格440円\/会員価格220円） \/ A4 \/ 2","offer_id":46401987313903,"sku":"IEEJ-ZT20213-086-PDF","price":440.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_24d5cd97-7cad-48b4-b73f-efb8c9a88b57.png?v=1744966383","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-zt20213-086","provider":"電気学会 電子図書館","version":"1.0","type":"link"}