{"product_id":"ieej-zt20213-089","title":"模範的軌道を用いた逆強化学習導入によるモデルフリー制御の実現","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e全国大会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003e3-089\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【全国大会】令和3年電気学会全国大会論文集\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2021\/03\/01\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eRealization of a Model Free Control via Inverse Reinforcement Learning using Exemplary Trajectory\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e今村麟太郎（千葉大学）,荒井幸代（千葉大学）\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eRintaro Imamura (Chiba University),Sachiyo Arai (Chiba University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e敵対生成型逆強化学習|自律システム|Adversarial Inverse Reinforcement Learning|autonomous systems\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003eモデルフリーの方法として強化学習を導入し，AUV による衝突回避問題を通じてその効果を検証する。具体的には，強化学習適用においてボトルネックとされる報酬設計問題や，状態行動空間の離散表現に起因する爆発に注目する。前者に対しては，敵対型逆強化学習（Adversarial Inverse Reinforcement Learning）を，後者に対しては Actor-Critic を導入した方法を提案する。また，計算機実験によって，制御則（方策）を得るまでの学習効率と，その性能を評価した。これらの結果から，提案\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e472 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格440円\/会員価格220円） \/ A4 \/ 2","offer_id":46401986167023,"sku":"IEEJ-ZT20213-089-PDF","price":440.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_65f5ebbd-d71e-4535-a6cf-b1de6d701159.png?v=1744966276","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-zt20213-089","provider":"電気学会 電子図書館","version":"1.0","type":"link"}