{"product_id":"ieej-st20049ct20115","title":"エキスパート群から方策推定を行う敵対的逆強化学習","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST20049,CT20115\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム\/【C】電子・情報・システム部門 制御合同研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2020\/12\/13\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eAdversarial Inverse Reinforcement Learning to estimate policies from multiple experts\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e山下 廣大(横浜国立大学),濱上 知樹(横浜国立大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eKodai Yamashita(Yokohama National University),Tomoki Hamagami(Yokohama National University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e逆強化学習|模倣学習|敵対的逆強化学習|Inverse Reinforcement Learning|Imitation Learning|AIRL\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e本研究ではInformation Maximizing Generative Adversarial Imitation Learningを逆強化学習手法に拡張する．エキスパートが複数存在する下で環境の変化にロバストな報酬関数を学習し，最適方策が複数存在する環境における方策の獲得を目的とする．提案手法によって学習時とテスト時で環境が変動する場合でも，エキスパートを反映させた未学習の方策の生成を可能にした．\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(英語): \u003c\/strong\u003eIn this study, we extend Information Maximizing Generative Adversarial Imitation Learning as a method of inverse reinforcement learning._x000D_\nThe purpose is to learn a reward function that is robust to changes in the environment, and to acquire policy in an environment where there are multiple optimal policies.\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e1,297 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 5","offer_id":46393292095727,"sku":"IEEJ-ST20049CT20115-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_2cee47ec-2f2d-4430-a45e-12a289f3a656.png?v=1744687117","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-st20049ct20115","provider":"電気学会 電子図書館","version":"1.0","type":"link"}