エキスパート群から方策推定を行う敵対的逆強化学習

¥330 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: ST20049,CT20115

グループ名: 【C】電子・情報・システム部門システム/【C】電子・情報・システム部門制御合同研究会

発行日: 2020/12/13

タイトル(英語): Adversarial Inverse Reinforcement Learning to estimate policies from multiple experts

著者名: 山下廣大(横浜国立大学),濱上知樹(横浜国立大学)

著者名(英語): Kodai Yamashita(Yokohama National University),Tomoki Hamagami(Yokohama National University)

要約(日本語): 本研究ではInformation Maximizing Generative Adversarial Imitation Learningを逆強化学習手法に拡張する．エキスパートが複数存在する下で環境の変化にロバストな報酬関数を学習し，最適方策が複数存在する環境における方策の獲得を目的とする．提案手法によって学習時とテスト時で環境が変動する場合でも，エキスパートを反映させた未学習の方策の生成を可能にした．

要約(英語): In this study, we extend Information Maximizing Generative Adversarial Imitation Learning as a method of inverse reinforcement learning._x000D_ The purpose is to learn a reward function that is robust to changes in the environment, and to acquire policy in an environment where there are multiple optimal policies.

原稿種別: 日本語

PDFファイルサイズ: 1,297 Kバイト

販売タイプ PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 5

数量

詳細を表示する

国/地域

エキスパート群から方策推定を行う敵対的逆強化学習

エキスパート群から方策推定を行う敵対的逆強化学習