マルチエージェント強化学習における周期的に1以上の値をとる割引率に関する基礎的検討
マルチエージェント強化学習における周期的に1以上の値をとる割引率に関する基礎的検討
カテゴリ: 研究会(論文単位)
論文No: CT19126
グループ名: 【C】電子・情報・システム部門 制御研究会
発行日: 2019/12/08
タイトル(英語): A basic study of the discount factor getting periodically 1 or more in multi-agent reinforcement learning.
著者名: 永吉 雅人(新潟県立看護大学),エルダトン サイモン(新潟県立看護大学),玉置 久(神戸大学)
著者名(英語): Masato Nagayoshi(Niigata College of Nursing),Simon Elderton(Niigata College of Nursing),Hisashi Tamaki(Kobe University)
キーワード: 強化学習|マルチエージェント|役割分化|メタパラメータ|揺らぎ|割引率|reinforcement learning|multi-agent|role differentiation|meta-parameter|waveform changing|discount factor
要約(日本語): 筆者らは,強化学習エージェントにおける個性の創出を目指して、「認知の歪み」に注目し、それを模倣したメタパラメータを波形変化(浮き沈み)するメタパラメータである揺らぎパラメータの導入を提案している。本稿では計算機実験により、マルチエージェントタスクの一つである追跡問題において、エージェントの割引率が周期的に1以上の値をとる場合の役割分化性能を確認する.
要約(英語): We have proposed a promoting method of role differentiation using "cognitive distortion" in multi-agent reinforcement learning. In the proposed method, we have introduced wave-form changing parameter. Then we confirm the effectiveness of role differentiation by the discount factor getting periodically 1 or more through computational experiments using "Pursuit Game" as one of multi-agent tasks.
原稿種別: 日本語
PDFファイルサイズ: 938 Kバイト
受取状況を読み込めませんでした
