マルチエージェント環境における間接報酬に関する一考察
マルチエージェント環境における間接報酬に関する一考察
カテゴリ: 研究会(論文単位)
論文No: ST16001
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2016/03/08
タイトル(英語): A Study of an Indirect Reward on Multi-agent Environments
著者名: 宮崎 和光(大学評価?学位授与機構)
著者名(英語): Kazuteru Miyazaki(National Institution for Academic Degrees and University Evaluation)
キーワード: マルチエージェント学習|間接報酬|直接報酬|不完全知覚問題|Profit Sharing|強化学習|Multi-agent Learning|Indirect Reward|Direct Reward|Perceptual Aliasing Problem|Profit Sharing|Reinforcement Learning
要約(日本語): 複数のエージェントが同時に学習を行うマルチエージェント学習では、直接報酬を得たエージェント以外のエージェントにいかに報酬を分配するかという間接報酬の問題がある。著者らはこれまで間接報酬の「負の効果」を解析した定理を示しているが、本論文では、間接報酬による不完全知覚の解消といった「正の効果」に着目する。先の定理との関係を整理した上で、不完全知覚を解消する手法の提案を行い、数値例により有効性を示す。
要約(英語): In a multi-agent learning that multiple agents learn at the same time, there is a problem about an indirect reward that is how to distribute the reward to agents that do not receive a direct reward. We have been shown the theorem about "negative effect" of the indirect reward. This paper focuses on the "positive effect" such as the elimination of the perceptual aliasing problem by the indirect reward. Through the organizing of the relationship between the previous theorem, we propose a method to eliminate the perceptual aliasing problem and show the effectiveness of the proposed method by numerical examples.
原稿種別: 日本語
PDFファイルサイズ: 748 Kバイト
受取状況を読み込めませんでした
