予想失敗確率を組み込んだ行動選択戦略の提案とマルチエージェント環境下での有効性の検証
予想失敗確率を組み込んだ行動選択戦略の提案とマルチエージェント環境下での有効性の検証
カテゴリ: 研究会(論文単位)
論文No: ST16002
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2016/03/08
タイトル(英語): Proposal and Evaluation of an Action Selection Strategy with Expected Failure Probability in Multi-agent Learning
著者名: 古川 耕大(明治大学),宮崎 和光(大学評価・学位授与機構),小林 博明(明治大学)
著者名(英語): Koudai Furukawa(Meiji University),Kazuteru Miyazaki(National Institution for Academic Degrees and University Evaluation),Hiroaki Kobayashi(Meiji University)
キーワード: マルチエージェント学習|同時学習問題|Profit Sharing|Expected Failure Probability|強化学習|Keepaway task|Multi-agent Learning|Concurrent Learning Problem|Profit Sharing|Expected Failure Probability|Reinforcement Learning|Keepaway task
要約(日本語): 複数のエージェントが同時に学習を行うマルチエージェント学習では、同時学習問題と呼ばれる学習結果が不安定になる問題がある。この問題に対し、これまでいつかの手法が提案されているが、本論文では、行動選択戦略に予想失敗確率(EFP)を組み込む手法を提案する。従来手法では、罰により行動が不可能となる場合でも、提案手法は、EFPにより適応的な行動出力が期待できる。Keep awayタスクに適用し提案手法の有効性を確認する。
要約(英語): In a multi-agent learning that multiple agents learn at the same time, there is a problem called concurrent learning problem where the learning result becomes unstable. Though there are several method to resolve the problem, we propose a method that incorporates the expected failure probability (EFP) into the action selection strategy. The proposed method can be expected to output an adaptive behavior by the EFP. We confirm the effectiveness of the proposed method using Keepaway task.
原稿種別: 日本語
PDFファイルサイズ: 1,081 Kバイト
受取状況を読み込めませんでした
