2報酬PS強化学習法の提案とその有効性の検証
2報酬PS強化学習法の提案とその有効性の検証
カテゴリ: 研究会(論文単位)
論文No: ST16029
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2016/07/09
タイトル(英語): Proposal of 2 reward PS reinforcement learning method and verification of the efficiency
著者名: 小玉 直樹(明治大学),宮崎 和光(独立行政法人大学改革支援・学位授与機構),小林 博明(明治大学)
著者名(英語): Naoki Kodama(Meiji University),Kazuteru Miyazaki(National Institution for Academic Degrees and Quality Enhancement of Higher Education),Hiroaki Kobayashi(Meiji University)
キーワード: 強化学習|PS法|機械学習|マルチエージェント|Reinforcement Learning|Profit Sharing|Machine Learning|Multi-agent
要約(日本語): 本論文では、PS法の効率向上のために2報酬PS強化学習を提案した。2報酬PS強化学習法では、従来のPS法から、安全度という要素を追加しその安全度に応じて正の場合は正の報酬を、負の場合は負の報酬を追加で与える。その後、検証に用いるkeepawayタスクについて述べ、それを用いて,従来のPS法とそれに罰を導入したPSwithEFP,それらに2報酬PS強化学習法を導入した方法で比較を行い、PS法の効率を向上させる事が出来るかどうか検証する。
要約(英語): In this paper, a two-reward PS reinforcement learning method is proposed to improve the efficiency of PS method. A degree of safety is introduced for each rule and depending on the values, additional negative or positive rewards are given to corresponding rules. The efficiency is shown through a keepaway task.
原稿種別: 日本語
PDFファイルサイズ: 1,550 Kバイト
受取状況を読み込めませんでした
