経験強化による尤度最大化を用いたエージェントの学習アルゴリズム
経験強化による尤度最大化を用いたエージェントの学習アルゴリズム
カテゴリ: 部門大会
論文No: GS13-5
グループ名: 【C】平成14年電気学会電子・情報・システム部門大会講演論文集
発行日: 2002/09/02
タイトル(英語): An Agent Learning Algorithm Using the Likelihood Maximization by the Experience Reinforcement
著者名: 高橋 進(千葉工業大学),山口 智(千葉工業大学),板倉 秀清(千葉工業大学)
著者名(英語): Susumu Takahashi(Chiba Institute of Technology),Satoshi Yamaguchi(Chiba Institute of Technology),Hidekiyo Itakura(Chiba Institute of Technology)
キーワード: 強化学習|尤度最大化プロフィットシェアリング|プロフィットシェアリング|Reinforcement Learning|Likelihood Maximization|Experience Reinforcement|Profit Sharing
要約(日本語): 強化学習に望まれる性能には、結果としてなるべく大きい報酬を得るという最適性と、学習途中でもなるべく報酬を得続けるという効率性の二つの側面がある。効率性を重視する接近を経験強化型と呼び、 代表的なものとしてProfit Sharingがある。経験強化型は環境同定型にくらべ、行動を逐次的に強化するため学習時間が短縮される。本研究では、Profit Sharingを尤度最大化に導入する手法を提案する。従来の尤度を用いた学習法では多くの繰り返しが必要であったが、尤度の更新に強化関数を用いることで学習を短縮できる。また、尤度最大化を利用することにより報酬が必要無く、設定しなければならないパラメータを削減することができる。
PDFファイルサイズ: 1,459 Kバイト
受取状況を読み込めませんでした
