隠れマルコフ環境下での階層型強化学習<p> - SSS(λ)アルゴリズムの性能評価 -
隠れマルコフ環境下での階層型強化学習<p> - SSS(λ)アルゴリズムの性能評価 -
カテゴリ: 部門大会
論文No: GS14-2
グループ名: 【C】平成15年電気学会電子・情報・システム部門大会講演論文集
発行日: 2003/08/29
タイトル(英語): Hierarchical Reinforcement Learning in Hidden Markov Environments - Experimental Verifications of SSS(lambda) Algorithm
著者名: 釜谷 博行(八戸工業高等専門学校),阿部 健一(東北大学)
著者名(英語): Hiroyuki Kamaya(Hachinohe National College of Technology),Kenichi Abe(Tohoku University)
キーワード: 隠れマルコフ環境|部分観測マルコフ環境|強化学習強化学習|hidden Markov environment|partially observable Markov decision process|reinforcement learning
要約(日本語): 近年,マルコフ環境下での強化学習アルゴリズムを隠れマルコフ環境に拡張し適用する試みが多くの研究者によってなされつつある。一般に,隠れマルコフ問題は近似解法によらざるを得ず,対象とする問題のクラスに応じてその性質をうまく利用した効率的なアルゴリズムを開発する必要がある。本研究では,環境モデルが未知で遅れ報酬を伴い,しかも従来の強化学習法では解くことのできない比較的規模の大きな隠れマルコフ問題を対象とする階層型強化学習SSS(λ)を提案する。本発表では,提案する学習アルゴリズムの有効性をシミュレーション実験により検証する。
PDFファイルサイズ: 4,757 Kバイト
受取状況を読み込めませんでした
