1
/
の
1
連続行動出力を持つ学習オートマトンの提案
連続行動出力を持つ学習オートマトンの提案
通常価格
¥440 JPY
通常価格
セール価格
¥440 JPY
単価
/
あたり
税込
カテゴリ: 部門大会
論文No: MC2-1
グループ名: 【C】平成26年電気学会電子・情報・システム部門大会講演論文集
発行日: 2014/09/03
タイトル(英語): Continuous Action Reinforcement Learning Automaton with the Baysian Estimator
著者名: 田中 洋平(松江工業高等専門学校),原 元司(松江工業高等専門学校)
著者名(英語): Yohei Tanaka(Matsue College of Technology),Motoshi Hara(Matsue College of Technology)
キーワード: 学習オートマトン|強化法|Actor-Critic法|ベイズ推定器|Learning Automaton|Reinforcement scheme|Actor-Critic method|Bayesian estimator
要約(日本語): 近年, 教師なし学習の形態として強化学習が活発的に研究されているが, その基礎となったのが学習オートマトンである. しかし, 従来の学習オートマトンは有限な行動集合を対象としており, 連続な行動出力が可能なものは存在せず実用面で問題がある. そこで, 本研究ではこの欠点を解決することを目的とし, 強化学習手法の一種であるActor-Critic法の考え方を取り込んだ学習オートマトンを提案する. 具体的には, Critic部にベイズ推定器を用いた学習オートマトンの概要を示し, 数値シミュレーションによってその有効性を示す.
PDFファイルサイズ: 2,099 Kバイト
受取状況を読み込めませんでした
