商品情報にスキップ
1 1

連続行動出力を持つ学習オートマトンの提案

連続行動出力を持つ学習オートマトンの提案

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: MC2-1

グループ名: 【C】平成26年電気学会電子・情報・システム部門大会講演論文集

発行日: 2014/09/03

タイトル(英語): Continuous Action Reinforcement Learning Automaton with the Baysian Estimator

著者名: 田中 洋平(松江工業高等専門学校),原 元司(松江工業高等専門学校)

著者名(英語): Yohei Tanaka(Matsue College of Technology),Motoshi Hara(Matsue College of Technology)

キーワード: 学習オートマトン|強化法|Actor-Critic法|ベイズ推定器|Learning Automaton|Reinforcement scheme|Actor-Critic method|Bayesian estimator

要約(日本語):  近年, 教師なし学習の形態として強化学習が活発的に研究されているが, その基礎となったのが学習オートマトンである. しかし, 従来の学習オートマトンは有限な行動集合を対象としており, 連続な行動出力が可能なものは存在せず実用面で問題がある. そこで, 本研究ではこの欠点を解決することを目的とし, 強化学習手法の一種であるActor-Critic法の考え方を取り込んだ学習オートマトンを提案する. 具体的には, Critic部にベイズ推定器を用いた学習オートマトンの概要を示し, 数値シミュレーションによってその有効性を示す.

PDFファイルサイズ: 2,099 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する