商品情報にスキップ
1 1

確率的傾斜法(SGA)を用いたニューロファジィネットワーク型強化学習システム

確率的傾斜法(SGA)を用いたニューロファジィネットワーク型強化学習システム

通常価格 ¥330 JPY
通常価格 セール価格 ¥330 JPY
セール 売り切れ
税込

カテゴリ: 研究会(論文単位)

論文No: ST14028

グループ名: 【C】電子・情報・システム部門 システム研究会

発行日: 2014/12/07

タイトル(英語): Reinforcement Learning Systems using Neuro-Fuzzy Networks and Stochastic Gradient Ascent Learning Algorithm (SGA)

著者名: 呉本 尭(山口大学),大林 正直(山口大学),小林 邦和(愛知県立大学),間普 真吾(山口大学)

著者名(英語): Kuremoto Takashi(Yamaguchi University),Obayashi Masanao(Yamaguchi University),Kobayashi Kunikazu(Aichi Prefectural University),Mabu Shingo(Yamaguchi University)

キーワード: 強化学習|部分観測マフコフ決定過程|確率的傾斜法|適応行動|時系列予測|ニューロファジィネットワーク|reinforcement learning|partially observable Markov decision process|stochastic gradient ascent|adaptive action|time series forecasting|neuro-fuzzy network

要約(日本語): 部分観測マルコフ決定過程下での強化学習の一つ手法として、確率的傾斜法(Stochastic Gradient Ascent)は木村らに提案され、これまで、自律移動ロボットの行動学習や、時系列予測などに応用され、多くの研究成果が得られている。本文では、著者らのこれまで提案した複数のSGAを用いたニューロファジィ型強化学習システムを紹介し、SGAの有効性及び今後の課題について述べる。

要約(英語): As a reinforcement learning algorithm solving problems in partially observable Markov decision processes (POMDPs), Kimura et al.'s SGA (Stochastic Gradient Ascent) has been used in many studies including adaptive action learning of autonomous mobile robots, time series forecasting, and so on. In this paper, reinforcement learning systems with SGA proposed in our previous works are introduced. The effectiveness and future works of these systems are reported.

原稿種別: 日本語

PDFファイルサイズ: 1,388 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する