商品情報にスキップ
1 1

ニューラルネットワークを利用した状態の時空間分割型強化学習システム

ニューラルネットワークを利用した状態の時空間分割型強化学習システム

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: GS14-6

グループ名: 【C】平成15年電気学会電子・情報・システム部門大会講演論文集

発行日: 2003/08/29

タイトル(英語): Reinforcement Learning System with Temporal-and-spatial State Division Using Neural Network

著者名: 大林 正直(山口大学),小田 携(山口大学),小林 邦和(山口大学),呉本尭 (山口大学)

著者名(英語): Masanao Obayashi(Yamaguchi University),Tazusa Oda(Yamaguchi University),Kunikazu Kobayashi(Yamaguchi University),Ben-yao Wu(Yamaguchi University)

キーワード: 強化学習|状態の時空間分割|ニューラルネットワークニューラルネットワーク|reinforcement learning|temporal-and-spatial state division|neural network

要約(日本語): 強化学習はエージェントの行動の結果、外部から与えられる報酬や罰を基により多くの報酬を得るための学習法である。強化学習法は教師信号を必要としないため、生体の自然な学習を模倣しており、近年、特に脚光を浴びてきている分野である。ところで、強化学習はその適応能力により、環境の変化にも対応可能な学習法である。しかしながら、環境変化が周期的に変化し、従来の強化学習方式ではその変化に対応できない場合がある。例えば、学習中に、環境が周期的に変化すると、環境への適応学習が振動的になり学習がうまくいかない。そこで、本稿では、環境が周期的に変化する場合において、環境の状態を、空間的‐時間的に分割し、上記周期的環境変化に対応可能な強化学習システムを提案する。通路が周期的に変化する迷路環境のシミュレーションにおいて、提案法の有効性を示した。

PDFファイルサイズ: 2,914 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する