商品情報にスキップ
1 1

強化学習における動的環境の問題クラスと環境変化の検出法

強化学習における動的環境の問題クラスと環境変化の検出法

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 部門大会

論文No: TC15-6

グループ名: 【C】平成24年電気学会電子・情報・システム部門大会講演論文集

発行日: 2012/09/05

タイトル(英語): Classification of Dynamic Environments and Detection Methods of Environmental Changes for Reinforcement Learning

著者名: 永吉 雅人(新潟県立看護大学),村尾 元(神戸大学),玉置 久(神戸大学)

著者名(英語): Masato Nagayoshi(Niigata College of Nursing),Hajime Murao(Kobe University),Hisashi Tamaki(Kobe University)

キーワード: 強化学習|動的環境|環境変化検出|適応的共構成|状態・行動空間構成エントロピー|reinforcement learning|dynamic environment|detection of environmental changes|adaptive co-construction|state and action spaces designentropy

要約(日本語): 強化学習は,実用性といった観点から,状態空間や行動空間を予め適切に設計することが難しい.この点に留意し,状態空間および行動空間を共に適応的構成する計算モデルについての検討を進めており,これまで状態空間と行動空間の適応的共構成法を提案している. 本稿では,さらに実用性の向上を目指して,動的環境に焦点をあて,動的環境における問題クラスを整理する.次に,動的環境の問題クラスのうち,3つのタイプに焦点をあて,2つの環境変化検出法を提案する.さらに,動的環境下における経路計画問題を対象とした計算機実験を通して,環境変化の検出法の有効性について検討する.

PDFファイルサイズ: 4,364 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する