強化学習における状態空間と行動空間の相互作用を生み出す適応的共構成法
強化学習における状態空間と行動空間の相互作用を生み出す適応的共構成法
カテゴリ: 研究会(論文単位)
論文No: ST13122
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2013/11/24
タイトル(英語): The adaptive co-construction method which gives rise to interactions between state and action spaces
著者名: 永吉 雅人(新潟県立看護大学),村尾 元(神戸大学),玉置 久(神戸大学)
著者名(英語): Nagayoshi Masato(Niigata College of Nursing),Murao Hajime(Kobe University),Tamaki Hisashi(Kobe University)
キーワード: 強化学習|状態・行動空間共構成法|空間間相互作用|エントロピー|reinforcement learning|co-construction of state and action spaces|interactions between state and action spaces|entropy
要約(日本語): 筆者らは、強化学習における状態空間と行動空間の適応的共構成法を提案している。しかしながら、この方法は学習回数の十分性を評価するにあたり2つの閾値を設定する必要があり、その設定に課題が残っていた。本稿では、学習回数の十分性を評価するための2つの閾値を必要としないように、エントロピーを用いた指標を導入し、新たな状態空間と行動空間の適応的共構成法を提案する。さらに、空間間の相互作用に注目してその効果と性能を検討する。
原稿種別: 日本語
PDFファイルサイズ: 511 Kバイト
受取状況を読み込めませんでした
