強化学習におけるメタパラメータを浮き沈みさせる効果の一検討:温度パラメータへの導入
強化学習におけるメタパラメータを浮き沈みさせる効果の一検討:温度パラメータへの導入
カテゴリ: 研究会(論文単位)
論文No: ST17074
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2017/12/08
タイトル(英語): A study on effectiveness of meta-parameters having ups and downs in reinforcement learning:Introduction to a temperature parameter of Boltzmann action selection
著者名: 永吉 雅人(新潟県立看護大学),玉置 久(神戸大学)
著者名(英語): Masato Nagayoshi(Niigata College of Nursing),Hisashi Tamaki(Kobe University)
キーワード: 強化学習|メタパラメータ|揺らぎ|温度|ボルツマン選択法|個性創出|reinforcement learning|meta-parameter|waveform changing|temperature|Boltzmann action selection|individuality creation
要約(日本語): 本稿では,強化学習エージェントにおけるメタパラメータの一つであるボルツマン選択法における温度パラメータを波形変化(浮き沈み)させた効果について、計算機実験を通して検討する。
要約(英語): In this paper, we confirm the effectiveness of of a temperature parameter of Boltzmann action selection having ups and downs in reinforcement learning through a computational experiment.
原稿種別: 日本語
PDFファイルサイズ: 308 Kバイト
受取状況を読み込めませんでした
