強化学習に対する報酬量に応じた反応時間の効果
強化学習に対する報酬量に応じた反応時間の効果
カテゴリ: 研究会(論文単位)
論文No: ST17015
グループ名: 【C】電子・情報・システム部門 システム研究会
発行日: 2017/06/10
タイトル(英語): The effect of a response time model with reward magnitude on reinforcement learning
著者名: 渡邊 駿(釧路工業高等専門学校)
著者名(英語): Shun Watanabe(National Institute of Technology, Kushiro College)
キーワード: 強化学習|報酬量|反応時間|reinforcement learning|reward magnitude|response time
要約(日本語): 環境との試行錯誤を通して行動を学習する強化学習は機械学習の一種であり,脳の神経組織である大脳基底核は強化学習と同様の機能を司ることが知られている。大脳基底核は環境から与えられる報酬量に応じて運動の反応時間を変化させることも知られており,森田らは報酬量に応じた反応時間を表現する関係式を提案した。本研究では,強化学習における報酬量に応じた反応時間の効果を計算機シミュレーションにより調査した。
要約(英語): Reinforcement learning is a machine learning algorithm. The basal ganglia performs reinforcement learning and changes a speed of a saccadic response time according to a reward modulation. Morita et al. proposed a mathematical model of the saccadic response time with reward magnitude. I investigated effect of the response time model on reinforcement learning in computational experiments.
原稿種別: 日本語
PDFファイルサイズ: 2,475 Kバイト
受取状況を読み込めませんでした
