強化学習に対する報酬量に応じた反応時間の効果

¥330 JPY

セール売り切れ

税込

カテゴリ: 研究会(論文単位)

論文No: ST17015

グループ名: 【C】電子・情報・システム部門システム研究会

発行日: 2017/06/10

タイトル(英語): The effect of a response time model with reward magnitude on reinforcement learning

著者名: 渡邊駿(釧路工業高等専門学校)

著者名(英語): Shun Watanabe(National Institute of Technology, Kushiro College)

要約(日本語): 環境との試行錯誤を通して行動を学習する強化学習は機械学習の一種であり，脳の神経組織である大脳基底核は強化学習と同様の機能を司ることが知られている。大脳基底核は環境から与えられる報酬量に応じて運動の反応時間を変化させることも知られており，森田らは報酬量に応じた反応時間を表現する関係式を提案した。本研究では，強化学習における報酬量に応じた反応時間の効果を計算機シミュレーションにより調査した。

要約(英語): Reinforcement learning is a machine learning algorithm. The basal ganglia performs reinforcement learning and changes a speed of a saccadic response time according to a reward modulation. Morita et al. proposed a mathematical model of the saccadic response time with reward magnitude. I investigated effect of the response time model on reinforcement learning in computational experiments.

原稿種別: 日本語

PDFファイルサイズ: 2,475 Kバイト

販売タイプ PDFダウンロード（一般価格330円/会員価格220円）

書籍サイズ A4

ページ数 6

数量

詳細を表示する

国/地域

強化学習に対する報酬量に応じた反応時間の効果

強化学習に対する報酬量に応じた反応時間の効果