1
/
の
1
Profit Sharing強化学習における報酬割り当てに関する一考察
Profit Sharing強化学習における報酬割り当てに関する一考察
通常価格
¥440 JPY
通常価格
セール価格
¥440 JPY
単価
/
あたり
税込
カテゴリ: 全国大会
論文No: 3-043
グループ名: 【全国大会】平成22年電気学会全国大会論文集
発行日: 2010/03/05
タイトル(英語): A study on distribution of reward in Profit Sharing Reinforcement Learning
著者名: 幸若完壮 (北海道大学),渡辺浩太 (北海道大学),五十嵐 一 (北海道大学)
キーワード: 強化学習|Profit Sharing
要約(日本語): 機械学習アルゴリズムの一つであるProfit Sharing(PS)は、報酬の獲得に寄与した行動系列を一括で強化する為、不完全知覚問題においても有効な確率的政策を高速に獲得できる。しかし、従来法では行動の数が増えると学習が進まないという問題点がある。 本研究では行動系列の強化方法を見直し、従来法よりも行動系列を大きく強化し、より高速に学習する手法を提案する。 提案した手法をSuttonの迷路問題に適用し、従来手法と比較した。その結果提案手法は高速に学習できる事を確認した。
原稿種別: 日本語
PDFファイルサイズ: 783 Kバイト
受取状況を読み込めませんでした
