Profit Sharing強化学習における報酬割り当てに関する一考察

¥440 JPY

セール売り切れ

税込

カテゴリ: 全国大会

論文No: 3-043

グループ名: 【全国大会】平成22年電気学会全国大会論文集

発行日: 2010/03/05

タイトル(英語): A study on distribution of reward in Profit Sharing Reinforcement Learning

著者名: 幸若完壮 (北海道大学),渡辺浩太 (北海道大学),五十嵐一 (北海道大学)

キーワード: 強化学習|Profit Sharing

要約(日本語): 機械学習アルゴリズムの一つであるProfit Sharing(PS)は、報酬の獲得に寄与した行動系列を一括で強化する為、不完全知覚問題においても有効な確率的政策を高速に獲得できる。しかし、従来法では行動の数が増えると学習が進まないという問題点がある。本研究では行動系列の強化方法を見直し、従来法よりも行動系列を大きく強化し、より高速に学習する手法を提案する。提案した手法をSuttonの迷路問題に適用し、従来手法と比較した。その結果提案手法は高速に学習できる事を確認した。

原稿種別: 日本語

PDFファイルサイズ: 783 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 1

数量

詳細を表示する

国/地域

Profit Sharing強化学習における報酬割り当てに関する一考察

Profit Sharing強化学習における報酬割り当てに関する一考察