商品情報にスキップ
1 1

Profit Sharing強化学習における報酬割り当てに関する一考察

Profit Sharing強化学習における報酬割り当てに関する一考察

通常価格 ¥440 JPY
通常価格 セール価格 ¥440 JPY
セール 売り切れ
税込

カテゴリ: 全国大会

論文No: 3-043

グループ名: 【全国大会】平成22年電気学会全国大会論文集

発行日: 2010/03/05

タイトル(英語): A study on distribution of reward in Profit Sharing Reinforcement Learning

著者名: 幸若完壮 (北海道大学),渡辺浩太 (北海道大学),五十嵐 一 (北海道大学)

キーワード: 強化学習|Profit Sharing

要約(日本語): 機械学習アルゴリズムの一つであるProfit Sharing(PS)は、報酬の獲得に寄与した行動系列を一括で強化する為、不完全知覚問題においても有効な確率的政策を高速に獲得できる。しかし、従来法では行動の数が増えると学習が進まないという問題点がある。 本研究では行動系列の強化方法を見直し、従来法よりも行動系列を大きく強化し、より高速に学習する手法を提案する。 提案した手法をSuttonの迷路問題に適用し、従来手法と比較した。その結果提案手法は高速に学習できる事を確認した。

原稿種別: 日本語

PDFファイルサイズ: 783 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する