1
/
の
1
複数報酬環境におけるProfit Sharingの適用に関する検討
複数報酬環境におけるProfit Sharingの適用に関する検討
通常価格
¥440 JPY
通常価格
セール価格
¥440 JPY
単価
/
あたり
税込
カテゴリ: 全国大会
論文No: 3-038
グループ名: 【全国大会】平成22年電気学会全国大会論文集
発行日: 2010/03/05
タイトル(英語): A Study on Application of Profit Sharing in Multi-reward Environment
著者名: 仲道 俊介(東京理科大学),原田 拓(東京理科大学)
著者名(英語): Shunsuke Nakamichi(Tokyo University of Science),Taku Harada(Tokyo University of Science)
キーワード: 強化学習|エージェント|複数報酬
要約(日本語): 多くの強化学習アルゴリズムでは単目的でのパフォーマンスの最大化を目標としている.しかし,現実世界における問題では多目的性を含むものが多くあり,多目的最適化技術が必要とされることが認識されている.しかし,Profit Sharingのように価値関数を累積値ベースで評価するアルゴリズムや遅れ報酬環境では多目的化が困難である.そこで本研究では,経験強化型の強化学習アルゴリズムであるProfit Sharingの多目的化のための基礎として,Profit Sharingを複数報酬環境において適用するための枠組みを検討する.本研究では報酬をベクトル化する.さらに,2段ルーレット法を提案し,確率的探索による行動選択を行い,重みによって価値関数を定義する.
原稿種別: 日本語
PDFファイルサイズ: 1,890 Kバイト
受取状況を読み込めませんでした
