複数報酬環境におけるProfit Sharingの適用に関する検討

¥440 JPY

セール売り切れ

税込

カテゴリ: 全国大会

論文No: 3-038

グループ名: 【全国大会】平成22年電気学会全国大会論文集

発行日: 2010/03/05

タイトル(英語): A Study on Application of Profit Sharing in Multi-reward Environment

著者名: 仲道俊介(東京理科大学),原田拓(東京理科大学)

著者名(英語): Shunsuke Nakamichi(Tokyo University of Science),Taku Harada(Tokyo University of Science)

キーワード: 強化学習|エージェント|複数報酬

要約(日本語): 多くの強化学習アルゴリズムでは単目的でのパフォーマンスの最大化を目標としている．しかし，現実世界における問題では多目的性を含むものが多くあり，多目的最適化技術が必要とされることが認識されている．しかし，Profit Sharingのように価値関数を累積値ベースで評価するアルゴリズムや遅れ報酬環境では多目的化が困難である．そこで本研究では，経験強化型の強化学習アルゴリズムであるProfit Sharingの多目的化のための基礎として，Profit Sharingを複数報酬環境において適用するための枠組みを検討する．本研究では報酬をベクトル化する．さらに，2段ルーレット法を提案し，確率的探索による行動選択を行い，重みによって価値関数を定義する．

原稿種別: 日本語

PDFファイルサイズ: 1,890 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 2

数量

詳細を表示する

国/地域

複数報酬環境におけるProfit Sharingの適用に関する検討

複数報酬環境におけるProfit Sharingの適用に関する検討