商品情報にスキップ
1 1

非合理的ルールの期待強化値抑制条件に基づくマルチエージェント強化学習の間接報酬設計

非合理的ルールの期待強化値抑制条件に基づくマルチエージェント強化学習の間接報酬設計

通常価格 ¥330 JPY
通常価格 セール価格 ¥330 JPY
セール 売り切れ
税込

カテゴリ: 研究会(論文単位)

論文No: IIC09008

グループ名: 【D】産業応用部門 産業計測制御研究会

発行日: 2009/03/03

タイトル(英語): A Design of Indirect Reward for Multi-Agent Reinforcement Learning Based on Constraint Condition of Expectation Value of Reinfoecement for Ineffective Rules

著者名: 玉嶋 大輔(千葉大学),小圷 成一(千葉大学),岡本 卓(千葉大学),平田 廣則(千葉大学)

著者名(英語): Daisuke Tamashima(Chiba University),Seiichi Koakutsu(Chiba University),Takashi Okamoto(Chiba University),Hironori Hirata(Chiba University)

キーワード: マルチエージェント強化学習|合理性定理|間接報酬|追跡問題|Multi-Agent Reinforcement Learning|Rational Theorem|Indirect Reward|Pursuit Problem

原稿種別: 日本語

PDFファイルサイズ: 760 Kバイト

販売タイプ
書籍サイズ
ページ数
詳細を表示する