1
/
の
1
追跡問題における報酬分配
追跡問題における報酬分配
通常価格
¥440 JPY
通常価格
セール価格
¥440 JPY
単価
/
あたり
税込
カテゴリ: 全国大会
論文No: 3-094
グループ名: 【全国大会】平成14年電気学会全国大会論文集
発行日: 2002/03/26
タイトル(英語): Rewards Sharing in Prey/Hunter Task
著者名: 石丸 優介(福岡工業大学),村田 敏之(福岡工業大学),鶴岡 久(福岡工業大学)
著者名(英語): Yuusuke Ishimaru(Fukuoka Institute of Technology),Toshiyuki Murata(Fukuoka Institute of Technology),Hisashi Tsuruoka(Fukuoka Institute of Technology)
キーワード: 強化学習|Q?学習|マルチエージェント|報酬
要約(日本語): 強化学習をもちいた追跡問題において、エージェントが独立して行動するよりも、互いに報酬を分け合う方が協調行動を誘発し、各ハンターの報酬獲得を有利にすることが、期待される。ハンターは獲物を1回捕捉するだけでは捕捉とみなさず、2回もしくは他のハンターと同時に捕食すると、はじめて獲物を倒せる系をモデルに選び、報酬の一部を共有する是非を論じている。
原稿種別: 日本語
PDFファイルサイズ: 123 Kバイト
受取状況を読み込めませんでした
