{"product_id":"ieej-st13123","title":"意図推定法を用いたマルチエージェント強化学習システムにおける協調行動の獲得","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST13123\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2013\/11\/24\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eCooperative Action Acquisition Based on Intention Estimation in a Multi-agent Reinforcement Learning System\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e椿本 樹矢(愛知県立大学),小林 邦和(愛知県立大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eTsubakimoto Tatsuya(Aichi Prefectural University),Kobayashi Kunikazu(Aichi Prefectural University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e意図推定法|マルチエージェント|強化学習|協調行動\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003eQ 学習を用いたマルチエージェント環境下における協調動作に関して, 他エージェントの内部モデルを知覚せず, 行動のみの観測で協調を行えるモデルとして長行らの政策推定が提案されている. 政策推定では, 設計上，大容量の記憶が必須である. この手法は, 他エージェントの行動一つひとつを推定し, それに合わせて自らの挙動を変更するといった考え方である. よって, 協調の為には, 相手の細かな行動に合わせた評価関数が必要となり, 煩雑なにならざるを得ない.本論文では, 必要な記憶は少量で, より簡明な評価関数を使用でき, 少ない学習回数で環境に適応した有効な政策を獲得する新たな手法を提案する.\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e545 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 5","offer_id":46376723742959,"sku":"IEEJ-ST13123-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_b7ee56ac-35f0-4b23-899b-dae6e91a4214.png?v=1744113434","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-st13123","provider":"電気学会 電子図書館","version":"1.0","type":"link"}