{"product_id":"ieej-st16002","title":"予想失敗確率を組み込んだ行動選択戦略の提案とマルチエージェント環境下での有効性の検証","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e研究会(論文単位)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eST16002\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】電子・情報・システム部門 システム研究会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2016\/03\/08\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eProposal and Evaluation of an Action Selection Strategy with Expected Failure Probability in Multi-agent Learning\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e古川 耕大(明治大学),宮崎 和光(大学評価・学位授与機構),小林 博明(明治大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eKoudai Furukawa(Meiji University),Kazuteru Miyazaki(National Institution for Academic Degrees and University Evaluation),Hiroaki Kobayashi(Meiji University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003eマルチエージェント学習|同時学習問題|Ｐｒｏｆｉｔ　Ｓｈａｒｉｎｇ|Ｅｘｐｅｃｔｅｄ　Ｆａｉｌｕｒｅ　Ｐｒｏｂａｂｉｌｉｔｙ|強化学習|Ｋｅｅｐａｗａｙ　ｔａｓｋ|Multi-agent Learning|Concurrent Learning Problem|Profit Sharing|Expected Failure Probability|Reinforcement Learning|Keepaway task\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e複数のエージェントが同時に学習を行うマルチエージェント学習では、同時学習問題と呼ばれる学習結果が不安定になる問題がある。この問題に対し、これまでいつかの手法が提案されているが、本論文では、行動選択戦略に予想失敗確率(EFP)を組み込む手法を提案する。従来手法では、罰により行動が不可能となる場合でも、提案手法は、EFPにより適応的な行動出力が期待できる。Keep awayタスクに適用し提案手法の有効性を確認する。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(英語): \u003c\/strong\u003eIn a multi-agent learning that multiple agents learn at the same time, there is a problem called concurrent learning problem where the learning result becomes unstable. Though there are several method to resolve the problem, we propose a method that incorporates the expected failure probability (EFP) into the action selection strategy. The proposed method can be expected to output an adaptive behavior by the EFP. We confirm the effectiveness of the proposed method using Keepaway task.\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e1,081 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格330円\/会員価格220円） \/ A4 \/ 7","offer_id":46388610433263,"sku":"IEEJ-ST16002-PDF","price":330.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_3167576d-db7b-453c-b3ea-8e76b431f71b.png?v=1744510888","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-st16002","provider":"電気学会 電子図書館","version":"1.0","type":"link"}