{"product_id":"ieej-ct10tc04007","title":"EDA-RLにおける確率モデルの構造探索","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e部門大会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003eTC4-7\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【C】平成22年電気学会電子・情報・システム部門大会講演論文集\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2010\/09\/02\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eSearch Method of the Structure of Probabilistic Models for EDA-RL\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e半田 久志(岡山大学)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eHisashi Handa(Okayama University)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e強化学習問題|進化学習|分布推定アルゴリズム|確率モデル探索|Reinforcement Learning Problems|Evolutionary Learning|Estimation of Distribution Algorithms|Search of the Structure of Probabilistic Model\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003e本研究では、これまでに提案してきた強化学習問題のための分布推定アルゴリズムであるEDA-RLに対してモデル構造を探索するメカニズムを付与する。不完全知覚問題を有する問題において、政策を推定するエピソード群から不完全知覚であると思われる状態遷移をカイ二乗検定により導出し、その状態遷移付近において1時刻前の状態を加味して状態構成を再構成するものである。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e2,192 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格440円\/会員価格220円） \/ A4 \/ 4","offer_id":46406430884079,"sku":"IEEJ-CT10TC04007-PDF","price":440.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_5fee8ebf-fa91-4a00-ad2f-abd9114864ef.png?v=1745138258","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-ct10tc04007","provider":"電気学会 電子図書館","version":"1.0","type":"link"}