{"product_id":"ieej-zt193103","title":"プレイアウトと深層学習を組み合わせた囲碁アルゴリズム","description":"\u003cp\u003e\u003cstrong\u003eカテゴリ: \u003c\/strong\u003e全国大会\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e論文No: \u003c\/strong\u003e3-103\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eグループ名: \u003c\/strong\u003e【全国大会】平成31年電気学会全国大会論文集\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e発行日: \u003c\/strong\u003e2019\/03\/01\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eタイトル(英語): \u003c\/strong\u003eGo Algorithm Combined with Playout and Deep Learning\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名: \u003c\/strong\u003e伊藤 雅(愛知工業大学),伊藤 有人(Hamee)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e著者名(英語): \u003c\/strong\u003eMasaru Itoh(Aichi Institute of Technology),Arito Itoh(Hamee Corp.)\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003eキーワード: \u003c\/strong\u003e囲碁アルゴリズム,プレイアウト,深層学習,モンテカルロ木探索,ミキシングパラメータ,ノード展開閾値\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e要約(日本語): \u003c\/strong\u003eプレイアウトと深層学習を組み合わせて少資源環境下で動作する囲碁アルゴリズムを構築する。ここで少資源とは1CPU＆1GPU程度で構成されるデスクトップPCをいう。 提案法では，Tree Policyの処理過程を省略し，ノード展開時にSL Policy Networkと同期させて，着手確率が高い有望手の上位20手のみをノード展開時に追加する。アルファ碁が提唱するRolloutによる勝敗は使わず，この部分を通常のモンテカルロ木探索と同様にプレイアウトを使用する。ノード評価値は一般的なUCB1値ではなく，アルファ碁が提唱するアクション値を採用する。 数値実験により提案法の統計的有意性を確認した。\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003e原稿種別: \u003c\/strong\u003e日本語\u003c\/p\u003e\u003cp\u003e\u003cstrong\u003ePDFファイルサイズ: \u003c\/strong\u003e269 Kバイト\u003c\/p\u003e","brand":"IEEJ-PDF","offers":[{"title":"PDFダウンロード（一般価格440円\/会員価格220円） \/ A4 \/ 2","offer_id":46401435336943,"sku":"IEEJ-ZT193103-PDF","price":440.0,"currency_code":"JPY","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0718\/9512\/2159\/files\/IEEJ-PDF_a3fb9049-505b-46f9-8cd1-0d6dc152ae05.png?v=1744942835","url":"https:\/\/ieej.bookpark.ne.jp\/products\/ieej-zt193103","provider":"電気学会 電子図書館","version":"1.0","type":"link"}