プレイアウトと深層学習を組み合わせた囲碁アルゴリズム

¥440 JPY

セール売り切れ

税込

カテゴリ: 全国大会

論文No: 3-103

グループ名: 【全国大会】平成31年電気学会全国大会論文集

発行日: 2019/03/01

タイトル(英語): Go Algorithm Combined with Playout and Deep Learning

著者名: 伊藤雅(愛知工業大学),伊藤有人(Hamee)

著者名(英語): Masaru Itoh(Aichi Institute of Technology),Arito Itoh(Hamee Corp.)

キーワード: 囲碁アルゴリズム,プレイアウト,深層学習,モンテカルロ木探索,ミキシングパラメータ,ノード展開閾値

要約(日本語): プレイアウトと深層学習を組み合わせて少資源環境下で動作する囲碁アルゴリズムを構築する。ここで少資源とは1CPU＆1GPU程度で構成されるデスクトップPCをいう。提案法では，Tree Policyの処理過程を省略し，ノード展開時にSL Policy Networkと同期させて，着手確率が高い有望手の上位20手のみをノード展開時に追加する。アルファ碁が提唱するRolloutによる勝敗は使わず，この部分を通常のモンテカルロ木探索と同様にプレイアウトを使用する。ノード評価値は一般的なUCB1値ではなく，アルファ碁が提唱するアクション値を採用する。数値実験により提案法の統計的有意性を確認した。

原稿種別: 日本語

PDFファイルサイズ: 269 Kバイト

販売タイプ PDFダウンロード（一般価格440円/会員価格220円）

書籍サイズ A4

ページ数 2

数量

詳細を表示する

国/地域

プレイアウトと深層学習を組み合わせた囲碁アルゴリズム

プレイアウトと深層学習を組み合わせた囲碁アルゴリズム