1
/
の
1
プレイアウトと深層学習を組み合わせた囲碁アルゴリズム
プレイアウトと深層学習を組み合わせた囲碁アルゴリズム
通常価格
¥440 JPY
通常価格
セール価格
¥440 JPY
単価
/
あたり
税込
カテゴリ: 全国大会
論文No: 3-103
グループ名: 【全国大会】平成31年電気学会全国大会論文集
発行日: 2019/03/01
タイトル(英語): Go Algorithm Combined with Playout and Deep Learning
著者名: 伊藤 雅(愛知工業大学),伊藤 有人(Hamee)
著者名(英語): Masaru Itoh(Aichi Institute of Technology),Arito Itoh(Hamee Corp.)
キーワード: 囲碁アルゴリズム,プレイアウト,深層学習,モンテカルロ木探索,ミキシングパラメータ,ノード展開閾値
要約(日本語): プレイアウトと深層学習を組み合わせて少資源環境下で動作する囲碁アルゴリズムを構築する。ここで少資源とは1CPU&1GPU程度で構成されるデスクトップPCをいう。 提案法では,Tree Policyの処理過程を省略し,ノード展開時にSL Policy Networkと同期させて,着手確率が高い有望手の上位20手のみをノード展開時に追加する。アルファ碁が提唱するRolloutによる勝敗は使わず,この部分を通常のモンテカルロ木探索と同様にプレイアウトを使用する。ノード評価値は一般的なUCB1値ではなく,アルファ碁が提唱するアクション値を採用する。 数値実験により提案法の統計的有意性を確認した。
原稿種別: 日本語
PDFファイルサイズ: 269 Kバイト
受取状況を読み込めませんでした
