English

Egaroucid 7.4.0 ベンチマーク

The FFO endgame test suite

The FFO endgame test suiteはオセロAIの終盤探索力の指標として広く使われるベンチマークです。各テストケースを完全読みし、最善手を計算します。探索時間と訪問ノード数を指標に性能を評価します。NPSはNodes Per Secondの略で、1秒あたりの訪問ノード数を表します。ここでは、The FFO endgame test suiteのうち40番から59番を実行した結果を掲載します。

Core i9-13900K

Core i9-13900KではAVX512版が動かないため、SIMD版、Generic版、x86版の結果を掲載します。

Egaroucidの結果は以下の通りです。

CPU時間(秒)ノード数NPSファイル
Core i9-13900Kx64_SIMD23.96519280200483804514937000_ffo40_59_Core_i9-13900K_x64_SIMD.txt
Core i9-13900Kx64_Generic35.05318750846644534928441001_ffo40_59_Core_i9-13900K_x64_Generic.txt
Core i9-13900Kx86_Generic88.49619057983884215354184002_ffo40_59_Core_i9-13900K_x86_Generic.txt

比較として、オープンソースで最速クラスのオセロAI Edax 4.5.2の結果も掲載します。

CPU時間(秒)ノード数NPSファイル
Core i9-13900Kx64_modern24.908276988222591112045217010_ffo40_59_Core_i9-13900K_edax_x64_modern.txt
Core i9-13900Kx6429.46927561483343935270397011_ffo40_59_Core_i9-13900K_edax_x64.txt
Core i9-13900Kx8645.15628511338646631396462012_ffo40_59_Core_i9-13900K_edax_x86.txt

Core i9-11900K

Core i9-11900KではAVX512版が動きます。

Egaroucidの結果は以下の通りです。

CPU時間(秒)ノード数NPSファイル
Core i9-11900Kx64_AVX51244.23217098579900386565832100_ffo40_59_Core_i9-11900K_x64_AVX512.txt
Core i9-11900Kx64_SIMD48.61418373521423377947122101_ffo40_59_Core_i9-11900K_x64_SIMD.txt
Core i9-11900Kx64_Generic85.01817451101371205263607102_ffo40_59_Core_i9-11900K_x64_Generic.txt
Core i9-11900Kx86_Generic238.9651818484584076098365103_ffo40_59_Core_i9-11900K_x86_Generic.txt

Edax 4.5.2の結果は以下の通りです。

CPU時間(秒)ノード数NPSファイル
Core i9-11900Kx64_avx51246.64227072480526580431382110_ffo40_59_Core_i9-11900K_edax_x64_avx512.txt
Core i9-11900Kx64_modern46.56127575952822592254308111_ffo40_59_Core_i9-11900K_edax_x64_modern.txt
Core i9-11900Kx6456.8626635810350468445486112_ffo40_59_Core_i9-11900K_edax_x64.txt
Core i9-11900Kx8691.76426989485812294118454113_ffo40_59_Core_i9-11900K_edax_x86.txt

Edax 4.4との対戦

現状世界最強とも言われるオセロAI、Edax 4.4との対戦結果です。

初手からの対戦では同じ進行ばかりになって評価関数の強さは計測できないので、初期局面から8手進めた互角に近いと言われる状態から打たせて勝敗を数えました。このとき、同じ進行に対して両者が必ず先手と後手の双方を1回ずつ持つようにしました。こうすることで、両者の強さが全く同じであれば勝率は50%となるはずです。

テストにはXOTに収録されている局面を使用しました。

bookは双方未使用です。

Egaroucid勝率が0.5を上回っていればEgaroucidがEdaxに勝ち越しています。また、カッコ内の数字はEgaroucidが黒番/白番のときのそれぞれの値です。全ての条件でEgaroucidが勝ち越しています。

バージョン6.3.0までは引き分けを省いて(勝ち)/(勝ち+負け)で勝率を計算していましたが、一般的ではなかったので、バージョン6.4.0からは引き分けを0.5勝として(勝ち+0.5*引き分け)/(勝ち+引き分け+負け)で計算しました。

レベルEgaroucid勝ち引分Edax勝ちEgaroucid勝率
11273(黒: 629 白: 644)47(黒: 29 白: 18)680(黒: 342 白: 338)0.648
51335(黒: 672 白: 663)100(黒: 55 白: 45)565(黒: 273 白: 292)0.693
101064(黒: 610 白: 454)226(黒: 108 白: 118)710(黒: 282 白: 428)0.589
15245(黒: 130 白: 115)104(黒: 50 白: 54)151(黒: 70 白: 81)0.594
2184(黒: 59 白: 25)43(黒: 15 白: 28)73(黒: 26 白: 47)0.527