English

Egaroucid 7.6.0 ベンチマーク

The FFO endgame test suite

The FFO endgame test suiteはオセロAIの終盤探索力の指標として広く使われるベンチマークです。各テストケースを完全読みし、最善手を計算します。探索時間と訪問ノード数を指標に性能を評価します。NPSはNodes Per Secondの略で、1秒あたりの訪問ノード数を表します。ここでは、The FFO endgame test suiteのうち40番から59番を実行した結果を掲載します。

Core i9-13900K

Core i9-13900KではAVX512版が動かないため、SIMD版、Generic版、x86版の結果を掲載します。

Egaroucidの結果は以下の通りです。また、比較としてオープンソースで最速クラスのオセロAI Edax 4.5.3の結果も掲載します (Edaxはバージョン4.6が最新ですが、手元で実行したところ4.6よりも4.5.3の方が速かったため、4.5.3を採用しました)。

AI時間(秒)ノード数NPSファイル
EgaroucidSIMD20.54714035262270683080852000_ffo40_59_Core_i9-13900K_SIMD.txt
EgaroucidGeneric30.34614290308977470912442001_ffo40_59_Core_i9-13900K_Generic.txt
Edaxx64_modern26.093280875723641076440898010_ffo40_59_Core_i9-13900K_edax_x64_modern.txt
Edaxx6430.29927886392112920373349011_ffo40_59_Core_i9-13900K_edax_x64.txt

Core i9-11900K

Core i9-11900KではAVX512版が動きます。

EgaroucidおよびEdax 4.5.3の結果は以下の通りです。

AI時間(秒)ノード数NPSファイル
EgaroucidAVX51234.27213061469404381111969100_ffo40_59_Core_i9-11900K_AVX512.txt
EgaroucidSIMD35.08913275458500378336757101_ffo40_59_Core_i9-11900K_SIMD.txt
EgaroucidGeneric62.67813403862190213852742102_ffo40_59_Core_i9-11900K_Generic.txt
Edaxx64_avx51239.04627252069199697947785110_ffo40_59_Core_i9-11900K_edax_x64_avx512.txt
Edaxx64_modern40.71826747187985656888550111_ffo40_59_Core_i9-11900K_edax_x64_modern.txt
Edaxx6448.26326602214755551192731112_ffo40_59_Core_i9-11900K_edax_x64.txt

Edax 4.6との対戦

現状世界最強とも言われるオセロAI、Edax 4.6との対戦結果です。

初手からの対戦では同じ進行ばかりになって評価関数の強さは計測できないので、初期局面から8手進めた互角に近いと言われる状態から打たせて勝敗を数えました。このとき、同じ進行に対して両者が必ず先手と後手の双方を1回ずつ持つようにし、2戦で獲得した石数が多い方が勝ちとしました。

勝率が0.5を上回っていればEgaroucidがEdaxに勝ち越しています。全ての条件でEgaroucidが勝ち越しています。

また、平均獲得石数は平均してEgaroucidがEdaxよりも何枚多く石を獲得できたかを表します。この値が大きいほど、Edaxに対して大勝しているということになります。

テストにはXOTに収録されている局面を使用しました。bookは双方未使用です。

レベル平均獲得石数勝率Egaroucid勝ち引分Edax勝ち
1+11.270.74273415251
5+8.370.79378125194
10+1.720.63359087323
15+0.890.6141383181
21+0.450.565501337