Tweet English

Egaroucid 6.2.0 ベンチマーク

The FFO endgame test suite

The FFO endgame test suiteはオセロAIの終盤探索力の指標として広く使われるベンチマークです。各テストケースを完全読みし、最善手を計算します。探索時間と訪問ノード数を指標に性能を評価します。NPSはNodes Per Secondの略で、1秒あたりの訪問ノード数を表します。

使用CPUはCore i9-11900Kです。

Egaroucid for Console 6.2.0 Windows x64 SIMD

番号深さ最善手手番の評価値探索時間(秒)訪問ノード数NPS
#4020@100%a2+380.07920675942261720784
#4122@100%h4+00.15628392068182000435
#4222@100%g2+60.20849139741236248754
#4323@100%g3-120.40186360041215361698
#4423@100%b8-140.17628565965162306619
#4524@100%b2+61.352476921635352752688
#4624@100%b3-80.38383495062218002772
#4725@100%g2+40.16222332907137857450
#4825@100%f6+280.853150805811176794620
#4926@100%e1+161.266314363012248312015
#5026@100%d8+105.9231485495809250801250
#5127@100%e2+62.485697258715280587008
#5227@100%a3+02.061505277066245161118
#5328@100%d8-210.4883319261482316481834
#5428@100%c7-215.9454960272938311086418
#5529@100%g6+042.9211362599782264739044
#5629@100%h5+25.791960708045165896744
#5730@100%a6-1011.0612827877585255662018
#5830@100%g1+46.6091364499647206460833
#5934@100%e8+640.221336298415217122
全体---108.5428747666237264857806

Edax4.4との対戦

現状世界最強とも言われるオセロAI、Edax 4.4との対戦結果です。

初手からの対戦では同じ進行ばかりになって評価関数の強さは計測できないので、初期局面から8手進めた互角に近いと言われる状態から打たせて勝敗を数えました。このとき、同じ進行に対して両者が必ず先手と後手の双方を1回ずつ持つようにしました。こうすることで、両者の強さが全く同じであれば勝率は50%となるはずです。

テストにはXOTに収録されている局面を使用しました。

bookは双方未使用です。

Egaroucid勝率が0.5を上回っていればEgaroucidがEdaxに勝ち越しています。また、カッコ内の数字はEgaroucidが黒番/白番のときのそれぞれの値です。全ての条件でEgaroucidが勝ち越しています。

レベルEgaroucid勝ち引分Edax勝ちEgaroucid勝率
11234(黒: 615 白: 619)49(黒: 23 白: 26)717(黒: 362 白: 355)0.632
51101(黒: 566 白: 535)92(黒: 48 白: 44)807(黒: 386 白: 421)0.577
101040(黒: 589 白: 451)234(黒: 115 白: 119)726(黒: 296 白: 430)0.589
15222(黒: 114 白: 108)67(黒: 31 白: 36)111(黒: 55 白: 56)0.667