Tweet English

Egaroucid 5.8.0 ベンチマーク

The FFO endgame test suite

The FFO endgame test suiteはオセロAIの終盤探索力の指標として広く使われるベンチマークです。各テストケースを完全読みし、最善手を計算します。探索時間と訪問ノード数を指標に性能を評価します。NPSはNodes Per Secondの略で、1秒あたりの訪問ノード数を表します。

使用CPUはCore i9-11900Kです。

番号深さ最善手手番の評価値探索時間(秒)訪問ノード数NPS
#4020a2380.20830240013145384677
#4122h400.28230934637109697294
#4222g260.32338954689120602752
#4323c7-120.764113328845148336184
#4423d2-140.42459600861490020
#4524b262.957597485227202057905
#4624b3-80.975101741641104350401
#4725g240.5685599687598586047
#4825f6283.955605660062153137815
#4926e1164.756798738457167943325
#5026d81013.332343428530175801090
#5127e265.41753233578498271328
#5227a304.371490500268112216945
#5328d8-245.6864995871831109352358
#5428c7-257.8148094332723140006446
#5529g60153.86819667033928127817570
#5629h5217.839173726391297385722
#5730a6-1040.7385202620937127709287
#5830g1420.252560167511126428025
#5934g8640.026205679076
全体---374.52748021233934128218350

Edax4.4との対戦

現状世界最強とも言われるオセロAI、Edax 4.4との対戦結果です。

初手からの対戦では同じ進行ばかりになって評価関数の強さは計測できないので、初期局面から8手進めた互角に近いと言われる状態から打たせて勝敗を数えました。このとき、同じ進行に対して両者が必ず先手と後手の双方を1回ずつ持つようにしました。こうすることで、両者の強さが全く同じであれば勝率は50%となるはずです。

テストにはXOTに収録されている局面を使用しました。

bookは双方未使用です。

Egaroucid勝率が0.5を上回っていればEgaroucidがEdaxに勝ち越しています。

Egaroucidが黒番

レベルEgaroucid勝ち引分Edax勝ちEgaroucid勝率
1489244870.5
5582593590.62
105851192960.66
115521323160.64

Egaroucidが白番

レベルEgaroucid勝ち引分Edax勝ちEgaroucid勝率
1534274390.55
5549444070.57
104431244330.51
115011153840.57