Tweet English

Egaroucid 5.5.0 / 5.6.0 ベンチマーク

The FFO endgame test suite

The FFO endgame test suiteはオセロAIの終盤探索力の指標として広く使われるベンチマークです。各テストケースを完全読みし、最善手を計算します。探索時間と訪問ノード数を指標に性能を評価します。NPSはNodes Per Secondの略で、1秒あたりの訪問ノード数を表します。

使用CPUはCore i9-11900Kです。

番号深さ最善手手番の評価値探索時間(秒)訪問ノード数NPS
#4020a2380.13527871488217746000
#4122h400.19928862801151114141
#4222g260.21348660062237366156
#4323c7-120.776166809244216917092
#4423d2-140.32342549145134649193
#4524b263.241912441891282840015
#4624b3-81.089227129647211677210
#4725g240.852151105116180531799
#4825f6283.025724631805240661509
#4926e1164.5371079040603239043110
#5026d81013.9433688114040264912659
#5127a3614.7322782257813189153430
#5227a303.785604311247160635631
#5328d8-269.73911344109584163022872
#5428c7-263.97212621020703197592458
#5529b70458.57378910958123172128553
#5629h5225.5763533955047138445312
#5730a6-1059.6549948249883166956162
#5830g1423.8243949220953166066227
#5934g8640.0437096645090
全体---748.231130791306291174800705

Edax4.4との対戦

現状世界最強とも言われるオセロAI、Edax 4.4との対戦結果です。

初手からの対戦では同じ進行ばかりになって評価関数の強さは計測できないので、初期局面から10手進めた状態から打たせて勝敗を数えました。このとき、同じ進行に対して両者が必ず先手と後手の双方を1回ずつ持つようにしました。こうすることで、両者の強さが全く同じであれば勝率は50%となるはずです。

なお、テストに使った局面はEgaroucidの評価関数の学習に使ったものとは別のデータで、最終的に引き分けまたは2石差になったものを使いました。

bookは双方未使用です。

Egaroucid勝率が0.5を上回っていればEgaroucidがEdaxに勝ち越しています。

Egaroucidが黒番

レベルEgaroucid勝ち引分Edax勝ちEgaroucid勝率
114871450.51
51078850.56
155011390.56

Egaroucidが白番

レベルEgaroucid勝ち引分Edax勝ちEgaroucid勝率
1181101090.62
511412740.61
15529390.57