The FFO endgame test suiteはオセロAIの終盤探索力の指標として広く使われるベンチマークです。各テストケースを完全読みし、最善手を計算します。探索時間と訪問ノード数を指標に性能を評価します。NPSはNodes Per Secondの略で、1秒あたりの訪問ノード数を表します。
番号 | 深さ | 最善手 | 評価値 | 時間(秒) | ノード数 | NPS |
---|---|---|---|---|---|---|
#40 | 20 | a2 | +38 | 0.031 | 16997628 | 548310580 |
#41 | 22 | h4 | +0 | 0.071 | 24207723 | 340953845 |
#42 | 22 | g2 | +6 | 0.103 | 53386603 | 518316533 |
#43 | 23 | g3 | -12 | 0.173 | 89368561 | 516581277 |
#44 | 23 | b8 | -14 | 0.081 | 14737343 | 181942506 |
#45 | 24 | b2 | +6 | 0.417 | 365913891 | 877491345 |
#46 | 24 | b3 | -8 | 0.184 | 72808508 | 395698413 |
#47 | 25 | g2 | +4 | 0.09 | 28623049 | 318033877 |
#48 | 25 | f6 | +28 | 0.357 | 177552046 | 497344666 |
#49 | 26 | e1 | +16 | 0.427 | 246001308 | 576115475 |
#50 | 26 | d8 | +10 | 1.635 | 1238528233 | 757509622 |
#51 | 27 | e2 | +6 | 0.749 | 445087184 | 594241901 |
#52 | 27 | a3 | +0 | 0.866 | 541177162 | 624915891 |
#53 | 28 | d8 | -2 | 4.012 | 3195739778 | 796545308 |
#54 | 28 | c7 | -2 | 4.812 | 4406176438 | 915664263 |
#55 | 29 | g6 | +0 | 13.025 | 9772271726 | 750270382 |
#56 | 29 | h5 | +2 | 1.727 | 836776216 | 484525892 |
#57 | 30 | a6 | -10 | 3.369 | 2322235752 | 689295266 |
#58 | 30 | g1 | +4 | 2.313 | 1276275073 | 551783429 |
#59 | 34 | e8 | +64 | 0.459 | 5864536 | 12776766 |
全体 | - | - | - | 34.901 | 25129728758 | 720028903 |
SIMDによる高速化をしていないバージョンです。
番号 | 深さ | 最善手 | 評価値 | 時間(秒) | ノード数 | NPS |
---|---|---|---|---|---|---|
#40 | 20 | a2 | +38 | 0.039 | 15642677 | 401094282 |
#41 | 22 | h4 | +0 | 0.086 | 23864262 | 277491418 |
#42 | 22 | g2 | +6 | 0.146 | 54012600 | 369949315 |
#43 | 23 | c7 | -12 | 0.145 | 43346280 | 298939862 |
#44 | 23 | b8 | -14 | 0.102 | 16542190 | 162178333 |
#45 | 24 | b2 | +6 | 0.611 | 365766568 | 598635954 |
#46 | 24 | b3 | -8 | 0.264 | 91211537 | 345498246 |
#47 | 25 | g2 | +4 | 0.108 | 25244982 | 233749833 |
#48 | 25 | f6 | +28 | 0.426 | 146189774 | 343168483 |
#49 | 26 | e1 | +16 | 0.602 | 260644739 | 432964682 |
#50 | 26 | d8 | +10 | 2.184 | 1029002849 | 471155150 |
#51 | 27 | e2 | +6 | 1.198 | 541359040 | 451885676 |
#52 | 27 | a3 | +0 | 0.898 | 385656725 | 429461831 |
#53 | 28 | d8 | -2 | 4.844 | 2703465246 | 558105954 |
#54 | 28 | c7 | -2 | 7.622 | 4862726309 | 637985608 |
#55 | 29 | g6 | +0 | 19.685 | 10018926638 | 508962491 |
#56 | 29 | h5 | +2 | 2.359 | 875422326 | 371098908 |
#57 | 30 | a6 | -10 | 5.299 | 2766188517 | 522020856 |
#58 | 30 | g1 | +4 | 3.317 | 1351288396 | 407382694 |
#59 | 34 | e8 | +64 | 0.442 | 5998341 | 13570907 |
全体 | - | - | - | 50.377 | 25582499996 | 507821029 |
現状世界最強とも言われるオセロAI、Edax 4.4との対戦結果です。
初手からの対戦では同じ進行ばかりになって評価関数の強さは計測できないので、初期局面から8手進めた互角に近いと言われる状態から打たせて勝敗を数えました。このとき、同じ進行に対して両者が必ず先手と後手の双方を1回ずつ持つようにしました。こうすることで、両者の強さが全く同じであれば勝率は50%となるはずです。
テストにはXOTに収録されている局面を使用しました。
bookは双方未使用です。
Egaroucid勝率が0.5を上回っていればEgaroucidがEdaxに勝ち越しています。また、カッコ内の数字はEgaroucidが黒番/白番のときのそれぞれの値です。全ての条件でEgaroucidが勝ち越しています。
バージョン6.3.0までは引き分けを省いて(勝ち)/(勝ち+負け)で勝率を計算していましたが、一般的ではなかったので、バージョン6.4.0からは引き分けを0.5勝として(勝ち+0.5*引き分け)/(勝ち+引き分け+負け)で計算しました。
レベル | Egaroucid勝ち | 引分 | Edax勝ち | Egaroucid勝率 |
---|---|---|---|---|
1 | 1386(黒: 686 白: 700) | 42(黒: 14 白: 28) | 572(黒: 300 白: 272) | 0.704 |
5 | 1250(黒: 639 白: 611) | 87(黒: 51 白: 36) | 663(黒: 310 白: 353) | 0.647 |
10 | 1041(黒: 571 白: 470) | 237(黒: 117 白: 120) | 722(黒: 312 白: 410) | 0.58 |
15 | 473(黒: 248 白: 225) | 192(黒: 84 白: 108) | 335(黒: 168 白: 167) | 0.569 |
21 | 81(黒: 48 白: 33) | 60(黒: 28 白: 32) | 59(黒: 24 白: 35) | 0.555 |