The FFO endgame test suiteはオセロAIの終盤探索力の指標として広く使われるベンチマークです。各テストケースを完全読みし、最善手を計算します。探索時間と訪問ノード数を指標に性能を評価します。NPSはNodes Per Secondの略で、1秒あたりの訪問ノード数を表します。
使用CPUはCore i9-11900Kです。
番号 | 深さ | 最善手 | 手番の評価値 | 探索時間(秒) | 訪問ノード数 | NPS |
---|---|---|---|---|---|---|
#40 | 20 | a2 | 38 | 0.135 | 27871488 | 217746000 |
#41 | 22 | h4 | 0 | 0.199 | 28862801 | 151114141 |
#42 | 22 | g2 | 6 | 0.213 | 48660062 | 237366156 |
#43 | 23 | c7 | -12 | 0.776 | 166809244 | 216917092 |
#44 | 23 | d2 | -14 | 0.323 | 42549145 | 134649193 |
#45 | 24 | b2 | 6 | 3.241 | 912441891 | 282840015 |
#46 | 24 | b3 | -8 | 1.089 | 227129647 | 211677210 |
#47 | 25 | g2 | 4 | 0.852 | 151105116 | 180531799 |
#48 | 25 | f6 | 28 | 3.025 | 724631805 | 240661509 |
#49 | 26 | e1 | 16 | 4.537 | 1079040603 | 239043110 |
#50 | 26 | d8 | 10 | 13.943 | 3688114040 | 264912659 |
#51 | 27 | a3 | 6 | 14.732 | 2782257813 | 189153430 |
#52 | 27 | a3 | 0 | 3.785 | 604311247 | 160635631 |
#53 | 28 | d8 | -2 | 69.739 | 11344109584 | 163022872 |
#54 | 28 | c7 | -2 | 63.972 | 12621020703 | 197592458 |
#55 | 29 | b7 | 0 | 458.573 | 78910958123 | 172128553 |
#56 | 29 | h5 | 2 | 25.576 | 3533955047 | 138445312 |
#57 | 30 | a6 | -10 | 59.654 | 9948249883 | 166956162 |
#58 | 30 | g1 | 4 | 23.824 | 3949220953 | 166066227 |
#59 | 34 | g8 | 64 | 0.043 | 7096 | 645090 |
全体 | - | - | - | 748.231 | 130791306291 | 174800705 |
現状世界最強とも言われるオセロAI、Edax 4.4との対戦結果です。
初手からの対戦では同じ進行ばかりになって評価関数の強さは計測できないので、初期局面から10手進めた状態から打たせて勝敗を数えました。このとき、同じ進行に対して両者が必ず先手と後手の双方を1回ずつ持つようにしました。こうすることで、両者の強さが全く同じであれば勝率は50%となるはずです。
なお、テストに使った局面はEgaroucidの評価関数の学習に使ったものとは別のデータで、最終的に引き分けまたは2石差になったものを使いました。
bookは双方未使用です。
Egaroucid勝率が0.5を上回っていればEgaroucidがEdaxに勝ち越しています。
レベル | Egaroucid勝ち | 引分 | Edax勝ち | Egaroucid勝率 |
---|---|---|---|---|
1 | 148 | 7 | 145 | 0.51 |
5 | 107 | 8 | 85 | 0.56 |
15 | 50 | 11 | 39 | 0.56 |
レベル | Egaroucid勝ち | 引分 | Edax勝ち | Egaroucid勝率 |
---|---|---|---|---|
1 | 181 | 10 | 109 | 0.62 |
5 | 114 | 12 | 74 | 0.61 |
15 | 52 | 9 | 39 | 0.57 |