Performance ELO, tournois maison
| Rang | Moteur / Système | Hardware | Elo | Parties | Err +/- |
|---|---|---|---|---|---|
| 1 ✱ | Fritz 20 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 4065 | 90 | 20 |
| 2 ✱ | Stockfish 11 64 POPCNT — 8 Threads | AMD Ryzen 9 7950X3D 100% | 4054 | 179 | 13 |
| 3 ✱ | Wasp 7.00 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3949 | 95 | 20 |
| 4 ✱ | Komodo 14.1 64-bit — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3934 | 240 | 13 |
| 5 ✱ | Fire 8 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3920 | 178 | 15 |
| 6 ✱ | Ethereal 12.75 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3911 | 180 | 15 |
| 7 ✱ | Komodo 12.1.1 64-bit — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3909 | 97 | 20 |
| 8 ✱ | Caissa 1.5 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3895 | 150 | 16 |
| 9 ✱ | Stockfish 8 64 POPCNT — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3872 | 110 | 19 |
| 10 ✱ | Wasp 5.50 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3849 | 153 | 16 |
| 11 ✱ | Xiphos 0.6 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3849 | 180 | 15 |
| 12 ✱ | Ethereal 11.75 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3846 | 144 | 17 |
| 13 ✱ | Booot 6.5 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3840 | 338 | 11 |
| 14 ✱ | Rebel-Extreme-1.1 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3839 | 70 | 24 |
| 15 ✱ | rofChade 2.3 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3809 | 179 | 15 |
| 16 ✱ | Deep Shredder 13 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3789 | 397 | 10 |
| 17 ✱ | Laser 1.7 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3772 | 180 | 14 |
| 18 ✱ | Defenchess 2.2 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3732 | 180 | 14 |
| 19 ✱ | Houdini 4 Pro x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3718 | 154 | 16 |
| 20 ✱ | Gull 3 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3685 | 158 | 16 |
| 21 ✱ | Critter 1.6a 64-bit — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3624 | 143 | 17 |
| 22 ✱ | Wasp 3.75 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3621 | 161 | 16 |
| 23 ✱ | Senpai 2.0 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3545 | 81 | 22 |
| 24 ✱ | Naum 4.2 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3534 | 108 | 19 |
| 25 ✱ | Wasp 2.00 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3513 | 128 | 17 |
| 26 ✱ | Komodo64 3 — 1 Thread | AMD Ryzen 9 7950X3D 100% | 3502 | 122 | 18 |
| 27 ✱ | Rybka 2.4MP — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3349 | 121 | 18 |
| 28 ✱ | Gull 1.2 x64 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 3291 | 102 | 20 |
| 29 ✱ | Glaurung 2.2 JA — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3266 | 142 | 17 |
| 30 ✱ | Loop M1-T — 4 Threads | AMD Ryzen 9 7950X3D 100% | 3209 | 120 | 18 |
| 31 ✱ | Fruit 2.3.1 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 3153 | 130 | 18 |
| 32 ✱ | Shredder 10 UCI — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 3118 | 208 | 14 |
| 33 ✱ | Shredder 6 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3053 | 60 | 26 |
| 34 ✱ | Deep Junior 7 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3046 | 149 | 16 |
| 35 ✱ | ProDeo 2.0 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 3016 | 198 | 14 |
| 36 ✱ | Hiarcs 8 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 3012 | 62 | 24 |
| 37 ✱ | Deep Sjeng 1.6 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 2982 | 118 | 18 |
| 38 ✱ | Junior 8 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2982 | 110 | 19 |
| 39 ✱ | Ruffian 2.1.0 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2979 | 144 | 17 |
| 40 ✱ | Gambit Tiger 2.0 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2975 | 121 | 18 |
| 41 ✱ | Junior 7 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2952 | 164 | 15 |
| 42 ✱ | Gandalf 6.01 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2941 | 85 | 22 |
| 43 ✱ | SOS 5 for Arena — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2935 | 152 | 16 |
| 44 ✱ | List 5.12 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2907 | 172 | 15 |
| 45 ✱ | Fritz 6 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2905 | 355 | 11 |
| 46 ✱ | Hiarcs 7.32 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2844 | 126 | 18 |
| 47 ✱ | Nimzo 8 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2838 | 131 | 17 |
| 48 ✱ | Fritz 5.32 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2834 | 195 | 14 |
| 49 | The King 3.50 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 2817 | 80 | 22 |
| 50 ✱ | Yace Paderbron — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2814 | 110 | 19 |
| 51 ✱ | Rebel 6 | AMD Ryzen 9 7950X3D 100% | 2679 | 34 | 31 |
| 52 | Cray Blitz 4.9h | AMD Ryzen 9 7950X3D 100% | 2531 | 70 | 19 |
| 53 | Rebel 6 | AMD Ryzen 9 7950X3D 1% | 2527 | 60 | 47 |
| 54 | Mephisto Genius 68030 London | cb-emu | 2363 | 349 | 13 |
| 55 | Mephisto Berlin Pro 68020 | cb-emu | 2315 | 349 | 15 |
| 56 | Mephisto RISC II | cb-emu | 2266 | 342 | 16 |
| 57 | Saitek RISC 2500 v1.04 | cb-emu | 2247 | 348 | 17 |
| 58 | Mephisto Dallas 68000-UCI | AMD Ryzen 9 7950X3D 100% | 2233 | 238 | 21 |
| 59 | Novag Star Diamond (v1.04) | cb-emu | 2226 | 350 | 17 |
| 60 | Saitek Sparc (rev.518) | cb-emu | 2153 | 347 | 19 |
| 61 | Mephisto Berlin 68000 v0.03 | cb-emu | 2135 | 349 | 19 |
| 62 | Fidelity Elite Avantgarde V9 | cb-emu | 2125 | 350 | 19 |
| 63 | Novag Sapphire | cb-emu | 2123 | 334 | 20 |
| 64 | Mephisto MM5 (v5.1)-UCI | AMD Ryzen 9 7950X3D 100% | 2108 | 264 | 23 |
| 65 | Fidelity Designer Mach IV | cb-emu | 2090 | 350 | 20 |
| 66 | Fidelity Designer Mach III | cb-emu | 2029 | 348 | 21 |
| 67 | Mephisto Mondial 68000 XL | cb-emu | 1973 | 346 | 21 |
| 68 | Novag Zircon II | cb-emu | 1970 | 334 | 22 |
| 69 | Saitek President | cb-emu | 1958 | 344 | 21 |
| 70 | Mephisto Nigel Short | cb-emu | 1956 | 349 | 21 |
| 71 | Saitek Maestro D++ | cb-emu | 1923 | 348 | 21 |
| 72 | Novag Super Forte C v3.6 | cb-emu | 1901 | 349 | 21 |
| 73 | Novag Super Expert C v3.6 | cb-emu | 1894 | 349 | 21 |
| 74 | Novag Turquoise | cb-emu | 1871 | 344 | 21 |
| 75 | Saitek Corona II (ver. D+) | cb-emu | 1856 | 350 | 21 |
| 76 | Mephisto Modena (set 3) | cb-emu | 1850 | 349 | 21 |
| 77 | Saitek Turbo King II (D+) | cb-emu | 1844 | 348 | 21 |
| 78 | Mephisto MM V (v5.1) | cb-emu | 1835 | 350 | 21 |
| 79 | Mephisto MM IV (v7.10) | cb-emu | 1808 | 348 | 21 |
| 80 | Fidelity Designer 2100 | cb-emu | 1808 | 348 | 21 |
| 81 | Novag Constellation Forte A | cb-emu | 1803 | 350 | 21 |
| 82 | Saitek Simultano (ver. B) | cb-emu | 1764 | 349 | 20 |
| 83 | Fidelity Par Excellence (B) | cb-emu | 1742 | 347 | 20 |
| 84 | Saitek Prisma | cb-emu | 1724 | 349 | 19 |
| 85 | Fidelity Designer 2000 | cb-emu | 1703 | 348 | 19 |
| 86 | Novag Super VIP v3.7 | cb-emu | 1640 | 348 | 17 |
| 87 | Tandy Chess Champion 2150 | cb-emu | 1577 | 346 | 16 |
| 88 | Saitek Turbo 16K | cb-emu | 1437 | 348 | 11 |
| 89 | Saitek Leonardo (v1.4) | cb-emu | 1285 | 347 | 8 |
Performance ELO, tournois maison
| Rang | Moteur / Système | Hardware | Elo | Parties | Err +/- |
|---|---|---|---|---|---|
| 1 ✱ | Wasp 7.00 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3934 | 60 | 25 |
| 2 ✱ | Komodo 12.1.1 64-bit — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3903 | 75 | 23 |
| 3 ✱ | Stockfish 8 64 POPCNT — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3872 | 80 | 22 |
| 4 ✱ | Caissa 1.5 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3863 | 80 | 22 |
| 5 ✱ | Booot 6.5 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3856 | 75 | 22 |
| 6 ✱ | Wasp 5.50 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3852 | 60 | 24 |
| ★ 7 | Stockfish 11 64 POPCNT — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3841 | 179 | 13 |
| 8 ✱ | Rebel-Extreme-1.1 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3831 | 70 | 24 |
| 9 ✱ | Ethereal 11.75 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3814 | 67 | 24 |
| 10 ✱ | Deep Shredder 13 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3754 | 59 | 24 |
| 11 ✱ | Houdini 4 Pro x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3737 | 102 | 20 |
| 12 | Komodo 14.1 64-bit — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3718 | 240 | 13 |
| 13 | Fire 8 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3707 | 178 | 15 |
| 14 | Ethereal 12.75 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3697 | 180 | 15 |
| 15 ✱ | Gull 3 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3685 | 80 | 22 |
| 16 ✱ | Critter 1.6a 64-bit — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3637 | 76 | 22 |
| 17 | Xiphos 0.6 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3635 | 180 | 15 |
| 18 ✱ | Wasp 3.75 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3610 | 59 | 26 |
| 19 | rofChade 2.3 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3594 | 179 | 15 |
| 20 ✱ | Naum 4.2 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3563 | 59 | 23 |
| 21 | Laser 1.7 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3558 | 180 | 14 |
| 22 ✱ | Senpai 2.0 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3558 | 46 | 29 |
| 23 ✱ | Komodo64 3 — 1 Thread | AMD Ryzen 9 7950X3D 100% | 3529 | 79 | 22 |
| 24 | Defenchess 2.2 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3517 | 180 | 14 |
| 25 ✱ | Wasp 2.00 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3513 | 60 | 22 |
| 26 ✱ | Rybka 2.4MP — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3386 | 67 | 23 |
| 27 ✱ | Gull 1.2 x64 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 3302 | 80 | 22 |
| 28 ✱ | Glaurung 2.2 JA — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3295 | 60 | 23 |
| 29 ✱ | Loop M1-T — 4 Threads | AMD Ryzen 9 7950X3D 100% | 3209 | 68 | 24 |
| 30 ✱ | Fruit 2.3.1 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 3173 | 80 | 21 |
| 31 ✱ | Shredder 10 UCI — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 3160 | 60 | 24 |
| 32 ✱ | Deep Sjeng 1.6 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3066 | 70 | 10 |
| 33 ✱ | Shredder 6 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3059 | 60 | 26 |
| 34 ✱ | Deep Junior 7 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3031 | 56 | 11 |
| 35 ✱ | ProDeo 2.0 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 3024 | 67 | 11 |
| 36 ✱ | Junior 8 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 3006 | 62 | 11 |
| 37 ✱ | Ruffian 2.1.0 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2989 | 90 | 9 |
| 38 ✱ | Gambit Tiger 2.0 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2981 | 60 | 11 |
| 39 ✱ | Junior 7 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2980 | 62 | 11 |
| 40 ✱ | Gandalf 6.01 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2971 | 70 | 10 |
| 41 ✱ | List 5.12 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2965 | 60 | 11 |
| 42 ✱ | SOS 5 for Arena — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2940 | 80 | 9 |
| 43 ✱ | Fritz 6 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2905 | 150 | 7 |
| 44 ✱ | Nimzo 8 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2900 | 75 | 10 |
| 45 ✱ | Hiarcs 7.32 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2891 | 55 | 12 |
| 46 ✱ | Fritz 5.32 — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2866 | 87 | 9 |
| 47 ✱ | Yace Paderbron — 1 Thread 1T | AMD Ryzen 9 7950X3D 100% | 2859 | 61 | 11 |
| 48 | The King 3.50 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 2817 | 80 | 22 |
| 49 | Rebel 6 | AMD Ryzen 9 7950X3D 100% | 2761 | 161 | 16 |
| 50 | Cray Blitz 4.9h | AMD Ryzen 9 7950X3D 100% | 2531 | 70 | 19 |
| 51 | Rebel 6 | AMD Ryzen 9 7950X3D 1% | 2527 | 60 | 47 |
| 52 | Mephisto Genius 68030 London | cb-emu | 2363 | 349 | 13 |
| 53 | Mephisto Berlin Pro 68020 | cb-emu | 2315 | 349 | 15 |
| 54 | Mephisto RISC II | cb-emu | 2266 | 342 | 16 |
| 55 | Saitek RISC 2500 v1.04 | cb-emu | 2247 | 348 | 17 |
| 56 | Mephisto Dallas 68000-UCI | AMD Ryzen 9 7950X3D 100% | 2233 | 238 | 21 |
| 57 | Novag Star Diamond (v1.04) | cb-emu | 2226 | 350 | 17 |
| 58 | Saitek Sparc (rev.518) | cb-emu | 2153 | 347 | 19 |
| 59 | Mephisto Berlin 68000 v0.03 | cb-emu | 2135 | 349 | 19 |
| 60 | Fidelity Elite Avantgarde V9 | cb-emu | 2125 | 350 | 19 |
| 61 | Novag Sapphire | cb-emu | 2123 | 334 | 20 |
| 62 | Mephisto MM5 (v5.1)-UCI | AMD Ryzen 9 7950X3D 100% | 2108 | 264 | 23 |
| 63 | Fidelity Designer Mach IV | cb-emu | 2090 | 350 | 20 |
| 64 | Fidelity Designer Mach III | cb-emu | 2029 | 348 | 21 |
| 65 | Mephisto Mondial 68000 XL | cb-emu | 1973 | 346 | 21 |
| 66 | Novag Zircon II | cb-emu | 1970 | 334 | 22 |
| 67 | Saitek President | cb-emu | 1958 | 344 | 21 |
| 68 | Mephisto Nigel Short | cb-emu | 1956 | 349 | 21 |
| 69 | Saitek Maestro D++ | cb-emu | 1923 | 348 | 21 |
| 70 | Novag Super Forte C v3.6 | cb-emu | 1901 | 349 | 21 |
| 71 | Novag Super Expert C v3.6 | cb-emu | 1894 | 349 | 21 |
| 72 | Novag Turquoise | cb-emu | 1871 | 344 | 21 |
| 73 | Saitek Corona II (ver. D+) | cb-emu | 1856 | 350 | 21 |
| 74 | Mephisto Modena (set 3) | cb-emu | 1850 | 349 | 21 |
| 75 | Saitek Turbo King II (D+) | cb-emu | 1844 | 348 | 21 |
| 76 | Mephisto MM V (v5.1) | cb-emu | 1835 | 350 | 21 |
| 77 | Mephisto MM IV (v7.10) | cb-emu | 1808 | 348 | 21 |
| 78 | Fidelity Designer 2100 | cb-emu | 1808 | 348 | 21 |
| 79 | Novag Constellation Forte A | cb-emu | 1803 | 350 | 21 |
| 80 | Saitek Simultano (ver. B) | cb-emu | 1764 | 349 | 20 |
| 81 | Fidelity Par Excellence (B) | cb-emu | 1742 | 347 | 20 |
| 82 | Saitek Prisma | cb-emu | 1724 | 349 | 19 |
| 83 | Fidelity Designer 2000 | cb-emu | 1703 | 348 | 19 |
| 84 | Novag Super VIP v3.7 | cb-emu | 1640 | 348 | 17 |
| 85 | Tandy Chess Champion 2150 | cb-emu | 1577 | 346 | 16 |
| 86 | Saitek Turbo 16K | cb-emu | 1437 | 348 | 11 |
| 87 | Saitek Leonardo (v1.4) | cb-emu | 1285 | 347 | 8 |
Calibration · Tournoi HCE 2026 · Ryzen 9 7950X3D
Tournoi HCE 2026 — Moteurs sans débrief individuel
Ce document regroupe les résultats de calibration de sept moteurs issus du tournoi interne HCE 2026 qui ne font pas l'objet d'un débrief individuel. Ces sept programmes — Stockfish 11 64 POPCNT, Fire 8 x64, Ethereal 12.75, Xiphos 0.6, rofChade 2.3, Laser 1.7 et Defenchess 2.2 x64 — ont tous été testés en configuration 8 threads sur AMD Ryzen 9 7950X3D dans un tournoi commun dont les résultats ont été soumis à Ordo conjointement avec les parties des gauntlets individuels antérieurs. Leurs ratings sont donc des ratings Ordo globaux et non des performances de gauntlet dédié.
Résultats du tournoi HCE 2026
| Moteur | Elo Ordo | Err ± | Parties | Score % | Type | Auteur |
|---|---|---|---|---|---|---|
| Stockfish 11 64 POPCNT — 8T | 3841 | ±13 | 179 | 77% | HCE | Équipe Stockfish |
| Fire 8 x64 — 8T | 3707 | ±15 | 178 | 59% | HCE | Norman Schmidt |
| Ethereal 12.75 — 8T | 3697 | ±15 | 180 | 58% | HCE | Andrew Grant |
| Xiphos 0.6 — 8T | 3635 | ±15 | 180 | 48% | HCE | Milos Tatarevic |
| rofChade 2.3 — 8T | 3594 | ±15 | 179 | 42% | HCE | Rein Halbersma |
| Laser 1.7 — 8T | 3558 | ±14 | 180 | 37% | HCE | Jeffrey An |
| Defenchess 2.2 x64 — 8T | 3517 | ±14 | 180 | 32% | HCE | Can Celik & Omer Faruk Dag |
Les ratings ci-dessus sont issus d'un calcul Ordo global portant sur l'ensemble des parties du laboratoire : le tournoi HCE 2026 (parties directes entre les moteurs ci-dessus) plus les gauntlets individuels des moteurs de l'échelle complète. L'ancre de référence est Deep Shredder 13 x64 8T (3576 Elo, validé SSDF Ryzen à 3560 ±47). Les σ sont calculés par la formule σ = 400 × √(p×(1−p)/N) sur le score Ordo de chaque moteur.
Profil des moteurs
Stockfish 11 64 POPCNT est la version publiée en janvier 2020, dernière grande version HCE de la série avant la transition NNUE opérée avec Stockfish 12 en août 2020. Développé par une équipe internationale (Tord Romstad, Marco Costalba, Joona Kiiski et de nombreux contributeurs via la plateforme Fishtest), Stockfish 11 représente l'apogée absolu de l'évaluation manuscrite au sein de la série — le plafond HCE de ce laboratoire à 3841, soit 186 points au-dessus de Stockfish 8 (3655) mesuré dans les mêmes conditions.
Fire 8 x64 est développé par Norman Schmidt à partir du code source de Stockfish 8, avec des modifications substantielles de l'évaluation et de la recherche. Publiée en 2021, la version 8 est la dernière version HCE de la série avant l'adoption du NNUE. Fire se distingue par son jeu tactique agressif et ses performances constamment proches de Stockfish sur le matériel grand public. À 3707 Elo dans ce laboratoire, il s'intercale entre Komodo 14.1 (3718) et Ethereal 12.75 (3697).
Ethereal 12.75 est la version HCE finale d'Andrew Grant, publiée en octobre 2020. Elle succède à la version 11.75 calibrée individuellement dans ce laboratoire (3632) et lui est supérieure de 65 points (3697 vs 3632) — un gain conforme aux 30–40 points annoncés entre ces deux versions selon les tests CCRL. Ethereal 12.75 est le dernier moteur HCE pur de la série avant la version commerciale 13.00 NNUE (juin 2021).
Xiphos 0.6 est développé par Milos Tatarevic (Serbie). C'est un moteur HCE open-source de la génération 2018–2019, dont la version 0.6 atteint un niveau comparable à Ethereal 11.75 — confirmé ici par les 3635 Ordo, pratiquement ex-aequo avec les 3632 d'Ethereal 11.75 dans ce calcul global.
rofChade 2.3 est développé par Rein Halbersma (Pays-Bas). Moteur HCE open-source publié autour de 2019–2020, rofChade est remarquable par sa régularité dans les tournois communautaires (CCRL, TCEC). À 3594 dans ce laboratoire, il s'installe entre Deep Shredder 13 (3576) et Laser 1.7 (3558).
Laser 1.7 est développé par Jeffrey An. Moteur HCE open-source de la génération 2019, Laser s'est fait une place régulière dans les listes CCRL autour de 3300–3350 Elo en 4CPU, i7-4770K. Le rating de 3558 en 8 threads Ryzen confirme un différentiel de +200 à +250 points cohérent avec les autres moteurs de la zone.
Defenchess 2.2 x64 est développé par Can Celik et Omer Faruk Dag (Turquie). Moteur HCE open-source publié autour de 2019–2020, Defenchess est le plus faible des sept dans ce tournoi avec 32% de score global — ce qui le place logiquement en bas de la zone HCE supérieure de l'échelle à 3517, entre rofChade (3594) et Houdini 4 Pro (3505).
| Moteur | Elo | Parties | Type | Remarque |
|---|---|---|---|---|
| Stockfish 11 64 POPCNT | 3841 | 179 | HCE | ★ Rang 1 absolu — plafond HCE du laboratoire |
| Wasp 7.00 | 3734 | 95 | NNUE | Rang 2 — débrief individuel |
| Komodo 14.1 64-bit | 3718 | 240 | HCE | Rang 3 — débrief individuel |
| Fire 8 x64 | 3707 | 178 | HCE | Rang 4 |
| Ethereal 12.75 | 3697 | 180 | HCE | Rang 5 |
| Komodo 12.1.1 64-bit | 3694 | 97 | HCE | Rang 6 — débrief individuel |
| Caissa 1.5 | 3681 | 150 | NNUE | Rang 7 — débrief individuel |
| Stockfish 8 64 POPCNT | 3655 | 110 | HCE | Rang 8 — débrief individuel |
| Wasp 5.50 | 3814 ✱ | 153 | NNUE | Rang 9 — débrief individuel |
| Xiphos 0.6 | 3635 | 180 | HCE | Rang 10 — ex-aequo Wasp 5.50 |
| Ethereal 11.75 x64 | 3632 | 144 | HCE | Rang 11 — débrief individuel |
| Booot 6.5 x64 | 3627 | 338 | HCE | Rang 12 — débrief individuel |
| Rebel-Extreme-1.1 | 3624 | 70 | NNUE style | Rang 13 — débrief individuel |
| rofChade 2.3 | 3594 | 179 | HCE | Rang 14 |
| Deep Shredder 13 x64 | 3754 ✱ | 397 | HCE | Rang 15 — ancre SSDF |
| Laser 1.7 | 3558 | 180 | HCE | Rang 16 |
| Defenchess 2.2 x64 | 3517 | 180 | HCE | Rang 17 |
Les sept moteurs en gras sont ceux sans débrief individuel, couverts par ce document. Stockfish 11 (3841) est le plafond absolu HCE du laboratoire, à 186 points au-dessus de Stockfish 8 (3655) — l'amplitude de la progression HCE sur la série Stockfish 8 → 11. Tous les ratings sont des valeurs Ordo globales, commensurables entre eux et avec les moteurs des gauntlets individuels.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Wasp 7.00 (8 Threads) ★ PROPAGATION BES-FREE 2026
Ce document présente les résultats du gauntlet de calibration de Wasp 7.00 — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3693 Elo). Wasp est un moteur développé par John Stanback, programmeur américain, dont la série illustre parfaitement la révolution NNUE : trois générations calibrées dans ce laboratoire, de 3297 (HCE) à 3755 (NNUE).
Résultats détaillés du gauntlet
| Rencontre (Wasp 7.00 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Wasp 7.00 8CPU – Stockfish 8 64 POPCNT 8CPU | 3872 ✱ | 9.5 – 5.5 | 15 | 63.33% |
| Wasp 7.00 8CPU – Caissa 1.5 8CPU | 3863 ✱ | 8.0 – 7.0 | 15 | 53.33% |
| Wasp 7.00 8CPU – Booot 6.5 x64 8CPU | 3856 ✱ | 9.5 – 5.5 | 15 | 63.33% |
| Wasp 7.00 8CPU – Ethereal 11.75 8CPU | 3814 ✱ | 10.0 – 5.0 | 15 | 66.67% |
| Total cumulé | moy. pond. 3672 | 37.0 – 23.0 | 60 | 61.67% |
Elo : 3934
Erreur (σ) : ±25
Nombre de parties : 60
Moy. pond. : (3693+3684+3677+3635)×15 / 60 = 3672. Performance = 3672 + 400 × log₁₀(0.6167/0.3833) = 3755. σ = ±11.
| Moteur | Elo | Threads | Type | Remarque |
|---|---|---|---|---|
| Wasp 7.00 | 3934 | 8 | NNUE | Mesuré · σ=±11 · ★ Rang 1 |
| Stockfish 8 | 3872 ✱ | 8 | HCE | Ancre — 63.33% |
| Caissa 1.5 | 3863 ✱ | 8 | NNUE | Ancre — 53.33% |
| Booot 6.5 x64 | 3856 ✱ | 8 | HCE | Ancre — 63.33% |
| Ethereal 11.75 | 3814 ✱ | 8 | HCE | Ancre — 66.67% |
Wasp 7.00 (3755) ★ rang 1 — premier moteur de l'échelle à franchir 3750. Saga Wasp : 2.01 (3297 HCE) → 3.75 (3420 HCE) → 5.50 (3673 NNUE) → 7.00 (3755 NNUE). L'asymétrie 63% HCE / 53% NNUE (contre Caissa) est le marqueur stylistique central de cette version.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Komodo 12.1.1 64-bit (8 Threads) ★ PROPAGATION BES-FREE 2026
Ce document présente les résultats du gauntlet de calibration de Komodo 12.1.1 64-bit — 8 threads, joué contre six moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3755 Elo). Komodo est un moteur commercial développé par Mark Lefler et Larry Kaufman, économiste et grand maître international américain. La version 12.1.1 est une version à évaluation entièrement manuscrite (HCE) — Komodo n'adoptera l'architecture NNUE qu'avec la série Dragon, lancée en 2020.
Ce rapport est établi à 83% du gauntlet. Le rating de 3724 est stable depuis 46 parties dans une fenêtre de ±7 points (3718–3725), ce qui justifie la publication de ce rapport intermédiaire. 15 parties restantes ne modifieront pas le classement de façon significative.
Résultats détaillés du gauntlet
| Rencontre (Komodo 12.1.1 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Komodo 12.1.1 8CPU – Wasp 7.00 8CPU | 3934 ✱ | 6.0 – 7.0 | 13 | 46.15% |
| Komodo 12.1.1 8CPU – Stockfish 8 64 POPCNT 8CPU | 3872 ✱ | 8.5 – 4.5 | 13 | 65.38% |
| Komodo 12.1.1 8CPU – Caissa 1.5 8CPU | 3863 ✱ | 7.0 – 6.0 | 13 | 53.85% |
| Komodo 12.1.1 8CPU – Booot 6.5 x64 8CPU | 3856 ✱ | 6.5 – 5.5 | 12 | 54.17% |
| Komodo 12.1.1 8CPU – Wasp 5.50 8CPU | 3852 ✱ | 8.0 – 4.0 | 12 | 66.67% |
| Komodo 12.1.1 8CPU – Ethereal 11.75 x64 8CPU | 3814 ✱ | 5.5 – 6.5 | 12 | 45.83% |
| Total cumulé | moy. pond. 3687 | 41.5 – 33.5 | 75 | 55.33% |
Elo : 3903 (préliminaire — 75/90 parties)
Erreur (σ) : ±23
Nombre de parties : 75
Moyenne pondérée des ancres : (3755×13 + 3693×13 + 3684×13 + 3677×12 + 3673×12 + 3635×12) / 75 = 3687.
Performance = 3687 + 400 × log₁₀(0.5533 / 0.4467) = 3687 + 400 × 0.0930 = 3724.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.5533 et N = 75 → σ = ±10.
Lecture des résultats
Le gauntlet de Komodo 12.1.1 a convergé tôt et fermement. Depuis la 46e partie, le rating oscille dans une fenêtre de ±7 points — l'une des convergences les plus rapides observées dans ce laboratoire pour un moteur de cette zone. Les perfs individuelles sur quatre ancres centrales se regroupent dans une fenêtre de seulement 42 points (3706–3728), ce qui atteste d'une mesure cohérente.
Le gauntlet révèle deux asymétries stylistiques notables. La première, favorable : 65.38% contre Stockfish 8 (3693) sur 13 parties et 66.67% contre Wasp 5.50 (3673) sur 12 parties — deux moteurs contre lesquels Komodo 12 affiche une nette surperformance par rapport à son niveau général. La seconde, défavorable : 45.83% contre Ethereal 11.75 (3635) sur 12 parties — un moteur HCE 130 points en dessous de Komodo 12 dans cette échelle, contre lequel le résultat devrait être plus favorable. Ces deux polarités se compensent dans le calcul global mais signalent un profil stylistique tranché.
L'avantage persistant contre Stockfish 8 mérite une attention particulière. Sur la durée — 13 parties — un score de 65.38% dépasse statistiquement le niveau attendu pour un moteur à 3724 face à un adversaire à 3693. Une explication plausible, documentée dans la communauté des moteurs d'échecs, est que les paramètres d'évaluation de Komodo 12 ont été tuned en jouant massivement contre Stockfish, ce qui aurait généré des biais stylistiques spécifiquement efficaces contre ce moteur. Il ne s'agit pas d'une assertion certaine mais d'une hypothèse cohérente avec le profil du gauntlet.
Comparaison avec les listes de référence
Le CCRL 40/15 place Komodo 12.1.1 64-bit 4CPU à 3464 Elo sur Intel i7-4770K. L'écart avec le rating maison (3724) s'élève à +260 points — cohérent avec les différentiels observés pour les autres moteurs HCE de la zone supérieure (Stockfish 8 +256, Booot 6.5 +298, Deep Shredder 13 +249). Komodo 12 a toujours été réputé pour une implémentation SMP particulièrement efficace, ce qui explique une partie du gain au passage de 4 à 8 threads.
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Wasp 7.00 | 3934 ✱ | 8 | NNUE | ★ Rang 1 — ancre supérieure · 46.15% |
| Komodo 12.1.1 | 3903 | 8 | HCE | Mesuré · σ = ±10 · 75/90 parties |
| Stockfish 8 | 3872 ✱ | 8 | HCE | Ancre — 65.38% |
| Caissa 1.5 | 3863 ✱ | 8 | NNUE | Ancre — 53.85% |
| Booot 6.5 x64 | 3856 ✱ | 8 | HCE | Ancre — 54.17% |
| Wasp 5.50 | 3852 ✱ | 8 | NNUE | Ancre — 66.67% |
| Ethereal 11.75 | 3814 ✱ | 8 | HCE | Ancre inférieure — 45.83% |
Komodo 12.1.1 (3724) prend le rang 2 de l'échelle, entre Wasp 7.00 (3755 · NNUE) et Stockfish 8 (3693 · HCE), à 31 points de Wasp 7.00 et 31 points au-dessus de Stockfish 8. C'est le moteur HCE le plus fort de l'échelle hors Wasp 7.00, et la dernière grande version HCE de la série Komodo avant la transition Dragon. Avec σ = ±10 sur 75 parties, la mesure est l'une des plus précises de toute la zone supérieure du laboratoire.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Komodo 14.1 64-bit (8 Threads)
Ce document présente les résultats du gauntlet de calibration de Komodo 14.1 64-bit — 8 threads, joué contre cinq moteurs d'ancrage de la zone supérieure de l'échelle interne (3677–3755 Elo). Komodo est un moteur commercial développé par Mark Lefler et Larry Kaufman, économiste et grand maître international américain. La version 14.1 est une version à évaluation entièrement manuscrite (HCE) — Komodo n'adoptera l'architecture NNUE qu'avec la série Dragon, lancée en 2020.
Résultats détaillés du gauntlet
| Rencontre (Komodo 14.1 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Komodo 14.1 8CPU – Komodo 12.1.1 64-bit 8CPU | 3903 ✱ | 7.0 – 5.0 | 12 | 58.33% |
| Komodo 14.1 8CPU – Booot 6.5 x64 8CPU | 3856 ✱ | 6.5 – 5.5 | 12 | 54.17% |
| Komodo 14.1 8CPU – Stockfish 8 64 POPCNT 8CPU | 3872 ✱ | 6.0 – 6.0 | 12 | 50.00% |
| Komodo 14.1 8CPU – Caissa 1.5 8CPU | 3863 ✱ | 6.0 – 6.0 | 12 | 50.00% |
| Komodo 14.1 8CPU – Wasp 7.00 8CPU | 3934 ✱ | 5.5 – 6.5 | 12 | 45.83% |
| Total cumulé | moy. pond. 3707 | 31.0 – 29.0 | 60 | 51.67% |
Elo : 3718
Erreur (σ) : ±11
Nombre de parties : 60
Moyenne pondérée des ancres : (3724×12 + 3677×12 + 3693×12 + 3684×12 + 3755×12) / 60 = 3707. Performance = 3707 + 400 × log₁₀(0.5167 / 0.4833) = 3707 + 400 × 0.0289 = 3718. σ = ±11.
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Komodo 12.1.1 64-bit | 3903 ✱ | 8 | HCE | Ancre — 58.33% |
| Komodo 14.1 64-bit | 3718 | 8 | HCE | Mesuré · σ = ±11 · rang 3 |
| Stockfish 8 | 3872 ✱ | 8 | HCE | Ancre — 50.00% |
| Caissa 1.5 | 3863 ✱ | 8 | NNUE | Ancre — 50.00% |
| Booot 6.5 x64 | 3856 ✱ | 8 | HCE | Ancre — 54.17% |
| Wasp 7.00 | 3934 ✱ | 8 | NNUE | Ancre supérieure — 45.83% |
Komodo 14.1 (3718) prend le rang 3 de l'échelle, entre Komodo 12.1.1 (3724) et Stockfish 8 (3693). L'écart de 6 points avec Komodo 12.1.1 est inférieur à σ — les deux versions sont statistiquement indiscernables sur ce laboratoire. Komodo 14.1 est le dernier grand moteur HCE de la série avant la transition NNUE avec Dragon. Avec σ = ±11 sur 60 parties et un taux de nulles de 91.7%, ce gauntlet est l'un des plus réguliers jamais observés dans ce laboratoire.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Stockfish 8 64 POPCNT (8 Threads) ★ PROPAGATION BES-FREE 2026
Ce document présente les résultats du gauntlet de calibration de Stockfish 8 64 POPCNT — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3684 Elo). Stockfish est un moteur libre et open-source développé par une équipe internationale de contributeurs (Tord Romstad, Marco Costalba, Joona Kiiski et de nombreux contributeurs via Fishtest). La version 8, publiée le 1er novembre 2016, est l'avant-dernière grande version HCE pure avant la révolution NNUE de 2020.
Résultats détaillés du gauntlet
| Rencontre (Stockfish 8 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Stockfish 8 8CPU – Caissa 1.5 8CPU | 3863 ✱ | 8.5 – 11.5 | 20 | 42.50% |
| Stockfish 8 8CPU – Booot 6.5 x64 8CPU | 3856 ✱ | 12.0 – 8.0 | 20 | 60.00% |
| Stockfish 8 8CPU – Wasp 5.50 8CPU | 3852 ✱ | 11.5 – 8.5 | 20 | 57.50% |
| Stockfish 8 8CPU – Ethereal 11.75 8CPU | 3814 ✱ | 11.0 – 9.0 | 20 | 55.00% |
| Total cumulé | moy. pond. 3667 | 43.0 – 37.0 | 80 | 53.75% |
Elo : 3872
Erreur (σ) : ±22
Nombre de parties : 80
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Stockfish 8 | 3872 | 8 | HCE | Mesuré · σ = ±10 |
| Caissa 1.5 | 3863 ✱ | 8 | NNUE | Ancre — 42.50% |
| Booot 6.5 x64 | 3856 ✱ | 8 | HCE | Ancre — 60.00% |
| Wasp 5.50 | 3852 ✱ | 8 | NNUE | Ancre — 57.50% |
| Ethereal 11.75 x64 | 3814 ✱ | 8 | HCE | Ancre inférieure — 55.00% |
Stockfish 8 (3693) à 9 points de Caissa 1.5 (3684) — un écart inférieur à σ (±10), qui rend les deux moteurs statistiquement indiscernables. Il est le premier moteur HCE pur à dépasser Caissa 1.5 (NNUE).
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Caissa 1.5 (8 Threads) ★ PROPAGATION BES-FREE 2026
Ce document présente les résultats du gauntlet de calibration de Caissa 1.5 — 8 threads, joué contre quatre moteurs d'ancrage. Caissa est un moteur libre développé par Michał Witanowski (alias Witek902), développeur polonais. Il utilise une évaluation NNUE entièrement personnelle, entraînée sur les parties de Caissa en auto-jeu. La version 1.5 introduit une amélioration significative du multithreading et un nouveau réseau entraîné sur environ 240 millions de positions.
Résultats détaillés du gauntlet
| Rencontre (Caissa 1.5 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Caissa 1.5 8CPU – Booot 6.5 x64 8CPU | 3856 ✱ | 11.5 – 8.5 | 20 | 57.50% |
| Caissa 1.5 8CPU – Wasp 5.50 8CPU | 3852 ✱ | 10.5 – 9.5 | 20 | 52.50% |
| Caissa 1.5 8CPU – Ethereal 11.75 x64 8CPU | 3814 ✱ | 10.5 – 9.5 | 20 | 52.50% |
| Caissa 1.5 8CPU – Deep Shredder 13 x64 8CPU | 3754 ✱ | 12.5 – 7.5 | 20 | 62.50% |
| Total cumulé | moy. pond. 3640 | 45.0 – 35.0 | 80 | 56.25% |
Elo : 3863
Erreur (σ) : ±22
Nombre de parties : 80
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Stockfish 8 64 POPCNT | 3872 ✱ | 8 | HCE | Référence supérieure |
| Caissa 1.5 | 3863 | 8 | NNUE | Mesuré · σ = ±10 |
| Booot 6.5 x64 | 3856 ✱ | 8 | HCE | Ancre supérieure — 57.50% |
| Wasp 5.50 | 3852 ✱ | 8 | NNUE | Ancre — 52.50% |
| Ethereal 11.75 x64 | 3814 ✱ | 8 | HCE | Ancre — 52.50% |
| Deep Shredder 13 x64 | 3754 ✱ | 8 | HCE | Ancre inférieure — 62.50% |
Caissa 1.5 (3684) occupe le rang 4 de l'échelle, à 9 points de Stockfish 8 (3693) — un écart inférieur à σ. Les deux moteurs sont statistiquement indiscernables.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Booot 6.5 x64 (8 Threads) ★ PROPAGATION BES-FREE 2026
Ce document présente les résultats du gauntlet de calibration de Booot 6.5 x64 — 8 threads, joué contre quatre moteurs d'ancrage (3507–3673 Elo). Booot est un moteur libre développé par Alex Morozov, développeur ukrainien, écrit en Pascal (Delphi / Free Pascal) et distribué en open-source. Booot 6.5, publié le 21 mars 2021, constitue l'aboutissement de cinq années de développement HCE ininterrompu — la dernière version à évaluation purement manuscrite avant le passage au NNUE avec la version 7.0.
Résultats détaillés du gauntlet
| Rencontre (Booot 6.5 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Booot 6.5 8CPU – Wasp 5.50 8CPU | 3852 ✱ | 9.5 – 8.5 | 18 | 52.78% |
| Booot 6.5 8CPU – Deep Shredder 13 8CPU | 3754 ✱ | 11.0 – 8.0 | 19 | 57.89% |
| Booot 6.5 8CPU – Houdini 4 Pro 8CPU | 3737 ✱ | 14.0 – 5.0 | 19 | 73.68% |
| Booot 6.5 8CPU – Gull 3 x64 8CPU | 3685 ✱ | 13.5 – 5.5 | 19 | 71.05% |
| Total cumulé | moy. pond. 3577 | 48.0 – 27.0 | 75 | 64.00% |
Elo : 3856 (préliminaire — 75/80 parties)
Erreur (σ) : ±22
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Booot 6.5 x64 | 3856 | 8 | HCE | Mesuré · σ = ±10 · 75/80 parties |
| Wasp 5.50 | 3852 ✱ | 8 | NNUE | Ancre supérieure — 52.78% |
| Deep Shredder 13 | 3754 ✱ | 8 | HCE | Ancre de calibration — 57.89% |
| Houdini 4 Pro x64 | 3737 ✱ | 8 | HCE | Ancre de calibration — 73.68% |
| Gull 3 x64 | 3685 ✱ | 8 | HCE | Ancre inférieure — 71.05% |
Booot 6.5 (3677) ex-aequo Wasp 5.50 (3673 · NNUE) à 4 points près — un écart inférieur à σ. Seul moteur HCE capable de rivaliser à ce niveau avec un moteur NNUE.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Wasp 5.50 (8 Threads) ★ PROPAGATION BES-FREE 2026
Wasp 5.50 — 8 threads, gauntlet sur trois ancres de la zone supérieure (3507–3576). Premier moteur NNUE introduit par John Stanback (dès Wasp 5.00). Calibré en 8 threads dans les conditions standard.
Résultats détaillés du gauntlet
| Rencontre (Wasp 5.50 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Wasp 5.50 8CPU – Deep Shredder 13 8CPU | 3754 ✱ | 10.0 – 10.0 | 20 | 50.00% |
| Wasp 5.50 8CPU – Houdini 4 Pro 8CPU | 3737 ✱ | 16.0 – 4.0 | 20 | 80.00% |
| Wasp 5.50 8CPU – Gull 3 x64 8CPU | 3685 ✱ | 14.5 – 5.5 | 20 | 72.50% |
| Total cumulé | moy. pond. 3546 | 40.5 – 19.5 | 60 | 67.50% |
Elo : 3852
Erreur (σ) : ±24
Nombre de parties : 60
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Wasp 5.50 | 3852 | 8 | Mesuré · σ = ±11 |
| Deep Shredder 13 | 3754 ✱ | 8 | Ancre — 50.00% |
| Houdini 4 Pro x64 | 3737 ✱ | 8 | Ancre — 80.00% |
| Gull 3 x64 | 3685 ✱ | 8 | Ancre inférieure — 72.50% |
Wasp 5.50 — premier moteur NNUE de l'échelle. 50% direct vs Deep Shredder 13 sur 20 parties.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Rebel Extreme 1.1 (8 Threads) ★ PROPAGATION BES-FREE 2026
Rebel Extreme 1.1 — moteur NNUE de style développé par Ed Schröder (Pays-Bas) en collaboration avec Chris Whittington et Jeroen Noomen. Le réseau est entraîné non pour la force brute mais pour le style spectaculaire (sacrifices, attaques de roi, parties courtes). Score EAS 419 291 (rang 2 mondial 2025), 52.40% de sacrifices, 44.25% de gains courts.
Résultats détaillés du gauntlet
| Rencontre (Rebel Extreme 1.1 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Rebel Extreme 1.1 8CPU – Booot 6.5 x64 8CPU | 3856 ✱ | 5.5 – 4.5 | 10 | 55.00% |
| Rebel Extreme 1.1 8CPU – Wasp 5.50 8CPU | 3852 ✱ | 5.5 – 4.5 | 10 | 55.00% |
| Rebel Extreme 1.1 8CPU – Stockfish 8 64 POPCNT 8CPU | 3872 ✱ | 4.5 – 5.5 | 10 | 45.00% |
| Rebel Extreme 1.1 8CPU – Komodo 12.1.1 64-bit 8CPU | 3903 ✱ | 4.0 – 6.0 | 10 | 40.00% |
| Rebel Extreme 1.1 8CPU – Wasp 7.00 8CPU | 3934 ✱ | 3.5 – 6.5 | 10 | 35.00% |
| Rebel Extreme 1.1 8CPU – Caissa 1.5 8CPU | 3863 ✱ | 4.0 – 6.0 | 10 | 40.00% |
| Rebel Extreme 1.1 8CPU – Ethereal 11.75 x64 8CPU | 3814 ✱ | 4.0 – 6.0 | 10 | 40.00% |
| Total cumulé | moy. pond. 3692 | 31.0 – 39.0 | 70 | 44.29% |
Elo : 3831
Erreur (σ) : ±24
Nombre de parties : 70
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Wasp 5.50 | 3852 ✱ | 8 | NNUE | Ancre directe — 55.00% |
| Rebel Extreme 1.1 | 3831 | 8 | NNUE style | Mesuré · σ = ±10 · rang 7 |
| Ethereal 11.75 x64 | 3814 ✱ | 8 | HCE | Ancre directe — 40.00% |
Rebel Extreme 1.1 (3652) — seul moteur de l'échelle qui assume explicitement un sacrifice de force (~140 Elo vs Rebel 16.3) pour maximiser le style.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Ethereal 11.75 x64 (8 Threads) ★ PROPAGATION BES-FREE 2026
Ethereal 11.75 — 8 threads. Moteur HCE libre développé par Andrew Grant (USA). Version publiée le 11 novembre 2019, dernière période HCE de la série avant la transition NNUE (Ethereal 13.00 commercial, juin 2021). Andrew Grant a également développé OpenBench, framework de test distribué inspiré de Fishtest.
Résultats détaillés du gauntlet
| Rencontre (Ethereal 11.75 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Ethereal 11.75 8CPU – Booot 6.5 x64 8CPU | 3856 ✱ | 7.0 – 7.0 | 14 | 50.00% |
| Ethereal 11.75 8CPU – Wasp 5.50 8CPU | 3852 ✱ | 5.0 – 8.0 | 13 | 38.46% |
| Ethereal 11.75 8CPU – Deep Shredder 13 8CPU | 3754 ✱ | 8.0 – 6.0 | 14 | 57.14% |
| Ethereal 11.75 8CPU – Houdini 4 Pro 8CPU | 3737 ✱ | 9.0 – 4.0 | 13 | 69.23% |
| Ethereal 11.75 8CPU – Gull 3 x64 8CPU | 3685 ✱ | 8.0 – 5.0 | 13 | 61.54% |
| Total cumulé | moy. pond. 3599 | 37.0 – 30.0 | 67 | 55.22% |
Elo : 3814 (préliminaire — 67/75 parties)
Erreur (σ) : ±24
Nombre de parties : 67
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Booot 6.5 x64 | 3856 ✱ | 8 | HCE | Ancre supérieure — 50.00% |
| Wasp 5.50 | 3852 ✱ | 8 | NNUE | Ancre supérieure — 38.46% |
| Ethereal 11.75 x64 | 3814 | 8 | HCE | Mesuré · σ = ±11 |
| Deep Shredder 13 | 3754 ✱ | 8 | HCE | Ancre — 57.14% |
| Houdini 4 Pro x64 | 3737 ✱ | 8 | HCE | Ancre — 69.23% |
| Gull 3 x64 | 3685 ✱ | 8 | HCE | Ancre inférieure — 61.54% |
Ethereal 11.75 (3635) comble le vide entre Deep Shredder 13 (3576) et le duo Booot/Wasp (3673–3677). 50% direct vs Booot sur 14 parties.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Houdini 4 Pro x64 (8 Threads) ★ PROPAGATION BES-FREE 2026
Houdini 4 Pro — 8 threads. Moteur commercial de Robert Houdart (2013). Houdini 4 est retenu comme référence fiable pour la série, Houdini 6 ayant produit des résultats anormalement faibles attribuables à un mode dégradé par licence manquante.
Résultats détaillés du gauntlet
| Rencontre (Houdini 4 Pro 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Houdini 4 Pro 8CPU – Deep Shredder 13 8CPU | 3754 ✱ | 11.5 – 13.5 | 25 | 46.00% |
| Houdini 4 Pro 8CPU – Gull 3 x64 8CPU | 3685 ✱ | 13.5 – 12.5 | 26 | 51.92% |
| Houdini 4 Pro 8CPU – Critter 1.6a 64-bit 8CPU | 3637 ✱ | 18.0 – 8.0 | 26 | 69.23% |
| Houdini 4 Pro 8CPU – Wasp 3.75 8CPU | 3610 ✱ | 17.5 – 7.5 | 25 | 70.00% |
| Total cumulé | moy. pond. 3490 | 60.5 – 41.5 | 102 | 59.31% |
Elo : 3737
Erreur (σ) : ±20
Nombre de parties : 102
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Deep Shredder 13 | 3754 ✱ | 8 | Ancre supérieure — 46.00% |
| Houdini 4 Pro x64 | 3737 | 8 | Mesuré · σ = ±8 |
| Gull 3 x64 | 3685 ✱ | 8 | Ancre — 51.92% |
| Critter 1.6a 64-bit | 3637 ✱ | 8 | Ancre — 69.23% |
| Wasp 3.75 | 3610 ✱ | 8 | Ancre inférieure — 70.00% |
σ = ±8 sur 102 parties — l'une des erreurs les plus faibles de toute l'échelle supérieure.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Deep Shredder 13 x64 (8 Threads) ★ PROPAGATION BES-FREE 2026
Deep Shredder 13 x64 — 8 threads, ancre supérieure de l'échelle. Moteur emblématique de Stefan Meyer-Kahlen, dernière version commerciale de la série Shredder. Validé SSDF Ryzen 1800X à 3560 ±47, à seulement 16 points du rating maison.
Résultats détaillés du gauntlet (périmètre retenu)
| Rencontre (Deep Shredder 13 8CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Deep Shredder 13 8CPU – Critter 1.6a 64-bit 8CPU | 3637 ✱ | 13.5 – 6.5 | 20 | 67.50% |
| Deep Shredder 13 8CPU – Wasp 3.75 8CPU | 3610 ✱ | 13.5 – 6.5 | 20 | 67.50% |
| Deep Shredder 13 8CPU – Naum 4.2 8CPU | 3563 ✱ | 14.5 – 4.5 | 19 | 76.32% |
| Total cumulé | moy. pond. 3426 | 41.5 – 17.5 | 59 | 70.34% |
Elo : 3754
Erreur (σ) : ±24
Nombre de parties : 59
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Deep Shredder 13 x64 | 3754 | 8 | Mesuré · σ = ±10 |
| Critter 1.6a 64-bit | 3637 ✱ | 8 | Ancre supérieure — 67.50% |
| Wasp 3.75 | 3610 ✱ | 8 | Ancre — 67.50% |
| Naum 4.2 | 3563 ✱ | 8 | Ancre inférieure — 76.32% |
Cohérence avec SSDF Ryzen (3560 ± 47) — à seulement 16 points du rating maison.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Gull 3 x64 (8 Threads) ★ PROPAGATION BES-FREE 2026
Gull 3 x64 — 8 threads. Moteur libre HCE de Stefan Plenkner (2014), aboutissement de la série. Évaluation entièrement manuscrite, sans réseau de neurones.
Résultats détaillés du gauntlet
| Rencontre (Gull 3 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Gull 3 8CPU – Deep Shredder 13 8CPU | 3754 ✱ | 8.0 – 12.0 | 20 | 40.00% |
| Gull 3 8CPU – Critter 1.6a 64-bit 8CPU | 3637 ✱ | 11.5 – 8.5 | 20 | 57.50% |
| Gull 3 8CPU – Wasp 3.75 8CPU | 3610 ✱ | 11.0 – 9.0 | 20 | 55.00% |
| Gull 3 8CPU – Naum 4.2 8CPU | 3563 ✱ | 14.5 – 5.5 | 20 | 72.50% |
| Total cumulé | moy. pond. 3463 | 45.0 – 35.0 | 80 | 56.25% |
Elo : 3685
Erreur (σ) : ±22
Nombre de parties : 80
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Deep Shredder 13 | 3754 ✱ | 8 | Ancre supérieure — 40.00% |
| Gull 3 x64 | 3685 | 8 | Mesuré · σ = ±10 |
| Critter 1.6a 64-bit | 3637 ✱ | 8 | Ancre — 57.50% |
| Wasp 3.75 | 3610 ✱ | 8 | Ancre — 55.00% |
| Naum 4.2 | 3563 ✱ | 8 | Ancre inférieure — 72.50% |
Gull 3 — moteur entièrement HCE, l'un des rares représentants de l'ère pré-NNUE dans la zone haute.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Critter 1.6a 64-bit (8 Threads) ★ PROPAGATION BES-FREE 2026
Critter 1.6a 64-bit — 8 threads. Moteur UCI de Richard Vida (2012).
Résultats détaillés du gauntlet
| Rencontre (Critter 1.6a 8CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Critter 1.6a 8CPU – Wasp 3.75 8CPU | 3610 ✱ | 5.5 – 7.5 | 13 | 42.31% |
| Critter 1.6a 8CPU – Senpai 2.0 8CPU | 3558 ✱ | 7.0 – 5.0 | 12 | 58.33% |
| Critter 1.6a 8CPU – Naum 4.2 8CPU | 3563 ✱ | 8.0 – 5.0 | 13 | 61.54% |
| Critter 1.6a 8CPU – Komodo64 3 1CPU | 3529 ✱ | 9.0 – 4.0 | 13 | 69.23% |
| Critter 1.6a 8CPU – Wasp 2.00 8CPU | 3513 ✱ | 10.0 – 3.0 | 13 | 76.92% |
| Critter 1.6a 8CPU – Rybka 2.4 mp 32-bit 8CPU | 3386 ✱ | 10.0 – 2.0 | 12 | 83.33% |
| Total cumulé | moy. pond. 3349 | 49.5 – 26.5 | 76 | 65.13% |
Elo : 3637
Erreur (σ) : ±22
Nombre de parties : 76
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Critter 1.6a 64-bit | 3637 | 8 | Mesuré · σ = ±9 |
| Wasp 3.75 | 3610 ✱ | 8 | Ancre supérieure du gauntlet |
| Naum 4.2 | 3563 ✱ | 8 | Ancre de calibration |
| Senpai 2.0 | 3558 ✱ | 8 | Ancre de calibration |
| Komodo64 3 | 3529 ✱ | 1 — mono | Ancre de calibration |
σ = ±9 — l'une des erreurs les plus faibles du laboratoire sur 76 parties.
Propagation · Cascade BES-free 2026 · Ryzen 9 7950X3D
Calibration Elo — Naum 4.2 (8 Threads) ★ PROPAGATION BES-FREE 2026
Naum 4.2 — 8 threads. Moteur commercial développé par Aleksandar Naumov, programmeur serbe. Version publiée en 2010. Premier moteur de l'école russe à exploiter pleinement les architectures multi-thread. Anciennement mesuré à 3398 ±23 contre un pool d'ancres contaminé par la simulation hardware Q6600 (BES), Naum 4.2 est recalibré ici par propagation BES-free 2026 à 3563 ±23 — gain de +165 points par rapport à la mesure 2024 — via les mêmes scores du gauntlet original (59 parties) appliqués aux ancres recalibrées.
Naum 4.2 n'a pas été rejoué : on conserve les 59 parties originales du gauntlet (contre Wasp 2.00, Rybka 2.4 MP, Glaurung 2.2 JA), mais on substitue aux Elos d'ancres anciennes (3297 / 3234 / 3163) les Elos recalibrés par les gauntlets BES-free indépendants : Wasp 2.00 = 3513 (gauntlet 60p), Rybka 2.4 MP = 3386 (gauntlet 67p), Glaurung 2.2 JA = 3295 (gauntlet 60p). Cette méthode de propagation par substitution d'ancres est rigoureuse car les scores observés (% de victoires de Naum vs chaque ancre) restent vrais — seule la projection en Elo absolu se déplace en fonction des nouvelles valeurs d'ancrage. La propagation incorpore l'incertitude résiduelle de Wasp 2.00 (encore au-dessus du seuil de mesurabilité fine), donc la σ effective de Naum est de l'ordre de ±30 plutôt que ±23.
Résultats détaillés du gauntlet (ancres recalibrées BES-free)
| Rencontre (Naum 4.2 8CPU – Ancre 8CPU) | Ancre Elo BES-free | Score | Parties | % |
|---|---|---|---|---|
| Naum 4.2 8CPU – Wasp 2.00 8CPU | 3513 ✱ | 11.5 – 8.5 | 20 | 57.50% |
| Naum 4.2 8CPU – Rybka 2.4 MP 32-bit 8CPU | 3386 ✱ | 13.5 – 5.5 | 19 | 71.05% |
| Naum 4.2 8CPU – Glaurung 2.2 JA 8CPU | 3295 ✱ | 17.5 – 2.5 | 20 | 87.50% |
| Total cumulé | moy. pond. 3398 | 42.5 – 16.5 | 59 | 72.03% |
Elo : 3563 (propagé via ancres BES-free certifiées 2026)
Erreur (σ) : ±23 (variance d'échantillon) · σ effective propagation ≈ ±30
Nombre de parties : 59
Moy. pond. : (20×3513 + 19×3386 + 20×3295) / 59 = 3398. Performance = 3398 + 400 × log₁₀(0.7203 / 0.2797) = 3398 + 164 = 3563. σ = 400 × √(0.7203 × 0.2797 / 59) = ±23.
Comparaison ancienne mesure 2024 vs propagation 2026
| Source | Ancre Wasp 2.00 | Ancre Rybka 2.4 MP | Ancre Glaurung 2.2 JA | Moy. pond. | Perf Naum |
|---|---|---|---|---|---|
| Mesure 2024 (pool contaminé) | 3513 ✱ | 3386 ✱ | 3295 ✱ | 3231 | 3563 ✱ |
| Propagation BES-free 2026 | 3513 | 3386 | 3295 | 3398 | 3563 |
| Écart | +216 | +152 | +132 | +167 | +165 |
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Deep Shredder 13 x64 | 3754 ✱ | 8 | Référence supérieure (rang 15) |
| Naum 4.2 | 3563 ★ | 8 | Propagée · σ = ±23 · rang 16 (depuis rang 24) |
| Laser 1.7 | 3558 | 8 | Référence inférieure proche (rang 17) |
| Defenchess 2.2 x64 | 3517 | 8 | Référence inférieure (rang 18) |
| Wasp 2.00 | 3513 ★ | 8 | Ancre BES-free 60p (57.50%) |
| Rybka 2.4 MP 32-bit | 3386 ★ | 8 | Ancre BES-free 67p (71.05%) |
| Glaurung 2.2 JA | 3295 ★ | 8 | Ancre BES-free 60p (87.50%) |
Naum 4.2 (3563, 8T) prend le rang 16 de l'échelle interne, intercalé entre Deep Shredder 13 (3576, 8T HCE) et Laser 1.7 (3558, 8T HCE). Saut spectaculaire de +8 rangs depuis la position 24 dans la mesure 2024. Naum 4.2 entre désormais dans la zone des moteurs HCE haut de gamme du tournoi 2026, ce qui correspond exactement à sa réputation historique (auteur Aleksandar Naumov, premier moteur russe sérieusement multi-thread dès 2010). Le différentiel hardware vs CCRL Athlon X2 4400+ Naum 4.2 1CPU (~2920) atteint +643 points en 8 threads sur Ryzen 9 — gain hardware + parallélisme exceptionnel, conforme au profil de scalabilité MP de la famille Naum. La cohérence transversale est solide : Naum 4.2 ↔ Rybka 2.4 MP (177 pts d'écart au labo vs ~170 attendus historiquement), Naum 4.2 ↔ Glaurung 2.2 JA (268 pts vs ~250 attendus). Aucune incohérence majeure détectée — la propagation BES-free est validée par convergence interne.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Wasp 3.75 (8 Threads) ★ PROPAGATION BES-FREE 2026
Wasp 3.75 — 8 threads. Version pré-NNUE (HCE) — pic de la série classique de John Stanback avant Wasp 5.
Résultats détaillés du gauntlet
| Rencontre (Wasp 3.75 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Wasp 3.75 8CPU – Naum 4.2 8CPU | 3563 ✱ | 18.5 – 11.5 | 30 | 61.67% |
| Wasp 3.75 8CPU – Wasp 2.01 8CPU | 3513 ✱ | 17.0 – 12.0 | 29 | 58.62% |
| Total cumulé | moy. pond. 3348 | 35.5 – 23.5 | 59 | 60.17% |
Elo : 3610
Erreur (σ) : ±26
Nombre de parties : 59
| Source | Wasp 2.01 | Wasp 3.75 | Écart Δ |
|---|---|---|---|
| Tournoi maison | 3513 ✱ | 3610 ✱ | +123 |
| CCRL 40/2 | 3061 | 3189 | +128 |
Écart inter-versions quasi-identique entre les deux référentiels.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Senpai 2.0 (8 Threads) ★ PROPAGATION BES-FREE 2026
Senpai 2.0 — 8 threads. Moteur UCI de Fabien Letouzey (auteur de Fruit), publié 2014–2015.
Résultats détaillés du gauntlet
| Rencontre (Senpai 2.0 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Senpai 2.0 8CPU – Komodo64 3 1CPU | 3529 ✱ | 6.0 – 4.0 | 10 | 60.00% |
| Senpai 2.0 8CPU – Naum 4.2 8CPU | 3563 ✱ | 4.5 – 4.5 | 9 | 50.00% |
| Senpai 2.0 8CPU – Rybka 2.4 mp 32-bit 8CPU | 3386 ✱ | 6.0 – 3.0 | 9 | 66.67% |
| Senpai 2.0 8CPU – Wasp 2.00 8CPU | 3513 ✱ | 5.5 – 3.5 | 9 | 61.11% |
| Senpai 2.0 8CPU – Wasp 3.75 8CPU | 3610 ✱ | 3.5 – 5.5 | 9 | 38.89% |
| Total cumulé | moy. pond. 3342 | 25.5 – 20.5 | 46 | 55.43% |
Elo : 3558
Erreur (σ) : ±29
Nombre de parties : 46
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Naum 4.2 | 3563 ✱ | 8 | Ancre — 50% exact |
| Senpai 2.0 | 3558 | 8 | Mesuré · σ = ±13 |
| Komodo64 3 | 3529 ✱ | 1 — mono | Ancre — 60% |
50% direct vs Naum 4.2 — borne fiable. Écart 18 points inférieur à σ.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Komodo64 3 (1 Thread) mono-thread ★ PROPAGATION BES-FREE 2026
Komodo64 3 ne peut exploiter qu'un seul cœur. Toutes les parties jouées avec Threads=1. Elo strictement mono-thread, non comparable directement aux ratings multi-threads sans tenir compte du différentiel de configuration.
Résultats détaillés du gauntlet
| Rencontre (Komodo64 3 1CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Komodo64 3 1CPU – Glaurung 2.2 JA 8CPU | 3295 ✱ | 12.5 – 3.5 | 16 | 78.13% |
| Komodo64 3 1CPU – Naum 4.2 8CPU | 3563 ✱ | 8.0 – 8.0 | 16 | 50.00% |
| Komodo64 3 1CPU – Rybka 2.4 mp 32-bit 8CPU | 3386 ✱ | 13.0 – 3.0 | 16 | 81.25% |
| Komodo64 3 1CPU – Wasp 2.00 8CPU | 3513 ✱ | 8.0 – 8.0 | 16 | 50.00% |
| Komodo64 3 1CPU – Wasp 3.75 8CPU | 3610 ✱ | 4.5 – 10.5 | 15 | 30.00% |
| Total cumulé | moy. pond. 3301 | 46.0 – 33.0 | 79 | 58.23% |
Elo : 3529 (mono-thread)
Erreur (σ) : ±22
Nombre de parties : 79
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Komodo64 3 | 3529 | 1 — mono-thread | Mesuré · σ = ±10 |
| Naum 4.2 | 3563 ✱ | 8 | Ancre — 50% |
| Wasp 2.00 | 3513 ✱ | 8 | Ancre — 50% |
Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Nouveau gauntlet 1T 2026
Calibration Elo — Gull 1.2 x64 (1 Thread) mono-thread ★ NOUVEAU GAUNTLET 1T 2026
Ce document présente les résultats du gauntlet de calibration de Gull 1.2 x64 — mono-thread, joué contre quatre ancres certifiées BES-free couvrant une fenêtre Elo de 135 points (Shredder 10 UCI 3160 — Glaurung 2.2 JA 3295). Gull est l'œuvre de Vadim Demichev, programmeur russe actif dans la communauté CCRL et TCEC du début des années 2010. La version 1.2, publiée en septembre 2012, constitue la première implémentation stable de Gull en architecture x86-64 pur, prise comme référence de l'école russe avant la transition de Gull 2 vers le SMP intégral. La mesure ici est strictement mono-thread, conforme à la configuration native testée par CCRL 40/15 (Athlon X2 4400+, 2919 Elo).
Gull 1.2 x64 est testé en configuration native sans option Threads activée. Bien que Gull supporte des configurations multi-CPU à partir de la série 2, la version 1.2 est strictement mono-thread dans son binaire de référence. Elo strictement mono-thread, non comparable directement aux ratings multi-threads sans tenir compte du différentiel de configuration. Vadim Demichev publiera plus tard Gull 3 (intégré au tournoi HCE 2026 de ce laboratoire à 3507 Elo, 8 threads), qui constitue l'évolution multi-thread directe de cette base.
Le moteur et son auteur
Vadim Demichev, programmeur russe né en 1980, publie Gull 1.0 en juin 2010. Le moteur s'inscrit dans la lignée des moteurs HCE russes (Strelka, Murka, Belka) sans en être un dérivé direct : Gull a été écrit à partir de zéro, avec une recherche alpha-bêta très propre et une évaluation manuscrite compacte. La version 1.2 (septembre 2012) consolide la base mono-thread et y ajoute le support natif x86-64 — point de bascule entre la série 1 (mono) et la série 2 (qui introduira le SMP). Demichev poursuivra le développement jusqu'à Gull 3 (2014), dernier moteur HCE de la lignée avant son abandon au profit de projets cryptographiques sans rapport avec les échecs.
La signature stylistique de Gull est reconnaissable : recherche peu agressive en pruning, évaluation positionnelle ferme, profil tactique solide mais sans hyperactivité. Gull est traditionnellement considéré comme l'un des moteurs les plus équilibrés de la fenêtre 3000-3300 Elo CCRL de son époque, capable de tenir des positions complexes sans surcalculer ni se faire surprendre.
| Version | Date | Caractéristique |
|---|---|---|
| Gull 1.0 | Juin 2010 | Première version publique de Vadim Demichev |
| Gull 1.1 | 2011 | Première mineure mono-thread |
| Gull 1.2 x64 | Septembre 2012 | Version mono-thread x86-64 — Version calibrée ici |
| Gull 2 | 2013 | Introduction du support SMP — première version multi-thread |
| Gull 3 x64 | 2014 | Dernier moteur HCE de la lignée — 8T (présent ici à 3507 dans le tournoi HCE 2026) |
Résultats détaillés du gauntlet
Le gauntlet a été exécuté sur 80 parties contre quatre ancres certifiées BES-free, équiréparties (20 parties chacune) sur la fenêtre 3160-3295. Toutes les ancres sont issues de gauntlets dédiés du laboratoire 2026 : Glaurung 2.2 JA et Loop M1-T en multi-thread, Fruit 2.3.1 et Shredder 10 UCI en mono-thread. La symétrie 1T-vs-8T des deux côtés est neutralisée par la calibration BES-free préalable de chaque ancre.
| Rencontre (Gull 1.2 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Gull 1.2 1CPU – Glaurung 2.2 JA 8CPU | 3295 | 10.0 – 10.0 | 20 | 50.00% |
| Gull 1.2 1CPU – Loop M1-T 4CPU | 3209 | 12.5 – 7.5 | 20 | 62.50% |
| Gull 1.2 1CPU – Fruit 2.3.1 1CPU | 3173 | 13.0 – 7.0 | 20 | 65.00% |
| Gull 1.2 1CPU – Shredder 10 UCI 1CPU | 3160 | 15.0 – 5.0 | 20 | 75.00% |
| Total cumulé | moy. pond. 3209 | 50.5 – 29.5 | 80 | 63.13% |
Elo : 3302 (1 Thread mono — gauntlet certifié BES-free)
Erreur (σ) : ±22
Nombre de parties : 80
Moy. pond. : (3295×20 + 3209×20 + 3173×20 + 3160×20) / 80 = 3209. Performance = 3209 + 400 × log₁₀(0.6313 / 0.3687) = 3209 + 400 × 0.2336 = 3302. σ = 400 × √(0.6313 × 0.3687 / 80) = ±22.
Lecture des résultats
Le profil de Gull 1.2 contre les quatre ancres dessine une monotonie stricte parfaitement alignée avec l'échelle Elo : 50.00% vs Glaurung (3295) → 62.50% vs Loop (3209) → 65.00% vs Fruit (3173) → 75.00% vs Shredder 10 (3160). Sur la fenêtre Elo de 135 points (Glaurung-Shredder), le score progresse de 25 points de pourcentage, soit une sensibilité de 0.185 % par point Elo. Cette sensibilité supérieure à la moyenne théorique (≈ 0.10 %/Elo près du 50%) est attendue dans la zone moyenne du tableau, où la pente Elo-score est plus raide.
Le résultat de 50.00% vs Glaurung 2.2 JA (3295) est statistiquement remarquable : il indique que Gull 1.2 est nominalement au même niveau que Glaurung sur cet échantillon de 20 parties. La perf individuelle déduite (3295 ±89) est cohérente avec la perf globale 3302, et l'écart de 7 points entre les deux moteurs est nettement inférieur à σ. Sur cette mesure, Gull 1.2 et Glaurung 2.2 JA constituent un duo Elo-équivalent — observation cohérente avec la chronologie historique (Glaurung 2.2 publié en 2008 ; Gull 1.2 publié en 2012, soit quatre ans plus tard, dans une architecture mono-thread modernisée).
Le 75.00% vs Shredder 10 UCI donne perf 3351 individuelle, soit +50 points au-dessus de la perf globale. C'est l'asymétrie la plus marquée du gauntlet, mais elle reste compatible avec la variance d'un échantillon de 20 parties (σ individuel ±88). Gull a possiblement un léger avantage stylistique contre la HCE plus ancienne de Shredder 10 (algorithmes 2005-2006), avantage qui se résorberait sans doute partiellement sur un échantillon plus large.
La convergence du rating sur les sept points de mesure successifs montre une stabilité progressive après une phase initiale instable : 3380 (11p) → 3287 (18p) → 3262 (25p) → 3290 (36p) → 3314 (48p) → 3302 (61p) → 3302 (80p figé). Les cinq dernières mesures tiennent dans une plage de 52 points (3262 à 3314), inférieure au σ d'échantillonnage moyen sur la période. La variance σ se contracte de manière monotone : ±54 (11p) → ±46 (18p) → ±39 (25p) → ±33 (36p) → ±28 (48p) → ±25 (61p) → ±22 (80p), suivant la racine carrée de N. La phase initiale (11-18 parties) a été instable en raison de l'échantillon trop petit vs Glaurung (3/3 puis 5/5 parties) ; à partir de 25 parties la perf se stabilise dans la zone 3262-3314, et la mesure finale s'est posée sur 3302.
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Senpai 2.0 | 3329 | 8 | Référence supérieure de la zone (rang 22) |
| Naum 4.2 | 3315 | 8 | Référence supérieure (rang 23, à propager) |
| Gull 1.2 x64 | 3302 ★ | 1 — mono-thread | Mesuré · σ = ±22 · nouveau gauntlet 1T 2026 · rang 24 |
| Glaurung 2.2 JA | 3295 ★ | 8 | Ancre supérieure — 50.00% |
| Wasp 2.00 | 3283 | 8 | Référence inférieure directe (rang 26, à propager) |
| Loop M1-T | 3209 ★ | 4 | Ancre — 62.50% |
| Fruit 2.3.1 | 3173 ★ | 1 | Ancre — 65.00% |
| Shredder 10 UCI | 3160 ★ | 1 | Ancre inférieure — 75.00% |
Gull 1.2 x64 (3302, mono-thread) prend le rang 24 de l'échelle interne, intercalé entre Naum 4.2 (3315, 8T, à propager) et Glaurung 2.2 JA (3295, 8T). L'écart de 13 points avec Naum et de 7 points avec Glaurung est inférieur à σ — Gull 1.2 mono-thread tient statistiquement sa place dans la zone haute des moteurs HCE de 2010-2012. Le différentiel hardware par rapport à la mesure CCRL 40/15 Athlon X2 4400+ (2919 Elo) est de +383 points, parfaitement aligné avec Fruit 2.3.1 (+393) et Wasp 2.01 (+337). Gull 1.2 devient le deuxième moteur mono-thread le mieux classé de l'échelle après le futur recalibrage de Komodo64 3 (rang 26 actuel, en attente de propagation), confirmant la robustesse remarquable de l'école russe HCE en architecture mono.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Nouveau gauntlet 4T 2026
Calibration Elo — Loop M1-T (4 Threads) ★ NOUVEAU GAUNTLET 4T 2026
Ce document présente les résultats du gauntlet de calibration de Loop M1-T — 4 threads, joué contre quatre moteurs d'ancrage couvrant une fenêtre Elo de 271 points (ProDeo 2.0 à 3024 — Glaurung 2.2 JA à 3295). Loop est l'œuvre de Fritz Reul, programmeur allemand actif dans la communauté CCC au milieu des années 2000, également auteur de List (présent dans ce laboratoire à 2965, mono-thread). Loop est dérivé du code source de Fruit 2.1 publié sous GPL par Fabien Letouzey en juin 2005 ; la version M1-T constitue la variante multi-thread officielle de la série Loop M1, publiée en juillet 2007.
Loop M1-T est mesuré ici en mode Threads=4, conforme au profil de référence CCRL 40/4 4CPU (Athlon X2 4400+, 2881 Elo). Le choix d'une configuration 4T plutôt que 8T est délibéré : Loop M1-T n'a jamais été optimisé pour les architectures à grand nombre de threads, et la mesure 4T garantit un différentiel hardware lisible vis-à-vis de la référence CCRL d'époque. Cette mesure est la première du laboratoire calibrée en mode 4 threads, et constitue un point d'ancrage utile pour les futures intégrations de moteurs 4T historiques.
Le moteur et son auteur
Fritz Reul, programmeur amateur allemand né en 1978, publie List en 2003 — moteur mono-thread propre qui se classe régulièrement dans le top 40 CCRL. En 2006, Reul reprend l'architecture de Fruit 2.1 et la dérive en deux directions : Loop 2006 (version expérimentale), puis Loop M1 et Loop M1-T (juillet 2007). La version M1 est mono-thread, M1-T introduit le support SMP jusqu'à 4 cœurs. Loop a été remarqué pour la propreté de sa recherche alpha-bêta et la qualité de son évaluation HCE compacte — héritage direct du code Letouzey, conservant la lisibilité exemplaire de la base d'origine.
La lignée Reul, considérée globalement, présente une cohérence stylistique forte. List et Loop partagent la même école : code compact, évaluation manuscrite, recherche peu agressive en pruning, profil tactique conservateur. Le passage de List (mono) à Loop M1-T (4 threads) marque l'unique tentative de Reul vers le SMP. Reul a ensuite quitté la scène CCRL après 2008, sans poursuivre Loop au-delà.
| Version | Date | Caractéristique |
|---|---|---|
| Fruit 2.1 | Juin 2005 | Base GPL de Letouzey — source du fork Loop |
| List 5.12 | 2003–2006 | Premier moteur de Reul, mono-thread (présent ici à 2965) |
| Loop 2006 | Septembre 2006 | Fork expérimental de Fruit 2.1 par Reul |
| Loop M1-T | Juillet 2007 | Version SMP 4 threads — Version calibrée ici |
| Loop M1 mono | Juillet 2007 | Version mono-thread parallèle |
Résultats détaillés du gauntlet
Le gauntlet a été exécuté sur 68 parties contre quatre ancres certifiées BES-free : Glaurung 2.2 JA (8T) en zone haute, Fruit 2.3.1 (1T) et Shredder 10 UCI (1T) en zone médiane, ProDeo 2.0 (1T) en zone inférieure. Les quatre ancres sont équirépondérées (17 parties chacune sauf ProDeo à 17 également), ce qui produit une moyenne pondérée parfaitement centrée sur la médiane Elo des ancres.
| Rencontre (Loop M1-T 4CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Loop M1-T 4CPU – Glaurung 2.2 JA 8CPU | 3295 | 7.5 – 9.5 | 17 | 44.12% |
| Loop M1-T 4CPU – Fruit 2.3.1 1CPU | 3173 | 9.0 – 8.0 | 17 | 52.94% |
| Loop M1-T 4CPU – Shredder 10 UCI 1CPU | 3160 | 10.0 – 7.0 | 17 | 58.82% |
| Loop M1-T 4CPU – ProDeo 2.0 1CPU | 3024 | 12.0 – 5.0 | 17 | 70.59% |
| Total cumulé | moy. pond. 3163 | 38.5 – 29.5 | 68 | 56.62% |
Elo : 3209 (4 Threads — gauntlet certifié BES-free)
Erreur (σ) : ±24
Nombre de parties : 68
Moy. pond. : (3295×17 + 3173×17 + 3160×17 + 3024×17) / 68 = 3163. Performance = 3163 + 400 × log₁₀(0.5662 / 0.4338) = 3163 + 400 × 0.1156 = 3209. σ = 400 × √(0.5662 × 0.4338 / 68) = ±24.
Lecture des résultats
Le profil de Loop M1-T contre les quatre ancres dessine une monotonie inversée : le score augmente strictement à mesure que l'Elo de l'ancre diminue (44.12% → 52.94% → 58.82% → 70.59% pour des ancres à 3295 → 3173 → 3160 → 3024). Cette progression est attendue dans son principe mais la pente effective est instructive : sur la fenêtre Elo de 271 points (Glaurung à ProDeo), le score progresse de 26.47 points de pourcentage, soit une sensibilité de 0.098 % par point Elo — exactement la pente théorique d'un moteur correctement ancré dans l'échelle (≈ 0.10 %/Elo près du 50%).
Les perfs individuelles déduites de chaque rencontre donnent un spread modeste : 3176 (contre ProDeo) à 3254 (contre Glaurung), soit 78 points d'écart entre extrêmes. Ce spread est inférieur au double σ global (±48), ce qui confirme l'absence d'asymétrie stylistique exploitable. Loop M1-T se comporte de manière homogène contre toute la fenêtre des ancres, ce qui légitime la moyenne pondérée comme estimateur principal.
Le résultat contre Glaurung 2.2 JA (3295) mérite mention. Loop perd 7.5-9.5 sur 17 parties (44.12%), donnant une perf de 3254 contre cette ancre seule. C'est cohérent avec sa position finale à 3209 (Loop est attendu en dessous de Glaurung de 86 points), mais sur 17 parties la performance par ancre incorpore une variance d'environ ±48 points. La mesure agrégée sur 68 parties bénéficie d'une variance bien moindre (±24) en mutualisant les quatre échantillons. Aucune des quatre rencontres individuelles n'est statistiquement contradictoire avec le rating final.
La convergence du rating sur les sept points de mesure successifs montre une stabilité remarquable après les 30 premières parties : 3219 (15p) → 3169 (22p) → 3194 (27p) → 3182 (36p) → 3200 (41p) → 3216 (55p) → 3209 (68p). Les six dernières mesures tiennent dans une plage de 47 points (3169 à 3216), inférieure au σ d'échantillonnage des étapes intermédiaires. La variance σ se contracte de manière monotone : ±51 (15p) → ±43 (22p) → ±38 (27p) → ±33 (36p) → ±31 (41p) → ±27 (55p) → ±24 (68p), suivant la racine carrée de N comme attendu. Le rating à 68 parties est arrêté à ce stade par décision méthodologique : la convergence est acquise et les 12 parties restantes apporteraient une réduction de σ marginale (±22 estimé à 80p).
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Wasp 2.00 | 3283 | 8 | Référence supérieure de la zone (rang 25) |
| Komodo64 3 | 3267 | 1 | Mono-thread supérieur (rang 26) |
| Rybka 2.4MP | 3386 ✱ | 8 | Référence supérieure directe (rang 27) |
| Loop M1-T | 3209 ★ | 4 | Mesuré · σ = ±24 · nouveau gauntlet 4T 2026 · rang 28 |
| Fruit 2.3.1 | 3173 ★ | 1 | Référence inférieure (rang 29) — Ancre — 52.94% |
| Shredder 10 UCI | 3160 ★ | 1 | Ancre — 58.82% |
| Glaurung 2.2 JA | 3295 ★ | 8 | Ancre supérieure — 44.12% |
| ProDeo 2.0 | 3024 | 1 | Ancre inférieure — 70.59% |
Loop M1-T (3209, 4T) prend le rang 28 de l'échelle interne, intercalé entre Rybka 2.4MP (3234, 8T) et Fruit 2.3.1 (3173, 1T). La position est cohérente avec la mesure CCRL d'époque (40/4 sur Athlon X2 4400+, 2881 Elo) : le différentiel hardware de +328 points entre la mesure historique et la mesure laboratoire Ryzen 7950X3D est aligné sur Wasp 2.01 (+337) et représente un gain hardware net de l'ordre de 8% par décennie pondéré par l'effet V-Cache 3D sur les workloads chess engine. Loop M1-T est le premier moteur 4 threads du laboratoire, et constitue à ce titre un point d'ancrage méthodologique pour les futures intégrations de moteurs SMP partiels (Hiarcs 11, Spike 1.4, Toga II 1.4 beta) dont les configurations natives plafonnent à 4 cœurs.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Nouveau gauntlet 1T 2026
Calibration Elo — Fruit 2.3.1 (1 Thread) mono-thread ★ NOUVEAU GAUNTLET 1T 2026
Ce document présente les résultats du gauntlet de calibration de Fruit 2.3.1 — mono-thread, joué contre quatre moteurs d'ancrage de la zone supérieure médiane (3024–3087 Elo) sur deux tournois agrégés. Fruit est l'œuvre de Fabien Letouzey, programmeur français dont la publication de Fruit en code source ouvert a façonné toute la génération des moteurs forts du milieu des années 2000 — Glaurung, Toga II, puis Stockfish. La version 2.3.1, dernière mineure de la série, ne dispose d'aucune extension SMP par construction : la mesure est strictement mono-thread.
Fruit 2.3.1 est mono-thread par conception du code source : aucune extension multi-CPU n'a jamais été développée par Letouzey ou ses dérivés directs. Toutes les parties jouées en configuration native sans option Threads. Elo strictement mono-thread, non comparable directement aux ratings multi-threads sans tenir compte du différentiel de configuration.
Le moteur et son auteur
Fabien Letouzey, programmeur français actif dans la communauté CCRL/CEGT au début des années 2000, publie Fruit 1.0 en mai 2004. Le moteur est immédiatement remarqué : code source d'une lisibilité exemplaire, recherche alpha-bêta très propre, évaluation HCE compacte mais profondément justifiée. Fruit 2.1, libéré en juin 2005, termine deuxième du WCCC 2005 de Reykjavik derrière Zappa, alors que la majorité des concurrents tournent sur du matériel multi-processeurs. Fruit est mono-thread, le restera.
Fruit 2.2 (mars 2006) est la dernière version sous licence GPL — point de bascule historique. Letouzey décide ensuite de fermer le code et de poursuivre Fruit en version commerciale (Fruit Reloaded, intégré à ChessBase), tandis que la lignée libre se développe à partir du code 2.2 : Toga II (Thomas Gaksch), puis Glaurung (Tord Romstad), enfin Stockfish — successeur direct de Glaurung et héritier méthodologique direct de Fruit. Fruit 2.3 et 2.3.1 (septembre 2007) constituent la dernière mise à jour publique de Letouzey lui-même, mineure mais consolidée — bug fixes, légères révisions d'évaluation, base technique réutilisée par Toga II 1.4.
| Version | Date | Événement |
|---|---|---|
| Fruit 1.0 | Mai 2004 | Première version publique de Fabien Letouzey |
| Fruit 2.1 | Juin 2005 | WCCC Reykjavik — 2e place derrière Zappa |
| Fruit 2.2 | Mars 2006 | Dernière version GPL — point de départ de la lignée libre |
| Toga II 1.x | 2006–2008 | Dérivé direct (Thomas Gaksch) — premier moteur SMP de la lignée |
| Fruit 2.3.1 | 2007 | Dernière version mineure publique — Version calibrée ici |
| Glaurung 2.2 | 2008 | Tord Romstad — successeur méthodologique direct (3163 Elo dans ce laboratoire) |
| Stockfish 1.0 | 2008 | Successeur direct de Glaurung — lignée Fruit prolongée |
Résultats détaillés du gauntlet
Le gauntlet agrège deux tournois indépendants exécutés en parallèle. Le tournoi principal (60 parties contre Shredder 10 UCI, Deep Sjeng 1.6, ProDeo 2.0) constitue le cœur de la mesure. Le second tournoi (20 parties contre Shredder 10 UCI, ProDeo 2.0, Deep Junior 7) ajoute Deep Junior 7 comme quatrième ancre et densifie la zone basse. L'agrégation par ancre (somme des scores, somme des parties) produit la mesure finale sur 80 parties.
| Rencontre (Fruit 2.3.1 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Fruit 2.3.1 1CPU – Shredder 10 UCI 1CPU | 3087 | 17.0 – 10.0 | 27 | 62.96% |
| Fruit 2.3.1 1CPU – Deep Sjeng 1.6 8CPU | 3066 ↑révisé | 14.5 – 5.5 | 20 | 72.50% |
| Fruit 2.3.1 1CPU – ProDeo 2.0 1CPU | 3024 ↑révisé | 17.0 – 10.0 | 27 | 62.96% |
| Fruit 2.3.1 1CPU – Deep Junior 7 8CPU | 3031 ↑révisé | 4.5 – 1.5 | 6 | 75.00% |
| Total cumulé | moy. pond. 3056 | 53.0 – 27.0 | 80 | 66.25% |
Elo : 3173 (1 Thread mono — gauntlet certifié sur ancres révisées · agrégation T1+T2)
Erreur (σ) : ±21
Nombre de parties : 80
Moy. pond. : (3087×27 + 3066×20 + 3024×27 + 3031×6) / 80 = 3056.3. Performance = 3056.3 + 400 × log₁₀(0.6625 / 0.3375) = 3056.3 + 400 × 0.2929 = 3173. σ = 400 × √(0.6625 × 0.3375 / 80) = ±21.
Lecture des résultats
Le résultat le plus structurant est la symétrie parfaite entre Shredder 10 UCI et ProDeo 2.0 : score identique de 17.0/27 = 62.96% contre chacune des deux ancres, sur le même nombre de parties. Cette coïncidence n'est pas un artefact : les perfs individuelles qui en découlent (3179 contre Shredder 10 à 3087, 3116 contre ProDeo à 3024) sont séparées de 63 points, soit exactement l'écart Elo entre les deux ancres. Fruit 2.3.1 distribue ses points de manière homogène en fonction du niveau adverse — c'est la signature d'une mesure stable, sans biais stylistique.
Le 72.50% contre Deep Sjeng 1.6 (8CPU) reste l'asymétrie résiduelle la plus marquée du gauntlet — perf individuelle de 3234 contre une ancre à 3066, soit +168 points. La trajectoire de cette perf au cours du gauntlet (3346 à 8 parties → 3273 à 15 parties → 3234 à 20 parties) montre une convergence claire : l'effet de saturation initial s'est résorbé. Fruit a réellement un avantage stylistique mesurable contre Deep Sjeng 1.6 (recherche moderne contre HCE plus ancienne), mais l'écart final reste compatible avec la variance d'un échantillon de 20 parties.
Le 75.00% contre Deep Junior 7 (6 parties) donne perf 3222, statistiquement cohérent avec l'ensemble. Le spread interne final (3116 ↔ 3234, soit 118 points) est nettement inférieur au spread observé en cours de gauntlet (283 points à 28 parties), signe d'une convergence solide.
L'agrégation T1+T2 procède par sommation directe des scores et des parties pour chaque ancre commune, le tournoi 1 ajoutant Deep Junior 7 comme quatrième ancre absente du tournoi principal. La variance se contracte régulièrement : ±36 (28 parties) → ±30 (41 parties) → ±27 (49 parties) → ±23 (70 parties) → ±21 (80 parties). La stabilité du rating sur les 30 dernières parties (3169 → 3174 → 3170 → 3173, soit ±4 points autour de 3172) confirme la convergence. Les trois calculs partiels — gauntlet T2 seul (3173 ±24), tournoi T1 seul (3175 ±42), agrégation (3173 ±21) — sont indistinguables, signature d'une mesure parfaitement homogène.
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Rybka 2.4MP | 3386 ✱ | 8 | Référence supérieure (rang 26) |
| Fruit 2.3.1 | 3173 ★ | 1 — mono-thread | Mesuré · σ = ±21 · nouveau gauntlet 1T 2026 · rang 27 |
| Glaurung 2.2 x64 | 3295 ✱ | 8 | Successeur méthodologique direct (Romstad) |
| Shredder 10 UCI | 3160 | 1 | Ancre — 62.96% |
| Deep Sjeng 1.6 | 3066 ↑révisé | 8 | Ancre — 72.50% |
| Shredder 6 | 3059 ★ | 8 | Référence inférieure série Shredder |
| Deep Junior 7 | 3031 ↑révisé | 8 | Ancre — 75.00% |
| ProDeo 2.0 | 3024 ↑révisé | 1 | Ancre inférieure — 62.96% |
Fruit 2.3.1 (3173, mono-thread) prend le rang 27 de l'échelle interne, intercalé entre Rybka 2.4MP (3234, 8T) et Glaurung 2.2 x64 (3163, 8T). L'écart de 10 points avec Glaurung 2.2 — successeur méthodologique direct (Tord Romstad, 2008) — est inférieur à σ et historiquement structurant : un moteur mono-thread de 2007 reste compétitif sur hardware moderne contre la première version SMP de sa propre lignée. La lignée Fruit → Glaurung → Stockfish s'est précisément constituée en absorbant les idées de Fruit et en y ajoutant le SMP ; ce gauntlet en mesure le solde net. Fruit 2.3.1 devient le moteur mono-thread le mieux classé de l'échelle (devant Komodo64 3 à 3267 dont la calibration mono est plus ancienne et à revérifier).
Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026
Calibration Elo — Deep Sjeng 1.6 (8 Threads) ↑révisé
Deep Sjeng 1.6 — 8 threads. Moteur commercial de Gian-Carlo Pascutto (également auteur de Leela Chess Zero). Version classique à évaluation manuscrite (HCE).
Résultats détaillés du gauntlet
| Rencontre (Deep Sjeng 1.6 8CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Deep Sjeng 1.6 8CPU – Deep Junior 7 8CPU | 3031 ↑révisé | 4.0 – 5.0 | 9 | 44.44% |
| Deep Sjeng 1.6 8CPU – Fritz 6 1CPU | 2905 ↑révisé | 6.0 – 3.0 | 9 | 66.67% |
| Deep Sjeng 1.6 8CPU – List 5.12 1CPU | 2965 ↑révisé | 5.5 – 3.5 | 9 | 61.11% |
| Deep Sjeng 1.6 8CPU – Nimzo 8 1CPU | 2900 ↑révisé | 7.0 – 1.0 | 8 | 87.50% |
| Deep Sjeng 1.6 8CPU – Hiarcs 7.32 8CPU | 2891 ↑révisé | 7.0 – 0.0 | 7 | 100.00% |
| Deep Sjeng 1.6 8CPU – Junior 7 8CPU | 2980 ↑révisé | 4.0 – 5.0 | 9 | 44.44% |
| Deep Sjeng 1.6 8CPU – Fritz 5.32 1CPU | 2866 ↑révisé | 8.5 – 1.5 | 10 | 85.00% |
| Deep Sjeng 1.6 8CPU – Yace Paderbron 1CPU | 2859 ↑révisé | 6.5 – 2.5 | 9 | 72.22% |
| Total cumulé | moy. pond. 2925 ↑révisé | 48.5 – 21.5 | 70 | 69.29% |
Elo : 3066 (recalibré cascade 2026)
Erreur (σ) : ±10
Nombre de parties : 70
Moy. pond. révisée : (2859×9 + 2866×10 + 2891×7 + 2980×9 + 2900×8 + 2965×9 + 2905×9 + 3031×9) / 70 = 2925. Performance = 2925 + 400 × log₁₀(0.6929 / 0.3071) = 3066. σ = ±10.
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Shredder 10 UCI | 3160 | 1 | Référence supérieure (recalibré) |
| Deep Sjeng 1.6 | 3066 ↑révisé | 8 | Mesuré · σ = ±10 · cascade 2026 |
| Shredder 6 | 3059 ★ | 8 | Nouveau gauntlet 8T 2026 |
| Deep Junior 7 | 3031 ↑révisé | 8 | Ancre — 44.44% |
Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Nouveau gauntlet 8T 2026
Calibration Elo — Shredder 6 (8 Threads) ★ NOUVEAU GAUNTLET 8T 2026
Ce document présente les résultats du gauntlet de calibration de Shredder 6 — 8 threads, joué contre quatre moteurs d'ancrage de la zone médiane haute (2989–3031 Elo). Shredder 6 est la version commerciale de Stefan Meyer-Kahlen, lauréate du WMCCC 2002 de Maastricht, dernière grande version monolithique de la série classique avant l'ère SMP des versions 7+. Gauntlet certifié, sans propagation BES — ancres révisées 2026.
Le moteur et son auteur
Stefan Meyer-Kahlen, programmeur allemand né en 1968, lance Shredder à la fin des années 1980. Le programme remporte son premier titre mondial au WMCCC 1996 de Jakarta, puis enchaîne une série de victoires sans équivalent : champion du monde des microordinateurs en 1996, 1998 et 2000, champion du monde toutes catégories au WCCC 1999 de Paderborn. En 2000, il co-invente avec Rudolf Huber (auteur de SOS) le protocole UCI, qui deviendra le standard de communication interface/moteur.
Shredder 6, publié en 2002, remporte le WMCCC 2002 de Maastricht, devançant Junior, Fritz et Chess Tiger. La SSDF de l'époque le créditera de ~2710 Elo sur Athlon 1200. C'est la dernière version monolithique avant l'ère SMP : Shredder 7+ intègre le multi-CPU, Shredder 10 UCI atteint 3160 dans ce laboratoire, et Deep Shredder 13 culmine à 3576.
| Version | Date | Événement |
|---|---|---|
| Shredder 3 | 1996 | WMCCC Jakarta — 1er titre mondial |
| Shredder 4 | 1998 | WMCCC Paderborn — 2e titre mondial |
| Shredder 5 | 2000 | WMCCC London — 3e titre · Co-publication UCI |
| Shredder 6 | 2002 | WMCCC Maastricht — 4e titre · Version calibrée ici |
| Shredder 10 UCI | 2006 | 3160 Elo (1T) — gauntlet certifié 2026 |
| Deep Shredder 13 | 2017 | Dernière version commerciale — 3576 Elo (8T) |
Résultats détaillés du gauntlet
| Rencontre (Shredder 6 8CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Shredder 6 8CPU – Deep Junior 7 8CPU | 3031 ↑révisé | 5.0 – 10.0 | 15 | 33.33% |
| Shredder 6 8CPU – Junior 8 1CPU | 3006 ↑révisé | 9.5 – 5.5 | 15 | 63.33% |
| Shredder 6 8CPU – ProDeo 2.0 1CPU | 3024 ↑révisé | 10.0 – 5.0 | 15 | 66.67% |
| Shredder 6 8CPU – Ruffian 2.1.0 1CPU | 2989 ↑révisé | 9.5 – 5.5 | 15 | 63.33% |
| Total cumulé | moy. pond. 3012 | 34.0 – 26.0 | 60 | 56.67% |
Elo : 3059 (8 Threads — gauntlet certifié sur ancres révisées · sans propagation BES)
Erreur (σ) : ±26
Nombre de parties : 60
Moy. pond. : (3031 + 3006 + 3024 + 2989) × 15 / 60 = 3012.5. Performance = 3012.5 + 400 × log₁₀(0.5667 / 0.4333) = 3012.5 + 400 × 0.1165 = 3059. σ = 400 × √(0.5667 × 0.4333 / 60) = ±26.
Lecture des résultats
Le résultat le plus structurant est le 33.33% contre Deep Junior 7 (3031) sur 15 parties — perf individuelle de 2911. C'est la seule confrontation 8T-vs-8T du gauntlet et la borne supérieure la plus serrée pour Shredder 6. Les trois autres ancres — Junior 8 (63.33%), ProDeo 2.0 (66.67%), Ruffian 2.1.0 (63.33%) — produisent des perfs individuelles de 3101, 3144 et 3084 respectivement. Cette zone serrée (60 points entre les trois ancres mono-thread) est cohérente : Shredder 6 (8T) tire avantage hardware contre des moteurs 1T calibrés entre 2989 et 3024.
Le score global de 56.67% absorbe les deux régimes — 8T-vs-8T contre Deep Junior 7, 8T-vs-1T contre les trois autres — et produit une mesure équilibrée qui place Shredder 6 entre Deep Sjeng 1.6 (3066) et Deep Junior 7 (3031). C'est exactement la position prédite par l'histoire de la série Shredder : Shredder 6 (2002) est la dernière version monolithique avant l'ère SMP, et Shredder 10 UCI (2006) lui est supérieur de 101 points — différentiel conforme à la progression attendue entre ces deux versions.
Les quatre ancres ont toutes été révisées dans la cascade 2026 : Deep Junior 7 (2996 → 3031), Junior 8 (2992 → 3006), ProDeo 2.0 (2999 → 3024), Ruffian 2.1.0 (2966 → 2989). Le rating de 3059 correspond donc à la calibration finale sur ancres révisées, et non à une propagation de cascade. Sur les anciennes ancres, le résultat aurait été de ~3030 — soit un déplacement de +29 points, du même ordre que les autres corrections de la zone.
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Shredder 10 UCI | 3160 | 1 | Référence supérieure série Shredder |
| Deep Sjeng 1.6 | 3066 ↑révisé | 8 | Référence supérieure immédiate |
| Shredder 6 | 3059 ★ | 8 | Mesuré · σ = ±26 · nouveau gauntlet 8T 2026 |
| Deep Junior 7 | 3031 ↑révisé | 8 | Ancre directe — 33.33% |
| ProDeo 2.0 | 3024 ↑révisé | 1 | Ancre — 66.67% |
| Junior 8 | 3006 ↑révisé | 1 | Ancre — 63.33% |
| Ruffian 2.1.0 | 2989 ↑révisé | 1 | Ancre inférieure — 63.33% |
Shredder 6 (3059) prend le rang 30 de l'échelle interne, intercalé entre Deep Sjeng 1.6 (3066) et Deep Junior 7 (3031). L'écart de 7 points avec Deep Sjeng 1.6 reste inférieur à 2σ — les trois moteurs forment un palier serré cohérent avec leur contemporanéité historique. L'écart de 101 points avec Shredder 10 UCI mesure le saut entre la dernière version monolithique de la première époque et la première version SMP mature.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026
Calibration Elo — ProDeo 2.0 (1 Thread) mono-thread ↑révisé
ProDeo 2.0 — mono-thread. Moteur libre HCE de Ed Schröder, fondateur de la série Rebel, publié en 2015.
ProDeo 2.0 est mono-thread par conception. Elo strictement mono-thread, non directement comparable aux ratings multi-threads.
Résultats détaillés du gauntlet
| Rencontre (ProDeo 2.0 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| ProDeo 2.0 1CPU – Shredder 10 UCI 1CPU | 3087 | 6.0 – 8.0 | 14 | 42.86% |
| ProDeo 2.0 1CPU – Deep Junior 7 8CPU | 3031 ↑révisé | 6.5 – 7.5 | 14 | 46.43% |
| ProDeo 2.0 1CPU – Fritz 6 1CPU | 2905 ↑révisé | 8.0 – 5.0 | 13 | 61.54% |
| ProDeo 2.0 1CPU – List 5.12 1CPU | 2965 ↑révisé | 7.5 – 5.5 | 13 | 57.69% |
| ProDeo 2.0 1CPU – SOS 5 for Arena 1CPU | 2922 ↑révisé | 7.5 – 5.5 | 13 | 57.69% |
| Total cumulé | moy. pond. 2984 ↑révisé | 35.5 – 31.5 | 67 | 52.99% |
Elo : 3005 (mono-thread · recalibré cascade 2026)
Erreur (σ) : ±11
Nombre de parties : 67
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Deep Junior 7 | 3031 ↑révisé | 8 | Ancre — 46.43% |
| ProDeo 2.0 | 3005 ↑révisé | 1 — mono-thread | Mesuré · σ = ±11 |
| Fritz 6 | 2905 ↑révisé | 1 | Ancre — 61.54% |
Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026
Calibration Elo — Junior 8 (1 Thread) mono-thread ↑révisé
Junior 8 — mono-thread. Version commerciale de la série de Amir Ban et Shay Bushinsky, distribuée par ChessBase. Recalibrée dans la cascade 2026 (correction partielle, +7 points : SOS 5 et Gambit Tiger restant en attente de recalibration BES).
Junior 8 testé en mono-thread (Threads=1). Elo strictement mono-thread.
Résultats détaillés du gauntlet — Scores Inchangés, Ancres Révisées
| Opposition | Ancre Elo | Score | N | % |
|---|---|---|---|---|
| Fritz 5.32 (1CPU) | 2866 ↑révisé | 5.5 – 3.5 | 9 | 61.11% |
| Hiarcs 7.32 (1CPU) | 2891 ↑révisé | 6.0 – 3.0 | 9 | 66.67% |
| Nimzo 8 (1CPU) | 2900 ↑révisé | 6.0 – 3.0 | 9 | 66.67% |
| SOS 5 for Arena (1CPU) | 2917 | 4.5 – 4.5 | 9 | 50.00% |
| List 5.12 (1CPU) | 2965 ↑révisé | 7.0 – 1.0 | 8 | 87.50% |
| Fritz 6 (1CPU) | 2905 ↑révisé | 4.0 – 5.0 | 9 | 44.44% |
| Gambit Tiger (1CPU) | 2957 | 5.5 – 3.5 | 9 | 61.11% |
| Total cumulé | moy. pond. 2914 ↑révisé | 38.5 – 23.5 | 62 | 62.10% |
Elo : 2999 (mono-thread · recalibré cascade 2026 partielle)
Erreur (σ) : ±11
Nombre de parties : 62
Junior 8 utilise 7 ancres dont 5 sont révisées. Les deux ancres restantes — SOS 5 for Arena (2917) et Gambit Tiger 2.0 (2957) — dépendent de Deep Junior 7 et Shredder 10, non encore recalibrés. Le rating de 2999 est provisoire et sera affiné lors de la prochaine vague.
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| ProDeo 2.0 | 3005 ↑révisé | 1 | Référence supérieure |
| Junior 8 | 2999 ↑révisé | 1 — mono-thread | Mesuré · σ = ±11 · recalibré 2026 |
| Deep Junior 7 | 2996 | 8 | Référence inférieure proche |
Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026
Calibration Elo — Ruffian 2.1.0 (1 Thread) mono-thread ↑révisé
Ruffian 2.1.0 — mono-thread. Moteur de Per-Ola Valfridsson (Suède), commercialisé par Lokasoft (2004). Lauréat DOCCC 2003, ICT 2004 (3e). Nommé d'après une jument de course américaine des années 1970. Recalcul cascade 2026.
Ruffian 2.1.0 testé en mono-thread. Elo strictement mono-thread.
Résultats détaillés du gauntlet
| Rencontre (Ruffian 2.1.0 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Ruffian 2.1.0 1CPU – Shredder 10 UCI 1CPU | 3087 | 4.5 – 10.5 | 15 | 30.00% |
| Ruffian 2.1.0 1CPU – ProDeo 2.0 1CPU | 3005 ↑révisé | 5.0 – 10.0 | 15 | 33.33% |
| Ruffian 2.1.0 1CPU – Deep Junior 7 8CPU | 3031 ↑révisé | 5.5 – 9.5 | 15 | 36.67% |
| Ruffian 2.1.0 1CPU – Gambit Tiger 2.0 1CPU | 2963 ↑révisé | 8.5 – 6.5 | 15 | 56.67% |
| Ruffian 2.1.0 1CPU – Fritz 6 1CPU | 2905 ↑révisé | 9.0 – 6.0 | 15 | 60.00% |
| Ruffian 2.1.0 1CPU – Gandalf 6.01 1CPU | 2953 ↑révisé | 9.5 – 5.5 | 15 | 63.33% |
| Total cumulé | moy. pond. 2991 | 42.0 – 48.0 | 90 | 46.67% |
Elo : 2989 (mono-thread · recalibré cascade 2026 · +23)
Erreur (σ) : ±9
Nombre de parties : 90
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Deep Junior 7 | 3031 ↑révisé | 8 | Ancre supérieure — 36.67% |
| Ruffian 2.1.0 | 2989 ↑révisé | 1 — mono-thread | Mesuré · σ = ±9 · recalibré 2026 |
| Gambit Tiger 2.0 | 2963 ↑révisé | 1 | Ancre — 56.67% |
| Fritz 6 | 2905 ↑révisé | 1 | Ancre — 60.00% |
| Gandalf 6.01 | 2953 ↑révisé | 1 | Ancre — 63.33% |
Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026
Calibration Elo — Gambit Tiger 2.0 (1 Thread) mono-thread ↑révisé
Gambit Tiger 2.0 — mono-thread. Variante à jeu ultra-agressif de Chess Tiger, développée par Christophe Théron (France/Guadeloupe). 2e mondial SSDF en octobre 2001 (2720 Elo Athlon 1200). Dernière version autonome avant intégration comme réglage dans Chess Tiger 15+. Recalcul cascade 2026.
Gambit Tiger 2.0 est mono-thread par conception.
Résultats détaillés du gauntlet
| Rencontre (Gambit Tiger 2.0 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Gambit Tiger 2.0 1CPU – Shredder 10 UCI 1CPU | 3087 | 3.5 – 6.5 | 10 | 35.00% |
| Gambit Tiger 2.0 1CPU – ProDeo 2.0 1CPU | 3005 ↑révisé | 4.5 – 5.5 | 10 | 45.00% |
| Gambit Tiger 2.0 1CPU – Deep Junior 7 8CPU | 3031 ↑révisé | 4.0 – 6.0 | 10 | 40.00% |
| Gambit Tiger 2.0 1CPU – Fritz 6 1CPU | 2905 ↑révisé | 5.0 – 5.0 | 10 | 50.00% |
| Gambit Tiger 2.0 1CPU – List 5.12 1CPU | 2965 ↑révisé | 5.0 – 5.0 | 10 | 50.00% |
| Gambit Tiger 2.0 1CPU – SOS 5 for Arena 1CPU | 2922 ↑révisé | 6.0 – 4.0 | 10 | 60.00% |
| Total cumulé | moy. pond. 2986 ↑révisé | 28.0 – 32.0 | 60 | 46.67% |
Elo : 2963 (mono-thread · recalibré cascade 2026)
Erreur (σ) : ±11
Nombre de parties : 60
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Ruffian 2.1.0 | 2989 ↑révisé | 1 | Référence supérieure |
| Gambit Tiger 2.0 | 2963 ↑révisé | 1 — mono-thread | Mesuré · σ = ±11 |
| Fritz 6 | 2905 ↑révisé | 1 | Ancre — 50.00% |
Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026
Calibration Elo — Gandalf 6.01 (1 Thread) mono-thread ↑révisé
Gandalf 6.01 — mono-thread. Moteur de Steen Suurballe (Danemark), avec collaboration de Dan Wulff Kristensen (livres d'ouvertures). Refonte positionnelle avec le GMI de correspondance Christian Kongsted. Commercialisé par Lokasoft (2004). Recalcul cascade 2026.
Gandalf 6.01 mono-thread par conception.
Résultats détaillés du gauntlet
| Rencontre (Gandalf 6.01 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Gandalf 6.01 1CPU – Shredder 10 UCI 1CPU | 3087 | 4.0 – 6.0 | 10 | 40.00% |
| Gandalf 6.01 1CPU – ProDeo 2.0 1CPU | 3005 ↑révisé | 4.5 – 5.5 | 10 | 45.00% |
| Gandalf 6.01 1CPU – Deep Junior 7 8CPU | 3031 ↑révisé | 5.0 – 5.0 | 10 | 50.00% |
| Gandalf 6.01 1CPU – Gambit Tiger 2.0 1CPU | 2963 ↑révisé | 4.0 – 6.0 | 10 | 40.00% |
| Gandalf 6.01 1CPU – Fritz 6 1CPU | 2905 ↑révisé | 6.0 – 4.0 | 10 | 60.00% |
| Gandalf 6.01 1CPU – List 5.12 1CPU | 2965 ↑révisé | 4.5 – 5.5 | 10 | 45.00% |
| Gandalf 6.01 1CPU – SOS 5 for Arena 1CPU | 2922 ↑révisé | 4.0 – 6.0 | 10 | 40.00% |
| Total cumulé | moy. pond. 2983 ↑révisé | 32.0 – 38.0 | 70 | 45.71% |
Elo : 2953 (mono-thread · recalibré cascade 2026)
Erreur (σ) : ±10
Nombre de parties : 70
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Gambit Tiger 2.0 | 2963 ↑révisé | 1 | Référence supérieure |
| Gandalf 6.01 | 2953 ↑révisé | 1 — mono-thread | Mesuré · σ = ±10 |
| Fritz 6 | 2905 ↑révisé | 1 | Ancre — 60.00% |
Calibration : List 5.12 mono-thread
Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 60 parties · Ancres révisées
List 5.12
List 5.12 — moteur libre de Fritz Reul, chercheur allemand. Ses six ancres sont toutes révisées dans la cascade Junior 7 / Fritz 6. Rating progresse de 2936 à 2965, franchissant la barre des 2960.
Aucun nouveau gauntlet n'a été joué. La révision résulte de la mise à jour en cascade des ancres : Junior 7 (+118), Fritz 6 (−42), puis Fritz 5.32 (+11), Yace Paderbron (+29), Hiarcs 7.32 (+29), Nimzo 8 (+29). Les scores originaux sont inchangés.
| Opposition | Ancre Elo | Score | N | % |
|---|---|---|---|---|
| Fritz 6 (1CPU) | 2905 ↑révisé | 5.0 – 5.0 | 10 | 50.00% |
| Nimzo 8 (1CPU) | 2900 ↑révisé | 7.0 – 3.0 | 10 | 70.00% |
| Hiarcs 7.32 (1CPU) | 2891 ↑révisé | 6.5 – 3.5 | 10 | 65.00% |
| Junior 7 (1CPU) | 2980 ↑révisé | 5.0 – 5.0 | 10 | 50.00% |
| Fritz 5.32 (1CPU) | 2866 ↑révisé | 6.5 – 3.5 | 10 | 65.00% |
| Yace Paderbron (1CPU) | 2859 ↑révisé | 5.5 – 4.5 | 10 | 55.00% |
| Total cumulé | moy.pond. 2900 | 35.5 – 24.5 | 60 | 59.17% |
Calibration : SOS 5 for Arena mono-thread
Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 80 parties · Ancres révisées
SOS 5 for Arena
SOS — moteur de Rudolf Huber, co-inventeur du protocole UCI avec Stefan Meyer-Kahlen (2000). Distribué via Arena. Recalcul cascade 2026 (post-Shredder 10).
Aucun nouveau gauntlet. Révision par mise à jour des ancres : Shredder 10 (3087 stable), Deep Junior 7 (2996 → 3031), Fritz 6 (2947 → 2905), List 5.12 (2936 → 2965). Le score 39.38% reste inchangé.
| Opposition | Ancre Elo | Score | N | % |
|---|---|---|---|---|
| Shredder 10 UCI (1CPU) | 3087 | 4.0 – 16.0 | 20 | 20.00% |
| Deep Junior 7 (8CPU) | 3031 ↑révisé | 5.5 – 14.5 | 20 | 27.50% |
| Fritz 6 (1CPU) | 2905 ↑révisé | 10.5 – 9.5 | 20 | 52.50% |
| List 5.12 (1CPU) | 2965 ↑révisé | 11.5 – 8.5 | 20 | 57.50% |
| Total cumulé | moy.pond. 2997 | 31.5 – 48.5 | 80 | 39.38% |
Calibration : Nimzo 8 mono-thread
Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 75 parties · Ancres révisées
Nimzo 8
Nimzo — moteur commercial de Chrilly Donninger (Autriche), également auteur de Hydra. Ses cinq ancres sont toutes révisées dans la cascade. La propriété mathématique remarquable se maintient : Nimzo 8 fait à nouveau 50.00% exact (37.5/75) — sa perf est donc strictement égale à la nouvelle moy. pond.
Aucun nouveau gauntlet n'a été joué. Révision par mise à jour en cascade des ancres : Junior 7 (+118), Fritz 6 (−42), Fritz 5.32 (+11), Yace Paderbron (+29), Hiarcs 7.32 (+29). Les scores originaux sont inchangés.
| Opposition | Ancre Elo | Score | N | % |
|---|---|---|---|---|
| Fritz 6 (1CPU) | 2905 ↑révisé | 5.5 – 9.5 | 15 | 36.67% |
| Fritz 5.32 (1CPU) | 2866 ↑révisé | 6.0 – 9.0 | 15 | 40.00% |
| Junior 7 (1CPU) | 2980 ↑révisé | 7.0 – 8.0 | 15 | 46.67% |
| Hiarcs 7.32 (1CPU) | 2891 ↑révisé | 8.5 – 6.5 | 15 | 56.67% |
| Yace Paderbron (1CPU) | 2859 ↑révisé | 10.5 – 4.5 | 15 | 70.00% |
| Total cumulé | moy.pond. 2900 | 37.5 – 37.5 | 75 | 50.00% |
Calibration : Hiarcs 7.32 mono-thread
Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 55 parties · Ancres révisées
Hiarcs 7.32
Hiarcs (Highly Intelligent Auto Response Chess System) — moteur commercial de Mark Uniacke, école britannique. Plusieurs titres WMCCC sur micros, notamment sur Palm Pilot (2000, 2001). Recalcul cascade 2026.
Aucun nouveau gauntlet n'a été joué. Révision par mise à jour en cascade des ancres : Junior 7 (+118), Fritz 6 (−42), Fritz 5.32 (+11), Yace Paderbron (+29). Les scores originaux sont inchangés.
| Opposition | Ancre Elo | Score | N | % |
|---|---|---|---|---|
| Fritz 5.32 (1CPU) | 2866 ↑révisé | 7.0 – 7.0 | 14 | 50.00% |
| Fritz 6 (1CPU) | 2905 ↑révisé | 6.5 – 7.5 | 14 | 46.43% |
| Junior 7 (1CPU) | 2980 ↑révisé | 5.5 – 8.5 | 14 | 39.29% |
| Yace Paderbron (1CPU) | 2859 ↑révisé | 7.5 – 5.5 | 13 | 57.69% |
| Total cumulé | moy.pond. 2903 | 26.5 – 28.5 | 55 | 48.18% |
Calibration : Fritz 5.32 mono-thread
Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 87 parties · Ancres révisées
Fritz 5.32 — ChessBase / Frans Morsch
Fritz 5.32 — moteur de Frans Morsch, commercialisé par ChessBase. Build de maintenance de Fritz 5 (1997). Le rating progresse de 2855 à 2866 par recalcul sur les ancres révisées (Fritz 6, Junior 7). Le score global reste 50.00% exact — la performance est strictement égale à la nouvelle moy. pond.
Aucun nouveau gauntlet. Révision par mise à jour des Elos de Fritz 6 (2947 → 2905, −42) et Junior 7 (2862 → 2980, +118). Propagation nette : +11 points. Rebel 6 (2761) reste stable.
| Opposition | Ancre Elo | Score | N | % |
|---|---|---|---|---|
| Rebel 6 (100%) | 2761 stable | 24.0 – 10.0 | 34 | 70.59% |
| Fritz 6 (1CPU) | 2905 ↑révisé | 14.5 – 18.5 | 33 | 43.94% |
| Junior 7 (1CPU) | 2980 ↑révisé | 5.0 – 15.0 | 20 | 25.00% |
| Total cumulé | moy. pond. 2866 | 43.5 – 43.5 | 87 | 50.00% |
Calibration : Yace Paderbron mono-thread
Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 61 parties · Ancres révisées
Yace Paderbron
Yace Paderbron — moteur open-source développé à l'Université de Paderborn (Allemagne), génération 2000–2005. Rating progresse de 2830 à 2859 par recalcul de ses trois ancres, toutes révisées dans la cascade.
Aucun nouveau gauntlet. Révision par mise à jour en cascade des ancres : Fritz 5.32 (+11), Fritz 6 (−42), Junior 7 (+118). Les scores originaux sont inchangés.
| Opposition | Ancre Elo | Score | N | % |
|---|---|---|---|---|
| Fritz 5.32 (1CPU) | 2866 ↑révisé | 9.5 – 11.5 | 21 | 45.24% |
| Fritz 6 (1CPU) | 2905 ↑révisé | 7.0 – 13.0 | 20 | 35.00% |
| Junior 7 (1CPU) | 2980 ↑révisé | 9.0 – 11.0 | 20 | 45.00% |
| Total cumulé | moy.pond. 2916 | 25.5 – 35.5 | 61 | 41.80% |
PROTOCOLE · ALIGNEMENT CCRL · CALIBRATION DEEP SHREDDER 13
Recalibration du laboratoire sur l'échelle CCRL 40/15 — protocole de gauntlet via cinq ancres certifiées
Cette note documente le protocole expérimental mis en œuvre pour mesurer, sans bidouillage d'offset, le décalage absolu entre l'échelle interne du laboratoire (pool Ordo BESFREE 2026) et l'échelle CCRL 40/15. La méthode consiste à faire jouer Deep Shredder 13 — moteur-pivot du pool laboratoire — contre cinq moteurs dont la note CCRL est publiée et stable, en simulant pour ces cinq moteurs les conditions matérielles CCRL via un ratio Fritzmark/Stockfish 10 appliqué aux cadences.
1. Choix du moteur-pivot et des ancres
Deep Shredder 13 occupe une place charnière dans le pool laboratoire (rang 15, Elo BESFREE 2026 = 3789, 397 parties). Le moteur est représenté à la fois sur SSDF (3358 Ryzen 1800X 8 CPU, 880 parties stables depuis 2019) et sur CCRL 40/15 (3327 Intel i7-4770K 4 CPU, 2967 parties). Son ancrage externe est donc solide, et il est suffisamment fort pour être confronté à des ancres modernes type Stockfish 10 ou Caissa 1.17 sans risque de chute brutale.
Les cinq ancres CCRL retenues couvrent la fenêtre Elo 3223–3601, soit une plage de 378 points centrée sur le score attendu de Deep Shredder 13 en équivalent CCRL :
| Moteur | Configuration CCRL | Elo CCRL 40/15 |
|---|---|---|
| Caissa 1.17 | 4 CPU | 3601 |
| Stockfish 10 | 4 CPU | 3522 |
| Ethereal 12.75 | 4 CPU | 3454 |
| Wasp 5.50 | 1 CPU | 3325 |
| Gull 3 x64 | 4 CPU | 3223 |
Moyenne arithmétique des cinq ancres : 3425 Elo CCRL. Quatre des cinq ancres sont en configuration 4 CPU, conforme au standard principal de CCRL 40/15. Wasp 5.50 figure en 1 CPU, à 3325, ce qui ajoute un point de validation en bas de fourchette et teste la cohérence du protocole sur deux types de configuration matérielle simultanément.
2. Ratio matériel Ryzen 9 7950X3D / Intel i7-4770K
CCRL définit ses cadences en équivalent « 40 coups en 15 minutes sur Intel i7-4770K à 3.5 GHz », et utilise Stockfish 10 comme étalon de calibration. Sur Stockfish 10 bench mono-thread (commande standard bench 16 1 13), les valeurs de référence relevées sur i7-4770K se situent autour de :
- 1 cœur 4770K @ 3.9 GHz turbo single : ~2.34 Mnps
- 4 cœurs 4770K @ 3.7 GHz all-core turbo : ~8.89 Mnps
Sur le Ryzen 9 7950X3D du laboratoire, les NPS extrapolées des données Fritzmark (Monstru, 16 × 5.0 GHz moyens, 91.2 Mnps en 32 threads BMI2) après retrait du gain SMT (≈ 30%) et division par cœur donnent :
- 1 cœur 7950X3D @ 5.0 GHz : ~4.39 Mnps
- 4 cœurs 7950X3D : ~17.54 Mnps
- 8 cœurs 7950X3D : ~35.08 Mnps
Ratio par cœur Ryzen 9 7950X3D / Intel i7-4770K :
3. Cadences appliquées dans Banksia
La cadence de référence du gauntlet est fixée à 15 secondes par coup pour Deep Shredder 13, condition matérielle complète du laboratoire (8 threads, X3D CCD, hash 64 Mo). Les cinq ancres CCRL doivent jouer à une cadence simulant leur hardware de référence, c'est-à-dire en divisant ce temps par le ratio matériel par cœur :
Le nombre de threads, lui, reste celui de la configuration CCRL d'origine (4 pour les ancres 4 CPU, 1 pour Wasp 5.50). Le scaling SMP est une caractéristique propre à chaque moteur, indépendante du ratio matériel par cœur, et doit être conservée tel quel pour respecter la condition de mesure CCRL.
| Moteur | Threads | Sec/coup | Cadence Banksia |
|---|---|---|---|
| Deep Shredder 13 | 8 | 15.0 | movetime 15 s |
| Caissa 1.17 | 4 | 7.8 | movetime 8 s |
| Stockfish 10 | 4 | 7.8 | movetime 8 s |
| Ethereal 12.75 | 4 | 7.8 | movetime 8 s |
| Gull 3 x64 | 4 | 7.8 | movetime 8 s |
| Wasp 5.50 | 1 | 7.8 | movetime 8 s |
Note technique : Banksia n'accepte pas facilement les décimales pour les cadences movetime. La valeur 7.8 sec est arrondie à 8 sec, ce qui introduit un biais marginal de +2.5% sur le budget de compute des ancres (≈ 6 Elo en leur faveur, dans la marge d'incertitude statistique).
4. Conditions de tournoi
- Format : Défi (Gauntlet), Deep Shredder 13 contre chaque ancre
- Parties par paire : 20 (couleurs alternées via « Permuter les camps »)
- Total de parties : 5 × 20 = 100 parties
- Simultanéité : 1 (aucune partie en parallèle, pour ne pas perturber les NPS)
- Hash table : 64 Mo identique pour tous les moteurs
- Ponder : désactivé (conformément aux conditions CCRL)
- Bibliothèque d'ouverture : Cerebellum 3M, max ply 16, top 30% (variation suffisante pour 100 parties sans répétition excessive)
- Marge par coup : 1.00 sec (pour absorber les latences UCI des moteurs avec NNUE volumineuse)
- Tables Syzygy : aucune (cohérence avec les conditions BESFREE 2026 historiques)
- Affinité CPU : pinning des threads sur la CCD X3D (cœurs 0-7) pour bénéficier du V-cache 96 Mo
5. Calcul de la performance Elo
À l'issue du gauntlet, Deep Shredder 13 totalise un score S (points marqués) sur N = 100 parties. Le ratio p = S/N est interprété via la formule classique :
Avec une moyenne arithmétique simple des cinq ancres (20 parties chacune, soit pondération uniforme 1/5) :
L'écart-type associé suit la formule de Wald :
Pour N = 100 et un score attendu autour de 0.50, σ ≈ ±20 Elo. Un intervalle de confiance à 95% s'établit à ±40 Elo.
6. Interprétation — calcul du décalage d'échelle
L'Elo CCRL effectif de Deep Shredder 13 sur ce gauntlet est PerfElo. Le décalage d'échelle absolu se calcule comme :
Les scénarios suivants permettent de visualiser l'amplitude attendue du décalage selon le score mesuré :
| Score DSh13 | Pts/100 | Perf Elo | Δ échelle | Interprétation |
|---|---|---|---|---|
| 90% | 90.0 | 3807 | −18 Elo | Échelles essentiellement alignées (improbable) |
| 80% | 80.0 | 3666 | +123 Elo | Décalage modeste, lab légèrement gonflé |
| 70% | 70.0 | 3572 | +217 Elo | Décalage notable, à mi-chemin de l'estimation prior |
| 60% | 60.0 | 3495 | +294 Elo | Décalage proche de l'estimation prior |
| 56% | 56.0 | 3467 | +322 Elo | Validation directe du +320 Elo estimé |
| 50% | 50.0 | 3425 | +364 Elo | Décalage important, ancres surévaluent DSh13 dans labo |
| 40% | 40.0 | 3354 | +435 Elo | Décalage très important, hypothèse à reconsidérer |
p = 1 / (1 + 10(3425−3469)/400) = 1 / (1 + 10−0.11) ≈ 56.3%
Soit environ 56 points sur 100 parties. Toute déviation significative de ce score (au-delà des ±20 Elo de σ) signalera un décalage différent de l'estimation prior et obligera à réviser la note méthodologique du pool BESFREE 2026.
7. Mise à jour conditionnelle du pool laboratoire
Le résultat de ce gauntlet ne modifie pas en lui-même les ratings internes du pool BESFREE 2026 — la cohérence interne du pool reste indépendante de son ancrage externe. En revanche, il permettra d'enrichir la note méthodologique de la rating list avec une affirmation chiffrée, vérifiable et reproductible :
L'échelle interne du laboratoire est positionnée à +X Elo au-dessus de l'échelle CCRL 40/15 absolue, telle que mesurée par gauntlet direct de Deep Shredder 13 contre cinq ancres certifiées CCRL (Caissa 1.17, Stockfish 10, Ethereal 12.75, Wasp 5.50, Gull 3 x64) en conditions matérielles équivalentes via ratio Fritzmark/Stockfish 10. Mesure effectuée sur 100 parties, σ ≈ ±20 Elo.
Cette affirmation, une fois la valeur de X mesurée, remplacera l'estimation actuelle « ~+320 Elo » qui repose sur une comparaison indirecte via SSDF/CCRL sur Deep Shredder 13. La calibration directe constitue une mesure de premier ordre, autrement plus solide qu'une décomposition indirecte du gain matériel par log2(NPS).
8. Pré-requis logistiques et durée du gauntlet
À raison de 100 parties, avec une durée moyenne estimée de 15-20 minutes par partie (variable selon la longueur effective de la partie), le gauntlet complet demande environ 25 à 35 heures de temps machine en simultanéité 1, soit deux à trois jours de calcul continu. Le tournoi peut être interrompu et repris via la fonctionnalité « Reprendre » de Banksia. Aucune autre charge significative ne doit tourner sur le 7950X3D pendant cette période, afin de ne pas dégrader les NPS et fausser la mesure.
9. Limites méthodologiques reconnues
Le protocole repose sur trois approximations identifiées :
- Ratio matériel par cœur (1.92) : extrapolé à partir de mesures Fritzmark/Stockfish 10 bench publiées par des tiers (Christian pour le 4770K, Monstru pour le 7950X3D). L'incertitude propre est de l'ordre de ±5-10%, soit ±0.10 sur le ratio, équivalent à ±15-25 Elo sur le décalage mesuré.
- Différences architecturales Zen 4 X3D vs Haswell : prédicteur de branchement, latences mémoire, structure de cache. À NPS identique, deux engines peuvent classer légèrement différemment sur les deux architectures. Cet effet est non quantifié mais probablement < ±20 Elo en ordre de grandeur.
- Arrondi de cadence à 8 sec au lieu de 7.8 sec : biais de +2.5% en faveur des ancres, équivalent à ≈ +6 Elo sur leur performance apparente, donc ≈ −6 Elo sur Deep Shredder. Dans la marge.
L'incertitude globale combinée sur la mesure du décalage d'échelle est de l'ordre de ±30-40 Elo, ce qui reste largement informatif sur un décalage attendu autour de +300 Elo.
