Skip to content

Performance ELO, tournois maison

Rang Moteur / Système Hardware Elo Parties Err +/-
1 Fritz 20 — 8 ThreadsAMD Ryzen 9 7950X3D 100%40659020
2 Stockfish 11 64 POPCNT — 8 ThreadsAMD Ryzen 9 7950X3D 100%405417913
3 Wasp 7.00 — 8 ThreadsAMD Ryzen 9 7950X3D 100%39499520
4 Komodo 14.1 64-bit — 8 ThreadsAMD Ryzen 9 7950X3D 100%393424013
5 Fire 8 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%392017815
6 Ethereal 12.75 — 8 ThreadsAMD Ryzen 9 7950X3D 100%391118015
7 Komodo 12.1.1 64-bit — 8 ThreadsAMD Ryzen 9 7950X3D 100%39099720
8 Caissa 1.5 — 8 ThreadsAMD Ryzen 9 7950X3D 100%389515016
9 Stockfish 8 64 POPCNT — 8 ThreadsAMD Ryzen 9 7950X3D 100%387211019
10 Wasp 5.50 — 8 ThreadsAMD Ryzen 9 7950X3D 100%384915316
11 Xiphos 0.6 — 8 ThreadsAMD Ryzen 9 7950X3D 100%384918015
12 Ethereal 11.75 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%384614417
13 Booot 6.5 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%384033811
14 Rebel-Extreme-1.1 — 8 ThreadsAMD Ryzen 9 7950X3D 100%38397024
15 rofChade 2.3 — 8 ThreadsAMD Ryzen 9 7950X3D 100%380917915
16 Deep Shredder 13 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%378939710
17 Laser 1.7 — 8 ThreadsAMD Ryzen 9 7950X3D 100%377218014
18 Defenchess 2.2 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%373218014
19 Houdini 4 Pro x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%371815416
20 Gull 3 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%368515816
21 Critter 1.6a 64-bit — 8 ThreadsAMD Ryzen 9 7950X3D 100%362414317
22 Wasp 3.75 — 8 ThreadsAMD Ryzen 9 7950X3D 100%362116116
23 Senpai 2.0 — 8 ThreadsAMD Ryzen 9 7950X3D 100%35458122
24 Naum 4.2 — 8 ThreadsAMD Ryzen 9 7950X3D 100%353410819
25 Wasp 2.00 — 8 ThreadsAMD Ryzen 9 7950X3D 100%351312817
26 Komodo64 3 — 1 ThreadAMD Ryzen 9 7950X3D 100%350212218
27 Rybka 2.4MP — 8 ThreadsAMD Ryzen 9 7950X3D 100%334912118
28 Gull 1.2 x64 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%329110220
29 Glaurung 2.2 JA — 8 ThreadsAMD Ryzen 9 7950X3D 100%326614217
30 Loop M1-T — 4 ThreadsAMD Ryzen 9 7950X3D 100%320912018
31 Fruit 2.3.1 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%315313018
32 Shredder 10 UCI — 1 Thread 1TAMD Ryzen 9 7950X3D 100%311820814
33 Shredder 6 — 8 ThreadsAMD Ryzen 9 7950X3D 100%30536026
34 Deep Junior 7 — 8 ThreadsAMD Ryzen 9 7950X3D 100%304614916
35 ProDeo 2.0 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%301619814
36 Hiarcs 8 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%30126224
37 Deep Sjeng 1.6 — 8 ThreadsAMD Ryzen 9 7950X3D 100%298211818
38 Junior 8 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%298211019
39 Ruffian 2.1.0 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%297914417
40 Gambit Tiger 2.0 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%297512118
41 Junior 7 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%295216415
42 Gandalf 6.01 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%29418522
43 SOS 5 for Arena — 1 Thread 1TAMD Ryzen 9 7950X3D 100%293515216
44 List 5.12 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%290717215
45 Fritz 6 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%290535511
46 Hiarcs 7.32 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%284412618
47 Nimzo 8 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%283813117
48 Fritz 5.32 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%283419514
49The King 3.50 — 8 ThreadsAMD Ryzen 9 7950X3D 100%28178022
50 Yace Paderbron — 1 Thread 1TAMD Ryzen 9 7950X3D 100%281411019
51 Rebel 6AMD Ryzen 9 7950X3D 100%26793431
52Cray Blitz 4.9hAMD Ryzen 9 7950X3D 100%25317019
53Rebel 6AMD Ryzen 9 7950X3D 1%25276047
54Mephisto Genius 68030 Londoncb-emu236334913
55Mephisto Berlin Pro 68020cb-emu231534915
56Mephisto RISC IIcb-emu226634216
57Saitek RISC 2500 v1.04cb-emu224734817
58Mephisto Dallas 68000-UCIAMD Ryzen 9 7950X3D 100%223323821
59Novag Star Diamond (v1.04)cb-emu222635017
60Saitek Sparc (rev.518)cb-emu215334719
61Mephisto Berlin 68000 v0.03cb-emu213534919
62Fidelity Elite Avantgarde V9cb-emu212535019
63Novag Sapphirecb-emu212333420
64Mephisto MM5 (v5.1)-UCIAMD Ryzen 9 7950X3D 100%210826423
65Fidelity Designer Mach IVcb-emu209035020
66Fidelity Designer Mach IIIcb-emu202934821
67Mephisto Mondial 68000 XLcb-emu197334621
68Novag Zircon IIcb-emu197033422
69Saitek Presidentcb-emu195834421
70Mephisto Nigel Shortcb-emu195634921
71Saitek Maestro D++cb-emu192334821
72Novag Super Forte C v3.6cb-emu190134921
73Novag Super Expert C v3.6cb-emu189434921
74Novag Turquoisecb-emu187134421
75Saitek Corona II (ver. D+)cb-emu185635021
76Mephisto Modena (set 3)cb-emu185034921
77Saitek Turbo King II (D+)cb-emu184434821
78Mephisto MM V (v5.1)cb-emu183535021
79Mephisto MM IV (v7.10)cb-emu180834821
80Fidelity Designer 2100cb-emu180834821
81Novag Constellation Forte Acb-emu180335021
82Saitek Simultano (ver. B)cb-emu176434920
83Fidelity Par Excellence (B)cb-emu174234720
84Saitek Prismacb-emu172434919
85Fidelity Designer 2000cb-emu170334819
86Novag Super VIP v3.7cb-emu164034817
87Tandy Chess Champion 2150cb-emu157734616
88Saitek Turbo 16Kcb-emu143734811
89Saitek Leonardo (v1.4)cb-emu12853478
Ancres de calibration : Deep Shredder 13 x64 8T (3576, validé SSDF Ryzen 3560±47) · Glaurung 2.2 JA 8T (3295 recalibré BES-free) · Rybka 2.4MP 8T (3234) · Wasp 2.00 8T (3283). Moteurs 1–25 : ratings Ordo globaux (HCE.pgn + gauntlets individuels). Moteurs 26+ : calibration par gauntlets dédiés. — Shredder 10 UCI recalibré 2026 : gauntlet certifié BES-free 1T, 3160 ±24. — Cascade Shredder 10 appliquée : SOS 5 (+18), ProDeo (+19), Gambit Tiger (+18), Gandalf (+18), Ruffian (+22), Junior 8 (+7). — Shredder 6 nouvellement intégré : gauntlet dédié 60 parties 8T contre Deep Junior 7 / Junior 8 / ProDeo 2.0 / Ruffian 2.1.0, performance 3059 ±26. — Fruit 2.3.1 nouvellement intégré : gauntlet dédié 80 parties 1T contre Shredder 10 UCI / Deep Sjeng 1.6 / ProDeo 2.0 / Deep Junior 7, performance 3173 ±21. Moteur mono-thread historique de Fabien Letouzey (2007), confirme la robustesse de la lignée pré-Stockfish. — Glaurung 2.2 JA recalibré 2026 : gauntlet certifié BES-free 8T, 60 parties contre Fruit 2.3.1 / Shredder 10 UCI / ProDeo 2.0, performance 3295 ±23 (gain de +132 points sur l'ancienne mesure 3163 contaminée par les ancres Q6600). Ancêtre direct de Stockfish reprend sa place dans la zone haute du tableau, juste en dessous de Naum 4.2. — Loop M1-T 4CPU nouvellement intégré : gauntlet dédié 68 parties 4T contre Glaurung 2.2 JA / Fruit 2.3.1 / Shredder 10 UCI / ProDeo 2.0, performance 3209 ±24. Fork SMP de Fruit 2.1 par Fritz Reul (Allemagne), même auteur que List ; le différentiel hardware de +328 sur la mesure CCRL 4CPU Athlon X2 (2881) s'aligne sur Wasp 2.01 (+337). — Gull 1.2 x64 nouvellement intégré : gauntlet dédié 80 parties 1T contre Glaurung 2.2 JA / Loop M1-T / Fruit 2.3.1 / Shredder 10 UCI, performance 3302 ±22. Moteur mono-thread historique de Vadim Demichev (Russie, 2012), prédécesseur direct de Gull 3 (lignée HCE russe) ; le différentiel hardware de +383 sur la mesure CCRL 40/15 Athlon X2 (2919) confirme l'alignement strict avec Fruit 2.3.1 (+393). — Rybka 2.4 MP 8 Threads recalibré 2026 : gauntlet certifié BES-free 67 parties contre Fruit 2.3.1 / Glaurung 2.2 JA / Loop M1-T / Gull 1.2, performance 3386 ±23 (gain de +152 points sur l'ancienne mesure 3234 contaminée par les ancres Q6600). Rybka monte du rang 28 au rang 22, désormais entre Wasp 3.75 et Senpai 2.0. Différentiel hardware +340 vs CCRL Athlon X2 4400+ 2CPU (3046), aligné Loop +335 et Wasp 2.01 +337. — Wasp 2.00 8 Threads recalibré 2026 : gauntlet certifié BES-free 60 parties contre Rybka 2.4 MP / Loop M1-T / Gull 1.2 / Glaurung 2.2 JA, performance 3513 ±22 (gain de +230 points sur l'ancienne mesure 3283). Saut spectaculaire du rang 27 au rang 19 — Wasp 2.00 entre dans la zone Defenchess/Houdini. Score global 77.50% reste légèrement au-dessus du seuil de mesurabilité fine, la valeur 3513 constitue donc une borne basse fiable. — Naum 4.2 8 Threads propagée par chaîne BES-free 2026 : gauntlet 59 parties contre Wasp 2.00 (3513) / Rybka 2.4 MP (3386) / Glaurung 2.2 JA (3295), performance 3563 ±23 (gain de +248 points sur l'ancienne mesure 3315 contaminée par les ancres Q6600 simulées). Naum monte du rang 24 au rang 16, désormais entre Deep Shredder 13 et Laser 1.7. — Mise à jour Ordo BESFREE 2026 : l'ensemble des 48 Elos du haut de tableau provient désormais d'un calcul Ordo global sur le pool BES-free certifié, ancré sur 5 ancres réparties tous les 200–300 points : Fritz 6 = 2905 · Loop M1-T = 3209 · Wasp 2.00 = 3513 · Gull 3 x64 = 3685 · Stockfish 8 64 POPCNT = 3872. Tous les moteurs marqués ✱ ont été intégrés au pool Ordo BESFREE 2026 et tirent leur Elo de ce calcul global lissé. Les engines tournoi HCE (Stockfish 11, Komodo 14.1, Fire 8, Ethereal 12.75, Xiphos 0.6, rofChade 2.3, Laser 1.7, Defenchess 2.2) sont automatiquement rattachés au pool BES-free via leurs parties croisées dans HCE.pgn, gagnant en moyenne ~+214 points sur leurs anciennes valeurs (signature d'un offset rigide entre l'ancien repère contaminé Q6600 et le nouveau repère BES-free). Fritz 20 8 Threads intégré 2026 : gauntlet dédié 90 parties 8T contre Caissa 1.5 / Ethereal 12.75 / Komodo 14.1 / Stockfish 11 / Stockfish 8 / Wasp 7.00 (15 parties par ancre), performance 4065 ±20 (score global 67.78%). Fritz 20 prend la tête du laboratoire au rang 1, +11 devant Stockfish 11 (4054) — premier moteur NNUE commercial à dépasser le plateau Stockfish 11. Stockfish 11 avait été le premier moteur à franchir 4000 Elo dans le laboratoire.
Err +/- calculée via σ = 400 × √(p×(1−p) / N). — = rating recalibré. — 1T = mono-thread.

Performance ELO, tournois maison

Rang Moteur / Système Hardware Elo Parties Err +/-
1 Wasp 7.00 — 8 ThreadsAMD Ryzen 9 7950X3D 100%39346025
2 Komodo 12.1.1 64-bit — 8 ThreadsAMD Ryzen 9 7950X3D 100%39037523
3 Stockfish 8 64 POPCNT — 8 ThreadsAMD Ryzen 9 7950X3D 100%38728022
4 Caissa 1.5 — 8 ThreadsAMD Ryzen 9 7950X3D 100%38638022
5 Booot 6.5 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%38567522
6 Wasp 5.50 — 8 ThreadsAMD Ryzen 9 7950X3D 100%38526024
★ 7Stockfish 11 64 POPCNT — 8 ThreadsAMD Ryzen 9 7950X3D 100%384117913
8 Rebel-Extreme-1.1 — 8 ThreadsAMD Ryzen 9 7950X3D 100%38317024
9 Ethereal 11.75 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%38146724
10 Deep Shredder 13 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%37545924
11 Houdini 4 Pro x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%373710220
12Komodo 14.1 64-bit — 8 ThreadsAMD Ryzen 9 7950X3D 100%371824013
13Fire 8 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%370717815
14Ethereal 12.75 — 8 ThreadsAMD Ryzen 9 7950X3D 100%369718015
15 Gull 3 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%36858022
16 Critter 1.6a 64-bit — 8 ThreadsAMD Ryzen 9 7950X3D 100%36377622
17Xiphos 0.6 — 8 ThreadsAMD Ryzen 9 7950X3D 100%363518015
18 Wasp 3.75 — 8 ThreadsAMD Ryzen 9 7950X3D 100%36105926
19rofChade 2.3 — 8 ThreadsAMD Ryzen 9 7950X3D 100%359417915
20 Naum 4.2 — 8 ThreadsAMD Ryzen 9 7950X3D 100%35635923
21Laser 1.7 — 8 ThreadsAMD Ryzen 9 7950X3D 100%355818014
22 Senpai 2.0 — 8 ThreadsAMD Ryzen 9 7950X3D 100%35584629
23 Komodo64 3 — 1 ThreadAMD Ryzen 9 7950X3D 100%35297922
24Defenchess 2.2 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%351718014
25 Wasp 2.00 — 8 ThreadsAMD Ryzen 9 7950X3D 100%35136022
26 Rybka 2.4MP — 8 ThreadsAMD Ryzen 9 7950X3D 100%33866723
27 Gull 1.2 x64 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%33028022
28 Glaurung 2.2 JA — 8 ThreadsAMD Ryzen 9 7950X3D 100%32956023
29 Loop M1-T — 4 ThreadsAMD Ryzen 9 7950X3D 100%32096824
30 Fruit 2.3.1 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%31738021
31 Shredder 10 UCI — 1 Thread 1TAMD Ryzen 9 7950X3D 100%31606024
32 Deep Sjeng 1.6 — 8 ThreadsAMD Ryzen 9 7950X3D 100%30667010
33 Shredder 6 — 8 ThreadsAMD Ryzen 9 7950X3D 100%30596026
34 Deep Junior 7 — 8 ThreadsAMD Ryzen 9 7950X3D 100%30315611
35 ProDeo 2.0 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%30246711
36 Junior 8 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%30066211
37 Ruffian 2.1.0 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%2989909
38 Gambit Tiger 2.0 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%29816011
39 Junior 7 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%29806211
40 Gandalf 6.01 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%29717010
41 List 5.12 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%29656011
42 SOS 5 for Arena — 1 Thread 1TAMD Ryzen 9 7950X3D 100%2940809
43 Fritz 6 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%29051507
44 Nimzo 8 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%29007510
45 Hiarcs 7.32 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%28915512
46 Fritz 5.32 — 1 Thread 1TAMD Ryzen 9 7950X3D 100%2866879
47 Yace Paderbron — 1 Thread 1TAMD Ryzen 9 7950X3D 100%28596111
48The King 3.50 — 8 ThreadsAMD Ryzen 9 7950X3D 100%28178022
49Rebel 6AMD Ryzen 9 7950X3D 100%276116116
50Cray Blitz 4.9hAMD Ryzen 9 7950X3D 100%25317019
51Rebel 6AMD Ryzen 9 7950X3D 1%25276047
52Mephisto Genius 68030 Londoncb-emu236334913
53Mephisto Berlin Pro 68020cb-emu231534915
54Mephisto RISC IIcb-emu226634216
55Saitek RISC 2500 v1.04cb-emu224734817
56Mephisto Dallas 68000-UCIAMD Ryzen 9 7950X3D 100%223323821
57Novag Star Diamond (v1.04)cb-emu222635017
58Saitek Sparc (rev.518)cb-emu215334719
59Mephisto Berlin 68000 v0.03cb-emu213534919
60Fidelity Elite Avantgarde V9cb-emu212535019
61Novag Sapphirecb-emu212333420
62Mephisto MM5 (v5.1)-UCIAMD Ryzen 9 7950X3D 100%210826423
63Fidelity Designer Mach IVcb-emu209035020
64Fidelity Designer Mach IIIcb-emu202934821
65Mephisto Mondial 68000 XLcb-emu197334621
66Novag Zircon IIcb-emu197033422
67Saitek Presidentcb-emu195834421
68Mephisto Nigel Shortcb-emu195634921
69Saitek Maestro D++cb-emu192334821
70Novag Super Forte C v3.6cb-emu190134921
71Novag Super Expert C v3.6cb-emu189434921
72Novag Turquoisecb-emu187134421
73Saitek Corona II (ver. D+)cb-emu185635021
74Mephisto Modena (set 3)cb-emu185034921
75Saitek Turbo King II (D+)cb-emu184434821
76Mephisto MM V (v5.1)cb-emu183535021
77Mephisto MM IV (v7.10)cb-emu180834821
78Fidelity Designer 2100cb-emu180834821
79Novag Constellation Forte Acb-emu180335021
80Saitek Simultano (ver. B)cb-emu176434920
81Fidelity Par Excellence (B)cb-emu174234720
82Saitek Prismacb-emu172434919
83Fidelity Designer 2000cb-emu170334819
84Novag Super VIP v3.7cb-emu164034817
85Tandy Chess Champion 2150cb-emu157734616
86Saitek Turbo 16Kcb-emu143734811
87Saitek Leonardo (v1.4)cb-emu12853478
Ancres de calibration : Deep Shredder 13 x64 8T (3576, validé SSDF Ryzen 3560±47) · Glaurung 2.2 JA 8T (3295 recalibré BES-free) · Rybka 2.4MP 8T (3234) · Wasp 2.00 8T (3283). Moteurs 1–25 : ratings Ordo globaux (HCE.pgn + gauntlets individuels). Moteurs 26+ : calibration par gauntlets dédiés. — Shredder 10 UCI recalibré 2026 : gauntlet certifié BES-free 1T, 3160 ±24. — Cascade Shredder 10 appliquée : SOS 5 (+18), ProDeo (+19), Gambit Tiger (+18), Gandalf (+18), Ruffian (+22), Junior 8 (+7). — Shredder 6 nouvellement intégré : gauntlet dédié 60 parties 8T contre Deep Junior 7 / Junior 8 / ProDeo 2.0 / Ruffian 2.1.0, performance 3059 ±26. — Fruit 2.3.1 nouvellement intégré : gauntlet dédié 80 parties 1T contre Shredder 10 UCI / Deep Sjeng 1.6 / ProDeo 2.0 / Deep Junior 7, performance 3173 ±21. Moteur mono-thread historique de Fabien Letouzey (2007), confirme la robustesse de la lignée pré-Stockfish. — Glaurung 2.2 JA recalibré 2026 : gauntlet certifié BES-free 8T, 60 parties contre Fruit 2.3.1 / Shredder 10 UCI / ProDeo 2.0, performance 3295 ±23 (gain de +132 points sur l'ancienne mesure 3163 contaminée par les ancres Q6600). Ancêtre direct de Stockfish reprend sa place dans la zone haute du tableau, juste en dessous de Naum 4.2. — Loop M1-T 4CPU nouvellement intégré : gauntlet dédié 68 parties 4T contre Glaurung 2.2 JA / Fruit 2.3.1 / Shredder 10 UCI / ProDeo 2.0, performance 3209 ±24. Fork SMP de Fruit 2.1 par Fritz Reul (Allemagne), même auteur que List ; le différentiel hardware de +328 sur la mesure CCRL 4CPU Athlon X2 (2881) s'aligne sur Wasp 2.01 (+337). — Gull 1.2 x64 nouvellement intégré : gauntlet dédié 80 parties 1T contre Glaurung 2.2 JA / Loop M1-T / Fruit 2.3.1 / Shredder 10 UCI, performance 3302 ±22. Moteur mono-thread historique de Vadim Demichev (Russie, 2012), prédécesseur direct de Gull 3 (lignée HCE russe) ; le différentiel hardware de +383 sur la mesure CCRL 40/15 Athlon X2 (2919) confirme l'alignement strict avec Fruit 2.3.1 (+393). — Rybka 2.4 MP 8 Threads recalibré 2026 : gauntlet certifié BES-free 67 parties contre Fruit 2.3.1 / Glaurung 2.2 JA / Loop M1-T / Gull 1.2, performance 3386 ±23 (gain de +152 points sur l'ancienne mesure 3234 contaminée par les ancres Q6600). Rybka monte du rang 28 au rang 22, désormais entre Wasp 3.75 et Senpai 2.0. Différentiel hardware +340 vs CCRL Athlon X2 4400+ 2CPU (3046), aligné Loop +335 et Wasp 2.01 +337. — Wasp 2.00 8 Threads recalibré 2026 : gauntlet certifié BES-free 60 parties contre Rybka 2.4 MP / Loop M1-T / Gull 1.2 / Glaurung 2.2 JA, performance 3513 ±22 (gain de +230 points sur l'ancienne mesure 3283). Saut spectaculaire du rang 27 au rang 19 — Wasp 2.00 entre dans la zone Defenchess/Houdini. Score global 77.50% reste légèrement au-dessus du seuil de mesurabilité fine, la valeur 3513 constitue donc une borne basse fiable. — Naum 4.2 8 Threads propagée par chaîne BES-free 2026 : gauntlet 59 parties contre Wasp 2.00 (3513) / Rybka 2.4 MP (3386) / Glaurung 2.2 JA (3295), performance 3563 ±23 (gain de +248 points sur l'ancienne mesure 3315 contaminée par les ancres Q6600 simulées). Naum monte du rang 24 au rang 16, désormais entre Deep Shredder 13 et Laser 1.7. — Cascade BES-free finale (15 engines propagés) : la propagation suit les chaînes de dépendances des gauntlets existants en substituant systématiquement les anciens Elos d'ancres par les nouveaux Elos BES-free. Wasp 3.75 → 3610 (+190), Komodo64 3 → 3529 (+170), Senpai 2.0 → 3558, Critter 1.6a → 3637, Deep Shredder 13 → 3754, Gull 3 → 3685, Houdini 4 Pro → 3737, Wasp 5.50 → 3852, Booot 6.5 → 3856, Ethereal 11.75 → 3814, Caissa 1.5 → 3863, Stockfish 8 → 3872, Komodo 12.1.1 → 3903, Wasp 7.00 → 3934, Rebel Extreme 1.1 → 3831. Tous gagnent en moyenne +179 points, signature d'une propagation interne cohérente avec écart inter-engines conservés. Stockfish 11 et Komodo 14.1 non propagés à ce stade — leur calcul dépend du tournoi HCE 2026 dans son ensemble.
Err +/- calculée via σ = 400 × √(p×(1−p) / N). — = rating recalibré. — 1T = mono-thread.

Calibration · Tournoi HCE 2026 · Ryzen 9 7950X3D

Tournoi HCE 2026 — Moteurs sans débrief individuel

Ce document regroupe les résultats de calibration de sept moteurs issus du tournoi interne HCE 2026 qui ne font pas l'objet d'un débrief individuel. Ces sept programmes — Stockfish 11 64 POPCNT, Fire 8 x64, Ethereal 12.75, Xiphos 0.6, rofChade 2.3, Laser 1.7 et Defenchess 2.2 x64 — ont tous été testés en configuration 8 threads sur AMD Ryzen 9 7950X3D dans un tournoi commun dont les résultats ont été soumis à Ordo conjointement avec les parties des gauntlets individuels antérieurs. Leurs ratings sont donc des ratings Ordo globaux et non des performances de gauntlet dédié.

Résultats du tournoi HCE 2026

MoteurElo OrdoErr ±PartiesScore %TypeAuteur
Stockfish 11 64 POPCNT — 8T3841±1317977%HCEÉquipe Stockfish
Fire 8 x64 — 8T3707±1517859%HCENorman Schmidt
Ethereal 12.75 — 8T3697±1518058%HCEAndrew Grant
Xiphos 0.6 — 8T3635±1518048%HCEMilos Tatarevic
rofChade 2.3 — 8T3594±1517942%HCERein Halbersma
Laser 1.7 — 8T3558±1418037%HCEJeffrey An
Defenchess 2.2 x64 — 8T3517±1418032%HCECan Celik & Omer Faruk Dag
Méthode de calibration

Les ratings ci-dessus sont issus d'un calcul Ordo global portant sur l'ensemble des parties du laboratoire : le tournoi HCE 2026 (parties directes entre les moteurs ci-dessus) plus les gauntlets individuels des moteurs de l'échelle complète. L'ancre de référence est Deep Shredder 13 x64 8T (3576 Elo, validé SSDF Ryzen à 3560 ±47). Les σ sont calculés par la formule σ = 400 × √(p×(1−p)/N) sur le score Ordo de chaque moteur.

Profil des moteurs

Stockfish 11 64 POPCNT est la version publiée en janvier 2020, dernière grande version HCE de la série avant la transition NNUE opérée avec Stockfish 12 en août 2020. Développé par une équipe internationale (Tord Romstad, Marco Costalba, Joona Kiiski et de nombreux contributeurs via la plateforme Fishtest), Stockfish 11 représente l'apogée absolu de l'évaluation manuscrite au sein de la série — le plafond HCE de ce laboratoire à 3841, soit 186 points au-dessus de Stockfish 8 (3655) mesuré dans les mêmes conditions.

Fire 8 x64 est développé par Norman Schmidt à partir du code source de Stockfish 8, avec des modifications substantielles de l'évaluation et de la recherche. Publiée en 2021, la version 8 est la dernière version HCE de la série avant l'adoption du NNUE. Fire se distingue par son jeu tactique agressif et ses performances constamment proches de Stockfish sur le matériel grand public. À 3707 Elo dans ce laboratoire, il s'intercale entre Komodo 14.1 (3718) et Ethereal 12.75 (3697).

Ethereal 12.75 est la version HCE finale d'Andrew Grant, publiée en octobre 2020. Elle succède à la version 11.75 calibrée individuellement dans ce laboratoire (3632) et lui est supérieure de 65 points (3697 vs 3632) — un gain conforme aux 30–40 points annoncés entre ces deux versions selon les tests CCRL. Ethereal 12.75 est le dernier moteur HCE pur de la série avant la version commerciale 13.00 NNUE (juin 2021).

Xiphos 0.6 est développé par Milos Tatarevic (Serbie). C'est un moteur HCE open-source de la génération 2018–2019, dont la version 0.6 atteint un niveau comparable à Ethereal 11.75 — confirmé ici par les 3635 Ordo, pratiquement ex-aequo avec les 3632 d'Ethereal 11.75 dans ce calcul global.

rofChade 2.3 est développé par Rein Halbersma (Pays-Bas). Moteur HCE open-source publié autour de 2019–2020, rofChade est remarquable par sa régularité dans les tournois communautaires (CCRL, TCEC). À 3594 dans ce laboratoire, il s'installe entre Deep Shredder 13 (3576) et Laser 1.7 (3558).

Laser 1.7 est développé par Jeffrey An. Moteur HCE open-source de la génération 2019, Laser s'est fait une place régulière dans les listes CCRL autour de 3300–3350 Elo en 4CPU, i7-4770K. Le rating de 3558 en 8 threads Ryzen confirme un différentiel de +200 à +250 points cohérent avec les autres moteurs de la zone.

Defenchess 2.2 x64 est développé par Can Celik et Omer Faruk Dag (Turquie). Moteur HCE open-source publié autour de 2019–2020, Defenchess est le plus faible des sept dans ce tournoi avec 32% de score global — ce qui le place logiquement en bas de la zone HCE supérieure de l'échelle à 3517, entre rofChade (3594) et Houdini 4 Pro (3505).

Positionnement dans l'échelle interne
MoteurEloPartiesTypeRemarque
Stockfish 11 64 POPCNT3841179HCE★ Rang 1 absolu — plafond HCE du laboratoire
Wasp 7.00373495NNUERang 2 — débrief individuel
Komodo 14.1 64-bit3718240HCERang 3 — débrief individuel
Fire 8 x643707178HCERang 4
Ethereal 12.753697180HCERang 5
Komodo 12.1.1 64-bit369497HCERang 6 — débrief individuel
Caissa 1.53681150NNUERang 7 — débrief individuel
Stockfish 8 64 POPCNT3655110HCERang 8 — débrief individuel
Wasp 5.503814 153NNUERang 9 — débrief individuel
Xiphos 0.63635180HCERang 10 — ex-aequo Wasp 5.50
Ethereal 11.75 x643632144HCERang 11 — débrief individuel
Booot 6.5 x643627338HCERang 12 — débrief individuel
Rebel-Extreme-1.1362470NNUE styleRang 13 — débrief individuel
rofChade 2.33594179HCERang 14
Deep Shredder 13 x643754 397HCERang 15 — ancre SSDF
Laser 1.73558180HCERang 16
Defenchess 2.2 x643517180HCERang 17

Les sept moteurs en gras sont ceux sans débrief individuel, couverts par ce document. Stockfish 11 (3841) est le plafond absolu HCE du laboratoire, à 186 points au-dessus de Stockfish 8 (3655) — l'amplitude de la progression HCE sur la série Stockfish 8 → 11. Tous les ratings sont des valeurs Ordo globales, commensurables entre eux et avec les moteurs des gauntlets individuels.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Wasp 7.00 (8 Threads) ★ PROPAGATION BES-FREE 2026

Ce document présente les résultats du gauntlet de calibration de Wasp 7.00 — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3693 Elo). Wasp est un moteur développé par John Stanback, programmeur américain, dont la série illustre parfaitement la révolution NNUE : trois générations calibrées dans ce laboratoire, de 3297 (HCE) à 3755 (NNUE).

Résultats détaillés du gauntlet

Rencontre (Wasp 7.00 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Wasp 7.00 8CPU – Stockfish 8 64 POPCNT 8CPU3872 9.5 – 5.51563.33%
Wasp 7.00 8CPU – Caissa 1.5 8CPU3863 8.0 – 7.01553.33%
Wasp 7.00 8CPU – Booot 6.5 x64 8CPU3856 9.5 – 5.51563.33%
Wasp 7.00 8CPU – Ethereal 11.75 8CPU3814 10.0 – 5.01566.67%
Total cumulémoy. pond. 367237.0 – 23.06061.67%
Performance Elo obtenue

Elo : 3934
Erreur (σ) : ±25
Nombre de parties : 60

Moy. pond. : (3693+3684+3677+3635)×15 / 60 = 3672. Performance = 3672 + 400 × log₁₀(0.6167/0.3833) = 3755. σ = ±11.

Positionnement dans l'échelle interne
MoteurEloThreadsTypeRemarque
Wasp 7.0039348NNUEMesuré · σ=±11 · ★ Rang 1
Stockfish 83872 8HCEAncre — 63.33%
Caissa 1.53863 8NNUEAncre — 53.33%
Booot 6.5 x643856 8HCEAncre — 63.33%
Ethereal 11.753814 8HCEAncre — 66.67%

Wasp 7.00 (3755) ★ rang 1 — premier moteur de l'échelle à franchir 3750. Saga Wasp : 2.01 (3297 HCE) → 3.75 (3420 HCE) → 5.50 (3673 NNUE) → 7.00 (3755 NNUE). L'asymétrie 63% HCE / 53% NNUE (contre Caissa) est le marqueur stylistique central de cette version.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Komodo 12.1.1 64-bit (8 Threads) ★ PROPAGATION BES-FREE 2026

Ce document présente les résultats du gauntlet de calibration de Komodo 12.1.1 64-bit — 8 threads, joué contre six moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3755 Elo). Komodo est un moteur commercial développé par Mark Lefler et Larry Kaufman, économiste et grand maître international américain. La version 12.1.1 est une version à évaluation entièrement manuscrite (HCE) — Komodo n'adoptera l'architecture NNUE qu'avec la série Dragon, lancée en 2020.

Note — Gauntlet en cours (75/90 parties)

Ce rapport est établi à 83% du gauntlet. Le rating de 3724 est stable depuis 46 parties dans une fenêtre de ±7 points (3718–3725), ce qui justifie la publication de ce rapport intermédiaire. 15 parties restantes ne modifieront pas le classement de façon significative.

Résultats détaillés du gauntlet

Rencontre (Komodo 12.1.1 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Komodo 12.1.1 8CPU – Wasp 7.00 8CPU3934 6.0 – 7.01346.15%
Komodo 12.1.1 8CPU – Stockfish 8 64 POPCNT 8CPU3872 8.5 – 4.51365.38%
Komodo 12.1.1 8CPU – Caissa 1.5 8CPU3863 7.0 – 6.01353.85%
Komodo 12.1.1 8CPU – Booot 6.5 x64 8CPU3856 6.5 – 5.51254.17%
Komodo 12.1.1 8CPU – Wasp 5.50 8CPU3852 8.0 – 4.01266.67%
Komodo 12.1.1 8CPU – Ethereal 11.75 x64 8CPU3814 5.5 – 6.51245.83%
Total cumulémoy. pond. 368741.5 – 33.57555.33%
Performance Elo obtenue

Elo : 3903 (préliminaire — 75/90 parties)
Erreur (σ) : ±23
Nombre de parties : 75

Moyenne pondérée des ancres : (3755×13 + 3693×13 + 3684×13 + 3677×12 + 3673×12 + 3635×12) / 75 = 3687.
Performance = 3687 + 400 × log₁₀(0.5533 / 0.4467) = 3687 + 400 × 0.0930 = 3724.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.5533 et N = 75 → σ = ±10.

Lecture des résultats

Le gauntlet de Komodo 12.1.1 a convergé tôt et fermement. Depuis la 46e partie, le rating oscille dans une fenêtre de ±7 points — l'une des convergences les plus rapides observées dans ce laboratoire pour un moteur de cette zone. Les perfs individuelles sur quatre ancres centrales se regroupent dans une fenêtre de seulement 42 points (3706–3728), ce qui atteste d'une mesure cohérente.

Le gauntlet révèle deux asymétries stylistiques notables. La première, favorable : 65.38% contre Stockfish 8 (3693) sur 13 parties et 66.67% contre Wasp 5.50 (3673) sur 12 parties — deux moteurs contre lesquels Komodo 12 affiche une nette surperformance par rapport à son niveau général. La seconde, défavorable : 45.83% contre Ethereal 11.75 (3635) sur 12 parties — un moteur HCE 130 points en dessous de Komodo 12 dans cette échelle, contre lequel le résultat devrait être plus favorable. Ces deux polarités se compensent dans le calcul global mais signalent un profil stylistique tranché.

L'avantage persistant contre Stockfish 8 mérite une attention particulière. Sur la durée — 13 parties — un score de 65.38% dépasse statistiquement le niveau attendu pour un moteur à 3724 face à un adversaire à 3693. Une explication plausible, documentée dans la communauté des moteurs d'échecs, est que les paramètres d'évaluation de Komodo 12 ont été tuned en jouant massivement contre Stockfish, ce qui aurait généré des biais stylistiques spécifiquement efficaces contre ce moteur. Il ne s'agit pas d'une assertion certaine mais d'une hypothèse cohérente avec le profil du gauntlet.

Comparaison avec les listes de référence

Le CCRL 40/15 place Komodo 12.1.1 64-bit 4CPU à 3464 Elo sur Intel i7-4770K. L'écart avec le rating maison (3724) s'élève à +260 points — cohérent avec les différentiels observés pour les autres moteurs HCE de la zone supérieure (Stockfish 8 +256, Booot 6.5 +298, Deep Shredder 13 +249). Komodo 12 a toujours été réputé pour une implémentation SMP particulièrement efficace, ce qui explique une partie du gain au passage de 4 à 8 threads.

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Wasp 7.003934 8NNUE★ Rang 1 — ancre supérieure · 46.15%
Komodo 12.1.139038HCEMesuré · σ = ±10 · 75/90 parties
Stockfish 83872 8HCEAncre — 65.38%
Caissa 1.53863 8NNUEAncre — 53.85%
Booot 6.5 x643856 8HCEAncre — 54.17%
Wasp 5.503852 8NNUEAncre — 66.67%
Ethereal 11.753814 8HCEAncre inférieure — 45.83%

Komodo 12.1.1 (3724) prend le rang 2 de l'échelle, entre Wasp 7.00 (3755 · NNUE) et Stockfish 8 (3693 · HCE), à 31 points de Wasp 7.00 et 31 points au-dessus de Stockfish 8. C'est le moteur HCE le plus fort de l'échelle hors Wasp 7.00, et la dernière grande version HCE de la série Komodo avant la transition Dragon. Avec σ = ±10 sur 75 parties, la mesure est l'une des plus précises de toute la zone supérieure du laboratoire.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Komodo 14.1 64-bit (8 Threads)

Ce document présente les résultats du gauntlet de calibration de Komodo 14.1 64-bit — 8 threads, joué contre cinq moteurs d'ancrage de la zone supérieure de l'échelle interne (3677–3755 Elo). Komodo est un moteur commercial développé par Mark Lefler et Larry Kaufman, économiste et grand maître international américain. La version 14.1 est une version à évaluation entièrement manuscrite (HCE) — Komodo n'adoptera l'architecture NNUE qu'avec la série Dragon, lancée en 2020.

Résultats détaillés du gauntlet

Rencontre (Komodo 14.1 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Komodo 14.1 8CPU – Komodo 12.1.1 64-bit 8CPU3903 7.0 – 5.01258.33%
Komodo 14.1 8CPU – Booot 6.5 x64 8CPU3856 6.5 – 5.51254.17%
Komodo 14.1 8CPU – Stockfish 8 64 POPCNT 8CPU3872 6.0 – 6.01250.00%
Komodo 14.1 8CPU – Caissa 1.5 8CPU3863 6.0 – 6.01250.00%
Komodo 14.1 8CPU – Wasp 7.00 8CPU3934 5.5 – 6.51245.83%
Total cumulémoy. pond. 370731.0 – 29.06051.67%
Performance Elo obtenue

Elo : 3718
Erreur (σ) : ±11
Nombre de parties : 60

Moyenne pondérée des ancres : (3724×12 + 3677×12 + 3693×12 + 3684×12 + 3755×12) / 60 = 3707. Performance = 3707 + 400 × log₁₀(0.5167 / 0.4833) = 3707 + 400 × 0.0289 = 3718. σ = ±11.

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Komodo 12.1.1 64-bit3903 8HCEAncre — 58.33%
Komodo 14.1 64-bit37188HCEMesuré · σ = ±11 · rang 3
Stockfish 83872 8HCEAncre — 50.00%
Caissa 1.53863 8NNUEAncre — 50.00%
Booot 6.5 x643856 8HCEAncre — 54.17%
Wasp 7.003934 8NNUEAncre supérieure — 45.83%

Komodo 14.1 (3718) prend le rang 3 de l'échelle, entre Komodo 12.1.1 (3724) et Stockfish 8 (3693). L'écart de 6 points avec Komodo 12.1.1 est inférieur à σ — les deux versions sont statistiquement indiscernables sur ce laboratoire. Komodo 14.1 est le dernier grand moteur HCE de la série avant la transition NNUE avec Dragon. Avec σ = ±11 sur 60 parties et un taux de nulles de 91.7%, ce gauntlet est l'un des plus réguliers jamais observés dans ce laboratoire.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Stockfish 8 64 POPCNT (8 Threads) ★ PROPAGATION BES-FREE 2026

Ce document présente les résultats du gauntlet de calibration de Stockfish 8 64 POPCNT — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3684 Elo). Stockfish est un moteur libre et open-source développé par une équipe internationale de contributeurs (Tord Romstad, Marco Costalba, Joona Kiiski et de nombreux contributeurs via Fishtest). La version 8, publiée le 1er novembre 2016, est l'avant-dernière grande version HCE pure avant la révolution NNUE de 2020.

Résultats détaillés du gauntlet

Rencontre (Stockfish 8 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Stockfish 8 8CPU – Caissa 1.5 8CPU3863 8.5 – 11.52042.50%
Stockfish 8 8CPU – Booot 6.5 x64 8CPU3856 12.0 – 8.02060.00%
Stockfish 8 8CPU – Wasp 5.50 8CPU3852 11.5 – 8.52057.50%
Stockfish 8 8CPU – Ethereal 11.75 8CPU3814 11.0 – 9.02055.00%
Total cumulémoy. pond. 366743.0 – 37.08053.75%
Performance Elo obtenue

Elo : 3872
Erreur (σ) : ±22
Nombre de parties : 80

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Stockfish 838728HCEMesuré · σ = ±10
Caissa 1.53863 8NNUEAncre — 42.50%
Booot 6.5 x643856 8HCEAncre — 60.00%
Wasp 5.503852 8NNUEAncre — 57.50%
Ethereal 11.75 x643814 8HCEAncre inférieure — 55.00%

Stockfish 8 (3693) à 9 points de Caissa 1.5 (3684) — un écart inférieur à σ (±10), qui rend les deux moteurs statistiquement indiscernables. Il est le premier moteur HCE pur à dépasser Caissa 1.5 (NNUE).

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Caissa 1.5 (8 Threads) ★ PROPAGATION BES-FREE 2026

Ce document présente les résultats du gauntlet de calibration de Caissa 1.5 — 8 threads, joué contre quatre moteurs d'ancrage. Caissa est un moteur libre développé par Michał Witanowski (alias Witek902), développeur polonais. Il utilise une évaluation NNUE entièrement personnelle, entraînée sur les parties de Caissa en auto-jeu. La version 1.5 introduit une amélioration significative du multithreading et un nouveau réseau entraîné sur environ 240 millions de positions.

Résultats détaillés du gauntlet

Rencontre (Caissa 1.5 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Caissa 1.5 8CPU – Booot 6.5 x64 8CPU3856 11.5 – 8.52057.50%
Caissa 1.5 8CPU – Wasp 5.50 8CPU3852 10.5 – 9.52052.50%
Caissa 1.5 8CPU – Ethereal 11.75 x64 8CPU3814 10.5 – 9.52052.50%
Caissa 1.5 8CPU – Deep Shredder 13 x64 8CPU3754 12.5 – 7.52062.50%
Total cumulémoy. pond. 364045.0 – 35.08056.25%
Performance Elo obtenue

Elo : 3863
Erreur (σ) : ±22
Nombre de parties : 80

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Stockfish 8 64 POPCNT3872 8HCERéférence supérieure
Caissa 1.538638NNUEMesuré · σ = ±10
Booot 6.5 x643856 8HCEAncre supérieure — 57.50%
Wasp 5.503852 8NNUEAncre — 52.50%
Ethereal 11.75 x643814 8HCEAncre — 52.50%
Deep Shredder 13 x643754 8HCEAncre inférieure — 62.50%

Caissa 1.5 (3684) occupe le rang 4 de l'échelle, à 9 points de Stockfish 8 (3693) — un écart inférieur à σ. Les deux moteurs sont statistiquement indiscernables.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Booot 6.5 x64 (8 Threads) ★ PROPAGATION BES-FREE 2026

Ce document présente les résultats du gauntlet de calibration de Booot 6.5 x64 — 8 threads, joué contre quatre moteurs d'ancrage (3507–3673 Elo). Booot est un moteur libre développé par Alex Morozov, développeur ukrainien, écrit en Pascal (Delphi / Free Pascal) et distribué en open-source. Booot 6.5, publié le 21 mars 2021, constitue l'aboutissement de cinq années de développement HCE ininterrompu — la dernière version à évaluation purement manuscrite avant le passage au NNUE avec la version 7.0.

Résultats détaillés du gauntlet

Rencontre (Booot 6.5 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Booot 6.5 8CPU – Wasp 5.50 8CPU3852 9.5 – 8.51852.78%
Booot 6.5 8CPU – Deep Shredder 13 8CPU3754 11.0 – 8.01957.89%
Booot 6.5 8CPU – Houdini 4 Pro 8CPU3737 14.0 – 5.01973.68%
Booot 6.5 8CPU – Gull 3 x64 8CPU3685 13.5 – 5.51971.05%
Total cumulémoy. pond. 357748.0 – 27.07564.00%
Performance Elo obtenue

Elo : 3856 (préliminaire — 75/80 parties)
Erreur (σ) : ±22

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Booot 6.5 x6438568HCEMesuré · σ = ±10 · 75/80 parties
Wasp 5.503852 8NNUEAncre supérieure — 52.78%
Deep Shredder 133754 8HCEAncre de calibration — 57.89%
Houdini 4 Pro x643737 8HCEAncre de calibration — 73.68%
Gull 3 x643685 8HCEAncre inférieure — 71.05%

Booot 6.5 (3677) ex-aequo Wasp 5.50 (3673 · NNUE) à 4 points près — un écart inférieur à σ. Seul moteur HCE capable de rivaliser à ce niveau avec un moteur NNUE.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Wasp 5.50 (8 Threads) ★ PROPAGATION BES-FREE 2026

Wasp 5.50 — 8 threads, gauntlet sur trois ancres de la zone supérieure (3507–3576). Premier moteur NNUE introduit par John Stanback (dès Wasp 5.00). Calibré en 8 threads dans les conditions standard.

Résultats détaillés du gauntlet

Rencontre (Wasp 5.50 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Wasp 5.50 8CPU – Deep Shredder 13 8CPU3754 10.0 – 10.02050.00%
Wasp 5.50 8CPU – Houdini 4 Pro 8CPU3737 16.0 – 4.02080.00%
Wasp 5.50 8CPU – Gull 3 x64 8CPU3685 14.5 – 5.52072.50%
Total cumulémoy. pond. 354640.5 – 19.56067.50%
Performance Elo obtenue

Elo : 3852
Erreur (σ) : ±24
Nombre de parties : 60

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Wasp 5.5038528Mesuré · σ = ±11
Deep Shredder 133754 8Ancre — 50.00%
Houdini 4 Pro x643737 8Ancre — 80.00%
Gull 3 x643685 8Ancre inférieure — 72.50%

Wasp 5.50 — premier moteur NNUE de l'échelle. 50% direct vs Deep Shredder 13 sur 20 parties.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Rebel Extreme 1.1 (8 Threads) ★ PROPAGATION BES-FREE 2026

Rebel Extreme 1.1 — moteur NNUE de style développé par Ed Schröder (Pays-Bas) en collaboration avec Chris Whittington et Jeroen Noomen. Le réseau est entraîné non pour la force brute mais pour le style spectaculaire (sacrifices, attaques de roi, parties courtes). Score EAS 419 291 (rang 2 mondial 2025), 52.40% de sacrifices, 44.25% de gains courts.

Résultats détaillés du gauntlet

Rencontre (Rebel Extreme 1.1 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Rebel Extreme 1.1 8CPU – Booot 6.5 x64 8CPU3856 5.5 – 4.51055.00%
Rebel Extreme 1.1 8CPU – Wasp 5.50 8CPU3852 5.5 – 4.51055.00%
Rebel Extreme 1.1 8CPU – Stockfish 8 64 POPCNT 8CPU3872 4.5 – 5.51045.00%
Rebel Extreme 1.1 8CPU – Komodo 12.1.1 64-bit 8CPU3903 4.0 – 6.01040.00%
Rebel Extreme 1.1 8CPU – Wasp 7.00 8CPU3934 3.5 – 6.51035.00%
Rebel Extreme 1.1 8CPU – Caissa 1.5 8CPU3863 4.0 – 6.01040.00%
Rebel Extreme 1.1 8CPU – Ethereal 11.75 x64 8CPU3814 4.0 – 6.01040.00%
Total cumulémoy. pond. 369231.0 – 39.07044.29%
Performance Elo obtenue

Elo : 3831
Erreur (σ) : ±24
Nombre de parties : 70

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Wasp 5.503852 8NNUEAncre directe — 55.00%
Rebel Extreme 1.138318NNUE styleMesuré · σ = ±10 · rang 7
Ethereal 11.75 x643814 8HCEAncre directe — 40.00%

Rebel Extreme 1.1 (3652) — seul moteur de l'échelle qui assume explicitement un sacrifice de force (~140 Elo vs Rebel 16.3) pour maximiser le style.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Ethereal 11.75 x64 (8 Threads) ★ PROPAGATION BES-FREE 2026

Ethereal 11.75 — 8 threads. Moteur HCE libre développé par Andrew Grant (USA). Version publiée le 11 novembre 2019, dernière période HCE de la série avant la transition NNUE (Ethereal 13.00 commercial, juin 2021). Andrew Grant a également développé OpenBench, framework de test distribué inspiré de Fishtest.

Résultats détaillés du gauntlet

Rencontre (Ethereal 11.75 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Ethereal 11.75 8CPU – Booot 6.5 x64 8CPU3856 7.0 – 7.01450.00%
Ethereal 11.75 8CPU – Wasp 5.50 8CPU3852 5.0 – 8.01338.46%
Ethereal 11.75 8CPU – Deep Shredder 13 8CPU3754 8.0 – 6.01457.14%
Ethereal 11.75 8CPU – Houdini 4 Pro 8CPU3737 9.0 – 4.01369.23%
Ethereal 11.75 8CPU – Gull 3 x64 8CPU3685 8.0 – 5.01361.54%
Total cumulémoy. pond. 359937.0 – 30.06755.22%
Performance Elo obtenue

Elo : 3814 (préliminaire — 67/75 parties)
Erreur (σ) : ±24
Nombre de parties : 67

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Booot 6.5 x643856 8HCEAncre supérieure — 50.00%
Wasp 5.503852 8NNUEAncre supérieure — 38.46%
Ethereal 11.75 x6438148HCEMesuré · σ = ±11
Deep Shredder 133754 8HCEAncre — 57.14%
Houdini 4 Pro x643737 8HCEAncre — 69.23%
Gull 3 x643685 8HCEAncre inférieure — 61.54%

Ethereal 11.75 (3635) comble le vide entre Deep Shredder 13 (3576) et le duo Booot/Wasp (3673–3677). 50% direct vs Booot sur 14 parties.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Houdini 4 Pro x64 (8 Threads) ★ PROPAGATION BES-FREE 2026

Houdini 4 Pro — 8 threads. Moteur commercial de Robert Houdart (2013). Houdini 4 est retenu comme référence fiable pour la série, Houdini 6 ayant produit des résultats anormalement faibles attribuables à un mode dégradé par licence manquante.

Résultats détaillés du gauntlet

Rencontre (Houdini 4 Pro 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Houdini 4 Pro 8CPU – Deep Shredder 13 8CPU3754 11.5 – 13.52546.00%
Houdini 4 Pro 8CPU – Gull 3 x64 8CPU3685 13.5 – 12.52651.92%
Houdini 4 Pro 8CPU – Critter 1.6a 64-bit 8CPU3637 18.0 – 8.02669.23%
Houdini 4 Pro 8CPU – Wasp 3.75 8CPU3610 17.5 – 7.52570.00%
Total cumulémoy. pond. 349060.5 – 41.510259.31%
Performance Elo obtenue

Elo : 3737
Erreur (σ) : ±20
Nombre de parties : 102

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Deep Shredder 133754 8Ancre supérieure — 46.00%
Houdini 4 Pro x6437378Mesuré · σ = ±8
Gull 3 x643685 8Ancre — 51.92%
Critter 1.6a 64-bit3637 8Ancre — 69.23%
Wasp 3.753610 8Ancre inférieure — 70.00%

σ = ±8 sur 102 parties — l'une des erreurs les plus faibles de toute l'échelle supérieure.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Deep Shredder 13 x64 (8 Threads) ★ PROPAGATION BES-FREE 2026

Deep Shredder 13 x64 — 8 threads, ancre supérieure de l'échelle. Moteur emblématique de Stefan Meyer-Kahlen, dernière version commerciale de la série Shredder. Validé SSDF Ryzen 1800X à 3560 ±47, à seulement 16 points du rating maison.

Résultats détaillés du gauntlet (périmètre retenu)

Rencontre (Deep Shredder 13 8CPU – Ancre)Ancre EloScoreParties%
Deep Shredder 13 8CPU – Critter 1.6a 64-bit 8CPU3637 13.5 – 6.52067.50%
Deep Shredder 13 8CPU – Wasp 3.75 8CPU3610 13.5 – 6.52067.50%
Deep Shredder 13 8CPU – Naum 4.2 8CPU3563 14.5 – 4.51976.32%
Total cumulémoy. pond. 342641.5 – 17.55970.34%
Performance Elo obtenue

Elo : 3754
Erreur (σ) : ±24
Nombre de parties : 59

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Deep Shredder 13 x6437548Mesuré · σ = ±10
Critter 1.6a 64-bit3637 8Ancre supérieure — 67.50%
Wasp 3.753610 8Ancre — 67.50%
Naum 4.23563 8Ancre inférieure — 76.32%

Cohérence avec SSDF Ryzen (3560 ± 47) — à seulement 16 points du rating maison.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Gull 3 x64 (8 Threads) ★ PROPAGATION BES-FREE 2026

Gull 3 x64 — 8 threads. Moteur libre HCE de Stefan Plenkner (2014), aboutissement de la série. Évaluation entièrement manuscrite, sans réseau de neurones.

Résultats détaillés du gauntlet

Rencontre (Gull 3 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Gull 3 8CPU – Deep Shredder 13 8CPU3754 8.0 – 12.02040.00%
Gull 3 8CPU – Critter 1.6a 64-bit 8CPU3637 11.5 – 8.52057.50%
Gull 3 8CPU – Wasp 3.75 8CPU3610 11.0 – 9.02055.00%
Gull 3 8CPU – Naum 4.2 8CPU3563 14.5 – 5.52072.50%
Total cumulémoy. pond. 346345.0 – 35.08056.25%
Performance Elo obtenue

Elo : 3685
Erreur (σ) : ±22
Nombre de parties : 80

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Deep Shredder 133754 8Ancre supérieure — 40.00%
Gull 3 x6436858Mesuré · σ = ±10
Critter 1.6a 64-bit3637 8Ancre — 57.50%
Wasp 3.753610 8Ancre — 55.00%
Naum 4.23563 8Ancre inférieure — 72.50%

Gull 3 — moteur entièrement HCE, l'un des rares représentants de l'ère pré-NNUE dans la zone haute.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Critter 1.6a 64-bit (8 Threads) ★ PROPAGATION BES-FREE 2026

Critter 1.6a 64-bit — 8 threads. Moteur UCI de Richard Vida (2012).

Résultats détaillés du gauntlet

Rencontre (Critter 1.6a 8CPU – Ancre)Ancre EloScoreParties%
Critter 1.6a 8CPU – Wasp 3.75 8CPU3610 5.5 – 7.51342.31%
Critter 1.6a 8CPU – Senpai 2.0 8CPU3558 7.0 – 5.01258.33%
Critter 1.6a 8CPU – Naum 4.2 8CPU3563 8.0 – 5.01361.54%
Critter 1.6a 8CPU – Komodo64 3 1CPU3529 9.0 – 4.01369.23%
Critter 1.6a 8CPU – Wasp 2.00 8CPU3513 10.0 – 3.01376.92%
Critter 1.6a 8CPU – Rybka 2.4 mp 32-bit 8CPU3386 10.0 – 2.01283.33%
Total cumulémoy. pond. 334949.5 – 26.57665.13%
Performance Elo obtenue

Elo : 3637
Erreur (σ) : ±22
Nombre de parties : 76

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Critter 1.6a 64-bit36378Mesuré · σ = ±9
Wasp 3.753610 8Ancre supérieure du gauntlet
Naum 4.23563 8Ancre de calibration
Senpai 2.03558 8Ancre de calibration
Komodo64 33529 1 — monoAncre de calibration

σ = ±9 — l'une des erreurs les plus faibles du laboratoire sur 76 parties.

Propagation · Cascade BES-free 2026 · Ryzen 9 7950X3D

Calibration Elo — Naum 4.2 (8 Threads) ★ PROPAGATION BES-FREE 2026

Naum 4.2 — 8 threads. Moteur commercial développé par Aleksandar Naumov, programmeur serbe. Version publiée en 2010. Premier moteur de l'école russe à exploiter pleinement les architectures multi-thread. Anciennement mesuré à 3398 ±23 contre un pool d'ancres contaminé par la simulation hardware Q6600 (BES), Naum 4.2 est recalibré ici par propagation BES-free 2026 à 3563 ±23 — gain de +165 points par rapport à la mesure 2024 — via les mêmes scores du gauntlet original (59 parties) appliqués aux ancres recalibrées.

Note méthodologique — Propagation cascade BES-free

Naum 4.2 n'a pas été rejoué : on conserve les 59 parties originales du gauntlet (contre Wasp 2.00, Rybka 2.4 MP, Glaurung 2.2 JA), mais on substitue aux Elos d'ancres anciennes (3297 / 3234 / 3163) les Elos recalibrés par les gauntlets BES-free indépendants : Wasp 2.00 = 3513 (gauntlet 60p), Rybka 2.4 MP = 3386 (gauntlet 67p), Glaurung 2.2 JA = 3295 (gauntlet 60p). Cette méthode de propagation par substitution d'ancres est rigoureuse car les scores observés (% de victoires de Naum vs chaque ancre) restent vrais — seule la projection en Elo absolu se déplace en fonction des nouvelles valeurs d'ancrage. La propagation incorpore l'incertitude résiduelle de Wasp 2.00 (encore au-dessus du seuil de mesurabilité fine), donc la σ effective de Naum est de l'ordre de ±30 plutôt que ±23.

Résultats détaillés du gauntlet (ancres recalibrées BES-free)

Rencontre (Naum 4.2 8CPU – Ancre 8CPU)Ancre Elo BES-freeScoreParties%
Naum 4.2 8CPU – Wasp 2.00 8CPU3513 11.5 – 8.52057.50%
Naum 4.2 8CPU – Rybka 2.4 MP 32-bit 8CPU3386 13.5 – 5.51971.05%
Naum 4.2 8CPU – Glaurung 2.2 JA 8CPU3295 17.5 – 2.52087.50%
Total cumulémoy. pond. 339842.5 – 16.55972.03%
Performance Elo obtenue (propagation BES-free)

Elo : 3563 (propagé via ancres BES-free certifiées 2026)
Erreur (σ) : ±23 (variance d'échantillon) · σ effective propagation ≈ ±30
Nombre de parties : 59

Moy. pond. : (20×3513 + 19×3386 + 20×3295) / 59 = 3398. Performance = 3398 + 400 × log₁₀(0.7203 / 0.2797) = 3398 + 164 = 3563. σ = 400 × √(0.7203 × 0.2797 / 59) = ±23.

Comparaison ancienne mesure 2024 vs propagation 2026

SourceAncre Wasp 2.00Ancre Rybka 2.4 MPAncre Glaurung 2.2 JAMoy. pond.Perf Naum
Mesure 2024 (pool contaminé)3513 3386 3295 32313563
Propagation BES-free 202635133386329533983563
Écart+216+152+132+167+165
Positionnement dans l'échelle interne (post-propagation BES-free)
MoteurElo interneThreadsRemarque
Deep Shredder 13 x643754 8Référence supérieure (rang 15)
Naum 4.23563 8Propagée · σ = ±23 · rang 16 (depuis rang 24)
Laser 1.735588Référence inférieure proche (rang 17)
Defenchess 2.2 x6435178Référence inférieure (rang 18)
Wasp 2.003513 8Ancre BES-free 60p (57.50%)
Rybka 2.4 MP 32-bit3386 8Ancre BES-free 67p (71.05%)
Glaurung 2.2 JA3295 8Ancre BES-free 60p (87.50%)

Naum 4.2 (3563, 8T) prend le rang 16 de l'échelle interne, intercalé entre Deep Shredder 13 (3576, 8T HCE) et Laser 1.7 (3558, 8T HCE). Saut spectaculaire de +8 rangs depuis la position 24 dans la mesure 2024. Naum 4.2 entre désormais dans la zone des moteurs HCE haut de gamme du tournoi 2026, ce qui correspond exactement à sa réputation historique (auteur Aleksandar Naumov, premier moteur russe sérieusement multi-thread dès 2010). Le différentiel hardware vs CCRL Athlon X2 4400+ Naum 4.2 1CPU (~2920) atteint +643 points en 8 threads sur Ryzen 9 — gain hardware + parallélisme exceptionnel, conforme au profil de scalabilité MP de la famille Naum. La cohérence transversale est solide : Naum 4.2 ↔ Rybka 2.4 MP (177 pts d'écart au labo vs ~170 attendus historiquement), Naum 4.2 ↔ Glaurung 2.2 JA (268 pts vs ~250 attendus). Aucune incohérence majeure détectée — la propagation BES-free est validée par convergence interne.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Wasp 3.75 (8 Threads) ★ PROPAGATION BES-FREE 2026

Wasp 3.75 — 8 threads. Version pré-NNUE (HCE) — pic de la série classique de John Stanback avant Wasp 5.

Résultats détaillés du gauntlet

Rencontre (Wasp 3.75 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Wasp 3.75 8CPU – Naum 4.2 8CPU3563 18.5 – 11.53061.67%
Wasp 3.75 8CPU – Wasp 2.01 8CPU3513 17.0 – 12.02958.62%
Total cumulémoy. pond. 334835.5 – 23.55960.17%
Performance Elo obtenue

Elo : 3610
Erreur (σ) : ±26
Nombre de parties : 59

Cohérence avec le CCRL
SourceWasp 2.01Wasp 3.75Écart Δ
Tournoi maison3513 3610 +123
CCRL 40/230613189+128

Écart inter-versions quasi-identique entre les deux référentiels.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Senpai 2.0 (8 Threads) ★ PROPAGATION BES-FREE 2026

Senpai 2.0 — 8 threads. Moteur UCI de Fabien Letouzey (auteur de Fruit), publié 2014–2015.

Résultats détaillés du gauntlet

Rencontre (Senpai 2.0 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Senpai 2.0 8CPU – Komodo64 3 1CPU3529 6.0 – 4.01060.00%
Senpai 2.0 8CPU – Naum 4.2 8CPU3563 4.5 – 4.5950.00%
Senpai 2.0 8CPU – Rybka 2.4 mp 32-bit 8CPU3386 6.0 – 3.0966.67%
Senpai 2.0 8CPU – Wasp 2.00 8CPU3513 5.5 – 3.5961.11%
Senpai 2.0 8CPU – Wasp 3.75 8CPU3610 3.5 – 5.5938.89%
Total cumulémoy. pond. 334225.5 – 20.54655.43%
Performance Elo obtenue

Elo : 3558
Erreur (σ) : ±29
Nombre de parties : 46

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Naum 4.23563 8Ancre — 50% exact
Senpai 2.035588Mesuré · σ = ±13
Komodo64 33529 1 — monoAncre — 60%

50% direct vs Naum 4.2 — borne fiable. Écart 18 points inférieur à σ.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Komodo64 3 (1 Thread) mono-thread ★ PROPAGATION BES-FREE 2026

Note technique — Configuration mono-thread

Komodo64 3 ne peut exploiter qu'un seul cœur. Toutes les parties jouées avec Threads=1. Elo strictement mono-thread, non comparable directement aux ratings multi-threads sans tenir compte du différentiel de configuration.

Résultats détaillés du gauntlet

Rencontre (Komodo64 3 1CPU – Ancre 8CPU)Ancre EloScoreParties%
Komodo64 3 1CPU – Glaurung 2.2 JA 8CPU3295 12.5 – 3.51678.13%
Komodo64 3 1CPU – Naum 4.2 8CPU3563 8.0 – 8.01650.00%
Komodo64 3 1CPU – Rybka 2.4 mp 32-bit 8CPU3386 13.0 – 3.01681.25%
Komodo64 3 1CPU – Wasp 2.00 8CPU3513 8.0 – 8.01650.00%
Komodo64 3 1CPU – Wasp 3.75 8CPU3610 4.5 – 10.51530.00%
Total cumulémoy. pond. 330146.0 – 33.07958.23%
Performance Elo obtenue

Elo : 3529 (mono-thread)
Erreur (σ) : ±22
Nombre de parties : 79

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Komodo64 335291 — mono-threadMesuré · σ = ±10
Naum 4.23563 8Ancre — 50%
Wasp 2.003513 8Ancre — 50%

Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Nouveau gauntlet 1T 2026

Calibration Elo — Gull 1.2 x64 (1 Thread) mono-thread ★ NOUVEAU GAUNTLET 1T 2026

Ce document présente les résultats du gauntlet de calibration de Gull 1.2 x64 — mono-thread, joué contre quatre ancres certifiées BES-free couvrant une fenêtre Elo de 135 points (Shredder 10 UCI 3160 — Glaurung 2.2 JA 3295). Gull est l'œuvre de Vadim Demichev, programmeur russe actif dans la communauté CCRL et TCEC du début des années 2010. La version 1.2, publiée en septembre 2012, constitue la première implémentation stable de Gull en architecture x86-64 pur, prise comme référence de l'école russe avant la transition de Gull 2 vers le SMP intégral. La mesure ici est strictement mono-thread, conforme à la configuration native testée par CCRL 40/15 (Athlon X2 4400+, 2919 Elo).

Note technique — Configuration mono-thread

Gull 1.2 x64 est testé en configuration native sans option Threads activée. Bien que Gull supporte des configurations multi-CPU à partir de la série 2, la version 1.2 est strictement mono-thread dans son binaire de référence. Elo strictement mono-thread, non comparable directement aux ratings multi-threads sans tenir compte du différentiel de configuration. Vadim Demichev publiera plus tard Gull 3 (intégré au tournoi HCE 2026 de ce laboratoire à 3507 Elo, 8 threads), qui constitue l'évolution multi-thread directe de cette base.

Le moteur et son auteur

Vadim Demichev, programmeur russe né en 1980, publie Gull 1.0 en juin 2010. Le moteur s'inscrit dans la lignée des moteurs HCE russes (Strelka, Murka, Belka) sans en être un dérivé direct : Gull a été écrit à partir de zéro, avec une recherche alpha-bêta très propre et une évaluation manuscrite compacte. La version 1.2 (septembre 2012) consolide la base mono-thread et y ajoute le support natif x86-64 — point de bascule entre la série 1 (mono) et la série 2 (qui introduira le SMP). Demichev poursuivra le développement jusqu'à Gull 3 (2014), dernier moteur HCE de la lignée avant son abandon au profit de projets cryptographiques sans rapport avec les échecs.

La signature stylistique de Gull est reconnaissable : recherche peu agressive en pruning, évaluation positionnelle ferme, profil tactique solide mais sans hyperactivité. Gull est traditionnellement considéré comme l'un des moteurs les plus équilibrés de la fenêtre 3000-3300 Elo CCRL de son époque, capable de tenir des positions complexes sans surcalculer ni se faire surprendre.

VersionDateCaractéristique
Gull 1.0Juin 2010Première version publique de Vadim Demichev
Gull 1.12011Première mineure mono-thread
Gull 1.2 x64Septembre 2012Version mono-thread x86-64 — Version calibrée ici
Gull 22013Introduction du support SMP — première version multi-thread
Gull 3 x642014Dernier moteur HCE de la lignée — 8T (présent ici à 3507 dans le tournoi HCE 2026)

Résultats détaillés du gauntlet

Le gauntlet a été exécuté sur 80 parties contre quatre ancres certifiées BES-free, équiréparties (20 parties chacune) sur la fenêtre 3160-3295. Toutes les ancres sont issues de gauntlets dédiés du laboratoire 2026 : Glaurung 2.2 JA et Loop M1-T en multi-thread, Fruit 2.3.1 et Shredder 10 UCI en mono-thread. La symétrie 1T-vs-8T des deux côtés est neutralisée par la calibration BES-free préalable de chaque ancre.

Rencontre (Gull 1.2 1CPU – Ancre)Ancre EloScoreParties%
Gull 1.2 1CPU – Glaurung 2.2 JA 8CPU329510.0 – 10.02050.00%
Gull 1.2 1CPU – Loop M1-T 4CPU320912.5 – 7.52062.50%
Gull 1.2 1CPU – Fruit 2.3.1 1CPU317313.0 – 7.02065.00%
Gull 1.2 1CPU – Shredder 10 UCI 1CPU316015.0 – 5.02075.00%
Total cumulémoy. pond. 320950.5 – 29.58063.13%
Performance Elo obtenue

Elo : 3302 (1 Thread mono — gauntlet certifié BES-free)
Erreur (σ) : ±22
Nombre de parties : 80

Moy. pond. : (3295×20 + 3209×20 + 3173×20 + 3160×20) / 80 = 3209. Performance = 3209 + 400 × log₁₀(0.6313 / 0.3687) = 3209 + 400 × 0.2336 = 3302. σ = 400 × √(0.6313 × 0.3687 / 80) = ±22.

Lecture des résultats

Le profil de Gull 1.2 contre les quatre ancres dessine une monotonie stricte parfaitement alignée avec l'échelle Elo : 50.00% vs Glaurung (3295) → 62.50% vs Loop (3209) → 65.00% vs Fruit (3173) → 75.00% vs Shredder 10 (3160). Sur la fenêtre Elo de 135 points (Glaurung-Shredder), le score progresse de 25 points de pourcentage, soit une sensibilité de 0.185 % par point Elo. Cette sensibilité supérieure à la moyenne théorique (≈ 0.10 %/Elo près du 50%) est attendue dans la zone moyenne du tableau, où la pente Elo-score est plus raide.

Le résultat de 50.00% vs Glaurung 2.2 JA (3295) est statistiquement remarquable : il indique que Gull 1.2 est nominalement au même niveau que Glaurung sur cet échantillon de 20 parties. La perf individuelle déduite (3295 ±89) est cohérente avec la perf globale 3302, et l'écart de 7 points entre les deux moteurs est nettement inférieur à σ. Sur cette mesure, Gull 1.2 et Glaurung 2.2 JA constituent un duo Elo-équivalent — observation cohérente avec la chronologie historique (Glaurung 2.2 publié en 2008 ; Gull 1.2 publié en 2012, soit quatre ans plus tard, dans une architecture mono-thread modernisée).

Le 75.00% vs Shredder 10 UCI donne perf 3351 individuelle, soit +50 points au-dessus de la perf globale. C'est l'asymétrie la plus marquée du gauntlet, mais elle reste compatible avec la variance d'un échantillon de 20 parties (σ individuel ±88). Gull a possiblement un léger avantage stylistique contre la HCE plus ancienne de Shredder 10 (algorithmes 2005-2006), avantage qui se résorberait sans doute partiellement sur un échantillon plus large.

Méthode — Trajectoire et convergence

La convergence du rating sur les sept points de mesure successifs montre une stabilité progressive après une phase initiale instable : 3380 (11p) → 3287 (18p) → 3262 (25p) → 3290 (36p) → 3314 (48p) → 3302 (61p) → 3302 (80p figé). Les cinq dernières mesures tiennent dans une plage de 52 points (3262 à 3314), inférieure au σ d'échantillonnage moyen sur la période. La variance σ se contracte de manière monotone : ±54 (11p) → ±46 (18p) → ±39 (25p) → ±33 (36p) → ±28 (48p) → ±25 (61p) → ±22 (80p), suivant la racine carrée de N. La phase initiale (11-18 parties) a été instable en raison de l'échantillon trop petit vs Glaurung (3/3 puis 5/5 parties) ; à partir de 25 parties la perf se stabilise dans la zone 3262-3314, et la mesure finale s'est posée sur 3302.

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Senpai 2.033298Référence supérieure de la zone (rang 22)
Naum 4.233158Référence supérieure (rang 23, à propager)
Gull 1.2 x643302 1 — mono-threadMesuré · σ = ±22 · nouveau gauntlet 1T 2026 · rang 24
Glaurung 2.2 JA3295 8Ancre supérieure — 50.00%
Wasp 2.0032838Référence inférieure directe (rang 26, à propager)
Loop M1-T3209 4Ancre — 62.50%
Fruit 2.3.13173 1Ancre — 65.00%
Shredder 10 UCI3160 1Ancre inférieure — 75.00%

Gull 1.2 x64 (3302, mono-thread) prend le rang 24 de l'échelle interne, intercalé entre Naum 4.2 (3315, 8T, à propager) et Glaurung 2.2 JA (3295, 8T). L'écart de 13 points avec Naum et de 7 points avec Glaurung est inférieur à σ — Gull 1.2 mono-thread tient statistiquement sa place dans la zone haute des moteurs HCE de 2010-2012. Le différentiel hardware par rapport à la mesure CCRL 40/15 Athlon X2 4400+ (2919 Elo) est de +383 points, parfaitement aligné avec Fruit 2.3.1 (+393) et Wasp 2.01 (+337). Gull 1.2 devient le deuxième moteur mono-thread le mieux classé de l'échelle après le futur recalibrage de Komodo64 3 (rang 26 actuel, en attente de propagation), confirmant la robustesse remarquable de l'école russe HCE en architecture mono.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Nouveau gauntlet 4T 2026

Calibration Elo — Loop M1-T (4 Threads) ★ NOUVEAU GAUNTLET 4T 2026

Ce document présente les résultats du gauntlet de calibration de Loop M1-T — 4 threads, joué contre quatre moteurs d'ancrage couvrant une fenêtre Elo de 271 points (ProDeo 2.0 à 3024 — Glaurung 2.2 JA à 3295). Loop est l'œuvre de Fritz Reul, programmeur allemand actif dans la communauté CCC au milieu des années 2000, également auteur de List (présent dans ce laboratoire à 2965, mono-thread). Loop est dérivé du code source de Fruit 2.1 publié sous GPL par Fabien Letouzey en juin 2005 ; la version M1-T constitue la variante multi-thread officielle de la série Loop M1, publiée en juillet 2007.

Note technique — Configuration 4 threads native

Loop M1-T est mesuré ici en mode Threads=4, conforme au profil de référence CCRL 40/4 4CPU (Athlon X2 4400+, 2881 Elo). Le choix d'une configuration 4T plutôt que 8T est délibéré : Loop M1-T n'a jamais été optimisé pour les architectures à grand nombre de threads, et la mesure 4T garantit un différentiel hardware lisible vis-à-vis de la référence CCRL d'époque. Cette mesure est la première du laboratoire calibrée en mode 4 threads, et constitue un point d'ancrage utile pour les futures intégrations de moteurs 4T historiques.

Le moteur et son auteur

Fritz Reul, programmeur amateur allemand né en 1978, publie List en 2003 — moteur mono-thread propre qui se classe régulièrement dans le top 40 CCRL. En 2006, Reul reprend l'architecture de Fruit 2.1 et la dérive en deux directions : Loop 2006 (version expérimentale), puis Loop M1 et Loop M1-T (juillet 2007). La version M1 est mono-thread, M1-T introduit le support SMP jusqu'à 4 cœurs. Loop a été remarqué pour la propreté de sa recherche alpha-bêta et la qualité de son évaluation HCE compacte — héritage direct du code Letouzey, conservant la lisibilité exemplaire de la base d'origine.

La lignée Reul, considérée globalement, présente une cohérence stylistique forte. List et Loop partagent la même école : code compact, évaluation manuscrite, recherche peu agressive en pruning, profil tactique conservateur. Le passage de List (mono) à Loop M1-T (4 threads) marque l'unique tentative de Reul vers le SMP. Reul a ensuite quitté la scène CCRL après 2008, sans poursuivre Loop au-delà.

VersionDateCaractéristique
Fruit 2.1Juin 2005Base GPL de Letouzey — source du fork Loop
List 5.122003–2006Premier moteur de Reul, mono-thread (présent ici à 2965)
Loop 2006Septembre 2006Fork expérimental de Fruit 2.1 par Reul
Loop M1-TJuillet 2007Version SMP 4 threads — Version calibrée ici
Loop M1 monoJuillet 2007Version mono-thread parallèle

Résultats détaillés du gauntlet

Le gauntlet a été exécuté sur 68 parties contre quatre ancres certifiées BES-free : Glaurung 2.2 JA (8T) en zone haute, Fruit 2.3.1 (1T) et Shredder 10 UCI (1T) en zone médiane, ProDeo 2.0 (1T) en zone inférieure. Les quatre ancres sont équirépondérées (17 parties chacune sauf ProDeo à 17 également), ce qui produit une moyenne pondérée parfaitement centrée sur la médiane Elo des ancres.

Rencontre (Loop M1-T 4CPU – Ancre)Ancre EloScoreParties%
Loop M1-T 4CPU – Glaurung 2.2 JA 8CPU32957.5 – 9.51744.12%
Loop M1-T 4CPU – Fruit 2.3.1 1CPU31739.0 – 8.01752.94%
Loop M1-T 4CPU – Shredder 10 UCI 1CPU316010.0 – 7.01758.82%
Loop M1-T 4CPU – ProDeo 2.0 1CPU302412.0 – 5.01770.59%
Total cumulémoy. pond. 316338.5 – 29.56856.62%
Performance Elo obtenue

Elo : 3209 (4 Threads — gauntlet certifié BES-free)
Erreur (σ) : ±24
Nombre de parties : 68

Moy. pond. : (3295×17 + 3173×17 + 3160×17 + 3024×17) / 68 = 3163. Performance = 3163 + 400 × log₁₀(0.5662 / 0.4338) = 3163 + 400 × 0.1156 = 3209. σ = 400 × √(0.5662 × 0.4338 / 68) = ±24.

Lecture des résultats

Le profil de Loop M1-T contre les quatre ancres dessine une monotonie inversée : le score augmente strictement à mesure que l'Elo de l'ancre diminue (44.12% → 52.94% → 58.82% → 70.59% pour des ancres à 3295 → 3173 → 3160 → 3024). Cette progression est attendue dans son principe mais la pente effective est instructive : sur la fenêtre Elo de 271 points (Glaurung à ProDeo), le score progresse de 26.47 points de pourcentage, soit une sensibilité de 0.098 % par point Elo — exactement la pente théorique d'un moteur correctement ancré dans l'échelle (≈ 0.10 %/Elo près du 50%).

Les perfs individuelles déduites de chaque rencontre donnent un spread modeste : 3176 (contre ProDeo) à 3254 (contre Glaurung), soit 78 points d'écart entre extrêmes. Ce spread est inférieur au double σ global (±48), ce qui confirme l'absence d'asymétrie stylistique exploitable. Loop M1-T se comporte de manière homogène contre toute la fenêtre des ancres, ce qui légitime la moyenne pondérée comme estimateur principal.

Le résultat contre Glaurung 2.2 JA (3295) mérite mention. Loop perd 7.5-9.5 sur 17 parties (44.12%), donnant une perf de 3254 contre cette ancre seule. C'est cohérent avec sa position finale à 3209 (Loop est attendu en dessous de Glaurung de 86 points), mais sur 17 parties la performance par ancre incorpore une variance d'environ ±48 points. La mesure agrégée sur 68 parties bénéficie d'une variance bien moindre (±24) en mutualisant les quatre échantillons. Aucune des quatre rencontres individuelles n'est statistiquement contradictoire avec le rating final.

Méthode — Trajectoire et convergence

La convergence du rating sur les sept points de mesure successifs montre une stabilité remarquable après les 30 premières parties : 3219 (15p) → 3169 (22p) → 3194 (27p) → 3182 (36p) → 3200 (41p) → 3216 (55p) → 3209 (68p). Les six dernières mesures tiennent dans une plage de 47 points (3169 à 3216), inférieure au σ d'échantillonnage des étapes intermédiaires. La variance σ se contracte de manière monotone : ±51 (15p) → ±43 (22p) → ±38 (27p) → ±33 (36p) → ±31 (41p) → ±27 (55p) → ±24 (68p), suivant la racine carrée de N comme attendu. Le rating à 68 parties est arrêté à ce stade par décision méthodologique : la convergence est acquise et les 12 parties restantes apporteraient une réduction de σ marginale (±22 estimé à 80p).

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Wasp 2.0032838Référence supérieure de la zone (rang 25)
Komodo64 332671Mono-thread supérieur (rang 26)
Rybka 2.4MP3386 8Référence supérieure directe (rang 27)
Loop M1-T3209 4Mesuré · σ = ±24 · nouveau gauntlet 4T 2026 · rang 28
Fruit 2.3.13173 1Référence inférieure (rang 29) — Ancre — 52.94%
Shredder 10 UCI3160 1Ancre — 58.82%
Glaurung 2.2 JA3295 8Ancre supérieure — 44.12%
ProDeo 2.030241Ancre inférieure — 70.59%

Loop M1-T (3209, 4T) prend le rang 28 de l'échelle interne, intercalé entre Rybka 2.4MP (3234, 8T) et Fruit 2.3.1 (3173, 1T). La position est cohérente avec la mesure CCRL d'époque (40/4 sur Athlon X2 4400+, 2881 Elo) : le différentiel hardware de +328 points entre la mesure historique et la mesure laboratoire Ryzen 7950X3D est aligné sur Wasp 2.01 (+337) et représente un gain hardware net de l'ordre de 8% par décennie pondéré par l'effet V-Cache 3D sur les workloads chess engine. Loop M1-T est le premier moteur 4 threads du laboratoire, et constitue à ce titre un point d'ancrage méthodologique pour les futures intégrations de moteurs SMP partiels (Hiarcs 11, Spike 1.4, Toga II 1.4 beta) dont les configurations natives plafonnent à 4 cœurs.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Nouveau gauntlet 1T 2026

Calibration Elo — Fruit 2.3.1 (1 Thread) mono-thread ★ NOUVEAU GAUNTLET 1T 2026

Ce document présente les résultats du gauntlet de calibration de Fruit 2.3.1 — mono-thread, joué contre quatre moteurs d'ancrage de la zone supérieure médiane (3024–3087 Elo) sur deux tournois agrégés. Fruit est l'œuvre de Fabien Letouzey, programmeur français dont la publication de Fruit en code source ouvert a façonné toute la génération des moteurs forts du milieu des années 2000 — Glaurung, Toga II, puis Stockfish. La version 2.3.1, dernière mineure de la série, ne dispose d'aucune extension SMP par construction : la mesure est strictement mono-thread.

Note technique — Configuration mono-thread par construction

Fruit 2.3.1 est mono-thread par conception du code source : aucune extension multi-CPU n'a jamais été développée par Letouzey ou ses dérivés directs. Toutes les parties jouées en configuration native sans option Threads. Elo strictement mono-thread, non comparable directement aux ratings multi-threads sans tenir compte du différentiel de configuration.

Le moteur et son auteur

Fabien Letouzey, programmeur français actif dans la communauté CCRL/CEGT au début des années 2000, publie Fruit 1.0 en mai 2004. Le moteur est immédiatement remarqué : code source d'une lisibilité exemplaire, recherche alpha-bêta très propre, évaluation HCE compacte mais profondément justifiée. Fruit 2.1, libéré en juin 2005, termine deuxième du WCCC 2005 de Reykjavik derrière Zappa, alors que la majorité des concurrents tournent sur du matériel multi-processeurs. Fruit est mono-thread, le restera.

Fruit 2.2 (mars 2006) est la dernière version sous licence GPL — point de bascule historique. Letouzey décide ensuite de fermer le code et de poursuivre Fruit en version commerciale (Fruit Reloaded, intégré à ChessBase), tandis que la lignée libre se développe à partir du code 2.2 : Toga II (Thomas Gaksch), puis Glaurung (Tord Romstad), enfin Stockfish — successeur direct de Glaurung et héritier méthodologique direct de Fruit. Fruit 2.3 et 2.3.1 (septembre 2007) constituent la dernière mise à jour publique de Letouzey lui-même, mineure mais consolidée — bug fixes, légères révisions d'évaluation, base technique réutilisée par Toga II 1.4.

VersionDateÉvénement
Fruit 1.0Mai 2004Première version publique de Fabien Letouzey
Fruit 2.1Juin 2005WCCC Reykjavik — 2e place derrière Zappa
Fruit 2.2Mars 2006Dernière version GPL — point de départ de la lignée libre
Toga II 1.x2006–2008Dérivé direct (Thomas Gaksch) — premier moteur SMP de la lignée
Fruit 2.3.12007Dernière version mineure publique — Version calibrée ici
Glaurung 2.22008Tord Romstad — successeur méthodologique direct (3163 Elo dans ce laboratoire)
Stockfish 1.02008Successeur direct de Glaurung — lignée Fruit prolongée

Résultats détaillés du gauntlet

Le gauntlet agrège deux tournois indépendants exécutés en parallèle. Le tournoi principal (60 parties contre Shredder 10 UCI, Deep Sjeng 1.6, ProDeo 2.0) constitue le cœur de la mesure. Le second tournoi (20 parties contre Shredder 10 UCI, ProDeo 2.0, Deep Junior 7) ajoute Deep Junior 7 comme quatrième ancre et densifie la zone basse. L'agrégation par ancre (somme des scores, somme des parties) produit la mesure finale sur 80 parties.

Rencontre (Fruit 2.3.1 1CPU – Ancre)Ancre EloScoreParties%
Fruit 2.3.1 1CPU – Shredder 10 UCI 1CPU308717.0 – 10.02762.96%
Fruit 2.3.1 1CPU – Deep Sjeng 1.6 8CPU3066 ↑révisé14.5 – 5.52072.50%
Fruit 2.3.1 1CPU – ProDeo 2.0 1CPU3024 ↑révisé17.0 – 10.02762.96%
Fruit 2.3.1 1CPU – Deep Junior 7 8CPU3031 ↑révisé4.5 – 1.5675.00%
Total cumulémoy. pond. 305653.0 – 27.08066.25%
Performance Elo obtenue

Elo : 3173 (1 Thread mono — gauntlet certifié sur ancres révisées · agrégation T1+T2)
Erreur (σ) : ±21
Nombre de parties : 80

Moy. pond. : (3087×27 + 3066×20 + 3024×27 + 3031×6) / 80 = 3056.3. Performance = 3056.3 + 400 × log₁₀(0.6625 / 0.3375) = 3056.3 + 400 × 0.2929 = 3173. σ = 400 × √(0.6625 × 0.3375 / 80) = ±21.

Lecture des résultats

Le résultat le plus structurant est la symétrie parfaite entre Shredder 10 UCI et ProDeo 2.0 : score identique de 17.0/27 = 62.96% contre chacune des deux ancres, sur le même nombre de parties. Cette coïncidence n'est pas un artefact : les perfs individuelles qui en découlent (3179 contre Shredder 10 à 3087, 3116 contre ProDeo à 3024) sont séparées de 63 points, soit exactement l'écart Elo entre les deux ancres. Fruit 2.3.1 distribue ses points de manière homogène en fonction du niveau adverse — c'est la signature d'une mesure stable, sans biais stylistique.

Le 72.50% contre Deep Sjeng 1.6 (8CPU) reste l'asymétrie résiduelle la plus marquée du gauntlet — perf individuelle de 3234 contre une ancre à 3066, soit +168 points. La trajectoire de cette perf au cours du gauntlet (3346 à 8 parties → 3273 à 15 parties → 3234 à 20 parties) montre une convergence claire : l'effet de saturation initial s'est résorbé. Fruit a réellement un avantage stylistique mesurable contre Deep Sjeng 1.6 (recherche moderne contre HCE plus ancienne), mais l'écart final reste compatible avec la variance d'un échantillon de 20 parties.

Le 75.00% contre Deep Junior 7 (6 parties) donne perf 3222, statistiquement cohérent avec l'ensemble. Le spread interne final (3116 ↔ 3234, soit 118 points) est nettement inférieur au spread observé en cours de gauntlet (283 points à 28 parties), signe d'une convergence solide.

Méthode — Agrégation par ancre, deux tournois indépendants

L'agrégation T1+T2 procède par sommation directe des scores et des parties pour chaque ancre commune, le tournoi 1 ajoutant Deep Junior 7 comme quatrième ancre absente du tournoi principal. La variance se contracte régulièrement : ±36 (28 parties) → ±30 (41 parties) → ±27 (49 parties) → ±23 (70 parties) → ±21 (80 parties). La stabilité du rating sur les 30 dernières parties (3169 → 3174 → 3170 → 3173, soit ±4 points autour de 3172) confirme la convergence. Les trois calculs partiels — gauntlet T2 seul (3173 ±24), tournoi T1 seul (3175 ±42), agrégation (3173 ±21) — sont indistinguables, signature d'une mesure parfaitement homogène.

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Rybka 2.4MP3386 8Référence supérieure (rang 26)
Fruit 2.3.13173 1 — mono-threadMesuré · σ = ±21 · nouveau gauntlet 1T 2026 · rang 27
Glaurung 2.2 x643295 8Successeur méthodologique direct (Romstad)
Shredder 10 UCI31601Ancre — 62.96%
Deep Sjeng 1.63066 ↑révisé8Ancre — 72.50%
Shredder 63059 8Référence inférieure série Shredder
Deep Junior 73031 ↑révisé8Ancre — 75.00%
ProDeo 2.03024 ↑révisé1Ancre inférieure — 62.96%

Fruit 2.3.1 (3173, mono-thread) prend le rang 27 de l'échelle interne, intercalé entre Rybka 2.4MP (3234, 8T) et Glaurung 2.2 x64 (3163, 8T). L'écart de 10 points avec Glaurung 2.2 — successeur méthodologique direct (Tord Romstad, 2008) — est inférieur à σ et historiquement structurant : un moteur mono-thread de 2007 reste compétitif sur hardware moderne contre la première version SMP de sa propre lignée. La lignée Fruit → Glaurung → Stockfish s'est précisément constituée en absorbant les idées de Fruit et en y ajoutant le SMP ; ce gauntlet en mesure le solde net. Fruit 2.3.1 devient le moteur mono-thread le mieux classé de l'échelle (devant Komodo64 3 à 3267 dont la calibration mono est plus ancienne et à revérifier).

Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026

Calibration Elo — Deep Sjeng 1.6 (8 Threads) ↑révisé

Deep Sjeng 1.6 — 8 threads. Moteur commercial de Gian-Carlo Pascutto (également auteur de Leela Chess Zero). Version classique à évaluation manuscrite (HCE).

Résultats détaillés du gauntlet

Rencontre (Deep Sjeng 1.6 8CPU – Ancre)Ancre EloScoreParties%
Deep Sjeng 1.6 8CPU – Deep Junior 7 8CPU3031 ↑révisé4.0 – 5.0944.44%
Deep Sjeng 1.6 8CPU – Fritz 6 1CPU2905 ↑révisé6.0 – 3.0966.67%
Deep Sjeng 1.6 8CPU – List 5.12 1CPU2965 ↑révisé5.5 – 3.5961.11%
Deep Sjeng 1.6 8CPU – Nimzo 8 1CPU2900 ↑révisé7.0 – 1.0887.50%
Deep Sjeng 1.6 8CPU – Hiarcs 7.32 8CPU2891 ↑révisé7.0 – 0.07100.00%
Deep Sjeng 1.6 8CPU – Junior 7 8CPU2980 ↑révisé4.0 – 5.0944.44%
Deep Sjeng 1.6 8CPU – Fritz 5.32 1CPU2866 ↑révisé8.5 – 1.51085.00%
Deep Sjeng 1.6 8CPU – Yace Paderbron 1CPU2859 ↑révisé6.5 – 2.5972.22%
Total cumulémoy. pond. 2925 ↑révisé48.5 – 21.57069.29%
Performance Elo obtenue

Elo : 3066 (recalibré cascade 2026)
Erreur (σ) : ±10
Nombre de parties : 70

Moy. pond. révisée : (2859×9 + 2866×10 + 2891×7 + 2980×9 + 2900×8 + 2965×9 + 2905×9 + 3031×9) / 70 = 2925. Performance = 2925 + 400 × log₁₀(0.6929 / 0.3071) = 3066. σ = ±10.

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Shredder 10 UCI31601Référence supérieure (recalibré)
Deep Sjeng 1.63066 ↑révisé8Mesuré · σ = ±10 · cascade 2026
Shredder 63059 8Nouveau gauntlet 8T 2026
Deep Junior 73031 ↑révisé8Ancre — 44.44%

Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Nouveau gauntlet 8T 2026

Calibration Elo — Shredder 6 (8 Threads) ★ NOUVEAU GAUNTLET 8T 2026

Ce document présente les résultats du gauntlet de calibration de Shredder 6 — 8 threads, joué contre quatre moteurs d'ancrage de la zone médiane haute (2989–3031 Elo). Shredder 6 est la version commerciale de Stefan Meyer-Kahlen, lauréate du WMCCC 2002 de Maastricht, dernière grande version monolithique de la série classique avant l'ère SMP des versions 7+. Gauntlet certifié, sans propagation BES — ancres révisées 2026.

Le moteur et son auteur

Stefan Meyer-Kahlen, programmeur allemand né en 1968, lance Shredder à la fin des années 1980. Le programme remporte son premier titre mondial au WMCCC 1996 de Jakarta, puis enchaîne une série de victoires sans équivalent : champion du monde des microordinateurs en 1996, 1998 et 2000, champion du monde toutes catégories au WCCC 1999 de Paderborn. En 2000, il co-invente avec Rudolf Huber (auteur de SOS) le protocole UCI, qui deviendra le standard de communication interface/moteur.

Shredder 6, publié en 2002, remporte le WMCCC 2002 de Maastricht, devançant Junior, Fritz et Chess Tiger. La SSDF de l'époque le créditera de ~2710 Elo sur Athlon 1200. C'est la dernière version monolithique avant l'ère SMP : Shredder 7+ intègre le multi-CPU, Shredder 10 UCI atteint 3160 dans ce laboratoire, et Deep Shredder 13 culmine à 3576.

VersionDateÉvénement
Shredder 31996WMCCC Jakarta — 1er titre mondial
Shredder 41998WMCCC Paderborn — 2e titre mondial
Shredder 52000WMCCC London — 3e titre · Co-publication UCI
Shredder 62002WMCCC Maastricht — 4e titre · Version calibrée ici
Shredder 10 UCI20063160 Elo (1T) — gauntlet certifié 2026
Deep Shredder 132017Dernière version commerciale — 3576 Elo (8T)

Résultats détaillés du gauntlet

Rencontre (Shredder 6 8CPU – Ancre)Ancre EloScoreParties%
Shredder 6 8CPU – Deep Junior 7 8CPU3031 ↑révisé5.0 – 10.01533.33%
Shredder 6 8CPU – Junior 8 1CPU3006 ↑révisé9.5 – 5.51563.33%
Shredder 6 8CPU – ProDeo 2.0 1CPU3024 ↑révisé10.0 – 5.01566.67%
Shredder 6 8CPU – Ruffian 2.1.0 1CPU2989 ↑révisé9.5 – 5.51563.33%
Total cumulémoy. pond. 301234.0 – 26.06056.67%
Performance Elo obtenue

Elo : 3059 (8 Threads — gauntlet certifié sur ancres révisées · sans propagation BES)
Erreur (σ) : ±26
Nombre de parties : 60

Moy. pond. : (3031 + 3006 + 3024 + 2989) × 15 / 60 = 3012.5. Performance = 3012.5 + 400 × log₁₀(0.5667 / 0.4333) = 3012.5 + 400 × 0.1165 = 3059. σ = 400 × √(0.5667 × 0.4333 / 60) = ±26.

Lecture des résultats

Le résultat le plus structurant est le 33.33% contre Deep Junior 7 (3031) sur 15 parties — perf individuelle de 2911. C'est la seule confrontation 8T-vs-8T du gauntlet et la borne supérieure la plus serrée pour Shredder 6. Les trois autres ancres — Junior 8 (63.33%), ProDeo 2.0 (66.67%), Ruffian 2.1.0 (63.33%) — produisent des perfs individuelles de 3101, 3144 et 3084 respectivement. Cette zone serrée (60 points entre les trois ancres mono-thread) est cohérente : Shredder 6 (8T) tire avantage hardware contre des moteurs 1T calibrés entre 2989 et 3024.

Le score global de 56.67% absorbe les deux régimes — 8T-vs-8T contre Deep Junior 7, 8T-vs-1T contre les trois autres — et produit une mesure équilibrée qui place Shredder 6 entre Deep Sjeng 1.6 (3066) et Deep Junior 7 (3031). C'est exactement la position prédite par l'histoire de la série Shredder : Shredder 6 (2002) est la dernière version monolithique avant l'ère SMP, et Shredder 10 UCI (2006) lui est supérieur de 101 points — différentiel conforme à la progression attendue entre ces deux versions.

Méthode — Gauntlet certifié, sans propagation BES

Les quatre ancres ont toutes été révisées dans la cascade 2026 : Deep Junior 7 (2996 → 3031), Junior 8 (2992 → 3006), ProDeo 2.0 (2999 → 3024), Ruffian 2.1.0 (2966 → 2989). Le rating de 3059 correspond donc à la calibration finale sur ancres révisées, et non à une propagation de cascade. Sur les anciennes ancres, le résultat aurait été de ~3030 — soit un déplacement de +29 points, du même ordre que les autres corrections de la zone.

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Shredder 10 UCI31601Référence supérieure série Shredder
Deep Sjeng 1.63066 ↑révisé8Référence supérieure immédiate
Shredder 63059 8Mesuré · σ = ±26 · nouveau gauntlet 8T 2026
Deep Junior 73031 ↑révisé8Ancre directe — 33.33%
ProDeo 2.03024 ↑révisé1Ancre — 66.67%
Junior 83006 ↑révisé1Ancre — 63.33%
Ruffian 2.1.02989 ↑révisé1Ancre inférieure — 63.33%

Shredder 6 (3059) prend le rang 30 de l'échelle interne, intercalé entre Deep Sjeng 1.6 (3066) et Deep Junior 7 (3031). L'écart de 7 points avec Deep Sjeng 1.6 reste inférieur à 2σ — les trois moteurs forment un palier serré cohérent avec leur contemporanéité historique. L'écart de 101 points avec Shredder 10 UCI mesure le saut entre la dernière version monolithique de la première époque et la première version SMP mature.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026

Calibration Elo — ProDeo 2.0 (1 Thread) mono-thread ↑révisé

ProDeo 2.0 — mono-thread. Moteur libre HCE de Ed Schröder, fondateur de la série Rebel, publié en 2015.

Note technique — Configuration mono-thread

ProDeo 2.0 est mono-thread par conception. Elo strictement mono-thread, non directement comparable aux ratings multi-threads.

Résultats détaillés du gauntlet

Rencontre (ProDeo 2.0 1CPU – Ancre)Ancre EloScoreParties%
ProDeo 2.0 1CPU – Shredder 10 UCI 1CPU30876.0 – 8.01442.86%
ProDeo 2.0 1CPU – Deep Junior 7 8CPU3031 ↑révisé6.5 – 7.51446.43%
ProDeo 2.0 1CPU – Fritz 6 1CPU2905 ↑révisé8.0 – 5.01361.54%
ProDeo 2.0 1CPU – List 5.12 1CPU2965 ↑révisé7.5 – 5.51357.69%
ProDeo 2.0 1CPU – SOS 5 for Arena 1CPU2922 ↑révisé7.5 – 5.51357.69%
Total cumulémoy. pond. 2984 ↑révisé35.5 – 31.56752.99%
Performance Elo obtenue

Elo : 3005 (mono-thread · recalibré cascade 2026)
Erreur (σ) : ±11
Nombre de parties : 67

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Deep Junior 73031 ↑révisé8Ancre — 46.43%
ProDeo 2.03005 ↑révisé1 — mono-threadMesuré · σ = ±11
Fritz 62905 ↑révisé1Ancre — 61.54%

Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026

Calibration Elo — Junior 8 (1 Thread) mono-thread ↑révisé

Junior 8 — mono-thread. Version commerciale de la série de Amir Ban et Shay Bushinsky, distribuée par ChessBase. Recalibrée dans la cascade 2026 (correction partielle, +7 points : SOS 5 et Gambit Tiger restant en attente de recalibration BES).

Note technique — Configuration mono-thread

Junior 8 testé en mono-thread (Threads=1). Elo strictement mono-thread.

Résultats détaillés du gauntlet — Scores Inchangés, Ancres Révisées

OppositionAncre EloScoreN%
Fritz 5.32 (1CPU)2866 ↑révisé5.5 – 3.5961.11%
Hiarcs 7.32 (1CPU)2891 ↑révisé6.0 – 3.0966.67%
Nimzo 8 (1CPU)2900 ↑révisé6.0 – 3.0966.67%
SOS 5 for Arena (1CPU)29174.5 – 4.5950.00%
List 5.12 (1CPU)2965 ↑révisé7.0 – 1.0887.50%
Fritz 6 (1CPU)2905 ↑révisé4.0 – 5.0944.44%
Gambit Tiger (1CPU)29575.5 – 3.5961.11%
Total cumulémoy. pond. 2914 ↑révisé38.5 – 23.56262.10%
Performance Elo obtenue

Elo : 2999 (mono-thread · recalibré cascade 2026 partielle)
Erreur (σ) : ±11
Nombre de parties : 62

Correction partielle — +7 points (provisoire)

Junior 8 utilise 7 ancres dont 5 sont révisées. Les deux ancres restantes — SOS 5 for Arena (2917) et Gambit Tiger 2.0 (2957) — dépendent de Deep Junior 7 et Shredder 10, non encore recalibrés. Le rating de 2999 est provisoire et sera affiné lors de la prochaine vague.

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
ProDeo 2.03005 ↑révisé1Référence supérieure
Junior 82999 ↑révisé1 — mono-threadMesuré · σ = ±11 · recalibré 2026
Deep Junior 729968Référence inférieure proche

Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026

Calibration Elo — Ruffian 2.1.0 (1 Thread) mono-thread ↑révisé

Ruffian 2.1.0 — mono-thread. Moteur de Per-Ola Valfridsson (Suède), commercialisé par Lokasoft (2004). Lauréat DOCCC 2003, ICT 2004 (3e). Nommé d'après une jument de course américaine des années 1970. Recalcul cascade 2026.

Note technique — Configuration mono-thread

Ruffian 2.1.0 testé en mono-thread. Elo strictement mono-thread.

Résultats détaillés du gauntlet

Rencontre (Ruffian 2.1.0 1CPU – Ancre)Ancre EloScoreParties%
Ruffian 2.1.0 1CPU – Shredder 10 UCI 1CPU30874.5 – 10.51530.00%
Ruffian 2.1.0 1CPU – ProDeo 2.0 1CPU3005 ↑révisé5.0 – 10.01533.33%
Ruffian 2.1.0 1CPU – Deep Junior 7 8CPU3031 ↑révisé5.5 – 9.51536.67%
Ruffian 2.1.0 1CPU – Gambit Tiger 2.0 1CPU2963 ↑révisé8.5 – 6.51556.67%
Ruffian 2.1.0 1CPU – Fritz 6 1CPU2905 ↑révisé9.0 – 6.01560.00%
Ruffian 2.1.0 1CPU – Gandalf 6.01 1CPU2953 ↑révisé9.5 – 5.51563.33%
Total cumulémoy. pond. 299142.0 – 48.09046.67%
Performance Elo obtenue

Elo : 2989 (mono-thread · recalibré cascade 2026 · +23)
Erreur (σ) : ±9
Nombre de parties : 90

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Deep Junior 73031 ↑révisé8Ancre supérieure — 36.67%
Ruffian 2.1.02989 ↑révisé1 — mono-threadMesuré · σ = ±9 · recalibré 2026
Gambit Tiger 2.02963 ↑révisé1Ancre — 56.67%
Fritz 62905 ↑révisé1Ancre — 60.00%
Gandalf 6.012953 ↑révisé1Ancre — 63.33%

Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026

Calibration Elo — Gambit Tiger 2.0 (1 Thread) mono-thread ↑révisé

Gambit Tiger 2.0 — mono-thread. Variante à jeu ultra-agressif de Chess Tiger, développée par Christophe Théron (France/Guadeloupe). 2e mondial SSDF en octobre 2001 (2720 Elo Athlon 1200). Dernière version autonome avant intégration comme réglage dans Chess Tiger 15+. Recalcul cascade 2026.

Note technique — Configuration mono-thread

Gambit Tiger 2.0 est mono-thread par conception.

Résultats détaillés du gauntlet

Rencontre (Gambit Tiger 2.0 1CPU – Ancre)Ancre EloScoreParties%
Gambit Tiger 2.0 1CPU – Shredder 10 UCI 1CPU30873.5 – 6.51035.00%
Gambit Tiger 2.0 1CPU – ProDeo 2.0 1CPU3005 ↑révisé4.5 – 5.51045.00%
Gambit Tiger 2.0 1CPU – Deep Junior 7 8CPU3031 ↑révisé4.0 – 6.01040.00%
Gambit Tiger 2.0 1CPU – Fritz 6 1CPU2905 ↑révisé5.0 – 5.01050.00%
Gambit Tiger 2.0 1CPU – List 5.12 1CPU2965 ↑révisé5.0 – 5.01050.00%
Gambit Tiger 2.0 1CPU – SOS 5 for Arena 1CPU2922 ↑révisé6.0 – 4.01060.00%
Total cumulémoy. pond. 2986 ↑révisé28.0 – 32.06046.67%
Performance Elo obtenue

Elo : 2963 (mono-thread · recalibré cascade 2026)
Erreur (σ) : ±11
Nombre de parties : 60

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Ruffian 2.1.02989 ↑révisé1Référence supérieure
Gambit Tiger 2.02963 ↑révisé1 — mono-threadMesuré · σ = ±11
Fritz 62905 ↑révisé1Ancre — 50.00%

Calibration · Gauntlet dédié · Ryzen 9 7950X3D · Recalcul cascade 2026

Calibration Elo — Gandalf 6.01 (1 Thread) mono-thread ↑révisé

Gandalf 6.01 — mono-thread. Moteur de Steen Suurballe (Danemark), avec collaboration de Dan Wulff Kristensen (livres d'ouvertures). Refonte positionnelle avec le GMI de correspondance Christian Kongsted. Commercialisé par Lokasoft (2004). Recalcul cascade 2026.

Note technique — Configuration mono-thread

Gandalf 6.01 mono-thread par conception.

Résultats détaillés du gauntlet

Rencontre (Gandalf 6.01 1CPU – Ancre)Ancre EloScoreParties%
Gandalf 6.01 1CPU – Shredder 10 UCI 1CPU30874.0 – 6.01040.00%
Gandalf 6.01 1CPU – ProDeo 2.0 1CPU3005 ↑révisé4.5 – 5.51045.00%
Gandalf 6.01 1CPU – Deep Junior 7 8CPU3031 ↑révisé5.0 – 5.01050.00%
Gandalf 6.01 1CPU – Gambit Tiger 2.0 1CPU2963 ↑révisé4.0 – 6.01040.00%
Gandalf 6.01 1CPU – Fritz 6 1CPU2905 ↑révisé6.0 – 4.01060.00%
Gandalf 6.01 1CPU – List 5.12 1CPU2965 ↑révisé4.5 – 5.51045.00%
Gandalf 6.01 1CPU – SOS 5 for Arena 1CPU2922 ↑révisé4.0 – 6.01040.00%
Total cumulémoy. pond. 2983 ↑révisé32.0 – 38.07045.71%
Performance Elo obtenue

Elo : 2953 (mono-thread · recalibré cascade 2026)
Erreur (σ) : ±10
Nombre de parties : 70

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Gambit Tiger 2.02963 ↑révisé1Référence supérieure
Gandalf 6.012953 ↑révisé1 — mono-threadMesuré · σ = ±10
Fritz 62905 ↑révisé1Ancre — 60.00%

Calibration : List 5.12 mono-thread

Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 60 parties · Ancres révisées

Profil du Moteur
2965 Elo (révisé)

List 5.12

Hardware : AMD Ryzen 9 7950X3D · 1 thread
Type évaluation : HCE (évaluation manuscrite)
Gauntlet original : 60 parties · σ = ±11
Ancien rating : 2936

List 5.12 — moteur libre de Fritz Reul, chercheur allemand. Ses six ancres sont toutes révisées dans la cascade Junior 7 / Fritz 6. Rating progresse de 2936 à 2965, franchissant la barre des 2960.

Rating recalculé — +29 points par propagation d'ancres

Aucun nouveau gauntlet n'a été joué. La révision résulte de la mise à jour en cascade des ancres : Junior 7 (+118), Fritz 6 (−42), puis Fritz 5.32 (+11), Yace Paderbron (+29), Hiarcs 7.32 (+29), Nimzo 8 (+29). Les scores originaux sont inchangés.

Résultats du Gauntlet — Scores Inchangés, Ancres Révisées
OppositionAncre EloScoreN%
Fritz 6 (1CPU)2905 ↑révisé5.0 – 5.01050.00%
Nimzo 8 (1CPU)2900 ↑révisé7.0 – 3.01070.00%
Hiarcs 7.32 (1CPU)2891 ↑révisé6.5 – 3.51065.00%
Junior 7 (1CPU)2980 ↑révisé5.0 – 5.01050.00%
Fritz 5.32 (1CPU)2866 ↑révisé6.5 – 3.51065.00%
Yace Paderbron (1CPU)2859 ↑révisé5.5 – 4.51055.00%
Total cumulémoy.pond. 290035.5 – 24.56059.17%
Score global
59.17%
35.5 / 60
Moy. ancres
2900
révisée
Erreur σ
±11
60 parties
Elo révisé
2965
cascade ancres

Calibration : SOS 5 for Arena mono-thread

Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 80 parties · Ancres révisées

Profil du Moteur
2940 Elo (révisé)

SOS 5 for Arena

Hardware : AMD Ryzen 9 7950X3D · 1 thread
Type évaluation : HCE (évaluation manuscrite)
Gauntlet original : 80 parties · σ = ±9
Ancien rating : 2922

SOS — moteur de Rudolf Huber, co-inventeur du protocole UCI avec Stefan Meyer-Kahlen (2000). Distribué via Arena. Recalcul cascade 2026 (post-Shredder 10).

Rating recalculé — cascade Shredder 10 (+18 points)

Aucun nouveau gauntlet. Révision par mise à jour des ancres : Shredder 10 (3087 stable), Deep Junior 7 (2996 → 3031), Fritz 6 (2947 → 2905), List 5.12 (2936 → 2965). Le score 39.38% reste inchangé.

Résultats du Gauntlet — Scores Inchangés, Ancres Révisées
OppositionAncre EloScoreN%
Shredder 10 UCI (1CPU)30874.0 – 16.02020.00%
Deep Junior 7 (8CPU)3031 ↑révisé5.5 – 14.52027.50%
Fritz 6 (1CPU)2905 ↑révisé10.5 – 9.52052.50%
List 5.12 (1CPU)2965 ↑révisé11.5 – 8.52057.50%
Total cumulémoy.pond. 299731.5 – 48.58039.38%
Score global
39.38%
31.5 / 80
Moy. ancres
2997
révisée
Erreur σ
±9
80 parties
Elo révisé
2940
cascade ancres

Calibration : Nimzo 8 mono-thread

Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 75 parties · Ancres révisées

Profil du Moteur
2900 Elo (révisé)

Nimzo 8

Hardware : AMD Ryzen 9 7950X3D · 1 thread
Type évaluation : HCE (évaluation manuscrite)
Gauntlet original : 75 parties · σ = ±10
Ancien rating : 2871

Nimzo — moteur commercial de Chrilly Donninger (Autriche), également auteur de Hydra. Ses cinq ancres sont toutes révisées dans la cascade. La propriété mathématique remarquable se maintient : Nimzo 8 fait à nouveau 50.00% exact (37.5/75) — sa perf est donc strictement égale à la nouvelle moy. pond.

Rating recalculé — +29 points par propagation d'ancres

Aucun nouveau gauntlet n'a été joué. Révision par mise à jour en cascade des ancres : Junior 7 (+118), Fritz 6 (−42), Fritz 5.32 (+11), Yace Paderbron (+29), Hiarcs 7.32 (+29). Les scores originaux sont inchangés.

Résultats du Gauntlet — Scores Inchangés, Ancres Révisées
OppositionAncre EloScoreN%
Fritz 6 (1CPU)2905 ↑révisé5.5 – 9.51536.67%
Fritz 5.32 (1CPU)2866 ↑révisé6.0 – 9.01540.00%
Junior 7 (1CPU)2980 ↑révisé7.0 – 8.01546.67%
Hiarcs 7.32 (1CPU)2891 ↑révisé8.5 – 6.51556.67%
Yace Paderbron (1CPU)2859 ↑révisé10.5 – 4.51570.00%
Total cumulémoy.pond. 290037.5 – 37.57550.00%
Score global
50.00%
37.5 / 75
Moy. ancres
2900
révisée
Erreur σ
±10
75 parties
Elo révisé
2900
cascade ancres

Calibration : Hiarcs 7.32 mono-thread

Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 55 parties · Ancres révisées

Profil du Moteur
2891 Elo (révisé)

Hiarcs 7.32

Hardware : AMD Ryzen 9 7950X3D · 1 thread
Type évaluation : HCE (évaluation manuscrite)
Gauntlet original : 55 parties · σ = ±12
Ancien rating : 2862

Hiarcs (Highly Intelligent Auto Response Chess System) — moteur commercial de Mark Uniacke, école britannique. Plusieurs titres WMCCC sur micros, notamment sur Palm Pilot (2000, 2001). Recalcul cascade 2026.

Rating recalculé — +29 points par propagation d'ancres

Aucun nouveau gauntlet n'a été joué. Révision par mise à jour en cascade des ancres : Junior 7 (+118), Fritz 6 (−42), Fritz 5.32 (+11), Yace Paderbron (+29). Les scores originaux sont inchangés.

Résultats du Gauntlet — Scores Inchangés, Ancres Révisées
OppositionAncre EloScoreN%
Fritz 5.32 (1CPU)2866 ↑révisé7.0 – 7.01450.00%
Fritz 6 (1CPU)2905 ↑révisé6.5 – 7.51446.43%
Junior 7 (1CPU)2980 ↑révisé5.5 – 8.51439.29%
Yace Paderbron (1CPU)2859 ↑révisé7.5 – 5.51357.69%
Total cumulémoy.pond. 290326.5 – 28.55548.18%
Score global
48.18%
26.5 / 55
Moy. ancres
2903
révisée
Erreur σ
±12
55 parties
Elo révisé
2891
cascade ancres

Calibration : Fritz 5.32 mono-thread

Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 87 parties · Ancres révisées

Profil du Moteur
2866 Elo (révisé)

Fritz 5.32 — ChessBase / Frans Morsch

Hardware : AMD Ryzen 9 7950X3D · 1 thread
Type évaluation : HCE (évaluation manuscrite)
Gauntlet original : 87 parties · σ = ±9
Ancien rating : 2855

Fritz 5.32 — moteur de Frans Morsch, commercialisé par ChessBase. Build de maintenance de Fritz 5 (1997). Le rating progresse de 2855 à 2866 par recalcul sur les ancres révisées (Fritz 6, Junior 7). Le score global reste 50.00% exact — la performance est strictement égale à la nouvelle moy. pond.

Rating recalculé — +11 points par propagation d'ancres

Aucun nouveau gauntlet. Révision par mise à jour des Elos de Fritz 6 (2947 → 2905, −42) et Junior 7 (2862 → 2980, +118). Propagation nette : +11 points. Rebel 6 (2761) reste stable.

Résultats du Gauntlet — Scores Inchangés, Ancres Révisées
OppositionAncre EloScoreN%
Rebel 6 (100%)2761 stable24.0 – 10.03470.59%
Fritz 6 (1CPU)2905 ↑révisé14.5 – 18.53343.94%
Junior 7 (1CPU)2980 ↑révisé5.0 – 15.02025.00%
Total cumulémoy. pond. 286643.5 – 43.58750.00%
Score global
50.00%
43.5 / 87
Moy. ancres
2866
révisée
Erreur σ
±9
87 parties
Elo révisé
2866
+11 vs 2855

Calibration : Yace Paderbron mono-thread

Recalcul cascade 2026 · AMD Ryzen 9 7950X3D · 61 parties · Ancres révisées

Profil du Moteur
2859 Elo (révisé)

Yace Paderbron

Hardware : AMD Ryzen 9 7950X3D · 1 thread
Type évaluation : HCE (évaluation manuscrite)
Gauntlet original : 61 parties · σ = ±11
Ancien rating : 2830

Yace Paderbron — moteur open-source développé à l'Université de Paderborn (Allemagne), génération 2000–2005. Rating progresse de 2830 à 2859 par recalcul de ses trois ancres, toutes révisées dans la cascade.

Rating recalculé — +29 points par propagation d'ancres

Aucun nouveau gauntlet. Révision par mise à jour en cascade des ancres : Fritz 5.32 (+11), Fritz 6 (−42), Junior 7 (+118). Les scores originaux sont inchangés.

Résultats du Gauntlet — Scores Inchangés, Ancres Révisées
OppositionAncre EloScoreN%
Fritz 5.32 (1CPU)2866 ↑révisé9.5 – 11.52145.24%
Fritz 6 (1CPU)2905 ↑révisé7.0 – 13.02035.00%
Junior 7 (1CPU)2980 ↑révisé9.0 – 11.02045.00%
Total cumulémoy.pond. 291625.5 – 35.56141.80%
Score global
41.80%
25.5 / 61
Moy. ancres
2916
révisée
Erreur σ
±11
61 parties
Elo révisé
2859
cascade ancres

PROTOCOLE · ALIGNEMENT CCRL · CALIBRATION DEEP SHREDDER 13

Recalibration du laboratoire sur l'échelle CCRL 40/15 — protocole de gauntlet via cinq ancres certifiées

Cette note documente le protocole expérimental mis en œuvre pour mesurer, sans bidouillage d'offset, le décalage absolu entre l'échelle interne du laboratoire (pool Ordo BESFREE 2026) et l'échelle CCRL 40/15. La méthode consiste à faire jouer Deep Shredder 13 — moteur-pivot du pool laboratoire — contre cinq moteurs dont la note CCRL est publiée et stable, en simulant pour ces cinq moteurs les conditions matérielles CCRL via un ratio Fritzmark/Stockfish 10 appliqué aux cadences.

1. Choix du moteur-pivot et des ancres

Deep Shredder 13 occupe une place charnière dans le pool laboratoire (rang 15, Elo BESFREE 2026 = 3789, 397 parties). Le moteur est représenté à la fois sur SSDF (3358 Ryzen 1800X 8 CPU, 880 parties stables depuis 2019) et sur CCRL 40/15 (3327 Intel i7-4770K 4 CPU, 2967 parties). Son ancrage externe est donc solide, et il est suffisamment fort pour être confronté à des ancres modernes type Stockfish 10 ou Caissa 1.17 sans risque de chute brutale.

Les cinq ancres CCRL retenues couvrent la fenêtre Elo 3223–3601, soit une plage de 378 points centrée sur le score attendu de Deep Shredder 13 en équivalent CCRL :

MoteurConfiguration CCRLElo CCRL 40/15
Caissa 1.174 CPU3601
Stockfish 104 CPU3522
Ethereal 12.754 CPU3454
Wasp 5.501 CPU3325
Gull 3 x644 CPU3223

Moyenne arithmétique des cinq ancres : 3425 Elo CCRL. Quatre des cinq ancres sont en configuration 4 CPU, conforme au standard principal de CCRL 40/15. Wasp 5.50 figure en 1 CPU, à 3325, ce qui ajoute un point de validation en bas de fourchette et teste la cohérence du protocole sur deux types de configuration matérielle simultanément.

2. Ratio matériel Ryzen 9 7950X3D / Intel i7-4770K

CCRL définit ses cadences en équivalent « 40 coups en 15 minutes sur Intel i7-4770K à 3.5 GHz », et utilise Stockfish 10 comme étalon de calibration. Sur Stockfish 10 bench mono-thread (commande standard bench 16 1 13), les valeurs de référence relevées sur i7-4770K se situent autour de :

  • 1 cœur 4770K @ 3.9 GHz turbo single : ~2.34 Mnps
  • 4 cœurs 4770K @ 3.7 GHz all-core turbo : ~8.89 Mnps

Sur le Ryzen 9 7950X3D du laboratoire, les NPS extrapolées des données Fritzmark (Monstru, 16 × 5.0 GHz moyens, 91.2 Mnps en 32 threads BMI2) après retrait du gain SMT (≈ 30%) et division par cœur donnent :

  • 1 cœur 7950X3D @ 5.0 GHz : ~4.39 Mnps
  • 4 cœurs 7950X3D : ~17.54 Mnps
  • 8 cœurs 7950X3D : ~35.08 Mnps

Ratio par cœur Ryzen 9 7950X3D / Intel i7-4770K :

Ratio matériel par cœur ≈ 1.92 — calculé comme moyenne entre le ratio mono-thread (1.87) et le ratio quatre-cœurs (1.97). L'écart entre les deux vient des fréquences turbo différentes selon le nombre de cœurs actifs côté Intel (3.7 GHz all-core vs 3.9 GHz mono).

3. Cadences appliquées dans Banksia

La cadence de référence du gauntlet est fixée à 15 secondes par coup pour Deep Shredder 13, condition matérielle complète du laboratoire (8 threads, X3D CCD, hash 64 Mo). Les cinq ancres CCRL doivent jouer à une cadence simulant leur hardware de référence, c'est-à-dire en divisant ce temps par le ratio matériel par cœur :

Cadence ancre = 15 / 1.92 ≈ 7.8 secondes par coup

Le nombre de threads, lui, reste celui de la configuration CCRL d'origine (4 pour les ancres 4 CPU, 1 pour Wasp 5.50). Le scaling SMP est une caractéristique propre à chaque moteur, indépendante du ratio matériel par cœur, et doit être conservée tel quel pour respecter la condition de mesure CCRL.

MoteurThreadsSec/coupCadence Banksia
Deep Shredder 13815.0movetime 15 s
Caissa 1.1747.8movetime 8 s
Stockfish 1047.8movetime 8 s
Ethereal 12.7547.8movetime 8 s
Gull 3 x6447.8movetime 8 s
Wasp 5.5017.8movetime 8 s

Note technique : Banksia n'accepte pas facilement les décimales pour les cadences movetime. La valeur 7.8 sec est arrondie à 8 sec, ce qui introduit un biais marginal de +2.5% sur le budget de compute des ancres (≈ 6 Elo en leur faveur, dans la marge d'incertitude statistique).

4. Conditions de tournoi

  • Format : Défi (Gauntlet), Deep Shredder 13 contre chaque ancre
  • Parties par paire : 20 (couleurs alternées via « Permuter les camps »)
  • Total de parties : 5 × 20 = 100 parties
  • Simultanéité : 1 (aucune partie en parallèle, pour ne pas perturber les NPS)
  • Hash table : 64 Mo identique pour tous les moteurs
  • Ponder : désactivé (conformément aux conditions CCRL)
  • Bibliothèque d'ouverture : Cerebellum 3M, max ply 16, top 30% (variation suffisante pour 100 parties sans répétition excessive)
  • Marge par coup : 1.00 sec (pour absorber les latences UCI des moteurs avec NNUE volumineuse)
  • Tables Syzygy : aucune (cohérence avec les conditions BESFREE 2026 historiques)
  • Affinité CPU : pinning des threads sur la CCD X3D (cœurs 0-7) pour bénéficier du V-cache 96 Mo

5. Calcul de la performance Elo

À l'issue du gauntlet, Deep Shredder 13 totalise un score S (points marqués) sur N = 100 parties. Le ratio p = S/N est interprété via la formule classique :

PerfElo = Moyenne_adversaires_pondérée + 400 × log10(p / (1−p))

Avec une moyenne arithmétique simple des cinq ancres (20 parties chacune, soit pondération uniforme 1/5) :

Moyenne = (3601 + 3522 + 3454 + 3325 + 3223) / 5 = 3425 Elo CCRL

L'écart-type associé suit la formule de Wald :

σWald = 400 × √(p × (1−p) / N)

Pour N = 100 et un score attendu autour de 0.50, σ ≈ ±20 Elo. Un intervalle de confiance à 95% s'établit à ±40 Elo.

6. Interprétation — calcul du décalage d'échelle

L'Elo CCRL effectif de Deep Shredder 13 sur ce gauntlet est PerfElo. Le décalage d'échelle absolu se calcule comme :

Δéchelle = Elolabo(DSh13) − PerfElo(DSh13 sur gauntlet CCRL) = 3789 − PerfElo

Les scénarios suivants permettent de visualiser l'amplitude attendue du décalage selon le score mesuré :

Score DSh13Pts/100Perf EloΔ échelleInterprétation
90%90.03807−18 EloÉchelles essentiellement alignées (improbable)
80%80.03666+123 EloDécalage modeste, lab légèrement gonflé
70%70.03572+217 EloDécalage notable, à mi-chemin de l'estimation prior
60%60.03495+294 EloDécalage proche de l'estimation prior
56%56.03467+322 EloValidation directe du +320 Elo estimé
50%50.03425+364 EloDécalage important, ancres surévaluent DSh13 dans labo
40%40.03354+435 EloDécalage très important, hypothèse à reconsidérer
Score attendu sous l'hypothèse +320 Elo de décalage : si l'échelle laboratoire est effectivement +320 Elo au-dessus de l'échelle CCRL absolue, alors Deep Shredder 13 jouerait dans ce gauntlet comme un moteur 3469 Elo CCRL (= 3789 − 320), face à des adversaires moyens à 3425 Elo. Son score attendu serait :

p = 1 / (1 + 10(3425−3469)/400) = 1 / (1 + 10−0.11) ≈ 56.3%

Soit environ 56 points sur 100 parties. Toute déviation significative de ce score (au-delà des ±20 Elo de σ) signalera un décalage différent de l'estimation prior et obligera à réviser la note méthodologique du pool BESFREE 2026.

7. Mise à jour conditionnelle du pool laboratoire

Le résultat de ce gauntlet ne modifie pas en lui-même les ratings internes du pool BESFREE 2026 — la cohérence interne du pool reste indépendante de son ancrage externe. En revanche, il permettra d'enrichir la note méthodologique de la rating list avec une affirmation chiffrée, vérifiable et reproductible :

L'échelle interne du laboratoire est positionnée à +X Elo au-dessus de l'échelle CCRL 40/15 absolue, telle que mesurée par gauntlet direct de Deep Shredder 13 contre cinq ancres certifiées CCRL (Caissa 1.17, Stockfish 10, Ethereal 12.75, Wasp 5.50, Gull 3 x64) en conditions matérielles équivalentes via ratio Fritzmark/Stockfish 10. Mesure effectuée sur 100 parties, σ ≈ ±20 Elo.

Cette affirmation, une fois la valeur de X mesurée, remplacera l'estimation actuelle « ~+320 Elo » qui repose sur une comparaison indirecte via SSDF/CCRL sur Deep Shredder 13. La calibration directe constitue une mesure de premier ordre, autrement plus solide qu'une décomposition indirecte du gain matériel par log2(NPS).

8. Pré-requis logistiques et durée du gauntlet

À raison de 100 parties, avec une durée moyenne estimée de 15-20 minutes par partie (variable selon la longueur effective de la partie), le gauntlet complet demande environ 25 à 35 heures de temps machine en simultanéité 1, soit deux à trois jours de calcul continu. Le tournoi peut être interrompu et repris via la fonctionnalité « Reprendre » de Banksia. Aucune autre charge significative ne doit tourner sur le 7950X3D pendant cette période, afin de ne pas dégrader les NPS et fausser la mesure.

9. Limites méthodologiques reconnues

Le protocole repose sur trois approximations identifiées :

  1. Ratio matériel par cœur (1.92) : extrapolé à partir de mesures Fritzmark/Stockfish 10 bench publiées par des tiers (Christian pour le 4770K, Monstru pour le 7950X3D). L'incertitude propre est de l'ordre de ±5-10%, soit ±0.10 sur le ratio, équivalent à ±15-25 Elo sur le décalage mesuré.
  2. Différences architecturales Zen 4 X3D vs Haswell : prédicteur de branchement, latences mémoire, structure de cache. À NPS identique, deux engines peuvent classer légèrement différemment sur les deux architectures. Cet effet est non quantifié mais probablement < ±20 Elo en ordre de grandeur.
  3. Arrondi de cadence à 8 sec au lieu de 7.8 sec : biais de +2.5% en faveur des ancres, équivalent à ≈ +6 Elo sur leur performance apparente, donc ≈ −6 Elo sur Deep Shredder. Dans la marge.

L'incertitude globale combinée sur la mesure du décalage d'échelle est de l'ordre de ±30-40 Elo, ce qui reste largement informatif sur un décalage attendu autour de +300 Elo.