Performance ELO, tournois maison
| Rang | Moteur / Système | Hardware | Elo | Parties | Err +/- |
|---|---|---|---|---|---|
| ★ 1 | Wasp 7.00 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3755 | 60 | 11 |
| 2 | Komodo 12.1.1 64-bit — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3724 | 75 | 10 |
| 3 | Stockfish 8 64 POPCNT — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3693 | 80 | 10 |
| 4 | Caissa 1.5 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3684 | 80 | 10 |
| 5 | Booot 6.5 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3677 | 75 | 10 |
| 6 | Wasp 5.50 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3673 | 60 | 11 |
| 7 | Ethereal 11.75 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3635 | 67 | 11 |
| 8 | Deep Shredder 13 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3576 | 59 | 10 |
| 9 | Houdini 4 Pro x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3556 | 102 | 8 |
| 10 | Gull 3 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3507 | 80 | 10 |
| 11 | Critter 1.6a 64-bit — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3458 | 76 | 9 |
| 12 | Wasp 3.75 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3420 | 59 | 26 |
| 13 | Naum 4.2 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3398 | 59 | 23 |
| 14 | Senpai 2.0 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3380 | 46 | 13 |
| 15 | Komodo64 3 | AMD Ryzen 9 7950X3D 100% | 3359 | 79 | 10 |
| 16 | Wasp 2.01 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3297 | 73 | 20 |
| 17 | Rybka 2.4MP — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3234 | 67 | 21 |
| 18 | Glaurung 2.2 x64 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3163 | 75 | 23 |
| 19 | Shredder 10 UCI | AMD Ryzen 9 7950X3D 100% | 3087 | 80 | 21 |
| 20 | Deep Sjeng 1.6 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 3037 | 70 | 10 |
| 21 | ProDeo 2.0 | AMD Ryzen 9 7950X3D 100% | 2999 | 67 | 11 |
| 22 | Deep Junior 7 — 8 Threads | AMD Ryzen 9 7950X3D 100% | 2996 | 72 | 23 |
| 23 | Junior 8 | AMD Ryzen 9 7950X3D 100% | 2992 | 62 | 11 |
| 24 | Ruffian 2.1.0 | AMD Ryzen 9 7950X3D 100% | 2966 | 90 | 9 |
| 25 | Gambit Tiger 2.0 | AMD Ryzen 9 7950X3D 100% | 2957 | 60 | 11 |
| 26 | Fritz 6 | AMD Ryzen 9 7950X3D 100% | 2947 | 107 | 19 |
| 27 | Gandalf 6.01 | AMD Ryzen 9 7950X3D 100% | 2947 | 70 | 10 |
| 28 | List 5.12 | AMD Ryzen 9 7950X3D 100% | 2936 | 60 | 11 |
| 29 | SOS 5 for Arena | AMD Ryzen 9 7950X3D 100% | 2917 | 80 | 9 |
| 30 | Nimzo 8 | AMD Ryzen 9 7950X3D 100% | 2871 | 75 | 10 |
| 31 | Junior 7 | AMD Ryzen 9 7950X3D 100% | 2862 | 75 | 21 |
| 32 | Hiarcs 7.32 | AMD Ryzen 9 7950X3D 100% | 2862 | 55 | 12 |
| 33 | Fritz 5.32 | AMD Ryzen 9 7950X3D 100% | 2855 | 87 | 21 |
| 34 | Yace Paderbron | AMD Ryzen 9 7950X3D 100% | 2830 | 61 | 11 |
| 35 | The King 3.50 | AMD Ryzen 9 7950X3D 100% | 2817 | 80 | 22 |
| 36 | Rebel 6 | AMD Ryzen 9 7950X3D 100% | 2761 | 161 | 16 |
| 37 | Cray Blitz 4.9h | AMD Ryzen 9 7950X3D 100% | 2531 | 70 | 19 |
| 38 | Rebel 6 | AMD Ryzen 9 7950X3D 1% | 2527 | 60 | 47 |
| 39 | Mephisto Genius 68030 London | cb-emu | 2363 | 349 | 13 |
| 40 | Mephisto Berlin Pro 68020 | cb-emu | 2315 | 349 | 15 |
| 41 | Mephisto RISC II | cb-emu | 2266 | 342 | 16 |
| 42 | Saitek RISC 2500 v1.04 | cb-emu | 2247 | 348 | 17 |
| 43 | Mephisto Dallas 68000-UCI | AMD Ryzen 9 7950X3D 100% | 2233 | 238 | 21 |
| 44 | Novag Star Diamond (v1.04) | cb-emu | 2226 | 350 | 17 |
| 45 | Saitek Sparc (rev.518) | cb-emu | 2153 | 347 | 19 |
| 46 | Mephisto Berlin 68000 v0.03 | cb-emu | 2135 | 349 | 19 |
| 47 | Fidelity Elite Avantgarde V9 | cb-emu | 2125 | 350 | 19 |
| 48 | Novag Sapphire | cb-emu | 2123 | 334 | 20 |
| 49 | Mephisto MM5 (v5.1)-UCI | AMD Ryzen 9 7950X3D 100% | 2108 | 264 | 23 |
| 50 | Fidelity Designer Mach IV | cb-emu | 2090 | 350 | 20 |
| 51 | Fidelity Designer Mach III | cb-emu | 2029 | 348 | 21 |
| 52 | Mephisto Mondial 68000 XL | cb-emu | 1973 | 346 | 21 |
| 53 | Novag Zircon II | cb-emu | 1970 | 334 | 22 |
| 54 | Saitek President | cb-emu | 1958 | 344 | 21 |
| 55 | Mephisto Nigel Short | cb-emu | 1956 | 349 | 21 |
| 56 | Saitek Maestro D++ | cb-emu | 1923 | 348 | 21 |
| 57 | Novag Super Forte C v3.6 | cb-emu | 1901 | 349 | 21 |
| 58 | Novag Super Expert C v3.6 | cb-emu | 1894 | 349 | 21 |
| 59 | Novag Turquoise | cb-emu | 1871 | 344 | 21 |
| 60 | Saitek Corona II (ver. D+) | cb-emu | 1856 | 350 | 21 |
| 61 | Mephisto Modena (set 3) | cb-emu | 1850 | 349 | 21 |
| 62 | Saitek Turbo King II (D+) | cb-emu | 1844 | 348 | 21 |
| 63 | Mephisto MM V (v5.1) | cb-emu | 1835 | 350 | 21 |
| 64 | Mephisto MM IV (v7.10) | cb-emu | 1808 | 348 | 21 |
| 65 | Fidelity Designer 2100 | cb-emu | 1808 | 348 | 21 |
| 66 | Novag Constellation Forte A | cb-emu | 1803 | 350 | 21 |
| 67 | Saitek Simultano (ver. B) | cb-emu | 1764 | 349 | 20 |
| 68 | Fidelity Par Excellence (B) | cb-emu | 1742 | 347 | 20 |
| 69 | Saitek Prisma | cb-emu | 1724 | 349 | 19 |
| 70 | Fidelity Designer 2000 | cb-emu | 1703 | 348 | 19 |
| 71 | Novag Super VIP v3.7 | cb-emu | 1640 | 348 | 17 |
| 72 | Tandy Chess Champion 2150 | cb-emu | 1577 | 346 | 16 |
| 73 | Saitek Turbo 16K | cb-emu | 1437 | 348 | 11 |
| 74 | Saitek Leonardo (v1.4) | cb-emu | 1285 | 347 | 8 |
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Wasp 7.00 (8 Threads)
Ce document présente les résultats du gauntlet de calibration de Wasp 7.00 — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3693 Elo). Wasp est un moteur développé par John Stanback, programmeur américain, actif depuis la version 2.x. À partir de la version 5.00, Wasp intègre une évaluation NNUE — la version 7.00 est donc un moteur NNUE natif, successeur d'une série qui était auparavant HCE.
Le moteur et son auteur
John Stanback développe Wasp depuis 2014 environ. La série a connu une progression remarquable en HCE jusqu'à la version 4.x, puis une transition vers le NNUE à partir de la version 5.00 qui lui a conféré un bond de force considérable. Wasp 7.00 représente l'état de l'art actuel de la série — son développement suit un rythme régulier de mises à jour sans rupture majeure d'architecture.
La série Wasp est distribuée librement sur GitHub. Ses versions HCE (2.x, 3.x) figurent déjà dans cette échelle — Wasp 2.01 (3297 · rang 15) et Wasp 3.75 (3420 · rang 11) — ce qui rend Wasp l'un des rares moteurs dont trois générations distinctes sont mesurées dans ce laboratoire, illustrant l'évolution HCE→NNUE sur une seule ligne de code.
| Version | Type éval. | Elo labo | Remarque |
|---|---|---|---|
| Wasp 2.01 | HCE | 3297 | Rang 15 dans cette échelle |
| Wasp 3.75 | HCE | 3420 | Rang 11 dans cette échelle |
| Wasp 5.50 | NNUE | 3673 | Rang 5 dans cette échelle |
| Wasp 7.00 | NNUE | 3755 | ★ Rang 1 — version calibrée |
Résultats détaillés du gauntlet
| Rencontre (Wasp 7.00 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Wasp 7.00 8CPU – Stockfish 8 64 POPCNT 8CPU | 3693 | 9.5 – 5.5 | 15 | 63.33% |
| Wasp 7.00 8CPU – Caissa 1.5 8CPU | 3684 | 8.0 – 7.0 | 15 | 53.33% |
| Wasp 7.00 8CPU – Booot 6.5 x64 8CPU | 3677 | 9.5 – 5.5 | 15 | 63.33% |
| Wasp 7.00 8CPU – Ethereal 11.75 8CPU | 3635 | 10.0 – 5.0 | 15 | 66.67% |
| Total cumulé | moy. pond. 3672 | 37.0 – 23.0 | 60 | 61.67% |
Elo : 3755
Erreur (σ) : ±11
Nombre de parties : 60
Moyenne pondérée des ancres : (3693×15 + 3684×15 + 3677×15 + 3635×15) / 60 = 3672.
Performance = 3672 + 400 × log₁₀(0.6167 / 0.3833) = 3672 + 400 × 0.2066 = 3755.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.6167 et N = 60 → σ = ±11.
Lecture des résultats
Le gauntlet de Wasp 7.00 est l'un des plus stables jamais observés dans ce laboratoire. Le rating a oscillé dans une fenêtre de seulement 19 points depuis la première mesure significative : 3753 (18 parties), 3746 (24), 3736 (39), 3749 (51), 3755 (60). Cette convergence précoce et régulière témoigne d'un profil stylistique parfaitement cohérent, sans anomalie ni variance excessive.
L'analyse par adversaire révèle une asymétrie notable. Wasp 7.00 domine de façon très homogène les trois moteurs HCE — 63.33% contre Stockfish 8 (3693), 63.33% contre Booot 6.5 (3677) et 66.67% contre Ethereal 11.75 (3635) — mais ne fait que 53.33% contre Caissa 1.5 (3684), moteur NNUE natif. Cette dichotomie HCE/NNUE est un marqueur stylistique clair : Wasp 7.00 exploite les faiblesses propres à l'évaluation manuscrite mais rencontre plus de résistance face à un adversaire de même paradigme. Caissa 1.5 est le seul moteur de ce gauntlet qui lui résiste réellement.
Comparaison avec les listes de référence
La progression de la série Wasp dans ce laboratoire illustre parfaitement l'impact du NNUE : Wasp 2.01 (3297) → Wasp 3.75 (3420) → Wasp 5.50 (3673) → Wasp 7.00 (3755). Le gain HCE entre 2.01 et 3.75 est de 123 points sur plusieurs années de développement. Le gain NNUE entre 3.75 et 5.50 est de 253 points — soit plus du double en une seule transition architecturale. Le gain entre 5.50 et 7.00 est de 82 points — ce qui représente deux années de développement NNUE intensif au sommet de l'échelle, là où chaque point est plus difficile à arracher.
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Wasp 7.00 | 3755 | 8 | NNUE | Mesuré · σ = ±11 · ★ Rang 1 |
| Stockfish 8 | 3693 | 8 | HCE | Ancre — 63.33% |
| Caissa 1.5 | 3684 | 8 | NNUE | Ancre — 53.33% (résistance NNUE) |
| Booot 6.5 x64 | 3677 | 8 | HCE | Ancre — 63.33% |
| Wasp 5.50 | 3673 | 8 | NNUE | Prédécesseur — +82 Elo |
| Ethereal 11.75 | 3635 | 8 | HCE | Ancre inférieure — 66.67% |
Wasp 7.00 (3755) prend le ★ rang 1 de l'échelle avec une avance de 62 points sur Stockfish 8 (3693) et de 71 points sur Caissa 1.5 (3684). C'est le premier moteur de cette échelle à franchir le cap des 3750 — et la troisième génération de la série Wasp à être calibrée dans ce laboratoire. La saga Wasp incarne à elle seule la révolution NNUE : deux générations HCE à 3297 et 3420, deux générations NNUE à 3673 et 3755.
Calibration Elo — Komodo 12.1.1 64-bit (8 Threads)
Ce document présente les résultats du gauntlet de calibration de Komodo 12.1.1 64-bit — 8 threads, joué contre six moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3755 Elo). Komodo est un moteur commercial développé par Mark Lefler et Larry Kaufman, économiste et grand maître international américain. La version 12.1.1 est une version à évaluation entièrement manuscrite (HCE) — Komodo n'adoptera l'architecture NNUE qu'avec la série Dragon, lancée en 2020.
Ce rapport est établi à 83% du gauntlet. Le rating de 3724 est stable depuis 46 parties dans une fenêtre de ±7 points (3718–3725), ce qui justifie la publication de ce rapport intermédiaire. 15 parties restantes ne modifieront pas le classement de façon significative.
Résultats détaillés du gauntlet
| Rencontre (Komodo 12.1.1 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Komodo 12.1.1 8CPU – Wasp 7.00 8CPU | 3755 | 6.0 – 7.0 | 13 | 46.15% |
| Komodo 12.1.1 8CPU – Stockfish 8 64 POPCNT 8CPU | 3693 | 8.5 – 4.5 | 13 | 65.38% |
| Komodo 12.1.1 8CPU – Caissa 1.5 8CPU | 3684 | 7.0 – 6.0 | 13 | 53.85% |
| Komodo 12.1.1 8CPU – Booot 6.5 x64 8CPU | 3677 | 6.5 – 5.5 | 12 | 54.17% |
| Komodo 12.1.1 8CPU – Wasp 5.50 8CPU | 3673 | 8.0 – 4.0 | 12 | 66.67% |
| Komodo 12.1.1 8CPU – Ethereal 11.75 x64 8CPU | 3635 | 5.5 – 6.5 | 12 | 45.83% |
| Total cumulé | moy. pond. 3687 | 41.5 – 33.5 | 75 | 55.33% |
Elo : 3724 (préliminaire — 75/90 parties)
Erreur (σ) : ±10
Nombre de parties : 75
Moyenne pondérée des ancres : (3755×13 + 3693×13 + 3684×13 + 3677×12 + 3673×12 + 3635×12) / 75 = 3687.
Performance = 3687 + 400 × log₁₀(0.5533 / 0.4467) = 3687 + 400 × 0.0930 = 3724.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.5533 et N = 75 → σ = ±10.
Lecture des résultats
Le gauntlet de Komodo 12.1.1 a convergé tôt et fermement. Depuis la 46e partie, le rating oscille dans une fenêtre de ±7 points — l'une des convergences les plus rapides observées dans ce laboratoire pour un moteur de cette zone. Les perfs individuelles sur quatre ancres centrales se regroupent dans une fenêtre de seulement 42 points (3706–3728), ce qui atteste d'une mesure cohérente.
Le gauntlet révèle deux asymétries stylistiques notables. La première, favorable : 65.38% contre Stockfish 8 (3693) sur 13 parties et 66.67% contre Wasp 5.50 (3673) sur 12 parties — deux moteurs contre lesquels Komodo 12 affiche une nette surperformance par rapport à son niveau général. La seconde, défavorable : 45.83% contre Ethereal 11.75 (3635) sur 12 parties — un moteur HCE 130 points en dessous de Komodo 12 dans cette échelle, contre lequel le résultat devrait être plus favorable. Ces deux polarités se compensent dans le calcul global mais signalent un profil stylistique tranché.
L'avantage persistant contre Stockfish 8 mérite une attention particulière. Sur la durée — 13 parties — un score de 65.38% dépasse statistiquement le niveau attendu pour un moteur à 3724 face à un adversaire à 3693. Une explication plausible, documentée dans la communauté des moteurs d'échecs, est que les paramètres d'évaluation de Komodo 12 ont été tuned en jouant massivement contre Stockfish, ce qui aurait généré des biais stylistiques spécifiquement efficaces contre ce moteur. Il ne s'agit pas d'une assertion certaine mais d'une hypothèse cohérente avec le profil du gauntlet.
Comparaison avec les listes de référence
Le CCRL 40/15 place Komodo 12.1.1 64-bit 4CPU à 3464 Elo sur Intel i7-4770K. L'écart avec le rating maison (3724) s'élève à +260 points — cohérent avec les différentiels observés pour les autres moteurs HCE de la zone supérieure (Stockfish 8 +256, Booot 6.5 +298, Deep Shredder 13 +249). Komodo 12 a toujours été réputé pour une implémentation SMP particulièrement efficace, ce qui explique une partie du gain au passage de 4 à 8 threads.
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Wasp 7.00 | 3755 | 8 | NNUE | ★ Rang 1 — ancre supérieure · 46.15% |
| Komodo 12.1.1 | 3724 | 8 | HCE | Mesuré · σ = ±10 · 75/90 parties |
| Stockfish 8 | 3693 | 8 | HCE | Ancre — 65.38% |
| Caissa 1.5 | 3684 | 8 | NNUE | Ancre — 53.85% |
| Booot 6.5 x64 | 3677 | 8 | HCE | Ancre — 54.17% |
| Wasp 5.50 | 3673 | 8 | NNUE | Ancre — 66.67% |
| Ethereal 11.75 | 3635 | 8 | HCE | Ancre inférieure — 45.83% |
Komodo 12.1.1 (3724) prend le rang 2 de l'échelle, entre Wasp 7.00 (3755 · NNUE) et Stockfish 8 (3693 · HCE), à 31 points de Wasp 7.00 et 31 points au-dessus de Stockfish 8. C'est le moteur HCE le plus fort de l'échelle hors Wasp 7.00, et la dernière grande version HCE de la série Komodo avant la transition Dragon. Avec σ = ±10 sur 75 parties, la mesure est l'une des plus précises de toute la zone supérieure du laboratoire.
Calibration Elo — Stockfish 8 64 POPCNT (8 Threads)
Ce document présente les résultats du gauntlet de calibration de Stockfish 8 64 POPCNT — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3684 Elo). Stockfish est un moteur libre et open-source développé par une équipe internationale de contributeurs, dont les principaux fondateurs sont Tord Romstad (Norvège), Marco Costalba (Italie) et Joona Kiiski (Finlande). La version 8 est une version à évaluation entièrement manuscrite (HCE), publiée en novembre 2016 — l'avant-dernière grande version HCE pure avant la série 9–11 qui précède la révolution NNUE de 2020.
Le moteur et son histoire
Stockfish naît en 2008 de la fusion de deux projets : Glaurung, moteur de Tord Romstad, et les travaux de Marco Costalba. Joona Kiiski rejoint rapidement le projet. Dès ses premières versions, Stockfish adopte une philosophie radicalement ouverte : le code source est publié sous licence GPL, les tests de développement sont distribués via Fishtest (une plateforme communautaire créée en 2012 permettant à des milliers de contributeurs de tester des modifications en parallèle), et toutes les décisions d'amélioration sont validées statistiquement avant intégration.
La progression de Stockfish en termes de rating est sans équivalent dans l'histoire des moteurs d'échecs : de ~2700 Elo à ses débuts en 2008 à plus de 3500 Elo CCRL à l'apogée de la série HCE. La version 8, publiée le 1er novembre 2016, introduit des améliorations significatives de la recherche (notamment du Syzygy tablebase probing optimisé, des améliorations de la réduction LMR et du pruning en fin de recherche) et un affinement de l'évaluation positionnelle. Elle est créditée de 3437 Elo CCRL 40/15 en 4CPU sur i7-4770K.
La transition vers le NNUE s'opère progressivement : Stockfish 12 (août 2020) est la première version officielle avec NNUE activé par défaut, et Stockfish 16.1 supprime définitivement l'option de revenir au HCE classique. Pour les moteurs HCE, Stockfish 8 représente une étape intermédiaire entre les grandes versions 5–7 qui avaient déjà établi la suprématie mondiale du programme, et les versions 9–11 qui constituent l'apogée HCE absolu. La version HCE la plus forte mesurée dans ce laboratoire est SF8, HCE pur.
| Version | Date | Type éval. | Événement / Progrès |
|---|---|---|---|
| 1.0 | Nov. 2008 | HCE | Fusion Glaurung + Costalba — naissance de Stockfish |
| 5 | Mai 2014 | HCE | Introduction de Fishtest — développement distribué massif |
| 7 | Jan. 2016 | HCE | Support Syzygy 6 pièces — ~3400 CCRL |
| 8 | Nov. 2016 | HCE | ~3437 CCRL 4CPU · Version calibrée dans ce laboratoire |
| 11 | Jan. 2020 | HCE | Dernière version HCE pure — apogée absolu HCE |
| 12 | Août 2020 | NNUE | Première version NNUE par défaut — +80 Elo vs SF11 |
| 16.1+ | 2024 | NNUE | Option HCE définitivement supprimée |
Résultats détaillés du gauntlet
| Rencontre (Stockfish 8 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Stockfish 8 8CPU – Caissa 1.5 8CPU | 3684 | 8.5 – 11.5 | 20 | 42.50% |
| Stockfish 8 8CPU – Booot 6.5 x64 8CPU | 3677 | 12.0 – 8.0 | 20 | 60.00% |
| Stockfish 8 8CPU – Wasp 5.50 8CPU | 3673 | 11.5 – 8.5 | 20 | 57.50% |
| Stockfish 8 8CPU – Ethereal 11.75 8CPU | 3635 | 11.0 – 9.0 | 20 | 55.00% |
| Total cumulé | moy. pond. 3667 | 43.0 – 37.0 | 80 | 53.75% |
Elo : 3693
Erreur (σ) : ±10
Nombre de parties : 80
Moyenne pondérée des ancres : (3684×20 + 3677×20 + 3673×20 + 3635×20) / 80 = 3667.
Performance = 3667 + 400 × log₁₀(0.5375 / 0.4625) = 3667 + 400 × 0.0654 = 3693.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.5375 et N = 80 → σ = ±10.
Lecture des résultats
Le gauntlet de Stockfish 8 révèle un profil remarquable. Les trois ancres HCE et NNUE — Booot 6.5 (60%), Wasp 5.50 (57.5%), Ethereal 11.75 (55%) — convergent dans une fenêtre serrée de 3670–3747, attestant d'un style universel sans faiblesse spécifique contre ces adversaires. Le 42.50% contre Caissa 1.5 (3684) sur 20 parties est le seul résultat légèrement défavorable — Caissa, moteur NNUE natif, semble particulièrement bien armé contre le style positionnel profond de Stockfish HCE.
La convergence du rating a été rapide et stable : 3708 sur 18 parties, 3701 sur 52, 3696 sur 61, 3693 sur 80 parties. La fenêtre de variation ne dépasse pas ±15 points depuis la 52e partie, ce qui témoigne d'une mesure bien établie. Avec σ = ±10 sur 80 parties, c'est l'une des mesures les plus fiables de la zone supérieure du laboratoire.
Comparaison avec les listes de référence
Le CCRL 40/15 place Stockfish 8 64-bit 4CPU à 3437 Elo sur Intel i7-4770K. L'écart avec le rating maison (3693) s'élève à +256 points — cohérent avec les autres moteurs HCE de la zone supérieure (Booot 6.5 +298, Deep Shredder 13 +249, Ethereal 11.75 +239). Ce différentiel légèrement inférieur à celui de Booot 6.5 suggère que Stockfish 8 ne bénéficie pas d'un scaling SMP exceptionnel sur Zen 4, contrairement à Booot dont le lazy SMP est particulièrement efficace. Le passage de 4 à 8 threads apporte un gain standard sans surperformance notable.
Notons que Stockfish 8 n'est pas la version HCE la plus forte de la série — Stockfish 11 (janvier 2020), créditée de ~3510 Elo CCRL 4CPU, lui est supérieure d'environ 70–80 points. Dans ce laboratoire, SF11 aurait probablement atteint 3750–3770, ce qui l'aurait placé nettement au-dessus de tous les moteurs actuellement dans l'échelle, y compris Caissa 1.5.
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Stockfish 8 | 3693 | 8 | HCE | Mesuré · σ = ±10 |
| Caissa 1.5 | 3684 | 8 | NNUE | Ancre de calibration — 42.50% |
| Booot 6.5 x64 | 3677 | 8 | HCE | Ancre de calibration — 60.00% |
| Wasp 5.50 | 3673 | 8 | NNUE | Ancre de calibration — 57.50% |
| Ethereal 11.75 x64 | 3635 | 8 | HCE | Ancre inférieure — 55.00% |
Stockfish 8 (3693) prend la tête de l'échelle interne avec une avance de 9 points sur Caissa 1.5 (3684) — un écart inférieur à σ (±10), qui rend les deux moteurs statistiquement indiscernables. Il est le premier moteur HCE pur à dépasser Caissa 1.5 (NNUE). Ce résultat illustre parfaitement la frontière des générations : Stockfish 8, moteur de 2016 à évaluation manuscrite, rivalise directement avec les meilleurs NNUE de 2021–2022 sur ce hardware. La version SF11 (2020) aurait vraisemblablement creusé l'écart encore davantage, portant le plafond HCE absolu de cette échelle bien au-dessus de 3750.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Caissa 1.5 (8 Threads)
Ce document présente les résultats du gauntlet de calibration de Caissa 1.5 — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3576–3677 Elo). Caissa est un moteur libre développé par Michał Witanowski (alias Witek902), développeur polonais de Malbork. Il utilise une évaluation NNUE entièrement personnelle, entraînée sur les parties de Caissa en auto-jeu, et a été calibré en configuration 8 threads dans les conditions standard du laboratoire.
Le moteur et son auteur
Michał Witanowski commence le développement de Caissa en mars 2021, sans aucune connaissance préalable de la programmation d'échecs — il le déclare lui-même lors de sa première apparition sur le forum TalkChess en octobre 2021. À cette date, le moteur tourne à environ 2800 Elo en 10+1 et utilise provisoirement le réseau NNUE de Stockfish 12, en attendant que Witanowski finalise son propre entraîneur. Le choix d'un réseau externe est assumé et transitoire : dès les premières versions, l'auteur travaille en parallèle sur un système d'entraînement et de génération de données propre.
La progression est spectaculaire. En moins de deux ans, Caissa passe de 2800 Elo à plus de 3400, puis 3600 Elo. L'architecture finale retenue est une dual-perspective network (32×768→1024)×2→1, avec 32 king buckets et mises à jour incrémentales efficaces — une architecture moderne comparable à celle de Stockfish.
La version 1.5 marque un tournant technique important : elle introduit une amélioration significative des performances multithreading — le moteur ne crée plus de nouveaux threads à chaque commande go — et entraîne un nouveau réseau sur environ 240 millions de positions. C'est la première version où la gestion du parallélisme devient véritablement optimisée, ce qui explique une partie de ses bonnes performances en 8 threads dans ce laboratoire.
Résultats détaillés du gauntlet
| Rencontre (Caissa 1.5 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Caissa 1.5 8CPU – Booot 6.5 x64 8CPU | 3677 | 11.5 – 8.5 | 20 | 57.50% |
| Caissa 1.5 8CPU – Wasp 5.50 8CPU | 3673 | 10.5 – 9.5 | 20 | 52.50% |
| Caissa 1.5 8CPU – Ethereal 11.75 x64 8CPU | 3635 | 10.5 – 9.5 | 20 | 52.50% |
| Caissa 1.5 8CPU – Deep Shredder 13 x64 8CPU | 3576 | 12.5 – 7.5 | 20 | 62.50% |
| Total cumulé | moy. pond. 3640 | 45.0 – 35.0 | 80 | 56.25% |
Elo : 3684
Erreur (σ) : ±10
Nombre de parties : 80
Moyenne pondérée des ancres : (3677×20 + 3673×20 + 3635×20 + 3576×20) / 80 = 3640.
Performance = 3640 + 400 × log₁₀(0.5625 / 0.4375) = 3640 + 400 × 0.1094 = 3684.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.5625 et N = 80 → σ = ±10.
Lecture des résultats
Le gauntlet de Caissa 1.5 a convergé progressivement et régulièrement : 3670 sur 14 parties, 3665 sur 31, 3681 sur 60, 3689 sur 65, 3684 sur 80 parties. La fenêtre de variation n'excède pas ±24 points sur l'ensemble du gauntlet, et se resserre à ±8 points sur les 50 dernières parties — signe d'une mesure bien établie avec σ = ±10.
Les deux ancres les plus structurantes sont le 52.50% contre Wasp 5.50 (3673) sur 20 parties et le 52.50% contre Ethereal 11.75 (3635) sur 20 parties — des quasi-parités qui indiquent que Caissa 1.5 domine légèrement ces deux moteurs mais sans écart statistiquement décisif. Le 57.50% contre Booot 6.5 (3677) sur 20 parties est le résultat le plus intéressant : Caissa 1.5 domine Booot 6.5 avec une marge de 7.5 points nette, soit un écart de l'ordre de 28–30 points Elo — inférieur à σ mais constant sur l'ensemble du gauntlet. Le 62.50% contre Deep Shredder 13 (3576) confirme une domination solide sur la zone inférieure.
Un marqueur notable : les perfs individuelles contre Wasp 5.50 (3690) et Ethereal 11.75 (3652) sont presque identiques malgré 38 points d'écart entre les deux ancres. Caissa semble obtenir le même résultat relatif quel que soit le style de l'adversaire dans cette zone — HCE ou NNUE — ce qui témoigne d'un profil stylistique universel, sans faiblesse caractérisée.
Comparaison avec les listes de référence
Le CCRL 40/15 place Caissa 1.5 64-bit 4CPU à 3453 Elo sur Intel i7-4770K. L'écart avec le rating maison (3684) s'élève à +231 points — le différentiel le plus faible de toute la zone supérieure de l'échelle. À titre de comparaison, les moteurs HCE de la même zone affichent des différentiels nettement supérieurs : Booot 6.5 +298 points, Ethereal 11.75 +239 points, Deep Shredder 13 +249 points. Ce résultat confirme une caractéristique bien documentée des moteurs NNUE modernes : leur évaluation par réseau de neurones atteint déjà un niveau d'efficacité élevé sur processeur i7-4770K, laissant peu de marge de progression supplémentaire sur Zen 4, contrairement aux moteurs HCE dont les gains de fréquence et d'IPC sont plus directement exploitables.
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Stockfish 8 64 POPCNT | 3693 | 8 | HCE | Référence supérieure |
| Caissa 1.5 | 3684 | 8 | NNUE | Mesuré · σ = ±10 |
| Booot 6.5 x64 | 3677 | 8 | HCE | Ancre supérieure — 57.50% |
| Wasp 5.50 | 3673 | 8 | NNUE | Ancre de calibration — 52.50% |
| Ethereal 11.75 x64 | 3635 | 8 | HCE | Ancre de calibration — 52.50% |
| Deep Shredder 13 x64 | 3576 | 8 | HCE | Ancre inférieure — 62.50% |
Caissa 1.5 (3684) occupe le second rang de l'échelle interne, à 9 points seulement derrière Stockfish 8 (3693) — un écart inférieur à σ (±10), qui rend les deux moteurs statistiquement indiscernables. Caissa 1.5 devance Booot 6.5 (3677 · HCE) de 7 points, écart également inférieur à σ. Ce résultat est d'autant plus remarquable que Caissa 1.5 est une version de fin 2022, développée par un autodidacte sans expérience préalable de la programmation d'échecs — et qu'elle rivalise directement avec Booot 6.5, l'aboutissement de dix années de développement HCE par un auteur expérimenté.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Booot 6.5 x64 (8 Threads)
Ce document présente les résultats du gauntlet de calibration de Booot 6.5 x64 — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3507–3673 Elo). Booot est un moteur libre développé par Alex Morozov, développeur ukrainien, écrit en Pascal (Delphi / Free Pascal) et distribué en open-source. Il supporte le multi-threading et a été calibré dans les conditions standard du laboratoire, en version x64-popcnt.
Le moteur et son auteur
Alex Morozov commence le développement de Booot au début des années 2000, dans la tradition des moteurs autodidactes de l'époque. La genèse du projet est modeste : les premières versions affrontent des moteurs comme TSCP ou Mustang, et Booot 3.3 est déjà estimé à environ 2300 Elo. Dès la version 4, Morozov intègre le protocole UCI (à partir de la 4.2), ouvrant le moteur aux interfaces modernes. La version 4.15.1, publiée en 2009, marque l'aboutissement de cette première grande période : Booot atteint alors les 2533 Elo CCRL, et son code source est partagé librement — un geste rare qui contribue à sa notoriété dans la communauté.
La série 5 est une période de consolidation. La version 5.2.0, distribuée avec les sources et les exécutables 32/64 bits, confirme la régularité du projet. C'est avec la série 6, à partir de l'automne 2016, que Booot connaît sa véritable ascension. La version 6.1 (octobre 2016) introduit une refonte majeure de l'évaluation et un algorithme de parallélisme SMP dit « lazy » — c'est à ce moment que le moteur entre véritablement dans la cour des grands. Les versions se succèdent à un rythme soutenu :
| Version | Date | Événement / Progrès | CCRL estimé |
|---|---|---|---|
| 6.1 | Oct. 2016 | Refonte évaluation, lazy SMP | ~3100 |
| 6.2 | Mai 2017 | Améliorations search et évaluation | ~3160 |
| 6.3 | Juin 2018 | +70–100 Elo selon l'auteur — participation WCCC Stockholm | ~3250 |
| 6.3.1 | 2018 | Version stabilisée, la plus testée du CCRL Archive | 3261 (1CPU) |
| 6.4 | Avr. 2020 | Retour remarqué après deux ans — résultats au-dessus des attentes | ~3320 |
| 6.5 | Mars 2021 | Dernière version HCE — sommet de la série classique | 3379 (4CPU) |
| 7.0 | 2022 | Transition NNUE — implémentation personnelle en Pascal/SIMD | >3500 |
| 7.1+ | 2023 | Développement continu sur la base NNUE | >3500 |
Booot 6.5, publié le 21 mars 2021, constitue l'aboutissement de cinq années de développement HCE ininterrompu. C'est la dernière version à évaluation purement manuscrite avant que Morozov ne franchisse lui-même le pas vers le NNUE avec la version 7.0 — un passage qu'il a mené de bout en bout : implémentation du réseau de neurones en Pascal, entraînement en Python, accélération SIMD. La version 6.5 reste une référence pour tous ceux qui souhaitent évaluer la force maximale atteignable par un moteur HCE moderne bien parallélisé.
Résultats détaillés du gauntlet
| Rencontre (Booot 6.5 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Booot 6.5 8CPU – Wasp 5.50 8CPU | 3673 | 9.5 – 8.5 | 18 | 52.78% |
| Booot 6.5 8CPU – Deep Shredder 13 8CPU | 3576 | 11.0 – 8.0 | 19 | 57.89% |
| Booot 6.5 8CPU – Houdini 4 Pro 8CPU | 3556 | 14.0 – 5.0 | 19 | 73.68% |
| Booot 6.5 8CPU – Gull 3 x64 8CPU | 3507 | 13.5 – 5.5 | 19 | 71.05% |
| Total cumulé | moy. pond. 3577 | 48.0 – 27.0 | 75 | 64.00% |
Elo : 3677 (préliminaire — 75/80 parties)
Erreur (σ) : ±10
Nombre de parties : 75
Moyenne pondérée des ancres : (3673×18 + 3576×19 + 3556×19 + 3507×19) / 75 = 3577.
Performance = 3577 + 400 × log₁₀(0.6400 / 0.3600) = 3577 + 400 × 0.2499 = 3677.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.6400 et N = 75 → σ = ±10.
Lecture des résultats
Le gauntlet de Booot 6.5 présente un profil très cohérent. Les quatre perfs individuelles s'étalent sur 104 points (3631–3735), ce qui est raisonnable pour un gauntlet couvrant 166 points d'écart entre les ancres les plus éloignées. La convergence du rating a été progressive mais régulière : 3601 sur 11 parties, 3644 sur 32, 3674 sur 41, 3686 sur 59, 3677 sur 75 parties. La fenêtre de variation n'excède pas ±15 points depuis la 41e partie, signe d'une mesure désormais bien établie.
Les deux ancres les plus structurantes sont le 52.78% contre Wasp 5.50 (3673) sur 18 parties — qui place Booot 6.5 en quasi-parité avec Wasp 5.50, le moteur NNUE co-leader de l'échelle — et le 57.89% contre Deep Shredder 13 (3576) sur 19 parties, qui établit une domination claire sur l'ex-leader HCE. Ces deux résultats encadrent une zone de 3576–3673 au sein de laquelle la performance calculée de 3677 se positionne logiquement. Le 73.68% contre Houdini 4 Pro et le 71.05% contre Gull 3 confirment la domination de Booot sur l'ensemble de la zone 3507–3556.
Comparaison avec les listes de référence
Le CCRL 40/15 place Booot 6.5 64-bit 4CPU à 3379 Elo sur Intel i7-4770K, basé sur 112 parties. L'écart avec le rating maison (3677) est de +298 points — le différentiel le plus élevé observé parmi les moteurs HCE de l'échelle. À titre de comparaison, Deep Shredder 13 affiche +249 points (3327 → 3576), Gull 3 +247 points (3260 → 3507), Houdini 4 +224 points (3332 → 3556), Critter 1.6a +225 points (3233 → 3458). Booot 6.5 dépasse tous ces différentiels, ce qui suggère une implémentation du parallélisme SMP particulièrement efficace sur les cœurs Zen 4 du Ryzen 9 7950X3D.
Note : Booot 6.5 est la dernière version HCE de la série — la version 7.0 a introduit le NNUE en 2022 avec une implémentation entièrement personnelle de Morozov. Booot 6.5 représente donc l'aboutissement ultime du développement HCE du moteur.
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| Booot 6.5 x64 | 3677 | 8 | HCE | Mesuré · σ = ±10 · 75/80 parties |
| Wasp 5.50 | 3673 | 8 | NNUE | Ancre supérieure — 52.78% |
| Deep Shredder 13 | 3576 | 8 | HCE | Ancre de calibration — 57.89% |
| Houdini 4 Pro x64 | 3556 | 8 | HCE | Ancre de calibration — 73.68% |
| Gull 3 x64 | 3507 | 8 | HCE | Ancre inférieure — 71.05% |
Booot 6.5 (3677) occupe le sommet de l'échelle interne ex-aequo avec Wasp 5.50 (3673 · NNUE) à 4 points près — un écart inférieur à σ, qui rend les deux moteurs statistiquement indiscernables. C'est un résultat remarquable pour un moteur HCE : Booot 6.5 est le seul moteur à évaluation manuscrite capable de rivaliser à ce niveau avec un moteur NNUE dans ce laboratoire. Il devance Deep Shredder 13 de 101 points et Houdini 4 Pro de 121 points.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Wasp 5.50 (8 Threads)
Ce document présente les résultats du gauntlet de calibration de Wasp 5.50 — 8 threads, joué contre trois moteurs d'ancrage de la zone supérieure de l'échelle interne (3507–3576 Elo). Wasp est un moteur libre développé par John Stanback, reconnu pour son style de jeu agressif et ses qualités tactiques. La version 5.50 intègre une évaluation NNUE (Efficiently Updatable Neural Network), introduite dès Wasp 5.00 — ce qui en fait le premier moteur à réseau de neurones à figurer dans l'échelle interne du laboratoire.
Ce rapport est établi à mi-gauntlet. Les scores ont été obtenus sur 20 parties par adversaire. Le rating de 3673 est stable depuis 47 parties dans une fenêtre de ±13 points (3661–3673), ce qui justifie la publication de ce rapport intermédiaire.
Résultats détaillés du gauntlet
| Rencontre (Wasp 5.50 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Wasp 5.50 8CPU – Deep Shredder 13 8CPU | 3576 | 10.0 – 10.0 | 20 | 50.00% |
| Wasp 5.50 8CPU – Houdini 4 Pro 8CPU | 3556 | 16.0 – 4.0 | 20 | 80.00% |
| Wasp 5.50 8CPU – Gull 3 x64 8CPU | 3507 | 14.5 – 5.5 | 20 | 72.50% |
| Total cumulé | moy. pond. 3546 | 40.5 – 19.5 | 60 | 67.50% |
Elo : 3673 (intermédiaire — 60/90 parties)
Erreur (σ) : ±11
Nombre de parties : 60
Moyenne pondérée des ancres : (3576×20 + 3556×20 + 3507×20) / 60 = 3546.
Performance = 3546 + 400 × log₁₀(0.6750 / 0.3250) = 3546 + 400 × 0.3174 = 3673.
Lecture des résultats
L'ancre la plus directe et la plus fiable est le 50.00% exact contre Deep Shredder 13 (3576) sur 20 parties — un résultat qui, pris seul, placerait Wasp 5.50 à la stricte parité avec Deep Shredder 13. À l'opposé, le 80.00% contre Houdini 4 Pro (3556) sur 20 parties — Houdini 4 étant lui-même calibré à seulement 20 points en dessous de Deep Shredder 13 — indique un niveau nettement supérieur. Le 72.50% contre Gull 3 (3507) sur 20 parties confirme la domination de Wasp 5.50 sur cette zone.
Cette apparente contradiction se résout si l'on accepte que Wasp 5.50 a un profil stylistique particulièrement défavorable à Houdini 4 — son jeu tactique agressif correspondant exactement au type d'adversaire contre lequel Houdini 4 résiste moins bien.
Comparaison avec les listes de référence
Le CCRL 40/15 place Wasp 5.50 64-bit 4CPU à 3397 Elo sur Intel i7-4770K. L'écart avec le rating maison (3673) s'élève à +276 points. Wasp 5.50 bénéficie particulièrement du passage en 8 threads sur architecture Zen 4, probablement grâce à une implémentation du parallélisme plus efficace que ses contemporains.
Wasp 5.50 (3673) occupe le sommet de l'échelle interne ex-aequo avec Booot 6.5 (3677). Wasp 5.50 est le premier moteur NNUE de l'échelle, illustrant l'avantage considérable que procure l'évaluation par réseau de neurones sur les moteurs HCE de même génération.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Ethereal 11.75 x64 (8 Threads)
Ce document présente les résultats du gauntlet de calibration de Ethereal 11.75 x64 — 8 threads, joué contre cinq moteurs d'ancrage de la zone supérieure de l'échelle interne (3507–3677 Elo). Ethereal est un moteur libre développé par Andrew Grant, informaticien et mathématicien américain. La version 11.75 est une version à évaluation entièrement manuscrite (HCE), publiée en novembre 2019 — l'une des dernières grandes versions HCE avant la transition NNUE qui marquera la série 13.
Le moteur et son auteur
Andrew Grant est étudiant en informatique et mathématiques à l'University of Maryland, Baltimore County, lorsqu'il publie la première version officielle d'Ethereal en juin 2016. La progression est fulgurante : en l'espace de deux ans, Ethereal passe d'un moteur de niveau amateur à un concurrent sérieux des meilleurs programmes du monde. En 2018, Ethereal remporte la Division 4 puis la Division 3 du TCEC.
L'une des contributions les plus durables de Grant à la communauté est OpenBench, un framework de test distribué inspiré de Fishtest. La version 11.75, publiée le 11 novembre 2019, introduit notamment le support complet du MultiPV. La rupture arrive en juin 2021 : Grant annonce la sortie commerciale d'Ethereal 13.00 intégrant le NNUE. En 2023, il devient responsable technique de Torch, le moteur interne de Chess.com.
Résultats détaillés du gauntlet
| Rencontre (Ethereal 11.75 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Ethereal 11.75 8CPU – Booot 6.5 x64 8CPU | 3677 | 7.0 – 7.0 | 14 | 50.00% |
| Ethereal 11.75 8CPU – Wasp 5.50 8CPU | 3673 | 5.0 – 8.0 | 13 | 38.46% |
| Ethereal 11.75 8CPU – Deep Shredder 13 8CPU | 3576 | 8.0 – 6.0 | 14 | 57.14% |
| Ethereal 11.75 8CPU – Houdini 4 Pro 8CPU | 3556 | 9.0 – 4.0 | 13 | 69.23% |
| Ethereal 11.75 8CPU – Gull 3 x64 8CPU | 3507 | 8.0 – 5.0 | 13 | 61.54% |
| Total cumulé | moy. pond. 3599 | 37.0 – 30.0 | 67 | 55.22% |
Elo : 3635 (préliminaire — 67/75 parties)
Erreur (σ) : ±11
Nombre de parties : 67
Moyenne pondérée des ancres : (3677×14 + 3673×13 + 3576×14 + 3556×13 + 3507×13) / 67 = 3599.
Performance = 3599 + 400 × log₁₀(0.5522 / 0.4478) = 3599 + 400 × 0.0910 = 3635.
Lecture des résultats
Le rating s'est stabilisé autour de 3635 dès la 41e partie et n'a plus bougé que dans une fenêtre de ±16 points jusqu'à la 67e. L'ancre directe la plus solide est le 50.00% exact contre Booot 6.5 (3677) sur 14 parties — un résultat sur grand effectif qui place Ethereal 11.75 en parité stricte avec le co-leader de l'échelle.
En regard, le 38.46% contre Wasp 5.50 (3673) sur 13 parties dessine une nette infériorité vis-à-vis de Wasp — une divergence difficile à expliquer puisque Booot et Wasp sont calibrés à seulement 4 points d'écart. Cette asymétrie stylistique (Ethereal semble mieux s'entendre avec le style HCE de Booot qu'avec le jeu NNUE de Wasp) est un marqueur intéressant.
Comparaison avec les listes de référence
Le CCRL 40/15 place Ethereal 11.75 64-bit 4CPU à 3396 Elo sur Intel i7-4770K, basé sur 670 parties. L'écart avec le rating maison (3635) s'élève à +239 points, différentiel parfaitement cohérent avec les autres moteurs HCE de la zone supérieure.
Ethereal 11.75 (3635) comble exactement le vide qui existait entre Deep Shredder 13 (3576) et le duo Booot/Wasp (3673–3677). Il s'intercale à 59 points au-dessus de DS13 et à seulement 38–42 points en dessous du sommet.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Deep Shredder 13 x64 (8 Threads)
Ce document présente les résultats de calibration de Deep Shredder 13 x64 — 8 threads, joué contre trois moteurs d'ancrage de la zone sommet de l'échelle interne (3398–3458 Elo). Deep Shredder 13 est le moteur emblématique de Stefan Meyer-Kahlen, dernière version commerciale de la série Shredder — un moteur traditionnel basé sur une évaluation entièrement manuscrite, sans réseau de neurones, reconnu pour ses qualités positionnelles et son scaling exceptionnel avec les ressources matérielles.
Le gauntlet complet comprend cinq adversaires (Critter, Wasp 3.75, Naum 4.2, Senpai 2.0, Komodo64 3) sur 99 parties au total. Les résultats présentés ici excluent volontairement Senpai 2.0 et Komodo64 3, dont les scores respectifs (82.50% et 90.00%) tirent la performance vers le haut de façon disproportionnée. Le périmètre retenu — Critter, Wasp 3.75 et Naum 4.2, soit 59 parties — produit une estimation plus conservative.
Résultats détaillés du gauntlet (périmètre retenu)
| Rencontre (Deep Shredder 13 8CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Deep Shredder 13 8CPU – Critter 1.6a 64-bit 8CPU | 3458 | 13.5 – 6.5 | 20 | 67.50% |
| Deep Shredder 13 8CPU – Wasp 3.75 8CPU | 3420 | 13.5 – 6.5 | 20 | 67.50% |
| Deep Shredder 13 8CPU – Naum 4.2 8CPU | 3398 | 14.5 – 4.5 | 19 | 76.32% |
| Total cumulé | moy. pond. 3426 | 41.5 – 17.5 | 59 | 70.34% |
Elo : 3576
Erreur (σ) : ±10
Nombre de parties : 59
Moyenne pondérée des ancres : (3458×20 + 3420×20 + 3398×19) / 59 = 3426.
Performance = 3426 + 400 × log₁₀(0.7034 / 0.2966) = 3426 + 400 × 0.3750 = 3576.
Lecture des résultats
Le résultat le plus remarquable du gauntlet est la symétrie parfaite entre les deux premières ancres : 67.50% aussi bien contre Critter 1.6a (3458) que contre Wasp 3.75 (3420), sur 20 parties chacun. Cette coïncidence n'est pas fortuite — elle indique que Deep Shredder 13 se situe très précisément dans la zone 3540–3580.
Comparaison avec les listes de référence
Le CCRL 40/2 Archive place Deep Shredder 13 64-bit 4CPU à 3323, et le CCRL 40/15 à 3328. L'écart avec le rating maison (3576) est de l'ordre de +250 points. La SSDF, qui a testé Deep Shredder 13 sur un Ryzen 7 1800X 8 cœurs, l'avait calibré à 3560 (±47) — une valeur remarquablement proche du rating maison, ce qui valide la cohérence du laboratoire avec cette référence externe utilisant un hardware Ryzen comparable.
Deep Shredder 13 dépasse Critter 1.6a de 118 points et s'installe nettement au sommet de l'échelle des HCE classiques. La cohérence avec la SSDF Ryzen (3560 ± 47) — à seulement 16 points du rating maison — est l'une des validations externes les plus directes obtenues dans ce laboratoire.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Houdini 4 Pro x64 (8 Threads)
Ce document présente les résultats du gauntlet de calibration de Houdini 4 Pro x64 — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3420–3576 Elo). Houdini est un moteur commercial développé par Robert Houdart, réputé pour son style de jeu universel.
Un gauntlet préalable de Houdini 6 Pro (popcnt) a produit un résultat aberrant : 3555 Elo dans ce laboratoire, soit un gain de seulement +39 points par rapport à son rating CCRL 40/2 Archive 4CPU (3516), alors que Deep Shredder 13 affiche +253 points dans les mêmes conditions. Cette inversion de hiérarchie est cohérente avec un mode dégradé provoqué par une activation de licence manquante. Houdini 4 est retenu comme référence fiable.
Résultats détaillés du gauntlet
| Rencontre (Houdini 4 Pro 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Houdini 4 Pro 8CPU – Deep Shredder 13 8CPU | 3576 | 11.5 – 13.5 | 25 | 46.00% |
| Houdini 4 Pro 8CPU – Gull 3 x64 8CPU | 3507 | 13.5 – 12.5 | 26 | 51.92% |
| Houdini 4 Pro 8CPU – Critter 1.6a 64-bit 8CPU | 3458 | 18.0 – 8.0 | 26 | 69.23% |
| Houdini 4 Pro 8CPU – Wasp 3.75 8CPU | 3420 | 17.5 – 7.5 | 25 | 70.00% |
| Total cumulé | moy. pond. 3490 | 60.5 – 41.5 | 102 | 59.31% |
Elo : 3556
Erreur (σ) : ±8
Nombre de parties : 102
Moyenne pondérée des ancres : (3576×25 + 3507×26 + 3458×26 + 3420×25) / 102 = 3490.
Performance = 3490 + 400 × log₁₀(0.5931 / 0.4069) = 3490 + 400 × 0.1637 = 3556.
Lecture des résultats
Les perfs individuelles s'étalent sur seulement 79 points (3520–3599), ce qui est une dispersion exceptionnellement faible. Le 50% exact contre Gull 3 (à 0.92% près) est l'ancre de calibration la plus directe disponible dans ce gauntlet.
Comparaison avec les listes de référence
Le CCRL 40/2 Archive place Houdini 4 Pro en 4CPU à environ 3332 Elo sur Intel i7-4770K. L'écart avec le rating maison (3556) s'élève à +224 points, ce qui reflète le cumul du passage de 4 à 8 threads et du gain de fréquence/IPC du Ryzen 9 7950X3D.
Houdini 4 Pro (3556) s'intercale entre Deep Shredder 13 (3576) et Gull 3 (3507). Avec σ = ±8 sur 102 parties, le rating de Houdini 4 Pro est l'un des mieux établis de toute la zone supérieure du laboratoire.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Gull 3 x64 (8 Threads)
Ce document présente les résultats complets du gauntlet de calibration dédié de Gull 3 x64 — 8 threads, joué contre quatre moteurs d'ancrage de la zone sommet de l'échelle interne (3398–3576 Elo). Gull 3 est un moteur libre à évaluation entièrement manuscrite (HCE), développé par Stefan Plenkner et publié en 2014.
Résultats détaillés du gauntlet
| Rencontre (Gull 3 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Gull 3 8CPU – Deep Shredder 13 8CPU | 3576 | 8.0 – 12.0 | 20 | 40.00% |
| Gull 3 8CPU – Critter 1.6a 64-bit 8CPU | 3458 | 11.5 – 8.5 | 20 | 57.50% |
| Gull 3 8CPU – Wasp 3.75 8CPU | 3420 | 11.0 – 9.0 | 20 | 55.00% |
| Gull 3 8CPU – Naum 4.2 8CPU | 3398 | 14.5 – 5.5 | 20 | 72.50% |
| Total cumulé | moy. pond. 3463 | 45.0 – 35.0 | 80 | 56.25% |
Elo : 3507
Erreur (σ) : ±10
Nombre de parties : 80
Moyenne pondérée des ancres : (3576×20 + 3458×20 + 3420×20 + 3398×20) / 80 = 3463.
Performance = 3463 + 400 × log₁₀(0.5625 / 0.4375) = 3463 + 400 × 0.1091 = 3507.
Lecture des résultats
Profil en nette progression monotone — des 40.00% contre Deep Shredder 13 jusqu'aux 72.50% contre Naum 4.2. Mesuré à 3516 sur 20 parties, à 3507 sur 40, à 3495 sur 55, et à 3507 au terme des 80 parties, le rating a convergé avant même la mi-gauntlet.
Comparaison avec les listes de référence
Le CCRL 40/2 Archive place Gull 3 64-bit 4CPU à 3260 Elo sur Intel i7-4770K, avec 4832 parties. L'écart avec le rating maison (3507) s'élève à +247 points. Gull 3 est un moteur entièrement HCE — son évaluation est purement manuscrite, sans réseau de neurones d'aucune sorte.
Gull 3 s'intercale entre Critter 1.6a (3458) et Deep Shredder 13 (3576), à 49 points au-dessus de Critter et 69 points en dessous de Deep Shredder.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Critter 1.6a 64-bit (8 Threads)
Ce document présente les résultats complets du gauntlet de calibration dédié de Critter 1.6a 64-bit — 8 threads, joué contre six moteurs d'ancrage couvrant la zone haute de l'échelle interne (3234–3420 Elo). Critter est un moteur UCI développé par Richard Vida, dont la version 1.6a — publiée en 2012 — constitue l'une des plus abouties de la série.
Résultats détaillés du gauntlet
| Rencontre (Critter 1.6a 8CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Critter 1.6a 8CPU – Wasp 3.75 8CPU | 3420 | 5.5 – 7.5 | 13 | 42.31% |
| Critter 1.6a 8CPU – Senpai 2.0 8CPU | 3380 | 7.0 – 5.0 | 12 | 58.33% |
| Critter 1.6a 8CPU – Naum 4.2 8CPU | 3398 | 8.0 – 5.0 | 13 | 61.54% |
| Critter 1.6a 8CPU – Komodo64 3 1CPU | 3359 | 9.0 – 4.0 | 13 | 69.23% |
| Critter 1.6a 8CPU – Wasp 2.00 8CPU | 3297 | 10.0 – 3.0 | 13 | 76.92% |
| Critter 1.6a 8CPU – Rybka 2.4 mp 32-bit 8CPU | 3234 | 10.0 – 2.0 | 12 | 83.33% |
| Total cumulé | moy. pond. 3349 | 49.5 – 26.5 | 76 | 65.13% |
Elo : 3458
Erreur (σ) : ±9
Nombre de parties : 76
Moyenne pondérée des ancres : (3420×13 + 3380×12 + 3398×13 + 3359×13 + 3297×13 + 3234×12) / 76 = 3349.
Performance = 3349 + 400 × log₁₀(0.6513 / 0.3487) = 3349 + 400 × 0.2714 = 3458.
Lecture des résultats
Le gauntlet est l'un des plus fournis et des mieux équilibrés du laboratoire : six adversaires distincts, 76 parties, et un σ = ±9 qui en fait l'une des mesures les plus précises. La gradation est régulière : 42.31% contre Wasp 3.75, 58.33% contre Senpai 2.0, 61.54% contre Naum 4.2, 69.23% contre Komodo64 3, 76.92% contre Wasp 2.00, et 83.33% contre Rybka 2.4 mp.
Comparaison avec les listes de référence
Le CCRL 40/2 place Critter 1.6a aux alentours de 3200 en 1 CPU et de 3290–3310 en 4 CPU. Le rating maison en 8 threads (3458) se situe environ +150 points au-dessus du CCRL 4CPU.
Critter 1.6a prend la tête de l'échelle interne avec σ = ±9. Son avance sur Wasp 3.75 (+38 points) est probable mais non définitivement tranchée : le résultat direct penche en faveur de Wasp 3.75.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Wasp 3.75 (8 Threads)
Ce document présente les résultats complets du gauntlet de calibration dédié de Wasp 3.75 — 8 threads, joué contre les deux moteurs d'ancrage de la zone supérieure : Naum 4.2 (8 threads) et Wasp 2.01 (8 threads). Wasp est un moteur libre développé par John Stanback. La version 3.75 est une version pré-NNUE — l'évaluation est entièrement manuscrite (HCE) — qui constitue le pic de la série classique avant le passage au réseau de neurones avec Wasp 5.
Résultats détaillés du gauntlet
| Rencontre (Wasp 3.75 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Wasp 3.75 8CPU – Naum 4.2 8CPU | 3398 | 18.5 – 11.5 | 30 | 61.67% |
| Wasp 3.75 8CPU – Wasp 2.01 8CPU | 3297 | 17.0 – 12.0 | 29 | 58.62% |
| Total cumulé | moy. pond. 3348 | 35.5 – 23.5 | 59 | 60.17% |
Elo : 3420
Erreur (σ) : ±26
Nombre de parties : 59
Moyenne pondérée des ancres : (3398×30 + 3297×29) / 59 = 3348.
Performance = 3348 + 400 × log₁₀(0.6017 / 0.3983) = 3348 + 400 × 0.1791 = 3420.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.6017 et N = 59 → σ = ±26.
Lecture des résultats
Le gauntlet de Wasp 3.75 ne s'appuie que sur deux ancres directes mais profondes : Naum 4.2 (3398) sur 30 parties et Wasp 2.01 (3297) sur 29 parties. La large erreur (±26) résulte de cette concentration sur deux adversaires plutôt qu'une grande diversité — mais les deux scores convergent dans le même sens (61.67% et 58.62%), ce qui consolide la mesure malgré l'erreur statistique relativement élevée.
Le résultat le plus structurant est le 61.67% contre Naum 4.2 (3398) sur 30 parties : il établit une domination claire et statistiquement solide sur l'ancre la plus haute du gauntlet, plaçant Wasp 3.75 environ 80 points au-dessus de Naum 4.2. Le 58.62% contre Wasp 2.01 (3297) est un résultat intra-série particulièrement éclairant : il quantifie la progression réelle de Wasp entre les versions 2.01 et 3.75.
Cohérence avec le CCRL
L'écart mesuré entre Wasp 2.01 et Wasp 3.75 dans le tournoi maison (3297 → 3420, soit +123 points) trouve une confirmation remarquable dans les listes de référence du CCRL, qui placent les mêmes deux versions à respectivement 3061 et 3189 en configuration 4CPU, soit un écart de +128 points. La quasi-identité des deux deltas — 123 vs 128 — valide la cohérence interne du système de calibration.
| Source | Wasp 2.01 | Wasp 3.75 | Écart Δ | Configuration |
|---|---|---|---|---|
| Tournoi maison | 3297 | 3420 | +123 | 8 threads · Ryzen 9 7950X3D |
| CCRL 40/2 | 3061 | 3189 | +128 | 4CPU · Intel i7-4770K |
L'écart absolu entre les deux référentiels (~+236 points en moyenne) reflète mécaniquement le gain apporté par le passage de 4 à 8 threads sur un Ryzen 9 7950X3D face à l'i7-4770K. Le delta inter-versions reste stable à 5 points près, indépendamment du matériel.
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Critter 1.6a 64-bit | 3458 | 8 | Référence supérieure |
| Wasp 3.75 | 3420 | 8 | Mesuré · σ = ±26 |
| Naum 4.2 | 3398 | 8 | Ancre supérieure — 61.67% |
| Wasp 2.01 | 3297 | 8 | Ancre inférieure — 58.62% |
Wasp 3.75 (3420) s'intercale entre Critter 1.6a (3458) et Naum 4.2 (3398), à 38 points sous Critter et 22 points au-dessus de Naum. La validation par cohérence inter-versions avec le CCRL (+123 vs +128) renforce considérablement la fiabilité de cette mesure malgré l'erreur élevée.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Naum 4.2 (8 Threads)
Ce document présente les résultats complets du gauntlet de calibration dédié de Naum 4.2 — 8 threads, joué contre les trois moteurs d'ancrage de la zone intermédiaire : Wasp 2.00, Rybka 2.4 MP et Glaurung 2.2 JA. Naum est un moteur commercial développé par Aleksandar Naumov, programmeur serbe, dont la version 4.2 publiée en 2010 constitue l'aboutissement de la série — la dernière version distribuée par Chess Assistant.
Résultats détaillés du gauntlet
| Rencontre (Naum 4.2 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Naum 4.2 8CPU – Wasp 2.00 8CPU | 3297 | 11.5 – 8.5 | 20 | 57.50% |
| Naum 4.2 8CPU – Rybka 2.4 MP 32-bit 8CPU | 3234 | 13.5 – 5.5 | 19 | 71.05% |
| Naum 4.2 8CPU – Glaurung 2.2 JA 8CPU | 3163 | 17.5 – 2.5 | 20 | 87.50% |
| Total cumulé | moy. pond. 3231 | 42.5 – 16.5 | 59 | 72.03% |
Elo : 3398
Erreur (σ) : ±23
Nombre de parties : 59
Moyenne pondérée des ancres : (3297×20 + 3234×19 + 3163×20) / 59 = 3231.
Performance = 3231 + 400 × log₁₀(0.7203 / 0.2797) = 3231 + 167 = 3398.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.7203 et N = 59 → σ = ±23.
Lecture des résultats
Le gauntlet de Naum 4.2 présente un profil en progression rigoureusement monotone : 57.50% contre Wasp 2.00 (3297), 71.05% contre Rybka 2.4 MP (3234), 87.50% contre Glaurung 2.2 JA (3163). La gradation est parfaitement cohérente avec l'écart Elo des ancres, ce qui valide la solidité du rating obtenu sans aucune anomalie stylistique. Le 57.50% contre Wasp 2.00 — l'ancre la plus haute du gauntlet — positionne précisément Naum 4.2 environ 100 points au-dessus de Wasp 2.00.
Comparaison avec les listes de référence
Le CCRL 40/2 place Naum 4.2 64-bit 4CPU à environ 3098 Elo sur Intel i7-4770K. L'écart avec le rating maison (3398) s'élève à +300 points, cohérent avec les autres moteurs de la zone supérieure de l'échelle. Naum 4.2 est l'une des dernières versions HCE pures à atteindre ce niveau dans les listes officielles.
| Moteur | Elo interne | Threads | Remarque |
|---|---|---|---|
| Wasp 3.75 | 3420 | 8 | Référence supérieure |
| Naum 4.2 | 3398 | 8 | Mesuré · σ = ±23 |
| Senpai 2.0 | 3380 | 8 | Référence inférieure proche |
| Wasp 2.00 | 3297 | 8 | Ancre supérieure — 57.50% |
| Rybka 2.4 MP 32-bit | 3234 | 8 | Ancre de calibration — 71.05% |
| Glaurung 2.2 JA | 3163 | 8 | Ancre inférieure — 87.50% |
Naum 4.2 (3398) sert lui-même d'ancre de calibration pour de nombreux gauntlets ultérieurs (Wasp 3.75, Senpai 2.0, Critter 1.6a, Komodo64 3, Deep Shredder 13). Avec σ = ±23 sur 59 parties contre 3 ancres distinctes, sa mesure est l'une des plus fondamentales de toute la zone supérieure du laboratoire — c'est sur ce socle que repose l'ensemble de la calibration des moteurs de la zone 3300–3500.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Senpai 2.0 (8 Threads)
Ce document présente les résultats complets du gauntlet de calibration dédié de Senpai 2.0 — 8 threads, joué contre cinq moteurs d'ancrage couvrant la zone haute de l'échelle interne (3163–3420 Elo). Senpai est un moteur UCI développé par Fabien Letouzey — l'auteur de Fruit — et publié autour de 2014–2015.
Résultats détaillés du gauntlet
| Rencontre (Senpai 2.0 8CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Senpai 2.0 8CPU – Komodo64 3 1CPU | 3359 | 6.0 – 4.0 | 10 | 60.00% |
| Senpai 2.0 8CPU – Naum 4.2 8CPU | 3398 | 4.5 – 4.5 | 9 | 50.00% |
| Senpai 2.0 8CPU – Rybka 2.4 mp 32-bit 8CPU | 3234 | 6.0 – 3.0 | 9 | 66.67% |
| Senpai 2.0 8CPU – Wasp 2.00 8CPU | 3297 | 5.5 – 3.5 | 9 | 61.11% |
| Senpai 2.0 8CPU – Wasp 3.75 8CPU | 3420 | 3.5 – 5.5 | 9 | 38.89% |
| Total cumulé | moy. pond. 3342 | 25.5 – 20.5 | 46 | 55.43% |
Elo : 3380
Erreur (σ) : ±13
Nombre de parties : 46
Moyenne pondérée des ancres : (3359×10 + 3398×9 + 3234×9 + 3297×9 + 3420×9) / 46 = 3342.
Performance = 3342 + 400 × log₁₀(0.5543 / 0.4457) = 3342 + 400 × 0.0948 = 3380.
Lecture des résultats
Le résultat le plus instructif du gauntlet est le match nul à 50% contre Naum 4.2 (3398). C'est l'ancre la mieux établie de l'échelle supérieure — mesurée sur 59 parties avec σ = ±23 — et ce résultat parfaitement équilibré constitue une borne directe particulièrement fiable.
Comparaison avec les listes de référence
Le CCRL 40/2 place Senpai 2.0 aux alentours de 3050–3080 en configuration 1 CPU. L'écart avec le rating maison (3380) reflète le passage de 1 à 8 threads et la vitesse brute du Ryzen 9 7950X3D face à l'Intel i7-4770K — différentiel global de l'ordre de +300 points.
Senpai 2.0 s'insère entre Naum 4.2 (3398 · 8T) et Komodo64 3 (3359 · 1T), à seulement 18 points sous Naum — un écart inférieur à σ.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Komodo64 3 (1 Thread) mono-thread
Ce document présente les résultats complets du gauntlet de calibration dédié de Komodo64 3, joué en configuration mono-thread (1 CPU) contre cinq moteurs d'ancrage couvrant une large plage de l'échelle interne. Komodo64 3 est un moteur de génération 2012, distribué en binaire 64-bit sans support natif du parallélisme — il s'exécute donc sur un unique thread, quelle que soit la configuration matérielle.
Contrairement aux moteurs modernes calibrés en 8 threads sur ce laboratoire, Komodo64 3 ne peut exploiter qu'un seul cœur. Toutes les parties de ce gauntlet ont été jouées avec le paramètre Threads=1. Son Elo mesuré (3359) est donc strictement un Elo mono-thread.
Résultats détaillés du gauntlet
| Rencontre (Komodo64 3 1CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Komodo64 3 1CPU – Glaurung 2.2 JA 8CPU | 3163 | 12.5 – 3.5 | 16 | 78.13% |
| Komodo64 3 1CPU – Naum 4.2 8CPU | 3398 | 8.0 – 8.0 | 16 | 50.00% |
| Komodo64 3 1CPU – Rybka 2.4 mp 32-bit 8CPU | 3234 | 13.0 – 3.0 | 16 | 81.25% |
| Komodo64 3 1CPU – Wasp 2.00 8CPU | 3297 | 8.0 – 8.0 | 16 | 50.00% |
| Komodo64 3 1CPU – Wasp 3.75 8CPU | 3420 | 4.5 – 10.5 | 15 | 30.00% |
| Total cumulé | moy. pond. 3301 | 46.0 – 33.0 | 79 | 58.23% |
Elo : 3359 (mono-thread)
Erreur (σ) : ±10
Nombre de parties : 79
Moyenne pondérée des ancres : (3163×16 + 3398×16 + 3234×16 + 3297×16 + 3420×15) / 79 = 3301.
Performance = 3301 + 400 × log₁₀(0.5823 / 0.4177) = 3301 + 400 × 0.1443 = 3359.
Lecture des résultats
Komodo64 3 domine très nettement les deux ancres inférieures — Glaurung 2.2 JA (78.13%) et Rybka 2.4 mp 32-bit (81.25%) — tout en faisant jeu égal avec Naum 4.2 et Wasp 2.00 (50% chacun). C'est face à Wasp 3.75 que l'écart se creuse (30%). Les deux matchs nuls à 50% confirment que Komodo64 3 se situe exactement dans la zone Naum 4.2 / Wasp 2.00, soit autour de 3350–3400 en mono-thread. L'erreur σ = ±10 est l'une des plus faibles du laboratoire.
Komodo64 3 se glisse entre Wasp 2.00 (3297 · 8T) et Naum 4.2 (3398 · 8T), à 62 points en dessous de Wasp 3.75. Rapporté à une configuration 8 threads, son niveau réel serait sensiblement supérieur — mais cette estimation sort du cadre de la calibration directe.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Deep Sjeng 1.6 (8 Threads)
Ce document présente les résultats du gauntlet de calibration de Deep Sjeng 1.6 — 8 threads, joué contre huit moteurs d'ancrage de la zone médiane haute de l'échelle interne (2830–2996 Elo). Deep Sjeng est un moteur commercial développé par Gian-Carlo Pascutto, l'un des auteurs les plus prolifiques de l'histoire des moteurs d'échecs, également connu pour son travail sur Leela Chess Zero. La version 1.6 est une version classique à évaluation manuscrite (HCE).
Résultats détaillés du gauntlet
| Rencontre (Deep Sjeng 1.6 8CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Deep Sjeng 1.6 8CPU – Deep Junior 7 8CPU | 2996 | 4.0 – 5.0 | 9 | 44.44% |
| Deep Sjeng 1.6 8CPU – Fritz 6 1CPU | 2947 | 6.0 – 3.0 | 9 | 66.67% |
| Deep Sjeng 1.6 8CPU – List 5.12 1CPU | 2936 | 5.5 – 3.5 | 9 | 61.11% |
| Deep Sjeng 1.6 8CPU – Nimzo 8 1CPU | 2871 | 7.0 – 1.0 | 8 | 87.50% |
| Deep Sjeng 1.6 8CPU – Hiarcs 7.32 8CPU | 2862 | 7.0 – 0.0 | 7 | 100.00% |
| Deep Sjeng 1.6 8CPU – Junior 7 8CPU | 2862 | 4.0 – 5.0 | 9 | 44.44% |
| Deep Sjeng 1.6 8CPU – Fritz 5.32 1CPU | 2855 | 8.5 – 1.5 | 10 | 85.00% |
| Deep Sjeng 1.6 8CPU – Yace Paderbron 1CPU | 2830 | 6.5 – 2.5 | 9 | 72.22% |
| Total cumulé | moy. pond. 2896 | 48.5 – 21.5 | 70 | 69.29% |
Elo : 3037
Erreur (σ) : ±10
Nombre de parties : 70
Moyenne pondérée des ancres : (2830×9 + 2855×10 + 2862×7 + 2862×9 + 2871×8 + 2936×9 + 2947×9 + 2996×9) / 70 = 2896.
Performance = 2896 + 400 × log₁₀(0.6929 / 0.3071) = 2896 + 400 × 0.3533 = 3037.
Le gauntlet de Deep Sjeng 1.6 révèle une asymétrie inhabituelle : le moteur domine très nettement la plupart de ses ancres (85–100% contre Fritz 5.32, Nimzo 8, Hiarcs 7.32), mais résiste mal à Junior 7 (44.44%) malgré un rating théorique identique à Hiarcs 7.32. Ce même écart s'observe contre Deep Junior 7 (44.44%). Cette dissymétrie — positive contre les moteurs positionnel-style, négative contre la famille Junior — est un marqueur stylistique clair.
Lecture des résultats
La convergence du rating est remarquablement rapide et stable : 2960 sur 14 parties, 3023 sur 30, 3022 sur 40, 3033 sur 47, et 3037 sur 70 parties. Le résultat le plus structurant est le 66.67% contre Fritz 6 (2947) sur 9 parties — l'ancre la plus haute du gauntlet avec un résultat fiable. Le 100% contre Hiarcs 7.32 sur 7 parties est statistiquement non représentatif. La zone réelle de Deep Sjeng 1.6 est probablement comprise entre 3010 et 3050, avec 3037 comme estimation centrale.
Deep Sjeng 1.6 (3037) se positionne entre Deep Junior 7 (2996) et Shredder 10 (3087), comblant un espace jusqu'ici vide dans l'échelle.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — ProDeo 2.0 (1 Thread)
Ce document présente les résultats du gauntlet de calibration de ProDeo 2.0 — mono-thread, joué contre cinq moteurs d'ancrage de la zone médiane haute de l'échelle interne (2917–3087 Elo). ProDeo est un moteur développé par Ed Schröder, fondateur de la série Rebel — l'une des dynasties les plus importantes de l'histoire des moteurs d'échecs commerciaux. La version 2.0 est une version libre à évaluation entièrement manuscrite (HCE), publiée en 2015.
ProDeo 2.0 est un moteur mono-thread par conception. Toutes les parties de ce gauntlet ont été jouées avec le paramètre Threads=1. Son Elo mesuré (2999) est donc strictement un Elo mono-thread.
Résultats détaillés du gauntlet
| Rencontre (ProDeo 2.0 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| ProDeo 2.0 1CPU – Shredder 10 UCI 1CPU | 3087 | 6.0 – 8.0 | 14 | 42.86% |
| ProDeo 2.0 1CPU – Deep Junior 7 8CPU | 2996 | 6.5 – 7.5 | 14 | 46.43% |
| ProDeo 2.0 1CPU – Fritz 6 1CPU | 2947 | 8.0 – 5.0 | 13 | 61.54% |
| ProDeo 2.0 1CPU – List 5.12 1CPU | 2936 | 7.5 – 5.5 | 13 | 57.69% |
| ProDeo 2.0 1CPU – SOS 5 for Arena 1CPU | 2917 | 7.5 – 5.5 | 13 | 57.69% |
| Total cumulé | moy. pond. 2979 | 35.5 – 31.5 | 67 | 52.99% |
Elo : 2999 (mono-thread)
Erreur (σ) : ±11
Nombre de parties : 67
Moyenne pondérée des ancres : (3087×14 + 2996×14 + 2947×13 + 2936×13 + 2917×13) / 67 = 2979.
Performance = 2979 + 400 × log₁₀(0.5299 / 0.4701) = 2979 + 400 × 0.0520 = 2999.
Lecture des résultats
Les cinq perfs individuelles se regroupent dans une fenêtre de seulement 66 points (2971–3037), ce qui est exceptionnel. Les deux ancres directes les plus structurantes sont le 46.43% contre Deep Junior 7 (2996) et le 61.54% contre Fritz 6 (2947).
Comparaison avec les listes de référence
Le CCRL 40/15 place ProDeo 2.0 à 2682 Elo en 1CPU sur Intel i7-4770K. L'écart avec le rating maison (2999) est de +317 points — nettement supérieur aux différentiels observés pour les autres moteurs mono-thread de l'échelle.
ProDeo 2.0 (2999) se positionne en quasi-parité avec Deep Junior 7 (2996 · 8T), à seulement 3 points d'écart — inférieur à σ. En tant que moteur mono-thread, c'est un résultat remarquable : ProDeo 2.0 rivalise avec un moteur fonctionnant en 8 threads.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Junior 8 (1 Thread) mono-thread
Ce document présente les résultats du gauntlet de calibration de Junior 8 — mono-thread, joué contre sept moteurs d'ancrage de la zone médiane haute de l'échelle interne (2855–2957 Elo). Junior est un moteur commercial développé par Amir Ban et Shay Bushinsky, programmeurs israéliens dont la collaboration a produit l'une des séries les plus titrées de l'histoire des échecs informatiques.
Junior 8 est un moteur mono-thread par conception. Toutes les parties de ce gauntlet ont été jouées avec le paramètre Threads=1. Son Elo mesuré (2992) est donc strictement un Elo mono-thread.
Le moteur et ses auteurs
Amir Ban et Shay Bushinsky commencent le développement de Junior au début des années 1990. Le moteur se distingue rapidement par un style de jeu tactique agressif et non conventionnel, privilégiant les positions déséquilibrées et les sacrifices matériels. Junior participe aux World Computer Chess Championships à partir de 1994 et s'impose rapidement comme l'un des rivaux les plus redoutables de Deep Blue, puis de Shredder et Fritz.
Le palmarès de la série est exceptionnel : six titres de champion du monde (1997, 2002, 2004 WCCC et WCSC, 2006, 2011), dont une victoire mémorable à Graz 2003 face aux meilleures machines du monde. Junior 8 est la version commercialisée via ChessBase après l'intégration de la série dans leur catalogue. Elle hérite du style combatif de la série mais dans une forme aboutie et stabilisée — la dernière version majeure à évaluation purement manuscrite (HCE) avant la disparition progressive du développement actif.
Résultats détaillés du gauntlet
| Rencontre (Junior 8 1CPU – Ancre) | Ancre Elo | Score | Bilan | Parties | % |
|---|---|---|---|---|---|
| Junior 8 1CPU – Fritz 5.32 1CPU | 2855 | 5.5 – 3.5 | +4/=3/−2 | 9 | 61.11% |
| Junior 8 1CPU – Hiarcs 7.32 1CPU | 2862 | 6.0 – 3.0 | +5/=2/−2 | 9 | 66.67% |
| Junior 8 1CPU – Nimzo 8 1CPU | 2871 | 6.0 – 3.0 | +5/=2/−2 | 9 | 66.67% |
| Junior 8 1CPU – SOS 5 for Arena 1CPU | 2917 | 4.5 – 4.5 | +4/=1/−4 | 9 | 50.00% |
| Junior 8 1CPU – List 5.12 1CPU | 2936 | 7.0 – 1.0 | +6/=2/−0 | 8 | 87.50% |
| Junior 8 1CPU – Fritz 6 1CPU | 2947 | 4.0 – 5.0 | +3/=2/−4 | 9 | 44.44% |
| Junior 8 1CPU – Gambit Tiger 2.0 1CPU | 2957 | 5.5 – 3.5 | +4/=3/−2 | 9 | 61.11% |
| Total cumulé | moy. pond. 2906 | 38.5 – 23.5 | 62 | 62.10% |
Elo : 2992 (mono-thread)
Erreur (σ) : ±11
Nombre de parties : 62
Moyenne pondérée des ancres : (2855×9 + 2862×9 + 2871×9 + 2917×9 + 2936×8 + 2947×9 + 2957×9) / 62 = 2906.
Performance = 2906 + 400 × log₁₀(0.6210 / 0.3790) = 2906 + 400 × 0.2143 = 2992.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.6210 et N = 62 → σ = ±11.
Lecture des résultats
Le gauntlet de Junior 8 révèle un profil très cohérent avec la tradition stylistique de la série. Les six perfs individuelles sur les ancres inferieures convergent dans une fenêtre de 2899–3036, avec une exception : le 87.50% contre List 5.12 (2936) sur 8 parties produit une perf de 3274, nettement au-dessus de la moyenne. Ce seul résultat tire la performance globale vers le haut et représente la principale source d'incertitude dans ce gauntlet.
Les ancres les plus fiables sont le 50.00% exact contre SOS 5 (2917) sur 9 parties — qui place Junior 8 à parité stricte avec ce moteur — et le 44.44% contre Fritz 6 (2947) sur 9 parties. Ces deux résultats encadrent la zone réelle avec précision : Junior 8 domine SOS 5 (2917) mais se retrouve en infériorité face à Fritz 6 (2947). La zone 2960–2990 semble la plus représentative de son niveau réel, 2992 constituant une estimation légèrement haute.
La faiblesse marquée contre Fritz 6 (44.44%) est un marqueur stylistique structurel. Fritz 5.32 et Fritz 6 sont deux moteurs issus de la même famille, et Junior 8 résiste mieux à Fritz 5.32 (61.11%) qu'à Fritz 6 (44.44%) — une asymétrie cohérente avec le bond de force entre les deux versions Fritz.
Comparaison avec les listes de référence
Junior 8 n'est pas systématiquement présent dans les listes CCRL modernes, qui se concentrent sur les versions récentes. La SSDF historique et les archives CCRL des années 2000 créditaient les versions contemporaines de Junior d'environ 2600–2750 Elo sur matériel de l'époque. L'écart avec le rating maison (2992) reflète intégralement le gain de vitesse brute du Ryzen 9 7950X3D sur un cœur unique — aucun bénéfice du parallélisme n'intervient ici.
Dans le contexte de l'échelle interne, Junior 8 (2992) se positionne entre Deep Junior 7 (2996 · 8 threads) et Ruffian 2.1.0 (2966 · mono-thread). En mono-thread pur, Junior 8 rivalise directement avec Deep Junior 7 fonctionnant en 8 threads — la différence de seulement 4 points étant statistiquement non significative. C'est un résultat remarquable qui illustre l'efficacité par cœur de l'architecture Junior.
| Moteur | Elo interne | Threads | Type éval. | Remarque |
|---|---|---|---|---|
| ProDeo 2.0 | 2999 | 1 | HCE | Référence supérieure proche |
| Deep Junior 7 | 2996 | 8 | HCE | Référence supérieure — 8 threads |
| Junior 8 | 2992 | 1 | HCE | Mesuré · σ = ±11 · mono-thread |
| Ruffian 2.1.0 | 2966 | 1 | HCE | Référence inférieure |
| Gambit Tiger 2.0 | 2957 | 1 | HCE | Ancre — 61.11% |
| SOS 5 for Arena | 2917 | 1 | HCE | Ancre — 50.00% |
Junior 8 (2992) prend le rang 22 de l'échelle en mono-thread, entre Deep Junior 7 (2996 · 8T) et Ruffian 2.1.0 (2966 · 1T). L'écart de 4 points avec Deep Junior 7 est inférieur à σ — les deux moteurs de la série Junior sont statistiquement à parité, le passage aux 8 threads de Deep Junior 7 ne procurant qu'un avantage marginal sur cette mesure. Avec σ = ±11 sur 62 parties, le rating de Junior 8 est bien établi pour un gauntlet mono-thread.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Ruffian 2.1.0 (1 Thread)
Ce document présente les résultats du gauntlet de calibration de Ruffian 2.1.0 — mono-thread, joué contre six moteurs d'ancrage de la zone médiane haute de l'échelle interne (2947–3087 Elo). Ruffian est un moteur développé par Per-Ola Valfridsson, programmeur suédois spécialisé dans les télécommunications.
Ruffian 2.1.0 est testé en configuration mono-thread. Son Elo mesuré (2966) est strictement un Elo mono-thread.
Le moteur et son auteur
Per-Ola Valfridsson commence le développement de Ruffian en 1998, en parallèle de son activité professionnelle dans les télécommunications. Le moteur apparaît publiquement en juillet 2002 sur ICC et FICS. Le nom du programme est un hommage à une célèbre jument de course américaine. Ruffian remporte le DOCCC 2003 et le Championnat de Suède non-officiel 2003. En 2004, à l'ICT de Leiden, il termine 3e derrière Shredder et Hydra. La version 2.0 commerciale, distribuée par Lokasoft avec l'interface Arena 1.0, est décrite en décembre 2003 comme l'un des moteurs WinBoard les plus forts du monde.
La version 2.1.0 est la déclinaison finale et la plus puissante de la série commerciale. Valfridsson n'a publié aucune mise à jour depuis, et le programme est entré dans l'histoire sans transition vers le NNUE.
Résultats détaillés du gauntlet
| Rencontre (Ruffian 2.1.0 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Ruffian 2.1.0 1CPU – Shredder 10 UCI 1CPU | 3087 | 4.5 – 10.5 | 15 | 30.00% |
| Ruffian 2.1.0 1CPU – ProDeo 2.0 1CPU | 2999 | 5.0 – 10.0 | 15 | 33.33% |
| Ruffian 2.1.0 1CPU – Deep Junior 7 8CPU | 2996 | 5.5 – 9.5 | 15 | 36.67% |
| Ruffian 2.1.0 1CPU – Gambit Tiger 2.0 1CPU | 2957 | 8.5 – 6.5 | 15 | 56.67% |
| Ruffian 2.1.0 1CPU – Fritz 6 1CPU | 2947 | 9.0 – 6.0 | 15 | 60.00% |
| Ruffian 2.1.0 1CPU – Gandalf 6.01 1CPU | 2947 | 9.5 – 5.5 | 15 | 63.33% |
| Total cumulé | moy. pond. 2989 | 42.0 – 48.0 | 90 | 46.67% |
Elo : 2966 (mono-thread)
Erreur (σ) : ±9
Nombre de parties : 90
Moyenne pondérée des ancres : (3087×15 + 2999×15 + 2996×15 + 2957×15 + 2947×15 + 2947×15) / 90 = 2989.
Performance = 2989 + 400 × log₁₀(0.4667 / 0.5333) = 2989 − 400 × 0.0580 = 2966.
Ruffian 2.1.0 présente un écart inhabituel entre ses résultats contre les moteurs positionnels (60–63% contre Fritz 6 et Gandalf) et ses résultats contre la famille Junior (36.67% contre Deep Junior 7). Cette résistance faible contre le style tactique agressif de la série Junior — déjà observée avec Deep Sjeng 1.6 — est un marqueur stylistique structurel.
Comparaison avec les listes de référence
Le CCRL 40/15 place Ruffian 2.1.0 à 2612 Elo en 1CPU sur Intel i7-4770K. L'écart avec le rating maison (2966) est de +354 points — le différentiel le plus élevé observé parmi les moteurs mono-thread de l'échelle.
Ruffian 2.1.0 (2966) s'intercale entre Deep Junior 7 (2996 · 8T) et Gambit Tiger 2.0 (2957 · 1T). Moteur suédois apparu comme une comète en 2002 et disparu sans laisser de successeur, Ruffian 2.1.0 confirme ici sa solidité vingt ans après sa publication.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Gambit Tiger 2.0 (1 Thread)
Ce document présente les résultats du gauntlet de calibration de Gambit Tiger 2.0 — mono-thread. Gambit Tiger est une variante à jeu ultra-agressif de Chess Tiger, développé par Christophe Théron, programmeur français résidant en Guadeloupe.
Gambit Tiger 2.0 est un moteur mono-thread par conception. Son Elo mesuré (2957) est donc strictement un Elo mono-thread.
Le moteur et son auteur
Christophe Théron commence la programmation d'échecs à l'âge de 17 ans en 1982, sur un TRS-80 cadencé à 1,77 MHz. Chess Tiger est lancé en 1997 pour PC — c'est à l'origine la version française de Rebel Tiger, vendu sous licence par Schroeder BV. Chess Tiger et sa variante Gambit Tiger participent aux WMCCC 1997, WCCC 1999, WMCCC 2000 (3e place) et WMCCC 2001, remportent trois fois le Championnat Français de Programmes d'Échecs.
L'apogée de Gambit Tiger 2.0 se produit en octobre 2001, lorsque la liste SSDF place le programme au 2e rang mondial, à seulement 6 points derrière Deep Fritz sur Athlon 1200 MHz : Gambit Tiger 2.0 256MB Athlon 1200 est crédité de 2720 Elo SSDF, juste derrière Deep Fritz (2726) et devant Chess Tiger 14.0 (2703), Shredder 5.32 (2699) et Junior 7.0 (2679).
Résultats détaillés du gauntlet
| Rencontre (Gambit Tiger 2.0 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Gambit Tiger 2.0 1CPU – Shredder 10 UCI 1CPU | 3087 | 3.5 – 6.5 | 10 | 35.00% |
| Gambit Tiger 2.0 1CPU – ProDeo 2.0 1CPU | 2999 | 4.5 – 5.5 | 10 | 45.00% |
| Gambit Tiger 2.0 1CPU – Deep Junior 7 8CPU | 2996 | 4.0 – 6.0 | 10 | 40.00% |
| Gambit Tiger 2.0 1CPU – Fritz 6 1CPU | 2947 | 5.0 – 5.0 | 10 | 50.00% |
| Gambit Tiger 2.0 1CPU – List 5.12 1CPU | 2936 | 5.0 – 5.0 | 10 | 50.00% |
| Gambit Tiger 2.0 1CPU – SOS 5 for Arena 1CPU | 2917 | 6.0 – 4.0 | 10 | 60.00% |
| Total cumulé | moy. pond. 2980 | 28.0 – 32.0 | 60 | 46.67% |
Elo : 2957 (mono-thread)
Erreur (σ) : ±11
Nombre de parties : 60
Moyenne pondérée des ancres : (3087×10 + 2999×10 + 2996×10 + 2947×10 + 2936×10 + 2917×10) / 60 = 2980.
Performance = 2980 + 400 × log₁₀(0.4667 / 0.5333) = 2980 − 400 × 0.0580 = 2957.
Lecture des résultats
Les six perfs individuelles se regroupent dans une fenêtre de seulement 96 points (2907–3003). Les deux ancres les plus structurantes sont les 50% exacts contre Fritz 6 (2947) et List 5.12 (2936), chacun sur 10 parties. Le 35% contre Shredder 10 (3087) sur 10 parties établit clairement le plafond.
Comparaison avec les listes de référence
La SSDF, dans sa liste d'octobre 2001, plaçait Gambit Tiger 2.0 à 2720 Elo sur Athlon 1200 MHz. Le rating maison (2957) représente un gain de +237 points par rapport à cette référence historique.
Gambit Tiger 2.0 est un moteur daté de 2001, conçu pour une machine Athlon 1200 MHz, et il parvient encore en 2026 sur Ryzen 9 7950X3D à se hisser au-dessus de Fritz 6 — son contemporain d'époque avec lequel il se disputait le sommet mondial vingt-cinq ans plus tôt.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Gandalf 6.01 (1 Thread)
Ce document présente les résultats du gauntlet de calibration de Gandalf 6.01 — mono-thread, joué contre sept moteurs d'ancrage de la zone médiane haute de l'échelle interne (2917–3087 Elo). Gandalf est un moteur développé par Steen Suurballe, développeur danois, avec l'aide du spécialiste de livres d'ouvertures Dan Wulff Kristensen.
Gandalf 6.01 est un moteur mono-thread par conception. Son Elo mesuré (2947) est donc strictement un Elo mono-thread.
Le moteur et son auteur
Steen Suurballe commence le développement de Gandalf au début des années 1990 au Danemark. Le programme naît comme un moteur extrêmement sélectif. La SSDF lui attribue alors environ 2050 Elo. Début 1996, Gandalf adopte un moteur de recherche null-move conventionnel et réalise immédiatement de bons résultats au WMCCC Jakarta (6/9) et à l'Aegon 97. Le programme est commercialisé successivement par Gambit-Soft (versions 4.x), Schröder BV pour la version 5, et Lokasoft pour la version 6.
Gandalf 6 représente un bond de force considérable, notamment grâce à une refonte du jeu positionnel réalisée avec l'aide du grand maître de correspondance Christian Kongsted, ainsi qu'une profondeur de recherche supérieure de deux plies en moyenne à la version 5 et un livre d'ouvertures de plus de 2,2 millions de positions uniques optimisé par Dan Wulff.
Résultats détaillés du gauntlet
| Rencontre (Gandalf 6.01 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Gandalf 6.01 1CPU – Shredder 10 UCI 1CPU | 3087 | 4.0 – 6.0 | 10 | 40.00% |
| Gandalf 6.01 1CPU – ProDeo 2.0 1CPU | 2999 | 4.5 – 5.5 | 10 | 45.00% |
| Gandalf 6.01 1CPU – Deep Junior 7 8CPU | 2996 | 5.0 – 5.0 | 10 | 50.00% |
| Gandalf 6.01 1CPU – Gambit Tiger 2.0 1CPU | 2957 | 4.0 – 6.0 | 10 | 40.00% |
| Gandalf 6.01 1CPU – Fritz 6 1CPU | 2947 | 6.0 – 4.0 | 10 | 60.00% |
| Gandalf 6.01 1CPU – List 5.12 1CPU | 2936 | 4.5 – 5.5 | 10 | 45.00% |
| Gandalf 6.01 1CPU – SOS 5 for Arena 1CPU | 2917 | 4.0 – 6.0 | 10 | 40.00% |
| Total cumulé | moy. pond. 2977 | 32.0 – 38.0 | 70 | 45.71% |
Elo : 2947 (mono-thread)
Erreur (σ) : ±10
Nombre de parties : 70
Moyenne pondérée des ancres : (3087×10 + 2999×10 + 2996×10 + 2957×10 + 2947×10 + 2936×10 + 2917×10) / 70 = 2977.
Performance = 2977 + 400 × log₁₀(0.4571 / 0.5429) = 2977 − 400 × 0.0747 = 2947.
Lecture des résultats
Le profil stylistique de Gandalf 6.01 révèle une asymétrie notable. Son ancre directe la plus fiable est le 50% exact contre Deep Junior 7 (2996). Le 60% contre Fritz 6 (2947) confirme une légère supériorité, tandis que le 40% contre Gambit Tiger 2.0 (2957) révèle une faiblesse stylistique spécifique contre le jeu ultra-agressif.
Comparaison avec les listes de référence
La CCRL 40/2 Archive place Gandalf 6 (version non-patchée) à 2627 Elo en 1CPU sur Intel i7-4770K, basé sur 4247 parties. L'écart avec le rating maison (2947) s'élève à +320 points — le différentiel le plus élevé observé parmi les moteurs mono-thread de l'échelle.
Gandalf 6.01 (2947) se positionne à égalité exacte avec Fritz 6 (2947 · 1T) — deux contemporains de la même génération qui se retrouvent séparés par zéro point dans cette échelle, vingt ans après avoir cohabité dans les mêmes tournois commerciaux.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — List 5.12 (1 Thread) mono-thread
Ce document présente les résultats complets du gauntlet de calibration dédié de List 5.12, joué en configuration mono-thread (1 CPU) contre six moteurs d'ancrage de la zone médiane de l'échelle interne (2830–2947 Elo). List est un moteur libre développé au début des années 2000.
List 5.12 est un moteur mono-thread par conception. Son Elo mesuré (2936) est donc strictement un Elo mono-thread.
Résultats détaillés du gauntlet
| Rencontre (List 5.12 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| List 5.12 1CPU – Fritz 6 8CPU | 2947 | 5.0 – 5.0 | 10 | 50.00% |
| List 5.12 1CPU – Nimzo 8 1CPU | 2871 | 7.0 – 3.0 | 10 | 70.00% |
| List 5.12 1CPU – Hiarcs 7.32 8CPU | 2862 | 6.5 – 3.5 | 10 | 65.00% |
| List 5.12 1CPU – Junior 7 8CPU | 2862 | 5.0 – 5.0 | 10 | 50.00% |
| List 5.12 1CPU – Fritz 5.32 1CPU | 2855 | 6.5 – 3.5 | 10 | 65.00% |
| List 5.12 1CPU – Yace Paderbron 1CPU | 2830 | 5.5 – 4.5 | 10 | 55.00% |
| Total cumulé | moy. pond. 2871 | 35.5 – 24.5 | 60 | 59.17% |
Elo : 2936 (mono-thread)
Erreur (σ) : ±11
Nombre de parties : 60
Moyenne pondérée des ancres : (2947×10 + 2871×10 + 2862×10 + 2862×10 + 2855×10 + 2830×10) / 60 = 2871.
Performance = 2871 + 400 × log₁₀(0.5917 / 0.4083) = 2871 + 400 × 0.1611 = 2936.
Lecture des résultats
D'abord, le 50% exact contre Fritz 6 (2947) sur 10 parties — l'ancre la plus haute du gauntlet. Ensuite, le 50% exact contre Junior 7 (2862) — ancre à l'autre extrémité de la zone — qui confirme que List 5.12 domine clairement ce palier.
Comparaison avec les listes de référence
Le CCRL 40/2 Archive place List 5.12 à 2708 Elo en 1CPU sur Intel i7-4770K. L'écart avec le rating maison (2936) est de +228 points.
List 5.12 s'insère entre Fritz 6 (2947 · 8T) et Nimzo 8 (2871 · 1T), à seulement 11 points en dessous de Fritz 6 — un écart inférieur à σ. En tant que moteur mono-thread, List 5.12 rivalise avec des moteurs 8 threads.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — SOS 5 for Arena (1 Thread)
Ce document présente les résultats du gauntlet de calibration de SOS 5 for Arena — mono-thread, joué contre quatre moteurs d'ancrage de la zone médiane haute de l'échelle interne (2936–3087 Elo). SOS est un moteur développé par Rudolf Huber, distribué via Arena.
SOS 5 for Arena est un moteur mono-thread par conception. Son Elo mesuré (2917) est donc strictement un Elo mono-thread.
Résultats détaillés du gauntlet
| Rencontre (SOS 5 1CPU – Ancre) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| SOS 5 1CPU – Shredder 10 UCI 1CPU | 3087 | 4.0 – 16.0 | 20 | 20.00% |
| SOS 5 1CPU – Deep Junior 7 8CPU | 2996 | 5.5 – 14.5 | 20 | 27.50% |
| SOS 5 1CPU – Fritz 6 1CPU | 2947 | 10.5 – 9.5 | 20 | 52.50% |
| SOS 5 1CPU – List 5.12 1CPU | 2936 | 11.5 – 8.5 | 20 | 57.50% |
| Total cumulé | moy. pond. 2992 | 31.5 – 48.5 | 80 | 39.38% |
Elo : 2917 (mono-thread)
Erreur (σ) : ±9
Nombre de parties : 80
Moyenne pondérée des ancres : (3087×20 + 2996×20 + 2947×20 + 2936×20) / 80 = 2992.
Performance = 2992 + 400 × log₁₀(0.3937 / 0.6062) = 2992 − 75 = 2917.
Lecture des résultats
Le 52.50% contre Fritz 6 (2947) sur 20 parties — le résultat le plus robuste du gauntlet — établit une quasi-parité. Le 57.50% contre List 5.12 (2936) est parfaitement cohérent. À l'autre extrémité, les scores contre Shredder 10 (20%) et Deep Junior 7 (27.50%) sur 20 parties chacun sont sans ambiguïté.
SOS 5 affiche une quasi-parité avec Fritz 6 (2947 · 1T) — un moteur qui bénéficie de huit cœurs. Avec σ = ±9 sur 80 parties, la mesure est définitive.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Nimzo 8 (1 Thread) mono-thread
Ce document présente les résultats complets du gauntlet de calibration dédié de Nimzo 8, joué en configuration mono-thread (1 CPU) contre cinq moteurs d'ancrage de la zone médiane haute de l'échelle interne (2830–2947 Elo). Nimzo est un moteur commercial développé par Chrilly Donninger.
Nimzo 8 est un moteur mono-thread par conception. Son Elo mesuré (2871) est donc strictement un Elo mono-thread.
Résultats détaillés du gauntlet
| Rencontre (Nimzo 8 1CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Nimzo 8 1CPU – Fritz 6 8CPU | 2947 | 5.5 – 9.5 | 15 | 36.67% |
| Nimzo 8 1CPU – Fritz 5.32 8CPU | 2855 | 6.0 – 9.0 | 15 | 40.00% |
| Nimzo 8 1CPU – Junior 7 8CPU | 2862 | 7.0 – 8.0 | 15 | 46.67% |
| Nimzo 8 1CPU – Hiarcs 7.32 8CPU | 2862 | 8.5 – 6.5 | 15 | 56.67% |
| Nimzo 8 1CPU – Yace Paderbron 1CPU | 2830 | 10.5 – 4.5 | 15 | 70.00% |
| Total cumulé | moy. pond. 2871 | 37.5 – 37.5 | 75 | 50.00% |
Elo : 2871
Erreur (σ) : ±10
Nombre de parties : 75
Moyenne pondérée des ancres : (2947×15 + 2855×15 + 2862×15 + 2862×15 + 2830×15) / 75 = 2871.
Performance = 2871 + 400 × log₁₀(0.5000 / 0.5000) = 2871 + 0 = 2871.
Lecture des résultats
Le gauntlet produit un résultat d'une netteté mathématique rare : un score global de 50.00% exact contre une moyenne pondérée de 2871 Elo, ce qui donne directement et par définition une performance de 2871. Aucun calcul de différentiel n'est même nécessaire — le log₁₀(1) vaut 0, et la performance est égale à la moyenne des ancres.
Nimzo 8 s'insère entre Fritz 6 (2947) et la zone Junior 7 / Hiarcs 7.32 / Fritz 5.32 (2855–2862). Avec σ = ±10 et un score parfaitement équilibré, ce rating est l'un des plus proprement mesurés de toute l'échelle médiane.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Hiarcs 7.32 (1 Thread) mono-thread
Ce document présente les résultats complets du gauntlet de calibration dédié de Hiarcs 7.32, joué en configuration mono-thread (1 CPU) contre quatre moteurs d'ancrage de la zone médiane de l'échelle interne. Hiarcs est un moteur commercial développé par Mark Uniacke, dont les versions des années 1990–2000 sont emblématiques de la forte école britannique d'échecs informatique.
Hiarcs 7.32 est un moteur mono-thread par conception. Son Elo mesuré (2862) est donc strictement un Elo mono-thread.
Résultats détaillés du gauntlet
| Rencontre (Hiarcs 7.32 1CPU – Ancre 8CPU) | Ancre Elo | Score | +/=/− | Parties | % |
|---|---|---|---|---|---|
| Hiarcs 7.32 1CPU – Fritz 5.32 8CPU | 2855 | 7.0 – 7.0 | +4/=6/−4 | 14 | 50.00% |
| Hiarcs 7.32 1CPU – Fritz 6 8CPU | 2947 | 6.5 – 7.5 | +3/=7/−4 | 14 | 46.43% |
| Hiarcs 7.32 1CPU – Junior 7 8CPU | 2862 | 5.5 – 8.5 | +3/=5/−6 | 14 | 39.29% |
| Hiarcs 7.32 1CPU – Yace Paderbron 1CPU | 2830 | 7.5 – 5.5 | +4/=7/−2 | 13 | 57.69% |
| Total cumulé | moy. pond. 2874 | 26.5 – 28.5 | 55 | 48.18% |
Elo : 2862 (mono-thread)
Erreur (σ) : ±12
Nombre de parties : 55
Moyenne pondérée des ancres : (2855×14 + 2947×14 + 2862×14 + 2830×13) / 55 = 2874.
Performance = 2874 + 400 × log₁₀(0.4818 / 0.5182) = 2874 − 12.6 = 2862.
Lecture des résultats
Le résultat pivot est le 50% exact contre Fritz 5.32 (2855), qui constitue une borne directe particulièrement fiable. Les 57.69% contre Yace Paderbron (2830, également mono-thread) confirment que Hiarcs domine légèrement ce moteur de même génération. Le 39.29% contre Junior 7 (2862) est plus surprenant : les deux moteurs affichent le même Elo interne, mais Hiarcs perd ce duel direct clairement.
Comparaison avec les listes de référence
La SSDF, qui a testé de nombreuses versions de Hiarcs sur matériel dédié des années 1990–2000, situait Hiarcs 7 autour de 2580–2630 sur son échelle historique. L'écart avec le rating maison (2862) — de l'ordre de +240 à +280 points — est entièrement imputable à la vitesse brute du Ryzen 9 7950X3D.
Hiarcs 7.32 partage numériquement le même Elo que Junior 7 (2862), mais le duel direct (39.29%) est en faveur de Junior 7.
Calibration : Fritz 5.32 mono-thread
Analyse comparative : Ryzen 9 7950X3D vs Listes de référence CCRL & KCEC
Fritz 5.32 — L'héritier de Frans Morsch
Fritz 5.32 est l'une des versions les plus abouties du moteur original de Frans Morsch, avant que ChessBase ne migre vers d'autres bases de code à partir de Fritz 13. À la fin des années 1990, Fritz dominait les classements SSDF et CCRL. Sa structure de recherche alpha-bêta est entièrement séquentielle : Fritz 5.32 ne supporte pas le multi-threading et s'exécute sur un seul cœur.
| Opposition | Ancre Elo | Score | Bilan | Parties | % |
|---|---|---|---|---|---|
fritz532.trn-1 + fritz532.trn Fritz 5.32 – Rebel 6.0 (cumul) | 2761 | 24.0 – 10.0 | ✔ Victoire | 34 | 70.59% |
fritz532.trn-1 + fritz532.trn Fritz 5.32 – Fritz 6 (cumul) | 2947 | 14.5 – 18.5 | ✘ Défaite | 33 | 43.94% |
fritz532.trn-1 Fritz 5.32 – Junior 7 | 2862 | 5.0 – 15.0 | ✘ Défaite | 20 | 25.00% |
| Total cumulé — 2 sessions fusionnées | moy. pond. 2855 | 43.5 – 43.5 | — Équilibre parfait | 87 | 50.00% |
Le CCRL 40/2 Archive crédite Fritz 5.32 d'un rating de 2539 Elo en configuration mono-processeur sur Intel i7-4770K (2202 parties). Le gain mesuré au laboratoire (+316 points) ne provient pas du parallélisme mais uniquement de la différence de fréquence et d'IPC entre l'i7-4770K et le Ryzen 9 7950X3D.
La liste KCEC place Fritz 5.32 à 2646 Elo (1329 parties). Dans la liste KCEC, List 5.12 figure à 2699, avec un score direct de 15/30 contre Fritz 5.32, ce qui est cohérent avec l'écart de rating observé entre les deux moteurs.
Le résultat le plus élégant du gauntlet est le score global de 50.00% exact sur 87 parties. Ce score nul contre une moyenne pondérée de 2855 produit directement la performance Elo par définition. Rebel 6.0 (2761) est dominé sans appel sur 34 parties cumulées (70.59%). Fritz 6 (2947) s'avère légèrement supérieur sur 33 parties (43.94%). Junior 7 (2862) domine nettement Fritz 5.32 (25.00% sur 20 parties), reflet d'un différentiel stylistique marqué.
Positionnement dans l'échelle maison : Fritz 5.32 (2855) se situe entre Yace Paderbron (2830 · mono-thread) et Hiarcs 7.32 (2862). L'écart de 92 points avec Fritz 6 (2947) confirme la progression réelle entre les deux versions sur hardware moderne.
Calibration · Gauntlet dédié · Ryzen 9 7950X3D
Calibration Elo — Yace Paderbron (1 Thread) mono-thread
Ce document présente les résultats complets du gauntlet de calibration dédié de Yace Paderbron, joué en configuration mono-thread (1 CPU) contre trois moteurs d'ancrage de la zone médiane de l'échelle interne. Yace Paderbron est un moteur open-source développé à l'Université de Paderborn au début des années 2000.
Yace Paderbron est un moteur mono-thread par conception. Son Elo mesuré (2830) est donc strictement un Elo mono-thread.
Résultats détaillés du gauntlet
| Rencontre (Yace Paderbron 1CPU – Ancre 8CPU) | Ancre Elo | Score | Parties | % |
|---|---|---|---|---|
| Yace Paderbron 1CPU – Fritz 5.32 8CPU | 2855 | 9.5 – 11.5 | 21 | 45.24% |
| Yace Paderbron 1CPU – Fritz 6 8CPU | 2947 | 7.0 – 13.0 | 20 | 35.00% |
| Yace Paderbron 1CPU – Junior 7 8CPU | 2862 | 9.0 – 11.0 | 20 | 45.00% |
| Total cumulé | moy. pond. 2888 | 25.5 – 35.5 | 61 | 41.80% |
Elo : 2830 (mono-thread)
Erreur (σ) : ±11
Nombre de parties : 61
Moyenne pondérée des ancres : (2855×21 + 2947×20 + 2862×20) / 61 = 2888.
Performance = 2888 + 400 × log₁₀(0.4180 / 0.5820) = 2888 − 57.5 = 2830.
Lecture des résultats
Ses trois scores contre les ancres sont très proches — 45.24% contre Fritz 5.32 (2855), 45.00% contre Junior 7 (2862), et 35.00% contre Fritz 6 (2947) — ce qui produit des performances individuelles quasi identiques (2822, 2840 et 2827). Une telle homogénéité valide la solidité du rating obtenu.
Comparaison avec les listes de référence
La SSDF plaçait Yace Paderbron aux alentours de 2550–2600 sur son échelle. L'écart avec le rating maison (2830) est de l'ordre de +230 à +280 points, entièrement imputable au gain de vitesse du Ryzen 9 7950X3D.
Yace Paderbron s'insère juste au-dessus de The King 3.50 (2817 · 8T) et en dessous de Fritz 5.32 (2855) et Junior 7 (2862).
