I. Le problème — cotes relatives contre échelle absolue

Un logiciel comme Ordo calcule des cotes Elo relatives à partir des résultats d'un tournoi. Sans ancre externe, le classement flotte librement : on sait que le moteur A est supérieur de 200 points au moteur B, mais on ne sait pas où ils se situent sur l'échelle absolue SSDF ou CCRL. Le grand tournoi seul ne suffit pas — il donne de l'ordre, pas de l'altitude.

Une ancre est un moteur dont la cote absolue est établie par gauntlet dédié — des parties jouées contre des adversaires eux-mêmes déjà calibrés, sur le hardware de référence Ryzen 9 7950X3D. En fixant plusieurs ancres à des niveaux différents, Ordo peut aligner tout le classement sur l'échelle absolue, comme poser une règle graduée sur une carte sans repères. On ne peut calibrer un moteur qu'en le faisant jouer contre des adversaires proches en force, eux-mêmes déjà ancrés. La stratégie est donc une montée progressive : chaque nouvelle ancre s'appuie sur les précédentes, étendant la zone calibrée vers le haut. C'est le principe de l'échelle de Jacob — un barreau à la fois.

Le grand tournoi sert à identifier la hiérarchie et choisir quels moteurs méritent d'être calibrés en priorité. Il ne remplace pas les gauntlets dédiés : ses cotes restent relatives, mais il montre les écarts entre moteurs et les zones de l'échelle qui manquent d'ancres.

Principe méthodologique — Chroniques Software, 2026

II. Grand Tournoi — 76 moteurs, cotes relatives

Paramètres et zones de couverture

📋 Paramètres du Grand Tournoi · total-3 2850 parties Pool : 76 moteurs · 75 parties par moteur · Hardware : 8 threads Ryzen 9 7950X3D sauf mention · Cotes calculées par Ordo, relatives au pool · Erreur σ = 400 × √(p·(1−p)/N) · Les ancres existantes (fond vert) servent de points d'attache à Ordo.
Zone Haute · 3297–4072
17 moteurs · 0 ancre — à calibrer en priorité absolue
Zone Intermédiaire · 3163–3297
19 moteurs · 1 ancre (Wasp 2.00)
Zone Basse · 2685–3163
40 moteurs · 6 ancres — bien couverte
# Moteur Elo σ Pts N % Zone
1Dragon by Komodo Chess 64-bit4071.7±12.069.57593%HAUTE
2Stockfish 18 8CPU4037.1±13.068.57591%HAUTE
3Caissa 1.24 POPCNT 8CPU4034.7±13.068.57591%HAUTE
4Fire 9.3 x64 avx2 8CPU4034.3±13.068.57591%HAUTE
5Stockfish 12 8CPU4006.7±13.967.57590%HAUTE
6Rebel-16.3 8CPU4002.6±13.967.57590%HAUTE
7Lc0 v0.31.0-rc13992.4±14.367.07589%HAUTE
8Fritz 20 AVX512 8CPU3959.0±15.066.07588%HAUTE
9Stockfish 11 64 BMI2 8CPU3955.7±15.066.07588%HAUTE
10Ethereal 12.75 (PEXT) 8CPU3898.3±16.364.07585%HAUTE
11Komodo 14.1 64-bit 8CPU3889.5±16.663.57585%HAUTE
12Rebel-Extreme-1.1 8CPU3885.9±16.663.57585%HAUTE
13Stockfish 8 64 BMI2 8CPU3874.4±16.663.57585%HAUTE
14Komodo 12.1.1 64-bit 8CPU3861.0±16.963.07584%HAUTE
15Caissa 1.5 8CPU3851.9±17.262.57583%HAUTE
16Wasp 7.00 8CPU3818.1±18.061.07581%HAUTE
17Wasp 5.50 8CPU3756.6±18.959.07579%HAUTE
18Deep Shredder 13 x64 8CPU3621.4±20.953.57571%INTER.
19Wasp 4.50 8CPU3619.4±21.053.07571%INTER.
20Gull 3 x64 BMI2 8CPU3597.9±21.252.57570%INTER.
21Houdini 4 Pro x64 8CPU3595.4±21.352.07569%INTER.
22Critter 1.6a 64-bit 8CPU3580.4±21.451.57569%INTER.
23Houdini 5.01 Pro x64 8CPU3564.9±21.551.07568%INTER.
24Rebel 14.13563.2±21.750.57567%INTER.
25Wasp 3.75 8CPU3522.9±22.049.07565%INTER.
26Deep Rybka 4.1 SSE42 x64 8CPU3512.9±22.148.57565%INTER.
27Houdini 6 Pro x64-popc 8CPU3506.9±22.248.07564%INTER.
28Critter 1.01 64-bit SSE4 8CPU3503.2±22.248.07564%INTER.
29Senpai 2.0 8CPU3477.0±22.446.57562%INTER.
30Fire 1.5 xTreme x64p 8CPU3474.5±22.446.57562%INTER.
31Naum 4.2 8CPU3420.4±22.744.07559%INTER.
32spark-1.0-win64-mp-corei 8CPU3352.3±23.040.57554%INTER.
33Senpai 1.0 8CPU3351.6±23.040.57554%INTER.
34Komodo64 33335.0±23.139.57553%INTER.
35Deep Shredder 12 x64 8CPU3334.9±23.139.57553%INTER.
36Absurd-1.0 8CPU3327.6±23.139.07552%INTER.
37Wasp 2.00 8CPU ANCRE A13297.0±23.139.57553%ANCRÉE
38Colossus 2025b 8CPU3243.4±23.034.57546%COUVERTE
39Rybka 2.4 mp 32-bit 8CPU ANCRE A23234.0±23.139.57553%ANCRÉE
40Toga II 1.4 beta5c3223.1±23.033.57545%COUVERTE
41Fritz 13 SE3217.7±22.933.07544%COUVERTE
42Zappa Mexico II x64 8CPU3206.9±22.932.57543%COUVERTE
43Gull 1.2 x643205.4±22.932.57543%COUVERTE
44Glaurung 2.2 JA 8CPU ANCRE A33163.0±23.033.57545%ANCRÉE
45Rybka 1.0 Beta 32-bit3153.1±22.629.57539%COUVERTE
46Loop M1-T-1234 8CPU3135.2±22.428.57538%COUVERTE
47FRUIT 2.3.13112.2±22.227.07536%COUVERTE
48Shredder 10 UCI ANCRE A43087.0±20.119.07525%ANCRÉE
49Deep Fritz 83084.3±21.925.57534%COUVERTE
50Fritz 103054.3±21.524.07532%COUVERTE
51Chess Tiger 20073049.1±21.423.57531%COUVERTE
52ProDeo 1.823037.5±21.323.07531%COUVERTE
53Gambit Fruit 1.0 Beta 4bx3019.4±21.022.07529%COUVERTE
54Pharaon 3.5.1 8CPU2999.4±20.620.57527%COUVERTE
55Deep Junior 7 ANCRE A52996.0±18.916.07521%ANCRÉE
56Ruffian 2.1.02979.5±20.319.57526%COUVERTE
57Crafty 20.142971.1±20.119.07525%COUVERTE
58Fritz 72965.1±20.119.07525%COUVERTE
59Shredder 62948.5±19.718.07524%COUVERTE
60Fritz 6 ANCRE A62947.0±18.515.07520%ANCRÉE
61Deep Fritz2922.2±19.116.57522%COUVERTE
62Gandalf 6.012918.3±19.116.57522%COUVERTE
63Gambit Tiger 2.02916.7±18.916.07521%COUVERTE
64Fritz 82907.3±18.715.57521%COUVERTE
65ProDeo 2.02907.1±18.715.57521%COUVERTE
66SOS 5 for Arena2900.7±18.715.57521%COUVERTE
67Hiarcs 82889.5±18.214.57519%COUVERTE
68Deep Sjeng 1.6 8CPU2870.0±18.014.07519%COUVERTE
69Junior 82869.1±18.014.07519%COUVERTE
70Junior 7 ANCRE A72862.0±19.116.57522%ANCRÉE
71List 5122855.8±17.513.07517%COUVERTE
72Nimzo 82837.2±17.212.57517%COUVERTE
73Tao 5.62836.0±17.212.57517%COUVERTE
74Hiarcs 7.322813.2±16.611.57515%COUVERTE
75Yace Paderborn2778.6±15.49.57513%COUVERTE
76Fritz 5.322684.5±13.06.5759%COUVERTE

σ = 400 × √(p × (1−p) / N) où p = points/parties, N = 75 parties. Cotes relatives au pool — ancres (fond vert) servent de pivot absolu à Ordo. Les Elo sont ceux du tournoi total-3 (2850 parties).

II bis. Analyse du tournoi — performances notables

Dragon by Komodo Chess domine le tournoi avec 93 % (69,5/75), devançant nettement le trio Stockfish 18 / Caissa 1.24 / Fire 9.3 qui se partagent la 2e place à 91 % — et seulement 0,4 point d'Elo d'écart entre eux. Le classement de ce tournoi renverse l'ordre attendu au sommet.

— Observation Chroniques Software · tournoi total-3 · 2026

Moteurs dominants — le sommet du tableau

Dragon by Komodo Chess s'impose avec 4071,7 Elo et 93 % de score — meilleure performance absolue du tournoi. Il devance Stockfish 18 (4037,1) d'un écart de 34 points, ce qui est significatif sur 75 parties. Stockfish 18, Caissa 1.24 et Fire 9.3 sont pratiquement à égalité (68,5 pts chacun), séparés par seulement 2,8 points d'Elo : un résultat statistiquement indiscernable qui exigerait au moins 200 parties supplémentaires pour être tranché. Rebel-16.3 confirme sa vigueur avec 90 %, devançant Lc0 qui se révèle légèrement en retrait par rapport aux autres moteurs modernes (89 %, 3992 Elo).

Moteurs n'ayant jamais perdu — ou presque

Dragon by Komodo (93 %), Stockfish 18, Caissa 1.24 et Fire 9.3 (91 % chacun) maintiennent un score plancher impressionnant sur 75 parties. Avec des σ de ±12 à ±13 points, leurs cotes sont les plus précises de tout le pool — une conséquence directe de leur domination constante. Stockfish 12 et Rebel-16.3 à 90 % ne perdent que contre le quatuor de tête.

Moteurs ayant surperformé leur classement attendu

Surprises positives Mieux que prévu — performances dépassant les attentes historiques
  • Wasp 7.00 8CPU (rang 16 · 3818) — impressionne avec 81 %, au-dessus des Komodo 14 et Rebel-Extreme qui le précèdent de peu. Sa montée en version est remarquable : +521 points Elo entre Wasp 2.00 et Wasp 7.00, la progression la plus spectaculaire d'un moteur au fil de ses versions dans ce pool.
  • Colossus 2025b 8CPU (rang 38 · 3243) — moteur moderne qui se hisse au niveau des anciens champions des années 2005–2010. Ses 46 % dans ce pool très compétitif sont une performance solide pour un programme récent face à des machines multi-thread optimisées.
  • Rebel 14.1 (rang 24 · 3563) — version monoprocesseur qui rivalise avec Houdini 4 et 5 Pro, moteurs pourtant configurés en 8CPU. Un score de 67 % suggère une efficacité algorithmique exceptionnelle par thread.
  • Lc0 v0.31.0-rc1 (rang 7 · 3992) — le seul réseau de neurones du pool, il se glisse parmi les Stockfish et Komodo à 89 %. Remarquable compte tenu de son architecture radicalement différente.
Déceptions relatives En-deçà des attentes — moteurs ayant sous-performé
  • Shredder 10 UCI (rang 48 · 3087 · ancre A4) — seulement 25 % de score, très en-dessous des autres moteurs de sa génération dans ce pool. La cause probable n'est pas une faiblesse intrinsèque mais un effet de cadence : ce tournoi se joue à 3 minutes par partie, alors que lors de son gauntlet d'étalonnage, Shredder 10 avait 15 secondes par coup. Les moteurs classiques des années 2000 géraient typiquement un calcul court et intense à chaque coup ; en parties longues, les machines modernes à deep search et tablebase les écrasent plus facilement qu'en blitz. Sa cote absolue de 3087 Elo reste valable pour la cadence de référence du gauntlet.
  • Deep Junior 7 (rang 55 · 2996 · ancre A5) — même diagnostic : 21 % en parties de 3 minutes contre 15 secondes/coup lors de l'étalonnage. Junior était architecturalement taillé pour l'attaque et la tactique à cadence rapide — son moteur sélectif à grande profondeur sur des lignes précises perd une partie de son avantage dès que les modernes peuvent aussi calculer profond. Sa cote absolue de 2996 reflète la cadence gauntlet, pas les 3 minutes du tournoi.
  • Houdini 6 Pro (rang 27 · 3507) — version plus récente mais classée légèrement sous Houdini 4 et Houdini 5 dans ce tournoi. Probablement un artéfact de configuration (paramètres, tablebases) plutôt qu'une réalité intrinsèque.

Anomalie notable — Shredder 10 et sa σ basse

Shredder 10 UCI (rang 48) présente la particularité d'obtenir l'une des σ les plus basses hors sommet : ±20,1. Cela vient de son score atypiquement bas (19/75 = 25 %), qui réduit p×(1−p) à 0,25×0,75 = 0,19, valeur plus faible que celle des moteurs autour de 50 %. En pratique, cette précision apparente est trompeuse : un moteur écrasé par le pool est moins informatif qu'un moteur qui se bat à 50 %. Deep Junior 7 (21 %) et Fritz 6 (20 %) présentent le même phénomène. C'est précisément l'intérêt du gauntlet dédié — joué à la cadence d'étalonnage — pour confirmer les cotes absolues de ces moteurs ancienne génération.

II ter. Les 6 nouvelles ancres retenues

Avec 75 parties chacun, le tournoi total-3 permet d'identifier les meilleurs candidats à la calibration. Le critère de sélection est triple : spacing sous 150 points entre ancres consécutives, σ aussi basse que possible, et existence de données CCRL ou SSDF pour validation externe. Ce sont exactement les 6 ancres qui constituent le plan de calibration de la section IV.

6 ancres retenues — plan définitif Étapes B1 à B6 · zone 3297–4072 · sauts ≤ 141 Elo
  • B1 · Naum 4.2 8CPU (3420 ±22,7) — +123 vs Wasp 2.00. Moteur au comportement stable et documenté, 59 % dans ce pool. Premier barreau de l'échelle, vs A1 + A2 + A3 pour triple ancrage.
  • B2 · Wasp 3.75 8CPU (3523 ±22,0) — +103 vs Naum. Colonne vertébrale de la série Wasp, progression régulière garantie. Vs B1 + A1.
  • B3 · Wasp 4.50 8CPU (3619 ±21,0) — +96 vs Wasp 3.75. Écart le plus court du plan, gauntlet le plus précis. Franchit le seuil des 3600. Vs B2 + B1.
  • B4 · Wasp 5.50 8CPU (3757 ±18,9) — +138 vs Wasp 4.50. Étape pivot : ouvre la zone des moteurs modernes multi-CPU au-dessus de 3700. Vs B3 + B2.
  • B5 · Ethereal 12.75 (PEXT) 8CPU (3898 ±16,3) — +141 vs Wasp 5.50. Moteur open-source de très haut niveau, σ ±16,3 la meilleure hors sommet du pool. Remplace Stockfish 11 dans le plan original : même zone, σ plus favorable, données CCRL abondantes. Vs B4 + B3.
  • B6 · Stockfish 12 8CPU (4007 ±13,9) — +109 vs Ethereal. Ancre finale haute, saut maîtrisé. Une fois calibré, Ordo peut placer Dragon, SF18, Caissa 1.24 et Fire 9.3 en cascade — complétant l'échelle jusqu'à 4072. Vs B5 + B4.

III. Diagnostic — un gap critique de 775 points

La zone 3297 → 4072, de Wasp 2.00 jusqu'à Dragon by Komodo, couvre 775 points Elo et regroupe 17 moteurs — soit 22 % du pool total. Elle est intégralement dépourvue d'ancre.

— Diagnostic Chroniques Software · 2026 · Gap priorité absolue du plan de calibration

Les cotes Ordo de cette zone reposent uniquement sur l'extrapolation à partir de Wasp 2.00, avec une incertitude qui s'accumule à mesure qu'on monte. Un moteur classé à 4007 Elo relatif pourrait en réalité être à 3900 ou 4100 — sans ancre intermédiaire, impossible de le savoir. C'est la priorité absolue du plan qui suit.

7 ancres établies Gauntlets dédiés sur Ryzen 9 7950X3D — zone 2862 à 3297
  • A1 · Wasp 2.00 8CPU3297 ±23,1 · Sommet actuel de la chaîne d'ancres
  • A2 · Rybka 2.4 mp 8CPU3234 ±23,1 · +63 sous Wasp 2.00
  • A3 · Glaurung 2.2 JA 8CPU3163 ±23,0 · 75 parties · résultat précis
  • A4 · Shredder 10 UCI3087 ±20,1 · σ basse (score extrême p=0.25)
  • A5 · Deep Junior 72996 ±18,9 · σ basse (score extrême p=0.21)
  • A6 · Fritz 62947 ±18,5 · σ basse (score extrême p=0.20)
  • A7 · Junior 72862 ±19,1 · Ancre de base — fond de l'échelle

IV. Plan de Calibration — montée en 6 étapes

On ne saute jamais plus de ~150 Elo entre deux ancres consécutives — au-delà, le gauntlet perd en précision. Les moteurs de la série Wasp constituent la colonne vertébrale de B1 à B4 : bien distribués sur l'échelle, chaque version est naturellement proche de la précédente. Ethereal remplace Stockfish 11 en B5 : même zone, σ plus favorable, sauts mieux équilibrés.

1

Naum 4.2 8CPU

3420,4 Elo relatif
✔ Wasp 2.00 (A1 · 3297)
✔ Rybka 2.4 (A2 · 3234)
✔ Glaurung 2.2 (A3 · 3163)
Premier échelon au-dessus de Wasp 2.00. Naum affiche 59 % dans ce pool très compétitif — qualité algorithmique confirmée. Triple ancrage vs A1 + A2 + A3 pour maximum de précision.
+123 vs Wasp 2.00 · couvre 3297→3420
2

Wasp 3.75 8CPU

3522,9 Elo relatif
✔ Naum 4.2 (B1 · ~3420)
✔ Wasp 2.00 (A1 · 3297)
Suite logique de la série Wasp. +226 Elo au-dessus de Wasp 2.00, +103 au-dessus de Naum — espacement idéal pour un gauntlet précis. Naum fraîchement calibré assure une opposition solide.
+103 vs Naum · couvre 3420→3523
3

Wasp 4.50 8CPU

3619,4 Elo relatif
✔ Wasp 3.75 (B2 · ~3523)
✔ Naum 4.2 (B1 · ~3420)
Saut le plus court du plan : +96 points. Gauntlet le plus précis statistiquement. Franchit le seuil des 3600 et prépare l'opposition à Wasp 5.50.
+96 vs Wasp 3.75 · couvre 3523→3619
4

Wasp 5.50 8CPU

3756,6 Elo relatif
✔ Wasp 4.50 (B3 · ~3619)
✔ Wasp 3.75 (B2 · ~3523)
Étape pivot : dernier Wasp, ouvre la zone 3700+. +138 points — doublement sécurisé par deux ancres Wasp. Prépare l'opposition à Ethereal.
+138 vs Wasp 4.50 · ouvre la zone 3700+
5

Ethereal 12.75 (PEXT) 8CPU

3898,3 Elo relatif
✔ Wasp 5.50 (B4 · ~3757)
✔ Wasp 4.50 (B3 · ~3619)
Moteur open-source de très haut niveau, σ ±16,3 — la meilleure hors sommet du pool. Remplace Stockfish 11 : saut ramené de +199 à +141, validation CCRL abondante. Ancre internationale de première qualité.
+141 vs Wasp 5.50 · franchit le seuil 3900
6

Stockfish 12 8CPU

4006,7 Elo relatif
✔ Ethereal 12.75 (B5 · ~3898)
✔ Wasp 5.50 (B4 · ~3757)
Ancre finale haute. +109 vs Ethereal — saut bien maîtrisé. Une fois calibré, Ordo place Dragon by Komodo (4072), Stockfish 18, Caissa 1.24 et Fire 9.3 en cascade, complétant l'échelle sur 1387 points.
+109 vs Ethereal · ancre le sommet complet

V. Résultat attendu — 13 ancres sur 1387 points

Objectif final 13 ancres · 2685–4072 · ±35 Elo max. pour tout moteur interstitiel
  • Étendue calibrée : 2685 → 4072 — soit 1387 points Elo couverts
  • Espacement moyen entre ancres : ~107 Elo sur 13 points de référence
  • Incertitude maximale pour tout moteur entre deux ancres : ±35 Elo
  • Parties gauntlets supplémentaires : ~420 réparties sur 6 gauntlets
  • Tournoi final objectif : ≥ 100 parties par moteur pour cotes absolues définitives
  • 76 moteurs disposant d'une cote absolue Ryzen 9 7950X3D exploitable contre SSDF et CCRL
Ancres actuelles
7
2685 → 3297 Elo
Nouvelles ancres
6
3420 → 4007 Elo · sauts ≤ 141
Gap comblé
775 pts
3297 → 4072 couverts
Moteurs classés
76
échelle absolue Ryzen 9