Skip to content

Performance ELO, tournois maison

Rang Moteur / Système Hardware Elo Parties Err +/-
★ 1Wasp 7.00 — 8 ThreadsAMD Ryzen 9 7950X3D 100%37556011
2Komodo 12.1.1 64-bit — 8 ThreadsAMD Ryzen 9 7950X3D 100%37247510
3Stockfish 8 64 POPCNT — 8 ThreadsAMD Ryzen 9 7950X3D 100%36938010
4Caissa 1.5 — 8 ThreadsAMD Ryzen 9 7950X3D 100%36848010
5Booot 6.5 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%36777510
6Wasp 5.50 — 8 ThreadsAMD Ryzen 9 7950X3D 100%36736011
7Ethereal 11.75 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%36356711
8Deep Shredder 13 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%35765910
9Houdini 4 Pro x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%35561028
10Gull 3 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%35078010
11Critter 1.6a 64-bit — 8 ThreadsAMD Ryzen 9 7950X3D 100%3458769
12Wasp 3.75 — 8 ThreadsAMD Ryzen 9 7950X3D 100%34205926
13Naum 4.2 — 8 ThreadsAMD Ryzen 9 7950X3D 100%33985923
14Senpai 2.0 — 8 ThreadsAMD Ryzen 9 7950X3D 100%33804613
15Komodo64 3AMD Ryzen 9 7950X3D 100%33597910
16Wasp 2.01 — 8 ThreadsAMD Ryzen 9 7950X3D 100%32977320
17Rybka 2.4MP — 8 ThreadsAMD Ryzen 9 7950X3D 100%32346721
18Glaurung 2.2 x64 — 8 ThreadsAMD Ryzen 9 7950X3D 100%31637523
19Shredder 10 UCIAMD Ryzen 9 7950X3D 100%30878021
20Deep Sjeng 1.6 — 8 ThreadsAMD Ryzen 9 7950X3D 100%30377010
21ProDeo 2.0AMD Ryzen 9 7950X3D 100%29996711
22Deep Junior 7 — 8 ThreadsAMD Ryzen 9 7950X3D 100%29967223
23Junior 8AMD Ryzen 9 7950X3D 100%29926211
24Ruffian 2.1.0AMD Ryzen 9 7950X3D 100%2966909
25Gambit Tiger 2.0AMD Ryzen 9 7950X3D 100%29576011
26Fritz 6AMD Ryzen 9 7950X3D 100%294710719
27Gandalf 6.01AMD Ryzen 9 7950X3D 100%29477010
28List 5.12AMD Ryzen 9 7950X3D 100%29366011
29SOS 5 for ArenaAMD Ryzen 9 7950X3D 100%2917809
30Nimzo 8AMD Ryzen 9 7950X3D 100%28717510
31Junior 7AMD Ryzen 9 7950X3D 100%28627521
32Hiarcs 7.32AMD Ryzen 9 7950X3D 100%28625512
33Fritz 5.32AMD Ryzen 9 7950X3D 100%28558721
34Yace PaderbronAMD Ryzen 9 7950X3D 100%28306111
35The King 3.50AMD Ryzen 9 7950X3D 100%28178022
36Rebel 6AMD Ryzen 9 7950X3D 100%276116116
37Cray Blitz 4.9hAMD Ryzen 9 7950X3D 100%25317019
38Rebel 6AMD Ryzen 9 7950X3D 1%25276047
39Mephisto Genius 68030 Londoncb-emu236334913
40Mephisto Berlin Pro 68020cb-emu231534915
41Mephisto RISC IIcb-emu226634216
42Saitek RISC 2500 v1.04cb-emu224734817
43Mephisto Dallas 68000-UCIAMD Ryzen 9 7950X3D 100%223323821
44Novag Star Diamond (v1.04)cb-emu222635017
45Saitek Sparc (rev.518)cb-emu215334719
46Mephisto Berlin 68000 v0.03cb-emu213534919
47Fidelity Elite Avantgarde V9cb-emu212535019
48Novag Sapphirecb-emu212333420
49Mephisto MM5 (v5.1)-UCIAMD Ryzen 9 7950X3D 100%210826423
50Fidelity Designer Mach IVcb-emu209035020
51Fidelity Designer Mach IIIcb-emu202934821
52Mephisto Mondial 68000 XLcb-emu197334621
53Novag Zircon IIcb-emu197033422
54Saitek Presidentcb-emu195834421
55Mephisto Nigel Shortcb-emu195634921
56Saitek Maestro D++cb-emu192334821
57Novag Super Forte C v3.6cb-emu190134921
58Novag Super Expert C v3.6cb-emu189434921
59Novag Turquoisecb-emu187134421
60Saitek Corona II (ver. D+)cb-emu185635021
61Mephisto Modena (set 3)cb-emu185034921
62Saitek Turbo King II (D+)cb-emu184434821
63Mephisto MM V (v5.1)cb-emu183535021
64Mephisto MM IV (v7.10)cb-emu180834821
65Fidelity Designer 2100cb-emu180834821
66Novag Constellation Forte Acb-emu180335021
67Saitek Simultano (ver. B)cb-emu176434920
68Fidelity Par Excellence (B)cb-emu174234720
69Saitek Prismacb-emu172434919
70Fidelity Designer 2000cb-emu170334819
71Novag Super VIP v3.7cb-emu164034817
72Tandy Chess Champion 2150cb-emu157734616
73Saitek Turbo 16Kcb-emu143734811
74Saitek Leonardo (v1.4)cb-emu12853478
Moteurs de calibration : Zappa Mexico II (3059), Glaurung 2.2 (2995), Wasp 2 (2956), Rybka 2.3.1 (2920), Fruit 2.3.1 (2861), Shredder 10 (2825), The King 3.50 (Perf. 2817), Chess Tiger 2007 (2802).
Err +/- calculée via σ = 400 × √(p×(1−p) / N), avec p = score réel observé. — Moteurs sans mention de threads : mono-thread.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Wasp 7.00 (8 Threads)

Ce document présente les résultats du gauntlet de calibration de Wasp 7.00 — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3693 Elo). Wasp est un moteur développé par John Stanback, programmeur américain, actif depuis la version 2.x. À partir de la version 5.00, Wasp intègre une évaluation NNUE — la version 7.00 est donc un moteur NNUE natif, successeur d'une série qui était auparavant HCE.

Le moteur et son auteur

John Stanback développe Wasp depuis 2014 environ. La série a connu une progression remarquable en HCE jusqu'à la version 4.x, puis une transition vers le NNUE à partir de la version 5.00 qui lui a conféré un bond de force considérable. Wasp 7.00 représente l'état de l'art actuel de la série — son développement suit un rythme régulier de mises à jour sans rupture majeure d'architecture.

La série Wasp est distribuée librement sur GitHub. Ses versions HCE (2.x, 3.x) figurent déjà dans cette échelle — Wasp 2.01 (3297 · rang 15) et Wasp 3.75 (3420 · rang 11) — ce qui rend Wasp l'un des rares moteurs dont trois générations distinctes sont mesurées dans ce laboratoire, illustrant l'évolution HCE→NNUE sur une seule ligne de code.

VersionType éval.Elo laboRemarque
Wasp 2.01HCE3297Rang 15 dans cette échelle
Wasp 3.75HCE3420Rang 11 dans cette échelle
Wasp 5.50NNUE3673Rang 5 dans cette échelle
Wasp 7.00NNUE3755★ Rang 1 — version calibrée

Résultats détaillés du gauntlet

Rencontre (Wasp 7.00 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Wasp 7.00 8CPU – Stockfish 8 64 POPCNT 8CPU36939.5 – 5.51563.33%
Wasp 7.00 8CPU – Caissa 1.5 8CPU36848.0 – 7.01553.33%
Wasp 7.00 8CPU – Booot 6.5 x64 8CPU36779.5 – 5.51563.33%
Wasp 7.00 8CPU – Ethereal 11.75 8CPU363510.0 – 5.01566.67%
Total cumulémoy. pond. 367237.0 – 23.06061.67%
Performance Elo obtenue

Elo : 3755
Erreur (σ) : ±11
Nombre de parties : 60

Moyenne pondérée des ancres : (3693×15 + 3684×15 + 3677×15 + 3635×15) / 60 = 3672.
Performance = 3672 + 400 × log₁₀(0.6167 / 0.3833) = 3672 + 400 × 0.2066 = 3755.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.6167 et N = 60 → σ = ±11.

Lecture des résultats

Le gauntlet de Wasp 7.00 est l'un des plus stables jamais observés dans ce laboratoire. Le rating a oscillé dans une fenêtre de seulement 19 points depuis la première mesure significative : 3753 (18 parties), 3746 (24), 3736 (39), 3749 (51), 3755 (60). Cette convergence précoce et régulière témoigne d'un profil stylistique parfaitement cohérent, sans anomalie ni variance excessive.

L'analyse par adversaire révèle une asymétrie notable. Wasp 7.00 domine de façon très homogène les trois moteurs HCE — 63.33% contre Stockfish 8 (3693), 63.33% contre Booot 6.5 (3677) et 66.67% contre Ethereal 11.75 (3635) — mais ne fait que 53.33% contre Caissa 1.5 (3684), moteur NNUE natif. Cette dichotomie HCE/NNUE est un marqueur stylistique clair : Wasp 7.00 exploite les faiblesses propres à l'évaluation manuscrite mais rencontre plus de résistance face à un adversaire de même paradigme. Caissa 1.5 est le seul moteur de ce gauntlet qui lui résiste réellement.

Comparaison avec les listes de référence

La progression de la série Wasp dans ce laboratoire illustre parfaitement l'impact du NNUE : Wasp 2.01 (3297) → Wasp 3.75 (3420) → Wasp 5.50 (3673) → Wasp 7.00 (3755). Le gain HCE entre 2.01 et 3.75 est de 123 points sur plusieurs années de développement. Le gain NNUE entre 3.75 et 5.50 est de 253 points — soit plus du double en une seule transition architecturale. Le gain entre 5.50 et 7.00 est de 82 points — ce qui représente deux années de développement NNUE intensif au sommet de l'échelle, là où chaque point est plus difficile à arracher.

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Wasp 7.0037558NNUEMesuré · σ = ±11 · ★ Rang 1
Stockfish 836938HCEAncre — 63.33%
Caissa 1.536848NNUEAncre — 53.33% (résistance NNUE)
Booot 6.5 x6436778HCEAncre — 63.33%
Wasp 5.5036738NNUEPrédécesseur — +82 Elo
Ethereal 11.7536358HCEAncre inférieure — 66.67%

Wasp 7.00 (3755) prend le ★ rang 1 de l'échelle avec une avance de 62 points sur Stockfish 8 (3693) et de 71 points sur Caissa 1.5 (3684). C'est le premier moteur de cette échelle à franchir le cap des 3750 — et la troisième génération de la série Wasp à être calibrée dans ce laboratoire. La saga Wasp incarne à elle seule la révolution NNUE : deux générations HCE à 3297 et 3420, deux générations NNUE à 3673 et 3755.

Calibration Elo — Komodo 12.1.1 64-bit (8 Threads)

Ce document présente les résultats du gauntlet de calibration de Komodo 12.1.1 64-bit — 8 threads, joué contre six moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3755 Elo). Komodo est un moteur commercial développé par Mark Lefler et Larry Kaufman, économiste et grand maître international américain. La version 12.1.1 est une version à évaluation entièrement manuscrite (HCE) — Komodo n'adoptera l'architecture NNUE qu'avec la série Dragon, lancée en 2020.

Note — Gauntlet en cours (75/90 parties)

Ce rapport est établi à 83% du gauntlet. Le rating de 3724 est stable depuis 46 parties dans une fenêtre de ±7 points (3718–3725), ce qui justifie la publication de ce rapport intermédiaire. 15 parties restantes ne modifieront pas le classement de façon significative.

Résultats détaillés du gauntlet

Rencontre (Komodo 12.1.1 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Komodo 12.1.1 8CPU – Wasp 7.00 8CPU37556.0 – 7.01346.15%
Komodo 12.1.1 8CPU – Stockfish 8 64 POPCNT 8CPU36938.5 – 4.51365.38%
Komodo 12.1.1 8CPU – Caissa 1.5 8CPU36847.0 – 6.01353.85%
Komodo 12.1.1 8CPU – Booot 6.5 x64 8CPU36776.5 – 5.51254.17%
Komodo 12.1.1 8CPU – Wasp 5.50 8CPU36738.0 – 4.01266.67%
Komodo 12.1.1 8CPU – Ethereal 11.75 x64 8CPU36355.5 – 6.51245.83%
Total cumulémoy. pond. 368741.5 – 33.57555.33%
Performance Elo obtenue

Elo : 3724 (préliminaire — 75/90 parties)
Erreur (σ) : ±10
Nombre de parties : 75

Moyenne pondérée des ancres : (3755×13 + 3693×13 + 3684×13 + 3677×12 + 3673×12 + 3635×12) / 75 = 3687.
Performance = 3687 + 400 × log₁₀(0.5533 / 0.4467) = 3687 + 400 × 0.0930 = 3724.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.5533 et N = 75 → σ = ±10.

Lecture des résultats

Le gauntlet de Komodo 12.1.1 a convergé tôt et fermement. Depuis la 46e partie, le rating oscille dans une fenêtre de ±7 points — l'une des convergences les plus rapides observées dans ce laboratoire pour un moteur de cette zone. Les perfs individuelles sur quatre ancres centrales se regroupent dans une fenêtre de seulement 42 points (3706–3728), ce qui atteste d'une mesure cohérente.

Le gauntlet révèle deux asymétries stylistiques notables. La première, favorable : 65.38% contre Stockfish 8 (3693) sur 13 parties et 66.67% contre Wasp 5.50 (3673) sur 12 parties — deux moteurs contre lesquels Komodo 12 affiche une nette surperformance par rapport à son niveau général. La seconde, défavorable : 45.83% contre Ethereal 11.75 (3635) sur 12 parties — un moteur HCE 130 points en dessous de Komodo 12 dans cette échelle, contre lequel le résultat devrait être plus favorable. Ces deux polarités se compensent dans le calcul global mais signalent un profil stylistique tranché.

L'avantage persistant contre Stockfish 8 mérite une attention particulière. Sur la durée — 13 parties — un score de 65.38% dépasse statistiquement le niveau attendu pour un moteur à 3724 face à un adversaire à 3693. Une explication plausible, documentée dans la communauté des moteurs d'échecs, est que les paramètres d'évaluation de Komodo 12 ont été tuned en jouant massivement contre Stockfish, ce qui aurait généré des biais stylistiques spécifiquement efficaces contre ce moteur. Il ne s'agit pas d'une assertion certaine mais d'une hypothèse cohérente avec le profil du gauntlet.

Comparaison avec les listes de référence

Le CCRL 40/15 place Komodo 12.1.1 64-bit 4CPU à 3464 Elo sur Intel i7-4770K. L'écart avec le rating maison (3724) s'élève à +260 points — cohérent avec les différentiels observés pour les autres moteurs HCE de la zone supérieure (Stockfish 8 +256, Booot 6.5 +298, Deep Shredder 13 +249). Komodo 12 a toujours été réputé pour une implémentation SMP particulièrement efficace, ce qui explique une partie du gain au passage de 4 à 8 threads.

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Wasp 7.0037558NNUE★ Rang 1 — ancre supérieure · 46.15%
Komodo 12.1.137248HCEMesuré · σ = ±10 · 75/90 parties
Stockfish 836938HCEAncre — 65.38%
Caissa 1.536848NNUEAncre — 53.85%
Booot 6.5 x6436778HCEAncre — 54.17%
Wasp 5.5036738NNUEAncre — 66.67%
Ethereal 11.7536358HCEAncre inférieure — 45.83%

Komodo 12.1.1 (3724) prend le rang 2 de l'échelle, entre Wasp 7.00 (3755 · NNUE) et Stockfish 8 (3693 · HCE), à 31 points de Wasp 7.00 et 31 points au-dessus de Stockfish 8. C'est le moteur HCE le plus fort de l'échelle hors Wasp 7.00, et la dernière grande version HCE de la série Komodo avant la transition Dragon. Avec σ = ±10 sur 75 parties, la mesure est l'une des plus précises de toute la zone supérieure du laboratoire.

Calibration Elo — Stockfish 8 64 POPCNT (8 Threads)

Ce document présente les résultats du gauntlet de calibration de Stockfish 8 64 POPCNT — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3635–3684 Elo). Stockfish est un moteur libre et open-source développé par une équipe internationale de contributeurs, dont les principaux fondateurs sont Tord Romstad (Norvège), Marco Costalba (Italie) et Joona Kiiski (Finlande). La version 8 est une version à évaluation entièrement manuscrite (HCE), publiée en novembre 2016 — l'avant-dernière grande version HCE pure avant la série 9–11 qui précède la révolution NNUE de 2020.

Le moteur et son histoire

Stockfish naît en 2008 de la fusion de deux projets : Glaurung, moteur de Tord Romstad, et les travaux de Marco Costalba. Joona Kiiski rejoint rapidement le projet. Dès ses premières versions, Stockfish adopte une philosophie radicalement ouverte : le code source est publié sous licence GPL, les tests de développement sont distribués via Fishtest (une plateforme communautaire créée en 2012 permettant à des milliers de contributeurs de tester des modifications en parallèle), et toutes les décisions d'amélioration sont validées statistiquement avant intégration.

La progression de Stockfish en termes de rating est sans équivalent dans l'histoire des moteurs d'échecs : de ~2700 Elo à ses débuts en 2008 à plus de 3500 Elo CCRL à l'apogée de la série HCE. La version 8, publiée le 1er novembre 2016, introduit des améliorations significatives de la recherche (notamment du Syzygy tablebase probing optimisé, des améliorations de la réduction LMR et du pruning en fin de recherche) et un affinement de l'évaluation positionnelle. Elle est créditée de 3437 Elo CCRL 40/15 en 4CPU sur i7-4770K.

La transition vers le NNUE s'opère progressivement : Stockfish 12 (août 2020) est la première version officielle avec NNUE activé par défaut, et Stockfish 16.1 supprime définitivement l'option de revenir au HCE classique. Pour les moteurs HCE, Stockfish 8 représente une étape intermédiaire entre les grandes versions 5–7 qui avaient déjà établi la suprématie mondiale du programme, et les versions 9–11 qui constituent l'apogée HCE absolu. La version HCE la plus forte mesurée dans ce laboratoire est SF8, HCE pur.

VersionDateType éval.Événement / Progrès
1.0Nov. 2008HCEFusion Glaurung + Costalba — naissance de Stockfish
5Mai 2014HCEIntroduction de Fishtest — développement distribué massif
7Jan. 2016HCESupport Syzygy 6 pièces — ~3400 CCRL
8Nov. 2016HCE~3437 CCRL 4CPU · Version calibrée dans ce laboratoire
11Jan. 2020HCEDernière version HCE pure — apogée absolu HCE
12Août 2020NNUEPremière version NNUE par défaut — +80 Elo vs SF11
16.1+2024NNUEOption HCE définitivement supprimée

Résultats détaillés du gauntlet

Rencontre (Stockfish 8 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Stockfish 8 8CPU – Caissa 1.5 8CPU36848.5 – 11.52042.50%
Stockfish 8 8CPU – Booot 6.5 x64 8CPU367712.0 – 8.02060.00%
Stockfish 8 8CPU – Wasp 5.50 8CPU367311.5 – 8.52057.50%
Stockfish 8 8CPU – Ethereal 11.75 8CPU363511.0 – 9.02055.00%
Total cumulémoy. pond. 366743.0 – 37.08053.75%
Performance Elo obtenue

Elo : 3693
Erreur (σ) : ±10
Nombre de parties : 80

Moyenne pondérée des ancres : (3684×20 + 3677×20 + 3673×20 + 3635×20) / 80 = 3667.
Performance = 3667 + 400 × log₁₀(0.5375 / 0.4625) = 3667 + 400 × 0.0654 = 3693.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.5375 et N = 80 → σ = ±10.

Lecture des résultats

Le gauntlet de Stockfish 8 révèle un profil remarquable. Les trois ancres HCE et NNUE — Booot 6.5 (60%), Wasp 5.50 (57.5%), Ethereal 11.75 (55%) — convergent dans une fenêtre serrée de 3670–3747, attestant d'un style universel sans faiblesse spécifique contre ces adversaires. Le 42.50% contre Caissa 1.5 (3684) sur 20 parties est le seul résultat légèrement défavorable — Caissa, moteur NNUE natif, semble particulièrement bien armé contre le style positionnel profond de Stockfish HCE.

La convergence du rating a été rapide et stable : 3708 sur 18 parties, 3701 sur 52, 3696 sur 61, 3693 sur 80 parties. La fenêtre de variation ne dépasse pas ±15 points depuis la 52e partie, ce qui témoigne d'une mesure bien établie. Avec σ = ±10 sur 80 parties, c'est l'une des mesures les plus fiables de la zone supérieure du laboratoire.

Comparaison avec les listes de référence

Le CCRL 40/15 place Stockfish 8 64-bit 4CPU à 3437 Elo sur Intel i7-4770K. L'écart avec le rating maison (3693) s'élève à +256 points — cohérent avec les autres moteurs HCE de la zone supérieure (Booot 6.5 +298, Deep Shredder 13 +249, Ethereal 11.75 +239). Ce différentiel légèrement inférieur à celui de Booot 6.5 suggère que Stockfish 8 ne bénéficie pas d'un scaling SMP exceptionnel sur Zen 4, contrairement à Booot dont le lazy SMP est particulièrement efficace. Le passage de 4 à 8 threads apporte un gain standard sans surperformance notable.

Notons que Stockfish 8 n'est pas la version HCE la plus forte de la série — Stockfish 11 (janvier 2020), créditée de ~3510 Elo CCRL 4CPU, lui est supérieure d'environ 70–80 points. Dans ce laboratoire, SF11 aurait probablement atteint 3750–3770, ce qui l'aurait placé nettement au-dessus de tous les moteurs actuellement dans l'échelle, y compris Caissa 1.5.

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Stockfish 836938HCEMesuré · σ = ±10
Caissa 1.536848NNUEAncre de calibration — 42.50%
Booot 6.5 x6436778HCEAncre de calibration — 60.00%
Wasp 5.5036738NNUEAncre de calibration — 57.50%
Ethereal 11.75 x6436358HCEAncre inférieure — 55.00%

Stockfish 8 (3693) prend la tête de l'échelle interne avec une avance de 9 points sur Caissa 1.5 (3684) — un écart inférieur à σ (±10), qui rend les deux moteurs statistiquement indiscernables. Il est le premier moteur HCE pur à dépasser Caissa 1.5 (NNUE). Ce résultat illustre parfaitement la frontière des générations : Stockfish 8, moteur de 2016 à évaluation manuscrite, rivalise directement avec les meilleurs NNUE de 2021–2022 sur ce hardware. La version SF11 (2020) aurait vraisemblablement creusé l'écart encore davantage, portant le plafond HCE absolu de cette échelle bien au-dessus de 3750.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Caissa 1.5 (8 Threads)

Ce document présente les résultats du gauntlet de calibration de Caissa 1.5 — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3576–3677 Elo). Caissa est un moteur libre développé par Michał Witanowski (alias Witek902), développeur polonais de Malbork. Il utilise une évaluation NNUE entièrement personnelle, entraînée sur les parties de Caissa en auto-jeu, et a été calibré en configuration 8 threads dans les conditions standard du laboratoire.

Le moteur et son auteur

Michał Witanowski commence le développement de Caissa en mars 2021, sans aucune connaissance préalable de la programmation d'échecs — il le déclare lui-même lors de sa première apparition sur le forum TalkChess en octobre 2021. À cette date, le moteur tourne à environ 2800 Elo en 10+1 et utilise provisoirement le réseau NNUE de Stockfish 12, en attendant que Witanowski finalise son propre entraîneur. Le choix d'un réseau externe est assumé et transitoire : dès les premières versions, l'auteur travaille en parallèle sur un système d'entraînement et de génération de données propre.

La progression est spectaculaire. En moins de deux ans, Caissa passe de 2800 Elo à plus de 3400, puis 3600 Elo. L'architecture finale retenue est une dual-perspective network (32×768→1024)×2→1, avec 32 king buckets et mises à jour incrémentales efficaces — une architecture moderne comparable à celle de Stockfish.

La version 1.5 marque un tournant technique important : elle introduit une amélioration significative des performances multithreading — le moteur ne crée plus de nouveaux threads à chaque commande go — et entraîne un nouveau réseau sur environ 240 millions de positions. C'est la première version où la gestion du parallélisme devient véritablement optimisée, ce qui explique une partie de ses bonnes performances en 8 threads dans ce laboratoire.

Résultats détaillés du gauntlet

Rencontre (Caissa 1.5 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Caissa 1.5 8CPU – Booot 6.5 x64 8CPU367711.5 – 8.52057.50%
Caissa 1.5 8CPU – Wasp 5.50 8CPU367310.5 – 9.52052.50%
Caissa 1.5 8CPU – Ethereal 11.75 x64 8CPU363510.5 – 9.52052.50%
Caissa 1.5 8CPU – Deep Shredder 13 x64 8CPU357612.5 – 7.52062.50%
Total cumulémoy. pond. 364045.0 – 35.08056.25%
Performance Elo obtenue

Elo : 3684
Erreur (σ) : ±10
Nombre de parties : 80

Moyenne pondérée des ancres : (3677×20 + 3673×20 + 3635×20 + 3576×20) / 80 = 3640.
Performance = 3640 + 400 × log₁₀(0.5625 / 0.4375) = 3640 + 400 × 0.1094 = 3684.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.5625 et N = 80 → σ = ±10.

Lecture des résultats

Le gauntlet de Caissa 1.5 a convergé progressivement et régulièrement : 3670 sur 14 parties, 3665 sur 31, 3681 sur 60, 3689 sur 65, 3684 sur 80 parties. La fenêtre de variation n'excède pas ±24 points sur l'ensemble du gauntlet, et se resserre à ±8 points sur les 50 dernières parties — signe d'une mesure bien établie avec σ = ±10.

Les deux ancres les plus structurantes sont le 52.50% contre Wasp 5.50 (3673) sur 20 parties et le 52.50% contre Ethereal 11.75 (3635) sur 20 parties — des quasi-parités qui indiquent que Caissa 1.5 domine légèrement ces deux moteurs mais sans écart statistiquement décisif. Le 57.50% contre Booot 6.5 (3677) sur 20 parties est le résultat le plus intéressant : Caissa 1.5 domine Booot 6.5 avec une marge de 7.5 points nette, soit un écart de l'ordre de 28–30 points Elo — inférieur à σ mais constant sur l'ensemble du gauntlet. Le 62.50% contre Deep Shredder 13 (3576) confirme une domination solide sur la zone inférieure.

Un marqueur notable : les perfs individuelles contre Wasp 5.50 (3690) et Ethereal 11.75 (3652) sont presque identiques malgré 38 points d'écart entre les deux ancres. Caissa semble obtenir le même résultat relatif quel que soit le style de l'adversaire dans cette zone — HCE ou NNUE — ce qui témoigne d'un profil stylistique universel, sans faiblesse caractérisée.

Comparaison avec les listes de référence

Le CCRL 40/15 place Caissa 1.5 64-bit 4CPU à 3453 Elo sur Intel i7-4770K. L'écart avec le rating maison (3684) s'élève à +231 points — le différentiel le plus faible de toute la zone supérieure de l'échelle. À titre de comparaison, les moteurs HCE de la même zone affichent des différentiels nettement supérieurs : Booot 6.5 +298 points, Ethereal 11.75 +239 points, Deep Shredder 13 +249 points. Ce résultat confirme une caractéristique bien documentée des moteurs NNUE modernes : leur évaluation par réseau de neurones atteint déjà un niveau d'efficacité élevé sur processeur i7-4770K, laissant peu de marge de progression supplémentaire sur Zen 4, contrairement aux moteurs HCE dont les gains de fréquence et d'IPC sont plus directement exploitables.

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Stockfish 8 64 POPCNT36938HCERéférence supérieure
Caissa 1.536848NNUEMesuré · σ = ±10
Booot 6.5 x6436778HCEAncre supérieure — 57.50%
Wasp 5.5036738NNUEAncre de calibration — 52.50%
Ethereal 11.75 x6436358HCEAncre de calibration — 52.50%
Deep Shredder 13 x6435768HCEAncre inférieure — 62.50%

Caissa 1.5 (3684) occupe le second rang de l'échelle interne, à 9 points seulement derrière Stockfish 8 (3693) — un écart inférieur à σ (±10), qui rend les deux moteurs statistiquement indiscernables. Caissa 1.5 devance Booot 6.5 (3677 · HCE) de 7 points, écart également inférieur à σ. Ce résultat est d'autant plus remarquable que Caissa 1.5 est une version de fin 2022, développée par un autodidacte sans expérience préalable de la programmation d'échecs — et qu'elle rivalise directement avec Booot 6.5, l'aboutissement de dix années de développement HCE par un auteur expérimenté.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Booot 6.5 x64 (8 Threads)

Ce document présente les résultats du gauntlet de calibration de Booot 6.5 x64 — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3507–3673 Elo). Booot est un moteur libre développé par Alex Morozov, développeur ukrainien, écrit en Pascal (Delphi / Free Pascal) et distribué en open-source. Il supporte le multi-threading et a été calibré dans les conditions standard du laboratoire, en version x64-popcnt.

Le moteur et son auteur

Alex Morozov commence le développement de Booot au début des années 2000, dans la tradition des moteurs autodidactes de l'époque. La genèse du projet est modeste : les premières versions affrontent des moteurs comme TSCP ou Mustang, et Booot 3.3 est déjà estimé à environ 2300 Elo. Dès la version 4, Morozov intègre le protocole UCI (à partir de la 4.2), ouvrant le moteur aux interfaces modernes. La version 4.15.1, publiée en 2009, marque l'aboutissement de cette première grande période : Booot atteint alors les 2533 Elo CCRL, et son code source est partagé librement — un geste rare qui contribue à sa notoriété dans la communauté.

La série 5 est une période de consolidation. La version 5.2.0, distribuée avec les sources et les exécutables 32/64 bits, confirme la régularité du projet. C'est avec la série 6, à partir de l'automne 2016, que Booot connaît sa véritable ascension. La version 6.1 (octobre 2016) introduit une refonte majeure de l'évaluation et un algorithme de parallélisme SMP dit « lazy » — c'est à ce moment que le moteur entre véritablement dans la cour des grands. Les versions se succèdent à un rythme soutenu :

VersionDateÉvénement / ProgrèsCCRL estimé
6.1Oct. 2016Refonte évaluation, lazy SMP~3100
6.2Mai 2017Améliorations search et évaluation~3160
6.3Juin 2018+70–100 Elo selon l'auteur — participation WCCC Stockholm~3250
6.3.12018Version stabilisée, la plus testée du CCRL Archive3261 (1CPU)
6.4Avr. 2020Retour remarqué après deux ans — résultats au-dessus des attentes~3320
6.5Mars 2021Dernière version HCE — sommet de la série classique3379 (4CPU)
7.02022Transition NNUE — implémentation personnelle en Pascal/SIMD>3500
7.1+2023Développement continu sur la base NNUE>3500

Booot 6.5, publié le 21 mars 2021, constitue l'aboutissement de cinq années de développement HCE ininterrompu. C'est la dernière version à évaluation purement manuscrite avant que Morozov ne franchisse lui-même le pas vers le NNUE avec la version 7.0 — un passage qu'il a mené de bout en bout : implémentation du réseau de neurones en Pascal, entraînement en Python, accélération SIMD. La version 6.5 reste une référence pour tous ceux qui souhaitent évaluer la force maximale atteignable par un moteur HCE moderne bien parallélisé.

Résultats détaillés du gauntlet

Rencontre (Booot 6.5 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Booot 6.5 8CPU – Wasp 5.50 8CPU36739.5 – 8.51852.78%
Booot 6.5 8CPU – Deep Shredder 13 8CPU357611.0 – 8.01957.89%
Booot 6.5 8CPU – Houdini 4 Pro 8CPU355614.0 – 5.01973.68%
Booot 6.5 8CPU – Gull 3 x64 8CPU350713.5 – 5.51971.05%
Total cumulémoy. pond. 357748.0 – 27.07564.00%
Performance Elo obtenue

Elo : 3677 (préliminaire — 75/80 parties)
Erreur (σ) : ±10
Nombre de parties : 75

Moyenne pondérée des ancres : (3673×18 + 3576×19 + 3556×19 + 3507×19) / 75 = 3577.
Performance = 3577 + 400 × log₁₀(0.6400 / 0.3600) = 3577 + 400 × 0.2499 = 3677.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.6400 et N = 75 → σ = ±10.

Lecture des résultats

Le gauntlet de Booot 6.5 présente un profil très cohérent. Les quatre perfs individuelles s'étalent sur 104 points (3631–3735), ce qui est raisonnable pour un gauntlet couvrant 166 points d'écart entre les ancres les plus éloignées. La convergence du rating a été progressive mais régulière : 3601 sur 11 parties, 3644 sur 32, 3674 sur 41, 3686 sur 59, 3677 sur 75 parties. La fenêtre de variation n'excède pas ±15 points depuis la 41e partie, signe d'une mesure désormais bien établie.

Les deux ancres les plus structurantes sont le 52.78% contre Wasp 5.50 (3673) sur 18 parties — qui place Booot 6.5 en quasi-parité avec Wasp 5.50, le moteur NNUE co-leader de l'échelle — et le 57.89% contre Deep Shredder 13 (3576) sur 19 parties, qui établit une domination claire sur l'ex-leader HCE. Ces deux résultats encadrent une zone de 3576–3673 au sein de laquelle la performance calculée de 3677 se positionne logiquement. Le 73.68% contre Houdini 4 Pro et le 71.05% contre Gull 3 confirment la domination de Booot sur l'ensemble de la zone 3507–3556.

Comparaison avec les listes de référence

Le CCRL 40/15 place Booot 6.5 64-bit 4CPU à 3379 Elo sur Intel i7-4770K, basé sur 112 parties. L'écart avec le rating maison (3677) est de +298 points — le différentiel le plus élevé observé parmi les moteurs HCE de l'échelle. À titre de comparaison, Deep Shredder 13 affiche +249 points (3327 → 3576), Gull 3 +247 points (3260 → 3507), Houdini 4 +224 points (3332 → 3556), Critter 1.6a +225 points (3233 → 3458). Booot 6.5 dépasse tous ces différentiels, ce qui suggère une implémentation du parallélisme SMP particulièrement efficace sur les cœurs Zen 4 du Ryzen 9 7950X3D.

Note : Booot 6.5 est la dernière version HCE de la série — la version 7.0 a introduit le NNUE en 2022 avec une implémentation entièrement personnelle de Morozov. Booot 6.5 représente donc l'aboutissement ultime du développement HCE du moteur.

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
Booot 6.5 x6436778HCEMesuré · σ = ±10 · 75/80 parties
Wasp 5.5036738NNUEAncre supérieure — 52.78%
Deep Shredder 1335768HCEAncre de calibration — 57.89%
Houdini 4 Pro x6435568HCEAncre de calibration — 73.68%
Gull 3 x6435078HCEAncre inférieure — 71.05%

Booot 6.5 (3677) occupe le sommet de l'échelle interne ex-aequo avec Wasp 5.50 (3673 · NNUE) à 4 points près — un écart inférieur à σ, qui rend les deux moteurs statistiquement indiscernables. C'est un résultat remarquable pour un moteur HCE : Booot 6.5 est le seul moteur à évaluation manuscrite capable de rivaliser à ce niveau avec un moteur NNUE dans ce laboratoire. Il devance Deep Shredder 13 de 101 points et Houdini 4 Pro de 121 points.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Wasp 5.50 (8 Threads)

Ce document présente les résultats du gauntlet de calibration de Wasp 5.50 — 8 threads, joué contre trois moteurs d'ancrage de la zone supérieure de l'échelle interne (3507–3576 Elo). Wasp est un moteur libre développé par John Stanback, reconnu pour son style de jeu agressif et ses qualités tactiques. La version 5.50 intègre une évaluation NNUE (Efficiently Updatable Neural Network), introduite dès Wasp 5.00 — ce qui en fait le premier moteur à réseau de neurones à figurer dans l'échelle interne du laboratoire.

Note — Gauntlet en cours (60/90 parties)

Ce rapport est établi à mi-gauntlet. Les scores ont été obtenus sur 20 parties par adversaire. Le rating de 3673 est stable depuis 47 parties dans une fenêtre de ±13 points (3661–3673), ce qui justifie la publication de ce rapport intermédiaire.

Résultats détaillés du gauntlet

Rencontre (Wasp 5.50 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Wasp 5.50 8CPU – Deep Shredder 13 8CPU357610.0 – 10.02050.00%
Wasp 5.50 8CPU – Houdini 4 Pro 8CPU355616.0 – 4.02080.00%
Wasp 5.50 8CPU – Gull 3 x64 8CPU350714.5 – 5.52072.50%
Total cumulémoy. pond. 354640.5 – 19.56067.50%
Performance Elo obtenue

Elo : 3673 (intermédiaire — 60/90 parties)
Erreur (σ) : ±11
Nombre de parties : 60

Moyenne pondérée des ancres : (3576×20 + 3556×20 + 3507×20) / 60 = 3546.
Performance = 3546 + 400 × log₁₀(0.6750 / 0.3250) = 3546 + 400 × 0.3174 = 3673.

Lecture des résultats

L'ancre la plus directe et la plus fiable est le 50.00% exact contre Deep Shredder 13 (3576) sur 20 parties — un résultat qui, pris seul, placerait Wasp 5.50 à la stricte parité avec Deep Shredder 13. À l'opposé, le 80.00% contre Houdini 4 Pro (3556) sur 20 parties — Houdini 4 étant lui-même calibré à seulement 20 points en dessous de Deep Shredder 13 — indique un niveau nettement supérieur. Le 72.50% contre Gull 3 (3507) sur 20 parties confirme la domination de Wasp 5.50 sur cette zone.

Cette apparente contradiction se résout si l'on accepte que Wasp 5.50 a un profil stylistique particulièrement défavorable à Houdini 4 — son jeu tactique agressif correspondant exactement au type d'adversaire contre lequel Houdini 4 résiste moins bien.

Comparaison avec les listes de référence

Le CCRL 40/15 place Wasp 5.50 64-bit 4CPU à 3397 Elo sur Intel i7-4770K. L'écart avec le rating maison (3673) s'élève à +276 points. Wasp 5.50 bénéficie particulièrement du passage en 8 threads sur architecture Zen 4, probablement grâce à une implémentation du parallélisme plus efficace que ses contemporains.

Positionnement dans l'échelle interne

Wasp 5.50 (3673) occupe le sommet de l'échelle interne ex-aequo avec Booot 6.5 (3677). Wasp 5.50 est le premier moteur NNUE de l'échelle, illustrant l'avantage considérable que procure l'évaluation par réseau de neurones sur les moteurs HCE de même génération.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Ethereal 11.75 x64 (8 Threads)

Ce document présente les résultats du gauntlet de calibration de Ethereal 11.75 x64 — 8 threads, joué contre cinq moteurs d'ancrage de la zone supérieure de l'échelle interne (3507–3677 Elo). Ethereal est un moteur libre développé par Andrew Grant, informaticien et mathématicien américain. La version 11.75 est une version à évaluation entièrement manuscrite (HCE), publiée en novembre 2019 — l'une des dernières grandes versions HCE avant la transition NNUE qui marquera la série 13.

Le moteur et son auteur

Andrew Grant est étudiant en informatique et mathématiques à l'University of Maryland, Baltimore County, lorsqu'il publie la première version officielle d'Ethereal en juin 2016. La progression est fulgurante : en l'espace de deux ans, Ethereal passe d'un moteur de niveau amateur à un concurrent sérieux des meilleurs programmes du monde. En 2018, Ethereal remporte la Division 4 puis la Division 3 du TCEC.

L'une des contributions les plus durables de Grant à la communauté est OpenBench, un framework de test distribué inspiré de Fishtest. La version 11.75, publiée le 11 novembre 2019, introduit notamment le support complet du MultiPV. La rupture arrive en juin 2021 : Grant annonce la sortie commerciale d'Ethereal 13.00 intégrant le NNUE. En 2023, il devient responsable technique de Torch, le moteur interne de Chess.com.

Résultats détaillés du gauntlet

Rencontre (Ethereal 11.75 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Ethereal 11.75 8CPU – Booot 6.5 x64 8CPU36777.0 – 7.01450.00%
Ethereal 11.75 8CPU – Wasp 5.50 8CPU36735.0 – 8.01338.46%
Ethereal 11.75 8CPU – Deep Shredder 13 8CPU35768.0 – 6.01457.14%
Ethereal 11.75 8CPU – Houdini 4 Pro 8CPU35569.0 – 4.01369.23%
Ethereal 11.75 8CPU – Gull 3 x64 8CPU35078.0 – 5.01361.54%
Total cumulémoy. pond. 359937.0 – 30.06755.22%
Performance Elo obtenue

Elo : 3635 (préliminaire — 67/75 parties)
Erreur (σ) : ±11
Nombre de parties : 67

Moyenne pondérée des ancres : (3677×14 + 3673×13 + 3576×14 + 3556×13 + 3507×13) / 67 = 3599.
Performance = 3599 + 400 × log₁₀(0.5522 / 0.4478) = 3599 + 400 × 0.0910 = 3635.

Lecture des résultats

Le rating s'est stabilisé autour de 3635 dès la 41e partie et n'a plus bougé que dans une fenêtre de ±16 points jusqu'à la 67e. L'ancre directe la plus solide est le 50.00% exact contre Booot 6.5 (3677) sur 14 parties — un résultat sur grand effectif qui place Ethereal 11.75 en parité stricte avec le co-leader de l'échelle.

En regard, le 38.46% contre Wasp 5.50 (3673) sur 13 parties dessine une nette infériorité vis-à-vis de Wasp — une divergence difficile à expliquer puisque Booot et Wasp sont calibrés à seulement 4 points d'écart. Cette asymétrie stylistique (Ethereal semble mieux s'entendre avec le style HCE de Booot qu'avec le jeu NNUE de Wasp) est un marqueur intéressant.

Comparaison avec les listes de référence

Le CCRL 40/15 place Ethereal 11.75 64-bit 4CPU à 3396 Elo sur Intel i7-4770K, basé sur 670 parties. L'écart avec le rating maison (3635) s'élève à +239 points, différentiel parfaitement cohérent avec les autres moteurs HCE de la zone supérieure.

Positionnement dans l'échelle interne

Ethereal 11.75 (3635) comble exactement le vide qui existait entre Deep Shredder 13 (3576) et le duo Booot/Wasp (3673–3677). Il s'intercale à 59 points au-dessus de DS13 et à seulement 38–42 points en dessous du sommet.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Deep Shredder 13 x64 (8 Threads)

Ce document présente les résultats de calibration de Deep Shredder 13 x64 — 8 threads, joué contre trois moteurs d'ancrage de la zone sommet de l'échelle interne (3398–3458 Elo). Deep Shredder 13 est le moteur emblématique de Stefan Meyer-Kahlen, dernière version commerciale de la série Shredder — un moteur traditionnel basé sur une évaluation entièrement manuscrite, sans réseau de neurones, reconnu pour ses qualités positionnelles et son scaling exceptionnel avec les ressources matérielles.

Note méthodologique — Périmètre du gauntlet retenu

Le gauntlet complet comprend cinq adversaires (Critter, Wasp 3.75, Naum 4.2, Senpai 2.0, Komodo64 3) sur 99 parties au total. Les résultats présentés ici excluent volontairement Senpai 2.0 et Komodo64 3, dont les scores respectifs (82.50% et 90.00%) tirent la performance vers le haut de façon disproportionnée. Le périmètre retenu — Critter, Wasp 3.75 et Naum 4.2, soit 59 parties — produit une estimation plus conservative.

Résultats détaillés du gauntlet (périmètre retenu)

Rencontre (Deep Shredder 13 8CPU – Ancre)Ancre EloScoreParties%
Deep Shredder 13 8CPU – Critter 1.6a 64-bit 8CPU345813.5 – 6.52067.50%
Deep Shredder 13 8CPU – Wasp 3.75 8CPU342013.5 – 6.52067.50%
Deep Shredder 13 8CPU – Naum 4.2 8CPU339814.5 – 4.51976.32%
Total cumulémoy. pond. 342641.5 – 17.55970.34%
Performance Elo obtenue

Elo : 3576
Erreur (σ) : ±10
Nombre de parties : 59

Moyenne pondérée des ancres : (3458×20 + 3420×20 + 3398×19) / 59 = 3426.
Performance = 3426 + 400 × log₁₀(0.7034 / 0.2966) = 3426 + 400 × 0.3750 = 3576.

Lecture des résultats

Le résultat le plus remarquable du gauntlet est la symétrie parfaite entre les deux premières ancres : 67.50% aussi bien contre Critter 1.6a (3458) que contre Wasp 3.75 (3420), sur 20 parties chacun. Cette coïncidence n'est pas fortuite — elle indique que Deep Shredder 13 se situe très précisément dans la zone 3540–3580.

Comparaison avec les listes de référence

Le CCRL 40/2 Archive place Deep Shredder 13 64-bit 4CPU à 3323, et le CCRL 40/15 à 3328. L'écart avec le rating maison (3576) est de l'ordre de +250 points. La SSDF, qui a testé Deep Shredder 13 sur un Ryzen 7 1800X 8 cœurs, l'avait calibré à 3560 (±47) — une valeur remarquablement proche du rating maison, ce qui valide la cohérence du laboratoire avec cette référence externe utilisant un hardware Ryzen comparable.

Positionnement dans l'échelle interne

Deep Shredder 13 dépasse Critter 1.6a de 118 points et s'installe nettement au sommet de l'échelle des HCE classiques. La cohérence avec la SSDF Ryzen (3560 ± 47) — à seulement 16 points du rating maison — est l'une des validations externes les plus directes obtenues dans ce laboratoire.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Houdini 4 Pro x64 (8 Threads)

Ce document présente les résultats du gauntlet de calibration de Houdini 4 Pro x64 — 8 threads, joué contre quatre moteurs d'ancrage de la zone supérieure de l'échelle interne (3420–3576 Elo). Houdini est un moteur commercial développé par Robert Houdart, réputé pour son style de jeu universel.

Contexte — Anomalie Houdini 6

Un gauntlet préalable de Houdini 6 Pro (popcnt) a produit un résultat aberrant : 3555 Elo dans ce laboratoire, soit un gain de seulement +39 points par rapport à son rating CCRL 40/2 Archive 4CPU (3516), alors que Deep Shredder 13 affiche +253 points dans les mêmes conditions. Cette inversion de hiérarchie est cohérente avec un mode dégradé provoqué par une activation de licence manquante. Houdini 4 est retenu comme référence fiable.

Résultats détaillés du gauntlet

Rencontre (Houdini 4 Pro 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Houdini 4 Pro 8CPU – Deep Shredder 13 8CPU357611.5 – 13.52546.00%
Houdini 4 Pro 8CPU – Gull 3 x64 8CPU350713.5 – 12.52651.92%
Houdini 4 Pro 8CPU – Critter 1.6a 64-bit 8CPU345818.0 – 8.02669.23%
Houdini 4 Pro 8CPU – Wasp 3.75 8CPU342017.5 – 7.52570.00%
Total cumulémoy. pond. 349060.5 – 41.510259.31%
Performance Elo obtenue

Elo : 3556
Erreur (σ) : ±8
Nombre de parties : 102

Moyenne pondérée des ancres : (3576×25 + 3507×26 + 3458×26 + 3420×25) / 102 = 3490.
Performance = 3490 + 400 × log₁₀(0.5931 / 0.4069) = 3490 + 400 × 0.1637 = 3556.

Lecture des résultats

Les perfs individuelles s'étalent sur seulement 79 points (3520–3599), ce qui est une dispersion exceptionnellement faible. Le 50% exact contre Gull 3 (à 0.92% près) est l'ancre de calibration la plus directe disponible dans ce gauntlet.

Comparaison avec les listes de référence

Le CCRL 40/2 Archive place Houdini 4 Pro en 4CPU à environ 3332 Elo sur Intel i7-4770K. L'écart avec le rating maison (3556) s'élève à +224 points, ce qui reflète le cumul du passage de 4 à 8 threads et du gain de fréquence/IPC du Ryzen 9 7950X3D.

Positionnement dans l'échelle interne

Houdini 4 Pro (3556) s'intercale entre Deep Shredder 13 (3576) et Gull 3 (3507). Avec σ = ±8 sur 102 parties, le rating de Houdini 4 Pro est l'un des mieux établis de toute la zone supérieure du laboratoire.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Gull 3 x64 (8 Threads)

Ce document présente les résultats complets du gauntlet de calibration dédié de Gull 3 x64 — 8 threads, joué contre quatre moteurs d'ancrage de la zone sommet de l'échelle interne (3398–3576 Elo). Gull 3 est un moteur libre à évaluation entièrement manuscrite (HCE), développé par Stefan Plenkner et publié en 2014.

Résultats détaillés du gauntlet

Rencontre (Gull 3 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Gull 3 8CPU – Deep Shredder 13 8CPU35768.0 – 12.02040.00%
Gull 3 8CPU – Critter 1.6a 64-bit 8CPU345811.5 – 8.52057.50%
Gull 3 8CPU – Wasp 3.75 8CPU342011.0 – 9.02055.00%
Gull 3 8CPU – Naum 4.2 8CPU339814.5 – 5.52072.50%
Total cumulémoy. pond. 346345.0 – 35.08056.25%
Performance Elo obtenue

Elo : 3507
Erreur (σ) : ±10
Nombre de parties : 80

Moyenne pondérée des ancres : (3576×20 + 3458×20 + 3420×20 + 3398×20) / 80 = 3463.
Performance = 3463 + 400 × log₁₀(0.5625 / 0.4375) = 3463 + 400 × 0.1091 = 3507.

Lecture des résultats

Profil en nette progression monotone — des 40.00% contre Deep Shredder 13 jusqu'aux 72.50% contre Naum 4.2. Mesuré à 3516 sur 20 parties, à 3507 sur 40, à 3495 sur 55, et à 3507 au terme des 80 parties, le rating a convergé avant même la mi-gauntlet.

Comparaison avec les listes de référence

Le CCRL 40/2 Archive place Gull 3 64-bit 4CPU à 3260 Elo sur Intel i7-4770K, avec 4832 parties. L'écart avec le rating maison (3507) s'élève à +247 points. Gull 3 est un moteur entièrement HCE — son évaluation est purement manuscrite, sans réseau de neurones d'aucune sorte.

Positionnement dans l'échelle interne

Gull 3 s'intercale entre Critter 1.6a (3458) et Deep Shredder 13 (3576), à 49 points au-dessus de Critter et 69 points en dessous de Deep Shredder.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Critter 1.6a 64-bit (8 Threads)

Ce document présente les résultats complets du gauntlet de calibration dédié de Critter 1.6a 64-bit — 8 threads, joué contre six moteurs d'ancrage couvrant la zone haute de l'échelle interne (3234–3420 Elo). Critter est un moteur UCI développé par Richard Vida, dont la version 1.6a — publiée en 2012 — constitue l'une des plus abouties de la série.

Résultats détaillés du gauntlet

Rencontre (Critter 1.6a 8CPU – Ancre)Ancre EloScoreParties%
Critter 1.6a 8CPU – Wasp 3.75 8CPU34205.5 – 7.51342.31%
Critter 1.6a 8CPU – Senpai 2.0 8CPU33807.0 – 5.01258.33%
Critter 1.6a 8CPU – Naum 4.2 8CPU33988.0 – 5.01361.54%
Critter 1.6a 8CPU – Komodo64 3 1CPU33599.0 – 4.01369.23%
Critter 1.6a 8CPU – Wasp 2.00 8CPU329710.0 – 3.01376.92%
Critter 1.6a 8CPU – Rybka 2.4 mp 32-bit 8CPU323410.0 – 2.01283.33%
Total cumulémoy. pond. 334949.5 – 26.57665.13%
Performance Elo obtenue

Elo : 3458
Erreur (σ) : ±9
Nombre de parties : 76

Moyenne pondérée des ancres : (3420×13 + 3380×12 + 3398×13 + 3359×13 + 3297×13 + 3234×12) / 76 = 3349.
Performance = 3349 + 400 × log₁₀(0.6513 / 0.3487) = 3349 + 400 × 0.2714 = 3458.

Lecture des résultats

Le gauntlet est l'un des plus fournis et des mieux équilibrés du laboratoire : six adversaires distincts, 76 parties, et un σ = ±9 qui en fait l'une des mesures les plus précises. La gradation est régulière : 42.31% contre Wasp 3.75, 58.33% contre Senpai 2.0, 61.54% contre Naum 4.2, 69.23% contre Komodo64 3, 76.92% contre Wasp 2.00, et 83.33% contre Rybka 2.4 mp.

Comparaison avec les listes de référence

Le CCRL 40/2 place Critter 1.6a aux alentours de 3200 en 1 CPU et de 3290–3310 en 4 CPU. Le rating maison en 8 threads (3458) se situe environ +150 points au-dessus du CCRL 4CPU.

Positionnement dans l'échelle interne

Critter 1.6a prend la tête de l'échelle interne avec σ = ±9. Son avance sur Wasp 3.75 (+38 points) est probable mais non définitivement tranchée : le résultat direct penche en faveur de Wasp 3.75.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Wasp 3.75 (8 Threads)

Ce document présente les résultats complets du gauntlet de calibration dédié de Wasp 3.75 — 8 threads, joué contre les deux moteurs d'ancrage de la zone supérieure : Naum 4.2 (8 threads) et Wasp 2.01 (8 threads). Wasp est un moteur libre développé par John Stanback. La version 3.75 est une version pré-NNUE — l'évaluation est entièrement manuscrite (HCE) — qui constitue le pic de la série classique avant le passage au réseau de neurones avec Wasp 5.

Résultats détaillés du gauntlet

Rencontre (Wasp 3.75 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Wasp 3.75 8CPU – Naum 4.2 8CPU339818.5 – 11.53061.67%
Wasp 3.75 8CPU – Wasp 2.01 8CPU329717.0 – 12.02958.62%
Total cumulémoy. pond. 334835.5 – 23.55960.17%
Performance Elo obtenue

Elo : 3420
Erreur (σ) : ±26
Nombre de parties : 59

Moyenne pondérée des ancres : (3398×30 + 3297×29) / 59 = 3348.
Performance = 3348 + 400 × log₁₀(0.6017 / 0.3983) = 3348 + 400 × 0.1791 = 3420.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.6017 et N = 59 → σ = ±26.

Lecture des résultats

Le gauntlet de Wasp 3.75 ne s'appuie que sur deux ancres directes mais profondes : Naum 4.2 (3398) sur 30 parties et Wasp 2.01 (3297) sur 29 parties. La large erreur (±26) résulte de cette concentration sur deux adversaires plutôt qu'une grande diversité — mais les deux scores convergent dans le même sens (61.67% et 58.62%), ce qui consolide la mesure malgré l'erreur statistique relativement élevée.

Le résultat le plus structurant est le 61.67% contre Naum 4.2 (3398) sur 30 parties : il établit une domination claire et statistiquement solide sur l'ancre la plus haute du gauntlet, plaçant Wasp 3.75 environ 80 points au-dessus de Naum 4.2. Le 58.62% contre Wasp 2.01 (3297) est un résultat intra-série particulièrement éclairant : il quantifie la progression réelle de Wasp entre les versions 2.01 et 3.75.

Cohérence avec le CCRL

L'écart mesuré entre Wasp 2.01 et Wasp 3.75 dans le tournoi maison (3297 → 3420, soit +123 points) trouve une confirmation remarquable dans les listes de référence du CCRL, qui placent les mêmes deux versions à respectivement 3061 et 3189 en configuration 4CPU, soit un écart de +128 points. La quasi-identité des deux deltas — 123 vs 128 — valide la cohérence interne du système de calibration.

SourceWasp 2.01Wasp 3.75Écart ΔConfiguration
Tournoi maison32973420+1238 threads · Ryzen 9 7950X3D
CCRL 40/230613189+1284CPU · Intel i7-4770K

L'écart absolu entre les deux référentiels (~+236 points en moyenne) reflète mécaniquement le gain apporté par le passage de 4 à 8 threads sur un Ryzen 9 7950X3D face à l'i7-4770K. Le delta inter-versions reste stable à 5 points près, indépendamment du matériel.

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Critter 1.6a 64-bit34588Référence supérieure
Wasp 3.7534208Mesuré · σ = ±26
Naum 4.233988Ancre supérieure — 61.67%
Wasp 2.0132978Ancre inférieure — 58.62%

Wasp 3.75 (3420) s'intercale entre Critter 1.6a (3458) et Naum 4.2 (3398), à 38 points sous Critter et 22 points au-dessus de Naum. La validation par cohérence inter-versions avec le CCRL (+123 vs +128) renforce considérablement la fiabilité de cette mesure malgré l'erreur élevée.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Naum 4.2 (8 Threads)

Ce document présente les résultats complets du gauntlet de calibration dédié de Naum 4.2 — 8 threads, joué contre les trois moteurs d'ancrage de la zone intermédiaire : Wasp 2.00, Rybka 2.4 MP et Glaurung 2.2 JA. Naum est un moteur commercial développé par Aleksandar Naumov, programmeur serbe, dont la version 4.2 publiée en 2010 constitue l'aboutissement de la série — la dernière version distribuée par Chess Assistant.

Résultats détaillés du gauntlet

Rencontre (Naum 4.2 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Naum 4.2 8CPU – Wasp 2.00 8CPU329711.5 – 8.52057.50%
Naum 4.2 8CPU – Rybka 2.4 MP 32-bit 8CPU323413.5 – 5.51971.05%
Naum 4.2 8CPU – Glaurung 2.2 JA 8CPU316317.5 – 2.52087.50%
Total cumulémoy. pond. 323142.5 – 16.55972.03%
Performance Elo obtenue

Elo : 3398
Erreur (σ) : ±23
Nombre de parties : 59

Moyenne pondérée des ancres : (3297×20 + 3234×19 + 3163×20) / 59 = 3231.
Performance = 3231 + 400 × log₁₀(0.7203 / 0.2797) = 3231 + 167 = 3398.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.7203 et N = 59 → σ = ±23.

Lecture des résultats

Le gauntlet de Naum 4.2 présente un profil en progression rigoureusement monotone : 57.50% contre Wasp 2.00 (3297), 71.05% contre Rybka 2.4 MP (3234), 87.50% contre Glaurung 2.2 JA (3163). La gradation est parfaitement cohérente avec l'écart Elo des ancres, ce qui valide la solidité du rating obtenu sans aucune anomalie stylistique. Le 57.50% contre Wasp 2.00 — l'ancre la plus haute du gauntlet — positionne précisément Naum 4.2 environ 100 points au-dessus de Wasp 2.00.

Comparaison avec les listes de référence

Le CCRL 40/2 place Naum 4.2 64-bit 4CPU à environ 3098 Elo sur Intel i7-4770K. L'écart avec le rating maison (3398) s'élève à +300 points, cohérent avec les autres moteurs de la zone supérieure de l'échelle. Naum 4.2 est l'une des dernières versions HCE pures à atteindre ce niveau dans les listes officielles.

Positionnement dans l'échelle interne
MoteurElo interneThreadsRemarque
Wasp 3.7534208Référence supérieure
Naum 4.233988Mesuré · σ = ±23
Senpai 2.033808Référence inférieure proche
Wasp 2.0032978Ancre supérieure — 57.50%
Rybka 2.4 MP 32-bit32348Ancre de calibration — 71.05%
Glaurung 2.2 JA31638Ancre inférieure — 87.50%

Naum 4.2 (3398) sert lui-même d'ancre de calibration pour de nombreux gauntlets ultérieurs (Wasp 3.75, Senpai 2.0, Critter 1.6a, Komodo64 3, Deep Shredder 13). Avec σ = ±23 sur 59 parties contre 3 ancres distinctes, sa mesure est l'une des plus fondamentales de toute la zone supérieure du laboratoire — c'est sur ce socle que repose l'ensemble de la calibration des moteurs de la zone 3300–3500.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Senpai 2.0 (8 Threads)

Ce document présente les résultats complets du gauntlet de calibration dédié de Senpai 2.0 — 8 threads, joué contre cinq moteurs d'ancrage couvrant la zone haute de l'échelle interne (3163–3420 Elo). Senpai est un moteur UCI développé par Fabien Letouzey — l'auteur de Fruit — et publié autour de 2014–2015.

Résultats détaillés du gauntlet

Rencontre (Senpai 2.0 8CPU – Ancre 8CPU)Ancre EloScoreParties%
Senpai 2.0 8CPU – Komodo64 3 1CPU33596.0 – 4.01060.00%
Senpai 2.0 8CPU – Naum 4.2 8CPU33984.5 – 4.5950.00%
Senpai 2.0 8CPU – Rybka 2.4 mp 32-bit 8CPU32346.0 – 3.0966.67%
Senpai 2.0 8CPU – Wasp 2.00 8CPU32975.5 – 3.5961.11%
Senpai 2.0 8CPU – Wasp 3.75 8CPU34203.5 – 5.5938.89%
Total cumulémoy. pond. 334225.5 – 20.54655.43%
Performance Elo obtenue

Elo : 3380
Erreur (σ) : ±13
Nombre de parties : 46

Moyenne pondérée des ancres : (3359×10 + 3398×9 + 3234×9 + 3297×9 + 3420×9) / 46 = 3342.
Performance = 3342 + 400 × log₁₀(0.5543 / 0.4457) = 3342 + 400 × 0.0948 = 3380.

Lecture des résultats

Le résultat le plus instructif du gauntlet est le match nul à 50% contre Naum 4.2 (3398). C'est l'ancre la mieux établie de l'échelle supérieure — mesurée sur 59 parties avec σ = ±23 — et ce résultat parfaitement équilibré constitue une borne directe particulièrement fiable.

Comparaison avec les listes de référence

Le CCRL 40/2 place Senpai 2.0 aux alentours de 3050–3080 en configuration 1 CPU. L'écart avec le rating maison (3380) reflète le passage de 1 à 8 threads et la vitesse brute du Ryzen 9 7950X3D face à l'Intel i7-4770K — différentiel global de l'ordre de +300 points.

Positionnement dans l'échelle interne

Senpai 2.0 s'insère entre Naum 4.2 (3398 · 8T) et Komodo64 3 (3359 · 1T), à seulement 18 points sous Naum — un écart inférieur à σ.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Komodo64 3 (1 Thread) mono-thread

Ce document présente les résultats complets du gauntlet de calibration dédié de Komodo64 3, joué en configuration mono-thread (1 CPU) contre cinq moteurs d'ancrage couvrant une large plage de l'échelle interne. Komodo64 3 est un moteur de génération 2012, distribué en binaire 64-bit sans support natif du parallélisme — il s'exécute donc sur un unique thread, quelle que soit la configuration matérielle.

Note technique — Configuration mono-thread

Contrairement aux moteurs modernes calibrés en 8 threads sur ce laboratoire, Komodo64 3 ne peut exploiter qu'un seul cœur. Toutes les parties de ce gauntlet ont été jouées avec le paramètre Threads=1. Son Elo mesuré (3359) est donc strictement un Elo mono-thread.

Résultats détaillés du gauntlet

Rencontre (Komodo64 3 1CPU – Ancre 8CPU)Ancre EloScoreParties%
Komodo64 3 1CPU – Glaurung 2.2 JA 8CPU316312.5 – 3.51678.13%
Komodo64 3 1CPU – Naum 4.2 8CPU33988.0 – 8.01650.00%
Komodo64 3 1CPU – Rybka 2.4 mp 32-bit 8CPU323413.0 – 3.01681.25%
Komodo64 3 1CPU – Wasp 2.00 8CPU32978.0 – 8.01650.00%
Komodo64 3 1CPU – Wasp 3.75 8CPU34204.5 – 10.51530.00%
Total cumulémoy. pond. 330146.0 – 33.07958.23%
Performance Elo obtenue

Elo : 3359 (mono-thread)
Erreur (σ) : ±10
Nombre de parties : 79

Moyenne pondérée des ancres : (3163×16 + 3398×16 + 3234×16 + 3297×16 + 3420×15) / 79 = 3301.
Performance = 3301 + 400 × log₁₀(0.5823 / 0.4177) = 3301 + 400 × 0.1443 = 3359.

Lecture des résultats

Komodo64 3 domine très nettement les deux ancres inférieures — Glaurung 2.2 JA (78.13%) et Rybka 2.4 mp 32-bit (81.25%) — tout en faisant jeu égal avec Naum 4.2 et Wasp 2.00 (50% chacun). C'est face à Wasp 3.75 que l'écart se creuse (30%). Les deux matchs nuls à 50% confirment que Komodo64 3 se situe exactement dans la zone Naum 4.2 / Wasp 2.00, soit autour de 3350–3400 en mono-thread. L'erreur σ = ±10 est l'une des plus faibles du laboratoire.

Positionnement dans l'échelle interne

Komodo64 3 se glisse entre Wasp 2.00 (3297 · 8T) et Naum 4.2 (3398 · 8T), à 62 points en dessous de Wasp 3.75. Rapporté à une configuration 8 threads, son niveau réel serait sensiblement supérieur — mais cette estimation sort du cadre de la calibration directe.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Deep Sjeng 1.6 (8 Threads)

Ce document présente les résultats du gauntlet de calibration de Deep Sjeng 1.6 — 8 threads, joué contre huit moteurs d'ancrage de la zone médiane haute de l'échelle interne (2830–2996 Elo). Deep Sjeng est un moteur commercial développé par Gian-Carlo Pascutto, l'un des auteurs les plus prolifiques de l'histoire des moteurs d'échecs, également connu pour son travail sur Leela Chess Zero. La version 1.6 est une version classique à évaluation manuscrite (HCE).

Résultats détaillés du gauntlet

Rencontre (Deep Sjeng 1.6 8CPU – Ancre)Ancre EloScoreParties%
Deep Sjeng 1.6 8CPU – Deep Junior 7 8CPU29964.0 – 5.0944.44%
Deep Sjeng 1.6 8CPU – Fritz 6 1CPU29476.0 – 3.0966.67%
Deep Sjeng 1.6 8CPU – List 5.12 1CPU29365.5 – 3.5961.11%
Deep Sjeng 1.6 8CPU – Nimzo 8 1CPU28717.0 – 1.0887.50%
Deep Sjeng 1.6 8CPU – Hiarcs 7.32 8CPU28627.0 – 0.07100.00%
Deep Sjeng 1.6 8CPU – Junior 7 8CPU28624.0 – 5.0944.44%
Deep Sjeng 1.6 8CPU – Fritz 5.32 1CPU28558.5 – 1.51085.00%
Deep Sjeng 1.6 8CPU – Yace Paderbron 1CPU28306.5 – 2.5972.22%
Total cumulémoy. pond. 289648.5 – 21.57069.29%
Performance Elo obtenue

Elo : 3037
Erreur (σ) : ±10
Nombre de parties : 70

Moyenne pondérée des ancres : (2830×9 + 2855×10 + 2862×7 + 2862×9 + 2871×8 + 2936×9 + 2947×9 + 2996×9) / 70 = 2896.
Performance = 2896 + 400 × log₁₀(0.6929 / 0.3071) = 2896 + 400 × 0.3533 = 3037.

Note de lecture — Asymétrie stylistique marquée

Le gauntlet de Deep Sjeng 1.6 révèle une asymétrie inhabituelle : le moteur domine très nettement la plupart de ses ancres (85–100% contre Fritz 5.32, Nimzo 8, Hiarcs 7.32), mais résiste mal à Junior 7 (44.44%) malgré un rating théorique identique à Hiarcs 7.32. Ce même écart s'observe contre Deep Junior 7 (44.44%). Cette dissymétrie — positive contre les moteurs positionnel-style, négative contre la famille Junior — est un marqueur stylistique clair.

Lecture des résultats

La convergence du rating est remarquablement rapide et stable : 2960 sur 14 parties, 3023 sur 30, 3022 sur 40, 3033 sur 47, et 3037 sur 70 parties. Le résultat le plus structurant est le 66.67% contre Fritz 6 (2947) sur 9 parties — l'ancre la plus haute du gauntlet avec un résultat fiable. Le 100% contre Hiarcs 7.32 sur 7 parties est statistiquement non représentatif. La zone réelle de Deep Sjeng 1.6 est probablement comprise entre 3010 et 3050, avec 3037 comme estimation centrale.

Positionnement dans l'échelle interne

Deep Sjeng 1.6 (3037) se positionne entre Deep Junior 7 (2996) et Shredder 10 (3087), comblant un espace jusqu'ici vide dans l'échelle.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — ProDeo 2.0 (1 Thread)

Ce document présente les résultats du gauntlet de calibration de ProDeo 2.0 — mono-thread, joué contre cinq moteurs d'ancrage de la zone médiane haute de l'échelle interne (2917–3087 Elo). ProDeo est un moteur développé par Ed Schröder, fondateur de la série Rebel — l'une des dynasties les plus importantes de l'histoire des moteurs d'échecs commerciaux. La version 2.0 est une version libre à évaluation entièrement manuscrite (HCE), publiée en 2015.

Note technique — Configuration mono-thread

ProDeo 2.0 est un moteur mono-thread par conception. Toutes les parties de ce gauntlet ont été jouées avec le paramètre Threads=1. Son Elo mesuré (2999) est donc strictement un Elo mono-thread.

Résultats détaillés du gauntlet

Rencontre (ProDeo 2.0 1CPU – Ancre)Ancre EloScoreParties%
ProDeo 2.0 1CPU – Shredder 10 UCI 1CPU30876.0 – 8.01442.86%
ProDeo 2.0 1CPU – Deep Junior 7 8CPU29966.5 – 7.51446.43%
ProDeo 2.0 1CPU – Fritz 6 1CPU29478.0 – 5.01361.54%
ProDeo 2.0 1CPU – List 5.12 1CPU29367.5 – 5.51357.69%
ProDeo 2.0 1CPU – SOS 5 for Arena 1CPU29177.5 – 5.51357.69%
Total cumulémoy. pond. 297935.5 – 31.56752.99%
Performance Elo obtenue

Elo : 2999 (mono-thread)
Erreur (σ) : ±11
Nombre de parties : 67

Moyenne pondérée des ancres : (3087×14 + 2996×14 + 2947×13 + 2936×13 + 2917×13) / 67 = 2979.
Performance = 2979 + 400 × log₁₀(0.5299 / 0.4701) = 2979 + 400 × 0.0520 = 2999.

Lecture des résultats

Les cinq perfs individuelles se regroupent dans une fenêtre de seulement 66 points (2971–3037), ce qui est exceptionnel. Les deux ancres directes les plus structurantes sont le 46.43% contre Deep Junior 7 (2996) et le 61.54% contre Fritz 6 (2947).

Comparaison avec les listes de référence

Le CCRL 40/15 place ProDeo 2.0 à 2682 Elo en 1CPU sur Intel i7-4770K. L'écart avec le rating maison (2999) est de +317 points — nettement supérieur aux différentiels observés pour les autres moteurs mono-thread de l'échelle.

Positionnement dans l'échelle interne

ProDeo 2.0 (2999) se positionne en quasi-parité avec Deep Junior 7 (2996 · 8T), à seulement 3 points d'écart — inférieur à σ. En tant que moteur mono-thread, c'est un résultat remarquable : ProDeo 2.0 rivalise avec un moteur fonctionnant en 8 threads.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Junior 8 (1 Thread) mono-thread

Ce document présente les résultats du gauntlet de calibration de Junior 8 — mono-thread, joué contre sept moteurs d'ancrage de la zone médiane haute de l'échelle interne (2855–2957 Elo). Junior est un moteur commercial développé par Amir Ban et Shay Bushinsky, programmeurs israéliens dont la collaboration a produit l'une des séries les plus titrées de l'histoire des échecs informatiques.

Note technique — Configuration mono-thread

Junior 8 est un moteur mono-thread par conception. Toutes les parties de ce gauntlet ont été jouées avec le paramètre Threads=1. Son Elo mesuré (2992) est donc strictement un Elo mono-thread.

Le moteur et ses auteurs

Amir Ban et Shay Bushinsky commencent le développement de Junior au début des années 1990. Le moteur se distingue rapidement par un style de jeu tactique agressif et non conventionnel, privilégiant les positions déséquilibrées et les sacrifices matériels. Junior participe aux World Computer Chess Championships à partir de 1994 et s'impose rapidement comme l'un des rivaux les plus redoutables de Deep Blue, puis de Shredder et Fritz.

Le palmarès de la série est exceptionnel : six titres de champion du monde (1997, 2002, 2004 WCCC et WCSC, 2006, 2011), dont une victoire mémorable à Graz 2003 face aux meilleures machines du monde. Junior 8 est la version commercialisée via ChessBase après l'intégration de la série dans leur catalogue. Elle hérite du style combatif de la série mais dans une forme aboutie et stabilisée — la dernière version majeure à évaluation purement manuscrite (HCE) avant la disparition progressive du développement actif.

Résultats détaillés du gauntlet

Rencontre (Junior 8 1CPU – Ancre)Ancre EloScoreBilanParties%
Junior 8 1CPU – Fritz 5.32 1CPU28555.5 – 3.5+4/=3/−2961.11%
Junior 8 1CPU – Hiarcs 7.32 1CPU28626.0 – 3.0+5/=2/−2966.67%
Junior 8 1CPU – Nimzo 8 1CPU28716.0 – 3.0+5/=2/−2966.67%
Junior 8 1CPU – SOS 5 for Arena 1CPU29174.5 – 4.5+4/=1/−4950.00%
Junior 8 1CPU – List 5.12 1CPU29367.0 – 1.0+6/=2/−0887.50%
Junior 8 1CPU – Fritz 6 1CPU29474.0 – 5.0+3/=2/−4944.44%
Junior 8 1CPU – Gambit Tiger 2.0 1CPU29575.5 – 3.5+4/=3/−2961.11%
Total cumulémoy. pond. 290638.5 – 23.56262.10%
Performance Elo obtenue

Elo : 2992 (mono-thread)
Erreur (σ) : ±11
Nombre de parties : 62

Moyenne pondérée des ancres : (2855×9 + 2862×9 + 2871×9 + 2917×9 + 2936×8 + 2947×9 + 2957×9) / 62 = 2906.
Performance = 2906 + 400 × log₁₀(0.6210 / 0.3790) = 2906 + 400 × 0.2143 = 2992.
Erreur : σ = 400 × √(p × (1−p) / N), avec p = 0.6210 et N = 62 → σ = ±11.

Lecture des résultats

Le gauntlet de Junior 8 révèle un profil très cohérent avec la tradition stylistique de la série. Les six perfs individuelles sur les ancres inferieures convergent dans une fenêtre de 2899–3036, avec une exception : le 87.50% contre List 5.12 (2936) sur 8 parties produit une perf de 3274, nettement au-dessus de la moyenne. Ce seul résultat tire la performance globale vers le haut et représente la principale source d'incertitude dans ce gauntlet.

Les ancres les plus fiables sont le 50.00% exact contre SOS 5 (2917) sur 9 parties — qui place Junior 8 à parité stricte avec ce moteur — et le 44.44% contre Fritz 6 (2947) sur 9 parties. Ces deux résultats encadrent la zone réelle avec précision : Junior 8 domine SOS 5 (2917) mais se retrouve en infériorité face à Fritz 6 (2947). La zone 2960–2990 semble la plus représentative de son niveau réel, 2992 constituant une estimation légèrement haute.

La faiblesse marquée contre Fritz 6 (44.44%) est un marqueur stylistique structurel. Fritz 5.32 et Fritz 6 sont deux moteurs issus de la même famille, et Junior 8 résiste mieux à Fritz 5.32 (61.11%) qu'à Fritz 6 (44.44%) — une asymétrie cohérente avec le bond de force entre les deux versions Fritz.

Comparaison avec les listes de référence

Junior 8 n'est pas systématiquement présent dans les listes CCRL modernes, qui se concentrent sur les versions récentes. La SSDF historique et les archives CCRL des années 2000 créditaient les versions contemporaines de Junior d'environ 2600–2750 Elo sur matériel de l'époque. L'écart avec le rating maison (2992) reflète intégralement le gain de vitesse brute du Ryzen 9 7950X3D sur un cœur unique — aucun bénéfice du parallélisme n'intervient ici.

Dans le contexte de l'échelle interne, Junior 8 (2992) se positionne entre Deep Junior 7 (2996 · 8 threads) et Ruffian 2.1.0 (2966 · mono-thread). En mono-thread pur, Junior 8 rivalise directement avec Deep Junior 7 fonctionnant en 8 threads — la différence de seulement 4 points étant statistiquement non significative. C'est un résultat remarquable qui illustre l'efficacité par cœur de l'architecture Junior.

Positionnement dans l'échelle interne
MoteurElo interneThreadsType éval.Remarque
ProDeo 2.029991HCERéférence supérieure proche
Deep Junior 729968HCERéférence supérieure — 8 threads
Junior 829921HCEMesuré · σ = ±11 · mono-thread
Ruffian 2.1.029661HCERéférence inférieure
Gambit Tiger 2.029571HCEAncre — 61.11%
SOS 5 for Arena29171HCEAncre — 50.00%

Junior 8 (2992) prend le rang 22 de l'échelle en mono-thread, entre Deep Junior 7 (2996 · 8T) et Ruffian 2.1.0 (2966 · 1T). L'écart de 4 points avec Deep Junior 7 est inférieur à σ — les deux moteurs de la série Junior sont statistiquement à parité, le passage aux 8 threads de Deep Junior 7 ne procurant qu'un avantage marginal sur cette mesure. Avec σ = ±11 sur 62 parties, le rating de Junior 8 est bien établi pour un gauntlet mono-thread.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Ruffian 2.1.0 (1 Thread)

Ce document présente les résultats du gauntlet de calibration de Ruffian 2.1.0 — mono-thread, joué contre six moteurs d'ancrage de la zone médiane haute de l'échelle interne (2947–3087 Elo). Ruffian est un moteur développé par Per-Ola Valfridsson, programmeur suédois spécialisé dans les télécommunications.

Note technique — Configuration mono-thread

Ruffian 2.1.0 est testé en configuration mono-thread. Son Elo mesuré (2966) est strictement un Elo mono-thread.

Le moteur et son auteur

Per-Ola Valfridsson commence le développement de Ruffian en 1998, en parallèle de son activité professionnelle dans les télécommunications. Le moteur apparaît publiquement en juillet 2002 sur ICC et FICS. Le nom du programme est un hommage à une célèbre jument de course américaine. Ruffian remporte le DOCCC 2003 et le Championnat de Suède non-officiel 2003. En 2004, à l'ICT de Leiden, il termine 3e derrière Shredder et Hydra. La version 2.0 commerciale, distribuée par Lokasoft avec l'interface Arena 1.0, est décrite en décembre 2003 comme l'un des moteurs WinBoard les plus forts du monde.

La version 2.1.0 est la déclinaison finale et la plus puissante de la série commerciale. Valfridsson n'a publié aucune mise à jour depuis, et le programme est entré dans l'histoire sans transition vers le NNUE.

Résultats détaillés du gauntlet

Rencontre (Ruffian 2.1.0 1CPU – Ancre)Ancre EloScoreParties%
Ruffian 2.1.0 1CPU – Shredder 10 UCI 1CPU30874.5 – 10.51530.00%
Ruffian 2.1.0 1CPU – ProDeo 2.0 1CPU29995.0 – 10.01533.33%
Ruffian 2.1.0 1CPU – Deep Junior 7 8CPU29965.5 – 9.51536.67%
Ruffian 2.1.0 1CPU – Gambit Tiger 2.0 1CPU29578.5 – 6.51556.67%
Ruffian 2.1.0 1CPU – Fritz 6 1CPU29479.0 – 6.01560.00%
Ruffian 2.1.0 1CPU – Gandalf 6.01 1CPU29479.5 – 5.51563.33%
Total cumulémoy. pond. 298942.0 – 48.09046.67%
Performance Elo obtenue

Elo : 2966 (mono-thread)
Erreur (σ) : ±9
Nombre de parties : 90

Moyenne pondérée des ancres : (3087×15 + 2999×15 + 2996×15 + 2957×15 + 2947×15 + 2947×15) / 90 = 2989.
Performance = 2989 + 400 × log₁₀(0.4667 / 0.5333) = 2989 − 400 × 0.0580 = 2966.

Asymétrie stylistique — famille Junior

Ruffian 2.1.0 présente un écart inhabituel entre ses résultats contre les moteurs positionnels (60–63% contre Fritz 6 et Gandalf) et ses résultats contre la famille Junior (36.67% contre Deep Junior 7). Cette résistance faible contre le style tactique agressif de la série Junior — déjà observée avec Deep Sjeng 1.6 — est un marqueur stylistique structurel.

Comparaison avec les listes de référence

Le CCRL 40/15 place Ruffian 2.1.0 à 2612 Elo en 1CPU sur Intel i7-4770K. L'écart avec le rating maison (2966) est de +354 points — le différentiel le plus élevé observé parmi les moteurs mono-thread de l'échelle.

Positionnement dans l'échelle interne

Ruffian 2.1.0 (2966) s'intercale entre Deep Junior 7 (2996 · 8T) et Gambit Tiger 2.0 (2957 · 1T). Moteur suédois apparu comme une comète en 2002 et disparu sans laisser de successeur, Ruffian 2.1.0 confirme ici sa solidité vingt ans après sa publication.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Gambit Tiger 2.0 (1 Thread)

Ce document présente les résultats du gauntlet de calibration de Gambit Tiger 2.0 — mono-thread. Gambit Tiger est une variante à jeu ultra-agressif de Chess Tiger, développé par Christophe Théron, programmeur français résidant en Guadeloupe.

Note technique — Configuration mono-thread

Gambit Tiger 2.0 est un moteur mono-thread par conception. Son Elo mesuré (2957) est donc strictement un Elo mono-thread.

Le moteur et son auteur

Christophe Théron commence la programmation d'échecs à l'âge de 17 ans en 1982, sur un TRS-80 cadencé à 1,77 MHz. Chess Tiger est lancé en 1997 pour PC — c'est à l'origine la version française de Rebel Tiger, vendu sous licence par Schroeder BV. Chess Tiger et sa variante Gambit Tiger participent aux WMCCC 1997, WCCC 1999, WMCCC 2000 (3e place) et WMCCC 2001, remportent trois fois le Championnat Français de Programmes d'Échecs.

L'apogée de Gambit Tiger 2.0 se produit en octobre 2001, lorsque la liste SSDF place le programme au 2e rang mondial, à seulement 6 points derrière Deep Fritz sur Athlon 1200 MHz : Gambit Tiger 2.0 256MB Athlon 1200 est crédité de 2720 Elo SSDF, juste derrière Deep Fritz (2726) et devant Chess Tiger 14.0 (2703), Shredder 5.32 (2699) et Junior 7.0 (2679).

Résultats détaillés du gauntlet

Rencontre (Gambit Tiger 2.0 1CPU – Ancre)Ancre EloScoreParties%
Gambit Tiger 2.0 1CPU – Shredder 10 UCI 1CPU30873.5 – 6.51035.00%
Gambit Tiger 2.0 1CPU – ProDeo 2.0 1CPU29994.5 – 5.51045.00%
Gambit Tiger 2.0 1CPU – Deep Junior 7 8CPU29964.0 – 6.01040.00%
Gambit Tiger 2.0 1CPU – Fritz 6 1CPU29475.0 – 5.01050.00%
Gambit Tiger 2.0 1CPU – List 5.12 1CPU29365.0 – 5.01050.00%
Gambit Tiger 2.0 1CPU – SOS 5 for Arena 1CPU29176.0 – 4.01060.00%
Total cumulémoy. pond. 298028.0 – 32.06046.67%
Performance Elo obtenue

Elo : 2957 (mono-thread)
Erreur (σ) : ±11
Nombre de parties : 60

Moyenne pondérée des ancres : (3087×10 + 2999×10 + 2996×10 + 2947×10 + 2936×10 + 2917×10) / 60 = 2980.
Performance = 2980 + 400 × log₁₀(0.4667 / 0.5333) = 2980 − 400 × 0.0580 = 2957.

Lecture des résultats

Les six perfs individuelles se regroupent dans une fenêtre de seulement 96 points (2907–3003). Les deux ancres les plus structurantes sont les 50% exacts contre Fritz 6 (2947) et List 5.12 (2936), chacun sur 10 parties. Le 35% contre Shredder 10 (3087) sur 10 parties établit clairement le plafond.

Comparaison avec les listes de référence

La SSDF, dans sa liste d'octobre 2001, plaçait Gambit Tiger 2.0 à 2720 Elo sur Athlon 1200 MHz. Le rating maison (2957) représente un gain de +237 points par rapport à cette référence historique.

Positionnement dans l'échelle interne

Gambit Tiger 2.0 est un moteur daté de 2001, conçu pour une machine Athlon 1200 MHz, et il parvient encore en 2026 sur Ryzen 9 7950X3D à se hisser au-dessus de Fritz 6 — son contemporain d'époque avec lequel il se disputait le sommet mondial vingt-cinq ans plus tôt.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Gandalf 6.01 (1 Thread)

Ce document présente les résultats du gauntlet de calibration de Gandalf 6.01 — mono-thread, joué contre sept moteurs d'ancrage de la zone médiane haute de l'échelle interne (2917–3087 Elo). Gandalf est un moteur développé par Steen Suurballe, développeur danois, avec l'aide du spécialiste de livres d'ouvertures Dan Wulff Kristensen.

Note technique — Configuration mono-thread

Gandalf 6.01 est un moteur mono-thread par conception. Son Elo mesuré (2947) est donc strictement un Elo mono-thread.

Le moteur et son auteur

Steen Suurballe commence le développement de Gandalf au début des années 1990 au Danemark. Le programme naît comme un moteur extrêmement sélectif. La SSDF lui attribue alors environ 2050 Elo. Début 1996, Gandalf adopte un moteur de recherche null-move conventionnel et réalise immédiatement de bons résultats au WMCCC Jakarta (6/9) et à l'Aegon 97. Le programme est commercialisé successivement par Gambit-Soft (versions 4.x), Schröder BV pour la version 5, et Lokasoft pour la version 6.

Gandalf 6 représente un bond de force considérable, notamment grâce à une refonte du jeu positionnel réalisée avec l'aide du grand maître de correspondance Christian Kongsted, ainsi qu'une profondeur de recherche supérieure de deux plies en moyenne à la version 5 et un livre d'ouvertures de plus de 2,2 millions de positions uniques optimisé par Dan Wulff.

Résultats détaillés du gauntlet

Rencontre (Gandalf 6.01 1CPU – Ancre)Ancre EloScoreParties%
Gandalf 6.01 1CPU – Shredder 10 UCI 1CPU30874.0 – 6.01040.00%
Gandalf 6.01 1CPU – ProDeo 2.0 1CPU29994.5 – 5.51045.00%
Gandalf 6.01 1CPU – Deep Junior 7 8CPU29965.0 – 5.01050.00%
Gandalf 6.01 1CPU – Gambit Tiger 2.0 1CPU29574.0 – 6.01040.00%
Gandalf 6.01 1CPU – Fritz 6 1CPU29476.0 – 4.01060.00%
Gandalf 6.01 1CPU – List 5.12 1CPU29364.5 – 5.51045.00%
Gandalf 6.01 1CPU – SOS 5 for Arena 1CPU29174.0 – 6.01040.00%
Total cumulémoy. pond. 297732.0 – 38.07045.71%
Performance Elo obtenue

Elo : 2947 (mono-thread)
Erreur (σ) : ±10
Nombre de parties : 70

Moyenne pondérée des ancres : (3087×10 + 2999×10 + 2996×10 + 2957×10 + 2947×10 + 2936×10 + 2917×10) / 70 = 2977.
Performance = 2977 + 400 × log₁₀(0.4571 / 0.5429) = 2977 − 400 × 0.0747 = 2947.

Lecture des résultats

Le profil stylistique de Gandalf 6.01 révèle une asymétrie notable. Son ancre directe la plus fiable est le 50% exact contre Deep Junior 7 (2996). Le 60% contre Fritz 6 (2947) confirme une légère supériorité, tandis que le 40% contre Gambit Tiger 2.0 (2957) révèle une faiblesse stylistique spécifique contre le jeu ultra-agressif.

Comparaison avec les listes de référence

La CCRL 40/2 Archive place Gandalf 6 (version non-patchée) à 2627 Elo en 1CPU sur Intel i7-4770K, basé sur 4247 parties. L'écart avec le rating maison (2947) s'élève à +320 points — le différentiel le plus élevé observé parmi les moteurs mono-thread de l'échelle.

Positionnement dans l'échelle interne

Gandalf 6.01 (2947) se positionne à égalité exacte avec Fritz 6 (2947 · 1T) — deux contemporains de la même génération qui se retrouvent séparés par zéro point dans cette échelle, vingt ans après avoir cohabité dans les mêmes tournois commerciaux.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — List 5.12 (1 Thread) mono-thread

Ce document présente les résultats complets du gauntlet de calibration dédié de List 5.12, joué en configuration mono-thread (1 CPU) contre six moteurs d'ancrage de la zone médiane de l'échelle interne (2830–2947 Elo). List est un moteur libre développé au début des années 2000.

Note technique — Configuration mono-thread

List 5.12 est un moteur mono-thread par conception. Son Elo mesuré (2936) est donc strictement un Elo mono-thread.

Résultats détaillés du gauntlet

Rencontre (List 5.12 1CPU – Ancre)Ancre EloScoreParties%
List 5.12 1CPU – Fritz 6 8CPU29475.0 – 5.01050.00%
List 5.12 1CPU – Nimzo 8 1CPU28717.0 – 3.01070.00%
List 5.12 1CPU – Hiarcs 7.32 8CPU28626.5 – 3.51065.00%
List 5.12 1CPU – Junior 7 8CPU28625.0 – 5.01050.00%
List 5.12 1CPU – Fritz 5.32 1CPU28556.5 – 3.51065.00%
List 5.12 1CPU – Yace Paderbron 1CPU28305.5 – 4.51055.00%
Total cumulémoy. pond. 287135.5 – 24.56059.17%
Performance Elo obtenue

Elo : 2936 (mono-thread)
Erreur (σ) : ±11
Nombre de parties : 60

Moyenne pondérée des ancres : (2947×10 + 2871×10 + 2862×10 + 2862×10 + 2855×10 + 2830×10) / 60 = 2871.
Performance = 2871 + 400 × log₁₀(0.5917 / 0.4083) = 2871 + 400 × 0.1611 = 2936.

Lecture des résultats

D'abord, le 50% exact contre Fritz 6 (2947) sur 10 parties — l'ancre la plus haute du gauntlet. Ensuite, le 50% exact contre Junior 7 (2862) — ancre à l'autre extrémité de la zone — qui confirme que List 5.12 domine clairement ce palier.

Comparaison avec les listes de référence

Le CCRL 40/2 Archive place List 5.12 à 2708 Elo en 1CPU sur Intel i7-4770K. L'écart avec le rating maison (2936) est de +228 points.

Positionnement dans l'échelle interne

List 5.12 s'insère entre Fritz 6 (2947 · 8T) et Nimzo 8 (2871 · 1T), à seulement 11 points en dessous de Fritz 6 — un écart inférieur à σ. En tant que moteur mono-thread, List 5.12 rivalise avec des moteurs 8 threads.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — SOS 5 for Arena (1 Thread)

Ce document présente les résultats du gauntlet de calibration de SOS 5 for Arena — mono-thread, joué contre quatre moteurs d'ancrage de la zone médiane haute de l'échelle interne (2936–3087 Elo). SOS est un moteur développé par Rudolf Huber, distribué via Arena.

Note technique — Configuration mono-thread

SOS 5 for Arena est un moteur mono-thread par conception. Son Elo mesuré (2917) est donc strictement un Elo mono-thread.

Résultats détaillés du gauntlet

Rencontre (SOS 5 1CPU – Ancre)Ancre EloScoreParties%
SOS 5 1CPU – Shredder 10 UCI 1CPU30874.0 – 16.02020.00%
SOS 5 1CPU – Deep Junior 7 8CPU29965.5 – 14.52027.50%
SOS 5 1CPU – Fritz 6 1CPU294710.5 – 9.52052.50%
SOS 5 1CPU – List 5.12 1CPU293611.5 – 8.52057.50%
Total cumulémoy. pond. 299231.5 – 48.58039.38%
Performance Elo obtenue

Elo : 2917 (mono-thread)
Erreur (σ) : ±9
Nombre de parties : 80

Moyenne pondérée des ancres : (3087×20 + 2996×20 + 2947×20 + 2936×20) / 80 = 2992.
Performance = 2992 + 400 × log₁₀(0.3937 / 0.6062) = 2992 − 75 = 2917.

Lecture des résultats

Le 52.50% contre Fritz 6 (2947) sur 20 parties — le résultat le plus robuste du gauntlet — établit une quasi-parité. Le 57.50% contre List 5.12 (2936) est parfaitement cohérent. À l'autre extrémité, les scores contre Shredder 10 (20%) et Deep Junior 7 (27.50%) sur 20 parties chacun sont sans ambiguïté.

Positionnement dans l'échelle interne

SOS 5 affiche une quasi-parité avec Fritz 6 (2947 · 1T) — un moteur qui bénéficie de huit cœurs. Avec σ = ±9 sur 80 parties, la mesure est définitive.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Nimzo 8 (1 Thread) mono-thread

Ce document présente les résultats complets du gauntlet de calibration dédié de Nimzo 8, joué en configuration mono-thread (1 CPU) contre cinq moteurs d'ancrage de la zone médiane haute de l'échelle interne (2830–2947 Elo). Nimzo est un moteur commercial développé par Chrilly Donninger.

Note technique — Configuration mono-thread

Nimzo 8 est un moteur mono-thread par conception. Son Elo mesuré (2871) est donc strictement un Elo mono-thread.

Résultats détaillés du gauntlet

Rencontre (Nimzo 8 1CPU – Ancre 8CPU)Ancre EloScoreParties%
Nimzo 8 1CPU – Fritz 6 8CPU29475.5 – 9.51536.67%
Nimzo 8 1CPU – Fritz 5.32 8CPU28556.0 – 9.01540.00%
Nimzo 8 1CPU – Junior 7 8CPU28627.0 – 8.01546.67%
Nimzo 8 1CPU – Hiarcs 7.32 8CPU28628.5 – 6.51556.67%
Nimzo 8 1CPU – Yace Paderbron 1CPU283010.5 – 4.51570.00%
Total cumulémoy. pond. 287137.5 – 37.57550.00%
Performance Elo obtenue

Elo : 2871
Erreur (σ) : ±10
Nombre de parties : 75

Moyenne pondérée des ancres : (2947×15 + 2855×15 + 2862×15 + 2862×15 + 2830×15) / 75 = 2871.
Performance = 2871 + 400 × log₁₀(0.5000 / 0.5000) = 2871 + 0 = 2871.

Lecture des résultats

Le gauntlet produit un résultat d'une netteté mathématique rare : un score global de 50.00% exact contre une moyenne pondérée de 2871 Elo, ce qui donne directement et par définition une performance de 2871. Aucun calcul de différentiel n'est même nécessaire — le log₁₀(1) vaut 0, et la performance est égale à la moyenne des ancres.

Positionnement dans l'échelle interne

Nimzo 8 s'insère entre Fritz 6 (2947) et la zone Junior 7 / Hiarcs 7.32 / Fritz 5.32 (2855–2862). Avec σ = ±10 et un score parfaitement équilibré, ce rating est l'un des plus proprement mesurés de toute l'échelle médiane.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Hiarcs 7.32 (1 Thread) mono-thread

Ce document présente les résultats complets du gauntlet de calibration dédié de Hiarcs 7.32, joué en configuration mono-thread (1 CPU) contre quatre moteurs d'ancrage de la zone médiane de l'échelle interne. Hiarcs est un moteur commercial développé par Mark Uniacke, dont les versions des années 1990–2000 sont emblématiques de la forte école britannique d'échecs informatique.

Note technique — Configuration mono-thread

Hiarcs 7.32 est un moteur mono-thread par conception. Son Elo mesuré (2862) est donc strictement un Elo mono-thread.

Résultats détaillés du gauntlet

Rencontre (Hiarcs 7.32 1CPU – Ancre 8CPU)Ancre EloScore+/=/−Parties%
Hiarcs 7.32 1CPU – Fritz 5.32 8CPU28557.0 – 7.0+4/=6/−41450.00%
Hiarcs 7.32 1CPU – Fritz 6 8CPU29476.5 – 7.5+3/=7/−41446.43%
Hiarcs 7.32 1CPU – Junior 7 8CPU28625.5 – 8.5+3/=5/−61439.29%
Hiarcs 7.32 1CPU – Yace Paderbron 1CPU28307.5 – 5.5+4/=7/−21357.69%
Total cumulémoy. pond. 287426.5 – 28.55548.18%
Performance Elo obtenue

Elo : 2862 (mono-thread)
Erreur (σ) : ±12
Nombre de parties : 55

Moyenne pondérée des ancres : (2855×14 + 2947×14 + 2862×14 + 2830×13) / 55 = 2874.
Performance = 2874 + 400 × log₁₀(0.4818 / 0.5182) = 2874 − 12.6 = 2862.

Lecture des résultats

Le résultat pivot est le 50% exact contre Fritz 5.32 (2855), qui constitue une borne directe particulièrement fiable. Les 57.69% contre Yace Paderbron (2830, également mono-thread) confirment que Hiarcs domine légèrement ce moteur de même génération. Le 39.29% contre Junior 7 (2862) est plus surprenant : les deux moteurs affichent le même Elo interne, mais Hiarcs perd ce duel direct clairement.

Comparaison avec les listes de référence

La SSDF, qui a testé de nombreuses versions de Hiarcs sur matériel dédié des années 1990–2000, situait Hiarcs 7 autour de 2580–2630 sur son échelle historique. L'écart avec le rating maison (2862) — de l'ordre de +240 à +280 points — est entièrement imputable à la vitesse brute du Ryzen 9 7950X3D.

Positionnement dans l'échelle interne

Hiarcs 7.32 partage numériquement le même Elo que Junior 7 (2862), mais le duel direct (39.29%) est en faveur de Junior 7.

Calibration : Fritz 5.32 mono-thread

Analyse comparative : Ryzen 9 7950X3D vs Listes de référence CCRL & KCEC

Perspective Historique
Mesure 2026 : 2855 Elo

Fritz 5.32 — L'héritier de Frans Morsch

Développement : ChessBase / Frans Morsch (Pays-Bas)
Version : Fritz 5.32 — circa 1998–2000
Threading : Mono-thread — 1 CPU exclusivement
Statut : Moteur commercial de premier plan à son époque

Fritz 5.32 est l'une des versions les plus abouties du moteur original de Frans Morsch, avant que ChessBase ne migre vers d'autres bases de code à partir de Fritz 13. À la fin des années 1990, Fritz dominait les classements SSDF et CCRL. Sa structure de recherche alpha-bêta est entièrement séquentielle : Fritz 5.32 ne supporte pas le multi-threading et s'exécute sur un seul cœur.

Résultats détaillés de la calibration
OppositionAncre EloScoreBilanParties%
fritz532.trn-1 + fritz532.trn

Fritz 5.32 – Rebel 6.0 (cumul)
276124.0 – 10.0✔ Victoire3470.59%
fritz532.trn-1 + fritz532.trn

Fritz 5.32 – Fritz 6 (cumul)
294714.5 – 18.5✘ Défaite3343.94%
fritz532.trn-1

Fritz 5.32 – Junior 7
28625.0 – 15.0✘ Défaite2025.00%
Total cumulé — 2 sessions fusionnéesmoy. pond. 285543.5 – 43.5— Équilibre parfait8750.00%
Comparatif CCRL & KCEC vs Hardware Moderne
CCRL 40/2 (1 CPU · Intel i7-4770K)

Le CCRL 40/2 Archive crédite Fritz 5.32 d'un rating de 2539 Elo en configuration mono-processeur sur Intel i7-4770K (2202 parties). Le gain mesuré au laboratoire (+316 points) ne provient pas du parallélisme mais uniquement de la différence de fréquence et d'IPC entre l'i7-4770K et le Ryzen 9 7950X3D.

KCEC (1 CPU · hardware contemporain)

La liste KCEC place Fritz 5.32 à 2646 Elo (1329 parties). Dans la liste KCEC, List 5.12 figure à 2699, avec un score direct de 15/30 contre Fritz 5.32, ce qui est cohérent avec l'écart de rating observé entre les deux moteurs.

Analyse des résultats
Lecture du gauntlet consolidé

Le résultat le plus élégant du gauntlet est le score global de 50.00% exact sur 87 parties. Ce score nul contre une moyenne pondérée de 2855 produit directement la performance Elo par définition. Rebel 6.0 (2761) est dominé sans appel sur 34 parties cumulées (70.59%). Fritz 6 (2947) s'avère légèrement supérieur sur 33 parties (43.94%). Junior 7 (2862) domine nettement Fritz 5.32 (25.00% sur 20 parties), reflet d'un différentiel stylistique marqué.

Synthèse de Performance — Laboratoire 2026
Elo CCRL (1 CPU)
2539
i7-4770K · 2202 parties
Gain Ryzen 1T
+316
fréquence + IPC
Erreur (σ)
±21
87 parties · 2 sessions
Calibration Finale
2855

Positionnement dans l'échelle maison : Fritz 5.32 (2855) se situe entre Yace Paderbron (2830 · mono-thread) et Hiarcs 7.32 (2862). L'écart de 92 points avec Fritz 6 (2947) confirme la progression réelle entre les deux versions sur hardware moderne.

Calibration · Gauntlet dédié · Ryzen 9 7950X3D

Calibration Elo — Yace Paderbron (1 Thread) mono-thread

Ce document présente les résultats complets du gauntlet de calibration dédié de Yace Paderbron, joué en configuration mono-thread (1 CPU) contre trois moteurs d'ancrage de la zone médiane de l'échelle interne. Yace Paderbron est un moteur open-source développé à l'Université de Paderborn au début des années 2000.

Note technique — Configuration mono-thread

Yace Paderbron est un moteur mono-thread par conception. Son Elo mesuré (2830) est donc strictement un Elo mono-thread.

Résultats détaillés du gauntlet

Rencontre (Yace Paderbron 1CPU – Ancre 8CPU)Ancre EloScoreParties%
Yace Paderbron 1CPU – Fritz 5.32 8CPU28559.5 – 11.52145.24%
Yace Paderbron 1CPU – Fritz 6 8CPU29477.0 – 13.02035.00%
Yace Paderbron 1CPU – Junior 7 8CPU28629.0 – 11.02045.00%
Total cumulémoy. pond. 288825.5 – 35.56141.80%
Performance Elo obtenue

Elo : 2830 (mono-thread)
Erreur (σ) : ±11
Nombre de parties : 61

Moyenne pondérée des ancres : (2855×21 + 2947×20 + 2862×20) / 61 = 2888.
Performance = 2888 + 400 × log₁₀(0.4180 / 0.5820) = 2888 − 57.5 = 2830.

Lecture des résultats

Ses trois scores contre les ancres sont très proches — 45.24% contre Fritz 5.32 (2855), 45.00% contre Junior 7 (2862), et 35.00% contre Fritz 6 (2947) — ce qui produit des performances individuelles quasi identiques (2822, 2840 et 2827). Une telle homogénéité valide la solidité du rating obtenu.

Comparaison avec les listes de référence

La SSDF plaçait Yace Paderbron aux alentours de 2550–2600 sur son échelle. L'écart avec le rating maison (2830) est de l'ordre de +230 à +280 points, entièrement imputable au gain de vitesse du Ryzen 9 7950X3D.

Positionnement dans l'échelle interne

Yace Paderbron s'insère juste au-dessus de The King 3.50 (2817 · 8T) et en dessous de Fritz 5.32 (2855) et Junior 7 (2862).