Le chant du cygne de l'évaluation artisanale

Le dernier carré de l'évaluation artisanale — Tournoi HCE

Tournoi · évaluation artisanale (HCE)

Le dernier carré de l'évaluation artisanale

Dix moteurs, 898 parties, un seul critère d'admission : être resté fidèle à une fonction d'évaluation écrite à la main, sans réseau NNUE greffé. Ce sont les derniers grands champions de l'ère classique — pour la plupart figés en 2019-2020, à la veille du raz-de-marée neuronal.

Le thème. En septembre 2020, Stockfish 12 intègre NNUE et gagne d'un coup ~80 Elo : l'évaluation artisanale (HCE, hand-crafted evaluation) cesse d'être compétitive au sommet. En quelques mois, presque tous les grands moteurs basculent — ou s'arrêtent. Ce tournoi rassemble la toute dernière version purement HCE de chaque programme retenu, gelée juste avant ce basculement. Un mémorial autant qu'un classement.
Conditions. Round-robin intégral · 10 moteurs · 8 threads chacun · cadence 60 coups / 5 min, répétée · MSI · 11–19 mai 2026.

Classement final

898 parties · 10 moteurs · round-robin toutes rondes · tie-break : points

#	Moteur	Pts	J	+ / = / −	%
1	Stockfish 11 64	137,0	179	95 / 84 / 0	76,5 %
2	Komodo 14.1 64-bit	112,0	180	55 / 114 / 11	62,2 %
3	Fire 8 x64	105,0	178	50 / 110 / 18	59,0 %
4	Ethereal 12.75	103,5	180	38 / 131 / 11	57,5 %
5	Xiphos 0.6	87,0	180	20 / 134 / 26	48,3 %
6	Booot 6.5 x64	81,0	180	18 / 126 / 36	45,0 %
7	rofChade 2.3	76,0	179	17 / 118 / 44	42,5 %
8	Deep Shredder 13 x64	72,5	180	12 / 121 / 47	40,3 %
9	Laser 1.7	67,0	180	11 / 112 / 57	37,2 %
10	Defenchess 2.2 x64	57,0	180	7 / 100 / 73	31,7 %

Vainqueur · invaincu Stockfish 11 137,0 / 179 · 76,5 % · 0 défaite

Le verdict est sans appel : Stockfish 11 traverse le tournoi sans perdre une seule partie (95 gains, 84 nulles, aucune défaite sur 179 rencontres), avec 25 points d'avance. À l'autre bout, Defenchess ferme la marche à 31,7 %. Entre les deux, un fait marquant : les trois places suivantes sont occupées par des moteurs open source (Komodo excepté, commercial), tandis que les anciens champions commerciaux glissent dans le bas de tableau. Le rapport de force de l'ère ouverte, juste avant que NNUE ne rebatte les cartes une dernière fois.

Tableau croisé

Score de la ligne contre la colonne · 20 parties par confrontation · vert = majorité rouge = minorité

	SF11	Kom	Fire	Eth	Xiph	Booot	rofC	DS13	Laser	Defen
Stockfish 11	—	13.0	13.0	13.0	14.0	16.0	16.0	18.0	16.0	18.0
Komodo 14.1	7.0	—	13.0	9.0	12.5	13.5	13.5	14.0	14.0	15.5
Fire 8	6.0	7.0	—	10.5	11.5	13.5	13.5	13.0	13.5	16.5
Ethereal 12.75	7.0	11.0	9.5	—	11.5	12.0	11.0	12.0	14.0	15.5
Xiphos 0.6	6.0	7.5	8.5	8.5	—	9.5	12.0	12.0	10.5	12.5
Booot 6.5	4.0	6.5	6.5	8.0	10.5	—	9.5	11.5	12.0	12.5
rofChade 2.3	4.0	6.5	5.5	9.0	8.0	10.5	—	10.0	11.0	11.5
Deep Shredder 13	2.0	6.0	7.0	8.0	8.0	8.5	10.0	—	12.0	11.0
Laser 1.7	4.0	6.0	6.5	6.0	9.5	8.0	9.0	8.0	—	10.0
Defenchess 2.2	2.0	4.5	3.5	4.5	7.5	7.5	8.5	9.0	10.0	—

Stockfish n'enregistre aucun score perdant : toute sa ligne est verte. Deep Shredder 13 illustre à l'inverse l'effondrement des anciens face au champion ouvert — 2,0 / 20 contre Stockfish 11, soit 10 % seulement. Le tableau révèle aussi quelques non-transitivités locales (Komodo domine Ethereal 11-9, qui lui-même tient Fire), mais l'ossature reste remarquablement régulière.

Les moteurs, un à un

Auteur · origine · dernière version artisanale · bascule NNUE

01Stockfish 11 — le champion invaincu

Marco Costalba, Joona Kiiski, Gary Linscott & la communauté · open source GPL · sortie 18 janvier 2020 · dernier Stockfish purement HCE

Stockfish naît en 2008 quand Marco Costalba dérive Glaurung, le moteur de Tord Romstad, pour en faire un projet communautaire. Sa force vient moins d'un auteur que d'une méthode : le framework de test distribué Fishtest, où des centaines de bénévoles valident chaque micro-changement par milliers de parties. Au fil des ans, cette évaluation artisanale est devenue la plus finement réglée de l'histoire.

Stockfish 11 en est l'aboutissement absolu — et la fin d'une époque. Sept mois plus tard, Stockfish 12 (septembre 2020) intègre NNUE, un réseau de neurones efficacement actualisable importé du shogi, et gagne d'un seul coup ~80 Elo. La version 11 reste ainsi le dernier champion du monde de l'évaluation écrite à la main. Ici, il le prouve : invaincu, 76,5 %.

0 défaite en 179 parties. Aucun autre moteur du plateau ne dépasse 35 % contre lui. C'est l'écart entre la dernière HCE de pointe et tout le reste du champ classique.

02Komodo 14.1 — le positionnel

Don Dailey, GM Larry Kaufman, Mark Lefler · commercial · 2020 · dernière version avant Dragon (NNUE)

Komodo est né de la rencontre entre le programmeur Don Dailey et le grand-maître Larry Kaufman, théoricien réputé des valeurs de pièces et des déséquilibres matériels. À la mort de Don Dailey en 2013, Mark Lefler reprend le moteur de recherche tandis que Kaufman continue de cultiver l'évaluation. Komodo s'est forgé une réputation de jeu profondément positionnel et stratégique, là où d'autres misaient sur le calcul brut.

Komodo 14.1 est la dernière version à évaluation classique. En 2021, Komodo Dragon adopte NNUE et gagne près de 190 Elo d'un coup. La 14.1 est donc le chant du cygne du Komodo artisanal — et il décroche ici une solide 2ᵉ place, fidèle à sa réputation de robustesse.

03Fire 8 — le rescapé d'Ippolit

Norman Schmidt (« kranium ») · Belgique · open source GPL · sortie 23 février 2021 · Fire 8.N (mai 2021) passe à NNUE

Fire a une histoire mouvementée. Apparu en 2010 sous le nom de Firebird (renommé pour un conflit de marque), il dérivait jusqu'à la version 3.0 de la famille controversée Ippolit / IvanHoe, ces clones open source de l'ère Rybka. Fire 4 (décembre 2014) marque une réécriture complète et originale, qui solde ce passé. Le moteur de Norman Schmidt s'appuie sur des bitboards magiques, plus de 70 options UCI et une recherche SMP.

Fire 8, sorti début 2021 avec une évaluation « plus compacte et finement réglée », est la dernière mouture purement artisanale : trois mois plus tard, Fire 8.N greffe un réseau NNUE. Sa 3ᵉ place ici, devant Ethereal, en fait le meilleur des poursuivants après le duo de tête.

04Ethereal 12.75 — « HCE is dead »

Andrew Grant · États-Unis · open source GPLv3 · 9 octobre 2020 · « Final Release » HCE avant Ethereal 13 (NNUE)

Premier publié en juin 2016, Ethereal s'inspire ouvertement de Crafty, Stockfish, TSCP, MadChess et Fruit. Andrew Grant en a fait l'une des références de l'évaluation classique open source, et a créé en parallèle OpenBench, un framework de test distribué adopté par toute une génération de moteurs.

Ethereal 12.75 porte explicitement la mention « Final Release » : c'est la dernière version artisanale, gelée le 9 octobre 2020, le jour même où Grant lançait un appel pour entraîner un réseau NNUE. Il franchira le pas avec Ethereal 13 (NNUE, commercial, juin 2021), puis signera son fameux billet « I declare that HCE is dead » avant de prendre la tête du projet Torch de Chess.com. La 12.75 est donc le testament HCE d'un auteur qui a tourné la page sans regret.

05Xiphos 0.6 — l'inachevé

Miloš Tatarević · open source GPLv3 · sortie 7 novembre 2019 · développement arrêté, jamais passé à NNUE

Xiphos est né en février 2018 d'une envie : après avoir lu Deep Thinking de Garry Kasparov, Miloš Tatarević a voulu savoir « à quel point il serait difficile » d'écrire un moteur capable de surpasser Deep Blue. Réponse : dès sa première version, Xiphos tutoyait les 3000 Elo. Alpha-bêta classique à évaluation artisanale, il a culminé au 5ᵉ rang mondial CCRL en décembre 2019.

La version 0.6 est sa dernière sortie majeure. Le développement s'est ensuite arrêté, juste avant la vague NNUE — Xiphos ne s'y est jamais converti. Il reste un « et si ? » de l'histoire récente, première moitié de tableau ici, à 48,3 %.

06Booot 6.5 — le vétéran

Alex Morozov · Ukraine · 2020 · Booot 7.0 (2021) passe à NNUE

Booot est l'un des plus anciens projets encore en activité à cette époque : Alex Morozov le développe depuis le début des années 2000, d'abord en Pascal/Delphi, signe d'une longévité rare dans le petit monde des moteurs. Patiemment affiné au fil de deux décennies, il a toujours figuré honorablement dans les listes.

Booot 6.5 est sa dernière version à évaluation classique ; la 7.0 adoptera NNUE l'année suivante. Sixième ici, au cœur du peloton, il illustre le destin commun de cette génération : un dernier tour de piste artisanal avant la conversion.

07rofChade 2.3 — l'artisan discret

Ronald Friederich · Pays-Bas · ~2020 · rofChade 3.0 (2021) passe à NNUE

rofChade est l'œuvre solitaire et discrète de Ronald Friederich, dont la version 2.2 datait de septembre 2019. La lignée 2.x représente l'apogée de son évaluation artisanale, élégante et bien réglée, qui lui valait une place régulière dans le haut-milieu des classements.

La 2.3 est la dernière de cette veine : rofChade 3.0 basculera vers NNUE en 2021. Septième de ce tournoi, il devance d'un souffle les deux anciens champions commerciaux que sont Shredder et Laser.

08Deep Shredder 13 — le champion d'un autre temps

Stefan Meyer-Kahlen · Allemagne · commercial · sortie 2017 · HCE par conviction — n'a jamais adopté NNUE

Shredder est une légende : signé Stefan Meyer-Kahlen, il a accumulé une douzaine de titres de champion du monde (WCCC, WMCCC) entre les années 1990 et 2000, dominant l'époque où les moteurs commerciaux faisaient la loi. Sa marque de fabrique : une évaluation positionnelle sophistiquée et une grande solidité.

Sa singularité dans ce plateau : Deep Shredder 13 est resté HCE par choix, pas seulement par calendrier. Meyer-Kahlen n'a jamais converti Shredder à NNUE, fidèle à son approche classique. Sa 8ᵉ place — et son terrible 2,0 / 20 contre Stockfish 11 — mesure cruellement la distance que la communauté open source avait creusée, en deux décennies, face aux champions d'antan.

09Laser 1.7 — le projet fraternel

Jeffrey An & Michael An · États-Unis · open source · sortie 2019 · dernière version, jamais passé à NNUE

Laser est l'œuvre des frères Jeffrey et Michael An, un moteur alpha-bêta open source à l'évaluation soignée qui s'est fait un nom dans la communauté à la fin des années 2010. La version 1.7 (2019) est sa dernière sortie.

Comme Xiphos, Laser s'est tu juste avant la révolution neuronale, sans jamais franchir le pas du NNUE. Neuvième ici, il reste un témoin attachant de cette dernière génération artisanale indépendante.

10Defenchess 2.2 — la lanterne rouge

Can Çetin & Doğaç Eldenk · Turquie · open source · sortie 23 août 2019

Defenchess, développé par les Turcs Can Çetin et Doğaç Eldenk, est le benjamin du plateau et le plus modeste en force. Sa version 2.2 (août 2019) reste une évaluation entièrement artisanale, honnête et propre, mais en retrait du niveau des ténors de cette sélection.

Dernier au classement à 31,7 %, il n'en a pas moins disputé l'intégralité du round-robin et arraché ses points — y compris un surprenant 9,0 / 20 contre Deep Shredder 13, preuve que même la lanterne rouge avait ses jours.

Un instantané daté. Ce tournoi n'oppose pas dix moteurs « actuels » mais dix versions historiques, choisies pour incarner le sommet — ou le terminus — de l'évaluation artisanale de chaque lignée. Quelques mois après les dates ici figées, presque toutes ces familles ont basculé vers NNUE (Stockfish, Komodo, Fire, Ethereal, Booot, rofChade) ou se sont arrêtées (Xiphos, Laser). Lire ce classement, c'est regarder une photographie prise juste avant que le paysage ne change pour de bon.

Post Views: 3