
Zitat von
rollinghills
Das Ding "lernt" halt ganz anders, als wir es gewohnt sind.
Hier die Liste mit den Ergebnissen einzelner LCZero Versionen gegen Stockfish und den Wertungszahlen dazu:
Zur Liste
Schade, dass es nur gegen drei Stockfish-Versionen eingemessen wird, und nicht durch eine Auswahl ähnlich spielstarker Engines.
Übertriebenes Beispiel: Ein Großmeister setzt einen Patzer in 20 Zügen matt und soll dann einschätzen, ob der Patzer eher ELO 1200 oder doch ELO 1000 hat. Wird er das können? Dagegen könnten mehrere Partien gegen verschiedene Gegner im Bereich 1000-1200 ELO schon deutlich mehr Aufschluss über die Spielstärke geben.
Immerhin sind drei Stockfish-Versionen für die Einschätzung besser, als nur das Spiel gegen sich selbst.