
Zitat von
GS
Vielen Dank für die Aufstellung !
Beim "human chess" ist das so gewollt und meines Erachtens korrekt.
Es soll der aktuellen Form des Spielers Rechnung getragen werden
resp. diese soll mehr zur Geltung kommen als die Form vergangener
Tage. Bei Spielen von Schachprogrammen jedoch wäre das, wie
richtig geschrieben, Verschwendung resp. ein unnötiger Verzicht auf
wertvolle Daten.
Schachprogramme, zumindest wie wir sie bisher kennen gelernt haben
(bis auf 1-2 experimentelle Ausnahmen), haben von Geburt an eine
gleichbleibende Spielstärke. Deshalb ist die Art der bisherigen
Auswertung (wie ein grosses Turnier) absolut legitim.
Viele Grüsse,
G.S.
Völig richtig wenn man nicht in die Zukunft schaut, denn lernende Programme (wie du sagst, 1-2 experimentelle Ausnahmen gibt es ja schon) werden in Zukunft vermehrt auftreten... vielleicht nicht in den nächsten paar Monaten, aber in den nächsten paar Jahren. Und spätestens dann ist diese Berechnungsweise wieder überholt. Für den Moment allerdings geht es, wobei dann wieder das Problem der menschlichen Eichung bleibt. Und das ist ja das Problem der Listen. Jede liefert andere Werte.
Beispiel Kommodo 11.01:
CCRL 3394
CEGT 3313
IPON 3299
Allein hier differieren die Werte bereits um 100 Punkte, aufgrund unterschiedlicher Berechnung, möglicherweise unsinniger Turnieraustragung und was da sonst noch so alles sein mag. Schlechter kanns vermutlich mit FIDE-Wertung auch nicht werden. Aber genau da müssen wir ansetzen. Wie groß sind die Abweichenungen im Ergebnis. Noch im Bereich "vertretbar" oder schon im Bereich "geht gar nicht". Was würde das (zumindest auf der Basis vergleichbarer Werte mit menschlichen ELO) bedeuten? Könnte man die FIDE-Formel anwenden oder wären die Ergebnisse dann so ungenau, dass auch nichts gewonnen wäre?
Auch wenn es eher philosophisch als mathematisch rüberkommen mag. Aber wenn wir eine wirkliche Vergleichbarkeit haben wollen, müssen wir uns vermutlich von der rein mathematischen Betrachtungsweise verabschieden und einen Kompromiss finden. Entweder den, dass wir völlig neue Annäherungsverfahren brauchen, oder den dass wir mit Ungenauigkeiten (Stichwort weggeworfene Information) bei den Werten unter den Computern leben müssen, soweit sie einen gewissen Rahmen nicht überschreiten.