
Zitat von
Chessguru
das sehe ich nicht so. "Auf der einen Seite eine reine Zahlensammlung, statistisch sauber aber mit gewissen Schwächen aufgrund des Stichprobencharakters", auf der anderen eine subjektive Einschätzung. Aber andere Spieler schätzen die Geräte vielleicht völlig anders ein!? Am Ende hat man verschiedene subjektive Meinungen.
Hallo Micha,
das ist doch auch OK?! Wenn es sich bei den Meinungen allerdings um Expertenmeinungen handelt (und davon können wir hier ja ausgehen), dann werden sie nicht ganz widersprüchlich sein.
Eine Sache möchte ich allerdings klarstellen, bitte versteht mich hier nicht falsch: Ich würde persönlich nicht so weit gehen, meine subjektive Einschätzung in Form einer Liste oder gar mit Elo-Zahlen auszudrücken. Dafür fehlt wirklich jede Basis.
Aber wir haben ja in unserer Liste das Problem (wenn es denn eines ist), daß wir die Einstufungen vieler Geräte nicht hinreichend statistisch untermauern können. Es ist natürlich schön, z.B. den Excalibur LCD-Chess drin zu haben, wir müssen uns nur vor Augen halten, daß wir seine Zahl halt nicht zu wörtlich nehmen dürfen. Wie wörtlich wir eine Zahl nehmen dürfen, steht ja sogar dahinter, komfortabler gehts nicht.
Und genau an der Stelle kommt der Mensch (bzw. Wolfgang2)

ins Spiel: In solchen Fällen kann er uns begleitend zur Liste einen Hinweis geben, in welche Richtung innerhalb der großen Meßunsicherheit es wohl gehen wird. Und wenn er seine Einschätzung mit einer Analyse der Spielcharakteristik untermauern kann (z.B. gut im Mittelspiel oder stark im Endspiel), umso besser!
Wiederum möchte ich als Beispiel für prominente Meßungenauigkeit den Mephisto Polgar in der SSDF-Liste bemühen: Als der in seiner zweiten Liste immer noch auf 2057 (oder so ähnlich) stand, war es eine Binsenweisheit, daß die Zahl um einiges zu hoch war, und in der dritten hatte er auf einmal auch 1980 oder so. Bei manchen anderen Geräten ist das vielleicht nicht so einfach.

Zitat von
Wolfgang2
Das verstehe ich alles (habe ich oben schon geschrieben), allerdings ist die letzte Aussage (bzw. Einstufung) als solches ziemlich wertlos, da das Intervall von 960-1319 einfach zu groß ist.
Wenn die große statistische Fehlerspanne bei einigen Geräten wirklich ein Problem ist, dann hilft es eigentlich nur, die Eintrittschwelle anzuheben. Die SSDF hatte damals glaube ich 100 Partien Minimum angesetzt, und da gab es immer noch Phänomene a la Polgar.
Deshalb hätte ich eigentlich keine Lust auf eine derartige Einschränkung: Die Liste hätte weniger Einträge, und die systembedingten Schwierigkeiten wären doch nicht ausgeräumt, allenfalls abgeschwächt. Außerdem sind die Fehlerspannen ja immer vorbildlich dokumentiert, was will man mehr? (Danke Micha übrigens auch von meiner Seite!) Und wenn ich Informationen über ein Gerät suche, dann habe ich doch lieber eine unsichere Zahl als gar keine?
Viele Grüße,
Dirk