Einzelnen Beitrag anzeigen
  #54  
Alt 24.07.2007, 23:17
Benutzerbild von Supergrobi
Supergrobi Supergrobi ist offline
Revelation
 
Registriert seit: 12.07.2004
Ort: Hannover
Alter: 53
Land:
Beiträge: 702
Abgegebene Danke: 277
Erhielt 438 Danke für 112 Beiträge
Aktivitäten Langlebigkeit
0/20 20/20
Heute Beiträge
0/3 ssssss702
AW: Neue Aktivschach Elo Liste oder: Denkt doch mal statistisch :)

 Zitat von Chessguru
Ich habe nie behauptet, dass diese Liste zu 100% korrekt ist oder als allgemeingültige Wahrheit anzuerkennen sei. Diese Liste enthält rund 8.000 Partien, die wir in der Community gespielt haben und die Auswertung dieser Partien stellt unsere neue Liste dar. Nicht mehr und nicht weniger.
Hallo Micha,

wahre Worte! Eigentlich wäre es ja fast schon überflüssig, darüber zu reden, denn Du hast ja in der Liste auch Toleranzen angegeben. Wenn ich mich nicht irre, werden die standardmäßig für 67% Sicherheit angegeben?!

Das hieße auf gut Deutsch (Achtung Wolfgang2!):
Wenn ein Gerät wie z.B. der Excalibur LCD-Chess 16 Partien absolviert hat, liegt die hinter dieser Stichprobe vermutete wahre Spielstärke zu 67% innerhalb der angegebenen Grenzen von +187/-172, d.h. mit einer Wahrscheinlichkeit von 67% ist seine wahre Spielstärke irgendwo innerhalb von 960-1319. Entsprechend könnte er mit einer Wahrscheinlichkeit von 32% auch außerhalb liegen... In diesem Zusammenhang möchte ich nur an den Einstieg des Mephisto Polgar in der SSDF-Liste erinnern, der sogar in der zweiten Liste noch 80 Punkte zu hoch war.

Wenn man vermeiden will, daß ein Gerät nach mehr Partien die zunächst angegebenen Toleranzen überschreitet, kann man die Toleranz auch für eine höhere Sicherheit angeben, 95% ist z.B. recht gebräuchlich. Dann wäre unser Beispiel LCD-Chess wahrscheinlich mit +/-300 gelistet, weil man die größere Sicherheit ja nur durch Aufweiten der Grenzen erreicht...

Was ich damit sagen will: Diese Liste stellt wirklich nur eine statistische Auswertung unserer gespielten Partien dar. Ob ein Wert einer Elo-Zahl irgendeine Relevanz hat, hängt nur mit der Anzahl der gespielten Parten zusammen.


Und noch ein Wort zur subjektiven Einschätzung der Spielstärke:
Die hat natürlich ihre Berechtigung, wahrscheinlich nimmt jeder von uns für sich eine solche Einschätzung vor. Man sollte sich jedoch davor hüten, sich vom Eindruck bestimmter Partiephasen blenden zu lassen. Ist ein Gerät, das ein anderes in jeder Partie überspielt, es dann aber im Endspiel nicht mattsetzen kann, wirklich stärker? Die Mittelspielüberlegenheit wird hier ja von einer Endspielunterlegenheit kompensiert. Wer will sagen, was wichtiger ist?

Insofern ist das alles doch eher subjektiv geprägt, und man sollte nicht versuchen, eine solche subjektive Einschätzung in Konkurrenz zu einer Elo-Liste zu setzen. Die beiden Sichtweisen ergänzen sich doch ideal! Auf der einen Seite eine reine Zahlensammlung, statistisch sauber aber mit gewissen Schwächen aufgrund des Stichprobencharakters, auf der anderen Seite eine fachlich fundierte subjektive Einschätzung, die sich wirklich mit dem tatsächlichen Spielverhalten auseinandersetzt. Ist doch super!?

Noch ein Wort zu Mephisto I/II:

Setzt man die lt. Toleranz schlechteste denkbare Zahl des Meph.II in Relation zur besten des Meph.I, dann kommt heraus:
MephI.:1229
Meph.II:1340

D.h. es besteht durchaus eine nicht zu kleine Wahrscheinlichkeit, daß Wolfgang2 mit seiner Einschätzung der Liste gar nicht widerspricht!

Viele Grüße,
Dirk
Mit Zitat antworten