Einzelnen Beitrag anzeigen
  #55  
Alt 25.07.2007, 01:13
Wolfgang2 Wolfgang2 ist offline
Lebende Foren Legende
 
Registriert seit: 02.02.2005
Ort: Schweinfurt
Alter: 58
Land:
Beiträge: 2.784
Abgegebene Danke: 3.437
Erhielt 3.426 Danke für 1.631 Beiträge
Aktivitäten Langlebigkeit
6/20 20/20
Heute Beiträge
1/3 sssss2784
AW: Neue Aktivschach Elo Liste oder: Denkt doch mal statistisch :)

 Zitat von Supergrobi
Hallo Micha,

wahre Worte! Eigentlich wäre es ja fast schon überflüssig, darüber zu reden, denn Du hast ja in der Liste auch Toleranzen angegeben. Wenn ich mich nicht irre, werden die standardmäßig für 67% Sicherheit angegeben?!

Das hieße auf gut Deutsch (Achtung Wolfgang2!):
Wenn ein Gerät wie z.B. der Excalibur LCD-Chess 16 Partien absolviert hat, liegt die hinter dieser Stichprobe vermutete wahre Spielstärke zu 67% innerhalb der angegebenen Grenzen von +187/-172, d.h. mit einer Wahrscheinlichkeit von 67% ist seine wahre Spielstärke irgendwo innerhalb von 960-1319.
Das verstehe ich alles (habe ich oben schon geschrieben), allerdings ist die letzte Aussage (bzw. Einstufung) als solches ziemlich wertlos, da das Intervall von 960-1319 einfach zu groß ist.

 Zitat von Supergrobi
Und noch ein Wort zur subjektiven Einschätzung der Spielstärke:
Die hat natürlich ihre Berechtigung, wahrscheinlich nimmt jeder von uns für sich eine solche Einschätzung vor. Man sollte sich jedoch davor hüten, sich vom Eindruck bestimmter Partiephasen blenden zu lassen. Ist ein Gerät, das ein anderes in jeder Partie überspielt, es dann aber im Endspiel nicht mattsetzen kann, wirklich stärker?
Ein klares "JA!".
 Zitat von Supergrobi
Die Mittelspielüberlegenheit wird hier ja von einer Endspielunterlegenheit kompensiert. Wer will sagen, was wichtiger ist?
Die Mittelspielüberlegenheit ist wichtiger, da da Mittelspiel vor dem Endspiel ist und in einer praktischen Partie (gegen Menschen, und dafür sind die Computer in erster Linie gebaut) somit ein vorzeitiger Sieg möglich ist.

 Zitat von Supergrobi
Insofern ist das alles doch eher subjektiv geprägt, und man sollte nicht versuchen, eine solche subjektive Einschätzung in Konkurrenz zu einer Elo-Liste zu setzen.
Nein. Das Mittelspiel kommt vor dem Endspiel, das ist nicht subjektiv sondern objektiv (s.o.)

 Zitat von Supergrobi
Die beiden Sichtweisen ergänzen sich doch ideal! Auf der einen Seite eine reine Zahlensammlung, statistisch sauber aber mit gewissen Schwächen aufgrund des Stichprobencharakters, auf der anderen Seite eine fachlich fundierte subjektive Einschätzung, die sich wirklich mit dem tatsächlichen Spielverhalten auseinandersetzt. Ist doch super!?
Damit bin ich einverstanden! Noch eine Anmerkung: Ich habe mich tatsächlich ziemlich eingehend mit den meisten Geräten, die ich nannte auseinandergesetzt. Ich nehme auch nicht "die Wahrheit" für meine Liste in Anspruch. Speziell was die Abstufung der diversen Fidelity Chess Challengers betrifft, ist das auch garnicht so einfach.
Was ich an der Liste bemängle, sind offensichtliche Fehler in der Reihenfolge bei den Altgeräten (CC Sensory 8 viel zu hoch, MKIII ist niemals stärker als Intelligent Chess). Natürlich kann man jetzt mit den statistischen Fehlertoleranzen argumentieren, aber der angegebene Wert bzw. die Reihung sollte schon, zumindest ungefähr, stimmen. Oder man nimmt die Geräte aus der Liste raus...

Meine Meinung: Unsicherheiten sind immer drin, natürlich auch bei meiner Bewertung, der auch einige Partien zugrunde liegen. Es läßt sich beispielsweise bestimmt darüber diskutieren ob CC7 um 100 oder 150 Punkte stärker ist als CC10A. Aber gröbere Fehler bzgl. der Reihenfolge hat meine Liste, glaube ich jedenfalls, nicht.

 Zitat von Supergrobi
Noch ein Wort zu Mephisto I/II:

Setzt man die lt. Toleranz schlechteste denkbare Zahl des Meph.II in Relation zur besten des Meph.I, dann kommt heraus:
MephI.:1229
Meph.II:1340

D.h. es besteht durchaus eine nicht zu kleine Wahrscheinlichkeit, daß Wolfgang2 mit seiner Einschätzung der Liste gar nicht widerspricht!

Viele Grüße,
Dirk
Ein Problem bei den Mephisto I - Partien scheint mir (A) die Spielstufe L.3 zu sein und (B) die Nichterkennung der Zugwiederholung, weshalb überlegene Stellungen gelegentlich remisiert werden.
Bewertet man beides anders, oder läßt Mephisto I bei einem Teil der Partien als Kompromiß auf Stufe 4 spielen (die allerdings etwas zu lang ist), dann bekommt man auf längere Sicht mit Sicherheit die 50-100 Elo-Punkte mehr, die ich für angemessen halte.
d.h. aber auch mit anderen Worten: Belässt man es bei Stufe 3, die auf längere Sicht im Schnitt nur ca. 15-20 sec. beansprucht (hatte ich mal überprüft), dann bleibt's natürlich bei der Benachteiligung.

Gruß
Wolfgang

Geändert von Wolfgang2 (25.07.2007 um 01:33 Uhr)
Mit Zitat antworten