|
|||||||||||
AW: Neue Aktivschach Elo Liste
![]() Hallo Robert:
Es macht immer spass mit dich zu diskutieren. Auch dieser topic ist interessant ![]() Wie ich das irgendwie lese von dir und auch von Wolfgang da dreht sich die Welt um 5 oder 6 schachcomputers in den U1400 bereich, oder in dein Kundenbeispiel mit ein paar computers von 1980. Ich spreche hier aber ueber eine grosse Welt. Und hier ist mein beispiel der auch das sagt was du in dein Zitat ewaehnst aber von einen ganz anderen Gesichtspunkt... Im Endeffekt versuche ich in diesem Thread vorrangig, meine Erkenntnisse und Erfahrungen aus schachlicher Sicht einzubringen. Ich habe einen "neuzeitlichen" billigen Sch(w)achcomputer, so einen "Krypton Schachpartner 2", oder wie das Ding für 20 EUR heißt. Mein Eindruck von dem Gerät nach der ersten Partie wurde prompt vom MKIII bestätigt, der das Gerät ebenfalls besiegte. Dame kann das Krypton-Gerät auch spielen - und auch verlieren! Gruß Wolfgang |
|
||||||||||||
AW: Neue Aktivschach Elo Liste
Hallo Robert,
![]() Natürlich richtig, aber wir greifen als Turnier-/Spielleiter doch ständig ein! Ich spiele vielleicht 20% aller Partien bis zum Matt (bei den schwachen Geräten ist die Quote entsprechend höher). Wie hoch die Quote bei anderen hier ist, weiß ich nicht.
Zitieren:
Dein Beispiel mit den Kindern trifft mMn den Kern nicht ganz: Wenn sie gute Schachspieler werden wollen, gehört das Erlernen grundlegender Endspielkenntnisse natürlich dazu (wobei ich in meiner Turnierpraxis nie das Vergnügen hatte, meinen Gegner mit Dame gegen seinen nackten König mattzusetzen, mir also es letztendlich gar nichts gebracht hat, es zu lernen! ) Aber einem Schachcomputer kannst du es sooft zeigen, wie du willst; er wird es nie lernen!
Ich wollte mit diesem einfachen Beispiel nur aufzeigen, dass es auch Spieler gibt, die bis zum Matt spielen. Man darf die Geräte nicht immer nur aus Sicht des erfahrenen Turnierspielers sehen. Mit Sicherheit fällt jedem von uns eine Entscheidung im Sport ein, wo Ergebnisse zumindest aus Sicht des Zusehenden nicht gerecht waren. Aber niemand würde je auf die Idee kommen und das Ergebnis einfach abzuschätzen. Zitieren:
Nun wirst du mit Recht sagen, dass bei starken Geräten es ja selbstverständlich sei, ein gewonnenes Endspiel auch zu gewinnen. Aber wo zieht man die Grenze? Ab wann muss man bis zum Matt spielen? Bei 1600 ELO? 1400? Und welche Endspiele sind überhaupt gewonnen?
Ich denke, eine sichere Aussage kann hier niemand treffen, da es viel zu viele Unwägbarkeiten gibt. Bei vielen Geräten wissen wir gar nicht, ob sie bestimmte Endspiele beherrschen (L+S bei Magellan musste ich auch erst testen) oder sie vielleicht in Zeitnot vermurksen! Wo soll man die Grenze ziehen? Keine Ahnung! Ich kann nur sagen, wo ich meine Grenze ziehe. Wieder einmal wird vergessen, dass wir über ein Hobby sprechen. Wenn jemand der Meinung ist, er gibt eine Partie nach 2 Zügen Remis, kann er das gerne tun. Das geht mich nichts an. Wenn jemand der Meinung ist, der Chess Challenger 1 ist für ihn der stärkste Schachcomputer der Welt, kann er das auch gerne behaupten. Darum ging es auch nie. Es ging darum, dass wir eine neue Aktivschach Liste erstellt haben. Ich habe nie behauptet, dass diese Liste zu 100% korrekt ist oder als allgemeingültige Wahrheit anzuerkennen sei. Diese Liste enthält rund 8.000 Partien, die wir in der Community gespielt haben und die Auswertung dieser Partien stellt unsere neue Liste dar. Nicht mehr und nicht weniger. Niemand muss diese Liste akzeptieren, nur was man anerkennen muss, ist die Tatsache, dass diese Liste auf handfesten Fakten beruht. Wenn Wolfgang2 der Meinung ist, diese Liste sei für ihn nicht korrekt, kann er das gerne so äußern, aber im Gegenzug seine geschätzte Liste über alle anderen Meinung zu stellen, das ist für mich nicht akzeptabel. Das bei seiner Einschätzung andere Kriterien mit einfließen ist nachvollziehbar und jedem langjährigen „Schachcomputerbegleiter“ mit Sicherheit ein vertrautes Gefühl. Jeder von uns hat so seine Erfahrungen mit seinen Geräten gesammelt und beurteilt einige Fakten oder Zahlen halt etwas anders. Ich aber bitte einzusehen: „Das Höchste menschlicher Weisheit ist, einzusehen, dass alle Behauptungen nur bedingt und relativ, nur gewissermaßen, nur im allgemeinen, nur unter Umständen wahr sind.“ Gruß, Micha Geändert von Chessguru (24.07.2007 um 17:17 Uhr) |
|
||||||||||||
AW: Neue Aktivschach Elo Liste oder: Denkt doch mal statistisch :)
![]() Ich habe nie behauptet, dass diese Liste zu 100% korrekt ist oder als allgemeingültige Wahrheit anzuerkennen sei. Diese Liste enthält rund 8.000 Partien, die wir in der Community gespielt haben und die Auswertung dieser Partien stellt unsere neue Liste dar. Nicht mehr und nicht weniger.
wahre Worte! Eigentlich wäre es ja fast schon überflüssig, darüber zu reden, denn Du hast ja in der Liste auch Toleranzen angegeben. Wenn ich mich nicht irre, werden die standardmäßig für 67% Sicherheit angegeben?! Das hieße auf gut Deutsch (Achtung Wolfgang2!): Wenn ein Gerät wie z.B. der Excalibur LCD-Chess 16 Partien absolviert hat, liegt die hinter dieser Stichprobe vermutete wahre Spielstärke zu 67% innerhalb der angegebenen Grenzen von +187/-172, d.h. mit einer Wahrscheinlichkeit von 67% ist seine wahre Spielstärke irgendwo innerhalb von 960-1319. Entsprechend könnte er mit einer Wahrscheinlichkeit von 32% auch außerhalb liegen... In diesem Zusammenhang möchte ich nur an den Einstieg des Mephisto Polgar in der SSDF-Liste erinnern, der sogar in der zweiten Liste noch 80 Punkte zu hoch war. Wenn man vermeiden will, daß ein Gerät nach mehr Partien die zunächst angegebenen Toleranzen überschreitet, kann man die Toleranz auch für eine höhere Sicherheit angeben, 95% ist z.B. recht gebräuchlich. Dann wäre unser Beispiel LCD-Chess wahrscheinlich mit +/-300 gelistet, weil man die größere Sicherheit ja nur durch Aufweiten der Grenzen erreicht... Was ich damit sagen will: Diese Liste stellt wirklich nur eine statistische Auswertung unserer gespielten Partien dar. Ob ein Wert einer Elo-Zahl irgendeine Relevanz hat, hängt nur mit der Anzahl der gespielten Parten zusammen. Und noch ein Wort zur subjektiven Einschätzung der Spielstärke: Die hat natürlich ihre Berechtigung, wahrscheinlich nimmt jeder von uns für sich eine solche Einschätzung vor. Man sollte sich jedoch davor hüten, sich vom Eindruck bestimmter Partiephasen blenden zu lassen. Ist ein Gerät, das ein anderes in jeder Partie überspielt, es dann aber im Endspiel nicht mattsetzen kann, wirklich stärker? Die Mittelspielüberlegenheit wird hier ja von einer Endspielunterlegenheit kompensiert. Wer will sagen, was wichtiger ist? Insofern ist das alles doch eher subjektiv geprägt, und man sollte nicht versuchen, eine solche subjektive Einschätzung in Konkurrenz zu einer Elo-Liste zu setzen. Die beiden Sichtweisen ergänzen sich doch ideal! Auf der einen Seite eine reine Zahlensammlung, statistisch sauber aber mit gewissen Schwächen aufgrund des Stichprobencharakters, auf der anderen Seite eine fachlich fundierte subjektive Einschätzung, die sich wirklich mit dem tatsächlichen Spielverhalten auseinandersetzt. Ist doch super!? Noch ein Wort zu Mephisto I/II: Setzt man die lt. Toleranz schlechteste denkbare Zahl des Meph.II in Relation zur besten des Meph.I, dann kommt heraus: MephI.:1229 Meph.II:1340 D.h. es besteht durchaus eine nicht zu kleine Wahrscheinlichkeit, daß Wolfgang2 mit seiner Einschätzung der Liste gar nicht widerspricht! ![]() Viele Grüße, Dirk |
|
|||||||||||
AW: Neue Aktivschach Elo Liste oder: Denkt doch mal statistisch :)
![]() Hallo Micha,
wahre Worte! Eigentlich wäre es ja fast schon überflüssig, darüber zu reden, denn Du hast ja in der Liste auch Toleranzen angegeben. Wenn ich mich nicht irre, werden die standardmäßig für 67% Sicherheit angegeben?! Das hieße auf gut Deutsch (Achtung Wolfgang2!): Wenn ein Gerät wie z.B. der Excalibur LCD-Chess 16 Partien absolviert hat, liegt die hinter dieser Stichprobe vermutete wahre Spielstärke zu 67% innerhalb der angegebenen Grenzen von +187/-172, d.h. mit einer Wahrscheinlichkeit von 67% ist seine wahre Spielstärke irgendwo innerhalb von 960-1319. ![]() Und noch ein Wort zur subjektiven Einschätzung der Spielstärke:
Die hat natürlich ihre Berechtigung, wahrscheinlich nimmt jeder von uns für sich eine solche Einschätzung vor. Man sollte sich jedoch davor hüten, sich vom Eindruck bestimmter Partiephasen blenden zu lassen. Ist ein Gerät, das ein anderes in jeder Partie überspielt, es dann aber im Endspiel nicht mattsetzen kann, wirklich stärker? ![]() Die Mittelspielüberlegenheit wird hier ja von einer Endspielunterlegenheit kompensiert. Wer will sagen, was wichtiger ist?
![]() Insofern ist das alles doch eher subjektiv geprägt, und man sollte nicht versuchen, eine solche subjektive Einschätzung in Konkurrenz zu einer Elo-Liste zu setzen.
![]() Die beiden Sichtweisen ergänzen sich doch ideal! Auf der einen Seite eine reine Zahlensammlung, statistisch sauber aber mit gewissen Schwächen aufgrund des Stichprobencharakters, auf der anderen Seite eine fachlich fundierte subjektive Einschätzung, die sich wirklich mit dem tatsächlichen Spielverhalten auseinandersetzt. Ist doch super!?
Was ich an der Liste bemängle, sind offensichtliche Fehler in der Reihenfolge bei den Altgeräten (CC Sensory 8 viel zu hoch, MKIII ist niemals stärker als Intelligent Chess). Natürlich kann man jetzt mit den statistischen Fehlertoleranzen argumentieren, aber der angegebene Wert bzw. die Reihung sollte schon, zumindest ungefähr, stimmen. Oder man nimmt die Geräte aus der Liste raus... Meine Meinung: Unsicherheiten sind immer drin, natürlich auch bei meiner Bewertung, der auch einige Partien zugrunde liegen. Es läßt sich beispielsweise bestimmt darüber diskutieren ob CC7 um 100 oder 150 Punkte stärker ist als CC10A. Aber gröbere Fehler bzgl. der Reihenfolge hat meine Liste, glaube ich jedenfalls, nicht. ![]() Noch ein Wort zu Mephisto I/II:
Setzt man die lt. Toleranz schlechteste denkbare Zahl des Meph.II in Relation zur besten des Meph.I, dann kommt heraus: MephI.:1229 Meph.II:1340 D.h. es besteht durchaus eine nicht zu kleine Wahrscheinlichkeit, daß Wolfgang2 mit seiner Einschätzung der Liste gar nicht widerspricht! ![]() Viele Grüße, Dirk Bewertet man beides anders, oder läßt Mephisto I bei einem Teil der Partien als Kompromiß auf Stufe 4 spielen (die allerdings etwas zu lang ist), dann bekommt man auf längere Sicht mit Sicherheit die 50-100 Elo-Punkte mehr, die ich für angemessen halte. d.h. aber auch mit anderen Worten: Belässt man es bei Stufe 3, die auf längere Sicht im Schnitt nur ca. 15-20 sec. beansprucht (hatte ich mal überprüft), dann bleibt's natürlich bei der Benachteiligung. Gruß Wolfgang Geändert von Wolfgang2 (25.07.2007 um 01:33 Uhr) |
|
|||||||||||||||||||||||||||||||||
AW: Neue Aktivschach Elo Liste oder: Denkt doch mal statistisch :)
Hallo Dirk,
![]() Die beiden Sichtweisen ergänzen sich doch ideal! Auf der einen Seite eine reine Zahlensammlung, statistisch sauber aber mit gewissen Schwächen aufgrund des Stichprobencharakters, auf der anderen Seite eine fachlich fundierte subjektive Einschätzung, die sich wirklich mit dem tatsächlichen Spielverhalten auseinandersetzt. Ist doch super!?
![]() Und noch ein Wort zur subjektiven Einschätzung der Spielstärke:
Die hat natürlich ihre Berechtigung, wahrscheinlich nimmt jeder von uns für sich eine solche Einschätzung vor. Man sollte sich jedoch davor hüten, sich vom Eindruck bestimmter Partiephasen blenden zu lassen. Bringt einen das weiter? Wie soll man bei verschiedenen Meinungen eine sinnvolle Liste erstellen? ![]() Aber ich schätze, ich kann mich aus dieser Diskussion ausklinken. ![]() Ich nehme auch nicht "die Wahrheit" für meine Liste in Anspruch...
...Aber gröbere Fehler bzgl. der Reihenfolge hat meine Liste, glaube ich jedenfalls, nicht. Gruß, Micha Geändert von Chessguru (25.07.2007 um 18:06 Uhr) |
|
||||||||||||
AW: Neue Aktivschach Elo Liste oder: Denkt doch mal statistisch :)
![]() das sehe ich nicht so. "Auf der einen Seite eine reine Zahlensammlung, statistisch sauber aber mit gewissen Schwächen aufgrund des Stichprobencharakters", auf der anderen eine subjektive Einschätzung. Aber andere Spieler schätzen die Geräte vielleicht völlig anders ein!? Am Ende hat man verschiedene subjektive Meinungen.
das ist doch auch OK?! Wenn es sich bei den Meinungen allerdings um Expertenmeinungen handelt (und davon können wir hier ja ausgehen), dann werden sie nicht ganz widersprüchlich sein. Eine Sache möchte ich allerdings klarstellen, bitte versteht mich hier nicht falsch: Ich würde persönlich nicht so weit gehen, meine subjektive Einschätzung in Form einer Liste oder gar mit Elo-Zahlen auszudrücken. Dafür fehlt wirklich jede Basis. Aber wir haben ja in unserer Liste das Problem (wenn es denn eines ist), daß wir die Einstufungen vieler Geräte nicht hinreichend statistisch untermauern können. Es ist natürlich schön, z.B. den Excalibur LCD-Chess drin zu haben, wir müssen uns nur vor Augen halten, daß wir seine Zahl halt nicht zu wörtlich nehmen dürfen. Wie wörtlich wir eine Zahl nehmen dürfen, steht ja sogar dahinter, komfortabler gehts nicht. Und genau an der Stelle kommt der Mensch (bzw. Wolfgang2) ![]() Wiederum möchte ich als Beispiel für prominente Meßungenauigkeit den Mephisto Polgar in der SSDF-Liste bemühen: Als der in seiner zweiten Liste immer noch auf 2057 (oder so ähnlich) stand, war es eine Binsenweisheit, daß die Zahl um einiges zu hoch war, und in der dritten hatte er auf einmal auch 1980 oder so. Bei manchen anderen Geräten ist das vielleicht nicht so einfach. ![]() Das verstehe ich alles (habe ich oben schon geschrieben), allerdings ist die letzte Aussage (bzw. Einstufung) als solches ziemlich wertlos, da das Intervall von 960-1319 einfach zu groß ist.
Deshalb hätte ich eigentlich keine Lust auf eine derartige Einschränkung: Die Liste hätte weniger Einträge, und die systembedingten Schwierigkeiten wären doch nicht ausgeräumt, allenfalls abgeschwächt. Außerdem sind die Fehlerspannen ja immer vorbildlich dokumentiert, was will man mehr? (Danke Micha übrigens auch von meiner Seite!) Und wenn ich Informationen über ein Gerät suche, dann habe ich doch lieber eine unsichere Zahl als gar keine? Viele Grüße, Dirk |
|
||||||||||||
AW: Neue Aktivschach Elo Liste
Hallo zusammen,
ich habe die Diskussion belustig mitverfolgt. Und nun läuft bei mir mein persönliches Fass langsam über! Ich kann mich meinen Vorschreibern Supergrobi und Chessguru nur voll und ganz anschließen! Die statistische Genauigkeit der Aussage über die Spielstärke steigt mit Anzahl der Partien und Gegner. Trotzdem sollte ja irgendwann mal angefangen werden. Auch ich finde, das eine ungenauere Liste - dafür aber mit mehr Geräten - mehr Sinn und Spaß macht. Schließlich findet man das ein oder andere Unikat. Übrigens: Wir alle könne dazu beitragen, dass die Liste genauer wird, indem wir einfach alle unsere Rechner gegeneinander antreten lassen und diese Ergebinsse auch veröffentlichen. Mathematisch haben wir dann nach uendlich viel Partien eine Liste mit 0% Abweichung. Toll, oder? Also: net kallen - maken! (Wir wir Rheinländer sagen) Gruß Gerald
__________________
London 68030 Genius 68030 Vancouver 68030 Risc II MM V 18MHz |
|
|||||||||||
AW: Neue Aktivschach Elo Liste oder: Denkt doch mal statistisch :)
![]() ...
Eine Sache möchte ich allerdings klarstellen, bitte versteht mich hier nicht falsch: Ich würde persönlich nicht so weit gehen, meine subjektive Einschätzung in Form einer Liste oder gar mit Elo-Zahlen auszudrücken. Dafür fehlt wirklich jede Basis. ... Viele Grüße, Dirk ![]() ...
Kann mir einer auch nur ansatzweise erklären, wie man auf die genannten Werte kommt? Warum soll ein Mephisto I 1280 Elo haben? Weil Wolfgang2 es sagt? Sind es nicht vielleicht 1252? Oder 1203, oder 1187, oder doch 1301? Mephisto I hat auf jeden Fall eine "spürbaren" Abstand zu "Intelligent Chess" und alles andere was danach kommt. Die Relation muß auf jeden Fall gewahrt bleiben. Wenn du Mephisto I abwerten willst, mußt Du das bei den Geräten dahinter auch tun. ![]() ...
Wiederum möchte ich als Beispiel für prominente Meßungenauigkeit den Mephisto Polgar in der SSDF-Liste bemühen: Als der in seiner zweiten Liste immer noch auf 2057 (oder so ähnlich) stand, war es eine Binsenweisheit, daß die Zahl um einiges zu hoch war, und in der dritten hatte er auf einmal auch 1980 oder so. Gruß Wolfgang |
|
|||||||||||
AW: Neue Aktivschach Elo Liste
![]() Die statistische Genauigkeit der Aussage über die Spielstärke steigt mit Anzahl der Partien und Gegner.
Trotzdem sollte ja irgendwann mal angefangen werden. Auch ich finde, das eine ungenauere Liste - dafür aber mit mehr Geräten - mehr Sinn und Spaß macht. Schließlich findet man das ein oder andere Unikat. Übrigens: Wir alle könne dazu beitragen, dass die Liste genauer wird, indem wir einfach alle unsere Rechner gegeneinander antreten lassen und diese Ergebinsse auch veröffentlichen. Mathematisch haben wir dann nach uendlich viel Partien eine Liste mit 0% Abweichung. Toll, oder? Du hast z.B. bei den Fidelity-Geräten das Problem mit der Rechenzeit: Spielst Du gegen CC7, CC10... auf Stufe 2, antwortet der Rechner normalerweise in 5-10 Sekunden (im Endspiel unter 5 Selkunden), je nach Komplexität. Setzt Du Stufe 3 an, dann hast Du de facto eine "Turnierstufen"-Partie, sobald die Position etwas komplizierter wird. Und im Endspiel: Damit de Computer wenigstens ein paar Sekunden rechnet, mußt Du dann auf Stufe 4 oder 5 einstellen. Wer soll das alles reglementieren ? Guß Wolfgang |
![]() |
|
|
![]() |
||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Review: Neue Aktivschach Elo Liste 1-2008 | spacious_mind | Teststellungen und Elo Listen / Test positions and Elo lists | 17 | 07.05.2008 19:35 |
Neue Aktivschach Elo Liste | Chessguru | Teststellungen und Elo Listen / Test positions and Elo lists | 9 | 10.07.2007 21:45 |