|
||||||||||||
AW: Mm5 nur 1575 ELO ??
Es gibt ja auch noch verschiedene Stellungstest, wie z.B. den BT test die ja auch einen Anhaltspunkt zur Spielstärke liefern.
|
Folgender Benutzer sagt Danke zu Egbert für den nützlichen Beitrag: | ||
RetroComp (28.06.2017) |
|
||||||||||||
AW: Mm5 nur 1575 ELO ??
Hallo Egbert,
danke. Ich habe die Frage ja nicht umsonst gestellt. Warum erstelle ich diese Listen noch immer? Für mich? Wohl kaum. Die Nummer könnte ich auch viel einfacher und mit deutlich weniger Aufwand betreiben. Die Listen erstelle ich hauptsächlich nur noch für unsere Community. Sollte also die Mehrheit der Community z.B. eine Angleichung an die SSDF wünschen, wäre es ein leichtes die Listen anzupassen. Daher die Nachfrage. Für mich kommen eigentlich nur 2 Varianten in Frage. Variante 1: Startwert der alten SSDF Liste vor der Abwertung Variante 2: Startwert der neuen SSDF nach der Abwertung Schließlich handelt es sich hauptsächlich um Partien von Mitgliedern aus dieser Community. Daher versuche ich eine Mehrheit zu ergründen. Ist aber immer etwas schwierig, da wenig Feedback kommt. Kritik ist immer willkommen, nur ich möchte dann aber auch Lösungsvorschläge lesen, die uns in der Angelegenheit weiterbringen. Diese sollten aber von Schachspielern stammen und nicht von Statistikern, die sich für Schachspieler halten. Gruß Micha |
|
||||
AW: Mm5 nur 1575 ELO ??
Hallo Egbert,
danke. Ich habe die Frage ja nicht umsonst gestellt. Warum erstelle ich diese Listen noch immer? Für mich? Wohl kaum. Die Nummer könnte ich auch viel einfacher und mit deutlich weniger Aufwand betreiben. Die Listen erstelle ich hauptsächlich nur noch für unsere Community. Sollte also die Mehrheit der Community z.B. eine Angleichung an die SSDF wünschen, wäre es ein leichtes die Listen anzupassen. Daher die Nachfrage. Für mich kommen eigentlich nur 2 Varianten in Frage. Variante 1: Startwert der alten SSDF Liste vor der Abwertung Variante 2: Startwert der neuen SSDF nach der Abwertung Schließlich handelt es sich hauptsächlich um Partien von Mitgliedern aus dieser Community. Daher versuche ich eine Mehrheit zu ergründen. Ist aber immer etwas schwierig, da wenig Feedback kommt. Kritik ist immer willkommen, nur ich möchte dann aber auch Lösungsvorschläge lesen, die uns in der Angelegenheit weiterbringen. Diese sollten aber von Schachspielern stammen und nicht von Statistikern, die sich für Schachspieler halten. Gruß Micha Gruß Egbert |
Folgender Benutzer sagt Danke zu Egbert für den nützlichen Beitrag: | ||
Fluppio (28.06.2017) |
|
|||||||||||
AW: Mm5 nur 1575 ELO ??
Für mich kommen eigentlich nur 2 Varianten in Frage.
Variante 1: Startwert der alten SSDF Liste vor der Abwertung Variante 2: Startwert der neuen SSDF nach der Abwertung Schließlich handelt es sich hauptsächlich um Partien von Mitgliedern aus dieser Community. Daher versuche ich eine Mehrheit zu ergründen. Ist aber immer etwas schwierig, da wenig Feedback kommt. Kritik ist immer willkommen, nur ich möchte dann aber auch Lösungsvorschläge lesen, die uns in der Angelegenheit weiterbringen. Diese sollten aber von Schachspielern stammen und nicht von Statistikern, die sich für Schachspieler halten. Gruß Micha Kann man ein paar Geräte als Referenz angeben? Ist es daher möglich mit zB 10 Geräten und zB 100 Partien Menschen - Computer diese 10 Geräte als Referenz der Berechnung zu definieren? Gruß Karl |
|
||||||||||||
AW: Mm5 nur 1575 ELO ??
Mit den 100 Punkten Abzug der SSDF kann ich ja noch leben, aber die Nummer im CSS-Forum ist an Blödsinn nicht zu überbieten. Wir hatten das Thema ja gerade, s.h. Postings zuvor. Zitieren:
Nur: damals wurden noch regelmäßig Abgleiche mit menschlichen Elo durch
Turniere erspielt. Heute spielen die Programme nur noch automatisiert gegeneinander. Da würde ich mal eher die Vermutung äußern das mangels Abgleich die heutigen zahlen "falsch" sind. Damals gab es ständig Abgleiche. Porzer Open, Aegon Turnier, in schachvereinen, in Wohnzimmern bei Privatleuten zuhause. Da wäre doch schon aufgefallen das ein Gerät 300 elo schwächer ist .... oder ? Ich weiß ja nicht, was einige Leute so für Schachklubs besucht haben. Also die Spieler, die ich im Laufe der Jahre in den Schachklubs, Turnieren oder Ligaspielen mit z.B. 1500-2100 Elo kennengelernt habe, die spielten jedenfalls nicht alle Geräte oder Schachprogramme in Grund und Boden. Seltsamerweise machten die auch genügend Fehler in ihren Partien. Sorry, aber 350 Elo für alle Geräte zu hoch ist schlicht und ergreifend lächerlich. Gruß Micha |
Folgende 8 Benutzer sagen Danke zu Chessguru für den nützlichen Beitrag: | ||
Egbert (28.06.2017), Hartmut (28.06.2017), Mapi (28.06.2017), Mythbuster (28.06.2017), Oberstratege (28.06.2017), RetroComp (28.06.2017), Robert (28.06.2017), Thomas J (28.06.2017) |
|
|||||||||||
AW: Mm5 nur 1575 ELO ??
Ich bin für "Variante 2", schon alleine deswegen, damit der aktuelle, SSDF-Wert als Anhaltspunkt dienen kann für Geräte, die noch nicht in der Wiki gelistet sind.
Dieses Argument ist zwar nicht zwingend, da nach der Abwertung bei der SSDF mit den alten Brettgeräten nur noch wenig gespielt wurde. Aber dennoch ist mir der aktuelle Maßstab wichtiger. Gruß Wolfgang P.S. Micha, ich erinnere mich noch dunkel daran, dass Du hier im forum mal drei - nach verschiedenen Algorithmen berechnete - Listen vorgestellt hast. So weit ich mich erinnere, hat es immer irgend wo gehakt. Entweder waren die starken Geräte zu hoch bewertet, oder die schwachen zu niedrig. Die Grundproblematik bei dem Thema ist m.E., dass es bei Wettkämpfen ähnlich spielender Geräte oftmals zu klare Ergebnisse gibt, weil Kleinigkeiten am Ende zugunsten des (etwas) Stärkeren entscheiden. Dadurch erfährt die Liste eine zu starke Spreizung. |
|
||||||||||||
AW: Mm5 nur 1575 ELO ??
Hallo Egbert,
danke. Ich habe die Frage ja nicht umsonst gestellt. Warum erstelle ich diese Listen noch immer? Für mich? Wohl kaum. Die Nummer könnte ich auch viel einfacher und mit deutlich weniger Aufwand betreiben. Die Listen erstelle ich hauptsächlich nur noch für unsere Community. Sollte also die Mehrheit der Community z.B. eine Angleichung an die SSDF wünschen, wäre es ein leichtes die Listen anzupassen. Daher die Nachfrage. Für mich kommen eigentlich nur 2 Varianten in Frage. Variante 1: Startwert der alten SSDF Liste vor der Abwertung Variante 2: Startwert der neuen SSDF nach der Abwertung Schließlich handelt es sich hauptsächlich um Partien von Mitgliedern aus dieser Community. Daher versuche ich eine Mehrheit zu ergründen. Ist aber immer etwas schwierig, da wenig Feedback kommt. Kritik ist immer willkommen, nur ich möchte dann aber auch Lösungsvorschläge lesen, die uns in der Angelegenheit weiterbringen. Diese sollten aber von Schachspielern stammen und nicht von Statistikern, die sich für Schachspieler halten. Gruß Micha Hi Micha, eine Lösung habe ich keine parat. Die Ergebnisse und Berechnungen liegen ja vor. Es geht mir so wie Egbert mit der Liste, bei den schwächeren Geräten habe ich den Eindruck es passt gut, bei den Compis ca. Ü2000 liegen sie mir gefühlt zu hoch. Starke Taktiker wie von Morsch und auch die neuen Lang-Millenniums fegen halt Oldies gnadenlos weg und erzielen dadurch hohe ELO-Werte, die sie mE gegen Menschen nicht erzielen würden. Gruß Peter
__________________
http://chess-computer.blogspot.com/ |
Folgende 4 Benutzer sagen Danke zu Fluppio für den nützlichen Beitrag: | ||
|
||||||||||||
AW: Mm5 nur 1575 ELO ??
Hallo Karl,
Ich benutze für die Berechnung der Elo Listen das Programm EloStat. Ich weiß, ist nicht die beste Lösung. Der Grund ist, wie schon erwähnt, Vergleichbarkeit mit der SSDF. Deren damals benutztes Rating Programm basierte auf dem gleichen Algorithmus. P.S. Micha, ich erinnere mich noch dunkel daran, dass Du hier im forum mal drei - nach verschiedenen Algorithmen berechnete - Listen vorgestellt hast.
So weit ich mich erinnere, hat es immer irgend wo gehakt. Entweder waren die starken Geräte zu hoch bewertet, oder die schwachen zu niedrig. und im Vergleich bzw. Tests mit EloStat im Vergleich zu Bayeselo und Ordo: Zitieren:
Kann man ein paar Geräte als Referenz angeben?
Ist es daher möglich mit zB 10 Geräten und zB 100 Partien Menschen - Computer diese 10 Geräte als Referenz der Berechnung zu definieren? Da haben wir vielleicht bisher aneinander vorbei geredet. Du bist vermutlich davon ausgegangen, dass man entsprechende Gewichtungen einzelner Geräte vornehmen kann, richtig? Ich versuche mal eine einfache Erklärung des Elo Systems. Bei der Berechnung einer Elo Zahl geht man von folgender Hypothese aus. Die Verteilung der Spielstärke in der Gesamtheit der Spieler entspricht mathematisch der Gaußschen Glockenkurve (Wahrscheinlichkeitstheorie). Nach dieser Hypothese lässt sich für 2 Gegner statistisch voraussagen, mit welcher Wahrscheinlichkeit der eine Spieler gewinnen müsste (s.h. https://www.schachcomputer.info/html...erwartung.html). Somit kann man bei vielen Partien oder einem Turnier anhand der Wertungszahlen eines Spielers und des Durchschnitts der Wertungszahlen seiner Gegner voraussagen, wie viele Punkte er theoretisch erreichen wird. Wenn die Partien/Turniere gespielt sind, kann man so das erreichte Ergebnis mit dem statistisch Erreichbaren vergleichen und aus der Abweichung die neue Wertungs- oder Elo-Zahl berechnen. Wie das geht, kannst du auch auf unseren Seiten nachlesen. Schachcomputer haben eine gleichbleibende Spielstärke, dass ist der entscheidende Unterschied! Weiterhin betrachten wir alle Partien als ein Ganzes! Somit können wir auf das Programm EloStat zurückgreifen. Ich zitiere mal aus der Anleitung von EloStat, da Frank Schubert es aus meiner Sicht sehr anschaulich erläutert hat. "ELOStat verwendet das Iterationsverfahren nach Thompson. Bei diesem Verfahren wird allen Programmen zu Beginn der gleiche Elostartwert zugeordnet (evtl. im PGN-Header angegebene Elozahlen bleiben also unberücksichtigt!). Danach wird die gesamte Datenbank wie ein einziges großes Turnier behandelt und elomäßig ausgewertet. Die somit ermittelten Elozahlen werden anschließend den Programmen zugewiesen, d.h. sie ersetzen den anfänglichen Elostartwert. Mit den nunmehr aktualisierten Elozahlen wird erneut eine Datenbankauswertung gestartet. Dieses Vorgehen wird solange wiederholt, bis die Elozahlen aller Programme nahezu konstant bleiben (man sagt, die Elozahlen konvergieren gegen einen bestimmten Grenzwert). Der Elostartwert hat keinen Einfluss auf die relativen Spielstärkeunterschiede der Programme, d.h. der Eloabstand zwischen den Programmen ist unabhängig vom Startwert." "Die Leistungsfähigkeit des oben beschriebenen Iterationsalgorithmus beruht u.a. darauf, dass zwischen zwei Programmen A und C ein indirekter Spielstärkebezug hergestellt werden kann, selbst wenn A und C nie direkt gegeneinander gespielt haben. Hat z.B. das Programm A mehrere Partien gegen B gespielt und B wiederum einige Partien gegen C, so reicht dies aus, um die Elozahlen aller drei beteiligten Programme im Sinne des Iterationsverfahrens konvergieren zu lassen. A, B, und C bilden somit einen zusammenhängenden Cluster. Die im Beispiel behandelte Datenbank ‘wb_elo.pgn’ besteht aus einem einzelnen Cluster, d.h. geht man von einem beliebigen Programm aus, so lässt sich zu JEDEM anderen Programm der Datenbank ein Spielstärkebezug im obigen Sinne ableiten. Jede gute Datenbank sollte daher aus einem einzelnen Programmcluster bestehen und somit unfragmentiert sein (im Idealfall hat jeder gegen jeden gespielt). Spielt man allerdings mit zahlreichen Programmen, so kann es passieren, daß die Datenbank unbemerkt fragmentiert, d.h. in einzelne unabhängige Cluster zerfällt, zwischen denen kein Spielstärkebezug mehr existiert. Dieser Fall tritt z.B. dann ein, wenn man zu den Programmen A,B,C drei weitere Programme D,E,F, hinzufügen würde, die zwar jeweils unmittelbar gegeneinander spielen (also etwa D-E, D-F, E-F), aber keine einzige Partie gegen die anderen Programme austragen. In diesem Fall handelt es sich streng genommen nicht um eine einzige, sondern um zwei voneinander unabhängige Datenbestände. Bei der Eloberechnung laufen somit zwei ebenfalls unabhängige Iterationsverfahren ab und die ermittelten Elozahlen in beiden Clustern haben keinen Bezug mehr zueinander. ELOStat erkennt solche fragmentierten Datenbanken und zeigt in der Datei ‘cluster.dat’ die einzelnen Programme sowie die Anzahl der gespielten Partien je Cluster an." "In der Datei ‘cluster.dat’ wird zusätzlich der Wert des sog. Iterationsoffsets angegeben. Hierbei handelt es sich um eine Eigenart des Iterationsverfahrens, die für praktische Zwecke meist ohne Belang ist. Sie sei hier trotzdem kurz erläutert: Um die Konvergenz des Iterationsverfahrens sicherzustellen, muss gewährleistet sein, dass der mit der Anzahl der gespielten Partien je Programm gewichtete Mittelwert aller Elozahlen nach jedem Iterationsschritt exakt gleich dem Elostartwert ist. Aufgrund des nichtlinearen Zusammenhangs zwischen der relativen Performance eines Programms (in Prozent) und seiner Elozahl (genauer Elodifferenz) kommt es zu einem konstanten Offset, der bei jedem Iterationsschritt hinzuaddiert werden muß, um die oben erwähnte Konstanz des Elomittelwerts sicherzustellen. Dieser Offset führt in der Rangliste dazu, dass sich der angegebene Wert für Av.Op. von dem tatsächlichen Wert, den man aus den Elomittelwerten der ersten Spalte erhält, um genau diesen Wert ‘itoffset’ voneinander unterscheidet. Anders ausgedrückt fällt der Elowert eines Programms in der Rangliste immer um genau itoffset größer aus, als es aufgrund seiner Performance und seines Av.Op.-Wertes zu erwarten wäre. Dieser systematische Offset betrifft aber jedes in der Rangliste aufgeführte Programm gleichermaßen, so daß die Eloabstände zwischen den Programmen und somit die relativen Spielstärken davon unbeeinflußt bleiben. Der Wert von itoffset ist in den meisten Fällen kleiner als 1 Elopunkt (s.o.), kann in Sonderfällen aber durchaus auch mehr als 50 Elopunkte betragen." "Der Elowert eines Zweikampfergebnisses von 100 % bzw. 0 % bleibt nach der Theorie zwangsläufig unbestimmt. Aus rechentechnischen Gründen (u.a. um die korrekte Durchführung des Iterationsverfahrens in den Programmmodi 1 und 2 sicherzustellen) wird den beteiligten Programmen trotzdem eine endliche Elozahl zugewiesen, die um 600 Punkte oberhalb bzw. unterhalb des Av.Op. Elowertes liegt. Mit anderen Worten: ELOStat berücksichtigt keine Elounterschiede, die größer als ± 600 Punkte sind (die 95%-Fehlergrenzen können daher maximal ± 1200 Elopunkte betragen). Für alle praktisch relevanten Datenbanken spielen diese Sonderfälle aber im Grunde keine Rolle." Jetzt bitte genau lesen, denn dieser Punkt ist wichtig. "Das Iterationsverfahren setzt zwingend voraus, dass die mittlere Spielstärke eines Programms in jeder Partie dieselbe bleibt. Diese Näherung ist für Schachprograme derzeit sicherlich gut erfüllt, sofern kein extensives Buchlernen gegen ein und denselben Gegner erfolgt (andere Lernalgorithmen spielen meiner Erfahrung nach in der Praxis derzeit keine wesentliche Rolle). Für menschliche Datenbanken ist dieses Vorgehen aber problematisch, da menschliche Spieler sich im Laufe der Zeit deutlich steigern können (um Hunderte von Elopunkten), so dass die mittlere Spielstärke in der Regel von Partie zu Partie zunimmt. Die Auswertung historischer Datenbanken mit dem Iterationsverfahren stellt daher zwar eine äußerst reizvolle Sache dar, hat aber aus obigen Gründen nur eine bedingte Aussagekraft. Bei menschlichen Spielern sollte daher nach Möglichkeit des Elosystem der FIDE verwendet werden." Bei neueren Programmen zur Berechnung, finden weitere Kriterien Einzug. Kann man auf den entsprechenden Seiten nachlesen, z.B. Gewichtung von Remisen, Weiß und Schwarz, tralala. Das Problem bleibt aber bestehen. Besonders bei unseren sehr schwachen Geräten. Unten wird die Nummer zu dünn und oben zu dick - s.h. Beispiele. Lösung? Keine! Und da hilft es auch nichts, etwas von 350 Elo in den Wald zu brüllen. Gruß Micha Geändert von Chessguru (28.06.2017 um 17:45 Uhr) |
Folgende 3 Benutzer sagen Danke zu Chessguru für den nützlichen Beitrag: | ||
|
||||||||||||
AW: Mm5 nur 1575 ELO ??
Ganz klar Variante 1: Diese Werte basierten noch auf echten Partien gegen Menschen, die keine "Anti Computer Strategien" genutzt haben und unbefangen gespielt haben.
Ich weiß noch, als ich damals aktiv Liga im Verein gespielt habe, haben Spieler mit "echten" (was auch immer das sein soll) Elo 2000 bis 2100 reihenweise gegen Almeria, Portorose und getunte MM IV verloren ... ist aber auch egal. Ehrlich gesagt empfinde ich die Diskussion als müßig ... unsere Liste hat sich seit vielen Jahren bewährt und wenn man sie als das versteht, was sie ist, ist sie sogar ein recht guter Gradmesser im Vergleich zur eigenen Spielstärke. Wenn hier Leute schreiben, sie hätten 1800 Elo und würden gegen 2200er Kisten immer locker punkten, dann dazu nur zwei Anmerkungen: Einerseits ist es schon ein erheblicher Unterschied, ob man gegen einen (Computer-) Gegner spielt, den man in- und auswendig kennt ... oder gegen einen Unbekannten. Zudem habe ich so meine Zweifel, dass diese Spieler sich immer streng an die Regeln halten, sprich, bei 30 Sekunden pro Zug nie überziehen, keine Vorschau auf erwartete Züge oder den Rechenvorgang, keine Zurücknahme etc. pp. ... Mal ehrlich, ich denke, ich bin kein ganz schlechter Spieler, auf dem ChessBase Server habe ich im Spiel gegen Menschen bei 30 Minuten pro Spiel aktuell eine Wertung von knapp 2200 Elo ... aber ich hole nicht einen Sieg nach dem anderen gegen Vancouver, R30 und Co ... Zum CSS Forum: Wer Frank Q. kennt, weiß, wie er die seitenlangen Ausführungen zu deuten hat. Und zu "Tom Paul", dem Spieler, der selbst auf schnellster Hardware Stockfish schlägt, aber eine öffentliche Partie gegen mich mit 100,- Euro Wetteinsatz abgelehnt hat, schreibe ich nichts mehr ... Das ist mein Senf zu dem Thema.
__________________
This post may not be reproduced without prior written permission. Copyright (c) 1967-2024. All rights reserved to make me feel special. :-) Geändert von Mythbuster (28.06.2017 um 17:57 Uhr) |
|
|