|
|||||||||||
AW: Im Fadenkreuz
![]() O.K. da ist mir ein Fehler unterlaufen (habe es korrigiert), aber deswegen zitierst Du jetzt gar nicht mehr?
![]() ![]() kosakenzipfel |
|
||||||||||||
AW: ELO-Liste 02-2004
![]() Nichts für ungut, aber für ein "bisschen" Information kann ich auch bei den Schweden nachschauen.
So langsam fehlt mir auch das Verständnis. Seit zwei Tagen versuchen wir dir das Prinzip unserer Liste zu erläutern. Ich habe dir zwei wirklich ausführliche Postings zukommen lassen. In beiden Postings ist unsere Vorgehensweise ausführlich erläutert. Daher muss ich dich fragen, ob du das Prinzip wirklich verstanden hast? Wenn du mit unserer Berechnungsmethode nicht einverstanden bist, ist das dein gutes Recht. Niemand zwingt dich, unsere Liste zu akzeptieren. Da du aber Kritik geäußert hast, stehst du sehr wohl in der Beweispflicht. Dieser Beweis sollte aber eine genaue Berechnungsmethode darstellen und nicht nur Ideen oder Ansätze. Ich stelle dir gern unsere bisherigen Partien zur Verfügung, damit du eine genauere oder korrekte Liste erstellen kannst. Zitieren:
Schließlich kann man über unkorrekte Zahlen ja auch wunderbar diskutieren (wie man hier sieht!)
Deine erste Aussage ![]() Ich schrieb: „Das Elo-stärkere Gerät sammelt trotzdem Punkte an. Das mögen vielleicht nur 1 oder 2 Punkte sein. Über 20/30 solcher Partien sind das aber auch 30 Punkte Und das macht im Vergleich mit benachbarten Geräten in der Spitze, wo die Differenzen klein und die Luft dünn wird, eben deutliche Unterschiede in der Platzierung aus. Ein Effekt, wenn man neutral, oder ein „Verfahren“, wenn man unfreundlich sein will, was leider in der SSDF schon zu sehen war.“
Dazu Zitat von CHESSGURU "Damit unterstellst du uns, dass wir nach dem gleichen Prinzip wie die SSDF ´arbeiten´ und so eventuell Geräte bevorteilen. ..." Definitiv nicht. Ich schrieb „schon“ nicht „auch“. Damit ist die Gefahr und nicht der Willen zu einem methodischen Fehler gemeint. Begründung lt. Duden (s.h. 3 b): 3. a) (in Verbindung mit einer Angabe, seit wann etw. existiert, bekannt ist, gemacht wird) betont, dass etw. keine neue Erscheinung, kein neuer Zustand, Vorgang ist, sondern lange zuvor entstanden ist: s. Platon hat diese Ideen vertreten; s. bei Platon ...; s. als Kinder/als Kinder s. hatten wir eine Vorliebe für sie; dieses System hat sich s. früh, längst, immer bewährt; b) drückt aus, dass eine Erscheinung, ein Ereignis, Vorgang nicht zum ersten Mal stattfindet, sondern zu einem früheren Zeitpunkt in vergleichbarer Weise stattgefunden hat: ich kenne das s.; wie s. gesagt, ...; er hat, wie s. so oft, versagt; vorhin s. wollte ich gehen; das hatten wir s. einmal. Zitieren:
Deine Antwort: "Definitiv nicht. Ich schrieb "schon" nicht "auch". Damit ist
die Gefahr und nicht der Willen zu einem methodischen Fehler gemeint." Wieder falsch. Gefahr meint die Möglichkeit, dass jemandem z.B. etwas zustößt. Du redest aber in der Vergangenheitsform ("schon zu sehen war" - es ist also passiert) über einen bereits eingetretenen Zustand. Somit ist es sehr wohl eine Unterstellung. ![]() Auf diese Diskussionen würde ich gerne verzichten, um beim Wesentlichen zu bleiben.
Wir haben zur Kenntnis genommen, dass du mit dieser Liste nicht einverstanden bist, ist ja auch ok. Also wenn du eine bessere Berechnungsmethode vorlegen kannst, nur zu. Ansonsten möchte ich auch zum Wesentlichen zurückkehren. Gruß, Micha |
|
|||||||||||
AW: ELO-Liste 02-2004
1. Das Zitat "Schließlich kann man über unkorrekte Zahlen ja auch wunderbar diskutieren (wie man hier sieht!)" stammt von Robert (Posting Nr. 26) nicht von mir.
Wie du sehen kannst, hat die Einrahmung der Zitate in meiner Antwort nicht funktioniert. Aus dem Ablauf meines Postings kannst du aber erkennen, das die ungeraden Sätze von Robert stammen und die geraden meine Antwort darauf sind. 2. Auf dieses Zitat (siehe1.) habe ich dann geantwortet: "Auf diese Diskussionen würde ich gerne verzichten, um beim Wesentlichen zu bleiben." 3. Zitat Duden " 3b) drückt aus, dass eine Erscheinung, ein Ereignis, Vorgang nicht zum ersten Mal stattfindet, sondern zu einem früheren Zeitpunkt in vergleichbarer Weise stattgefunden hat: ..." Natürlich in der Vergangenheit, schließlich ist es bei der SSDF(!!!) in der Vergangenheit passiert; (Mein Zitat" was leider in der SSDF schon zu sehen war.“) 4. Zitat CHESSGURU "Da du aber Kritik geäußert hast, stehst du sehr wohl in der Beweispflicht. Dieser Beweis sollte aber eine genaue Berechnungsmethode darstellen und nicht nur Ideen oder Ansätze." Wie aus meiner Beschreibung des FADEKREUZ klar hervorgeht, ist es eine Methode Geräte zu paaren und KEINE Berechnungsmethode. Daher muss ich auch keine Berechnungsmethode beweisen. Das Punktesammeln ging von der normalen Elo-Formel aus. Du hast klargestellt, das der Effekt bei ELOStat nicht auftritt. Auf deine Anfrage "Welchen verzerrenden Effekt meinst Du?" sagte ich: "Das Punktesammeln der Starken. Wenn das mit eurer Formel ausgeschlossen wird. Ok." (!!!) Damit war(!) der Punkt schon erledigt. 5. Zitat CHESSGURU "Wir haben zur Kenntnis genommen, dass du mit dieser Liste nicht einverstanden bist, ist ja auch ok." Ich habe nicht behauptet, mit der Liste in dieser Form nicht einverstanden zu sein. Ich hätte einige Turnierpaarungen nicht hineingenommen und gesagt warum. Ihr habt euch dafür entschieden und dargelegt, dass eure Auswertung das kompensiert. Und damit ist die Sache erledigt. 6. Ich habe vorgeschlagen für folgende Geräte Aktiv-Partien durchführen zu können: Mephisto: SuMoII; MMII+HG240; MMIV+HG440; Academy; RomaII Saitek: Travel Champion; Centurion Novag: Super VIP; Sapphire Wenn ihr sie einbauen wollt, lasst es mich wissen. Gruß Kosakenzipfel |
|
||||||||||||
AW: ELO-Liste 02-2004
Hallo zusammen,
bis auf ein paar kleine Missverständnisse scheint ja alles ausgeräumt zu sein, wenn ich nicht irre. Ist doch schonmal schön. ![]() ![]() Es geht nicht um die Spielstärke, sondern um die Abstände der Geräte untereinander. Anhand dieser Abstände können dann Elo Zahlen erzeugt werden.
![]() Grundsätzlich ist nur eine Näherung möglich. Die Frage ist jetzt nur, wie kommen wir dieser Zahl am Nächsten?
... Wie gesagt, wir gehen davon aus, dass ein Schachcomputer eine feste "Spielstärke" hat. ![]() Vielmehr meinte ich folgendes: Die realen Gewinnerwartungen z.B. eines R30 entsprechen u.U. unterschiedlichen Elozahlen, je nach Gegner-Gerät. Nehmen wir an, der Sparc und der MMII haben innerhalb eines Clusters schon ihre Elo-Zahlen erhalten (etwa wie in Deinem Beispiel der Vancouver und der Elite Privat) und es kommt nun der R30 hinzu. Dann ist es möglich (oder sogar wahrscheinlich), dass die Partien des R30 gegen den Sparc alleine jetzt vielleicht einer Gewinnerwartung eines 2400er entsprechen würden, gegen den MMII alleine aber eher eines 2330er, weil dieser deutlich schwächer ist und trotzdem noch (aus Zähigkeitsgründen oder warum auch immer) noch z.B. 10% holt. D.h. es gibt so gesehen in Wahrheit keine einzelne Zahl, eine "feste abstrakte Spielstärke", der man sich annähern kann und dazu nur ein hinreichend gutes Verfahren braucht. Eine einzelne Zahl kann offenbar nicht gleichzeitig vorhersagen wie der R30 gegen den Sparc und wie er gegen den MMII im Duell abscheidet. Ebenso würden sich die Zahlen der beiden (Sparc und MMII) nach der Hinzunahme des R30 verändern müssen und damit i. Allg. auch die Differenz ihrer Elo-Zahlen. Die Frage ist also bestenfalls wie man aus der besagten Situation trotzdem die verschiedenen 'wahren' einzelnen Duell-Elo-Zahlen am besten in eine Gesamt-Zahl gießen kann, ohne zu viel an Vorhersagekraft zu verlieren. Dazu könnte man z.B. die Meinung vertreten, dass im Grunde die Gewinnerwartung gegen den MMII nicht wirklich interessiert und in der Berechnung weggelassen werden sollte, weil sie den R30 unfair benachteiligt und er ohnehin klar besser ist oder die 10% nur vernachlässigbare Ausreißer sind. Man kann aber auch der Auffassung sein, dass beide Gewinnerwartungen sich trotzdem in einer ELO-Zahl niederschlagen müssten (solange die Anzahl der Partien des R30 über alle Gegner-Spielstärken halbwegs gleichmäßig verteilt ist und nicht etwa 100 Partien gegen den MMII in die Berechnung eingehen und nur 2 gegen den Sparc, aber das ist ja klar). Ich persönlich teile, wie schon angedeutet - offenbar ähnlich wie ihr - diese zweite Meinung. ![]() ![]() wie verändern sich die Elo-Zahlen der beiden Geräte nach 100 Partien? Wie viel gewinnt und verliert ein Gerät und warum?
Anders sieht's aus, wenn man ein drittes Gerät hinzunimmt - wie oben ausgeführt. Obwohl ich den größten Teil schon letzte Nacht geschrieben habe, hoffe ich dass das alles kein allzu wirres Gebrabbel ist, sondern halbwegs nachvollziehbar... ![]() Viele Grüße, Martin |
|
||||||||||||
AW: ELO-Liste 02-2004
![]() 6. Ich habe vorgeschlagen für folgende Geräte Aktiv-Partien durchführen zu können: Mephisto: SuMoII; MMII+HG240; MMIV+HG440; Academy; RomaII Saitek: Travel Champion; Centurion Novag: Super VIP; Sapphire Wenn ihr sie einbauen wollt, lasst es mich wissen. Gruß Kosakenzipfel das hören wir gerne und Deine Sammlung ist sehr interessant. Allerdings liegt im Moment noch die große Aufgabe vor uns das Partiematerial für Aktivschach zu sichten. Insofern hast Du bei der Paarungszusammenstellung noch freie Auswahl... ![]() Danke aber schon einmal vorab für Deine Unterstützung/Bereitschaft, davon leben schließlich alle hier! Gruß Stefan |
|
||||||||||||
AW: ELO-Liste 02-2004
Hallo Martin,
![]() Darauf wollte ich doch hinaus: Die abstrakte Größe 'Spielstärke' ist eben nur als eine Gewinnerwartungsgröße zwischen je zwei Geräten sinnvoll.
![]() Vielmehr meinte ich folgendes: Die realen Gewinnerwartungen z.B. eines R30 entsprechen u.U. unterschiedlichen Elozahlen, je nach Gegner-Gerät. Nehmen wir an, der Sparc und der MMII haben innerhalb eines Clusters schon ihre Elo-Zahlen erhalten (etwa wie in Deinem Beispiel der Vancouver und der Elite Privat) und es kommt nun der R30 hinzu. Dann ist es möglich (oder sogar wahrscheinlich), dass die Partien des R30 gegen den Sparc alleine jetzt vielleicht einer Gewinnerwartung eines 2400er entsprechen würden, gegen den MMII alleine aber eher eines 2330er, weil dieser deutlich schwächer ist und trotzdem noch (aus Zähigkeitsgründen oder warum auch immer) noch z.B. 10% holt.
Ja, genau. Kein Einspruch, dem kann ich wiederum nur zustimmen. ![]() D.h. es gibt so gesehen in Wahrheit keine einzelne Zahl, eine "feste abstrakte Spielstärke", der man sich annähern kann und dazu nur ein hinreichend gutes Verfahren braucht. Eine einzelne Zahl kann offenbar nicht gleichzeitig vorhersagen wie der R30 gegen den Sparc und wie er gegen den MMII im Duell abscheidet. Ebenso würden sich die Zahlen der beiden (Sparc und MMII) nach der Hinzunahme des R30 verändern müssen und damit i. Allg. auch die Differenz ihrer Elo-Zahlen. Die Frage ist also bestenfalls wie man aus der besagten Situation trotzdem die verschiedenen 'wahren' einzelnen Duell-Elo-Zahlen am besten in eine Gesamt-Zahl gießen kann, ohne zu viel an Vorhersagekraft zu verlieren.
Aber in deinem letzten Satz gehst du darauf ja schon ein. Unser Ansatz bzw. die Idee von Elo Listen versucht die Spielstärke eines Spieler gegenüber der Allgemeinheit darzustellen. Aber mir ist schon klar, dass dies im Grunde nicht möglich ist. Keine Liste, kein Verfahren kann eine exakte Zahl ermitteln, weder für einen Computer noch für einen menschlichen Spieler. Es bleiben immer Schätzungen, Stichproben, Näherungen wie auch immer man es nennen will. So langsam kommen wir aber jetzt in einen Bereich, der nicht mehr mit dem Begriff Hobby vereinbar ist. ![]() Dazu könnte man z.B. die Meinung vertreten, dass im Grunde die Gewinnerwartung gegen den MMII nicht wirklich interessiert und in der Berechnung weggelassen werden sollte, weil sie den R30 unfair benachteiligt und er ohnehin klar besser ist oder die 10% nur vernachlässigbare Ausreißer sind.
Man kann aber auch der Auffassung sein, dass beide Gewinnerwartungen sich trotzdem in einer ELO-Zahl niederschlagen müssten (solange die Anzahl der Partien des R30 über alle Gegner-Spielstärken halbwegs gleichmäßig verteilt ist und nicht etwa 100 Partien gegen den MMII in die Berechnung eingehen und nur 2 gegen den Sparc, aber das ist ja klar). Ich persönlich teile, wie schon angedeutet - offenbar ähnlich wie ihr - diese zweite Meinung. Zitieren:
Wenn man es wirklich korrekt angehen will, müssen sogar alle Geräte gegeneinander antreten. Wenn alle Geräte die gleiche Gesamtanzahl an Partien aufweisen und dabei gewährleistet ist, dass jedes Gerät gegen alle anderen Vertreter die gleichen Anzahl an Vergleichspartien gespielt hat, ist eine relative statistische Auswertung möglich. Wobei die Gesamtanzahl der Partien ins Unendliche tendieren müßte, um der Wahrheit nahe zu kommen.
![]() Natürlich sollte sich nichts an den Elo-Zahlen ändern. Hoffentlich macht ELO-Stat das auch so. Der prozentuale Anteil an den Siegen der beiden Kontrahenten bleibt ja gleich und damit auch die jeweilige Gewinnerwartung, also auch die Elo-Zahl. Lediglich die Partien-Basis wird breiter.
Vielleicht ist es jetzt zu verstehen, warum das von mir angeführte 20:0 und 30:0 Ergebnis (RISC 2500 / MMII) in unserer momentanen Liste zu den vielleicht auf den ersten Blick nicht sofort nachvollziehbaren Veränderungen führt. Ein bevorteilen eines Gerätes kann ich bei diesem Ansatz nicht erkennen, da die Gesamtheit aller Partien betrachtet wird. Vielen Dank für deine anschaulichen Ausführungen. ![]() ...bis auf ein paar kleine Missverständnisse scheint ja alles ausgeräumt zu sein, wenn ich nicht irre. Ist doch schonmal schön.
Viele Grüße, Micha |
|
||||||||||||
AW: ELO-Liste 02-2004
Nachdem ich die Woche nur dienstlich unterwegs war, kann ich mich heute mal zu Wort melden. Es war sehr spannend, die kontroverse oder übereinstimmende Diskussion zur neuen Elo-Liste zu lesen. Zum Teil bin ich schlicht und ergreifend abgehängt worden, was wahrscheinlich meinem kaufmännischen Intellekt zu verdanken ist
![]() Nun zu meinen Eindrücken: natürlich war für mich das Abschneiden des Fidelity 68060 von größtem Interesse. Kam nicht hin und wieder mal die Frage auf, ob er sogar stärker als der omnipotente R30 sei. Nun, daran glaube ich heute auch nicht mehr so ganz, zumal es einem MM II gelang, dem 68060-Boliden ein Remis abzutrotzen ![]() Die beiden Mephisto Risc-Versionen I+II nähern sich so langsam an, was auch dem praktischen Spielgeschehen am ehesten entspricht. Mich freut es um so mehr, dass ganz offensichtlich Ed Schröders Kreation das stärkste Mephisto-Modul aller Zeiten war. Auch wenn „wir“ damit erst 2004 posthum den Lorbeerkranz an den Holländer vergeben. Aber auch hier gilt analog zum Fidelity 68060: der Risc braucht vieeel Bedenkzeit, um gut spielen zu können. Ich glaube, in der Disziplin der kurzen Bedenkzeiten ist es nach wie vor Richard Lang, der in Summe die besten Ergebnisse einfährt – ein Risc1MB kann gar nicht Blitzen, da kommt nur „Schrott“ heraus. Nun, der Maggi hält sich immer noch tapfer, auch wenn die Turnierergebnisse gegen den 68060, den London68030, den Risc und den Risc2500 eine andere Sprache spreche. Ich gehe davon aus, dass in diesem Punkt die Elo-Liste vorsätzlich gefälscht wurde.... ![]() Also Jungs, mal ehrlich, wieso hält dieses Gerät die 2200er Marke? Und ein Risc2500 soll gerade mal 14 Pünktchen stärker sein....? Hm, kapiere ich nicht. Der Platz des London 68020 sollte mit dem des London 68030 getauscht werden, dann stimmt´s. Ihr habt es ja schon angemerkt, woran es liegt. Mich würde an dieser Stelle noch mal eine besondere Beleuchtung der letzten Novag-Kreationen interessieren. Wie würde Stefan z.B. den Unterschied zwischen Diablo 68000, dem Saphire I+II und SFC charakterisieren? Ich meine im Hinblick auf die Attraktivität des Spielstils. Also, noch mal herzlichen Dank für all die Mühe und Arbeit, die Ihr euch gemacht habt. Singular Extention Grüße von Björn Geändert von Björn (05.09.2004 um 19:53 Uhr) |
|
||||||||||||
AW: ELO-Liste 02-2004
![]() Mich würde an dieser Stelle noch mal eine besondere Beleuchtung der letzten Novag-Kreationen interessieren. Wie würde Stefan z.B. den Unterschied zwischen Diablo 68000, dem Saphire I+II und SFC charakterisieren? Ich meine im Hinblick auf die Attraktivität des Spielstils.
Also, noch mal herzlichen Dank für all die Mühe und Arbeit, die Ihr euch gemacht habt. Singular Extention Grüße von Björn vielen Dank für die Rückmeldung und die vorteffliche Analyse. Es gibt inzwischen ja auch die kommentieret Version der Liste als pdf download, die Einschätzungen decken sich. Bzgl. des Diablo möchte ich demnächst einen eigenen Thread aufmachen. Da Micha und ich jetzt beide ein solches Gerät haben, werden wir sicher bald eine einigermassen brauchbare Einschätzung abgeben können. Im Moment ist es mir dafür aber noch zu früh. Ich habe gerade ein Match gegen den Sapphire II begonnen, das geht echt gut los, was die Qualität der Partien angeht , ich werde demnächst berichten. Ich glaube aber schon jetzt sagen zu können, daß der Diablo in unserer Liste etwas zu hoch bewertet wird. Gruß Stefan ![]() |
|
||||||||||||
AW: ELO-Liste 02-2004
![]() Ich würde sagen, wir wollen Spaß und daraus nebenbei auch ein bißchen Informationen ableiten.
Nichts für ungut, aber für ein "bisschen" Information kann ich auch bei den Schweden nachschauen. Zitieren:
Um eine wirklich korrekte Liste (sowas gibt es ja überhaupt nicht) zu erstellen, müßten wir wesentlich mehr Partien spielen, als wir überhaupt dazu in der Lage sind.
Eile mit Weile! So wie ich das sehe, wird es an dieser Liste noch in den nächsten Jährchen Beteiligung geben. Die Partien kommen dann von ganz allein. Nur kann man eben keine schnellen Resultate erwarten. ![]() Und dass die Genauigkeit mit der Zeit steigen sollte, ist auch mir (als "Nicht-Statistiker") klar. Ich wollte nur zum Ausdruck bringen, dass du mMn etwas zu hohe Ansprüche an die Liste stellst. Zitieren:
Und wieviel ist diese "Leistung" dann deiner Meinung nach wert?
![]() Würd´ich fragen wenn ich´s wüsste? Was erwartest du noch? ![]() Zitieren:
Sorry, aber ich finde, jetzt übertreibst du etwas!
Ich habe keine Lust, mir von der Liste vorschreiben zu lassen, welche Geräte ich gegeneinander antreten lassen darf, wenn ich etwas zur Liste beitragen will! Sorry, aber du lässt dir schon jetzt eine ganze Menge von der Liste vorschreiben: Entweder 40Z/2h oder 30Min/Partie, keine Dubletten, Vorlage der Partienotation... Warum dann bei diesem Punkt soviel Widerstand? Ich spiele die Paarungen, die mich interessieren (mit den Stufen, die ich will!) und wenn es eine Liste gibt, in die diese Partien hineinpassen, dann ist alles klar! Wenn nicht, dann habe ich halt nur für mich (und Micha ![]() Der einzige zusätzliche Aufwand, den ich treibe, ist, dass ich die Partien an Micha schicke. Aber das würde ich auch ohne Liste tun, weil ich weiss, dass er sich darüber freut, und sie gerne nachspielt. Die allermeisten Partien, die ich ihm bislang geschickt habe, sind 60min-Partien, die in keine Liste hier passen. Zitieren:
Und ich bin gerne bereit, ein paar Unkorrektheiten in der Liste in Kauf zu nehmen, wenn ich weiterhin meinen Spass an der Sache haben darf!
Kann man bei gleichwertigen Gegnern und ausgekämpften Partien keinen Spaß haben? Zitieren:
Schließlich kann man über unkorrekte Zahlen ja auch wunderbar diskutieren (wie man hier sieht!) ![]() Auf diese Diskussionen würde ich gerne verzichten, um beim Wesentlichen zu bleiben. viele Grüße, Robert Geändert von Robert (06.09.2004 um 11:49 Uhr) |
![]() |
|
|
![]() |
||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Neue ELO-Liste | Stefan | Teststellungen und Elo Listen / Test positions and Elo lists | 20 | 13.04.2005 14:35 |
Aktivschach Elo Liste | Chessguru | Teststellungen und Elo Listen / Test positions and Elo lists | 0 | 02.04.2005 18:44 |
D.A.CH 2004 Turnier | 'hard | Usertreffen, Veranstaltungen / User Meetings, Events | 32 | 24.11.2004 16:51 |