|
|
||||||||||||
AW: ELO ist relativ
Hallo,
klar, unsere Elo Listen sind und bleiben nur Anhaltspunkte. Etwas anderes wurde auch nie proklamiert, nette Spielerei eben. So relativ wie Nutella. Nutella hat nur wenige Vitamine, daher muss man relativ viel davon essen... Was aber auch eine Rolle spielt, ist die Art der Berechnung. Momentan bin dabei, unsere Turnierliste mit dem SSDF-Rating Programm zu berechnen. Bin gespannt, wie sich diese Liste im Vergleich gestalten wird. Gruß Micha |
Folgender Benutzer sagt Danke zu Chessguru für den nützlichen Beitrag: | ||
|
|||||||||||
AW: ELO ist relativ
Da wurde jetzt für die U 2100-Gruppe "trickreich" von einem Teilnehmer der Almeria 68020 gewählt, der offensichtlich falsch, hinter Dallas 68020, Roma 68020 und sogar Almeria 68000 eingestuft ist. Ich hoffe, dass Deine Anpassung nach SSDF-Rechnungsvorschrift dafür sorgt, dass Fidelity Mach IV unter die 2100er Elo-Grenze fällt und man dann das diesjährige Oldie-Turnier als 1988-er WM mit erweitertem Teilnehmerfeld interpretieren kann. Denn die 88-er WM war ja richtig interessant gewesen. Ich selbst habe Mach IV nicht, aber ich weiß, wer gerne damit antreten würde. Gruß Wolfgang |
|
||||||||||||
AW: ELO ist relativ
Hallo Wolfgang,
erst einmal will ich Dir sagen wie sehr ich Deine Threads schaetze, aber das habe ich Dir bereits das letzte Mal in Klingenberg persoenlich erzaehlt. Was ich aber jetzt nicht absolut nachvollziehen kann, ist die Tatsache das Du dich hier in diesem Forum weiter beschwerst. Sorry das ich das jetzt so sagen muss. Das ganze als "Trickreich" zu bezeichnen finde ich schon ganz schoen gewagt deswegen versuche ich das etwas zu neutralisieren...will es mal sachte halten...ich erzaehl dir mal was...ich hatte die gleiche Idee...war aber nicht schnell genug...sonst waer ich der Arsch gewesen oder wie? Ich seh das schwarz weiss...weil sonst moechte ich gerne mein BruteForce mit 9 Elo Punkten zuviel elo auch starten lassen...die Liste ist ja nicht 100% korrekt.... Ich hoffe Du verstehst mich nicht verkehrt. Jeder will was und der TL muss entscheiden (vielleicht akzeptierst du es hier mehr als dort)...da gibt es Leute denen das gefällt und da gibt es Leute denen das nicht gefällt...was ist Dir wichtig ...? mir ist wichtig das ich Dich und alle anderen in Klingenberg wieder treffe und spass habe mit einem guten gefuehl.. Ich kann mich auch ueber etwas aufregen was mir nicht an solchen Turnieren passt (die gleiche sch...gibt es auch in NL)...aber keine details...mir missfaellt das sehr...Weil es ist die Gemeinschaft...und ich glaube auch nicht das Du 100%ig so denkst...komm schraub mal zurueck ... Tobias |
|
|||||||||||
AW: ELO ist relativ
so dramatisch sehe ich das alles nicht. Ich akzeptiere die Klingenberg-Regeln, auch wenn ich mir vielleicht ein Zweitkriterium für die Zulassung eines Gerätes (SSDF-List oder Mindestpartien-Zahl 100) wünschen würde. Ich akzeptiere auch, dass der Almeria 68020 teilnimmt. Selbst nehme ich auch teil, freue mich schon drauf. Alles weitere habe ich im "anderen" Forum per PN geklärt, - wenn man so will "entschärft". Gruß Wolfgang |
|
||||||||||||
AW: ELO ist relativ
Hallo Tobias,
so dramatisch sehe ich das alles nicht. Ich akzeptiere die Klingenberg-Regeln, auch wenn ich mir vielleicht ein Zweitkriterium für die Zulassung eines Gerätes (SSDF-List oder Mindestpartien-Zahl 100) wünschen würde. Ich akzeptiere auch, dass der Almeria 68020 teilnimmt. Selbst nehme ich auch teil, freue mich schon drauf. Alles weitere habe ich im "anderen" Forum per PN geklärt, - wenn man so will "entschärft". Gruß Wolfgang schoen das wir das eben offline klaeren konnten. Ich kann jetzt deinen Standpunkt besser verstehen. Ich denke, dass somit auch alles gesagt ist. Ich freue mich auf unser Wiedersehen. Bis dahin Tobias |
|
|||||||||||
AW: ELO ist relativ
Ja Walter hat Recht ein allwissender Supercomputer, welcher alle Schwächen und Stärken berücksichtigt könnte eine gute ELO-Bewertung abgeben.
Aber wir hätten dabei schon wieder ein Problem. Welche Kriterien wie gewichtet werden. Dieser Supercomputer müsste dann nach einer möglichst hohen Anzahl von Spielen einen Wert liefern. Die Praxis schaut aber so aus, daß ein rechenstarkes Programm Vorteile im unübersichtlichen und kombinationsreichen Mittelspiel hat. Programme mit mehr Endspielwissen kommen aber erst dann zum Zug, wenn Sie zumindest das Mittelspiel einigermaßen verlustlos überstehen. Das alles beeeinflußt Ergebnisse. Außerdem wurden einige Schachprogramme so werbeträchtig präsentiert wie gewünscht, um einen höheren Verkaufspreis zu rechtfertigen. Die Hardware wurde als wichtig hingestellt oder auch nur eine um 50% höhere Taktfrequenz oder Verarbeitungsbreite, dabei ist und bleibt eine intelligente Programmierung der entscheidente Faktor. Der neue Genius von Millennium ist ein tolles Schachprogramm auf trotzdem noch kleiner Hardware, denn jeder heutige PC und sogar Laptop ist dieser Hardware mehrfach überlegen. Ich persönlich freue mich jedoch, daß endlich wieder der ernst zu nehmende Schachcomputer zurückkehrt. Noch vor ca.5 Jahren gab es bei Ebay keine Kategorie Schachcomputer mehr, weil Schachcomputer nur wenige Menschen interessierte. Nun endlich haben die Menschen gemerkt , daß das Schachspiel am Brett etwas wirklich Echtes ist und Bildschirmschach nicht das einzig Wahre. Amen Geändert von Chesswalker (16.01.2016 um 01:11 Uhr) |
Folgender Benutzer sagt Danke zu für den nützlichen Beitrag: | ||
Egbert (16.01.2016) |
|
||||||||||||
AW: ELO ist relativ
Hallo Wolfgang,
´schuldigung. Manchmal stehe ich ein bisschen neben mir und gucke, was ich da so mache, dann muss ich plötzlich grinsen und dann lachen wir beide. Zitieren:
Ich hoffe, dass Deine Anpassung nach SSDF-Rechnungsvorschrift dafür sorgt, dass Fidelity Mach IV unter die 2100er Elo-Grenze fällt und man dann das diesjährige Oldie-Turnier als 1988-er WM mit erweitertem Teilnehmerfeld interpretieren kann.
Denn die 88-er WM war ja richtig interessant gewesen. Ich selbst habe Mach IV nicht, aber ich weiß, wer gerne damit antreten würde. Sorry Wolfgang wenn es sarkastisch wurde, aber ich kann diese Nummer definitiv nicht einmal im Ansatz verstehen. Klingenberg, Kaufbeuren, Online-Turniere haben nur einen Zweck, sie sollen Freude bereiten. Der Spaß am Treffen mit Gleichgesinnten, die Freude am Spiel mit den alten Kisten, das Fachsimpeln, du weißt was ich meine. Falscher Ehrgeiz hat aus meiner Sicht nichts auf diesen Veranstaltungen zu suchen. Vielleicht macht es Sinn, nach den Motiven für verbissenen Ehrgeiz zu suchen. Was treibt einen an? Was glaubt man, durch diesen übertriebenen Ehrgeiz zu gewinnen? Und die vielleicht wichtigste Frage: Welchen Preis ist man bereit zu zahlen für diesen Ehrgeiz? Almeria 68020: Ehrlich gesagt war mir die Geschichte gar nicht aufgefallen. Gut, ist momentan vermutlich etwas zu niedrig angesiedelt. Zumeist versuche ich solche Geräte nicht in der Liste auszuführen, da einem die "innere gefühlte Elo-Liste" sagt, die Nummer passt einfach nicht, es fehlen einfach noch weitere Partien. Bei den Lang Kisten würde ich von ca. 50 Elo Zuwachs aufgrund der Taktverdoppelung ausgehen, so zumindest die Erfahrung bei anderen Programmversionen. Auf der anderen Seite, 70 Partien stehen zu Buche. Mein Ansatz wäre nicht das Wehklagen, sondern Partien zu spielen. Vielleicht fällt die Spielstärkesteigerung bei dem Almeria Programm bei Taktverdoppelung geringer aus? Nein? Vorher weiß man das? Genau das macht doch den Spaß aus. Spielen, testen, Spaß haben. So sehe ich die ELo Listen. Schauen wir mal, wie sich die Auswertung entwickelt. Auch hatte ich geschrieben, "Momentan bin dabei, unsere Turnierliste mit dem SSDF-Rating Programm zu berechnen", d.h. ich verwende für das Datenmaterial unserer Turnier-Elo-Liste das damalige Rating Programm von Lars Hjorth, welches bei der SSDF zur Listenerstellung zur Anwendung kam. Mir geht es nur um den Vergleich der Berechnungsmethoden. Ist aber ein riesiger Aufwand, dauert noch etwas. Nur Wolfgang, du willst mir doch nicht wirklich erzählen, dass wenn ich die Elo Zahl des Almeria 68020 in der Elo Liste ändere, dieses Gerät in Klingenberg spielen "darf"? Hallo? Ihr unterwerft euch einer privaten Elo Liste, von der ich immer und immer wieder sage, sie stellt nur eine Spielerei dar, da sie nur Anhaltspunkte liefern kann? Wo genau liegt jetzt das Problem? Bei der Elo Liste oder bei der Art der Betrachtung? Jungs, um was geht es euch eigentlich? Macht das so, wie ihr euch wohl fühlt und unterwerft euch keinem Diktat, welches noch nicht einmal vorhanden ist. Gruß Micha Hallo Walter, IWenn ich das Berechnungsschema richtig verstanden habe (@Micha: bitte korrigieren, wenn ich falsch liege, du bist der Experte), dann "klauen" sich die starken Geräte allmählich hier und da Elo-Punkte von den schwächeren, die mit der Zeit Punkte verlieren. Diesen Effekt gibt es jedenfalls bei menschlichen Spielern, wo sich die stärkeren zunehmend Punkte von den "Schwächlingen" holen. Also könnte es angezeigt sein, Partien zwischen Gegnern ab einer bestimmten Elo-Differenz überhaupt nicht mehr zu werten. Das würde den Effekt zumindest verlangsamen. Liege ich da richtig?
Es könnte auch gut sein, wenn man das System von Zeit zu Zeit neu justiert, praktisch neu anfängt. Bei unseren Elo Listen konnte ich diesen Effekt nicht erkennen. Aber selbst wenn, welche Alternative hätte man? "Neu justieren" hört sich nett, nur wie soll sich die Nummer in der Praxis gestalten? Partien weglassen? Diese Frage hatte wir vor nicht allzu langer Zeit hier schon einmal angesprochen -> https://www.schachcomputer.info/foru...p?t=99&page=24 ab Beitrag 233 ging es los. Was ich gerne machen möchte, über die verschiedenen Programme zur Berechnung diskutieren. Dass aus meiner Sicht sinnvollste Programm zur Berechnung von Computerratings ist Ordo. Hier schon mal ein "Brocken" unserer Turnierliste mit Ordo berechnet: Auszug, mit Absicht aus dem 2000er Bereich: Code:
30 Mephisto Almeria 68020 : 2112 112 112 32 56.3 % 2062 18.8 % 31 Mephisto Berlin 68000 : 2108 54 54 162 51.5 % 2094 31.5 % 32 Mephisto Milano Pro / Master Chess : 2099 47 47 190 54.7 % 2058 27.4 % 33 Fidelity Elite 68030 V9 : 2098 124 124 24 41.7 % 2164 8.3 % 34 Mephisto Lyon 68000 : 2088 70 70 92 50.5 % 2080 38.0 % 35 Novag Sapphire / Diamond : 2086 41 41 277 45.5 % 2117 28.2 % 36 Phoenix Resurrection Deep Sjeng : 2085 149 149 24 27.1 % 2265 29.2 % 37 Mephisto Portorose 68020 : 2082 69 69 91 58.8 % 2012 40.7 % 38 Fidelity Mach IV / Designer 2325 / V6 : 2079 55 55 157 38.9 % 2165 22.9 % 39 Phoenix Revelation Super Expert C : 2077 114 114 30 50.0 % 2077 46.7 % 40 Phoenix Revelation Amsterdam : 2061 155 155 18 52.8 % 2041 16.7 % 41 Mephisto Almeria 68000 : 2044 85 85 59 51.7 % 2032 35.6 % 42 Fidelity Par Excellence 16 MHz : 2044 146 146 24 54.2 % 2013 25.0 % 43 Mephisto Nigel Short 10 MHz : 2042 145 145 24 66.7 % 1904 8.3 % 44 Novag Diablo / Scorpio 68000 : 2033 41 41 254 54.3 % 2003 33.1 % 45 Mephisto Polgar 10 MHz : 2032 78 78 70 50.7 % 2026 21.4 % 46 Mephisto MM V 10 MHz : 2007 100 100 41 45.1 % 2043 22.0 % 47 Mephisto Roma 68020 : 1999 52 52 156 55.4 % 1954 22.4 % 48 Novag Citrine : 1997 72 72 80 55.0 % 1957 25.0 % 49 Saitek Cougar / Mephisto Explorer Pro : 1978 64 64 95 50.5 % 1971 18.9 % 50 Fidelity Mach III / Designer 2265 / V2 : 1978 42 42 244 41.6 % 2049 25.8 % 51 Mephisto Nigel Short : 1974 94 94 46 55.4 % 1937 28.3 % 52 Mephisto Milano : 1972 33 33 442 54.6 % 1935 22.4 % 53 Novag Super Expert / Forte C 6 MHz : 1968 34 34 412 54.9 % 1932 28.6 % 54 Saitek Corona D+ 8 MHz : 1968 120 120 25 50.0 % 1969 20.0 % 55 Mephisto Schachakademie 24 MHz : 1964 156 156 18 55.6 % 1915 33.3 % 56 Saitek GK 2100 : 1963 35 35 335 51.8 % 1945 27.8 % 57 Mephisto MM IV Turbo 16 MHz + HG440 : 1961 100 100 44 38.6 % 2065 22.7 % 58 Mephisto Monte Carlo IV LE : 1960 46 46 218 50.2 % 1958 27.1 % 59 Mephisto Roma II : 1954 89 89 51 53.9 % 1921 29.4 % 60 Novag Star Ruby / Obsidian : 1950 50 50 190 47.4 % 1971 37.9 % 61 Novag Super Expert / Forte B 6 MHz : 1947 73 73 81 49.4 % 1951 32.1 % 62 Novag Turquoise / Emerald classic plus : 1946 120 120 29 53.4 % 1908 31.0 % 63 Novag Zircon II / Jade II : 1939 50 50 180 47.8 % 1955 30.0 % 64 Mephisto Polgar : 1935 38 38 315 48.6 % 1946 24.8 % 65 Novag Super Expert / Forte C 5 MHz : 1934 64 64 117 50.9 % 1935 23.1 % 66 Mephisto Dallas / Mondial 68000XL : 1929 34 34 447 49.8 % 1930 24.4 % 67 Phoenix Revelation II Glasgow : 1928 65 65 160 53.4 % 1902 31.9 % 68 Mephisto Modena 8 MHz : 1926 46 46 190 45.5 % 1958 33.2 % 69 Mephisto MM V + HG550 : 1925 34 34 435 47.4 % 1945 23.4 % 70 Phoenix Revelation Rebell 5.0 : 1912 174 174 18 61.1 % 1822 33.3 % 71 Mephisto Schachakademie : 1901 107 107 36 47.2 % 1917 22.2 % 72 Saitek Brute Force : 1898 114 114 44 29.5 % 2090 22.7 % 73 Saitek D+ 6 MHz : 1898 161 161 16 46.9 % 1925 18.8 % 74 Mephisto Academy : 1897 63 63 125 50.4 % 1896 22.4 % 75 Saitek GK 2000 : 1887 62 62 116 50.9 % 1876 27.6 % 76 Saitek D++ 6 MHz : 1882 67 67 81 42.0 % 1939 27.2 % 77 Mephisto MM IV + HG440 : 1881 60 60 127 47.6 % 1911 19.7 % 78 Excalibur Grandmaster / Igor 24 MHz : 1880 150 150 19 44.7 % 1930 15.8 % 79 Mephisto Supermondial II / MC IV : 1877 62 62 111 49.1 % 1882 29.7 % 80 Mephisto Travel Champion 2080 : 1875 110 110 38 32.9 % 2033 13.2 % 81 Novag Super Expert / Forte A 5 MHz : 1863 82 82 73 54.8 % 1829 21.9 % 82 CXG Sphinx Dominator 2.04 : 1854 53 53 140 40.0 % 1931 20.0 % Gruß Micha |
|
||||||||||||
AW: ELO ist relativ
Irgendwie scheine ich das Problem nicht erkennen...
Einige sind sauer/enttäuscht, dass "ihr" Lieblingscomputer in einer vorher anerkannten Liste zu hoch steht und deshalb bei einer Beschränkung raus fällt? Dann sollte vorher der Finger gehoben werden, nachkarten hinterlässt immer einen faden Beigeschmack. Eine andere Sache ist das teilweise vorhandene Unverständnis in Bezug auf die Ermittlung der ELO-Zahlen. Da wird mit "Gefühl" argumentiert, es werden Vergleiche mit der Ermittlung menschlicher ELO-Zahlen herangezogen usw. Zum ersten: Gefühl hat dabei nichts verloren und ist zwar menschlich verständlich, aber für ein Ergebnis nicht hilfeich. Solange die einzelne Partie nicht technische Fehler hat gehört sie gewertet. Ansonsten wird ein systematischer Fehle eingebaut. Für verschiedene Fälle gehört vorher eine Lösung überlegt und diese dann konsequent angewandt. Dazu gehören z.B. Zeitüberschreitung, Umgang mit Dubletten (wenn sie aus Gründen der Zeitersparnis und Abwechselung nicht ausgespielt werden sollen), Aufgabe einer Seite und Abschätzung einer Partie (auch hier wäre das Ausspielen besser, aber eben auch mit Zeit und wenig Abwechselung verbunden). Die Veränderung der ELO-Zahlen in verschiedenen Listen mit der Zeit hat hauptsächlich zwei Ursachen: Es werden neue Partien gespielt (eventuell sogar mit neuen Programmen) und bei der Neuberechnung ergibt sich eine bessere Schätzung. Und zweitens, die gesamte Liste wird neu geeicht. Letzteres verändert die Liste nur als ganzes, aber für einzelne Programme kann dabei eine kritische fixe Marke (z.B. ELO 2000) über- bzw. unterschritten werden. Daher sollte eine Neueichung nicht kurz vor einem Turnier mit einem fixen Limit durchgeführt werden. Denn ein Programm mit z.B: 2006 statt vorher 1997 ist natürlich kein Deut anders und die Relation zu den anderen Turnierteilnehmern hat sich nicht geändert. Der Vergleich mit der Ermittlung menschlicher ELO-Werte ist nicht hilfreich. Menschen unterliegen einer zeitlichen Veränderung, Schachprogramme nicht. Eine Partie vor 20 Jahren von mir gegen meinen Nachbarn ist für den heutigen Erwartungswert meiner Spielstärke irrelevant. Eine Partie zwischen MM IV gegen Roma II hingegen gehört auch nach 20 Jahren noch in die Berechnung. Die Berechnung von ELO-Zahlen aus Partien zwischen Computern hat zwei grundsätzliche Probleme: Zum einen sollen die Zahlen mit menschlichen Zahlen vergleichbar sein, d.h. wenn Programm A 200 ELO höher als Progamm B eingestuft wird, dann soll sich das auch im Vergleich zu Menschen wider spiegeln. Es gibt aber deutlich mehr Partien zwischen Computern als gegen Menschen, deshalb wird es immer Abweichungen geben müssen. Und das zweite Problem liegt in der Annahme einer Verteilungsfunktion. Bayes-ELO statt ELO-Stat ist eine Verbesserung, aber es bleibt immer noch ein Fehler. |
|
||||||||||||
AW: ELO ist relativ
Was das Gefühl betrifft:
Nehmen wir mal eine Bewertung aufgrund von vier Programmen A, B, C und D. Folgende Ergebnisse gab es in einem ersten Durchlauf: Code:
A - B 12,0 - 8,0 A - C 18,0 - 22,0 A - D 13,5 - 16,5 B - C 16,5 - 13,5 B - D 22,0 - 18,0 C - D 10,0 - 10,0 A: 43,5/90 B: 46,5/90 C: 45,5/90 D: 44,5/90 Was sagen die ELO-Zahlen? Und würde sich etwas ändern, wenn in 10 weiteren Partien A gegen B 6 weitere Punkte erzielen würde? |
|
|