Test: ELO ist relativ - Schachcomputer.info Community

		Schachcomputer.info Community > Schachcomputer / Chess Computer: > Die ganze Welt der Schachcomputer / World of chess computers
Test: ELO ist relativ

Seite 1 von 2

Themen-Optionen

Ansicht

15.01.2016, 13:12

Chesswalker

Gast

Beiträge: n/a

ELO ist relativ

Hallo Fans

Da ich viele Schachcomputer sammle und auch ab und zu gegen einige Modelle spiele, fiel mir folgendes auf.
ELO-Zahlen sind als grober Anhaltspunkt für Spielstärke ganz okay, aber im Grunde sehr ungenau.
Beispiele: Ich nahm heute meinen neu ersteigerten Mephisto 68000 XL mit knapp 2000 ELO und er spielte locker einen Milano Pro gegen die Wand. Okay, ich rechnete schon fast damit, da das Endspiel eine Schwäche vom M.Milano Pro (F.Morsch) ist.
Krass wurde mein Erlebnis jedoch hier: Einen kleinen Novag Allegro (Piccolo) wollte ich vor Publikum mal schnell besiegen und opferte schon 2 Leichfiguren, weil ich etwas "zu locker" an die Sache ging und hatte wirklich Mühe die Partie noch zu gewinnen. Meine Einschätzung waren waren "gefühlsmässige" 1300-1400 SSF-ELO und deshalb nahm ich einen Novag Alto mit dieser Spielstärke 1300 und stellte fest, daß der kleine Allego (ELO 945) mit seinem halb so großen Programm (2k!) real viel besser spielt als der ca. 350 (!) ELOs stärkere Alto - sowohl im Direkvergleich (Maschine gegen Maschine) als auch gegen Mensch.
Ich glaube solche "Effekte" treten in allen Spielstärkeklassen auf, nur eben dachte ich, daß es nicht so extrem ist.
Grüße euer Chesswalker

Geändert von Chesswalker (15.01.2016 um 15:40 Uhr)

15.01.2016, 17:01

Chessguru

Administrator

Dabei seit 20 Jahren, 9 Monaten und 29 Tagen.

Registriert seit: 29.06.2004

Ort: Rostock

Alter: 56

Land:

Beiträge: 6.613

Bilder: 1

Abgegebene Danke: 1.864

Erhielt 4.910 Danke für 1.481 Beiträge

AW: ELO ist relativ

Hallo,

klar, unsere Elo Listen sind und bleiben nur Anhaltspunkte. Etwas anderes wurde auch nie proklamiert, nette Spielerei eben. So relativ wie Nutella. Nutella hat nur wenige Vitamine, daher muss man relativ viel davon essen...

Was aber auch eine Rolle spielt, ist die Art der Berechnung. Momentan bin dabei, unsere Turnierliste mit dem SSDF-Rating Programm zu berechnen. Bin gespannt, wie sich diese Liste im Vergleich gestalten wird.

Gruß
Micha

Folgender Benutzer sagt Danke zu Chessguru für den nützlichen Beitrag:

15.01.2016, 18:18

Wolfgang2

Lebende Foren Legende

Dabei seit 20 Jahren, 2 Monaten und 26 Tagen.

Registriert seit: 02.02.2005

Ort: Schweinfurt

Alter: 58

Land:

Beiträge: 2.793

Abgegebene Danke: 3.460

Erhielt 3.488 Danke für 1.639 Beiträge

AW: ELO ist relativ

Zitat von Chessguru

Hallo,

klar, unsere Elo Listen sind und bleiben nur Anhaltspunkte. Etwas anderes wurde auch nie proklamiert, nette Spielerei eben. ...

Gruß
Micha

Ja richtig Micha. Du hast das immer betont, die Liste sogar "kleiner" geredet als sie ist. Nur leider ist es wieder so, wie ich vor ein paar Monaten prognostiziert habe, dass die Liste als die unfehlbare Referenz heran gezogen wird, wenn es um das Klingenberg-Turnier geht.

Da wurde jetzt für die U 2100-Gruppe "trickreich" von einem Teilnehmer der Almeria 68020 gewählt, der offensichtlich falsch, hinter Dallas 68020, Roma 68020 und sogar Almeria 68000 eingestuft ist.

Ich hoffe, dass Deine Anpassung nach SSDF-Rechnungsvorschrift dafür sorgt, dass Fidelity Mach IV unter die 2100er Elo-Grenze fällt und man dann das diesjährige Oldie-Turnier als 1988-er WM mit erweitertem Teilnehmerfeld interpretieren kann.
Denn die 88-er WM war ja richtig interessant gewesen. Ich selbst habe Mach IV nicht, aber ich weiß, wer gerne damit antreten würde.

Gruß
Wolfgang

15.01.2016, 19:47

goto34

Resurrection

Dabei seit 16 Jahren, 8 Monaten und 26 Tagen.

Registriert seit: 02.08.2008

Ort: Dordrecht (Niederlande)

Alter: 53

Land:

Beiträge: 553

Bilder: 20

Abgegebene Danke: 119

Erhielt 129 Danke für 69 Beiträge

AW: ELO ist relativ

Hallo Wolfgang,

erst einmal will ich Dir sagen wie sehr ich Deine Threads schaetze, aber das habe ich Dir bereits das letzte Mal in Klingenberg persoenlich erzaehlt.

Was ich aber jetzt nicht absolut nachvollziehen kann, ist die Tatsache das Du dich hier in diesem Forum weiter beschwerst. Sorry das ich das jetzt so sagen muss.

Das ganze als "Trickreich" zu bezeichnen finde ich schon ganz schoen gewagt deswegen versuche ich das etwas zu neutralisieren...will es mal sachte halten...ich erzaehl dir mal was...ich hatte die gleiche Idee...war aber nicht schnell genug...sonst waer ich der Arsch gewesen oder wie? Ich seh das schwarz weiss...weil sonst moechte ich gerne mein BruteForce mit 9 Elo Punkten zuviel elo auch starten lassen...die Liste ist ja nicht 100% korrekt....

Ich hoffe Du verstehst mich nicht verkehrt. Jeder will was und der TL muss entscheiden (vielleicht akzeptierst du es hier mehr als dort)...da gibt es Leute denen das gefällt und da gibt es Leute denen das nicht gefällt...was ist Dir wichtig ...? mir ist wichtig das ich Dich und alle anderen in Klingenberg wieder treffe und spass habe mit einem guten gefuehl.. Ich kann mich auch ueber etwas aufregen was mir nicht an solchen Turnieren passt (die gleiche sch...gibt es auch in NL)...aber keine details...mir missfaellt das sehr...Weil es ist die Gemeinschaft...und ich glaube auch nicht das Du 100%ig so denkst...komm schraub mal zurueck ...

Tobias

15.01.2016, 20:40

Wolfgang2

Lebende Foren Legende

Registriert seit: 02.02.2005

Ort: Schweinfurt

Alter: 58

Land:

Beiträge: 2.793

Abgegebene Danke: 3.460

Erhielt 3.488 Danke für 1.639 Beiträge

AW: ELO ist relativ

Zitat von goto34

Hallo Wolfgang,

...mir missfaellt das sehr...Weil es ist die Gemeinschaft...und ich glaube auch nicht das Du 100%ig so denkst...komm schraub mal zurueck ...

Tobias

Hallo Tobias,
so dramatisch sehe ich das alles nicht. Ich akzeptiere die Klingenberg-Regeln, auch wenn ich mir vielleicht ein Zweitkriterium für die Zulassung eines Gerätes (SSDF-List oder Mindestpartien-Zahl 100) wünschen würde. Ich akzeptiere auch, dass der Almeria 68020 teilnimmt. Selbst nehme ich auch teil, freue mich schon drauf. Alles weitere habe ich im "anderen" Forum per PN geklärt, - wenn man so will "entschärft".

Gruß
Wolfgang

15.01.2016, 21:26

goto34

Resurrection

Registriert seit: 02.08.2008

Ort: Dordrecht (Niederlande)

Alter: 53

Land:

Beiträge: 553

Bilder: 20

Abgegebene Danke: 119

Erhielt 129 Danke für 69 Beiträge

AW: ELO ist relativ

Zitat von Wolfgang2

Hi Wolfgang,
schoen das wir das eben offline klaeren konnten. Ich kann jetzt deinen Standpunkt besser verstehen. Ich denke, dass somit auch alles gesagt ist. Ich freue mich auf unser Wiedersehen. Bis dahin

Tobias

15.01.2016, 23:17

Chesswalker

Gast

Beiträge: n/a

AW: ELO ist relativ

Ja Walter hat Recht

ein allwissender Supercomputer, welcher alle Schwächen und Stärken berücksichtigt könnte eine gute ELO-Bewertung abgeben.
Aber wir hätten dabei schon wieder ein Problem. Welche Kriterien wie gewichtet werden. Dieser Supercomputer müsste dann nach einer möglichst hohen Anzahl von Spielen einen Wert liefern.
Die Praxis schaut aber so aus, daß ein rechenstarkes Programm Vorteile im unübersichtlichen und kombinationsreichen Mittelspiel hat. Programme mit mehr Endspielwissen kommen aber erst dann zum Zug, wenn Sie zumindest das Mittelspiel einigermaßen verlustlos überstehen. Das alles beeeinflußt Ergebnisse.

Außerdem wurden einige Schachprogramme so werbeträchtig präsentiert wie gewünscht, um einen höheren Verkaufspreis zu rechtfertigen. Die Hardware
wurde als wichtig hingestellt oder auch nur eine um 50% höhere Taktfrequenz oder Verarbeitungsbreite, dabei ist und bleibt eine intelligente Programmierung
der entscheidente Faktor. Der neue Genius von Millennium ist ein tolles Schachprogramm auf trotzdem noch kleiner Hardware, denn jeder heutige
PC und sogar Laptop ist dieser Hardware mehrfach überlegen. Ich persönlich freue mich jedoch, daß endlich wieder der ernst zu nehmende Schachcomputer zurückkehrt.
Noch vor ca.5 Jahren gab es bei Ebay keine Kategorie Schachcomputer mehr, weil Schachcomputer nur wenige Menschen interessierte. Nun endlich haben die Menschen gemerkt , daß das Schachspiel am Brett etwas wirklich Echtes ist und Bildschirmschach nicht das einzig Wahre. Amen

Geändert von Chesswalker (16.01.2016 um 01:11 Uhr)

Folgender Benutzer sagt Danke zu für den nützlichen Beitrag:
Egbert (16.01.2016)

16.01.2016, 19:04

Chessguru

Administrator

Registriert seit: 29.06.2004

Ort: Rostock

Alter: 56

Land:

Beiträge: 6.613

Bilder: 1

Abgegebene Danke: 1.864

Erhielt 4.910 Danke für 1.481 Beiträge

AW: ELO ist relativ

Hallo Wolfgang,

Zitat von Wolfgang2

Nur leider ist es wieder so, wie ich vor ein paar Monaten prognostiziert habe, dass die Liste als die unfehlbare Referenz heran gezogen wird, wenn es um das Klingenberg-Turnier geht.

ja, da bin ich mir meiner Schuld natürlich bewusst und bereue zutiefst meine Verfehlung.

´schuldigung. Manchmal stehe ich ein bisschen neben mir und gucke, was ich da so mache, dann muss ich plötzlich grinsen und dann lachen wir beide.

Zitieren:

Ich hoffe, dass Deine Anpassung nach SSDF-Rechnungsvorschrift dafür sorgt, dass Fidelity Mach IV unter die 2100er Elo-Grenze fällt und man dann das diesjährige Oldie-Turnier als 1988-er WM mit erweitertem Teilnehmerfeld interpretieren kann.
Denn die 88-er WM war ja richtig interessant gewesen. Ich selbst habe Mach IV nicht, aber ich weiß, wer gerne damit antreten würde.

Zumeist ist Religion das Problem, nicht die Lösung...

Sorry Wolfgang wenn es sarkastisch wurde, aber ich kann diese Nummer definitiv nicht einmal im Ansatz verstehen.

Klingenberg, Kaufbeuren, Online-Turniere haben nur einen Zweck, sie sollen Freude bereiten. Der Spaß am Treffen mit Gleichgesinnten, die Freude am Spiel mit den alten Kisten, das Fachsimpeln, du weißt was ich meine. Falscher Ehrgeiz hat aus meiner Sicht nichts auf diesen Veranstaltungen zu suchen. Vielleicht macht es Sinn, nach den Motiven für verbissenen Ehrgeiz zu suchen. Was treibt einen an? Was glaubt man, durch diesen übertriebenen Ehrgeiz zu gewinnen? Und die vielleicht wichtigste Frage: Welchen Preis ist man bereit zu zahlen für diesen Ehrgeiz?

Almeria 68020: Ehrlich gesagt war mir die Geschichte gar nicht aufgefallen. Gut, ist momentan vermutlich etwas zu niedrig angesiedelt. Zumeist versuche ich solche Geräte nicht in der Liste auszuführen, da einem die "innere gefühlte Elo-Liste" sagt, die Nummer passt einfach nicht, es fehlen einfach noch weitere Partien. Bei den Lang Kisten würde ich von ca. 50 Elo Zuwachs aufgrund der Taktverdoppelung ausgehen, so zumindest die Erfahrung bei anderen Programmversionen. Auf der anderen Seite, 70 Partien stehen zu Buche. Mein Ansatz wäre nicht das Wehklagen, sondern Partien zu spielen. Vielleicht fällt die Spielstärkesteigerung bei dem Almeria Programm bei Taktverdoppelung geringer aus? Nein? Vorher weiß man das? Genau das macht doch den Spaß aus. Spielen, testen, Spaß haben. So sehe ich die ELo Listen. Schauen wir mal, wie sich die Auswertung entwickelt.

Auch hatte ich geschrieben, "Momentan bin dabei, unsere Turnierliste mit dem SSDF-Rating Programm zu berechnen", d.h. ich verwende für das Datenmaterial unserer Turnier-Elo-Liste das damalige Rating Programm von Lars Hjorth, welches bei der SSDF zur Listenerstellung zur Anwendung kam. Mir geht es nur um den Vergleich der Berechnungsmethoden. Ist aber ein riesiger Aufwand, dauert noch etwas.

Nur Wolfgang, du willst mir doch nicht wirklich erzählen, dass wenn ich die Elo Zahl des Almeria 68020 in der Elo Liste ändere, dieses Gerät in Klingenberg spielen "darf"? Hallo? Ihr unterwerft euch einer privaten Elo Liste, von der ich immer und immer wieder sage, sie stellt nur eine Spielerei dar, da sie nur Anhaltspunkte liefern kann? Wo genau liegt jetzt das Problem? Bei der Elo Liste oder bei der Art der Betrachtung? Jungs, um was geht es euch eigentlich? Macht das so, wie ihr euch wohl fühlt und unterwerft euch keinem Diktat, welches noch nicht einmal vorhanden ist.

Gruß
Micha

Hallo Walter,

Zitat von Walter

IWenn ich das Berechnungsschema richtig verstanden habe (@Micha: bitte korrigieren, wenn ich falsch liege, du bist der Experte), dann "klauen" sich die starken Geräte allmählich hier und da Elo-Punkte von den schwächeren, die mit der Zeit Punkte verlieren. Diesen Effekt gibt es jedenfalls bei menschlichen Spielern, wo sich die stärkeren zunehmend Punkte von den "Schwächlingen" holen. Also könnte es angezeigt sein, Partien zwischen Gegnern ab einer bestimmten Elo-Differenz überhaupt nicht mehr zu werten. Das würde den Effekt zumindest verlangsamen. Liege ich da richtig?
Es könnte auch gut sein, wenn man das System von Zeit zu Zeit neu justiert, praktisch neu anfängt.

ich bin nicht der Experte, ich putze hier nur.

Den beschriebenen Effekt kann man sehr schön bei der Fide beobachten, die Inflation der hohen Elo Zahlen.

Bei unseren Elo Listen konnte ich diesen Effekt nicht erkennen. Aber selbst wenn, welche Alternative hätte man? "Neu justieren" hört sich nett, nur wie soll sich die Nummer in der Praxis gestalten? Partien weglassen? Diese Frage hatte wir vor nicht allzu langer Zeit hier schon einmal angesprochen -> https://www.schachcomputer.info/foru...p?t=99&page=24 ab Beitrag 233 ging es los.

Was ich gerne machen möchte, über die verschiedenen Programme zur Berechnung diskutieren. Dass aus meiner Sicht sinnvollste Programm zur Berechnung von Computerratings ist Ordo. Hier schon mal ein "Brocken" unserer Turnierliste mit Ordo berechnet:

Auszug, mit Absicht aus dem 2000er Bereich:

Code:

  30 Mephisto Almeria 68020                    : 2112  112  112    32    56.3 %   2062   18.8 %
  31 Mephisto Berlin 68000                     : 2108   54   54   162    51.5 %   2094   31.5 %
  32 Mephisto Milano Pro / Master Chess        : 2099   47   47   190    54.7 %   2058   27.4 %
  33 Fidelity Elite 68030 V9                   : 2098  124  124    24    41.7 %   2164    8.3 %
  34 Mephisto Lyon 68000                       : 2088   70   70    92    50.5 %   2080   38.0 %
  35 Novag Sapphire / Diamond                  : 2086   41   41   277    45.5 %   2117   28.2 %
  36 Phoenix Resurrection Deep Sjeng           : 2085  149  149    24    27.1 %   2265   29.2 %
  37 Mephisto Portorose 68020                  : 2082   69   69    91    58.8 %   2012   40.7 %
  38 Fidelity Mach IV / Designer 2325 / V6     : 2079   55   55   157    38.9 %   2165   22.9 %
  39 Phoenix Revelation Super Expert C         : 2077  114  114    30    50.0 %   2077   46.7 %
  40 Phoenix Revelation Amsterdam              : 2061  155  155    18    52.8 %   2041   16.7 %
  41 Mephisto Almeria 68000                    : 2044   85   85    59    51.7 %   2032   35.6 %
  42 Fidelity Par Excellence 16 MHz            : 2044  146  146    24    54.2 %   2013   25.0 %
  43 Mephisto Nigel Short 10 MHz               : 2042  145  145    24    66.7 %   1904    8.3 %
  44 Novag Diablo / Scorpio 68000              : 2033   41   41   254    54.3 %   2003   33.1 %
  45 Mephisto Polgar 10 MHz                    : 2032   78   78    70    50.7 %   2026   21.4 %
  46 Mephisto MM V 10 MHz                      : 2007  100  100    41    45.1 %   2043   22.0 %
  47 Mephisto Roma 68020                       : 1999   52   52   156    55.4 %   1954   22.4 %
  48 Novag Citrine                             : 1997   72   72    80    55.0 %   1957   25.0 %
  49 Saitek Cougar / Mephisto Explorer Pro     : 1978   64   64    95    50.5 %   1971   18.9 %
  50 Fidelity Mach III / Designer 2265 / V2    : 1978   42   42   244    41.6 %   2049   25.8 %
  51 Mephisto Nigel Short                      : 1974   94   94    46    55.4 %   1937   28.3 %
  52 Mephisto Milano                           : 1972   33   33   442    54.6 %   1935   22.4 %
  53 Novag Super Expert / Forte C 6 MHz        : 1968   34   34   412    54.9 %   1932   28.6 %
  54 Saitek Corona D+ 8 MHz                    : 1968  120  120    25    50.0 %   1969   20.0 %
  55 Mephisto Schachakademie 24 MHz            : 1964  156  156    18    55.6 %   1915   33.3 %
  56 Saitek GK 2100                            : 1963   35   35   335    51.8 %   1945   27.8 %
  57 Mephisto MM IV Turbo 16 MHz + HG440       : 1961  100  100    44    38.6 %   2065   22.7 %
  58 Mephisto Monte Carlo IV LE                : 1960   46   46   218    50.2 %   1958   27.1 %
  59 Mephisto Roma II                          : 1954   89   89    51    53.9 %   1921   29.4 %
  60 Novag Star Ruby / Obsidian                : 1950   50   50   190    47.4 %   1971   37.9 %
  61 Novag Super Expert / Forte B 6 MHz        : 1947   73   73    81    49.4 %   1951   32.1 %
  62 Novag Turquoise / Emerald classic plus    : 1946  120  120    29    53.4 %   1908   31.0 %
  63 Novag Zircon II / Jade II                 : 1939   50   50   180    47.8 %   1955   30.0 %
  64 Mephisto Polgar                           : 1935   38   38   315    48.6 %   1946   24.8 %
  65 Novag Super Expert / Forte C 5 MHz        : 1934   64   64   117    50.9 %   1935   23.1 %
  66 Mephisto Dallas / Mondial 68000XL         : 1929   34   34   447    49.8 %   1930   24.4 %
  67 Phoenix Revelation II Glasgow             : 1928   65   65   160    53.4 %   1902   31.9 %
  68 Mephisto Modena 8 MHz                     : 1926   46   46   190    45.5 %   1958   33.2 %
  69 Mephisto MM V + HG550                     : 1925   34   34   435    47.4 %   1945   23.4 %
  70 Phoenix Revelation Rebell 5.0             : 1912  174  174    18    61.1 %   1822   33.3 %
  71 Mephisto Schachakademie                   : 1901  107  107    36    47.2 %   1917   22.2 %
  72 Saitek Brute Force                        : 1898  114  114    44    29.5 %   2090   22.7 %
  73 Saitek D+ 6 MHz                           : 1898  161  161    16    46.9 %   1925   18.8 %
  74 Mephisto Academy                          : 1897   63   63   125    50.4 %   1896   22.4 %
  75 Saitek GK 2000                            : 1887   62   62   116    50.9 %   1876   27.6 %
  76 Saitek D++ 6 MHz                          : 1882   67   67    81    42.0 %   1939   27.2 %
  77 Mephisto MM IV + HG440                    : 1881   60   60   127    47.6 %   1911   19.7 %
  78 Excalibur Grandmaster / Igor 24 MHz       : 1880  150  150    19    44.7 %   1930   15.8 %
  79 Mephisto Supermondial II / MC IV          : 1877   62   62   111    49.1 %   1882   29.7 %
  80 Mephisto Travel Champion 2080             : 1875  110  110    38    32.9 %   2033   13.2 %
  81 Novag Super Expert / Forte A 5 MHz        : 1863   82   82    73    54.8 %   1829   21.9 %
  82 CXG Sphinx Dominator 2.04                 : 1854   53   53   140    40.0 %   1931   20.0 %

Na? Neugierig geworden? Erinnert das nicht an die wohligen SSDF-Zeiten? Oder sind wir einfach nur befangen?

Gruß
Micha

Folgende 2 Benutzer sagen Danke zu Chessguru für den nützlichen Beitrag:
Robert (18.01.2016), Roberto (17.01.2016)

16.01.2016, 20:08

Solwac

Revelation

Dabei seit 14 Jahren, 9 Monaten und 10 Tagen.

Registriert seit: 18.07.2010

Land:

Beiträge: 782

Abgegebene Danke: 189

Erhielt 338 Danke für 216 Beiträge

AW: ELO ist relativ

Irgendwie scheine ich das Problem nicht erkennen...

Einige sind sauer/enttäuscht, dass "ihr" Lieblingscomputer in einer vorher anerkannten Liste zu hoch steht und deshalb bei einer Beschränkung raus fällt?

Dann sollte vorher der Finger gehoben werden, nachkarten hinterlässt immer einen faden Beigeschmack.

Eine andere Sache ist das teilweise vorhandene Unverständnis in Bezug auf die Ermittlung der ELO-Zahlen. Da wird mit "Gefühl" argumentiert, es werden Vergleiche mit der Ermittlung menschlicher ELO-Zahlen herangezogen usw.

Zum ersten: Gefühl hat dabei nichts verloren und ist zwar menschlich verständlich, aber für ein Ergebnis nicht hilfeich. Solange die einzelne Partie nicht technische Fehler hat gehört sie gewertet. Ansonsten wird ein systematischer Fehle eingebaut. Für verschiedene Fälle gehört vorher eine Lösung überlegt und diese dann konsequent angewandt. Dazu gehören z.B. Zeitüberschreitung, Umgang mit Dubletten (wenn sie aus Gründen der Zeitersparnis und Abwechselung nicht ausgespielt werden sollen), Aufgabe einer Seite und Abschätzung einer Partie (auch hier wäre das Ausspielen besser, aber eben auch mit Zeit und wenig Abwechselung verbunden).

Die Veränderung der ELO-Zahlen in verschiedenen Listen mit der Zeit hat hauptsächlich zwei Ursachen: Es werden neue Partien gespielt (eventuell sogar mit neuen Programmen) und bei der Neuberechnung ergibt sich eine bessere Schätzung. Und zweitens, die gesamte Liste wird neu geeicht. Letzteres verändert die Liste nur als ganzes, aber für einzelne Programme kann dabei eine kritische fixe Marke (z.B. ELO 2000) über- bzw. unterschritten werden. Daher sollte eine Neueichung nicht kurz vor einem Turnier mit einem fixen Limit durchgeführt werden. Denn ein Programm mit z.B: 2006 statt vorher 1997 ist natürlich kein Deut anders und die Relation zu den anderen Turnierteilnehmern hat sich nicht geändert.

Der Vergleich mit der Ermittlung menschlicher ELO-Werte ist nicht hilfreich. Menschen unterliegen einer zeitlichen Veränderung, Schachprogramme nicht. Eine Partie vor 20 Jahren von mir gegen meinen Nachbarn ist für den heutigen Erwartungswert meiner Spielstärke irrelevant. Eine Partie zwischen MM IV gegen Roma II hingegen gehört auch nach 20 Jahren noch in die Berechnung.

Die Berechnung von ELO-Zahlen aus Partien zwischen Computern hat zwei grundsätzliche Probleme: Zum einen sollen die Zahlen mit menschlichen Zahlen vergleichbar sein, d.h. wenn Programm A 200 ELO höher als Progamm B eingestuft wird, dann soll sich das auch im Vergleich zu Menschen wider spiegeln. Es gibt aber deutlich mehr Partien zwischen Computern als gegen Menschen, deshalb wird es immer Abweichungen geben müssen. Und das zweite Problem liegt in der Annahme einer Verteilungsfunktion. Bayes-ELO statt ELO-Stat ist eine Verbesserung, aber es bleibt immer noch ein Fehler.

#10

16.01.2016, 20:26

Solwac

Revelation

Registriert seit: 18.07.2010

Land:

Beiträge: 782

Abgegebene Danke: 189

Erhielt 338 Danke für 216 Beiträge

AW: ELO ist relativ

Was das Gefühl betrifft:

Nehmen wir mal eine Bewertung aufgrund von vier Programmen A, B, C und D.

Folgende Ergebnisse gab es in einem ersten Durchlauf:

Code:

A - B 12,0 -  8,0
A - C 18,0 - 22,0
A - D 13,5 - 16,5
B - C 16,5 - 13,5
B - D 22,0 - 18,0
C - D 10,0 - 10,0

A: 43,5/90
B: 46,5/90
C: 45,5/90
D: 44,5/90

Was sagt Euer Gefühl, welches Programm ist das Stärkste?
Was sagen die ELO-Zahlen?
Und würde sich etwas ändern, wenn in 10 weiteren Partien A gegen B 6 weitere Punkte erzielen würde?

Seite 1 von 2

« Vorheriges Thema | Nächstes Thema »

Forumregeln
Du bist nicht berechtigt, neue Themen zu erstellen. Du bist nicht berechtigt, auf Beiträge zu antworten. Du bist nicht berechtigt, Anhänge hochzuladen. Du bist nicht berechtigt, deine Beiträge zu bearbeiten. BB code ist An Smileys sind An. [IMG] Code ist An. HTML-Code ist An. Forum Regeln

Gehe zu

Alle Zeitangaben in WEZ +2. Es ist jetzt 16:34 Uhr.