|
||||||||||||
AW: ELO ist relativ
Was das Gefühl betrifft:
Nehmen wir mal eine Bewertung aufgrund von vier Programmen A, B, C und D. Folgende Ergebnisse gab es in einem ersten Durchlauf: Code:
A - B 12,0 - 8,0 A - C 18,0 - 22,0 A - D 13,5 - 16,5 B - C 16,5 - 13,5 B - D 22,0 - 18,0 C - D 10,0 - 10,0 A: 43,5/90 B: 46,5/90 C: 45,5/90 D: 44,5/90 Was sagen die ELO-Zahlen? Und würde sich etwas ändern, wenn in 10 weiteren Partien A gegen B 6 weitere Punkte erzielen würde? ![]() |
|
||||||||||||
AW: ELO ist relativ
Das "Angstgegner" - Argument möchte ich gerne aufgreifen, weil es speziell beim Almeria 68020 und - umgekehrter Effekt - beim MonteCarlo IV anzutreffen ist. Ersterer tut sich schwer mit den Schröder-Programmen (MC IV, Nigl Short) und der MC IV hat zwar 211 Spiele gemacht, aber davon nun mal rund die Hälfte gegen diverse Programme von Richard Lang, die ihm offenbar gut liegen.
Nun, dann gibt es ein stolzes Rating für den MC IV (2018), der meiner Ansicht nach (ich selbst habe den Supermondial II) irgendwo zwischen MM IV und MM V besser aufgehoben wäre. Aber das liegt in der Natur der Sache. Ich verstehe jeden, der mit dem "kleinen" Schröder-Programm Partien gegen "Lang"-Rechner spielt. ![]() Einen weiteren Punkt, den ich für kritisch halte, ist wenn ein Programm gegen eine Vorgängerversion spielt. Das gibt dann mitunter zu klare Ergebnisse. Ich betreibe "Mephisto Polgar - MM IV /20 MHz" auch deswegen nicht weiter. Denn das würde den MM IV unverhältnismäßig schlecht aussehen lassen, das Rating nach unten "verfälschen". Gruß Wolfgang Von den Schröder Programmen am stärksten abschneidet. 12 Mephisto College 20/30 16 mm5 18,5/33 17 Nigel Short 18/30 20 Mega IV 15/32 21 Academy 15/31 25 Milano 13/30 Von rebel x, rebel oder polgar habe ich noch nicht genug Partien erspielt. Aber ist es nicht erstaunlich das dieser Ableger von es so gut Scored ?!
__________________
Die ganze Welt des Computerschachs Geändert von mclane (16.01.2016 um 21:01 Uhr) |
|
||||||||||||
AW: ELO ist relativ
Völlig richtig, nur welche Variante würdest du wählen? Gerade mit dem Blick auf das sehr breite Spektrum z.B. in der Aktivliste? Im Grunde passt da keines der Programme, denn je breiter die Streuung desto ungenauer wird die Liste.
|
|
||||||||||||
AW: ELO ist relativ
![]() Das Problem wird meiner Meinung nach von den Eröffnungsbibliotheken verstärkt. Viele Programme nehmen nach dem Buch in schlechter bewerteten Stellungen die Stellungswiederholung, egal gegen welchen Gegner. Ich habe für eigene Auswertungen irgendwann mal festgestellt, dass bei Siegen unterhalb von 80% alles noch ganz gut funktioniert, das war noch bevor ich von Bayes-ELO gehört habe. Remi Coulom hat aber schon eine Menge Gehirnschmalz verwendet, daher habe ich nur wenig Hoffnung auf eine weitere Verbesserung. |
|
||||||||||||
AW: ELO ist relativ
Die grundsache ist das noch immer die gespielten partien des forums mitglieder zum grundlage liegen !
Für mich mit solch eine umfangreiche Partien Datenbank sollte die Reihenfolge nicht wesentlich anders aussehen. Was die interpretation des entgegens betrifft wo A von B , B von C, C von D und D von A wiederum besiegt werd oder sonnstige fälle, sollte auf eine menge partien keine oder weniger eine rolle spielen, weil diese specifischen scenario (s) während die Anzahl des Partien nur theoretisch ist.... Der ELOzahl legt nur das Verhalten fest, der Zahl kann wie in dieser fall so um und bei 50 ELO abgewertet sein. Es schaut sich an wegend die abwertung des SC die entsteht, das es eher die SSDF liste ernähert, aber da sollte wirklich die zwei listen SC nach SC einander nachlegen und Ihren relativen Position in eine Tabellenkalkulationprogramm eingegeben werden um so etwas zu bestätigen. Wenn ich überhaupt über ELOstat/BayesELO lese, sollte BayesELO eher ausgeglichen sein. Vielleicht gibt es mitglieder die nicht einverstanden sind mit dem heutigen Reihenfolge, kann schon sein. Ich lese manchmal über die Polemik des SFC. Eine ELOzahl entspricht am besten die Zahl des DWZ/FIDE oder USCF. Die Schweden haben sich dahin gemischt und daher die ELO des brettcomputer abgewertet und dies war nicht für jeder Computer zu recht ! Einige erhielten sich verhaltnungsgemass im Partien eher gut aber trotzdem bekommten den gleichen abzug wie SC die , auf die erhaltene Partien, gar nicht zu recht kommten. Wenn es doch keine Konvertierung danach möglich ist, und partien gegen Mensche fehlen werde ich mich nicht mühen. Ich weiss nicht ob die Arbeit nicht all so gross ist, sonst konnte beide Statistiken auf die wiki liste angezeigt werden für Ihre fangemeinde, doch die Diskussion Pro oder Contra werde sicherlich nicht aufhören. Für mich ist es egal ich sehe es wie eine convention, mehr nicht. Ich glaube meine hunger nach noch eine Zahl wie es beim Menschenschach explodiert sei besänftigt (National Standard , National Blitz ..., Fide Standard, Fide Blitz,..., DWZ, Höllandischen ELO, ...) Ich werde auch bestätigen : Meine Statistikkenntnisse reichen zum verstehen, nicht zum erfinden ! Geändert von StefanT (17.01.2016 um 12:19 Uhr) |
|
||||||||||||
AW: ELO ist relativ
Eine ELOzahl entspricht am besten die Zahl des DWZ/FIDE oder USCF. Die Schweden haben sich dahin gemischt und daher die ELO des brettcomputer abgewertet und dies war nicht für jeder Computer zu recht ! Einige erhielten sich verhaltnungsgemass im Partien eher gut aber trotzdem bekommten den gleichen abzug wie SC die , auf die erhaltene Partien, gar nicht zu recht kommten.
Allerdings war das Vorgehen der Schweden mit einer Korrektur um 100 Punkte so nicht richtig (die 100 Punkte machen mich misstrauisch, hätte man um z.B. 93 Punkte korrigiert, dann wäre es für mich glaubhafter). |
|
||||||||||||
AW: ELO ist relativ
Ja natürlich nicht, manche Geräte wurden dadurch schwächer gemacht als sie in Wirklichkeit sind!
__________________
Schach ist das Spiel, das die Verrückten gesund hält. ![]() |
|
||||||||||||
AW: ELO ist relativ
Ja natürlich nicht, manche Geräte wurden dadurch schwächer gemacht als sie in Wirklichkeit sind! Nur damit die gepimpten Elozahlen der Spitzen-PC's im oberen Teil der Liste nicht aus dem Ruder liefen.
__________________
Schach ist das Spiel, das die Verrückten gesund hält. ![]() |
|
||||||||||||
AW: ELO ist relativ
Heute ist es egal ob die Spitze bei 3300 oder 3100 liegt, der Wert ist kaum vergleichbar mit den besten Menschen. |
![]() |
|
|