|
|
||||||||||||
Mm5 nur 1575 ELO ??
Hallo,
ich weiß, ich werde diese Frage bereuen. Aber die Diskussion kommt ja immer wieder auf. Momentan so nebenbei im CSS-Forum. Allerdings sollten wir diese Thematik aus diesem Thread wohl auslagern, sondern wird Kurt sauer, da es hier um seine gespielten Partien geht. Thoralf Karlsson: "Unsere Hoffnung ist, dass die SSDF-Einstufung der Top-Programme jetzt besser mit der Elo-Rangliste übereinstimmt. Falls die bisherige Überbewertung durch einen "Spreiz-Effekt" verursacht wurde, ist es gut möglich, dass ältere und schwächere Ranglisten-Teilnehmer besser gegen Menschen spielen, als es durch ihre Einstufung in der SSDF-Rangliste zu erwarten ist. Wichtiger ist für uns aber, dass die Top-Programme eine möglichst korrekte Bewertung erfahren. We used the following computers Tournament Performance Rating against humans for a attempt to calibrate the elo towards the human elo. The games were played between 1987 and 1991.In 2000 we thought that this list was obsolete. We then took 115 suitable games from Chris Carson's collection of Man vs Machine games and made a new calibration. We had to lower the list with 100 points." Und rein zufällig ergab sich die exakte Zahl von 100 Punkten. Ja, muss ich zugeben, hört sich recht glaubwürdig an. Aber auch mit 100 Punkten weniger wurden die neuen Zahlen akzeptiert. All die Jahre war es die heilige Liste der Schachcomputerverrückten. Geeicht und erstellt anhand von Partien gegen Menschen. Im Jahr 2000 dann die Änderung um 100 Punkte. Warum genau 100? Egal, passt schon. Aber die Zeiten ändern sich. Mittlerweile wird die SSDF Liste in den einschlägigen Engine-Foren nicht mehr ernsthaft akzeptiert, da obsolet. Man greift lieber zu den neuen, schnelllebigen Listen, die die Top-Engines im Elo Bereich von 3100-3600 (je nach Bedenkzeit) ansiedeln. Wohl gemerkt rein rechnerisch, denn eine empirische Grundlage für menschliche Elo-Zahlen fehlt allen diesen Listen. So gut diese Listen auch die Abstände oder Zugewinne von Engines ausweisen können, mit menschlichen Elo Zahlen haben diese Listen nichts zu tun. Es sind rein theoretische Zahlen. Sollte ich falsch liegen, bitte ich um Turniere mit menschlichen Gegnern, wo die Top Engines ihre Elo Zahlen unter Beweise stellen konnten. Warum also sollte diese Listen dann als beweisführend für menschliche Elo Zahlen gelten? Und genau da liegt der große Unterschied zu der SSDF oder auch zu unseren Listen. Wobei, ich erwähne es immer wieder, die Schachcomputer.info Elo Listen (= Wiki Elo Liste) sind meine, rein privaten Listen. Nie extern von mir beworben, immer als meine private Spielerei tituliert. Geltungsbereich maximal für die Schachcomputer.info Seiten. Wer Spaß daran hat, schaut sie sich an, schmunzelnd vielleicht, bricht in lautes Lachen aus, nickt zustimmend oder zieht schulterzuckend weiter. Der damalige Startwert basiert auf der SSDF Liste vor der Abwertung. Aber natürlich sind all diese Elo Werte für Schachcomputer völlig falsch, das ist mir schon klar. Sie waren es immer und werden es immer sein. Diese Werte sind mindestens 100, vielleicht 200 oder sogar 350 Elo zu hoch. Die Begründungen warum alles Mist war und ist, sind vielfältig. Im CSS Forum wird gerade eine neue Behauptung aufgestellt. Auch sehr schön, wie ich finde. Was mich bei der ganzen Betrachtung wundert ist folgendes. Warum in aller Welt versagen menschliche Spieler in diversen Turnieren immer wieder gegen die völlig zu hoch eingestuften Schachcomputer? Schaue ich zu den regelmäßig ausgetragenen Turnieren von Luis (MECA - http://www.meca-web.es/torneos.htm) nach Spanien oder nach Holland, ich erinnere an die diversen Aegon Turniere, immer wieder haben wir es mit Schwächlingen aus der menschlichen Gattung "Schachspieler" zu tun. "Schwächlinge", die sich ihre Elo Zahlen anhand von Partien erspielt haben. Wie kann das sein? Fragen über Fragen... Gruß Micha |
Folgende 7 Benutzer sagen Danke zu Chessguru für den nützlichen Beitrag: | ||
Egbert (27.06.2017), Mapi (27.06.2017), MaximinusThrax (27.06.2017), Oberstratege (28.06.2017), RetroComp (27.06.2017), Robert (28.06.2017), Theo (28.06.2017) |
Folgender Benutzer sagt Danke zu borromeus für den nützlichen Beitrag: | ||
Oberstratege (28.06.2017) |
|
||||||||||||
AW: Tasc R30 - Utzinger,K (01), Rapid 60'
Hallo,
bei Turnieren zu Hause Mensch gegen Computer müßte man natürlich schon auf eine starke Ehrlichkeit bauen. Dabei steht einem jedoch die eigene Eitelkeit ein bisschen im Wege. Gewinnpartien stellt natürlich jeder gerne ein und lässt sich dafür auf die Schulter klopfen. Dagegen stellt man Verlustpartien natürlich nicht so gerne ein, erst recht nicht wenn man auch noch sehr "dumme" Fehler begangen hat und man dafür auch noch kritisiert wird. Die Verlockung einen schlechten Zug zurückzunehmen ist ja auch noch da. Nicht das ich falsch verstanden werde, ich glaube schon das hier im Forum sehr viele sehr ehrlich wären, ich glaube aber trotzdem das bei einem öffentlichen Turnier mit Schiedsrichter das Ergebnis anders aussehen würde und zwar zugunsten der Computer. Viele Grüße Jürgen |
|
||||||||||||
AW: Tasc R30 - Utzinger,K (01), Rapid 60'
Sehe ich ähnlich. Zu Hause im stillen Kämmerlein ist man keinem Druck ausgesetzt, in einem öffentlichen Wettkampf oder auch einem Mensch-Computer-Turnier wie früher AEGON, hat man immer Kiebitze um sich herum, eventuell Lautstärke etc. Da passiert schneller mal ein Lapsus und schon ist die Partie für den Menschen hin.
__________________
http://chess-computer.blogspot.com/ |
|
||||||||||||
AW: Tasc R30 - Utzinger,K (01), Rapid 60'
Hallo Karl,
Zitieren:
Würde man Affen Schach beibringen hätte da wohl auch irgend ein OberAff 2850ELO- der aber- relativ zu Menschen nur 700ELO hätte. Das ist eine Eigenschaft des ELO- Systems. Es misst keine absolute Stärke.
1992 veröffentlichte die CSS (Heft 1 / Feb.-März 1992 / Seite 26ff) eine Schachcomputer (+ Großrechner) Rangliste von Werner Stowasser. Diese basierte auf 4618 Partien gegen Menschen und 29617 reinen Computerpartien. Für heutige Verhältnisse keine überragende Datenbasis, aber zumindest eine gute Basis für eine Auswertung die auf Fakten beruhte. Zitieren:
Wenn man zwei unterschiedliche Welten der relativen Bewertung von "Stärken" vergeichen will, muss man diese "erden" also eine Relation zwischen diesen Systemen herstellen.
Und da ist meine Schätzung eben 200, egal ob jetzt real 176 oder 228.... das ist ein Gefühl, mehr nicht. Meine Sicht: Schaut euch die Abstände der Geräte untereinander an und seht unsere Listen maximal als Anhaltspunkt. Aber mit Argumenten wie momentan im CSS Forum geäußert, kann ich nichts anfangen. Aber ich bin immer an neuen Listen für Schachcomputer interessiert. Wer andere Listen vorlegen kann, die auf ausreichenden menschlichen Vergleichen beruht, immer her damit. Gruß Micha |
Folgende 6 Benutzer sagen Danke zu Chessguru für den nützlichen Beitrag: | ||
Egbert (27.06.2017), Mapi (28.06.2017), MaximinusThrax (27.06.2017), Oberstratege (28.06.2017), paulwise3 (27.06.2017), RetroComp (27.06.2017) |
|
||||||||||||
AW: Tasc R30 - Utzinger,K (01), Rapid 60'
Genau so sieht es nämlich aus!
Fast bin ich versucht abzulästern: jeder möge sich seine eigene Liste rahmen und sich über's Bettchen hängen, wenns schee macht.... und beim Einschlafen hilft... Da ich aber nie nieee Gehässig bin läster ich auch nicht... In diesem Sinne, auf die Richtige Liste und schlaft schön! Otto
__________________
Schach ist das Spiel, das die Verrückten gesund hält. (Albert Einstein) |
|
|||||||||||
AW: Tasc R30 - Utzinger,K (01), Rapid 60'
ehrlich gesagt verstehe ich nicht was Du hier sagst, denn ich habe keine Kritik geübt, sondern nur geschrieben, dass die Compi-ELO Liste im Vergleich zu Menschen aus meiner Sicht um 200 ELO's zu hoch ist, speziell im Bereich ab etwa ELO 1900/2000. Das ist, wie ich schon schrieb, vermutlich ein Effekt der taktischen Fähigkeiten/Unfähigkeiten der Compis, die DEREN Differenz ergeben. Ich weiss nicht, ob Du selber Turnierschach/Meisterschaft spielst- aber ein ELO2000 Mensch spielt weitaus unangenehmer als ein Novag Diablo. Ein Kurt (19xx) putzt in einer Partie einen R30 weg, ein Wolfgang zerlegt die Geräte laufend (auch wenn wir seine Verlustpartien (möglicherweise gibt es diese ja nicht) nicht sehen)- aber er hat laut eigenen Angaben etwa 1800, und ich aktuell 1762, performe mit 2100. Was wäre wohl hier der korrekte Schluss? Lediglich, dass die ELO- Zahlen der Compis wohl zu hoch liegen. Also, bei allem Respekt, es wurde hier keine Kritik geübt- woran auch? Die Daten der Compis liegen ja vor und daraus ergibt sich unter einer Basisvoraussetzung eben eine ELO Zahl. Das heisst aber nicht, dass diese auf Menschen bezogen stimmen, bzw. nur weil diese irgendwann vor 25 Jahren mit "wenigen" Partien mitgeeicht wurden, heute eine reale Aussage darstellen. So long, in keiner Weise wollte ich was kritisieren, sry wenn Du das so aufgenommen hast, aber eine Meinung wird ja erlaubt sein. Gruß Karl |
|
|||||||||||
AW: Tasc R30 - Utzinger,K (01), Rapid 60'
"um Elo 1800" war mal eine Schätzung von drei Elo 1900-2000 Spielern gegen die ich einige Aktivpartien spielte. Das ist aber um die 20-25 Jahre her. Im Blitzspiel bin ich deutlich schwächer, auch gegen Computer. Vielleicht Elo 1500, ich weiß es nicht. Ich möchte auch nicht sagen, dass ich die Geräte "zerlege" (trotzdem Danke für das Lob ). Was ich hier zeige, ist eher, dass es eine Menge von Schwachpunkten gibt, die man ausnutzen kann. Gruß Wolfgang |
|
||||||||||||
AW: Tasc R30 - Utzinger,K (01), Rapid 60'
Hallo zusammen,
Eigentlich müssten wir eine eigene Bezeichnung verwenden, wie es ja z. B. der Deutsche Schachbund mit DWZ und sein US-Amerikanisches Pendant mit seinem USCF-Rating machen. Also z. B. sowas wie "SCIR" (SchachComputer.Info-Rating) Dann hätte sich diese ganze Diskussion erledigt und es sollte dann klar sein, dass unsere Listen mit menschlichen ELOs wenig bis nichts zu tun haben. Und jetzt sollten wir hier den Platz wieder für Kurt und seine Partien freimachen (und die Diskussion auslagern, wenn es noch weitergehen sollte) viele Grüße Robert |
Folgende 2 Benutzer sagen Danke zu Robert für den nützlichen Beitrag: | ||
Oberstratege (28.06.2017), Wolfgang2 (28.06.2017) |
|
||||||||||||
AW: Tasc R30 - Utzinger,K (01), Rapid 60'
Hallo Robert,
Ich sehe das Problem unter anderem darin, dass man als Schachspieler den Begriff "ELO" mit Wertungszahlen von Menschen gleichstellt. Und jemand, der mit Computerschach nicht soviel am Hut hat, vergleicht unsere Zahlen unwillkürlich mit "menschlichen" ELO; doch das klappt natürlich nicht, weil unsere Liste nicht mit Computer vs Mensch-Partien geeicht ist (oder zumindest mit viel zu wenigen)
Schon vor Jahren habe ich Diskussionen wegen dieser sch... Listen geführt. Beispiel: "Ich habe gegen Gerät XY immer so um die 50% geholt und damals hatte ich 1800 Elo. Also MUSS dieses Gerät in der Liste auch 1800 Elo haben... Du musst das sofort ändern." Es war und wird immer das Gleiche sein. Lustig an der Sache, irgendwie scheint kaum mal jemand gegen ein Gerät zu verlieren. Womit wir wieder bei dem Thema "stilles Kämmerlein" wären. Zitieren:
Also z. B. sowas wie "SCIR" (SchachComputer.Info-Rating)
Mittlerweile sehe ich solche Diskussionen mit einer gewissen Gelassenheit. Die Diskussionen verlaufen eigentlich immer nach dem gleichen emotionalen Prinzip. Man zieht Rückschlüsse aufgrund des eigenen Spiels gegen Geräte/Programme..., weil die eigene Elo Zahl oder die man meint zu haben, als Faktum erst einmal steht. Und genau aufgrund dieser eigenen Erfahrungen, sollten entsprechende Elo Listen dann auch aussehen. Problem an der Sache, jeder hat seine eigenen Erfahrungen gesammelt und würde immer darauf pochen, das genau er aber völlig richtig liegt mit seiner Einschätzung. Womit wir wieder bei den 100, 200 usw. Punkten Problematik anfangen. Ich könnte nun Partien vorlegen, wo 2200/2300 Elo Spieler gegen starke Geräte verloren haben. Würde aber an dem Standpunkt nichts ändern. Ein Standpunkt sollte aber nicht nur das sein, worauf man ständig stehen bleibt. Was ich mit meinem ganzen Gequatsche in den Postings zuvor ausdrücken wollte, ist eigentlich recht simpel. Aus meiner Sicht wird viel zu sehr auf dem eigenen Standpunkt beharrt. Man möchte nicht mit anderen Fakten belästigt werden, da die eigene Meinung ja völlig korrekt ist. Zumindest aus der eigenen Sicht... Warum nur sieht man die Sache so verkrampft? Persönlich ist es mir völlig egal, ob unsere Listen nun bei 2400, 2200 oder 2000 oder wo auch immer beginnen, denn allen kann man es nie Recht machen. Aber nur den Blick ausschließlich auf die eigenen Erfahrungen zu richten und keine anderen Fakten zu akzeptieren, ist mir dann doch etwas zu einfach gedacht. Nochmal zu den info Listen. Gründe für die Erstellung der Listen waren für mich (oder uns damals) auch fragwürdige Aktionen seitens der SSDF wie z.B. Stichwort Mephisto MM IV Turbo. Aber auch die Einschätzungen einiger Geräte, die nicht aus dem Hause Mephisto stammten, waren für mich immer etwas seltsam. Auch der seltsame Zuwachs von immer so um die 20 Elos bei neuen Mephisto Geräten oder die anfangs zu hohe Einordnung von Neuerscheinungen. Mein Ansatz war einfach. Ich wollte eine kostenlose Liste, die nur auf Partien beruht, die von freien Testern gespielt wurden. Keine Beeinflussung von Firmen, Herstellern etc. und ich wollte somit eine Vergleichbarkeit zu den alten SSDF Listen erstellen. Ob nun mit 100 Elo mehr oder weniger, who cares? Bei aller berechtigten und unberechtigten Kritik (oder Äußerungen, bevor sich jemand angegriffen fühlt...) an den Werten, habe ich 2 abschließende Fragen. 1. Ist es sinnvoll Listen zu erstellen? 2. Wenn ja, wie sollte diese dann aussehen und auf welchen Fakten beruhen? Vielleicht könnte jemand eine Liste einstellen, die nach eurer Meinung Elo Werte korrekt wiedergibt. Gruß Micha |
Themen-Optionen | |
Ansicht | |
|
|