Schachcomputer.info Community

Zurück   Schachcomputer.info Community > Schachcomputer / Chess Computer: > Die ganze Welt der Schachcomputer / World of chess computers


 
 
Themen-Optionen Ansicht

Prev Vorheriger Beitrag   Nächster Beitrag Next
  #11  
Alt 01.07.2017, 15:18
Hartmut Hartmut ist offline
Lebende Foren Legende
 
Registriert seit: 01.04.2010
Ort: Nürnberg
Alter: 60
Land:
Beiträge: 2.226
Abgegebene Danke: 3.403
Erhielt 1.644 Danke für 945 Beiträge
Aktivitäten Langlebigkeit
6/20 15/20
Heute Beiträge
0/3 sssss2226
AW: Mm5 nur 1575 ELO ??

 Zitat von borromeus Beitrag anzeigen
Ihr redet aneinander vorbei- solwac hat das Problem schon richtig erkannt, denke ich. Er sagt einfach nur, dass 2 Compis, die auf Menschen geeicht sind, wenn diese gegeneinander spielen eine höhere Elodifferenz aufweisen werden als die ursprüngliche.
Das sagt er eben nicht. Er spricht eben in diesem Zusammenhang von Gewinnerwartung. Und diese ist eben durch die ELO-Differenz festgelegt. Kann durchaus sein, dass diese beiden Geräte dann untereinander ein anderes Ergebnis einfahren und sich daraus dann eine höhere ELO-Differenz ergibt, wenn man die Partien auswertet. Aber das ist eben der Punkt. Ich muss eben einen solchen Wettkampf durchführen. Dann ergibt sich die neue ELO-Zahl und alles ist OK. Ich kann aber nicht einfach von vornherein sagen, dass bei diesen beiden Geräten die Gewinnerwartung anders ist. Genauso könnte ich dann sagen, wenn ich in meinem Verein andauernd die ELO-2000er niederknüpple (weil ich die kenne) ist die Gewinnerwartung größer als wenn ich gegen unbekannte 2000er aus einem anderen Pool antrete. Das ist zwar sehr wahrscheinlich, aber ich muss es eben in einem Turnier bestätigen. Darum macht man ja die ganze ELO-Rechnerei. Damit die ELO-Zahl in Relation zu einem möglichst großen Gegnerpool steht.


Zitieren:
Das geht auch umgekehrt: ich könnte mir einen Labortest vorstellen:

Es melden sich x Freiwillige, deren ELOzahl bekannt ist.
Sagen wir, deren ELO Schnitt sei 1700.

Dann wählt der Tester zwei Geräte aus, eines mit 1700 und eines mit 2000.
Der Tester lässt die Geräte gegen die Menschen spielen, wobei den Menschen das Gerät nicht bekannt ist- also keine Vorbereitung möglich. Die Partien werden nicht, oder erst am Ende veröffentlicht.

Was wird herauskommen, signifikante Anzahl an Partien vorausgesetzt?
Die beiden Compis performen mit einem geringeren Abstand als die 300!

Wie Wolfgang2 schrieb wird nun "gestaucht".
Warum soll man dann stauchen? Zuerst einmal gäbe es bei diesem Labortest einige Probleme.

1. Ich weiss zwar nicht welche Geräte bespielt werden, ich weiss aber dass es Computer sind, könnte also rein theoretisch eine Anti-Computer-Strategie fahren. Das würde das Ergebnis verfälschen.

2. Es ist nicht bekannt, gegen welche Gegner die 1700 bzw. 2000 erreicht wurden. Aber gut, das könnte man herausfinden.

3. Der Test müsste in mehreren Phasen durchgeführt werden. Einmal mit Geräten die eher taktisch orientiert sind, einmal mit Geräten die eher positionell orientiert spielen, wie die Langs. Es gibt immer Gegner mit denen man gut zurecht kommt und welche die einem weniger liegen. Will man also ein Zufallsergebnis ausschließen dann muss der Gegnerpool entsprechend breiter ausgelegt sein. Mit nur 2 Geräten käme man da nicht hin. Da wären Zufallsergebnisse vorprogrammiert. Und da ist es für mich mit Computern wie mit Menschen.

Es gibt Gegner die mir liegen und wo ich auch nominell stärkere auseinandernehme und es gibt nominell schwächere Gegner gegen die ich kein Bein auf den Boden kriege. Allein diese Ergebnisse strafen die rein wertungsmäßig berechneten Gewinnerwartungen Lügen. Muss ich da dann auch stauchen? Allein daran sieht man doch wie unsinnig die Idee einer Stauchung ist.

Und unabhängig vom Ergebnis eines solchen Tests habe ich ja erstmal nichts bewiesen, außer dass gewisse Spieler oder Computer andere Ergebnisse erzielen, wenn sich der Gegnerpool ändert. Um das zu beweisen muss ich mir nur ansehen wie ich persönlich gegen eine Gegnerschaft von sagen wir mal durchschnittlich ELO 2000 im eigenen Verein punkte (wo ich die Gegner und ihre Vorlieben und Spielweisen alle sehr gut kenne und mich entsprechend darauf einstelle) oder in einem gleichstarken fremden Umfeld (z.B. einem Open, oder in den Mannschaftskämpfen gegen fremde Gegner). Da könnte man genau denselben Effekt feststellen. Ich werde mit großer Wahrscheinlichkeit im eigenen Verein gegen bekannte Gegner anders punkten. Und sei es nur deshalb weil ich einer derjenigen bin, die sich auch auf bekannte Gegner gut vorbereiten während der Gegner vielleicht frank und frei drauflosspielt (findet man in Vereinsturnieren öfter mal). Muss ich jetzt dann die offiziellen ELO/DWZ-Listen stauchen weil es auch sowas wie eine Vereinsmeisterschaft gibt? Nein. Es zeigt doch nur dass ein Gegnerpool der klein gehalten ist, nicht so aussagekräftig ist, wie ein entsprechend großer Gegnerpool. Oder dass, wenn ich 2 Poole zusammenführe was anderes rauskommt als innerhalb der beiden separaten Poole. Aber dafür muss ich nicht Computer und Menschen vergleichen. Das kann man auch rein unter Menschen (oder wie gehabt im Vergleichskampf Hiarcs - Berlin Pro hier im Forum) ohne Probleme feststellen. Dazu muss ich nicht den Mensch-Maschine-Vergleich bemühen (auch wenn der sicherlich interessant sein dürfte).

Insgesamt wäre so ein Labortest sicherlich interessant. Ob dann allerdings das von Dir oder Solvac vorweggenommene Ergebnis herauskommt wird sich zeigen. Bisher ist das erstmal nur Vermutung.

Ich würde hier sogar eher ein anderes Testumfeld wählen, nämlich ein Turnier oder eine Wettkampfserie mit menschlichen und elektronischen Gegnern im etwa selben ELO-Level. Die jeweiligen Gegner dürfen sich jedoch nicht am Brett sehen und die Züge werden von Mittelsmännern ausgeführt. Das heisst, der Mensch weiss nicht ob er gerade gegen einen Computer oder gegen einen Menschen spielt. Mag sein, dass er es im Laufe der Partie aufgrund bestimmter dummer Computerzüge herausfindet, aber erstmal weiss er es nicht. Damit vermeide ich Anti-Computer-Strategien und erhalte ein unabhängiges Ergebnis. So einen Test würde ich auf jeden Fall als aussagekräftig ansehen, wenngleich auch da natürlich Zufallsergebnisse nicht auszuschließen wären.

Zitieren:
Conclusio: Lassen wir die Listen wie sie sind, denn in der Welt der Compis stimmen sie ja. Eine Übertragung dieser Elozahl auf Menschen ist aber nur bedingt möglich
In der Welt der Compis stimmen sie ja auch nicht wirklich, weil sie eben auf völlig andere Art berechnet wurden. Um hier den Wert eines ELO-Unterschieds von sagen wir mal 50 ELO beurteilen zu können, müsste ich die Berechnung als Otto-Normaldoof erstmal verstehen. Und da gibt es auf den Herstellerseiten zwar viele Formeln, aber die versteht man vielleicht als Mathematiker, nicht aber als Normalsterblicher. Deswegen kommt es ja immer wieder zu solchen fruchtlosen Diskussionen wie im CSS-Forum. Weil eigentlich keiner das Prinzip der verschiedenen Wertungssysteme versteht und weil jeder meint ELO darf auch was anderes sein, als die Berechnungsgrundlage von Arpad ELO und ist dann trotzdem vergleichbar. Kommt mir vor wie die PSH-Methode beim Superconny... geht aber da wie dort schief.
__________________
Mein Profil beim ICCF (International Correspondence Chess Federation)
https://www.iccf.com/player?id=89948&tab=3
Mit Zitat antworten
Folgender Benutzer sagt Danke zu Hartmut für den nützlichen Beitrag:
Mythbuster (01.07.2017)
 


Forumregeln
Du bist nicht berechtigt, neue Themen zu erstellen.
Du bist nicht berechtigt, auf Beiträge zu antworten.
Du bist nicht berechtigt, Anhänge hochzuladen.
Du bist nicht berechtigt, deine Beiträge zu bearbeiten.

BB code ist An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist An.

Gehe zu


Alle Zeitangaben in WEZ +1. Es ist jetzt 11:46 Uhr.



Powered by vBulletin (Deutsch)
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
©Schachcomputer.info