|
|||||||||||
AW: Mm5 nur 1575 ELO ??
Zitieren:
Das geht auch umgekehrt: ich könnte mir einen Labortest vorstellen:
Es melden sich x Freiwillige, deren ELOzahl bekannt ist. Sagen wir, deren ELO Schnitt sei 1700. Dann wählt der Tester zwei Geräte aus, eines mit 1700 und eines mit 2000. Der Tester lässt die Geräte gegen die Menschen spielen, wobei den Menschen das Gerät nicht bekannt ist- also keine Vorbereitung möglich. Die Partien werden nicht, oder erst am Ende veröffentlicht. Was wird herauskommen, signifikante Anzahl an Partien vorausgesetzt? Die beiden Compis performen mit einem geringeren Abstand als die 300! Wie Wolfgang2 schrieb wird nun "gestaucht". 1. Ich weiss zwar nicht welche Geräte bespielt werden, ich weiss aber dass es Computer sind, könnte also rein theoretisch eine Anti-Computer-Strategie fahren. Das würde das Ergebnis verfälschen. 2. Es ist nicht bekannt, gegen welche Gegner die 1700 bzw. 2000 erreicht wurden. Aber gut, das könnte man herausfinden. 3. Der Test müsste in mehreren Phasen durchgeführt werden. Einmal mit Geräten die eher taktisch orientiert sind, einmal mit Geräten die eher positionell orientiert spielen, wie die Langs. Es gibt immer Gegner mit denen man gut zurecht kommt und welche die einem weniger liegen. Will man also ein Zufallsergebnis ausschließen dann muss der Gegnerpool entsprechend breiter ausgelegt sein. Mit nur 2 Geräten käme man da nicht hin. Da wären Zufallsergebnisse vorprogrammiert. Und da ist es für mich mit Computern wie mit Menschen. Es gibt Gegner die mir liegen und wo ich auch nominell stärkere auseinandernehme und es gibt nominell schwächere Gegner gegen die ich kein Bein auf den Boden kriege. Allein diese Ergebnisse strafen die rein wertungsmäßig berechneten Gewinnerwartungen Lügen. Muss ich da dann auch stauchen? Allein daran sieht man doch wie unsinnig die Idee einer Stauchung ist. Und unabhängig vom Ergebnis eines solchen Tests habe ich ja erstmal nichts bewiesen, außer dass gewisse Spieler oder Computer andere Ergebnisse erzielen, wenn sich der Gegnerpool ändert. Um das zu beweisen muss ich mir nur ansehen wie ich persönlich gegen eine Gegnerschaft von sagen wir mal durchschnittlich ELO 2000 im eigenen Verein punkte (wo ich die Gegner und ihre Vorlieben und Spielweisen alle sehr gut kenne und mich entsprechend darauf einstelle) oder in einem gleichstarken fremden Umfeld (z.B. einem Open, oder in den Mannschaftskämpfen gegen fremde Gegner). Da könnte man genau denselben Effekt feststellen. Ich werde mit großer Wahrscheinlichkeit im eigenen Verein gegen bekannte Gegner anders punkten. Und sei es nur deshalb weil ich einer derjenigen bin, die sich auch auf bekannte Gegner gut vorbereiten während der Gegner vielleicht frank und frei drauflosspielt (findet man in Vereinsturnieren öfter mal). Muss ich jetzt dann die offiziellen ELO/DWZ-Listen stauchen weil es auch sowas wie eine Vereinsmeisterschaft gibt? Nein. Es zeigt doch nur dass ein Gegnerpool der klein gehalten ist, nicht so aussagekräftig ist, wie ein entsprechend großer Gegnerpool. Oder dass, wenn ich 2 Poole zusammenführe was anderes rauskommt als innerhalb der beiden separaten Poole. Aber dafür muss ich nicht Computer und Menschen vergleichen. Das kann man auch rein unter Menschen (oder wie gehabt im Vergleichskampf Hiarcs - Berlin Pro hier im Forum) ohne Probleme feststellen. Dazu muss ich nicht den Mensch-Maschine-Vergleich bemühen (auch wenn der sicherlich interessant sein dürfte). Insgesamt wäre so ein Labortest sicherlich interessant. Ob dann allerdings das von Dir oder Solvac vorweggenommene Ergebnis herauskommt wird sich zeigen. Bisher ist das erstmal nur Vermutung. Ich würde hier sogar eher ein anderes Testumfeld wählen, nämlich ein Turnier oder eine Wettkampfserie mit menschlichen und elektronischen Gegnern im etwa selben ELO-Level. Die jeweiligen Gegner dürfen sich jedoch nicht am Brett sehen und die Züge werden von Mittelsmännern ausgeführt. Das heisst, der Mensch weiss nicht ob er gerade gegen einen Computer oder gegen einen Menschen spielt. Mag sein, dass er es im Laufe der Partie aufgrund bestimmter dummer Computerzüge herausfindet, aber erstmal weiss er es nicht. Damit vermeide ich Anti-Computer-Strategien und erhalte ein unabhängiges Ergebnis. So einen Test würde ich auf jeden Fall als aussagekräftig ansehen, wenngleich auch da natürlich Zufallsergebnisse nicht auszuschließen wären. Zitieren:
Conclusio: Lassen wir die Listen wie sie sind, denn in der Welt der Compis stimmen sie ja. Eine Übertragung dieser Elozahl auf Menschen ist aber nur bedingt möglich
__________________
Mein Profil beim ICCF (International Correspondence Chess Federation) https://www.iccf.com/player?id=89948&tab=3 |
Folgender Benutzer sagt Danke zu Hartmut für den nützlichen Beitrag: | ||
Mythbuster (01.07.2017) |
|
|