|
|
||||||||||||
AW: Spielstärke MMII
Und ja, die Frage ist ernst gemeint ... wenn der Gegner weiterhin 30 Sekunden hat, kannst Du bei dem Brute Force Programm ca. 120 Elo vom Schnellschachwert abziehen ... hat der Gegner aber auch nur 5 Sekunden, könnte er sogar stärker sein, da hier der Brute Force Rechner taktisch im Vorteil ist ... Grüße zurück, Sascha
__________________
This post may not be reproduced without prior written permission. Copyright (c) 1967-2024. All rights reserved to make me feel special. :-) |
|
|||||||||||
AW: Spielstärke MMII
Kommt aber natürlich darauf an, welche Bedenkzeit der Gegenüber hat. Im Schnellschach wären es etwa 2-3 Halbierungen und damit etwa 1600 Elo Geändert von AlexS (16.05.2024 um 23:32 Uhr) |
Folgender Benutzer sagt Danke zu AlexS für den nützlichen Beitrag: | ||
spacious_mind (17.05.2024) |
|
||||||||||||
AW: Spielstärke MMII
Hallo, an alle in diesem thread!
Pardon, aber das rechenmodell von Prof. Elo ermittelt keine absolute spielstärke, sondern immer nur relative werte zu den kontrahenten. Wenn A und B auf turnierstufe eine differenz von 50 Elo haben, dann sollte sich insbesondere bei computern auch bei allen anderen bedenkzeiten im statistischen mittel über viele gegner und viele partien der gleiche abstand von 50 Elo ergeben. Menschliche gehirne reagieren bei den verschiedenen bedenkzeiten nicht unbedingt einheitlich. Deshalb Saschas berechtigte frage: "Im Vergleich zu welcher Bedenkzeit beim Gegner? " Also wenn A plötzlich die x-fache bedenkzeit hat, verschieben sich die relationen mit großer wahrscheinlichkeit. Aber es sind und bleiben relative einstufungen. Es bedürfte hunderttausender partien in kreuzvergleichen, um da ein einigermaßen stabiles bewertungsgitter zu ermitteln. Viel spaß dabei! Viele grüße Horst ps. Hallo, Harry, eventuell war deine frage so gemeint, dass du gern einstufen möchtest, wie stark du spielst, wenn du gegen den MM II auf level 1 in mehreren partien ungefähr gleichstand erreichst. Für diesen fall kann ich die spielstärkeeinstellung empfehlen, die die Shredder-programme anbieten. Gewinnt man, erhöht Shredder automatisch (wenn es so eingestellt ist) seine spielstärke, und umgekehrt. Dadurch bekommt man ein ungefähres gefühl für die eigene spielstärke. Geändert von Wandersleben (17.05.2024 um 00:19 Uhr) |
Folgende 4 Benutzer sagen Danke zu Wandersleben für den nützlichen Beitrag: | ||
|
|||||||||||
AW: Spielstärke MMII
Mann kann aber im Computerschach die relative Spielstärke zwischen zwei Kontrahenten mit unterschiedlicher Bedenkzeit abschätzen.
|
|
||||||||||||
AW: Spielstärke MMII
Es gibt Unterschiede zwischen Brute Force und selektiven Programmen. Bei den Brute Force Brütern kann man tatsächlich sagen, dass jeweils ein Halbzug ca. 200 Elopunkte bringt ... allerdingt benötigen die meisten Programme die jeweils 7-fache Zeit für den nächsten HZ ... anhand dessen kann man hier schon ganz gut rechnen ... ... aber: Man weiß nicht, was konkret eine Verdoppelung bringt, da man bei keinem Zug weiß, kommt er hier entscheidend in den nächsten HZ oder nicht ... Bei selektiven Programmen spielen viele Faktoren eine Rolle, aber hier gibt es eindeutig Grenzen nach oben, rein aufgrund der Tatsache, dass sie irgendwann den falschen Zug zwangsläufig aus den falschen Gründen spielen, den sie für richtig halten ... oder weil sie einfach nicht tiefer kommen. Man kann das bei allen Programmen beobachten ... vor allem kann man sehr gut sehen, dass die Faustregel bei selektiven Programmen eine Verdoppelung = 70 Elo nicht lange funktioniert ... Dank den Geräten von Ruud und dem Phoenix kann man das bei allen Emus sehen ... die Zuwächse wurden immer geringer. Ich behaupte mal kühn, dass zum Beispiel der Glasgow bei einer weiteren Verdoppelung keine 10 Elo Punke gewinnen würde ... wenn es überhaupt noch messbare Gewinne gibt. Der Gipfel ist hier erreicht. Aber auch nach unten geht das nicht beliebig, sprich, immer weiter halbieren ... jedes Programm hat eine gewisse "Grundstärke", die es bei einem Halbzug inkl. seines Wissens und seiner Bewertungskriterien erreicht ... Insofern, wenn man ein Programm kennt und weiß, in welchem Rahmen die Zeit oder Geschwindigkeit gesteigert oder reduziert werden soll, kann man schon Aussagen treffen, muss aber immer die jeweiligen Grenzen kennen. Gruß, Sascha
__________________
This post may not be reproduced without prior written permission. Copyright (c) 1967-2024. All rights reserved to make me feel special. :-) |
Folgende 3 Benutzer sagen Danke zu Mythbuster für den nützlichen Beitrag: | ||
|
|||||||||||
AW: Spielstärke MMII
Abschätzen ist dafür ja das richtige Wort. Selbst die Elo-Werte in diversen Elo-Listen muss man immer in einer Schwankungsbreite sehen, dazu kommen noch die Testbedingungen, Bedenkzeit, usw.
Ein eindrückliches Beispiel finde ich immer, was passiert bei illegalen Zügen oder Abstürzen? Wiederhole ich die Partien für Ranglisten? Dann haben die Programme einen Vorteil, die nur in schlechten Stellungen abstürzen. Aber ist es gerecht Abstürze als Verlust zu werten? Ich will ja die Spielstärke messen, und nicht die Stabilität. Nächste Frage: Spiele ich bis zum Matt? Es gibt selbst Spitzenprogramme, die in gewonnener Stellung ein Patt fabrizieren. Breche ich solche Partien ab? Oder spiele ich zu Ende und benachteilige die Programme, die aktiv aufgeben? Selbst die Spezialisten die 10.000 Bulletpartien zwischen Engines spielen vergessen, dass diese Werte eben nur für Bullet gelten und schon in Blitzpartien ganz anders aussehen können. Kurz: Eine Wahrheit gibt es bei den Elo-Zahlen nie. |
Folgende 4 Benutzer sagen Danke zu AlexS für den nützlichen Beitrag: | ||
applechess (17.05.2024), Chessguru (17.05.2024), spacious_mind (17.05.2024), Wandersleben (17.05.2024) |
|
||||||||||||
Re: Spielstärke MMII
Dieser Beitrag und dieses Thema ist natürlich von Interesse, da ich alle diese Tests durchführe, daher habe ich gerade die 10 Renaissance-Tests mit MMII mit Mess plus Winboard auf Level 1 abgeschlossen. Mess plus Winboard eignet sich tatsächlich hervorragend, um die StartpositionFEN einzugeben und sofort zu spielen Verwenden Sie das Programm von diesem Zeitpunkt an, in diesem Fall mit MMII. Es endete wie folgt:
HTML-Code:
COMPUTER NAME LEVEL G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 RATING MEPHISTO II - 3.5 Mhz LV A6 2477 1398 1521 2049 1095 950 1308 1789 1435 1570 1559 MEPHISTO MM II - 3.70 MHz LV 1 2761 806 1215 1613 1630 1419 1276 1887 1166 1247 1502 Gruss Nick PS.. I should of course add that these final scores are how Stockfish 16.1 compares the moves played within these tests against with what SF16-1 would play and rates it accordingly move by move. Geändert von spacious_mind (17.05.2024 um 15:21 Uhr) |
Folgender Benutzer sagt Danke zu spacious_mind für den nützlichen Beitrag: | ||
Wandersleben (17.05.2024) |
|
||||||||||||
AW: Re: Spielstärke MMII
du drückst es richtig aus! Es kann kein absolutes Elo-niveau geben, sondern beruht immer auf der recht willkürlichen entscheidung, auf welchen grundwert man sich beziehen will. Deinen Renaissance-test eichst du an der spielstärke von Stockfish 16.1. Aber welche bedenkzeit hast du denn beim Stockfish vorgegeben? Wenn du die bedenkzeit anders gewählt oder ein anderes referenzprogramm genommen hättest, wäre die skala möglicherweise ein paar punkte höher oder niedriger. Das gleiche problem gibt es beim meeresspiegel. In jeder region der erde bezieht man sich auf ein anderes nullniveau. https://de.wikipedia.org/wiki/H%C3%B...er_L%C3%A4nder Bei menschen ist das niveau der Elo-zahl entscheidend davon abhängig, mit welchem anfangswert man neueinsteiger in die listen aufnimmt. Ein zu hoher einstiegswert führt zu einer inflation der werte, ein zu niedriger zu einer deflation. Im moment ist die FIDE-bewertung wohl in einer phase der inflation. Was sich mathematisch dadurch nicht ändert, sind die differenzen der Elo-zahlen (ps. und nur die sind das maß für die gewinnerwartung in einer partie.) Viele grüße nach Alabama Horst Geändert von Wandersleben (17.05.2024 um 15:52 Uhr) Grund: Ein halbsatz wurde ergänzt. |
Folgender Benutzer sagt Danke zu Wandersleben für den nützlichen Beitrag: | ||
spacious_mind (17.05.2024) |
|
||||||||||||
Re: AW: Re: Spielstärke MMII
Hallo, Nick,
du drückst es richtig aus! Es kann kein absolutes Elo-niveau geben, sondern beruht immer auf der recht willkürlichen entscheidung, auf welchen grundwert man sich beziehen will. Deinen Renaissance-test eichst du an der spielstärke von Stockfish 16.1. Aber welche bedenkzeit hast du denn beim Stockfish vorgegeben? Wenn du die bedenkzeit anders gewählt oder ein anderes referenzprogramm genommen hättest, wäre die skala möglicherweise ein paar punkte höher oder niedriger. Das gleiche problem gibt es beim meeresspiegel. In jeder region der erde bezieht man sich auf ein anderes nullniveau. https://de.wikipedia.org/wiki/H%C3%B...er_L%C3%A4nder Bei menschen ist das niveau der Elo-zahl entscheidend davon abhängig, mit welchem anfangswert man neueinsteiger in die listen aufnimmt. Ein zu hoher einstiegswert führt zu einer inflation der werte, ein zu niedriger zu einer deflation. Im moment ist die FIDE-bewertung wohl in einer phase der inflation. Was sich mathematisch dadurch nicht ändert, sind die differenzen der Elo-zahlen. Viele grüße nach Alabama Horst Ich habe im Emulator-Beitrag ein Beispiel gezeigt, bei dem ich 42 Ply tief gearbeitet habe. Man muss so ziemlich sitzen und jede Bewegung beobachten. Die meisten Bewegungen dauern jeweils ein paar Stunden, bevor Sie ein konsistentes Muster erkennen. Manche Bewegungen gehen natürlich viel schneller. Es gibt keine strenge Regel. Ich habe bereits erklärt, dass man in extremen Fällen manchmal bis zu einer Tiefe von 50+ und mehr vorgehen muss. Ich hatte eine, die ich 92 tief laufen ließ, bevor schließlich jeder Zug ein erzwungenes Schachmatt war und bevor SF fertig war es Matt in xx-Berechnungen. Sie müssen nur bei jeder einzelnen Bewegung konsequent sein. Keine Abkürzungen ps... der 42 Ply Beispiel dauerte 4 stunden. Bei Ihn wuerde ich wahrscheinlich wenn er im Test dabei waere den computer den ganzen tag laufen lassen nur bei dieser eine Stellung. Weiterer Ps.. Das ist auch der Grund wobei ich auch eine Stockfish 16-1 und alle andere Engines bei 3 minuten pro zug oder hoeher bewerten kann, ohne Bedenken. Ich denke es wird eine Weile dauern vor Ich diese test neu eichen muesste. Gruss Nick Geändert von spacious_mind (17.05.2024 um 16:08 Uhr) |
Folgender Benutzer sagt Danke zu spacious_mind für den nützlichen Beitrag: | ||
Wandersleben (17.05.2024) |
|
|
Ähnliche Themen | ||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Partie: Simultano-MMII | Mapi | Partien und Turniere / Games and Tournaments | 0 | 29.04.2016 16:55 |
Hilfe: Benötige Rat Spielstärke | MMartin | Die ganze Welt der Schachcomputer / World of chess computers | 18 | 31.12.2012 10:13 |
Frage: Spielstärke bei Schachcomputerprogrammen | User_549 | Die ganze Welt der Schachcomputer / World of chess computers | 35 | 31.01.2009 21:19 |
Frage: MMII im Mobilteil??? | user_175 | Die ganze Welt der Schachcomputer / World of chess computers | 2 | 24.09.2006 10:15 |
Anleitung: BDA für MMII | iuppiter | Die ganze Welt der Schachcomputer / World of chess computers | 3 | 28.01.2006 01:48 |