|
|
||||||||||||
Re: AW: Testellungen Ratings fuer Schachcomputers
Ich glaube, es ist gar nicht so einfach, mittels Stellungstests die Spielstärke von Schachcomputern zu ermitteln. Siehe z.B. meinen MMVI.Taktisch recht stark, aber positionell und Endspiel eher schwächer, so das sogar ein Mephisto II Brikett ihn schlägt, wenn er seine Spielart umsetzen kann. Ich glaube bald, man braucht sehr viele unterschiedliche Stellungen, um die Elozahl einigermaßen gut zu beurteilen. In dem Test sollten vielleicht auch einige Endspiele , z.B. Bauernendspiele oder ähnlich eingebaut werden. Dazu müssten aber noch mehr Teststellungen eingebaut werden. Ich habe das Gefühl, obwohl es jetzt schon sehr viel ist, das 40 Teststellungen immer noch zu wenig sind.
Ja einige Stellung werden bestimmt noch dazu kommen muessen. Endspiele werden die schwaecheren Programme aber sicherlich nicht helfen das wuerde einen CXG 3000 bestimmt nur weiter nach unten ziehen. Ich bin dabei mit einen alternativen Test der vielleicht interessant ist. Schaue mal spaeter den Post an Leonard Barden Test an was ich spaeter schreibe. Gruss Nick |
|
||||||||||||
AW: Re: AW: Testellungen Ratings fuer Schachcomputers
Mach ich !
|
|
||||||||||||
AW: Testellungen Ratings fuer Schachcomputers
Ein Test, der mit einigen Dutzend oder auch 100 Stellungen ein Schachprogramm bzw. -Computer zuverlässig bewertet kann es nicht geben. Dafür sind die Möglichkeiten einfach zu groß.
Bis auf wenige Einzelfälle können Stellungen nicht eindeutig bewertet werden, es bleibt also nur die heuristische Bewertung einer begrenzten Zahl von Eigenschaften einer Stellung. Hier kann der Programmierer immer nur Kompromisse eingehen und das Programm mit den am besten abgestimmten Kompromissen ist das stärkste. Übrig bleiben aber so viele Faktoren, dass sie mit wenigen Teststellungen nicht abgedeckt werden können. So z.B. entfernte Freibauern. Ein Programm ohne das direkte Wissen kann trotzdem taktisch einfach durch Suchen bei Teststellungen die richtige Lösung finden, verpasst sie aber im Spiel wo nach einem forcierten Abtausch nicht mehr genügend Rechentiefe übrig bleibt. Oder umgekehrt weiß das Programm zwar um die Kraft eines entfernten Freibauerns, aber diese Bewertungsfunktion ist langsamer als die eines Konkurrenten. Dadurch sinkt die kombinatorische Schlagkraft und das schlauere Programm verliert zu oft bevor das Wissen einen Vorteil bringt. Ein Test bringt auch ein festes Resultat (was ja auf den ersten Blick auch erstrebenswert ist), aber dadurch wird die "Wirklichkeit" nicht gut abgebildet. Bei einem Schachprogramm wird nämlich das Ergebnis in einer Rangliste sehr stark von der Auswahl der Gegner gesteuert. Dies kann man sehr schön bei der Liste des SSDF sehen. Manche Programme haben Wettkämpfe zu 20 Partien bestritten, oft wurde aber auch von der 20 abgewichen. Dadurch werden solche Matches über- oder unterschätzt. Zusammen mit den Unwägbarkeiten der Eröffnungsbibliothek schätze ich den "Fehler" (es ist eher einfach Unsicherheit) auf bis zu 100 Elo ein. Das ist schon eine ganze Menge und kommt noch auf den statischen Fehler, der nach 10.000den von Partien wenigstens auf +-5 zurück geht. |
![]() |
|
|
![]() |
||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Frage: wie pflegt man das holzbrett des schachcomputers? | OliverWeh | Die ganze Welt der Schachcomputer / World of chess computers | 63 | 04.01.2017 11:40 |
Frage: Software fuer FinalChesscard fuer PC? | nalkem | Technische Fragen und Probleme / Tuning | 13 | 18.08.2009 22:28 |