|
|
||||||||||||
Re: AW: Rating Tests - Dritter Versuch
Hi!
Eines vorweg: Du schreibst, es würde Spaß machen und das ist auch das wichtigste! Ohne Spaß wäre ein Hobby auch fehl am Platz. Aber ich hoffe, Du legst dich nicht zu sehr auf das Ergebnis in Form einer Elozahl fest. Denn beim nach spielen mit verschiedenen Computern testest Du nicht die Spielstärke, Du testest die Übereinstimmung mit dem 3000+-Schachprogramm. Diese ergibt sich bei ganzen Partien aber nicht nur aus kritischen Stellungen sondern auch aus Stellung mit mehreren praktisch gleichwertigen Zügen. Bei solchen Zügen ist die Übereinstimmung aber nicht unbedingt an die Spielstärke gekoppelt. Ein Beispiel zur Erläuterung: Die Partie bestehe aus fünf Zügen, von denen vier jeweils auch Alternativen haben und einer eine Gewinnkombination einleitet. Das Schachprogramm gibt fünf Züge vor, darunter auch die Kombination. Schachcomputer A wählt jetzt die ersten vier Züge gleich und findet die Kombination nicht – macht 80%. Schachcomputer B wählt bei den ersten vier Zügen Alternativen, findet aber die Kombination – macht 20%. Ist A jetzt stärker als B? ![]() Eine Idee zur Verbesserung, von der ich das Ergebnis nicht abschätzen kann: Du erstellst für soundso viele Stellungen (diese können einer Partie entspringen, besser aber eher unabhängige Positionen) eine Liste der Alternativen mit der Bewertung durch das starke Schachprogramm. Dazu kann der Multivariantenmodus genutzt werden. Die Schachcomputer suchen dann jeweils mit der gewünschten Stufe (z.B. Turnierstufe) in jeder Stellung ihren besten Zug. In die Wertung geht dann jeweils die Differenz der Bewertungen des Schachprogramms für die beiden Züge (Referenz des Schachprogramms und gewählter Zug des Schachcomputers). Wieder ein Beispiel: In der Eröffnungsstellung gibt das Schachprogramm folgende Bewertungen zurück: e4 (0,10), d4 (0,09), Sf3 (0,08), … , h3 (-0,12). e4 ist also der vom Schachprogramm gewählte Zug und die Alternativen sind bis 0,22 schlechter. Folgt ein Schachcomputer jetzt den Zügen des Programms, dann wird ein solcher Zug mit 0 in die Auswertetabelle eingetragen. Im Beispiel würde für die Alternative d4 also -0,01 eingetragen, weil dies der Differenz zwischen 0,10 und 0,09 entspricht. Auf diese Art werden geringe Abweichungen auch mit nur einem kleinen Malus gewertet, Fehler hingegen schlagen kräftig zu Buche. Diese Auswertetabelle enthält jetzt die Rohdaten, für die genaue Bewertung der Ergebnisse müsste man sich die Daten noch einmal getrennt anschauen. Ebenso müsste man bei Mattankündigungen eine Entsprechung finden, denn eigentlich bedeutet Matt ja nach der Spieltheorie einen Wert von unendlich. Die Praxis der Schachprogramme ist natürlich pragmatischer. Aber diese Auswertung kann man schnell mit Excel machen, der Aufwand steckt in der Ermittlung der Rohdaten. P.S. Einen Vorteil für die Durchführung der Tests sehe darin, dass es nur um den gewählten Zug eines Schachcomputers in einer bestimmten Stellung auf einer bestimmten Stufe geht. Es geht nicht um die exakte Lösungszeit, was ja bei manchen Geräten nur durch absolute Aufmerksamkeit feststellbar ist. Auch entspricht die Auswahl des Zuges genau dem, was als Unterschied bei unterschiedlich getakteten Versionen eines Schachcomputers beobachtet wird – in manchen Stellungen wird ein anderer Zug gefunden. Ja, das problem ist ich moechte auch ein CC1 als Beispiel vergleichen koennen. (CC1 is eigentlich ein scherz er kann ja nicht zugruckgaben machen ![]() Man sollte nicht vergessen das ich einen Test suche fuer saemtlichen Brettschachcomputers als aller erste, daher ist es nicht moeglich ins Baumstamm zu schauen bei den Meissten alten schwachen Schachcomputers. Wie in meine obigen Beispiele, da spielt ein CXG 3000, CC9, MK12 und Constellation Junior. Daher den Weg du erwaehnst geht hier nicht so richtig ausser ich mache das nur fuer die Top Brettcomputers und dann Lohnt sich das nicht mehr. Der Trick ist man muss einige solche Spiele machen ein Test Spiel reicht nicht aus. Ich habe schon zum Teil 6 spiele Random Bewertet und ich weiss das es Spiele gibt wo der eine Programmierer oder der andere besser abschneidet. Aber im gross und ganzen gleicht sich das wieder aus und die besten programme liegen oben und die schwachen unten. Man soll auch nicht eins vergessen in den obigen ersten Test Spiel, der RS2250 Brute Force spielt zu 81% den besten Zug in 24 Zuegen. Das ware insgesamt um 81% zu erreichen kein Zufall mehr ![]() Ein Morsch spielt sehr Aktiv und das obige Spiel zeigt nur das der Gegner von Botvinnik mit so einen Spiel Stil auch gegen ein Morsch verlieren wuerde ![]() Hier sind die Spiel arten die ich mit den naechsten Testspielen dazufuegen werde: Aktiv Zentrum 2 Spiele Positionell 3 Spiele Angriff 2 Spiele Verteidigung 3 Spiele Kombination 2 Spiele Endspiel 2 Spiele Insgesamt 14 Spiele * ca 25 Zuege = 350 Zuege = ca 1120 Punkte. Zum Schluss wird es auch fuer Brettcomputers ausgeglichen sein und sie werden gegeneinander vergleichbar sein. Das mit den ELO macht Spass, aber daneben stehen auch die Punkte und der Prozentsatz. Hier gibt es 3 wege fuer einen Vergleich. Punkte, % und Nick's ELO ![]() ps Ich habe schon 6 Tests fast zu ende Bewertet mit 11 Computers und es klappt hervorragend jedes mal. Viele Gruesse, Nick Geändert von spacious_mind (28.05.2013 um 14:35 Uhr) |
|
||||||||||||
Re: Rating Tests - Dritter Versuch
Hallo Solwac,
Noch ein paar weitere bemerkungen zu dein Post. 1) Unabhaengige Positionen. Hier wuerde ich keinen Weiteren Test machen. Ich habe es ja schon versucht. Das klappt nicht gut fuer Brett Computers. Ich habe ca 50 volle Tests die man damals gemacht hat, von BT 2450, 2630, 2830. Fine Test Kaufmann Test usw usw. Keiner von den Funktioniert richtig weil alle mit der Hand ausgwaehlt wahren und bestimmte Programme haben daher Ihre Vorteile und bestimmte Programme Ihre nachteile. Ausserdem die Stellung ist die geschmack sache der Person und nichts mehr. 2) Baumstamm analysieren Ich finde das auch nicht der Richtige Weg. Ich versuche mal zu erklaeren wieso. Alte Schachcomputers leben fuer Heute und nicht fuer Morgen. Damit meine ich das ein Zug wird gerechnet und der Computer entscheidet sich fuer seinen besten Zug und die meissten rechnen nur innerhalb 30 sekunden 4 ply Tief. Daher so wie ein Mensch muessen sie sich entscheiden welcher der beste Zug ist. In Ihren Kopf haben sie auch zum teil die analyse fuer diese entscheidung. Der computer der pondert hat dann hier seinen Vorteil und manchmal auch seinen Nachteil wenn er zu selektiv rechnet. Der Gegner spielt jetzt sein gegen Zug und der Computer muss ploetzlich wieder von neu Rechnen weil zu 80% (wenn er die Pondern faehigkeit hat) spielt der Gegner ein Zug was er nicht in sein Gehirn erwartet hatte. Und so nach einer Rechnenzeit, entscheidet er sich wieder fuer was er meint der beste Zug ist. Den Baumstamm zu Analysieren hat hier kein Sinn weil der Brettcomputer Zug fuer Zug neu Rechnet (zu 80%) und wieder Entscheidet was fuer Ihn der Beste Zug ist. Es ist diese entscheidung (diesen Fakt) die ich in mein Rating Test bewerte und nicht was die Zukunft vielleicht bringt oder nicht bringt. 3) Computer Analyse. Ich habe absichtlich ein Programm genommen was viel staerker ist als ich damit ich keine selbst entscheidung hier mache. Das gleiche mit der 21 Ply. Ich nehme an das die besten Zuege Bewertet sind und mit dieser Bewertung werden die Computers verglichen. Auch mein Punkt System ist Haar genau gerechnet (siehe unten). Ich koennte auch 5 von den besten Programme nehmen und den Durchschnitt deren 10 Besten Zuege rechnen. Das waere vielleicht noch genauer aber wuerde dann 5 mal so lange dauern um vielleicht 0,1 (ein Zehntel) zu aendern in der bewertung. ![]() Wie die obige Bewertungtabelle es auch Zeigt. Die Computers finden schon gute Zuege die auch eine Belohnung bekommen. viele Gruesse, Nick Geändert von spacious_mind (28.05.2013 um 15:39 Uhr) |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Re: Rating Tests - Dritter Versuch
Ich habe soeben das Top Engine was ich benuetzte fuer die Bewertungen diesen Test spielen lassen und auch den MChess Pro 5.0 auf einen Pentium P75.
Hier sind jetzt die Ergebnisse: viele Gruesse, Nick |
|
||||||||||||
AW: Re: Rating Tests - Dritter Versuch
Hm, ich habe mich wohl nicht deutlich genug ausgedrückt. Es scheint einige Missverständnisse zu geben.
![]() Ja, das problem ist ich moechte auch ein CC1 als Beispiel vergleichen koennen. (CC1 is eigentlich ein scherz er kann ja nicht zugruckgaben machen
![]() Man sollte nicht vergessen das ich einen Test suche fuer saemtlichen Brettschachcomputers als aller erste, daher ist es nicht moeglich ins Baumstamm zu schauen bei den Meissten alten schwachen Schachcomputers. Wie in meine obigen Beispiele, da spielt ein CXG 3000, CC9, MK12 und Constellation Junior. Daher den Weg du erwaehnst geht hier nicht so richtig ausser ich mache das nur fuer die Top Brettcomputers und dann Lohnt sich das nicht mehr. Spielt man eine Partie nach, so können sogar Schachcomputer ohne Stellungseingabe verwendet werden wenn ein Zug zurückgenommen werden kann. Es braucht noch nicht einmal eine nummerische Bewertung, es reicht der ausgewählte Zug auf einer Stufe. 1) Unabhaengige Positionen.
Hier wuerde ich keinen Weiteren Test machen. Ich habe es ja schon versucht. Das klappt nicht gut fuer Brett Computers. Ich habe ca 50 volle Tests die man damals gemacht hat, von BT 2450, 2630, 2830. Fine Test Kaufmann Test usw usw. Keiner von den Funktioniert richtig weil alle mit der Hand ausgwaehlt wahren und bestimmte Programme haben daher Ihre Vorteile und bestimmte Programme Ihre nachteile. Ausserdem die Stellung ist die geschmack sache der Person und nichts mehr. 2) Baumstamm analysieren
Ich finde das auch nicht der Richtige Weg. Ich versuche mal zu erklaeren wieso. Alte Schachcomputers leben fuer Heute und nicht fuer Morgen. Damit meine ich das ein Zug wird gerechnet und der Computer entscheidet sich fuer seinen besten Zug und die meissten rechnen nur innerhalb 30 sekunden 4 ply Tief. Daher so wie ein Mensch muessen sie sich entscheiden welcher der beste Zug ist. In Ihren Kopf haben sie auch zum teil die analyse fuer diese entscheidung. Der computer der pondert hat dann hier seinen Vorteil und manchmal auch seinen Nachteil wenn er zu selektiv rechnet. Der Gegner spielt jetzt sein gegen Zug und der Computer muss ploetzlich wieder von neu Rechnen weil zu 80% (wenn er die Pondern faehigkeit hat) spielt der Gegner ein Zug was er nicht in sein Gehirn erwartet hatte. Und so nach einer Rechnenzeit, entscheidet er sich wieder fuer was er meint der beste Zug ist. Den Baumstamm zu Analysieren hat hier kein Sinn weil der Brettcomputer Zug fuer Zug neu Rechnet (zu 80%) und wieder Entscheidet was fuer Ihn der Beste Zug ist. Es ist diese entscheidung (diesen Fakt) die ich in mein Rating Test bewerte und nicht was die Zukunft vielleicht bringt oder nicht bringt. Den Effekt guter Vorhersagen und damit erfolgreicher Ponderei ist schwer zu erfassen. Da hier das Timing der gegnerischen Züge entscheident ist, würde ich das nur im direkten Vergleich testen. Stellungstest können das nicht. 3) Computer Analyse.
Ich habe absichtlich ein Programm genommen was viel staerker ist als ich damit ich keine selbst entscheidung hier mache. Das gleiche mit der 21 Ply. Ich nehme an das die besten Zuege Bewertet sind und mit dieser Bewertung werden die Computers verglichen. Auch mein Punkt System ist Haar genau gerechnet (siehe unten). Ich koennte auch 5 von den besten Programme nehmen und den Durchschnitt deren 10 Besten Zuege rechnen. Das waere vielleicht noch genauer aber wuerde dann 5 mal so lange dauern um vielleicht 0,1 (ein Zehntel) zu aendern in der bewertung. Vielleicht sollte das Testverfahren noch ein wenig besprochen werden und dann erst mit der Sammlung von Daten begonnen werden? Das würde ermöglichen, dass möglichst viel vom Aufwand auch wirklich am Ende genutzt werden kann. |
Folgender Benutzer sagt Danke zu Solwac für den nützlichen Beitrag: | ||
spacious_mind (29.05.2013) |
|
||||||||||||
Re: AW: Re: Rating Tests - Dritter Versuch
Hm, ich habe mich wohl nicht deutlich genug ausgedrückt. Es scheint einige Missverständnisse zu geben.
![]() Ein Schachcomputer muss nur folgendes können: In einer Stellung einen Zug bei gegebener Zeiteinstellung (z.B. für Turnierspiel) auswählen. Das können alle Schachcomputer! Spielt man eine Partie nach, so können sogar Schachcomputer ohne Stellungseingabe verwendet werden wenn ein Zug zurückgenommen werden kann. Es braucht noch nicht einmal eine nummerische Bewertung, es reicht der ausgewählte Zug auf einer Stufe. Die von Dir angeführten Stellungstests versuchen alle Schlüsselzüge zu finden und sind deshalb ausgewählt worden. Leider ist dieses Auswahlverfahren sehr schwer für einen Menschen. Deswegen meine Idee um auch Stellungen ohne den einen Schlüsselzug verwenden zu können. Die Gewichtung solcher Stellungen ergibt sich automatisch. Hat man dann Ergebnisse einiger Schachcomputer, dann kann man für einzelne Stellungen die Relevanz überlegen. So macht es wahrscheinlich keinen Sinn, wenn alle Schachcomputer dieselben Züge auswählen wie das Referenzprogramm oder maximal unbedeutende Abweichungen produzieren. Weichen einige Schachcomputer aber stärker ab, so scheint die Stellung zur Unterscheidung der Schachcomputer nützlich zu sein. Das verstehe ich nicht. Was meinst Du mit "Baumstamm analysieren"? Den Effekt guter Vorhersagen und damit erfolgreicher Ponderei ist schwer zu erfassen. Da hier das Timing der gegnerischen Züge entscheident ist, würde ich das nur im direkten Vergleich testen. Stellungstest können das nicht. Richtig, für den Anfang dürfte ein sehr starkes Program ausreichen. Ob man später noch mal weitere Programme mit in die Vorgaben einbeziehen sollte? Man kann es ja probieren, die Hauptarbeit mit den Schachcomputern bleibt davon ja unabhängig. Es werden also keine Ergebnisse ungültig, was ich für sehr wichtig halte. Man steckt halt einmal den Aufwand in die Analyse mit dem Schachprogramm und kann danach beliebig viele Schachcomputer testen. Schick wäre die Verwendung von frei verfügbaren Programmen, weil dann alle ohne finanziellen Aufwand den kompletten test nachvollziehen können. Dies hilft Fehler leichter zu erkennen und ermöglicht die Arbeitsteilung indem jeder Tester selber Teststellungen bzw. Testpartien beisteuern kann. Vielleicht sollte das Testverfahren noch ein wenig besprochen werden und dann erst mit der Sammlung von Daten begonnen werden? Das würde ermöglichen, dass möglichst viel vom Aufwand auch wirklich am Ende genutzt werden kann. Ja, danke jetzt verstehe ich besser. 1) Ein Schachcomputer muss nur folgendes koennen. Stimmt der Computer muss nur die faehigkeit haben Zugrueckgaben zu erlauben und es Funktioniert dann. Dass waeren dann 99% aller alten Brettcomputers und 100% alle anderen Schachprogramme so wie DOS, Palm, Pocket PC usw. 2) Die von Dir angeführten Stellungstests. Ja die Richtung wo ich mich hier lehne ist einen bestimmten Punktsatz per Analyse zu verteilen. Es gibt sicherlich andere Wege und wie du Richtig sagst vielleicht spaeter wenn Ich genuegend Spiele Analysiert habe und Bewertet habe dann koennte man ja aus der Analyse vielleicht bessere oder alternative Wege finden. Ich werde diese aber erst zum Schluss machen sonst lasse ich mich wieder Ablenken ![]() Das Programm habe ich schon gezeigt Critter 1.6a, ja mein gedanke ist der gleiche es muss ein programm sein was jeder auch hat damit auch alles Durchsichtlich ist. Du kannst wenn du lust und Zeit hast die Gleichen Spiele sehr gerne anders versuchen zu Bewerten und dann haetten wir hier 2 Bewertungsmoeglichkeiten fuer den Schlussvergleich. Die analyse kann ich dir zur verfuegung Stellen. Fuer andere Spiele die ich noch Analysieren muss waere ich auch dankbar wenn jemand Lust haete ein Spiel durch Arena laufen zu lassen mit 15 PV oder 10 PV und minimum 21/22 ply tief. 3) Baumstamm Analysieren Vielleicht habe ich dich falsch verstanden ich dachte dein Vorschlag war das man nicht nur den Computer gewaehlten Zug aber auch die dahinterstehende analyse des Computers Bewertet und damit bin ich nicht einverstanden weil diese nicht moeglich waere fuer die meissten alten schwaecheren Brettcomputers. Zitieren:
Vielleicht sollte das Testverfahren noch ein wenig besprochen werden und dann erst mit der Sammlung von Daten begonnen werden? Das würde ermöglichen, dass möglichst viel vom Aufwand auch wirklich am Ende genutzt werden kann.
Gruss Nick Geändert von spacious_mind (30.05.2013 um 01:33 Uhr) |
|
||||||||||||
AW: Rating Tests - Dritter Versuch
Ja, Critter 1.6a sollte (z.B. unter Arena) alle Möglichkeiten bieten!
![]() Ich weiß nicht, ob ich am Wochenende die Zeit und Muße finde um einmal eine Partie nach meinen Vorstellungen aufzubereiten und zur Verfügung zu stellen. Mal sehen. |
|
||||||||||||
Re: AW: Rating Tests - Dritter Versuch
Gruss Nick |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Re: Rating Tests - Dritter Versuch
Das zweite Test Spiel ist ein Spiel aus 1957. Diesmal tun sich eigentlich alle Brettcomputers schwer. Es gibt einige Stellungen wo der Schachcomputer gewaehlte Zug eigentlich von eine gewonnene Stellung zu eine verlorene Stellung umwandelt. Diesmal ist es David Kittinger mit Jade 2 was dieses Spiel am besten versteht. Der King 2.54 ist erstaunlich schlecht, er versteht hier fasst garnichts.
Test Spiel 2 A. MANGINI - A. KOTOV Mar del Plata, Argentina 1957
Der Alexander Kotov spielte dieses Spiel mit einer analysierte Staerke von ELO 2629. Critter 1.6a (unten nicht Angezeigt) schaffte es mit ELO 2828 und P75 - MChess Pro 5 (unten nicht Angezeigt) mit auch nur eine schwache Bewertung von ELO 1751. Ausser Critter 1.6a, saemtliche bis jetzt getesteten Programme haetten in dieses Spiel ganz klar gegen den Alexander Kotov verloren! 1. e4 c5 2. Nf3 d6 3. d4 cxd4 4. Nxd4 Nf6 5. Bd3 Nc6 6. c3 {Start Test}
[Event "Leonard Barden Test Game 2"]
[Site "Mar del Plata, 1957"] [Date "????.??.??"] [Round "?"] [White "Mangini, A."] [Black "Kotov, A."] [Result "0-1"] [ECO "B55"] [Annotator ",Microsoft"] [PlyCount "56"] [EventDate "1957.??.??"] 1. e4 c5 2. Nf3 d6 3. d4 cxd4 4. Nxd4 Nf6 5. Bd3 Nc6 6. c3 {Start Test} e5 { 2.5 = 6. /\ e5; 3.0 = 6. /\ g6; 2.6 = 6. /\ e6; 1.7 = 6. /\ Bd7; 1.7 = 6. /\ Ne5; 1.7 = 6. /\ Qc7; 1.5 = 6. /\ h6; 1.5 = 6. /\ Rb8; 1.3 = 6. /\ a6; 1.2 = 6. /\ Qd7; 1.2 = 6. /\ Bg4; 1.2 = 6. /\ Qb6; 1.1 = 6. /\ Qa5; 1.0 = 6. /\d5} 7. Nc2 d5 {4.0 = 7. /\ d5; 1.7 = 7. /\ Bg4; 1.3 = 7. /\ Be7; 1.0 = 7. /\ Be6} 8. exd5 Nxd5 {3.0 = 8. /\ Nxd5; 2.2 = 8. /\ Qxe5; 1.0 = 8. /\ e4} 9. O-O Be6 { 4.0 = 9. /\ Be6; 2.8 = 9. /\ Be7; 2.8 = 9. /\ Bc5; 1.9 = 9. /\ h5; 1.8 = 9. /\ Nf6; 1.5 = 9. /\ a6; 1.0 = 9. /\h6} 10. Qf3 Bd6 {1.9 = 10. /\ Bd6; 4. 0 0. /\ Qd7; 3.9 = 10. /\ Qf6; 3.1 = 10. /\ Nf6; 2.7 = 10. /\ a6; 2.5 = 10. /\ Qc8; 2. 5 = 10. /\ Rc7; 2.5 = 10. /\ Rc8; 2.5 = 10. /\ Bc5; 2.1 = 10. /\ Be7; 1.9 = 10. /\ Nb6; 1.6 = 10. /\ Qh4; 1.4 = 10. /\ h5; 1.3 = 10. /\ g6; 1.0 = 10. /\ Qb6} 11. Ne3 Nxe3 { 4.0 = 11. /\ Nxe3; 1.7 = 11. /\ Nf4; 1.0 = 11. /\ e4; 1.0 11. /\ Qf6} 12. Bxe3 O-O {4.0 = 12. /\ 0-0; 4.0 = 12. /\ f5; 1.1 = 12. /\ Qc7; 1.0 = 12. / \ Qd7; 1. 0 = 12. /\ Qe7} 13. Nd2 f5 {4.0 = 13. /\ f5; 2.4 = 13. /\ Be7; 1. 4 = 13. /\ Qc8; 1.3 = 13. /\ Qh4; 1.0 = 13. /\ Ba3} 14. Bc4 Qe7 {4.0 = 14. /\ Qe7; 3.6 = 14. /\ Qd7; 3.1 = 14. /\ Qf6; 2.6 = 14. /\ Qe8; 2.0 = 14. /\ Bf7; 2.0 = 14. /\ Qc8; 1.0 = 14. /\ Bxc4} 15. Bxe6+ Qxe6 {1.0 = 15. /\ Qxe6} 16. b4 e4 { 4.0 = 16. /\ e4; 3.1 = 16. /\ Rac8; 3.0 = 16. /\ a5; 2.7 = 16. / \ Bc7; 2.0 = 16. /\ Be7; 1.9 = 16. /\ Rad8; 1.7 = 16. /\ Rfe8; 1.7 = 16. / \ Rfd8; 1.6 = 16. /\ h6; 1.6 = 16. /\ Rfc8; 1.5 = 16. /\ Rae8; 1.4 = 16. / \ Rf6; 1.3 = 16. /\ a6; 1.1 = 16. /\ Kh8; 1.0 = 16. /\Rf7} 17. Qe2 Qe5 {1.0 = 17. /\ Qe5; 4.0 = 17. /\ Be5; 3.3 = 17. /\ Kh8; 3.0 = 17. /\ Ne5; 2. 6 = 17. /\ Rfe8; 2.6 = 17. /\ Rae8; 2.5 = 17. /\ Rac8; 2.2 = 17. /\ Ne7; 1. 8 = 17. /\ Rfd8; 1.5 = 17. /\ Rf7; 1.5 = 17. /\ Bc7; 1.3 = 17. /\ Rfc8; 1. 3 = 17. /\b6} 18. Qc4+ Kh8 { 2.0 = 18. /\ Kh8; 1.0 = 18. /\ Rf7} 19. g3 Rac8 {4.0 = 19. /\ Rac8; 2.9 = 19. / \ Qf6; 1.5 = 19. /\ Qe7; 1.5 = 19. /\ f4; 1. 0 = 19. /\ Qe8} 20. Rfd1 Qf6 { 4.0 = 20. /\ Qf6; 2.0 = 20. /\ Qe7; 1.5 = 20. /\ Bb8; 1.2 = 20. /\ b5; 1.0 = 20. /\ Be7} 21. Qb3 Be5 {4.0 = 21. /\ Be5; 3. 6 = 21. /\ b6; 1.6 = 21. /\ Bc7; 1.5 = 21. /\ Rcd8; 1.2 = 21. /\ Ne5; 1.0 = 21. /\ Rfe8; 1.0 = 21. /\ Bb8} 22. Nc4 f4 {4.0 = 22. /\ f4; 1.7 = 22. /\ b6; 1.0 = 22. /\ b5} 23. Bc5 e3 { 1.7 = 23. /\ e3; 4.0 = 23. /\ Na5; 2.4 = 23. /\ Rfe8; 1.0 = 23. /\ Qf5} 24. Bxf8 exf2+ {4.0 = 24. /\ exf2+; 3.8 = 24. /\ fxg3} 25. Kg2 Rxf8 { 3.0 = 25. /\ Rxf8; 1.3 = 25. /\ fxg3} 26. Rd3 fxg3 { 3.0 = 26. /\ fxg3; 2.5 = 26. /\ f3} 27. Nd2 gxh2 {2.0 = 27. /\ gxh2} 28. Nf1 Qg6+ {1.0 = 28. /\ Qg6+; 3.0 = 28. /\ h1Q+; 3.0 = 28. /\ h1B+; 2.0 = 28. / \ h1R+; 1.0 = 28. /\ Qg5+; 1.0 = 28. /\ Qh4} 0-1 Test Spiel 2 Ratings - Ergebnisse ![]() Test Spiel 2 Platzierung Der Durchschnittwert nach 2 Testspiele sieht so aus: Durchschnitt nach 2 Testspiele http://spacious-mind.com/forum_repor...test_final.ods Hier ist auch das PGN Spiel: http://spacious-mind.com/forum_reports/tests/spacious_mind_test_game1.pgn Viele Gruesse, Nick Geändert von spacious_mind (01.06.2013 um 15:44 Uhr) |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Re: Rating Tests - Dritter Versuch
Ich wollte auch überprüfen, ob die menschliche Wertungen in meinem Test auch die realen Spiel Ratings der Großmeister entsprechen.
Im ersten Test-Spiel, spielte Mikhail Botwinnik gegen Henry Grob. Botvinnik's höchste Bewertung war ELO 2885 in 1945. Henry Grob's höchste Bewertung war ELO 2491, damit war die ausgewerte Bewertung von ELO 2426 im Test-Spiel 1, unter dem Durchschnitt. Allerdings war Henry Grob's höchste Bewertung im Jahr 1939. Dieses Spiel wurde im Jahr 1956 gespielt. Im zweiten Test-Spiel, spielte Alexander Kotov gegen A. Mangini. Kotov's höchste Bewertung war ELO 2753 im Jahr 1950. Ich konnte keine Bewertung für A. Mangini finden. Die ausgewertete Bewertung von ELO 2629 scheint akzeptabel zu sein, für Test-Game 2. Hier ist das 3. Test-Spiel. In diesem Spiel Leonard Barden spielt gegen Arnold Yorvath Green. Green hatte eine höchst Bewertung von ELO 2356 im Jahr 1952. Barden hatte eine höchst Bewertung von ELO 2497 im Jahr 1958. Die ausgewerteten Bewertung für Test-Game 3 ist ELO 2449. Diese Bewertung scheint akzeptabel zu sein. Test Spiel 3 A. Y. GREEN - L. BARDEN Bognor, England 1956
1. d4 Nf6 2. c4 g6 3. g3 Bg7 4. Bg2 O-O 5. Nf3 d6 6. O-O Nc6 7. d5 Na5 8. Nfd2 c6 9. Nc3 cxd5 10. cxd5 {Test Start}
[Event "Leonard Barden Test Game 3"]
[Site "Bognor, 1956"] [Date "????.??.??"] [Round "?"] [White "Green, A. Y."] [Black "Barden, L."] [Result "0-1"] [ECO "E62"] [Annotator ",Microsoft"] [PlyCount "60"] [EventDate "1956.??.??"] 1. d4 Nf6 2. c4 g6 3. g3 Bg7 4. Bg2 O-O 5. Nf3 d6 6. O-O Nc6 7. d5 Na5 8. Nfd2 c6 9. Nc3 cxd5 10. cxd5 {Test Start} Ng4 {1.9 = 10. /\ Ng4; 3.5 = 10. /\ Bd7; 2.9 = 10. /\ Bg4; 2.9 = 10. /\ Bf5; 2.8 = 10. /\ Qc7; 2.1 = 10. /\ a6; 1. 9 = 10. /\ Nh5; 1.8 = 10. /\ Ne8; 1.6 = 10. /\ Qb6; 1.0 = 10. /\ Nd7} 11. Rb1 Bd7 { 3.3 = 11. /\ Bd7; 3.5 = 11. /\ Bf5; 2.4 = 11. /\ Rb8; 2.3 = 11. / \ Ne5; 2.2 = 11. /\ a6; 1.7 = 11. /\ h6; 1.7 = 11. /\ Qd7; 1.4 = 11. /\ Qb6; 1.3 = 11. /\ Bxc3; 1.3 = 11. /\ Qe8; 1.3 = 11. /\ h5; 1.2 = 11. /\ b6; 1.0 = 11. /\ Re8; 1. 0 = 11. /\} 12. h3 Ne5 {3.5 = 12. /\ Ne5; 2.5 = 12. /\ Nf6; 1.0 = 12. /\ Nh6} 13. b3 Qc8 {3.5 = 13. /\ Qc8; 1.5 = 13. /\ b5; 1.0 = 13. /\ Rc8} 14. b4 Nac4 { 3.5 = 14. /\ Nac4; 3.2 = 14. /\ Bxh3; 3.1 = 14. /\ Qxc3; 1.1 = 14. /\ b6; 1.0 = 14. / \ Rb8} 15. Kh2 Nxd2 {2.5 = 15. /\ Nxd2; 4.0 = 15. /\ Ne3; 2.3 = 15. /\ b5; 2.2 = 15. /\ Nb6; 1.4 = 15. /\ Qc7; 1.4 = 15. /\ a6; 1.4 = 15. /\ a5; 1.4 = 15. /\ f5; 1.2 = 15. /\ Ng4+; 1.1 = 15. /\ Bf5; 1.0 = 15. /\ Qe8} 16. Qxd2 Bf5 {4.0 = 16. /\ Bf5; 2.9 = 16. /\ b5; 2.4 = 16. /\ a5; 2.3 = 16. /\ Nc4; 2.2 = 16. /\ b6; 2.2 = 16. /\ Qc7; 2.1 = 16. /\ Re8; 2.0 = 16. /\ a6; 1.7 = 16. /\ Rd8; 1.6 = 16. /\ h6; 1.4 = 16. /\ Qc4; 1.2 = 16. /\ Rb8; 1.2 = 16. /\ Qd8; 1. 0 = 16. /\ Qe8; 1.0 = 16. /\ h5} 17. Ne4 Qc4 {4.0 = 17. /\ Qc4; 1.9 = 17. /\ b5; 1,9 = 17. /\ Qd7; 1.6 = 17. /\ b6; 1.6 = 17. /\ Re8; 1.3 = 17. /\ Qc7; 1.3 = 17. /\ Nc4; 1.3 = 17. /\ h5; 1.2 = 17. /\ a6; 1.2 = 17. /\ Qd8; 1.1 = 17. /\ Rd8; 1.1 = 17. /\ Rb8; 1.1 = 17. /\ Qe8; 1.0 = 17. /\ Qb8} 18. f3 Rfc8 { 4.0 = 18. /\ Rfc8; 3.8 = 18. /\ Rac8; 3.5 = 18. /\ Rfe8; 3.1 = 18. /\ a6; 2.7 = 18. /\ Rfd8; 1.9 = 18. /\ Rab8; 1.8 = 18. /\ Rfb8; 1.3 = 18. /\ h5; 1.3 = 18. /\ Bxe4; 1.0 = 18. /\ b6; 1.0 = 18. /\ h6; 1.0 = 18. /\b5} 19. Rd1 Qc2 { 3.2 = 19. /\ Qc2; 4.0 = 19. /\ Bxe4; 2.9 = 19. /\ Rc7; 2.2 = 19. /\ h6; 2.2 = 19. /\ a6; 2.0 = 19. /\ b6; 1.8 = 19. / \ b5; 1.4 = 19. /\ Bh8; 1.3 = 19. /\ a5; 1.2 = 19. /\ h5; 1.0 = 19. /\Rab8} 20. Rb2 Qa4 { 2.4 = 20. /\ Qa4; 4.0 = 20. /\ Qxd2; 1.0 = 20. /\ Qc7} 21. Qe1 Rc7 {1.1 = 21. / \ Rc7; 4.0 = 21. /\ Nc4; 3.0 = 21. /\ a6; 2.3 = 21. /\ b6; 2.0 = 21. /\ Rc4; 1. 5 = 21. /\ Bxe4; 1.3 = 21. /\ Nxf3+; 1.3 = 21. / \ h6; 1.2 = 21. /\ h5; 1.2 = 21. /\ Nd7; 1.0 = 21. /\ b5} 22. Nd2 Bc2 {3.8 = 22. /\ Bc2; 4.0 = 22. /\ a5; 2. 6 = 22. /\ Rc2; 1.2 = 22. /\ Nc4; 1. 2 = 22. /\ Rac8; 1.0 = 22. /\Bd3} 23. Nb3 Bxd1 {4.0 = 23. /\ Bxd1; 3.4 = 23. /\ Nxf3+; 2.5 = 23. /\ Rac8; 1.3 = 23. /\ Ng4+; 1.0 = 23. /\ Nd3; 1.0 = 23. /\ Nd7} 24. Qxd1 Rac8 {4.0 = 24. ...Rac8; 3. 1 = 24. /\ Qxb4; 2.0 = 24. /\ Rd8; 1.8 = 24. /\ Re8; 1.8 = 24. /\ Rf8; 1.8 = 24. /\ Rb8; 1.4 = 24. /\ Nc4; 1.4 = 24. /\ a6; 1.3 = 24. /\ h6; 1.2 = 24. /\ h5; 1.0 = 24. /\ Nd7} 25. Rd2 Qxb4 {3.0 = 25. /\ Qxb4; 4.0 = 25. /\ Nc4; 1.7 = 25. /\ Qb5; 1.6 = 25. /\ Bh6; 1.5 = 25. /\ Nd7; 1.4 = 25. /\ h5; 1.2 = 25. /\ a6; 1.1 = 25. / \ a5; 1.0 = 25. /\ h6} 26. h4 a5 {4.0 = 26. /\ a5; 1.8 = 26. / \ h5; 1.7 = 26. /\ Qb6; 1.6 = 26. /\ b6; 1.4 = 26. /\ b5; 1.3 = 26. /\ f5; 1.2 = 26. / \ Qb5; 1.2 = 26. /\ Bh8; 1.1 = 26. /\ Nc4; 1.1 = 26. /\ Rc4; 1.0 = 26. /\ a6; 1.0 = 26. /\ Qa4} 27. a3 Qb6 { 3.5 = 27. /\ Qb6; 2.6 = 27. /\ Qb5; 1.7 = 27. /\ Qa4; 1.0 = 27. /\ Qc4} 28. a4 Rc3 {3.5 = 28. /\ Rc3; 3.3 = 28. /\ Bh6; 1.0 = 28. /\ h5} 29. Bh3 R8c7 { 1.1 = 29. /\ R8c7; 3.5 = 29. /\ Qf2+; 1.5 = 29. /\ R8c4; 1.0 = 29. /\ f5} 30. f4 Qxb3 {1.0 = 30. /\ Qxb3; 3.5 = 30. /\ Qf2+; 1.5 = 30. /\ Rxb3; 1.5 = 30. /\ Rxc1; 1.3 = 30. /\ Ng4+; 1.2 = 30. /\ Qe3; 1.0 = 30. /\ f5} 0-1 Critter 1.6a 64 Bit spielte diesen Test Spiel mit einem rechnerischen Bewertung von ELO 2779 und P75-MChess Pro 5 mit ELO 2393. Test Spiel 3 Ratings - Ergebnisse ![]() Jeder Test bringt Überraschungen. In diesem dritten Test hatte Fidelity CC9 eine sehr starke Leistung. Auch die Morsch Programme waren wieder sehr Gut. Aber der Star dieser Show war CM 512K - 15 MHZ - KING 2.54, der wie ein Großmeister dieses Spiel Beherschte. Test Spiel 3 Platzierung Der Durchschnittwert nach 3 Testspiele sieht so aus: Durchschnitt nach 3 Testspiele viele Gruesse, Nick |
![]() |
|
|
![]() |
||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
WIKI ELO Rating For Resurrection Fruit 05?? | Steveb | Teststellungen und Elo Listen / Test positions and Elo lists | 0 | 14.12.2005 16:46 |
Frage: gibt es Tests oder Turniere oder Partien mit dem Mephisto Master Chess ? | mclane | Die ganze Welt der Schachcomputer / World of chess computers | 7 | 18.04.2005 21:34 |