Schachcomputer.info Community

Zurück   Schachcomputer.info Community > Schachcomputer / Chess Computer: > Teststellungen und Elo Listen / Test positions and Elo lists


Antwort
 
Themen-Optionen Ansicht

  #1  
Alt 07.01.2019, 14:08
Benutzerbild von spacious_mind
spacious_mind spacious_mind ist offline
Lebende Foren Legende
 
Registriert seit: 29.06.2006
Ort: Alabama, USA
Land:
Beiträge: 2.200
Abgegebene Danke: 634
Erhielt 1.070 Danke für 476 Beiträge
Aktivitäten Langlebigkeit
7/20 18/20
Heute Beiträge
0/3 sssss2200
Gedanken ueber Schachcomputer Performance

Was Frank schreibt in sein ELO Bericht ist interessant und mich dann reizte diesen Bericht zu Schreiben.

Hier will mal kurz Zeigen wie die alten computers alle in bestimmte spiele ihre schwaechen und staerken haben. Diese resultaten die ich hier zeige sind nicht werte aus bestimmte Stellungen sondern das benehmen von den Schachcomputers innerhalb gesamt spiele. Ich finde sehr lustig wenn ich mir es anschaue.

Code:
Name	                                   Level	G1	G2	G3	G4	G5	RATING
RESURRECTION FRUIT V. '05	             30S FIXED	2780	2325	2870	1812	2340	2338
MEPHISTO BERLIN PRO LONDON ACTIVE	LV 4 30S AV.	2494	2471	2555	1724	2414	2259
REVELATION LONDON ACTIVE	             30S AV.	2386	2309	2525	1845	2398	2240
REVELATION VANCOUVER ACTIVE	             30S AV.	2492	2398	2369	1814	2260	2209
MEPHISTO VANCOUVER 68000 ACTIVE	             30S AV.	2486	2354	2478	1716	2093	2155
MAXSTATION 386SX-16 MHZ GENIUS 1.0	     30S AV.	2346	2374	2550	1762	2025	2150
REVELATION ROMA	LV 50                        30S AV.	2326	2414	2512	1639	2197	2147
MEPHISTO LONDON 68000 RISKY	             30S AV.	2418	2210	2536	1694	2201	2144
MEPHISTO BERLIN 68000	                     30S AV.	2434	2391	2435	1576	2263	2141
MEPHISTO LONDON 68000 SOLID	             30S AV.	2526	2147	2378	1699	2176	2118
REVELATION DALLAS	                LV 3 30S AV.	2346	2223	2527	1672	2149	2117
SAITEK BARRACUDA	                     30S AV.	2480	1980	2215	2026	1682	2048
MEPHISTO MONTANA	                  H1 30S	2386	1951	2305	2037	1682	2046
RADIO SHACK MEGA 2050X	                  H1 30S	2386	1936	2215	2039	1746	2042
FIDELITY ELITE PREMIERE 2265	       LV A5 30S AV.	2508	2093	2342	1505	1956	1998
FIDELITY ELITE PREMIERE VANCOUVER      LV A5 30S AV.	2696	1841	2258	1559	1999	1990
CHESS KING TRIOMPHE	               LV  3 30S	2008	1514	1807	1650	1452	1665
SYSTEMA GEMINI PLUS	               LV 48 30S AV.	2132	1282	1875	1638	1421	1642
SAITEK MK 12 TRAINER	               LV  4 15S	1854	1430	1682	1708	1407	1613
SAITEK SENSOR CHESS MOD. 165	       LV  4 20S	2016	1349	1623	1660	1422	1601
PERI BETA	                          A4 30S	2028	1462	1616	1645	1330	1600
FIDELITY SILVER BULLET	               LV  4 30S	2150	1345	1560	1533	1443	1577
SCISYS EXECUTIVE CHESS	               LV3 4 30S	2036	1286	1623	1511	1214	1507
NOVAG MICRO CHESS	               LV3 5 25S	1952	1218	1364	1759	1194	1506
ZB ganz oben in der Liste Resurrection Fruit '05 ein starkes Programm, versteht Test spiel 4 ueberhaupt nicht. Alle Langs verstehen Testspiel 4 uebhaupt nicht und fallen in dieses spiel bis auf 1500 ELO herunter.

Und das ist das Lustige fuer mich dabei ueber den gesamten Spiel 4 ablauf da findet sogar ein Systema Gemini Plus oder Saitek Sensor Chess bessere zuege waehrend den gesamten spiel ablauf als der Elite Premiere.

Ein paar Morsch sind oben auch dabei, diese zeigen das sie Ihre groessere schwaechen haben in den ablauf von Testspiel 5.

Diese beispiele sagen nicht das ein Vancouver gegen den Systema Gemini verlieren wuerde. Was sie aber zeigen ist das alle Programme Ihre staerken und schwaechen haben mit Ihre zug wahl in bestimmte situationen. Ein schwacher computer stolpert sogar solche in situationen auf ein besseren Zug als ein starker computer.

Der Mensch der wird sobald er erkennt in bestimmte Spiel situationen das der Vancouver 1500 ELO leistung bringt dann dieses auch naturlich jedes mal voll ausnuetzen. Er uebersieht dann auch das der Vancouver in andere spiel situationen sogar auch ueber 2500 ELO spielen koennte.

Bei Fruit '05 zb sieht man auch das er in Spiel 4 mi sein 1800 ELO Wert auch fuer normale gute spieler schlagbar ist sobald man seine schwaechen erkennt.

Die besten computers fuer gegen Menschen spiele oft sind nicht die staerksten auf einer Liste sondern die programme die im gross und ganzen am ausgeglichenen spielen ueber mehrere spiel situationen und sich nicht so gross hoch und herunter schwanken lassen.

Viele Gruesse
Nick

Geändert von Chessguru (07.01.2019 um 15:08 Uhr) Grund: Tabellendarstellung korrigiert
Mit Zitat antworten
Folgende 5 Benutzer sagen Danke zu spacious_mind für den nützlichen Beitrag:
Chessguru (07.01.2019), Egbert (07.01.2019), Mythbuster (07.01.2019), pato4sen (07.01.2019)
  #2  
Alt 07.01.2019, 15:12
Benutzerbild von spacious_mind
spacious_mind spacious_mind ist offline
Lebende Foren Legende
 
Registriert seit: 29.06.2006
Ort: Alabama, USA
Land:
Beiträge: 2.200
Abgegebene Danke: 634
Erhielt 1.070 Danke für 476 Beiträge
Aktivitäten Langlebigkeit
7/20 18/20
Heute Beiträge
0/3 sssss2200
Re: Gedanken ueber Schachcomputer Performance

Ach ja ich hatte vergessen zu sagen. Test Spiel 4 ist ein Anti-Computer schachschpiel aus dem Jahr 1793! Als Schwarz erziehlte Philidor 2339, gute 500 Punkte mehr als Fruit'05 und das ohne computers oder schachbuecher. Zu den Zeitpunkt gab es keine Buecher ausser das Buch von Greco von 150 Jahre frueher. Bis Philidor selber buecher schrieb und zum gleichen Zeitpunkt Musik schrieb. Sein Gegner Thomas Bowdler erzielte 2164 ELO. 350 ELO mehr als Fruit'05.

Ich denke mal das die Leute die meinen Anti-Computer Schach erfunden zu haben treumen und sollten mal Philidor anschauen der so naturlich spielte. Also Philidor = Erfinder von Anti-Computer Schach 200 Jahre vor es schachcomputer gab!

Mit sein Spielstiel ich denke mal das der Philidor nach ein paar uebungen saemtliche computers in der Liste die ich zeigte schlagen wuerde ohne grosse muehe und das ohne Buch oder Computer assistance

Viele gruesse
Nick
Mit Zitat antworten
Folgender Benutzer sagt Danke zu spacious_mind für den nützlichen Beitrag:
  #3  
Alt 07.01.2019, 17:13
user_2071
Gast
 
Beiträge: n/a
Aktivitäten Langlebigkeit
0/20 0/20
Heute Beiträge
sssssssss
AW: Gedanken ueber Schachcomputer Performance

Nick,

ich mache keinen Hehl daraus, dass mich die Ansatzpunkte von Dir begeistern. Das ist genau das was ich mir wünsche.

Wollte mich auch intensiver mit Deinen Ansatzpunkten auseinandersetzen und dachte kürzlich erst wieder, aufgrund einer Diskussion im Hiarcs Forum, an Deine Worte.

Hatte Polgar 10Mhz - Yeno 532 XL laufen (weiß jetzt nicht genau aber zwischen 250 - 300 Elo Unterschied). Polgar spielte die Eröffnung zwar passiv aber gut und kam in Vorteil. Das Programm von Ulf typisch mit schlechten Bauernketten bei vielen Figuren auf dem Brett. Dann begann das späte Mittelspiel. So langsam kämpfte sich der Yeno von -2.5 zurück auf -1.0 und dann der Aussetzer vom Polgar und Ulf Rathsmann gewann aufgrund von zwei schlechten Zügen des Polgars die hintereinanderkamen.

Geht mit 1:0 für den Yeno in die Elo Berechnung ein.
Der typische Käse!

Tatsächlich war das Bild doch ein ganz anderes:
Der Polgar spielte zusammengenommen die bessere Partie. Der Yeno spielte taktisch gut aber positionell katastrophal. Zusammengenommen, Fehler auf beiden Seiten aber auch gute positionelle Züge vom Polgar und taktisches vom Yeno.

Ich bewertete die Partie mit 45%:55% für den Polgar, obwohl der Yeno gewonnen hatte (ein Bewertungssystem welches ich teste ... nichts besonderes, nicht reif um mehr dazu zu schreiben).

Zurück zu Deinem Posting!
Die Frage ist wie wir Dein Konzept so umsetzen, dass sich vergleichbar zu einer Ratingliste nachvollziehbare Informationen bilden.

Wie viele Partien sind notwendig?
Die Partien sorgfältig auszuwählen ist, die für Ratingzwecke dann eingesetzt werden ist wahrscheinlich eine andere Frage.

Fest steht, das der Ansatz von Dir ein wirklicher richtig guter Ansatz ist.

Grob gesagt:
Je niedriger die Elo desto mehr Fehler in einer Partie (kein Geheimnis). Fehler können Partieentscheidend sein (kein Geheimnis), müssen es aber nicht (auch kein Geheimnis). Bei Schachcomputer Partien oft zu sehen, dass weder Schachcomputer 1 oder Schachcomputer 2 den entscheidenden Zug spielen. Lasse z. B. immer gerne Wasp mitlaufen, wenn 2 Schachcomputer gegeneinander spielen. Innerhalb einer einzigen Partie passiert das gar mehrfach das keiner der beiden Schachcomputer den richtigen Weg sieht, der gar einen 1.500 Elo Spieler sofort ins Auge springt.

Muss ehrlicher Weise schreiben, dass meine persönlichen Ansätze in eine ganz andere Richtung gehen (Ansätze, die ich gar seit vielen Jahren verfolge), diese aber nach näherer Betrachtungsweise im Vergleich zu Deinen ...

Murks will ich nicht schreiben ...
über Board werfen will ich die ja auch nicht ...
Wie soll ich schreiben?
Deine begeistern mich halt, sind also besser.
Jetzt ist es raus!

Ich wollte mich schon zur Jahreswende damit beschäftigen aber ich bin derzeit ein wenig lahmgelegt (persönliche Gründe).

Aber die Frage die ich mir stelle:
Wie viele dieser Partien brauchen wir, damit die Ratings genau werden. Wie können wir dann abgrenzen zwischen "Mittelspiel / Übergang Endspiel und Endspiel? Das muss da irgendwie berücksichtig werden.

Also, ganz großes Kino!
Weil das was hier beschrieben wird ist die Realität und nicht die dumme Elo für sich allein gestellt.

Nur wie bekommen wir das noch besser verpackt?

Werde mich damit beschäftigen, zurzeit bin ich noch nicht so weit, um irgendetwas brauchbares beizusteuern, weil meine Überlegungen in eine andere Richtung gehen und dafür jetzt hinderlich sind.

Umdenken ist angesagt (bei mir).

Viele Grüße
Frank
Mit Zitat antworten
  #4  
Alt 07.01.2019, 17:29
user_2071
Gast
 
Beiträge: n/a
Aktivitäten Langlebigkeit
0/20 0/20
Heute Beiträge
sssssssss
AW: Gedanken ueber Schachcomputer Performance

Im Detail:

Derzeit meine Denke:
Nehmen wir an wir haben 20 Partien als Basis!
Die werten wir genau so aus, wie von Dir beschrieben. Die Partien müssen natürlich gut ausgewählt sein!
Gehe davon aus, dass Du Dir hier schon Gedanken gemacht hast bzw. gut ausgewählt hast.

Könnten wir ja weiter mit Elo arbeiten aber zusätzlich die gefundenen Fehler in ein Diagramm einarbeiten.

Fehler bei verbliebenen Figuren auf dem Brett:
- bei 30-28 = 0, 27-25 Figuren auf dem Brett = 2, 24-21 = 7, ... bis zu 2.

Dann könnten wir anhand einer Grafik neben Elo darstellen, in welchen Partiephasen die meisten Fehler produziert wurden. Wir könnten sofort sehen, welche Programme in welcher Partiephase eine Stärke oder Schwäche haben. Könnten Kurven von gleichen Programmen aufeinanderlegen. Und das wäre erst der Anfang dessen was möglich wäre.

Hoffe Du kannst das so ein wenig nachvollziehen wie ich mir die Darstellung vorstelle.

1. Berlin 68000 ... 2.000 Elo ... und dahinter die statistische Darstellung.
2. Roma 68000 ... 1.875 Elo ... und dahinter die statistische Darstellung.

Jetzt ziehen wir uns alles von Richard Lang zusammen und legen die Kurven aufeinander.

Irgendwie so ...
Das wäre alles sehr einfach umsetzbar.
Na ja, zunächst mal verhältnismäßig einfach!

Ich schrieb Dir glaube ich auch im Hiarcs Forum, dass sich hierfür auch ein Excel Experte brennend interessieren würde.

Die Frage ist nur, wie viele von diesem Partien benötigen wir um ein wirklich gutes und genaues Ergebnis zu produzieren?
Sicherlich ist viel weniger Material erforderlich als wir bei einer Ratingliste erzeugen müssten?!

Gruß
Frank

Geändert von user_2071 (07.01.2019 um 17:34 Uhr)
Mit Zitat antworten
  #5  
Alt 07.01.2019, 18:29
Benutzerbild von udo
udo udo ist offline
Lebende Foren Legende
 
Registriert seit: 19.08.2006
Ort: Itzehoe
Alter: 69
Land:
Beiträge: 2.334
Abgegebene Danke: 404
Erhielt 1.363 Danke für 779 Beiträge
Aktivitäten Langlebigkeit
12/20 18/20
Heute Beiträge
2/3 sssss2334
AW: Gedanken ueber Schachcomputer Performance

Was sind das den für Stellungen bei G1- G5 , bzw. Spielsituationen?

Ich nehme an, G1 ist Eröffnung, G5 ist Endspiel, aber gerade G4, wo die Lang Programme relativ schlecht sind, was ist das?
Mit Zitat antworten
  #6  
Alt 07.01.2019, 18:48
user_2071
Gast
 
Beiträge: n/a
Aktivitäten Langlebigkeit
0/20 0/20
Heute Beiträge
sssssssss
AW: Gedanken ueber Schachcomputer Performance

Hallo Udo,

g für game!
Game 1, Game 2 ... G1, G2

Gesamtergebnis für die dargestellten Partien zusammengezogen.

Also, nicht das eher weniger aussagende Endergebnis einer Partie werten, sondern die komplette Partie checken und Zugbewertungen durchführen. Master-Partien herausfinden, die sich für solche Bewertungen eignen.

Gab zu Schachcomputer Zeiten mal Bücher wo GM Züge bewertet wurden. Dann konnte Punkte erzielt werden. Eine vergleichbare Vorgehensweise.

Jeder Zug kann grundsätzlich bewertet werden.
Finde das macht bei Schachcomputern auch mehr Sinn als ein Endergebnis zu bewerten.

Und so spielte Fruit z. B. eine Partie die nach 1.800 Elo aussah, hatte einen voller Aussetzer drin. Gemini in Partie 1 überraschte.

Sammeln von Fehlern ist das Thema hier!
Wenn wir Fehler sammeln und Anzahl der Figuren auf dem Brett den Fehlern zuordnen können entstehen sehr schöne Stats.

Gibt viele Ansatzpunkte:
Nur bei diesem Ansatzpunkt werden Besonderheiten der Programme schneller ersichtlich. Einzig und allein übrig bleibt nur ein Kritikpunkt: Wurde jetzt ein guter Zug zufällig gespielt oder nicht. Aber wie das mit Statistiken ist ... weniges was fragwürdig ist verschwindet in der Masse der statistischen Auswertung.

Dieser Ansatzpunkt ist einfach.
Zugbewertungen zwecks Spielstärkemessung sind nicht neu.

Aber hier wird es kontinuierlich abgetestet und wir sehen wie stark dann die Endergebnisse sind wenn diese zusammengefügt werden. Und aus diesen Endergebnissen läßt sich viel basteln.

Spielwiese für Statistiker!!

Viele Grüße
Frank

Der Umkehrschluss ist:
Schachcomputer A - Schachcomputer B
Fertige Partie mittels Master Engine, Enscheidungsengine würden wir bei 3-Hirn sagen analysieren lassen.
Oder taktische Analyse bei ChessBase ... ChessBase gibt einen Prozentwert für das taktische Ergebnis aus.

Milano (Taktik 45%) - TurboKing B (Taktik 32%), 0:1 ... aha, da ist etwas faul gewesen.
Etc..

Sind derzeit einige spannende Statistik Ideen die entwickelt werden.
Die hier z. B. reizt ...

Geändert von user_2071 (07.01.2019 um 19:07 Uhr)
Mit Zitat antworten
  #7  
Alt 07.01.2019, 18:52
Benutzerbild von applechess
applechess applechess ist offline
Lebende Foren Legende
 
Registriert seit: 18.09.2011
Ort: Kanton Zürich
Land:
Beiträge: 7.668
Abgegebene Danke: 10.561
Erhielt 16.189 Danke für 5.755 Beiträge
Aktivitäten Langlebigkeit
13/20 13/20
Heute Beiträge
0/3 sssss7668
AW: Gedanken ueber Schachcomputer Performance

 Zitat von spacious_mind Beitrag anzeigen
Was Frank schreibt in sein ELO Bericht ist interessant und mich dann reizte diesen Bericht zu Schreiben.

Hier will mal kurz Zeigen wie die alten computers alle in bestimmte spiele ihre schwaechen und staerken haben. Diese resultaten die ich hier zeige sind nicht werte aus bestimmte Stellungen sondern das benehmen von den Schachcomputers innerhalb gesamt spiele. Ich finde sehr lustig wenn ich mir es anschaue.

Viele Gruesse
Nick
Hallo Nick
Und wer hat sich die Riesenmühe gemacht zu entscheiden,
welche Züge in welcher Partiephase als schwach (schlecht)
zu beurteilen sind?
Gruss
Kurt
Mit Zitat antworten
Folgender Benutzer sagt Danke zu applechess für den nützlichen Beitrag:
Wolfgang2 (07.01.2019)
  #8  
Alt 07.01.2019, 19:05
Wolfgang2 Wolfgang2 ist offline
Lebende Foren Legende
 
Registriert seit: 02.02.2005
Ort: Schweinfurt
Alter: 57
Land:
Beiträge: 2.733
Abgegebene Danke: 3.321
Erhielt 3.290 Danke für 1.591 Beiträge
Aktivitäten Langlebigkeit
9/20 20/20
Heute Beiträge
1/3 sssss2733
AW: Gedanken ueber Schachcomputer Performance

Das ist eine sehr gute Frage, Kurt. Spitzen-Engines sind dafür nur bedingt geeignet.
Denn solange es noch eine einzige (!) spätere Rettung gibt, werden mitunter eine Reihe von weniger guten Zügen als neutral bzw. spielbar beurteilt.

In Wirklichkeit ist das aber nicht praxisgerecht, weil der Computer unter Umständen (evtl. sogar wahrscheinlich) diese einzige Rettung nicht findet und die Partie verliert.

Gruß
Wolfgang
Mit Zitat antworten
Folgender Benutzer sagt Danke zu Wolfgang2 für den nützlichen Beitrag:
applechess (07.01.2019)
  #9  
Alt 07.01.2019, 19:25
Benutzerbild von applechess
applechess applechess ist offline
Lebende Foren Legende
 
Registriert seit: 18.09.2011
Ort: Kanton Zürich
Land:
Beiträge: 7.668
Abgegebene Danke: 10.561
Erhielt 16.189 Danke für 5.755 Beiträge
Aktivitäten Langlebigkeit
13/20 13/20
Heute Beiträge
0/3 sssss7668
AW: Gedanken ueber Schachcomputer Performance

 Zitat von Wolfgang2 Beitrag anzeigen
Das ist eine sehr gute Frage, Kurt. Spitzen-Engines sind dafür nur bedingt geeignet. Denn solange es noch eine einzige (!) spätere Rettung gibt, werden mitunter eine Reihe von weniger guten Zügen als neutral bzw. spielbar beurteilt.
So ist es.

Zitieren:
In Wirklichkeit ist das aber nicht praxisgerecht, weil der Computer unter Umständen (evtl. sogar wahrscheinlich) diese einzige Rettung nicht findet und die Partie verliert.
Auch das ist eine richtige Feststellung.

Aus all diesen Gründen bestehen (oder müssen bestehen)
berechtigte Zweifel, dass man ohne einen Riesenaufwand zu
betreiben, eine praktisch brauchbare und die realen
Gegebenheiten berücksichtigende Einteilung der
Stärken/Schwächen der Programme für die verschiedenen
Partiephasen erstellen kann. Vielfach bildet für den Sieg/Verlust
nicht ein einziger Zug die Grundlage, sondern einige Nicht-Best-
Züge in jeder Partiephase. Und in jenen Fällen, wo ganze
schlimme und direkte Verlustzüge produziert werden, kann die
ansonste u.U. gute Behandlung einer Partiephase zunichte
gemacht werden.

Kurzum, ich glaube nicht an für verschiedene Partiephasen
aufgeteilte Elo-Werte.

Gruss
Kurt
Mit Zitat antworten
  #10  
Alt 07.01.2019, 19:43
user_2071
Gast
 
Beiträge: n/a
Aktivitäten Langlebigkeit
0/20 0/20
Heute Beiträge
sssssssss
AW: Gedanken ueber Schachcomputer Performance

Hi Kurt,

bei der FCP Ratingliste ließ ich bis zum Matt spielen. Also, nach jedem Spießroutenlauf die Partien ausgewertet nach:

1. Matt 20-59
2. Matt 60-79
3. Matt 80-99
4. Matt 100-300 (Shredder GUI bricht nach 300 Zügen ab).

Die Stats sind im Download der Ratingliste.

Nun verglichen, die Stats einer alten zu einer neu aufgenommen Version. Festgestellt, dass plötzlich Andscacs bei Matt 80-99 stark und bei Matt 100-300 deutlich zulegte. Programmierer angeschrieben was er geändert hat. Antwort war klar, hatte natürlich bestätigt was ich vermutet hatte.

OK, dachte ich mir ...
Alle Stats brachten die gleichen Ergebnisse zu Tage, auch wenn ich Spießroutenläufe habe wiederholen lassen.

Dann anders ...
Ferdinand kontaktiert, er programmierte Tools für "Figuren auf dem Brett bei Mattstellung".

Dann wieder von vorn:
Partien in die Datenbank gebracht, Elo-Auswertung aus der Datenbank gemacht und Bingo ... Abweichungen von in 95% der Fälle nicht mehr als +-25 Elo.

Prima, dachte ich mir ... Möglichkeit 1 ist nicht schlecht, Möglichkeit 2 ist auch OK aber deutlich zeitaufwendiger. Die Kombination muss her ... kam logischer Weise auch nichts anderes dabei heraus. Kombination aus 1 und 2 wieder mit einer programmiertechnischen Lösung erstellen lassen.

Und schon hatte ich das Ergebnis:
Spielstärke im frühen Mittelspiel, im späten Mittelspiel etc..

Und was war auffällig:
Klar, die Engines wie Spark, Junior ... die Taktiker spielten hatten natürlich sehr gute Ergebnisse bei Matt in wenigen Zügen. Spark dann wieder ... eine Katastrophe im Endspiel ... bei den Endspielstatisiken der TOP-50 ... beständig hinten.

Alles stimmte!
x-mal wiederholt, gab nie ein Problem.

Nur, es geht besser!
Viel besser!!

Aber alles ist enorm zeitaufwendig.

Ich bewertete mit Zügen bis zum Matt oder Figuren auf dem Feld bei Matt.
Einzelbewertungen von gespielten Zügen sind besser (Nick Variante).

Bei Arena hatte ich die Blunder Suche entwickelt die Martin dann programmiertechnisch umsetze.
Ziel war es seinerzeit ... die Fehler in einer Partie aufspühren. Dafür gab es Einstellungen die gewählt werden konnten.

Ich machte in Arena Zeite nichts anderes als die Anzahl der Fehler den Zugnummern zuzuteilen.
Daraus veruschte ich festzustellen, welche Engine spielt die meisten Fehler in den jeweiligen Partiephasen.
Das brauchte ich dringend, weil wir Engines einen Charakter gegeben hatten, also einen Spielstil beschrieben haben.
Irgendwo her mussten die Infos kommen.

Der Zuspruch war enrom, auch auf der Schachwelt (Zeitschrift GM Hickl). Die Spielstilbeschreibungen waren erfolgreicher als ich dachte. Schachspieler, Leser der Zeitschrift haben sich wirklich Engines runtergeladen und ausprobiert, waren begeistert. Engines wo denen die vorher nie etwas gehört hatten.

Hier mal die FCP Ratingliste ... Auszug aus einer Statistik, hier zu Züge bis zum Matt nicht höher als 59!

Code:
  FCP Rating List
  Each one against each other!
  ----------------------------

  Date           : December 20th, 2016 (23:30)
  Games          : 41.000 / 5.798 = 14.141%
  Move Number    : 020 - 059
  Version        : 4.49, final!
  Elo average    : 2904
  Elo range      : 479.98
  Conditions     : http://www.amateurschach.de/main/_conditions.htm

  Generated with : Ordo 1.2.6 x64 (Ratings for chess and other games)
  Ordo_126-x64.exe -a 2904 -p 59.pgn -o ordo126.txt -b columns.txt -N2 -QEWDV -U "0,1,4,5,7,8,9,3,10,2,11,12,14" -s1000

  https://sites.google.com/site/gaviotachessengine/ordo
  by Miguel A. Ballicora (Argentina)



   # Player                           :      Elo  Games  Score%  won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ---------------------------------------------------------------------------------------------------------------------------
   1 Stockfish 8 BMI2 x64 C15         :  3187.71    272    85.1  191    81     0   231.5   29.8  37.08  2868.95  22.21   35.7
   2 Houdini 5 Pro x64 C1             :  3140.95    342    80.6  209   133     0   275.5   38.9  29.04  2878.70  21.76   36.5
   3 Komodo 10.2 x64 C15              :  3130.64    286    79.7  170   116     0   228.0   40.6  30.83  2877.61  21.90   34.6
   4 Fire 5 POP x64 C15               :  3083.97    182    75.5   97    81     4   137.5   44.5  35.83  2879.58  22.44   35.2
   5 Andscacs 0.89 BMI2 x64 C15       :  3039.00    242    70.5  110   121    11   170.5   50.0  27.83  2875.50  22.42   35.4
   6 Shredder 13 x64 C15              :  3018.89    286    64.9   94   183     9   185.5   64.0  23.45  2902.02  22.69   36.7
   7 Fizbo 1.8 BMI2 x64               :  2989.55    311    61.1   91   198    22   190.0   63.7  20.51  2903.98  22.61   37.6
   8 GullChess 3.0 BMI2 x64           :  2982.01    281    60.7   80   181    20   170.5   64.4  21.78  2895.61  22.47   37.1
   9 Booot 6.1 POP x64                :  2967.71    355    60.7   87   257    11   215.5   72.4  19.44  2886.71  21.87   36.9
  10 Critter 1.6a x64                 :  2951.14    298    56.7   62   214    22   169.0   71.8  20.21  2897.04  22.43   37.3
  ---------------------------------------------------------------------------------------------------------------------------
  11 Hakkapeliitta TCEC v2 x64        :  2945.24    242    57.9   66   148    28   140.0   61.2  22.93  2888.40  22.28   36.7
  12 Fritz 15 x64                     :  2941.96    280    55.2   50   209    21   154.5   74.6  20.66  2899.50  21.88   36.0
  13 Texel 1.06 x64                   :  2939.22    275    55.8   57   193    25   153.5   70.2  20.95  2900.35  22.57   36.7
  14 Equinox 3.30 x64                 :  2937.47    266    53.4   41   202    23   142.0   75.9  21.07  2914.44  22.40   37.5
  15 Protector 1.9.0 x64              :  2922.91    275    53.1   40   212    23   146.0   77.1  19.77  2900.84  22.05   37.2
  16 iCE 3.0 v658 POP x64             :  2917.25    283    51.4   50   191    42   145.5   67.5  19.99  2907.42  22.49   36.9
  17 Chiron 3 x64                     :  2916.92    309    51.3   35   247    27   158.5   79.9  19.33  2911.84  22.36   37.1
  18 Nirvanachess 2.3 POP x64         :  2910.24    336    52.1   37   276    23   175.0   82.1  17.79  2899.06  22.17   36.9
  19 Hannibal 1.7 x64                 :  2904.83    267    50.4   27   215    25   134.5   80.5  20.24  2904.01  22.04   37.2
  20 Naum 4.6 x64                     :  2900.71    265    50.4   44   179    42   133.5   67.5  20.69  2898.94  22.54   37.4
  ---------------------------------------------------------------------------------------------------------------------------
  21 Pedone 1.5 BMI2 x64              :  2898.59    231    50.2   33   166    32   116.0   71.9  21.42  2899.95  22.19   37.3
  22 Spark 1.0 x64                    :  2885.16    255    50.2   37   182    36   128.0   71.4  20.72  2886.52  21.89   36.7
  23 Junior 13.3.00 x64               :  2879.68    286    47.4   44   183    59   135.5   64.0  20.79  2906.14  22.66   38.0
  24 Rodent II 0.9.64 x64             :  2867.93    265    47.5   27   198    40   126.0   74.7  20.28  2887.60  21.53   35.3
  25 Vajolet2 2.2 POP x64             :  2859.96    292    44.7   25   211    56   130.5   72.3  20.25  2907.08  22.34   37.8
  26 Wasp 1.25 BMI2 x64               :  2859.94    280    46.4   25   210    45   130.0   75.0  20.40  2891.11  21.95   36.0
  27 Arasan 19.1 POP x64              :  2857.07    270    42.8   22   187    61   115.5   69.3  21.13  2914.30  22.23   36.0
  28 Cheng 4.39 x64                   :  2855.08    269    45.2   34   175    60   121.5   65.1  20.02  2894.56  21.94   36.6
  29 Sjeng c't 2010 w32               :  2851.35    292    42.5   23   202    67   124.0   69.2  20.19  2910.62  22.49   38.0
  30 Spike 1.4 Leiden w32             :  2849.53    304    42.8   23   214    67   130.0   70.4  20.28  2904.54  22.22   37.8
  ---------------------------------------------------------------------------------------------------------------------------
  31 Hiarcs 14 WCSC w32               :  2847.86    323    42.7   39   198    86   138.0   61.3  18.55  2907.00  22.49   36.8
  32 Daydreamer 2.0.0 pre2 GNU x64    :  2816.71    355    37.5   11   244   100   133.0   68.7  18.32  2916.83  22.82   37.9
  33 Senpai 1.0 SSE42 x64             :  2815.62    330    36.7   17   208   105   121.0   63.0  19.66  2920.30  22.69   36.4
  34 Quazar 0.4 x64                   :  2812.94    204    36.0   14   119    71    73.5   58.3  25.78  2923.56  23.00   35.7
  35 Deuterium 14.3.34.130 POP x64    :  2811.38    342    37.7   21   216   105   129.0   63.2  19.85  2909.63  22.58   38.6
  36 Zappa Mexico II x64              :  2790.45    273    33.7   16   152   105    92.0   55.7  22.97  2923.18  22.67   36.4
  37 Crafty 25.2 x64                  :  2779.25    322    33.1   28   157   137   106.5   48.8  20.53  2917.72  22.94   38.3
  38 Nemorino 1.02 POP x64            :  2773.42    256    31.4   11   139   106    80.5   54.3  25.09  2921.67  22.36   35.9
  39 Bobcat 7.6 x64                   :  2764.56    315    29.5    6   174   135    93.0   55.2  23.10  2928.25  22.29   35.3
  40 SmarThink 1.96 SSE4 x64          :  2751.48    261    26.4    7   124   130    69.0   47.5  27.76  2939.55  22.87   35.5
  ---------------------------------------------------------------------------------------------------------------------------
  41 DiscoCheck 5.2.1 x64             :  2707.73    218    22.5   19    60   139    49.0   27.5  33.20  2942.72  23.20   33.1
  ---------------------------------------------------------------------------------------------------------------------------


  White advantage = 38.43 +/- 2.54
  Draw rate (equal opponents) = 83.60 % +/- 0.85

  Games        : 5798 (finished)
  White Wins   : 1383 (23.9 %)
  Black Wins   : 737 (12.7 %)
  Draws        : 3678 (63.4 %)
  Unfinished   : 0

  White Score  : 55.6 %
  Black Score  : 44.4 %
Mittelspielrangliste ...
Wie ich die wirklich x-fach nach jedem neuen Spießroutenlauf zu allen Partiephasen generierte.

Nun schaue mal wo Spark steht ... im Mittelspiel zunächst mal 130 Elo über das tatsächliche Level.
Stärke, prima! Stärke gefunden!!
Aber ... nur eine Stärke gefunden, nur eine einzige die aber ein Abbild auf die komplette Stärke wiederspiegeln "könnte".
Wer viel für sich sieht, sieht auch viel gegen sich.
Sprich, wenn ich viele Partien schnell gewinnen, werde ich viele Partien auch nicht schnell verlieren.

Und so konnte dann aus den vier Ratinglisten zu den vier Partiephasen sehr vieles abgelesen werden.

Das sind Versuche eines Einzelnen die zufriedenstellend aber nicht ausreichend sind.

Geht nicht gibt es nicht.
Es geht alles, man mus nur wollen!!

Aber das müssen mehrere Leute entwickeln. Wenige übersehen, einzelne erst Recht.
Und das war nur ein Ansatzpunkt von x guten Ansatzpunkten.

Gibt noch viel mehr solcher Ideen aber ich muss immer aufpassen es nicht explodieren zu lassen.
Nochmal zu Nick: Züge auswerten ist genial (was kritisch ist kann leicht gefiltert werden).

Gruß
Frank

Geändert von user_2071 (07.01.2019 um 19:57 Uhr)
Mit Zitat antworten
Antwort


Forumregeln
Du bist nicht berechtigt, neue Themen zu erstellen.
Du bist nicht berechtigt, auf Beiträge zu antworten.
Du bist nicht berechtigt, Anhänge hochzuladen.
Du bist nicht berechtigt, deine Beiträge zu bearbeiten.

BB code ist An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist An.

Gehe zu

Ähnliche Themen
Thema Erstellt von Forum Antworten Letzter Beitrag
Idee: Gedanken eines Schachcomputer-Liebhabers Egbert Die ganze Welt der Schachcomputer / World of chess computers 16 03.10.2017 13:04
Info: Gedanken zum Thema Schachprogramm und Elo Solwac Die ganze Welt der Schachcomputer / World of chess computers 3 06.10.2016 07:51
Frage: ueber Milano Pro spacious_mind Die ganze Welt der Schachcomputer / World of chess computers 3 08.12.2007 18:37


Alle Zeitangaben in WEZ +1. Es ist jetzt 05:26 Uhr.



Powered by vBulletin (Deutsch)
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
©Schachcomputer.info