Einzelnen Beitrag anzeigen
  #724  
Alt 24.06.2019, 12:42
StPohl StPohl ist offline
TASC R30
 
Registriert seit: 30.03.2018
Land:
Beiträge: 424
Abgegebene Danke: 71
Erhielt 550 Danke für 247 Beiträge
Aktivitäten Langlebigkeit
2/20 7/20
Heute Beiträge
0/3 ssssss424
AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau (Der LC0 Thread)

 Zitat von fhub Beitrag anzeigen
Ok, danke für die vielen Tips!

Die 50xxx-Networks werde ich dann mal vergessen, aber noch ist mir nicht ganz klar, was nun am besten für meine Konfigration geeignet ist.
Das CUDA-Zeugs will ich mir nur für LC0 nicht unbedingt installieren, aber die ganz langsame CPU-Version benutze ich auch nicht, sondern die OpenCL-Version von LC0 (die läuft ja auch auf der Grafikkarte).
Welche Networks sind denn für die OpenCL-Version gut geeignet?
Und ist da wirklich so ein großer Unterschied zwischen CUDA und OpenCL?

Grüße,
Franz
Es ist ein Riesenunterschied zwischen CUDA und OpenCl!! (ca. Faktor 4.5 bis 5x schneller ist CUDA)
Wenn du also eine CUDA-Karte hast (also was halbwegs aktuelles von NVIDIA) solltest du unbedingt lc0-CUDA benutzen. Das Gute ist, es muß gar nichts installiert werden! (Das war nur ganz früher der Fall, mittlerweile hat NVIDIA dem lc0-Team erlaubt, die nötigen CUDA-files in ihren Download zu packen!).
Du mußt nur deinen Grafiktreiber auf den neuesten Stand bringen (das ist aber keine große Sache und geht praktisch von alleine):
https://www.nvidia.de/Download/index.aspx?lang=de

Danach rebootest du den PC und lädst dir nur den lc0-CUDA runter (der ist allerdings gute 250MB groß) und entpackst das Ganze in einen Ordner, packst ein Net dazu und das war es schon. Das ist letztlich sogar bequemer, als die OpenCL-Version. Denn Letztere muß man erst mal im Konsolenmodus starten, dann go infinte eingeben und dann sucht lc0 die optimale Konfiguration für die GPU und das kann gut und gerne 30-45 Minuten dauern(!). In der Zeit hast du die CUDA-Version längst am Laufen!

Bei einer flotten CUDA-Karte empfiehlt es sich, die lc0-UCI-Option NNCacheSize hochzusetzen (entspricht etwa der Hash-Option bei normalen Engines). 1000000 wäre schon empfehlenswert (default ist 200000). Hash über die GUI kann man nicht einstellen, lc0 kennt das Hash-Kommando gar nicht. Hier kann man in der GUI also einen ganz kleinen Wert nehmen, lc0 nutzt das sowieso nicht.

Wer eine RTX-Karte hat, muß bei den lc0-UCI-Optionen noch unbedingt Backend=cudnn-fp16 einstellen, das macht lc0 ca. Faktor 3 schneller, weil die Fließkommaoperationen auf 16bit begrenzt werden (default sind 32bit). Das geht aber nur auf RTX-Karten! Und ist der Grund, warum alle Tester sich jetzt RTX-Karten gekauft haben...auch ich. Also ich hab ein neues Notebook mit RTX2060 gekauft. Wer einen KlotzPC daheim hat, dem würde ich die RTX 2070 empfehlen, welche bei lc0 das z.Zt. beste Preis/Leistungsverhältnis hat.

Geändert von StPohl (24.06.2019 um 13:21 Uhr)
Mit Zitat antworten