Einzelnen Beitrag anzeigen
  #725  
Alt 24.06.2019, 12:53
StPohl StPohl ist offline
TASC R30
 
Registriert seit: 30.03.2018
Land:
Beiträge: 424
Abgegebene Danke: 71
Erhielt 550 Danke für 247 Beiträge
Aktivitäten Langlebigkeit
2/20 7/20
Heute Beiträge
0/3 ssssss424
AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau (Der LC0 Thread)

Hier die Werte einer RTX 2060 (nicht mobile) von Andreas Strangmüller:
Code:
Leela Zero (Lc0) auf einer NVIDIA Geforce RTX 2060

GUI:       Arena 3.5.1
Engine:    Lc0 v0.20.1 CUDA
Netz:      32900
Stellung:  Grundstellung - FEN: rnbqkbnr/pppppppp/8/8/8/8/PPPPPPPP/RNBQKBNR w KQkq - 0 1

Nachfolgend einige Benchmarks mit unterschiedlichen Settings nach ca. 60 Sekunden Bedenkzeit aus der Grundstellung:

Default Settings, backend=cudnn

                    Zeit    Knoten Gesamt   Knoten pro Sekunde
Höchste Knotenzahl: 01:01   469.006          7.681
Nach einer Minute:  01:01   469.006          7.681

---------------------------------------------------------------

Default Settings, backend=cudnn-fp16

                    Zeit    Knoten Gesamt   Knoten pro Sekunde
Höchste Knotenzahl: 00:18     404.929       22.276
Nach einer Minute:  01:01   1.224.396       19.995

---------------------------------------------------------------

Default Settings, backend=cudnn-fp16, NNCacheSize=2000000

                    Zeit    Knoten Gesamt   Knoten pro Sekunde
Höchste Knotenzahl: 01:01   1.503.121       24.499
Nach einer Minute:  01:01   1.503.121       24.499
Man beachte den Riesen-Unterschied zwischen cudnn-fp16 und default !
Eine RTX 2070 sollte nochmal ca. 20% schneller sein...

Mit der OpenCL-Version kann man froh sein, wenn lc0 auf 1000 n/s kommt. Die meisten Systeme werden sogar darunter bleiben. Nur mal so als Vergleich...

Die schnellsten nicht-RTX Karten, also GTX 1080 etc. kommen mit der CUDA-Version von lc0 so auf 6000-8000 n/s.
Mit Zitat antworten