Hier die Werte einer RTX 2060 (nicht mobile) von Andreas Strangmüller:
Code:
Leela Zero (Lc0) auf einer NVIDIA Geforce RTX 2060
GUI: Arena 3.5.1
Engine: Lc0 v0.20.1 CUDA
Netz: 32900
Stellung: Grundstellung - FEN: rnbqkbnr/pppppppp/8/8/8/8/PPPPPPPP/RNBQKBNR w KQkq - 0 1
Nachfolgend einige Benchmarks mit unterschiedlichen Settings nach ca. 60 Sekunden Bedenkzeit aus der Grundstellung:
Default Settings, backend=cudnn
Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 01:01 469.006 7.681
Nach einer Minute: 01:01 469.006 7.681
---------------------------------------------------------------
Default Settings, backend=cudnn-fp16
Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 00:18 404.929 22.276
Nach einer Minute: 01:01 1.224.396 19.995
---------------------------------------------------------------
Default Settings, backend=cudnn-fp16, NNCacheSize=2000000
Zeit Knoten Gesamt Knoten pro Sekunde
Höchste Knotenzahl: 01:01 1.503.121 24.499
Nach einer Minute: 01:01 1.503.121 24.499
Man beachte den Riesen-Unterschied zwischen cudnn-fp16 und default !
Eine RTX 2070 sollte nochmal ca. 20% schneller sein...
Mit der OpenCL-Version kann man froh sein, wenn lc0 auf 1000 n/s kommt. Die meisten Systeme werden sogar darunter bleiben. Nur mal so als Vergleich...
Die schnellsten nicht-RTX Karten, also GTX 1080 etc. kommen mit der CUDA-Version von lc0 so auf 6000-8000 n/s.