Öffentliche GPU- und NPU-Uploads
NVIDIA RTX 5060 Ti 16 GB
4608 CUDA cores
Typ
GPU
VRAM
16 GB
Memory Bandwidth
448 GB/s
TDP
180 W
Benchmark-Ergebnisse
|
Llama 2
7B
|
Q4_0 | 512 | 3,460.92 | 148.00 ms | 94 | llama.cpp | Vulkan | — | vor 4 Wochen hochgeladen |
|
|
Einheitlicher Test
Llama-Bench
Verwendeter Prompt
llama-bench -p 512 -n 128
Notizen
llama-bench / Vulkan scoreboard; Flash Attention deaktiviert
Nachweis
|
||||||||||