Öffentliche GPU- und NPU-Uploads

NVIDIA RTX 4080 SUPER

10240 CUDA cores

Typ

GPU

VRAM

16 GB

Memory Bandwidth

736 GB/s

TDP

320 W

Benchmark-Ergebnisse

Llama 2 7B
Q4_0 512 7,101.18 72.00 ms 147 llama.cpp Vulkan vor 4 Wochen hochgeladen
AI Hardware Research System
Einheitlicher Test

Llama-Bench

Verwendeter Prompt

llama-bench -p 512 -n 128

Notizen

llama-bench / Vulkan scoreboard; Flash Attention deaktiviert