Öffentliche GPU- und NPU-Uploads

NVIDIA RTX 4090

16384 CUDA cores

Typ

GPU

VRAM

24 GB

Memory Bandwidth

1,008 GB/s

TDP

450 W

Benchmark-Ergebnisse

Llama 2 7B
Q4_0 512 9,452.03 54.00 ms 188 llama.cpp Vulkan vor 4 Wochen hochgeladen
AI Hardware Research System
Einheitlicher Test

Llama-Bench

Verwendeter Prompt

llama-bench -p 512 -n 128

Notizen

llama-bench / Vulkan scoreboard; Flash Attention deaktiviert