Öffentliche GPU- und NPU-Uploads

NVIDIA RTX 5090

21760 CUDA cores

Typ

GPU

VRAM

32 GB

Memory Bandwidth

1,792 GB/s

TDP

575 W

Benchmark-Ergebnisse

Llama 2 7B
Q4_0 512 10,381.64 49.00 ms 264 llama.cpp Vulkan vor 4 Wochen hochgeladen
AI Hardware Research System
Einheitlicher Test

Llama-Bench

Verwendeter Prompt

llama-bench -p 512 -n 128

Notizen

llama-bench / Vulkan scoreboard; Flash Attention deaktiviert