Öffentliche GPU- und NPU-Uploads

Apple M1 Ultra 64-core GPU

Typ

GPU

VRAM

64 GB

Memory Bandwidth

800 GB/s

TDP

88 W

Benchmark-Ergebnisse

llama-7b-v2 7B
Q4_0 512 1,030.04 497.00 ms 84 llama.cpp Metal vor 4 Wochen hochgeladen
AI Hardware Research System
Verwendeter Prompt

./llama-bench -p 512 -n 128 -ngl 99

Notizen

Apple-Silicon-Sammelthread; weitgehend einheitlich, aber nicht streng homogen; commit 8e672ef; Hinweis: Im selben Thread auch F16 1168.89 / 37.01 und Q8_0 1042.95 / 59.87.