Öffentliche GPU- und NPU-Uploads
Apple M1 Ultra 48-core GPU
Typ
GPU
VRAM
128 GB
Memory Bandwidth
800 GB/s
TDP
66 W
Benchmark-Ergebnisse
|
llama-7b-v2
7B
|
Q4_0 | 512 | 772.24 | 663.00 ms | 75 | llama.cpp | Metal | — | vor 4 Wochen hochgeladen |
|
|
Verwendeter Prompt
./llama-bench -p 512 -n 128 -ngl 99
Notizen
Apple-Silicon-Sammelthread; weitgehend einheitlich, aber nicht streng homogen; commit 8e672ef; Hinweis: Im selben Thread auch F16 875.81 / 33.92 und Q8_0 783.45 / 55.69.
Nachweis
|
||||||||||