Public GPU and NPU uploads
Apple M1 Ultra 64-core GPU
Type
GPU
VRAM
128 GB
Memory bandwidth
800 GB/s
TDP
88 W
Benchmark results
|
llama-7b-v2
7B
|
Q4_0 | 512 | 1,030.04 | 497.00 ms | 84 | llama.cpp | Metal | — | uploaded 4 weeks ago |
|
|
Used prompt
./llama-bench -p 512 -n 128 -ngl 99
Notes
Apple-Silicon-Sammelthread; weitgehend einheitlich, aber nicht streng homogen; commit 8e672ef; Hinweis: Im selben Thread auch F16 1168.89 / 37.01 und Q8_0 1042.95 / 59.87.
Evidence
|
||||||||||