Public GPU and NPU uploads
Apple M2 Max 38-core GPU
Type
GPU
VRAM
64 GB
Memory bandwidth
400 GB/s
TDP
54 W
Benchmark results
|
llama-7b-v2
7B
|
Q4_0 | 512 | 671.31 | 763.00 ms | 66 | llama.cpp | Metal | — | uploaded 4 weeks ago |
|
|
Used prompt
./llama-bench -p 512 -n 128 -ngl 99
Notes
Apple-Silicon-Sammelthread; weitgehend einheitlich, aber nicht streng homogen; Hinweis: Separate 38-core-Posts fuer 32 GB und 96 GB mit sehr aehnlichen Werten; ausserdem F16 755.67 / 24.65 und Q8_0 677.91 / 41.83.
Evidence
|
||||||||||