Public GPU and NPU uploads

Apple M1 Ultra 48-core GPU

Type

GPU

VRAM

64 GB

Memory bandwidth

800 GB/s

TDP

66 W

Benchmark results

llama-7b-v2 7B
Q4_0 512 772.24 663.00 ms 75 llama.cpp Metal uploaded 4 weeks ago
AI Hardware Research System
Used prompt

./llama-bench -p 512 -n 128 -ngl 99

Notes

Apple-Silicon-Sammelthread; weitgehend einheitlich, aber nicht streng homogen; commit 8e672ef; Hinweis: Im selben Thread auch F16 875.81 / 33.92 und Q8_0 783.45 / 55.69.