← Back to community benchmarks

Qwen2.5-Coder-3B-Instruct

M1 (7c) · 16 GB · 4bit · 2026-04-12

Performance

32k

tokens

57.2

PP tok/s

10.3

TG tok/s

572960

TTFT (ms)

3.3

Peak mem (GB)

Hardware

Chip M1 (7c)

Memory 16 GB

GPU Cores 7

Software

oMLX v0.3.4

macOS macOS 26.3.1

Context 32,768

Performance by Context Length

Context	PP tok/s	TG tok/s	Peak Mem
8k	91.6	10.8	2.5 GB	view
16k	73.9	8.1	2.7 GB	view
32k	57.2	10.3	3.3 GB	current