← Back to community benchmarks

Qwen2.5-Coder-3B-Instruct

M1 (7c) · 16 GB · 4bit · 2026-04-12

Performance

8k

tokens

91.6

PP tok/s

10.8

TG tok/s

89431

TTFT (ms)

2.5

Peak mem (GB)

Hardware

Chip M1 (7c)

Memory 16 GB

GPU Cores 7

Software

oMLX v0.3.4

macOS macOS 26.3.1

Context 8,192

Performance by Context Length

Context	PP tok/s	TG tok/s	Peak Mem
8k	91.6	10.8	2.5 GB	current
16k	73.9	8.1	2.7 GB	view
32k	57.2	10.3	3.3 GB	view