aime26-16

math · deterministic-tests · seed tier 3 · published

Best result per model

#	Model	Tests	Run
1	phi-4-mini	0/1	Q6_K · 24 GB · runner verified
2	qwen3-coder	0/1	UD-Q4_K_XL · 24 GB · runner verified
3	qwen3-coder-next	0/1	UD-Q4_K_XL · 24 GB · runner verified

3 models attempted.