Benchmark

Model Alias	Actual Model	Tokens/s	Notes
qwen3-coder:30b	-	31.84	-
qwen3.5:9b	qwen3.5:9b-q4_K_M	15	工具调用准确度相比 qwen3 有所增强
qwen3:35b-a3b (262k)	qwen3.5:35b-a3b-q4_K_M	25	手动将上下文从 8k 调整到 262k；工具调用能力尚可；VRAM 占用稳定在 24.4G-30G

Benchmark ​