Benchmark
| Model Alias | Actual Model | Tokens/s | Notes |
|---|---|---|---|
| qwen3-coder:30b | - | 31.84 | - |
| qwen3.5:9b | qwen3.5:9b-q4_K_M | 15 | 工具调用准确度相比 qwen3 有所增强 |
| qwen3:35b-a3b (262k) | qwen3.5:35b-a3b-q4_K_M | 25 | 手动将上下文从 8k 调整到 262k;工具调用能力尚可;VRAM 占用稳定在 24.4G-30G |
| Model Alias | Actual Model | Tokens/s | Notes |
|---|---|---|---|
| qwen3-coder:30b | - | 31.84 | - |
| qwen3.5:9b | qwen3.5:9b-q4_K_M | 15 | 工具调用准确度相比 qwen3 有所增强 |
| qwen3:35b-a3b (262k) | qwen3.5:35b-a3b-q4_K_M | 25 | 手动将上下文从 8k 调整到 262k;工具调用能力尚可;VRAM 占用稳定在 24.4G-30G |