Skip to content

Qwen3.5

Benchmark

以下三机对比采用 lzc_thor2026-03-20T05-47-33Z 的完整正式矩阵,只保留正确用法下的完整结果,不采用 p1cublasmmq 之类试验性单请求数据。

ModelBest ParallelOrinThor T4000Thor T5000
Qwen3.5-0.8B-Q4_K_M161326.86 tok/s / TTFT 1.94 s / 42.54 W1311.50 tok/s / TTFT 1.88 s / 21.72 W1783.26 tok/s / TTFT 1.37 s / 30.35 W
Qwen3.5-2B-Q4_K_M16989.57 tok/s / TTFT 2.91 s / 46.43 W960.84 tok/s / TTFT 3.01 s / 22.46 W1291.47 tok/s / TTFT 2.17 s / 32.93 W
Qwen3.5-4B-Q4_K_M16431.96 tok/s / TTFT 7.16 s / 48.48 W442.65 tok/s / TTFT 7.07 s / 23.95 W622.09 tok/s / TTFT 4.87 s / 35.87 W
Qwen3.5-9B-Q4_K_M16318.65 tok/s / TTFT 10.85 s / 56.49 W314.55 tok/s / TTFT 11.23 s / 24.60 W450.86 tok/s / TTFT 7.71 s / 35.85 W
Qwen3.5-27B-Q4_K_M1695.80 tok/s / TTFT 44.38 s / 56.82 W90.82 tok/s / TTFT 48.44 s / 25.32 W150.03 tok/s / TTFT 25.49 s / 36.91 W
Qwen3.5-35B-A3B-Q4_K_M16192.59 tok/s / TTFT 27.41 s / 43.12 W181.57 tok/s / TTFT 30.34 s / 18.74 W271.35 tok/s / TTFT 19.09 s / 31.05 W
Qwen3.5-122B-A10B-IQ2_S1665.14 tok/s / TTFT 46.02 s / 42.48 W60.92 tok/s / TTFT 50.95 s / 19.49 W76.55 tok/s / TTFT 43.03 s / 26.25 W

Latest T4000 SM110 Retest

2026-03-20T17-10-00Z 的最新 sm110 maxn retest 目前先完成了 Thor T4000,因此单独列出,避免把未完成的 T5000 / Orin 数据混到同一张对比表里。

ModelBest ParallelThor T4000
Qwen3.5-0.8B-Q4_K_M161313.47 tok/s / TTFT 1.88 s / 21.73 W
Qwen3.5-2B-Q4_K_M16960.84 tok/s / TTFT 3.01 s / 22.84 W
Qwen3.5-4B-Q4_K_M16442.74 tok/s / TTFT 7.07 s / 23.95 W
Qwen3.5-9B-Q4_K_M16314.46 tok/s / TTFT 11.23 s / 24.60 W
Qwen3.5-27B-Q4_K_M1691.00 tok/s / TTFT 48.40 s / 25.33 W
Qwen3.5-35B-A3B-Q4_K_M16181.36 tok/s / TTFT 30.35 s / 18.74 W
Qwen3.5-122B-A10B-IQ2_S1660.67 tok/s / TTFT 51.23 s / 19.49 W

Notes

  • 三机对比数据来源:/home/catdog/lzc_thor/docs/runs/2026-03-20T05-47-33Z
  • 最新 sm110 重测数据来源:/home/catdog/lzc_thor/docs/runs/2026-03-20T17-10-00Z
  • Qwen3.5-397B-A17B-IQ1_S 在最新测试里 T4000Orin 均未形成可用 benchmark,因此不写入正式 benchmark 表。
  • 功耗列统一记录测试中的最大功率。