Whisper.cpp

Benchmark

以下对比采用 lzc_thor 在 2026-03-21 的最新正式矩阵，主表只保留同时具备 Orin / Thor T4000 / Thor T5000 三机可比结果的模型。

Model	Scene	Orin	Thor T4000	Thor T5000	Notes
`base.en`	`jfk`, concurrency=`16`	`3.39 req/s` / `P95 4.55 s` / `56.82 W`	`7.39 req/s` / `P95 2.10 s` / `11.65 W`	`9.44 req/s` / `P95 1.64 s` / `17.68 W`	三机都能稳定完成压测，适合作为英语轻量模型基线
`small.en`	`jfk`, concurrency=`16`	`2.46 req/s` / `P95 6.28 s` / `26.88 W`	`4.07 req/s` / `P95 3.80 s` / `14.25 W`	`5.36 req/s` / `P95 2.89 s` / `21.76 W`	速度和识别质量相比 `base.en` 更均衡
`medium.en`	`jfk`, concurrency=`16`	`1.34 req/s` / `P95 11.52 s` / `35.50 W`	`1.77 req/s` / `P95 8.71 s` / `16.85 W`	`2.53 req/s` / `P95 6.11 s` / `26.94 W`	中型模型下 Thor T5000 优势更明显

Model	Scene	Thor T4000	Thor T5000	Notes
`large-v3-turbo`	`jfk`, concurrency=`16`	`1.59 req/s` / `P95 9.70 s` / `20.93 W`	`2.52 req/s` / `P95 6.13 s` / `36.15 W`	`2026-03-21` 最新矩阵中 Orin 结果仍未完整落盘，先只保留双 Thor 对比