Whisper.cpp
Benchmark
以下对比采用 lzc_thor 在 2026-03-21 的最新正式矩阵,主表只保留同时具备 Orin / Thor T4000 / Thor T5000 三机可比结果的模型。
| Model | Scene | Orin | Thor T4000 | Thor T5000 | Notes |
|---|---|---|---|---|---|
base.en | jfk, concurrency=16 | 3.39 req/s / P95 4.55 s / 56.82 W | 7.39 req/s / P95 2.10 s / 11.65 W | 9.44 req/s / P95 1.64 s / 17.68 W | 三机都能稳定完成压测,适合作为英语轻量模型基线 |
small.en | jfk, concurrency=16 | 2.46 req/s / P95 6.28 s / 26.88 W | 4.07 req/s / P95 3.80 s / 14.25 W | 5.36 req/s / P95 2.89 s / 21.76 W | 速度和识别质量相比 base.en 更均衡 |
medium.en | jfk, concurrency=16 | 1.34 req/s / P95 11.52 s / 35.50 W | 1.77 req/s / P95 8.71 s / 16.85 W | 2.53 req/s / P95 6.11 s / 26.94 W | 中型模型下 Thor T5000 优势更明显 |
More
| Model | Scene | Thor T4000 | Thor T5000 | Notes |
|---|---|---|---|---|
large-v3-turbo | jfk, concurrency=16 | 1.59 req/s / P95 9.70 s / 20.93 W | 2.52 req/s / P95 6.13 s / 36.15 W | 2026-03-21 最新矩阵中 Orin 结果仍未完整落盘,先只保留双 Thor 对比 |
Notes
- 数据来源:
/home/catdog/lzc_thor/docs/runs/2026-03-21T08-45-00Z - 主表使用的是正式压力矩阵结果,不引用中断或未汇总 case。
- 功耗列统一记录测试中的最大功率,不写平均功率。