PaddleOCR-VL-1.5
Benchmark
| Model | Framework | Scene | TTFT | Token/s | Sample | Notes |
|---|---|---|---|---|---|---|
| PaddleOCR-VL-1.5 (f16) | llama.cpp | OCR / ReadingGeneration | 310 ms | 94 | - | 能识别复杂排版,但大段重复文本会出现幻觉 |
| PaddleOCR-VL-1.5-GGUF-Q4_K_M.gguf | llama.cpp | ReadingGeneration | - | 199.66 | 307 tokens / 1.5 s | 相比 f16 更容易出现幻觉 |
| PaddleOCR-VL-1.5-GGUF-Q8_0.gguf | llama.cpp | ReadingGeneration | - | 176.82 | 2012 tokens / 11 s | 速度与稳定性较均衡,建议使用该精度 |
Notes
- 该模型主要提供纯 OCR 能力。
- 若要同时实现版面分析和 Markdown 输出,需结合其他模型使用。
- Image:
registry.lazycat.cloud/x/lzc-aipod-paddleocr-vl:2017cd2