Skip to content

PaddleOCR-VL-1.5

Benchmark

ModelFrameworkSceneTTFTToken/sSampleNotes
PaddleOCR-VL-1.5 (f16)llama.cppOCR / ReadingGeneration310 ms94-能识别复杂排版,但大段重复文本会出现幻觉
PaddleOCR-VL-1.5-GGUF-Q4_K_M.ggufllama.cppReadingGeneration-199.66307 tokens / 1.5 s相比 f16 更容易出现幻觉
PaddleOCR-VL-1.5-GGUF-Q8_0.ggufllama.cppReadingGeneration-176.822012 tokens / 11 s速度与稳定性较均衡,建议使用该精度

Notes

  • 该模型主要提供纯 OCR 能力。
  • 若要同时实现版面分析和 Markdown 输出,需结合其他模型使用。
  • Image: registry.lazycat.cloud/x/lzc-aipod-paddleocr-vl:2017cd2