PaddleOCR-VL-1.5

Benchmark

Model	Framework	Scene	TTFT	Token/s	Sample	Notes
PaddleOCR-VL-1.5 (f16)	llama.cpp	OCR / ReadingGeneration	310 ms	94	-	能识别复杂排版，但大段重复文本会出现幻觉
PaddleOCR-VL-1.5-GGUF-Q4_K_M.gguf	llama.cpp	ReadingGeneration	-	199.66	307 tokens / 1.5 s	相比 f16 更容易出现幻觉
PaddleOCR-VL-1.5-GGUF-Q8_0.gguf	llama.cpp	ReadingGeneration	-	176.82	2012 tokens / 11 s	速度与稳定性较均衡，建议使用该精度