multi-ocr-sdk现已支持paddleocr-vl-1.5

doggie · 2026年02月26日11:20

关于multi-ocr-sdk

multi-ocr-sdk：支持多种ocr引擎的pip包

前倾提要

最近发布的paddleocr-vl-1.5不知道大家体验了没有，效果非常不错

2026年1月29日，我们发布了PaddleOCR-VL-1.5。PaddleOCR-VL-1.5不仅以94.5%精度大幅刷新了评测集OmniDocBench v1.5，更创新性地支持了异形框定位，使得PaddleOCR-VL-1.5 在扫描、倾斜、弯折、屏幕拍摄及复杂光照等真实场景中均表现优异。此外，模型还新增了印章识别与文本检测识别能力，关键指标持续领跑。
使用教程 - PaddleOCR 文档

没体验过的可以在线体验—— PaddleOCR - 文档解析与智能文字识别 | 支持API调用与MCP服务 - 飞桨星河社区
这张图是官方的案例，对于这种畸形的图片的识别效果非常好，常规的图更是不在话下

所以multi-ocr-sdk快（gui）速更新支持了paddleocr-vl-1.5

大幅简化了使用流程，只要指定base_url和api_key以及文件路径即可

如何使用

先安装

pip install multi-ocr-sdk

再使用

import json

from multi_ocr_sdk import PaddleOCRVLClient


base_url = "http://10.131.101.39:8010"
api_key = "test"

# 默认模式：仅返回识别出的文字markdown
client = PaddleOCRVLClient(base_url=base_url, api_key=api_key)
markdown_text = client.parse(r"examples/example_files/DeepSeek_OCR_paper_page1.jpg")
print(markdown_text)

# # 富结果模式：返回 Markdown + 每页版面定位信息（边界框坐标）
# rich_client = PaddleOCRVLClient(
#     base_url=base_url,
#     api_key=api_key,
#     return_layout_info=True,
# )
# result = rich_client.parse(r"examples/example_files/DeepSeek_OCR_paper_page1.jpg")
# result_dict = result.to_dict()
# print(json.dumps(result_dict, ensure_ascii=False, indent=2))

最后

欢迎大家pr

話題	回覆	觀看
multi-ocr-sdk：支持多种ocr引擎的pip包 💻编程 ocr	31	2025年12月16日
paddleocr-vl-1.5微调教程 🤖人工智能 ocr , paddlepaddle	10	2026年02月25日
如何安装部署paddleocr-vl 💻编程 ocr	10	2026年01月12日
deepseek-ocr和paddleocr-vl区别 🤖人工智能 ocr , deepseek , paddle	10	2026年01月12日
paddleocr-vl-1.5 docker部署及参数调整 💻编程 ocr , docker , paddle	23	2026年02月25日

multi-ocr-sdk现已支持paddleocr-vl-1.5

关于multi-ocr-sdk

前倾提要

如何使用

最后

Related topics