想在本地部署 OCR 服务，解析美团的外卖订单截图，求推荐一个好用的 OCR 模型

This topic created in 83 days ago, the information mentioned may be changed or developed.

公司做的是美团业务，需要定期解析一批美团的订单截图（也有一些是手机相机拍的订单页面图片），提取出其中的订单号码。我试用了下腾讯的 ocr 识别成功率很高，就是太贵了，图片量很大遭不住。哪位老哥研究过 OCR ，能不能推荐一个适合本地部署的，公司有 5060 显卡。

OCR

本地部署

美团

49 replies • 2026-06-10 17:09:02 +08:00

superhuai

Apr 20

偷偷摸摸用之前微信提取的那个 ocr ，应该不要钱。

Wao

Apr 20

deepseek ocr

Mogugugugu

Apr 20

Paddle OCR 试试

66beta

Apr 20

听上去 Gemini 本地模型 Gemma 4 就能做？而且显卡错错有余

Leon6868

Apr 20

也许用多模态大模型比普通 OCR 好，收集拍摄的订单图片对于基于文字分隔的 OCR 而言还是太难了

raptor

Apr 20

@Mogugugugu 百度这个确实还行

diudiuu

Apr 20

gemma+ocr 一套

https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF/tree/main

mmproj-BF16.gguf 这个是图片模型

honda720

Apr 20

Paddle OCR 就是干这个的，5060 应该能搞个稍微好点的

xyooyx

Apr 20

Topdu/OpenOCR 前段时期试了个小型的，效果不错

defunct9

Apr 20

mmproj-BF16.gguf 这个是多模态用的，https://rendoumi.com/posts/20260409-gemma4_install/

wnpllrzodiac

Apr 20

rapid OCR

cheng6563

Apr 20

跑个 qwen 看效果怎样。

labubu

Apr 20

百度 Paddle server 版本

iorilu

Apr 20

关注下, 模型太多了

现在有什么排行榜或确认的评测, 那几个模型领先吗

TuringGooner

Apr 20

之前不是有大佬逆向出来一个微信的 OCR 组件，纯算法的

Seanfuck

Apr 20

Paddle OCR 基本上最强，有 cpu 版本，有现成的容器镜像。

picone

Apr 20

paddle OCR ，性能也不错

BlueSkyXN

Apr 20

我一般用 MAC 自带的

pandaPapa

Apr 20

deepseek ocr 好像免费的

SmallBlueZhao

Apr 20

第一次看见帖子里面推荐百度家的东西比别家的多。。。

whitewatercn

Apr 20

之前试过，paddle-ocr-vl1.5 足够好用，且开销不大，跟着这两个教程玩就足够了

先部署 https://forum.beginner.center/t/topic/2677

再调用 https://forum.beginner.center/t/topic/2681

whitewatercn

Apr 20

@SmallBlueZhao #20
有一说一百度在 ocr 方面的积淀很深，不知道多少年前就开始提供 ocr api 了，大模型出来以前，他们的 api 就很好用

tianjiyao

Apr 20

@SmallBlueZhao 这个你别说 paddle OCR 是这个行业的翘首。。。百度这个是真的不错。更加厌恶肉饼了。。。。。多好的牌。。打成这样子稀烂

ShawnShi

PRO

Apr 20

https://aistudio.baidu.com/paddleocr 提供免费服务效果不错的

mashimaroinfo1

Apr 20

这个事儿我亲手试过, 最精准的是 GLM-OCR(GGUF), 好像 0.9b 。

次一等(但更快)RapidOCR 。

别信 Tesseract OCR, 各种意外错误。

Les1ie

Apr 20

直接用 paddleocr ，或者用基于他而开的框架 rapidOCR 。开发和部署都超级简单，不吃资源，比如我上个月搓的简易验证码识别，简单粗暴又高效 https://github.com/IanSmith123/easy_captcha :)

livelyyongheng1

Apr 20

那必然是 paddle

NizumaEiji

Apr 20

paddle ocr 吧日常用比较稳
没必要上多模态的 llm 吧

AiBoy

Apr 20

识别中文手写最强的是谁呢？

superPONY

Apr 20

巧了，最近在做的项目刚好测了几个多模态/OCR 模型，你可以参考我的项目 readme 文档，https://github.com/RAGDock/RAGDock 。有用的的话求个 Star 哈哈哈

andlp

Apr 20

yolo 效果比大模型好
定位订单的区域,针对这个字体识别,然后只识别 0-9 这 10 个数字效果比什么大模型都要好的多

berry10086

Apr 20

easyocr 也可以

miaomiao888

Apr 21

@AiBoy 合合 OCR

SanjinGG

Apr 21

rapidocr

Selenium39

Apr 21

llmocr

latelan

Apr 21

@defunct9 这个跑起来吃力么，小龙虾用着咋样啊

JoeSmith

Apr 21

https://github.com/datalab-to/chandra

刚看到篇帖子使劲夸了他
https://www.towardsdeeplearning.com/rip-commercial-ocr-an-open-source-model-just-topped-every-benchmark-351bf9d6be10

fork3rt

Apr 21

Paddle OCR VL 即可

ukoudai

Apr 21

你直接使用 macos,自带视觉识别的，速度还贼快

lyhiving

Apr 21

识别中文手写最强的是谁呢？

defunct9

Apr 21

@latelan 魔怔了吧，龙虾已经过时了。

fenildf

Apr 21

@whitewatercn 这种在 windows 下有法部署吗？

fenildf

Apr 21

@superPONY 已 star 。看起来挺好。想自己试试，发现缺指导文件 BUILD_GUIDE.md

EchoPrince

Apr 21

@berry10086 今天简单试了下，手机截图准确率很高了，但是相机拍摄的照片有时候订单号中间会缺失 3-4 位数字

fenildf

Apr 22

@EchoPrince 相机应该分辨率更高吧。不过可能被环境影响了

whitewatercn

Apr 24

@fenildf #42 windows 没试过，但是最简单的就是上 docker 吧，只要能启动 paddleocr 就行

fenildf

Apr 27

@whitewatercn 好的，谢谢

PersueYan

Apr 28

@ukoudai macos 自带的程序名字是啥

xiaxichen

Jun 10

paddle-ocr-vl1.6 很强