1
joApioVVx4M4X6Rf 2021-03-01 17:16:40 +08:00
你们用 tesseract-ocr 是识别什么语种的啊?其实有比这个更好的 python 替代方案,比如 paddleocr 和 easyocr,github 可以搜到
|
2
nnnToTnnn 2021-03-01 17:20:39 +08:00
orc 我记得很多啊~ 用 tesseract-ocr 不一定是最好的
|
3
shm7 2021-03-01 17:24:50 +08:00
所以红色信息是啥?出错信息是啥。据我了解 tesseract 的编译要和本地的各种图像驱动相关的,可能有个 dll 不一定够。
|
4
laqow 2021-03-01 17:53:21 +08:00 via Android
python 好像有个 pytesseract 还是什么 tesseract 的壳,印象感觉没有输出什么来着,看看那个壳怎么写的?
|
5
dayeye2006199 2021-03-02 07:10:27 +08:00
我假设你用的 pytesseract 这个套壳包,它就是启动了一个 subprocess,叫了一下系统内安装的 tesseract 。所以你可以找到这行代码: https://github.com/madmaze/pytesseract/blob/master/pytesseract/pytesseract.py#L255
改成: proc = subprocess.Popen(cmd_args, **subprocess_args(), stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL) 这样 stdout 和 stderr 就被重定向了。 |
6
sadfQED2 2021-03-02 12:39:00 +08:00 via Android
如果你用的是 5 楼说得那个套壳包确实改改 py 代码就行
我印象中 python tesseract 还有另外一个包,是通过 cpython 实现的,那个包可能确实需要重新编译,建议别自己折腾,换 4.1 版本试试呢,3.04 已经很老了,说不定升级一次就解决了 |