是使用 3.05 版本进行训练的,训练了大约有 500 张图片。疑问是:400 张训练出的 traineddata 文件是 300 多 KB,500 张还是 300 多 KB,而且还少了几 KB,为什么呢? 然后识别率也不见提高? 还有就是有大佬知道 TesseractOCR4.0 怎么训练吗?(我看了官方文档,看的很懵逼)
1
2ME 2017-10-18 09:29:20 +08:00 1
500 张 traineddata 300KB 是没问题的 如果是复杂的干扰比较多的验证码需要先预处理 二值化 文字分割等一些操作 减少图片复杂度后再进行训练识别才会有效果
|