需求是实现这样一个功能:fn(图片) => { 距离: 5km, 时间: 00:30:00 }
用"OCR+正则"的思路去做遇到的问题是:
- 标点符号识别率低,有时会把 5.01km 识别成 501km
- 关键信息缺少特征,比如有些软件中的时间可能是 'mm:ss' 的格式,会与手机系统时间混淆,又或者距离是纯数字的 ‘ 5 ’,而不是 '5km'
发几张 ocr 的结果图:
- https://wxt.sinaimg.cn/mw1024/80a06c8dgy1fofukmmw5lj214c132n0p.jpg?tags=%5B%5D
- https://wx2.sinaimg.cn/mw1024/80a06c8dgy1fofukmje3wj219o12oq66.jpg
- https://wx1.sinaimg.cn/mw1024/80a06c8dgy1fofukmldvrj214412gq65.jpg
- https://wx4.sinaimg.cn/mw1024/80a06c8dgy1fofukmo2v5j213y12cn10.jpg
自己想到 2 个方案
- 笨办法,针对不同软件做几个模版,对每个模版分别写正则
- 机器学习+ocr,同样也是针对几种模板分别做训练(没了解过这方面,老铁们有推荐的工具吗?)
大家有更好的思路吗?