这是我第 7 款 macOS 产品了:iText
iText 是一款 从图片中识别文字 的 OCR 工具。
选择屏幕任意区域,立即识别其中的文字。
配合快捷键,截图更方便。默认快捷键为 ⇧⌘1
;当然,你可以在 iText 偏好设置中修改。
比如,你在网上看到了一张图片、或者本地有个图片文件,都可以拖拽至 iText 菜单栏图标进行识别。
当然,你也可以在 iText 菜单中选择图片文件进行识别。
你会发现,对于 看扫描版 PDF 文件、登录才能复制文字的网页、对方以手机截图的方式发电话号码、等场景,iText 快速识字的功能,很有用、也很好用。
目前,iText 还处于封闭内测期。如需体验,请联系:[email protected]
iText 已上架 Mac App Store,点此下载
1
Willjim 2017-11-13 08:38:27 +08:00 via Android
哇,发现你特别喜欢通过状态栏做文章啊!东西感觉不错。
|
2
ixixixe2 2017-11-13 08:42:07 +08:00
厉害了
|
3
yu099 2017-11-13 08:43:00 +08:00 via Android
三个点只识别出一个😂😂
|
4
Telegram 2017-11-13 08:44:02 +08:00
看上去好棒
|
5
quietjosen OP @Willjim 也不完全,Klib 就是一般的窗口应用。主要是截图这种事,状态栏比较适合。
|
6
quietjosen OP @yu099 你这种挑剔的精神,刺激了人们进步 😂
|
7
quietjosen OP @Telegram 试试也不错的 :)
|
8
cxl008 2017-11-13 08:50:22 +08:00
没有下载地址? app store 搜不到啊
|
10
Telegram 2017-11-13 08:59:32 +08:00
@quietjosen #7 可是我是 PC,无奈。
|
11
AdamChrist 2017-11-13 08:59:41 +08:00
厉害了...点赞...
|
12
gitgit 2017-11-13 09:10:14 +08:00
windows 版本有吗
|
13
mokeyjay 2017-11-13 09:11:21 +08:00
Win 哭出声
|
14
x7395759 2017-11-13 09:24:27 +08:00 1
这种很正规的识别怎么样都不会差,会差的是图文混排,字体倾斜,字体粗细不一致,可见程度不一致,等~~~~
但还是很厉害的,我做一个验证码识别也就能到 70--------- |
15
privil 2017-11-13 09:26:05 +08:00 4
很标题党了 = =
|
16
VShawn 2017-11-13 09:28:22 +08:00 via Android 1
这种很规整的文章 tesseractOCR 就搞定了
|
17
leeyom 2017-11-13 09:38:32 +08:00
太棒了,好东西噢
|
18
CEBBCAT 2017-11-13 09:41:27 +08:00 via Android
看起来不错,一看图就想起来 Snipaste 了,希望也是个很棒的软件
|
22
quietjosen OP @x7395759 欢迎整个这种图来调戏一下 iText,看看它表现如何。
|
23
wplct 2017-11-13 10:03:15 +08:00
这种做交互上的创新也很不错。lz 厉害
|
24
xuanboyi 2017-11-13 10:05:18 +08:00 via iPhone
真大神,收下膝盖
|
25
Hayek 2017-11-13 10:05:20 +08:00
看标题以为在吹牛 x。
点进来看内容是真牛 x。 虽然识别使用的是接口,但是实现上还是挺好的。 |
26
freefcw 2017-11-13 10:09:36 +08:00
不错不错,很方便的感觉
|
27
xwartz 2017-11-13 10:17:53 +08:00
优秀
|
28
quietjosen OP @Hayek 哈哈,看回复吓了一跳;识别这种事,还是有技术难度的;自己搞,肯定不如大公司。
|
29
hester 2017-11-13 10:44:34 +08:00 4
太标题党了!
看来 LZ 在此道越走越远... 为什么说标题党呢? 因为 文中 压根也没有拿出任何 “证据” 证实与百度比肩 是什么意思... 另外,应该用了第三方的库,这种 OCR 类 App 同质化的比较严重,如果楼主能开源的话,供大家学习的话,或许还有些用处。 |
30
livc 2017-11-13 10:48:09 +08:00
资词
|
31
quietjosen OP @hester 请看正文第三行。
|
32
hester 2017-11-13 10:53:42 +08:00
|
33
quietjosen OP @hester 好吧,听出了痛心疾首的感觉。
|
34
icylogic 2017-11-13 11:01:45 +08:00
楼上想要 Windows 版的 …… Windows 有的,支持 100 多种语言
https://i.loli.net/2017/11/13/5a090a6837c29.png 顺便连翻译也有了 https://ooo.0o0.ooo/2017/11/13/5a090a684990a.png |
35
quietjosen OP @icylogic 看来还是 Windows 软件生态丰富,去瞧瞧,关键是看看识别率。
|
36
z0z 2017-11-13 11:10:20 +08:00
这个需要在线识别吗?
|
37
lwbjing 2017-11-13 11:29:58 +08:00 via iPhone
一天,哈哈,,,李彦宏看了要流泪…
|
38
quietjosen OP @z0z 需要,因为调用的是百度的服务。
|
39
quietjosen OP @lwbjing 你错了,他笑还来不及,我昨晚刚给百度充值了 100 信仰币…
|
40
hester 2017-11-13 11:36:18 +08:00
@quietjosen #33
到没有那么夸张,但我的确很不喜欢纯标题党。(如果仅仅是自娱自乐 + 自黑 的话,我到觉得挺正常。) 就好比,某些导购,明明东西不错,但是导购用的“话术”很是恶心,听着就没有购买的欲望了。 (并不是针对你,或其他某些具体的人) |
41
quietjosen OP @hester 恩,明白。
|
42
deadEgg 2017-11-13 11:53:07 +08:00
嘿 cool
|
43
artandlol 2017-11-13 11:57:13 +08:00 via iPhone
非年轻人还这么喜欢折腾 点赞
|
44
icylogic 2017-11-13 11:59:59 +08:00 1
@quietjosen 七八年前开发的,好像没有用到 Deep Learning 吧,只是功能相对完善。
我也好奇你的软件或者说百度的算法,有干扰的情况调教地怎么样。你的截图和我发的图其实都是最容易识别的情景。对于 OCR 来说也就是 MNIST 这个级别的工作吧 …… 不妨试试这两张,看看效果怎么样 …… https://i.loli.net/2017/11/13/5a0914552cfff.png https://i.loli.net/2017/11/13/5a09145667ffc.png 原本就在屏幕上渲染的字体,比如视频中的字幕,更复杂的 b 站弹幕,这些文本其实本身可识别率非常高,只是背景有干扰。 另一方面比如手写体、照片、扫描文档,这些字体有变形,识别率就更低了。 后者其实我目前见到做得最好的也就是 Google 翻译 App,摄像头对着文本实时识别加翻译,App 会直接用翻译文本在手机取景界面上把原文替换掉,识别对了效果非常好。不过也经常完全识别错。微软的也不错,不过需要拍一下,一张一张扫。 |
45
quietjosen OP |
46
qdwang 2017-11-13 12:11:05 +08:00 via iPhone
看效果相当不错,应该很好用
|
47
lanfeng007 2017-11-13 12:24:38 +08:00
mark 一下!
|
48
notreami 2017-11-13 12:26:19 +08:00
亮点在哪里?没有创新小 Demo,就不要放上来赶英超美了。
|
49
gzlock 2017-11-13 12:33:55 +08:00
|
50
quietjosen OP @gzlock 是的
|
51
BlackCat02 2017-11-13 13:24:10 +08:00
试了一下,对中文的识别不错。对 vim 里的代码识别了一下,就感觉有点差强人意。不知道百度这个接口是不是本身就不是针对英文的
|
52
quietjosen OP @BlackCat02 恩,毕竟百度是中文起家的;如果是英文,估计得选择国外的服务。不过,代码不是英语,无法使用英语的规则对结果进行优化。
|
53
surewen 2017-11-13 13:44:28 +08:00
是用了百度云的 SDK ?曾经和你的想法一样,想做成 app ……
接口啥都调完了,不过后面犯懒没做完…… 支持 |
54
quietjosen OP @surewen 百度没有 macOS SDK,我是封装了其 REST API
|
55
menc 2017-11-13 14:35:54 +08:00
调用了人家的服务,应该叫“给百度套了个壳”,不是叫做“比肩百度”,你得自己做一个才好意思比较。
|
57
surewen 2017-11-13 14:42:48 +08:00
|
58
quietjosen OP @menc 应该叫站在「百度肩膀」
|
59
quietjosen OP @surewen 感觉这种离线的库,不如云服务;后者有天然优势,可以实时更新识别能力。
|
60
dong3580 2017-11-13 14:48:35 +08:00
|
61
xy19009188 2017-11-13 15:25:40 +08:00
那么有 Windows 版么
|
62
quietjosen OP @xy19009188 没; Windows 应该有的,可以试试上面说的 Capture2text (我没试过)
|
63
BlackCat02 2017-11-13 15:57:34 +08:00
@quietjosen 是的,代码并不符合自然语法规则
|
64
Izual_Yang 2017-11-13 16:13:02 +08:00
@mokeyjay #13
curl.exe -s -F "action=submit" -F 'pic=@"本地图片.jpg"' http://ocr.shouji.sogou.com/v2/ocr/json | jq.exe -r ".result | .[].content" |
65
Izual_Yang 2017-11-13 16:14:05 +08:00
@icylogic #44
弹幕本来就是文本不是图片啊,你直接从 xml 里提取文字不就行了 |
66
aver4vex 2017-11-13 16:31:10 +08:00
我去找个变态验证码试试,好的话,爬虫就有指望了。O(∩_∩)O 哈哈~
|
67
ialva 2017-11-13 18:21:32 +08:00 via Android
还差一台 MacBook 就能用上了
|
68
quietjosen OP @aver4vex 变态码…别想了,有的连码它妈都不认识…
|
69
xy19009188 2017-11-13 18:52:04 +08:00 via Android
@quietjosen 试了下,识别不太好
|
70
quietjosen OP @xy19009188 方便的话,把图片发过来,我这边也试试。
|
71
tnx2014 2017-11-13 21:13:03 +08:00 2
看标题,我还以为是楼主自己的算法,结果还是调用别人的接口,这一点也不稀奇( Windows 下一堆调用百度、搜狗识别引擎的真的很多),虽然楼主也付出了一定的劳动,但既然用了别人的东西还说“比肩”那真的是用词不当,站在巨人肩膀上不等于比肩,如果楼主认为两者等价那我只能遗憾地表示我认为您语文不太好。
当然楼主说“比肩”也可能有调侃意味,不过我建议本着说话负责的态度,有些东西还是别开玩笑。楼主做一个小工具给他人用值得表扬,但是既然核心算法是他人的,还是低调一些为好。 我说话有时候不好听,对事不对人,如有让你不舒服的地方我先表示抱歉。 |
72
quietjosen OP @tnx2014 我花了一天,做了一款站在「百度」肩膀上的 OCR 图片识字工具 iText
|
74
WhiteSJ 2017-11-13 23:36:43 +08:00
厉害了, 很有用啊
|
75
cptbtp 2017-11-14 08:08:36 +08:00
厉害了。
|
76
xiaogu0322 2017-11-14 09:13:06 +08:00
@leeyom 你真棒~
|
77
awfe 2017-11-14 15:03:07 +08:00
|
78
quietjosen OP @awfe 其实 iText 这个名字是随意想的,毕竟总共做这个东西才几天;不过也挺契合我的其他产品名( iPic/iTimer/iHosts/iPaste ),估计不打算改了。
|
79
jwangkun 2017-11-15 12:14:10 +08:00
试用了一下,非常好,以后再也不用百度文库下载券了,我看试用期只有 30 天,之后是要收费么
|
80
sangmong 2017-11-15 14:12:42 +08:00
有没有 iphone 上的呢
|
81
quietjosen OP @jwangkun 30 天之内,估计还会有新的内测版。不过,发布后肯定是收费产品,可能是订阅或按次收费。
|
82
quietjosen OP @sangmong iPhone 下试试「白描」
|
83
Jibunuo 2017-11-17 16:32:28 +08:00 via Android
厉害!
|
84
hvsy 2017-11-17 22:46:57 +08:00
好厉害,已经发邮件了.希望能够试用一下.
|
85
Marsss 2017-12-07 09:59:57 +08:00
中英文混合的识别率怎么样?
|
86
quietjosen OP 腾讯在这方面还行,感觉百度英文稍差些,iText 用的是腾讯。
iText 已上架 MAS,何不下载试试? |
87
quietjosen OP @Marsss 楼上回复忘记 @ 了
|
88
zhihuixiangying 2018-01-20 00:21:55 +08:00
体验感觉挺不错的。
|
89
quietjosen OP @zhihuixiangying 吃的就是这碗饭,体验必须搞好 💪
|