1
imldy 2022-02-28 19:52:03 +08:00 via Android
换个浏览器或者 pdf 阅读器
|
2
kgdb00 OP @imldy 试了 chrome ,firefox ,evince 都不行,而且我这个 pdf 是要发给别人看的,所以应该要保证所有工具都能搜索。
|
3
pendulum 2022-02-28 20:41:08 +08:00 1
可能你这个 PDF 是扫描件,本身没有文字。但传 Google 后,它帮你 OCR 了,所以你能搜索
|
5
qwq11 2022-02-28 22:37:17 +08:00
什么叫「不能搜索」,是搜索了没有任何结果,还是按 Ctrl F 弹个提示框出来说该文档不支持搜索
如果是搜索了没有任何结果,那多半就是你 pdf 没有把字连成句之类的问题。 |
6
lekai63 2022-02-28 22:39:09 +08:00 via iPhone
有些 pdf “已加密”就会能看但不能搜索
ctrl+p 打印为 pdf 试试 |
9
mikewang 2022-02-28 22:55:21 +08:00
如果是加密文件,可 Unlock PDF: https://www.ilovepdf.com/unlock_pdf
如果是内嵌图片(文件大小一般在 MB 级别,不一定是扫描件),你需要 OCR 。 |
10
illl 2022-02-28 23:02:43 +08:00 via iPhone
用 adobe 的一款软件做一下光学文字识别,再保存一下就可以了
|
13
duke807 2022-02-28 23:13:04 +08:00
inkscape 導入看一下
|
14
dingwen07 2022-03-01 00:17:13 +08:00
使用 Okular ,设置里的“遵循 DRM”关掉
|
16
leaves7i 2022-03-01 01:50:55 +08:00
上传 google docs 分享链接
|
17
Tilie 2022-03-01 07:38:16 +08:00
acrobat 右侧有个开关 “所有页面可编辑” 打开之后会一页一页的 ocr 识别
适用于扫描出来的 |
18
danny1900 2022-03-01 08:38:23 +08:00
ABBYY FineReader ,试下这个 pdf 编辑器,自带 ocr 可以让你搜索
|
19
luny 2022-03-01 09:43:22 +08:00
看一下文档的属性,里面有一些安全项
有软件可以解除限制 |
20
nanvon 2022-03-01 11:40:49 +08:00
那就说明这个 pdf 内不是文字,是图片。图片需要被 OCR 后才能被搜索文字
|
22
emhhb2ppy 2022-03-01 14:22:28 +08:00
“双层 PDF”,“可检索 PDF”是你需要的 PDF 。这种文件在创建的时候每个字符对应了带坐标信息的 OCR 步骤。所以才可以检索到。不是阅读软件的问题。上传 g doc ,是 g 自己 OCR 了一遍,所以才可以检索到。g 还开源了 OCR 引擎,叫 Tesseract Open Source OCR Engine ( https://github.com/tesseract-ocr/tesseract)
|