目前用 SingleFile 自动保存到 webdav ,但是搜索是个问题,理想情况是有个 web 界面,目前没有找到合适的工具,暂时是用命令行 find+grep ,感觉不太方便。
了解了下两个轻量级的全文搜索:ZincSearch 、blevesearch ,还没深入是看,但是感觉也应该需要想办法把网页内容导入到引擎里面,不知道还有没有其他的方案。
尽量轻量级一些,ES 太重了首先排除掉吧。
1
TrembleBeforeMe 2023-02-28 12:34:14 +08:00 3
|
2
FrankAdler OP @TrembleBeforeMe 这个看起来好强,我先研究下看看
|
3
caomu 2023-02-28 13:15:48 +08:00 via Android
前段时间还讨论了一下
https://www.v2ex.com/t/916365 |
4
tool2d 2023-02-28 13:18:59 +08:00
自己写一个 vscode 插件,find in files 文本搜搜嘛可以了。
低频需求,性能要求不需要那么高。 |
5
FrankAdler OP |
6
FrankAdler OP @tool2d 可能还不如 find+grep 呢,就是要 ssh 下
|
7
vtexer 2023-02-28 13:47:10 +08:00
语雀的剪存
|
8
vtexer 2023-02-28 13:47:45 +08:00
飞书的剪存
|
9
fds 2023-02-28 13:55:35 +08:00
前两天看到 https://github.com/omnivore-app/omnivore 不过我没用过
|
10
tool2d 2023-02-28 13:57:08 +08:00
@FrankAdler mhtml 需要解包,至少不去搜索 base64 里的图片。
还需要定位跳转,搜出来结果,你总要看一下上下文吧。 还有一些不是 utf8 格式的页面需要转换,又或者不是一个个独立文件,文件多了后,是定期 zip 打包这种形式存在于磁盘上的。 退一万步,就算直接用 find 命令行,我也会写一个自己特化的管道过滤工具,码农不就是写工具的。 |
11
ipfox 2023-02-28 15:53:27 +08:00
chrome 插件 Chrono Power Action
|
12
Giftina 2023-02-28 16:42:22 +08:00 2
SingleFile 存到本地后搭配 hamsterbase 即可
|
13
Huelse 2023-02-28 16:53:10 +08:00
感觉有点像 onetab 的功能
|
14
abcdxe2v 2023-02-28 16:54:27 +08:00 1
@FrankAdler
historio.us 这个不行,很多网页抓取不到(可能是因为动态加载的原因) 由于我需要正则,所以我是 SingleFile 保存后,用 FileLocator Pro (因为是正则,所以无索引) |
15
ztbz123 2023-02-28 17:09:46 +08:00
@abcdxe2v 我也这样,但 FileLocator Pro 检索和预览 HTML ,是源代码 html 标签的形式,html 标签和样式比较多,看着不太直观方便,有没有什么解决方法?比如,能不能设置 FileLocator Pro 预览 HTML 格式文件时,可通过浏览器预览展示
|
16
zictos 2023-02-28 17:10:59 +08:00
试过很多,没一个好用的,很多明明看过的文字却搜不到。现在很多网站又都是 js 动态加载,就更可能搜不到了
|
17
FrankAdler OP @zictos archivebox 可以抓起 js 动态加载的(基于无头浏览器)
|
18
FrankAdler OP @ztbz123 可能保存的时候不要 css 样式会好很多?毕竟内容才是最重要的
|
19
tinola 2023-03-01 10:35:41 +08:00
以前用网文快捕 CyberArticle 可以离线保存,后来不更新了,可惜。现在用 onetab.
|
20
edis0n0 2023-03-01 11:15:35 +08:00
@TrembleBeforeMe #1 这个要登录的页面就不行,好文章很多都要登陆才能看
|
22
woyaojizhu8 2023-03-04 14:58:03 +08:00
recoll 最合适,而且也有 webui
|