V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Elaina
V2EX  ›  程序员

有没有一种比较好的方案在尽量保证网页样式不变的情况下进行剪藏的方案呢?

  •  1
     
  •   Elaina · 2022-11-15 19:22:40 +08:00 · 2654 次点击
    这是一个创建于 737 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在越来越多的内容被审核给和谐掉,或者某个网站域名更换无法找到了,有没有一种比较好的方案在尽量保证网页样式不变的情况下进行剪藏的方案呢?

    或者说开发一个剪藏系统应该以一个什么样的思路呢?

    23 条回复    2022-11-17 20:47:54 +08:00
    cmdOptionKana
        1
    cmdOptionKana  
       2022-11-15 19:35:07 +08:00   ❤️ 1
    浏览器插件 SingleFile
    hamsterbase
        2
    hamsterbase  
       2022-11-15 20:37:46 +08:00 via iPhone   ❤️ 2
    1. 用 singlefile 保存 html
    2. safari 右键另存为 webarchive
    3. chrome 右键另存为 mhtml

    这三种格式都能完美的保存 css ,图片 ,html 。

    hamsterbase 支持导入这三种格式的网页。 导入后支持以下功能

    1. 完美渲染,

    2. 支持在网页上批注做笔记。

    3. 全文搜索

    4. 根据条件筛选

    5. 筛选后以 rss 输出
    afutureus
        3
    afutureus  
       2022-11-15 20:59:15 +08:00 via iPhone   ❤️ 2
    保存为 pdf 。

    之前试过 n 种办法,最后用 safari 的 导出为 pdf 解决了。导出的 pdf 是一个完整无分页的。
    Garasu
        4
    Garasu  
       2022-11-15 21:09:11 +08:00
    群晖的 note 有个 chrome 的插件,能把网页收藏到 note 里,可以选择简化内容 完整内容 整个页面屏幕截图 屏幕截图 四种。
    除了群晖的 note ,一些笔记软件也有这个功能。
    DIO
        5
    DIO  
       2022-11-15 21:46:26 +08:00
    我折腾过很多方案。SingleFile is best
    某象笔记 做笔记的话 也不错,但是收费。
    chrome 另存 pdf 保存不够完整。

    另外还听说过 server 方案,把浏览的网页全部保存,有点心动,但是种种原因还是没尝试
    crysislinux
        6
    crysislinux  
       2022-11-15 22:42:53 +08:00 via Android
    要说方便的话还是得那些笔记软件出的浏览器插件。
    hamsterbase
        7
    hamsterbase  
       2022-11-15 23:14:53 +08:00
    @DIO

    试试看我?

    1. 支持在 nas 上部署 https://hamsterbase.com/zh/docs/install/synology.html
    2. 支持自动导入文件夹下的全部网页。 你之前 singlefile 保存的网页可以全部导入。https://hamsterbase.com/docs/importing-website.html#automatic-importing
    3. 支持绑定 singlefile 插件,一键导入。https://hamsterbase.com/zh/docs/integrations/singlefile.html
    edis0n0
        8
    edis0n0  
       2022-11-15 23:17:05 +08:00
    Ctrl+P 打印为 PDF ,虽然不能搜索不能复制但能保证不会引用外部内容,内容永远不会变
    agagega
        9
    agagega  
       2022-11-15 23:23:52 +08:00 via iPhone
    最完美的方案应该还是逐站进行优化(大部分内容其实都来自那几十个国内外知名网站,剩下的个人博客是很好直接从 html 抓的)。直接保存请求得到的 html 肯定不行,因为很多网站要用 ajax 做渲染,至少得保存渲染完之后的内容
    hamsterbase
        10
    hamsterbase  
       2022-11-16 00:46:03 +08:00
    @agagega

    如果不是批量爬虫,手动保存网页,那么 singilefile 、浏览器自带的快照会更合适一点。ctrl + s 就存下来了。
    此时保存的是 ajax, 前端框架渲染后的页面。 只需要把当前的 css 、html 、图片 存下来。 基本上保存前怎么样,保存后就是怎么样。 甚至可以 翻译、去广告之后再保存。


    如果要批量保存 url ,可以试试看 singlefile 自带的保存功能。

    1. 安装 singilefile
    2. 右键 -> singilefile -> Batch save URLS...
    TuringHero
        11
    TuringHero  
       2022-11-16 00:52:06 +08:00
    Cubox 有快照
    rpish
        12
    rpish  
       2022-11-16 00:54:59 +08:00
    cubox/inoreader
    WebKit
        13
    WebKit  
       2022-11-16 01:06:12 +08:00 via Android
    笔记插件,直接截图保存
    efaun
        14
    efaun  
       2022-11-16 01:24:56 +08:00
    Webrecorder
    CSGO
        15
    CSGO  
       2022-11-16 09:16:40 +08:00
    @cmdOptionKana SingleFile 和 Save Page WE 有什么区别?两个我同事保存同一个大网页,一个 20mb ,一个 15mb 。
    xiang0818
        16
    xiang0818  
       2022-11-16 09:34:49 +08:00
    有道云笔记插件了解一下
    cmdOptionKana
        17
    cmdOptionKana  
       2022-11-16 09:39:00 +08:00
    @CSGO 没用过 Save Page WE, 看起来也很不错
    Jacobson
        18
    Jacobson  
       2022-11-16 10:56:04 +08:00
    save as mht
    lxxself
        19
    lxxself  
       2022-11-17 10:24:33 +08:00
    @hamsterbase 有点东西,试了试,功能满足。不过 hamsterbase 前端交互一般般,搜索部分也搜不到。不过确实还不错了,打算试一段时间
    hamsterbase
        20
    hamsterbase  
       2022-11-17 12:12:43 +08:00 via iPhone
    @lxxself

    非常欢迎加微信详聊, 一起优化交互。

    目前有一个搜索优化的版本,我可以私聊发给你。
    hamsterbase
        21
    hamsterbase  
       2022-11-17 12:13:20 +08:00 via iPhone
    @lxxself

    软件官网有微信,还有 telegram 的联系方式。
    lxxself
        22
    lxxself  
       2022-11-17 19:34:04 +08:00
    @hamsterbase 卧槽,没细看昵称,原来就是官方啊。有官方群聊么
    hamsterbase
        23
    hamsterbase  
       2022-11-17 20:47:54 +08:00 via iPhone
    @lxxself

    https://hamsterbase.com/zh/docs/support.html

    telegram 群和微信群都有。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3237 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 10:41 · PVG 18:41 · LAX 02:41 · JFK 05:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.