V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
codeface
14.49D
V2EX  ›  分享创造

Wayback Archiver 自托管的个人网页归档系统

  •  1
     
  •   codeface · 1 天前 · 845 次点击

    一个自托管的个人网页归档系统,自动捕获并保存你在 Chrome 中浏览过的网页 — HTML 、CSS 、JavaScript 、图片等一应俱全。当原始网页无法访问时,你仍然可以通过归档副本还原当时的页面样式和内容。

    index

    v2ex

    x

    工作原理

    Chrome + Tampermonkey ──HTTP POST──▶ Go 服务器 ──▶ PostgreSQL (元数据)
      (关闭标签页 / 页面跳转                │              + 文件系统 (静态资源)
       时自动捕获)                          │
                                            ▼
                                         Web UI ──▶ 浏览 / 搜索 / 还原
    
    1. Tampermonkey 用户脚本在浏览器中运行,当你离开页面时自动捕获完整的 DOM 和资源。
    2. Go 服务器接收快照,下载浏览器因 CORS 限制无法获取的跨域资源,基于内容哈希去重后存储到本地。
    3. 内置 Web UI 可以浏览、搜索和还原任意归档页面 — 完全离线,不依赖外部服务。

    功能特性

    • 高保真还原 — CSSOM 序列化、计算样式内联、防刷新保护,尽可能还原页面原始效果
    • 完整页面捕获 — HTML 、CSS 、JS 、图片、字体;资源 URL 自动重写为本地路径
    • 跨域资源恢复 — 服务器端自动提取并下载被 CORS 拦截的资源
    • 内容哈希去重 — 相同资源跨页面共享,仅存储一份( SHA-256 )
    • 版本历史 — 同一 URL 可多次归档,按时间戳区分
    • 智能去重 — 会话级 + 服务器级双重去重,内容无变化时仅更新访问时间
    • 动态内容支持 — 捕获实时 DOM 状态; MutationObserver 监听变化,超过阈值自动提交一次更新
    • SPA 感知 — 检测单页应用导航,按路由重置捕获状态
    • 防刷新保护 — 归档页面被冻结:定时器、WebSocket 和导航 API 均被拦截
    • Web UI — 响应式界面,支持全文搜索(页面内容、URL 、标题)、按时间范围筛选和还原归档页面
    • RESTful API — 提供完整的归档和查询接口

    欢迎体验

    https://github.com/icodeface/wayback-archiver

    10 条回复    2026-03-12 20:52:34 +08:00
    codeface
        1
    codeface  
    OP
       1 天前
    记录我所浏览的一切!
    arphone
        2
    arphone  
       18 小时 40 分钟前
    amazing...
    loading
        3
    loading  
       17 小时 11 分钟前
    hahastudio
        4
    hahastudio  
       16 小时 45 分钟前
    感觉这个接 LLM 比 Rewind 这种要轻量
    fds
        5
    fds  
       16 小时 43 分钟前
    防刷新保护 很新颖👍
    强制剥离 js 只保留 css 和 html 效果如何?能想象有些动态页面会比较惨。
    codeface
        6
    codeface  
    OP
       16 小时 19 分钟前
    @fds 尽可能还原了,部分 SPA 网页还是要单独做特殊处理。
    hhacker
        7
    hhacker  
       8 小时 49 分钟前
    那么,直接存成图片行不行?就是会有点大
    xJogger
        8
    xJogger  
       8 小时 15 分钟前 via Android
    支持火狐么
    codeface
        9
    codeface  
    OP
       6 小时 56 分钟前
    @hhacker 图片不太方便做正文检索,然后我还想把内容开放给 AI 读,图片效果也没文本好。
    codeface
        10
    codeface  
    OP
       6 小时 53 分钟前
    @xJogger 经测试是支持的
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   985 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 19:45 · PVG 03:45 · LAX 12:45 · JFK 15:45
    ♥ Do have faith in what you're doing.