背景
作为一个经常需要整理技术文档和研究资料的开发者,我发现自己总是在做这样的事情:
- 看到好的技术博客、API 文档想保存,但网页版广告满天飞
- 复制粘贴到笔记软件,格式乱七八糟
- 手动整理 Markdown 格式,费时费力
- 最关键的需求:想把这些技术文档整理成知识库,喂给 AI Model ( Claude 、ChatGPT 等),提升写代码时的效率
现在 AI 编程助手越来越重要,但它们的知识有时效性限制。比如最新的框架文档、内部技术规范、项目最佳实践等,都需要我们手动整理后提供给 AI 。
但是这个过程太痛苦了:网页复制粘贴格式乱,手动整理 Markdown 耗时,想批量处理更是麻烦。
试过各种方案,要么功能不够用,要么界面太复杂,要么不支持 macOS 原生体验。索性自己撸了一个。
项目介绍
DownMark - Safari 浏览器扩展,专门解决网页内容到 Markdown 的转换问题。
核心功能
- 智能内容提取:基于算法识别网页主体内容,自动过滤广告、导航栏、侧边栏等干扰元素
- 标准 Markdown 输出:保持文章结构,支持标题、列表、链接等格式转换
- 原生 macOS 体验:深度集成 Safari ,一键操作,原生文件保存对话框
- 零配置使用:安装即用,无需复杂设置
技术实现
- 基于 Safari Web Extension API (Manifest V3)
- 内容脚本负责页面分析和提取
- 背景脚本处理扩展逻辑
- macOS 原生应用提供文件输出
使用场景
特别适合这些场景的 V 友:
- AI 编程助手重度用户:需要把最新技术文档、API 参考喂给 Claude/ChatGPT ,提升代码质量
- 技术博客收集党:看到好的实践文章想整理成知识库
- 框架文档整理:Vue3/React/Swift 等官方文档本地化管理
- 团队知识沉淀:把分散的技术分享统一整理成 Markdown ,方便 AI 索引
- 研究资料管理:论文、技术报告等学术资料收集
- 离线开发环境:网络不稳定时的本地文档库
举个实际例子:我现在做 SwiftUI 项目时,会把 Apple 的 HIG 文档、最新的 API 变更、社区最佳实践都用 DownMark 转成 Markdown ,然后上传到 Claude Projects ,这样 AI 就能基于最新最准确的信息帮我写代码了。
为什么做这个
现在 AI 编程助手这么火,但用过的都知道一个痛点:AI 的知识是有时效性的。
最新的框架更新、内部技术规范、项目特定的最佳实践,这些 AI 都不知道。想要 AI 帮你写出高质量的代码,就得手动喂给它这些上下文信息。
但市面上的工具大多存在这些问题:
- 内容提取不够精准,把广告、评论都抓进来,污染知识库
- Markdown 格式转换质量差,AI 读起来费劲
- 批量处理能力弱,一个个复制粘贴效率太低
- 不支持 macOS 原生体验,工作流程割裂
DownMark 专注解决这几个痛点,让技术文档到 AI 知识库的转换变成"一键搞定"。
技术细节
内容提取算法
- 基于 DOM 结构分析,识别文章主体区域
- 语义化标签优先级判断
- 广告和导航元素特征识别
- 内容密度计算,过滤低质量区块
格式转换
- HTML 到 Markdown 的标准化转换
- 特殊字符和编码问题处理
- 保持原文档的层次结构
- 链接和图片引用的正确处理
当前状态
- 已完成核心功能开发
- 通过 App Store 审核,正式上架
- 定价:$4.99 (一次性购买)
- 支持 macOS 14.0+
一些思考
做独立开发这两年,越来越觉得好的工具应该是"隐形"的 - 让开发者专注于代码本身,而不是纠结于工具的使用。
现在 AI 编程时代,知识库的质量直接影响代码质量。我们需要的不只是一个格式转换工具,而是一个高效的"知识到代码"的桥梁。DownMark 就是朝着这个方向努力的。
有了干净的 Markdown 技术文档,配合 Claude Projects 或者 ChatGPT 的 Knowledge ,写代码的效率真的能提升不少。特别是做新技术栈的项目时,这种差别更明显。
欢迎体验
如果你也有类似的内容收集需求,欢迎试用反馈。作为独立开发者,特别珍惜来自技术社区的意见和建议。
有任何问题或想法,欢迎在楼下讨论 👇
