大家好,最近我们团队开源了个项目,和大家分享一下。
我们平时看技术文档或者学术论文,PDF 是绕不开的坎。但目前的 PDF 转换工具,总有那么几个让人抓狂的点:
为了解决这些的问题,我们基于 DeepSeek-OCR 重写了一个转换引擎:pdf-craft。

我们没打算做一个大而全的工具,而是把精力都放在了技术细节上,希望能做到:
我们提供了两种方式:
1. 本地免费跑(我们最推荐的)
如果你有一张还不错的显卡( RTX 3060 或以上),可以尝试根据 README.md 中的步骤在本地运行。
完全免费,不限次数,数据都在你自己的电脑上。
当然,pdf-craft 引擎本身是完全开源的( MIT 协议),你可以直接 clone 仓库回来自己开发及部署。
2. 云服务
没算力的朋友也不用担心,我们同时提供了在线的云服务。没有订阅费,按实际用量计费,新用户注册会送一些免费额度,可以先体验一下。
我们相信,一个好的工具应该是开放和透明的。特别是文档处理这种场景,谁也不希望自己的文件被泄露。
开源,意味着:
这个项目还在快速迭代,肯定有不少问题。欢迎大家来我们的 GitHub 仓库提 Issue 和 PR 。
表格将在本周进行支持
1
allplay 2 天前 via Android
如何进行二次编辑?
|
2
SpectreFurieux 2 天前
最近我们一个项目里在使用 mineru 进行文档解析,请问您的团队的项目相比 mineru 怎么样?
|
3
111111111111 2 天前
试了一下失败了,不过没看到什么提示
/convert/019b2c7f-2128-7000-a151-a2423ae0eaaa |
4
BlackHole1 OP PRO @111111111111 已经修复此问题,之前是因为内部服务下载失败导致。
|
5
111111111111 15 小时 34 分钟前
重新试了下,效果很赞!搜藏了
|