V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Austin2035
V2EX  ›  程序员

「chatpdf」开源一个基于大模型的 PDF 对话网页应用

  •  1
     
  •   Austin2035 ·
    ausitn2035 · 2023-07-07 19:48:00 +08:00 · 2676 次点击
    这是一个创建于 494 天前的主题,其中的信息可能已经有所发展或是发生改变。

    ChatPDF

    preview

    ChatPDF 是一个开源项目,你可以在部署此项目后,通过私有 openai key ,自由地与 PDF 对话。下面是一些经典使用场景:

    1. 总结和分析论文、学术文章。
    2. 报告总结、分析和针对细节的提问。
    3. 回答任何 PDF 中的任何问题。

    技术栈

    • 前端:React + Antd + tailwindCSS
    • 后端:Python + FastAPI + MySQL + Redis(optional)
    • AI: langchain + llama_index

    特性

    • 流式传输
    • 注册登录
    • 会话次数限制
    • 国际化支持

    部署注意

    项目开发之初并非为开源设计,对于没有相关技术栈经验的人员部署此项目,可能需要花费些时间。后续会优化代码和部署流程,并书写详细部署指南。

    开源地址

    https://github.com/austin2035/chatpdf/

    10 条回复    2023-07-08 18:50:54 +08:00
    askfermi
        1
    askfermi  
       2023-07-07 19:50:54 +08:00
    有没有想法集成一些开源的 model ,参见: https://v2ex.com/t/954707#reply2
    最近打算实现一个兼容 openai-api 的 server
    Austin2035
        2
    Austin2035  
    OP
       2023-07-07 19:52:40 +08:00
    @askfermi 主要是没时间。
    lazydog
        3
    lazydog  
       2023-07-07 19:56:52 +08:00 via Android
    见过一个类似的,回去用用看哈
    gogogo1203
        4
    gogogo1203  
       2023-07-07 20:22:40 +08:00
    如果能有 AI 怎么处理业务的简单介绍,就更好了。我最近在研究这快。btw, 前后端分离对那些没有此类经验的人会很难很难。
    Austin2035
        5
    Austin2035  
    OP
       2023-07-08 08:49:28 +08:00
    @gogogo1203 确实。所以我有空的时候会弄一个 docker 部署,哈哈。
    Austin2035
        6
    Austin2035  
    OP
       2023-07-08 08:51:03 +08:00
    @lazydog 可以尝试一下,欢迎反馈。
    meinjoy
        7
    meinjoy  
       2023-07-08 11:21:56 +08:00 via Android
    解析 pdf 文件用的哪个库?
    Austin2035
        8
    Austin2035  
    OP
       2023-07-08 14:05:24 +08:00
    @meinjoy pypdf2
    gogogo1203
        9
    gogogo1203  
       2023-07-08 16:55:14 +08:00
    @Austin2035 我觉得也不太现实, ngix(ssl+file server)+后台+sql 。当初上手这一套 docker 东西到成功部署自己的项目花了好大力气。最近几个项目用了 vercel+supabase, 那一套就忘光。有可能的话,我希望能有更详细的 doc 让我能学习一下这个服务的业务逻辑和流程。 谢谢
    PikaTQL
        10
    PikaTQL  
       2023-07-08 18:50:54 +08:00
    爱了爱了 希望大佬有时间可以出一个 docker 部署的镜像或者 Dockerfile
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1147 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 22:55 · PVG 06:55 · LAX 14:55 · JFK 17:55
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.