• 请不要在回答技术问题时复制粘贴 AI 生成的内容
coderabbitjiang
V2EX  ›  程序员

go 基于向量数据库与 GPT3.5 的通用本地知识库方案

  •  
  •   coderabbitjiang · Mar 14, 2023 · 2460 views
    This topic created in 1163 days ago, the information mentioned may be changed or developed.

    流程

    • 将本地答案数据集,转为向量存储到向量数据
    • 当用户输入查询的问题时,把问题转为向量然后从向量数据库中查询相近的答案 topK 这个时候其实就是我们最普遍的问答查询方案,在没有 GPT 的时候就直接返回相关的答案整个流程就结束了
    • 现在有 GPT 了可以优化回答内容的整体结构,在单纯的搜索场景下其实这个优化没什么意义。但如果在客服等的聊天场景下,引用相关领域内容回复时,这样就会显得不那么的突兀。

    项目地址

    https://github.com/coderabbit214/document-ai

    coolair
        1
    coolair  
       Mar 14, 2023
    有没有不使用 openai 的离线本地方案?
    coderabbitjiang
        2
    coderabbitjiang  
    OP
       Mar 14, 2023
    @coolair 目前正在考虑 可能 LLAMA?
    40EaE5uJO3Xt1VVa
        3
    40EaE5uJO3Xt1VVa  
       Mar 14, 2023
    楼主 readme 里面的流程图用什么画的
    coderabbitjiang
        4
    coderabbitjiang  
    OP
       Mar 14, 2023
    @yanzhiling2001 md 格式 你可以下载下来看看源文件,另外:图是 gpt 帮的忙
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5743 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 48ms · UTC 02:23 · PVG 10:23 · LAX 19:23 · JFK 22:23
    ♥ Do have faith in what you're doing.