V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  mumu9  ›  全部回复第 1 页 / 共 1 页
回复总数  7
4 小时 37 分钟前
回复了 Suinn 创建的主题 问与答 关于 Rag 本地知识库落地的问题求助
@cheava 尝试下来的效果就是成本和收益不成比例吧😂。我个人的建议是不要在 RAG 上花费太多时间去尝试,收益很。目前看到的各种框架都属于指标战神,没有真正意义上能用于落地的。
1 天前
回复了 Suinn 创建的主题 问与答 关于 Rag 本地知识库落地的问题求助
@Suinn 内容压缩简单点就是提取文件中的摘要,将这些摘要作为新的 chunk ,这样就不会出现超过 chunk 长度限制,也能最大限度保留上下文。我们之前的做法是让有需求的同事明确指出需要关注的主题和内容,然后根据他们的反馈,依赖 LLM 去确定文档中的关键信息,但可能不太适合你说描述的场景,因为交易单中的信息可能比较密集。
楼下 v 友的意思应该是让你们先把交易单中的信息比如提取出交易编号、金额、日期等关键信息,存储后进行检索。这个思路我们之前也做过,不过是依赖数据库,利用 function call 去处理查询的参数,然后在存储结构化内容的数据库中执行 SQL 生成响应。
另外的一个做法是你可以尝试使用比如 neo4j 这类的图数据库,将基于交易编号、金额、客户信息等实体进行关联和存储。这方面你可以参考 graphRAG ,不过不算太推荐就是了😂。
2 天前
回复了 Suinn 创建的主题 问与答 关于 Rag 本地知识库落地的问题求助
不太清楚你的“交易单”具体包含哪些信息。从你的描述看,更需要的是知识图谱。交易编号作为一个实体,金额和其他文件内容属于实体信息。对 Query 部分进行 NER 后,根据实体进行检索。
如果非用 RAG 不可,对文件内容进行内容压缩后作为 chunk 可能是更有效的方法。
2023-07-22 08:40:35 +08:00
回复了 mumu9 创建的主题 Arc 想体验下 Arc,求一个邀请码,谢谢大佬们~
@logan19 hey, here’s an invite to Arc, the browser I was telling you about!

https://arc.net/gift/47b86bec
2023-07-11 10:59:48 +08:00
回复了 mumu9 创建的主题 Arc 想体验下 Arc,求一个邀请码,谢谢大佬们~
@ichkn 谢谢啦~
2023-01-08 21:55:49 +08:00
回复了 merciless 创建的主题 Surge 出一个 surge mac 车位
或者你留个联系方式给我,加你也行
2023-01-08 21:19:54 +08:00
回复了 merciless 创建的主题 Surge 出一个 surge mac 车位
还有的话算我一个 YWx1bHV6ZQ==
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3683 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 10:23 · PVG 18:23 · LAX 03:23 · JFK 06:23
Developed with CodeLauncher
♥ Do have faith in what you're doing.