telemsg 最近的时间轴更新
telemsg

telemsg

V2EX 第 448326 号会员,加入于 2019-10-22 11:04:40 +08:00
telemsg 最近回复了
3 天前
回复了 blueeon 创建的主题 程序员 为什么放弃了 RAG? RAG 的六大难题
这篇文章的作者指出的痛点(如上下文碎片化、本地资源开销、专业词汇不敏感)是非常真实的,确实反映了**早期/基础 RAG ( Naive RAG )**在实际落地中的普遍困境。

但是,如果要反驳这篇文章,核心切入点在于:**作者是在用“2023 年的基础 RAG”的缺点,来衬托“2024 年高级 RAG”的优点,然后通过“偷换概念”宣称自己放弃了 RAG ,本质上是一篇为自己产品( Linkly AI )带货的精彩软文。**

以下是具体的反驳逻辑和视角:

### 1. 概念偷换:他并没有放弃 RAG ,只是做了一个“层级 RAG”

作者提出的终极解法是 **Outline Index (搜索 -> 看大纲 -> 精读)**。

* **反驳**:这根本不是放弃 RAG ,这在业界被称为 **Hierarchical Retrieval (层级检索)**、**Document Summary Index** 或者类似 RAPTOR 的树状检索结构,LlamaIndex 等框架早就支持了。
* 本质上,它依然是“检索( Retrieval )+ 增强( Augmented )+ 生成( Generation )”的管线。作者只是把“直接检索碎片( Chunk )”改成了“先检索大纲( Outline ),再按需加载大区块( Section )”,这是 RAG 架构的演进,而非颠覆。

### 2. 逻辑自相矛盾:解析难度问题

* **作者的论点(问题四、五)**:文档被固定大小切块后语义破碎。并且不同文档类型(表格、合同、代码)结构不同,提取和分块的开发维护成本极高,效果还不好。
* **反驳(致命漏洞)**:如果一份排版复杂的 PDF (包含多级标题、跨页表格、双栏文本),你连准确的文本分块都做不到,**你的 Outline Index 是如何凭空为它生成完美的“结构化大纲(章节、层级、行号)”的?**
* **真相是**:无论做高级 RAG 还是做 Outline Index ,核心瓶颈都是**文档版面分析与结构化提取**( Document Parsing )。只要你能完美解析出文档结构,传统的语义切块( Semantic Chunking )加上父子文档关联( Parent-Child Retriever )同样能完美解决碎片化问题。作者把文档解析的锅,硬扣在了 RAG 的头上。

### 3. 以偏概全:拿“纯向量检索”的弱点当作整个 RAG 的弱点

* **作者的论点(问题二、三)**:Embedding 对专业词汇不敏感,Rerank 模型太重且不能解决根本的召回问题。
* **反驳**:现代生产环境的 RAG 标配是 **混合检索( Hybrid Search = 向量 Dense + 关键词 Sparse/BM25 )**。作者在文末也承认自己的方案也是用“BM25 + 向量”双路召回来解决领域词汇问题的。既然大家都在用双路召回,为什么这成了传统 RAG 的缺点,却成了他们产品的卖点?此外,API 化的 Rerank 模型(如 Cohere 、BGE )速度极快,几百毫秒的延迟在动辄数秒的 LLM 生成时间面前几乎可以忽略不计。

### 4. 场景局限:把“本地优先”的短板无限放大

* **作者的论点(问题一)**:本地桌面应用跑大 Embedding 模型太吃资源,跑小模型效果差,陷入两难。
* **反驳**:这是“本地桌面端”的软硬件限制,而不是 RAG 技术的限制。绝大多数企业级 RAG 或 SaaS 应用都在云端运行,调用顶级的 Embedding API 成本极低且效果极好。即便在本地端,随着端侧 NPU/Apple Silicon 的普及以及诸如 BGE-M3 等轻量级高性能模型的出现,这个门槛正在迅速降低。

### 5. 成本与效果的掩耳盗铃(关于大模型长文本陷阱)

* **作者的方案**:给 AI 一张地图,AI 看完大纲后决定按需加载精读(甚至加载整个章节)。
* **反驳**:这种做法极度依赖大模型的**超长上下文能力( Long Context )**和**推理能力**。
* **Token 成本极高**:如果用户问一个简单的数据点(例如“Q3 的利润是多少?”),传统 RAG 返回 3 个精准的 Chunk 可能只消耗 1000 Token 。而 Outline Index 需要先让 AI 读几百 Token 的大纲,然后加载可能长达 5000 Token 的整个财报章节去“精读”,Token 消耗和首字等待时间( TTFT )反而飙升。
* **迷失在中间( Lost in the middle )**:即便是现在的长文本模型,在塞入一个巨大的章节让其自己寻找细节时,依然很容易出现幻觉或遗漏。精准的 Chunk 召回反而是降低 LLM 幻觉的最有效手段。



### 总结

如何一针见血地评价并反驳这篇帖子?

> “文章写得很好,对早期无脑切块( Naive RAG )的批判刀刀见血。但作者用 2023 年最基础的 Fixed Chunk + 纯向量检索作为‘靶子’,刻意无视了 2024 年业界早已普及的**混合检索、语义切块、父子文档结构( Auto-merging retrieval )以及多步 Agentic RAG**。
> 作者兜售的『 Outline Index 』本质就是带 Metadata 的层级检索( Hierarchical RAG ),依然是 RAG 家族的一员。这就像是说:**‘为什么我放弃了汽车?因为三轮车太颠簸了,而且拉货太少。所以我现在改用四个轮子、带独立悬挂的交通工具了。’** 这是一次精彩的降维打击式营销,但从技术层面来看,RAG 并没有被放弃,只是在向着更精细的结构化和 Agent 化演进。”
1 月 5 日
回复了 hellopz 创建的主题 macOS 用 mac 的第五年了,仍然不喜欢
打开浏览器 打开 google 输入:如何关闭 mac 动画
2025 年 12 月 29 日
回复了 DLOG 创建的主题 程序员 小白来请教大佬,像 Gemini Pro 订阅,支付怎么解决
@telemsg 这个号是 Ultra, 也没啥登录障碍。 我都是分享给同事一起用
2025 年 12 月 29 日
回复了 DLOG 创建的主题 程序员 小白来请教大佬,像 Gemini Pro 订阅,支付怎么解决
2025 年 10 月 10 日
回复了 telemsg 创建的主题 macOS 分享一个消除 macOS Tahoe 26 升级提示的小技巧
@lsrnb 没有失效 我自己的问题 抓包了看一下
https://gdmf.apple.com
https://xp.apple.com
https://swscan.apple.com
2025 年 10 月 10 日
回复了 telemsg 创建的主题 macOS 分享一个消除 macOS Tahoe 26 升级提示的小技巧
@lsrnb 失效了? 有新的域名了?
2025 年 10 月 7 日
回复了 gdzzzyyy 创建的主题 Apple 有人遇到 macbook 和 iPhone 无法接力吗
电脑和手机都重新登录 id 就好了
2025 年 9 月 22 日
回复了 Sfilata 创建的主题 macOS macOS 26 Bug?
断网执行 softwareupdate -l 然后别手贱就好了
2025 年 8 月 22 日
回复了 DLOG 创建的主题 程序员 小白来请教大佬,像 Gemini Pro 订阅,支付怎么解决
轻度使用 买的月抛号
2025 年 8 月 4 日
回复了 JackMaMa 创建的主题 推广 新用户注册币安交易所赠送 500 枚$V2EX
UID:1139008279
Solona:3mk59E9XScFFVumn4Yb8YKRSQwMTERvab52s5NGM3zHx
未认证用户可以吗
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2949 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 15:10 · PVG 23:10 · LAX 08:10 · JFK 11:10
♥ Do have faith in what you're doing.