heirtheloong 最近的时间轴更新

heirtheloong

V2EX 第 607976 号会员，加入于 2022-12-26 19:09:06 +08:00

今日活跃度排名 17924

heirtheloong 提问技术话题好玩工作信息交易信息城市相关

求推荐一个可靠的 AI 知识库

奇思妙想 • heirtheloong • 1 天前 • 最后回复来自 shark000

» heirtheloong 创建的更多主题

heirtheloong 最近回复了

2 天前

回复了 heirtheloong 创建的主题 › 奇思妙想 › 求推荐一个可靠的 AI 知识库

@shark000 显然没有，现在的大模型能力有限。这么解释吧：

当前大模型有上下文限制，而一本书显然超过这个限制，更别说知识库了。所以要让 AI 读书、读知识库，必须进行向量。但向量化后，AI 也做不到读你给的书，因为上下文仍然超过了他的上下文长度，所以 AI 只会在其中搜索跟你提问相关的段落，读一部分。

这会带来什么问题呢？向量本质就是“切”文本，把文本切成长短不一的部分，在向量空间展示他们间的关联程度。所以一定会丢信息，不管你切得多“碎”，都会丢信息。所以这东西配合 AI ，本质就是个高级模糊搜索，还因为丢信息，实质体验并没有那么好。

举个例子，你需要的信息刚好包含在 AI 允许的上下文长度中，把这段文本丢给 AI ，一般能问出你要的结果。可如果你把这段文本丢进知识库，向量化后，再问 AI ，AI 就不一定能给出正确的答案了。

这种程度的都做不到，那么一些更高级的就更不要想了，比如：

1. 我有一本书，相关人物的信息散见于各章节，我想让 AI 帮我整理该人物地设定。做不到，因为 Ai 本质只是在向量空间中找这个人物关联高的词，再读对应段落，做个大致总结。他不可能像人一样那么细致，更别说作者对同一个人物还有不同称呼，人能理解并予以总结，但 AI 不行。

2. 需要推理的时候。比如你建立几个人物页面，一个页面说 A 是 B 的儿子，另一个说 B 是 C 的儿子，都很长。现在你问 AI ，A 和 C 是什么关系？ AI 未必能答得出来。因为 AI 的推理只限于他的上下文长度内，当需要推理的信息混杂在知识库中，他首先难以找到对应信息，再一个找到了也未必能推理得出来。

以上体验基于 Obsidian 的 SmartComposer 插件，用 OpenAI 的 text-embedding-3-smal 向量化我的知识库后，再用 DeepSeek-R1 和 gpt-4o-mini 提问得到的一些体验。用于提问的文本基本来自《猎魔人》的 wiki ，这已经相当规范的文本了，如果你的文本质量还不如这个，我估计使用体验想必难以保证。

我对 AI 的理解可能也有误，如果有专业人士可以指出，但想来现在的大模型可能真的只有这个水平了。

如果你确实有需求，可以用我的组合，至少能当个稍好的模糊搜索，多的就不能指望了。

67 天前

回复了 heirtheloong 创建的主题 › 奇思妙想 › 求推荐一个可靠的 AI 知识库

@zhaoyi1234 我能力最多也就配置下别人开发好的，你整些 python 代码我还能给你跑起来，再往上我就不行了

67 天前

回复了 heirtheloong 创建的主题 › 奇思妙想 › 求推荐一个可靠的 AI 知识库

@lucybenz 百度的刚用过了，除了其他 AI 通用的问题外（出错、漏答、张冠李戴），还有一个新问题：即使你要求他基于文本，他还是会引用网络资料。比如我问他聂风的人际关系，要求他不要引用网络资料，他本该基于小说第三部，可结果还是出现了小说中没有的角色（怀空、第二梦），即使如此，也不全面。

67 天前

回复了 heirtheloong 创建的主题 › 奇思妙想 › 求推荐一个可靠的 AI 知识库

@lointo 试过了，同样是《中国古代史教程》和《风云 3_倾城之恋》，跟谷歌的 notebooklm 差不多，在一个水平上。比如前者，叫他总结下某某特征，能说得有模有样，但一问细一点的东西，就全不知道。对于后者，效果更差。要他“介绍下梦这个角色”，他说没有这个角色。再叫他介绍下聂风相关人物，他又能找到“梦”，可是又缺个步惊云这种重要角色。还是那个问题：你让他找全面，他就胡说、张冠李戴。你让他准确，他就找不到、找不全。

如果拿来水论文，其实谷歌那个就很好了，毕竟免费额度也不少。这个我看官网只有 14 天试用，然后又基于 VS Code ，对于程序员可能很方便？能直接查找自己的代码库，并直接插入代码。但对一般用户就不甚好用了。

还是看你的文本，如果是那种特别机械的文本，可能效果会不错。也看你的要求，如果只是泛读，写点综述，那也可以。但指望他帮你模糊搜索，还指出位置，那真的做不到。

67 天前

回复了 heirtheloong 创建的主题 › 奇思妙想 › 求推荐一个可靠的 AI 知识库

@lucybenz MaxKB 之前用过，我移动端 3070 本地向量+Gemini 提问，效果很差，基本也就是原句才能找到这种，拿来做客服问答或者企业对外机器人还行，自己正经用不行，百川没试过

70 天前

回复了 heirtheloong 创建的主题 › 奇思妙想 › 求推荐一个可靠的 AI 知识库

@wangweiggsn 刚试了下 KIMI ，确实结果较好，但也确实和谷歌的 notebooklm 一样，当文本一长，就不能准确回答，特别是相关信息一散，就不能总结。我丢了《中国古代史教程》进去，KIMI 虽说只能读前 60%，可一让他介绍某个人物，有时还是说没有，可直接搜都能搜到名字。我截下该人物对应的章节，就能较好总结。

可如果是小说这类，一个人物散见于全书各处，你再让他总结，就经常张冠李戴、不全面、胡说八道。

70 天前

回复了 heirtheloong 创建的主题 › 奇思妙想 › 求推荐一个可靠的 AI 知识库

@lointo 稍微试了下，回答比 ChatDOC 强很多，比如上面提到的火麟剑主人的回答，他就找到了：“断帅用的是火麟剑。袁氏兄弟看到断帅的剑，认出那是火麟剑，非常吃惊。断帅也承认自己是南麟剑首。”

但仍有不全面的问题，比如我问他聂风掌握了哪些武功，他只找到“冰心决、点穴法（其实就是兽穴法）、风神腿”，但其实还有一门鬼虎所传的“急转步法”。进一步追问下倒是得到了这套步法，可又开始胡说八道：

> 除了您提到的武功之外，聂风还掌握以下武功：
> ●鬼虎所授轻功步法: 在鬼虎的洞穴中，鬼虎传授给聂风一套独特的轻功步法。这套步法非常精妙，能够帮助聂风在与巨熊搏斗中躲避攻击。后来在与独孤鸣比试时，聂风也是用这套步法躲避了独孤鸣的“亢龙有悔”。
因此，聂风所掌握的武功招式可以总结为以下几点:
> ●内功心法: 冰心诀
> ●轻功: 鬼虎所授轻功步法
> ●腿法: 风神腿
> ●剑法: 霍家剑法
> ●点穴: 点穴法
> 值得一提的是，虽然聂风精通霍家剑法，但他更倾向于使用腿法和轻功，这可能与他性格中善良温和的一面有关。

其中“霍家剑法”显然是步惊云的武功。

我会再用出版书籍试试，看面对纯知识类文本的效果如何。

93 天前

回复了 rongsh 创建的主题 › iCloud › 国内 icloud 官网登录后闪退

碰到同样的问题，暂时没找到解决方法，具体体现为：登录，进入见面，一两秒内自动退出登录，要求再次登录。

308 天前

回复了 plmsuper8 创建的主题 › 输入法 › 微软输入法祖传级 bug，触发半角/全角切换，即便关掉了快捷键

这是特性，不是 bug ，毕竟这么大的厂子，小十年不修一个极其影响体验的 bug ，天天琢磨往系统里加广告，这分明就是认为这是特性嘛。

这个特性，不是你升 win11 就解决了的，这是广泛存在于 win10 到 win11 的特性，想复现按下面方法来：

1. 将输入法状态切换为“中文+半角”；
2. 进入某个编辑区域（比如网页输入框）；
3. 按住 Shift 键不放，敲击（按下后松开）任意一个字母键（比如 R ），然后敲击 Space 键，最后松开所有按键，问题出现；
4. 会发现此时输入法切换成了全角输入，需要按下 Shift+Space 手动关闭。

312 天前

回复了 DigitaIOcean 创建的主题 › Android › 突然奇想：也许苹果用户转安卓最大的拦路虎就是性价比安卓机

现在的 8gen2 ，8gen3 体验也经很好了，而 5000+，甚至 5500+的无脑堆电池，让安桌即使后台挂一堆软件来保持通知，也能用上一天，更别说白菜一样的内存，3000 多的性价比机子，比如真我的一些，或老的红米旗舰，已经能买 16+512 的 8gen2 甚至是 8gen3 了，这些体验都很好，已经不是无脑看果子的时代了

» heirtheloong 创建的更多回复