heirtheloong 最近的时间轴更新
heirtheloong

heirtheloong

V2EX 第 607976 号会员,加入于 2022-12-26 19:09:06 +08:00
今日活跃度排名 17924
heirtheloong 最近回复了
2 天前
回复了 heirtheloong 创建的主题 奇思妙想 求推荐一个可靠的 AI 知识库
@shark000 显然没有,现在的大模型能力有限。这么解释吧:

当前大模型有上下文限制,而一本书显然超过这个限制,更别说知识库了。所以要让 AI 读书、读知识库,必须进行向量。但向量化后,AI 也做不到读你给的书,因为上下文仍然超过了他的上下文长度,所以 AI 只会在其中搜索跟你提问相关的段落,读一部分。

这会带来什么问题呢?向量本质就是“切”文本,把文本切成长短不一的部分,在向量空间展示他们间的关联程度。所以一定会丢信息,不管你切得多“碎”,都会丢信息。所以这东西配合 AI ,本质就是个高级模糊搜索,还因为丢信息,实质体验并没有那么好。

举个例子,你需要的信息刚好包含在 AI 允许的上下文长度中,把这段文本丢给 AI ,一般能问出你要的结果。可如果你把这段文本丢进知识库,向量化后,再问 AI ,AI 就不一定能给出正确的答案了。

这种程度的都做不到,那么一些更高级的就更不要想了,比如:

1. 我有一本书,相关人物的信息散见于各章节,我想让 AI 帮我整理该人物地设定。做不到,因为 Ai 本质只是在向量空间中找这个人物关联高的词,再读对应段落,做个大致总结。他不可能像人一样那么细致,更别说作者对同一个人物还有不同称呼,人能理解并予以总结,但 AI 不行。

2. 需要推理的时候。比如你建立几个人物页面,一个页面说 A 是 B 的儿子,另一个说 B 是 C 的儿子,都很长。现在你问 AI ,A 和 C 是什么关系? AI 未必能答得出来。因为 AI 的推理只限于他的上下文长度内,当需要推理的信息混杂在知识库中,他首先难以找到对应信息,再一个找到了也未必能推理得出来。

以上体验基于 Obsidian 的 SmartComposer 插件,用 OpenAI 的 text-embedding-3-smal 向量化我的知识库后,再用 DeepSeek-R1 和 gpt-4o-mini 提问得到的一些体验。用于提问的文本基本来自《猎魔人》的 wiki ,这已经相当规范的文本了,如果你的文本质量还不如这个,我估计使用体验想必难以保证。

我对 AI 的理解可能也有误,如果有专业人士可以指出,但想来现在的大模型可能真的只有这个水平了。

如果你确实有需求,可以用我的组合,至少能当个稍好的模糊搜索,多的就不能指望了。
67 天前
回复了 heirtheloong 创建的主题 奇思妙想 求推荐一个可靠的 AI 知识库
@zhaoyi1234 我能力最多也就配置下别人开发好的,你整些 python 代码我还能给你跑起来,再往上我就不行了
67 天前
回复了 heirtheloong 创建的主题 奇思妙想 求推荐一个可靠的 AI 知识库
@lucybenz 百度的刚用过了,除了其他 AI 通用的问题外(出错、漏答、张冠李戴),还有一个新问题:即使你要求他基于文本,他还是会引用网络资料。比如我问他聂风的人际关系,要求他不要引用网络资料,他本该基于小说第三部,可结果还是出现了小说中没有的角色(怀空、第二梦),即使如此,也不全面。
67 天前
回复了 heirtheloong 创建的主题 奇思妙想 求推荐一个可靠的 AI 知识库
@lointo 试过了,同样是《中国古代史教程》和《风云 3_倾城之恋》,跟谷歌的 notebooklm 差不多,在一个水平上。比如前者,叫他总结下某某特征,能说得有模有样,但一问细一点的东西,就全不知道。对于后者,效果更差。要他“介绍下梦这个角色”,他说没有这个角色。再叫他介绍下聂风相关人物,他又能找到“梦”,可是又缺个步惊云这种重要角色。还是那个问题:你让他找全面,他就胡说、张冠李戴。你让他准确,他就找不到、找不全。

如果拿来水论文,其实谷歌那个就很好了,毕竟免费额度也不少。这个我看官网只有 14 天试用,然后又基于 VS Code ,对于程序员可能很方便?能直接查找自己的代码库,并直接插入代码。但对一般用户就不甚好用了。

还是看你的文本,如果是那种特别机械的文本,可能效果会不错。也看你的要求,如果只是泛读,写点综述,那也可以。但指望他帮你模糊搜索,还指出位置,那真的做不到。
67 天前
回复了 heirtheloong 创建的主题 奇思妙想 求推荐一个可靠的 AI 知识库
@lucybenz MaxKB 之前用过,我移动端 3070 本地向量+Gemini 提问,效果很差,基本也就是原句才能找到这种,拿来做客服问答或者企业对外机器人还行,自己正经用不行,百川没试过
70 天前
回复了 heirtheloong 创建的主题 奇思妙想 求推荐一个可靠的 AI 知识库
@wangweiggsn 刚试了下 KIMI ,确实结果较好,但也确实和谷歌的 notebooklm 一样,当文本一长,就不能准确回答,特别是相关信息一散,就不能总结。我丢了《中国古代史教程》进去,KIMI 虽说只能读前 60%,可一让他介绍某个人物,有时还是说没有,可直接搜都能搜到名字。我截下该人物对应的章节,就能较好总结。

可如果是小说这类,一个人物散见于全书各处,你再让他总结,就经常张冠李戴、不全面、胡说八道。
70 天前
回复了 heirtheloong 创建的主题 奇思妙想 求推荐一个可靠的 AI 知识库
@lointo 稍微试了下,回答比 ChatDOC 强很多,比如上面提到的火麟剑主人的回答,他就找到了:“断帅用的是火麟剑。 袁氏兄弟看到断帅的剑,认出那是火麟剑,非常吃惊。 断帅也承认自己是南麟剑首。”

但仍有不全面的问题,比如我问他聂风掌握了哪些武功,他只找到“冰心决、点穴法(其实就是兽穴法)、风神腿”,但其实还有一门鬼虎所传的“急转步法”。进一步追问下倒是得到了这套步法,可又开始胡说八道:

> 除了您提到的武功之外,聂风还掌握以下武功:
> ●鬼虎所授轻功步法: 在鬼虎的洞穴中,鬼虎传授给聂风一套独特的轻功步法。 这套步法非常精妙,能够帮助聂风在与巨熊搏斗中躲避攻击。 后来在与独孤鸣比试时,聂风也是用这套步法躲避了独孤鸣的“亢龙有悔”。
因此,聂风所掌握的武功招式可以总结为以下几点:
> ●内功心法: 冰心诀
> ●轻功: 鬼虎所授轻功步法
> ●腿法: 风神腿
> ●剑法: 霍家剑法
> ●点穴: 点穴法
> 值得一提的是,虽然聂风精通霍家剑法,但他更倾向于使用腿法和轻功,这可能与他性格中善良温和的一面有关。

其中“霍家剑法”显然是步惊云的武功。

我会再用出版书籍试试,看面对纯知识类文本的效果如何。
93 天前
回复了 rongsh 创建的主题 iCloud 国内 icloud 官网登录后闪退
碰到同样的问题,暂时没找到解决方法,具体体现为:登录,进入见面,一两秒内自动退出登录,要求再次登录。
这是特性,不是 bug ,毕竟这么大的厂子,小十年不修一个极其影响体验的 bug ,天天琢磨往系统里加广告,这分明就是认为这是特性嘛。

这个特性,不是你升 win11 就解决了的,这是广泛存在于 win10 到 win11 的特性,想复现按下面方法来:

1. 将输入法状态切换为“中文+半角”;
2. 进入某个编辑区域(比如网页输入框);
3. 按住 Shift 键不放,敲击(按下后松开)任意一个字母键(比如 R ),然后敲击 Space 键,最后松开所有按键,问题出现;
4. 会发现此时输入法切换成了全角输入,需要按下 Shift+Space 手动关闭。
现在的 8gen2 ,8gen3 体验也经很好了,而 5000+,甚至 5500+的无脑堆电池,让安桌即使后台挂一堆软件来保持通知,也能用上一天,更别说白菜一样的内存,3000 多的性价比机子,比如真我的一些,或老的红米旗舰,已经能买 16+512 的 8gen2 甚至是 8gen3 了,这些体验都很好,已经不是无脑看果子的时代了
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5238 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 09:35 · PVG 17:35 · LAX 02:35 · JFK 05:35
Developed with CodeLauncher
♥ Do have faith in what you're doing.