资料我们主要有 PDF 、word 、PPT 、视频、代码。请教目前什么知识库的方案是大家认为效果不错的?我们现在用的开源的 coze-studio ,qwen 的 embedding 模型,实际应用基本上烂的一批,视频还没做
1
systemGuest 5 天前
烂有什么关系? 我们给 Gov 做 AI 知识库,PDF 、word 、PPT 、视频都有,视频识别的语音转文字,也非常烂,但是我们讲这是“国产”,他们就会非常乐于接受,甚至还上了新闻,国产标杆,鬼知道我们连训练都是英伟达。
|
2
zsj1029 5 天前
目前最简单效果最好的,openwebui + ollama + gptoss20b + qwen3-embedding8b 嵌入,文档有的,基本没有查不到的,包括多文档关联的问题,都能给你找到答案。所有文档都转 pdf 再导入,引用预览会更好。视频方案暂时没需求也没有。
|