V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  sudoy  ›  全部回复第 3 页 / 共 40 页
回复总数  784
1  2  3  4  5  6  7  8  9  10 ... 40  
130 天前
回复了 sudoy 创建的主题 问与答 AI 绘图实现产品场景图可行性
@coderluan 感谢回复
130 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@fizzmst 测试的时候 CURL 手动 post 请求返回正确的信息,用程序将列表遍历请求的时候返回出来的都是假信息。设置了延时也没用
130 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@yinmin 感谢提供思路!
130 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@kkocdko 了解过 embedding 模型,但是没有实际操作过,不知道从哪里开始
130 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@kenvix 专用模型目前没有找到合适的,因为不仅有实体,还有产品型号这种不规则字符串需要提取
130 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@forgottencoast 我用的是付费的 Claude API 和 OpenAI 的 API ,都是付费的,不过没有问过客服
130 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@SkywalkerJi 原来如此,不过我是让他提取我给它的邮件里面的信息,不是让他提取别人给它的信息
130 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@Liftman 原来如此,我的提示词如下:

const prompt = `
Extract the following information from the given email content:
po_number, phone, email, ship_to_name, ship_to_address, ship_to_address_2, ship_to_city, ship_to_state, ship_to_zip, ship_to_phone, sku, problem

Respond with only a JSON object containing these fields. If a field is not found, set its value to null.

Email content:
${emailContent}
`
136 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@nuance2ex 哦这样,我对 llm 本身没有研究,只会调用,谢谢指教
136 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@nuance2ex 哈哈你是说我出现幻觉啦?我最近都没喝酒啊。提取结果明明显示 customer@example.com, John Doe 这种 dummy 数据,肯定是哪里出错了
136 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@nuance2ex 这个方法值得一试,谢谢🙏
136 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@yinmin 我只有 qwen 1.5 ,还没有在这个项目用过,一定要 2.5 吗?
136 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@TimePPT 嗯,我目前改成用这个方法了,但是不够完美,还是 ai 方案提取的结果好,只是 ai 被限制了
136 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@trungdieu031 谢谢回复。

1. 试了 openai ,claude ,llama 3 都被限制了;
2. 增加延时了,提高到 10 秒钟延时都没用;更换 ip 和账号条件不允许,只有一个账号,而且主机都是 aws
3. 这个或许可以,我回头试试看,主要是通过 system prompt 进行强制修改
4. 本地部署主要也是硬件条件有限
136 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@maolon 没试过这个,回头试试看。本地部署不知道我的 Mac mini M1 能不能带起来
136 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@werwer 感谢回复!正则搞不定,比如订单号码,邮件里面有跟订单号码特征一样的字符串,AI 可以轻松判断哪个是订单号码。

我是做成 rest api ,然后 post 文本到后端,后端调用 claude ai api 提取,手动 post 一个两个都能正常返回正确的内容,当用一个 for 循环请求几十个的时候,就返回这些虚假数据。我尝试设置等候机制(也就是延时),每请求完一个,等待十秒钟再请求第二个,同样会出现一样的问题。我有时间再 debug 一下,目前暂时放弃 ai 这个方法了,改用编程的方法提取出不容易出错的信息,然后再人工匹配。
136 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@ladypxy 我自己写了,也用 ai 写了,编程的方法不稳定,正则提取出来的也经常出错,ai 非常稳定,就是容易触发风控
137 天前
回复了 sudoy 创建的主题 问与答 大语言模型提取个人信息返回虚假信息
@ladypxy 邮件内容排版非常乱,而且不规则,用编程提取经常会提取出错误信息。这就是为什么我上大语言模型的原因,这些语言模型我如果提取几封或者十几封邮件,是能正确提取出来并且按照指令返回 json ,所以我 i 知道这些模型是干啥的。现在问题是通过 api 密集调用,可能触发某种安全机制,全部返回虚假信息
搞定了!用 Llama 直接提取就可以
@janda 我连大厂的 RAG 都不会用
1  2  3  4  5  6  7  8  9  10 ... 40  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5996 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 02:33 · PVG 10:33 · LAX 18:33 · JFK 21:33
Developed with CodeLauncher
♥ Do have faith in what you're doing.