V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  sentinelK  ›  全部回复第 1 页 / 共 73 页
回复总数  1441
1  2  3  4  5  6  7  8  9  10 ... 73  
1 天前
回复了 chenliangngng 创建的主题 Visual Studio Code 新版 Copliot 令我陌生
最让我印象深刻的是,copilot 最近的更新让其可以自主提问了。会质疑缺失关键的上下文,弹出模态窗口让你填写或者引用某个文件。
2 天前
回复了 ethusdt 创建的主题 程序员 有大模型的服务,如何防止被蹬?
输入端对用户提示词进行再加工与过滤。
输出端杜绝直接返回大模型结果。大模型输出的内容要经过数据清洗和审核。

在系统提示词中要求大模型以特定格式输出结果。如果大模型输出的结果格式不符,说明系统提示词和既定上文被污染,放弃。
讨论隐私你得先聊到底什么是“隐私”。
不计成本的聊安全就是耍流氓。

另,在乎隐私的也绝对不会在常用设备上跑 openClaw 就是了。
有差异。
1 、各家 AI 产品的系统提示词不同。github copilot 是开源的,可以去看。
2 、各家对于上下文供给的逻辑,调用的搜索、压缩模型不同。
3 、各家产品会有一些功能性差异。比如最新版本的 VScode 会对于缺失的上下文提出疑问,并弹出模态窗口要求你补充。
@AoEiuV020JP 这样的结果就是你只能得到一个当年 flash 游戏水平手感的平台跳跃游戏。
“claude 能不能帮我搞定编码部分”
可以,但是:
你如何在你能接受的提示词长度范围内,无歧义的描述你的编码需求?

举个简单的例子,请问怎么用语言描述 FC 超级马里奥的物理性能?
btw ,在上世纪 80 年代末的机器学习算法,确实是符合楼主的这个思路的。
毕竟那时候还没有 transformer ,也没有神经网络算法实现的强化学习。

所以机器学习结果的过拟合效应很强。
所以在我看来,楼主说的几个点的逻辑都不成立。

1 、统计学模型只给出最大统计学解,且有一定随机性,所以“AI 搞不定”这个结论很难证真、证伪。
2 、简短的上下文就可以完美实现功能,只能说你的功能定义逻辑很清晰且统一,没有歧义,最优解的统计学优势很强。并不能证明是历史的过拟合。
3 、反之亦然,你无论如何都无法生成满意的结果,只能说明你输入的上下文没有明显的统计学优势,导致最终输出的内容不断的落入各种小的“局部最优”解中。
目前的 AI 模型体积与上下文可以说庞大,对于统计学上的相关性挖掘的是非常深入,且远超人的理解的。
所以 AI 视角下的“相似”、“轻而易举”,并不意味着人类视角中无意义的重复。

举个不恰当的例子,网上订火车票和电话订火车票,无论是操作流程,还是交互形态都相差巨大,但其系统流程是非常接近的。

相反的,在用户眼里,12306 就是个劣化版本的携程。
但本质上他们是完全不同的系统与业务逻辑。
2 月 27 日
回复了 Kinnikuman 创建的主题 程序员 关于大模型中转站的两个问题
以上两个问题对于用户而言都无解。
这也是中转站价格比官方便宜的主要原因。

btw ,即便是官方,你依然也没有任何能力能够知晓模型实际的运行版本,你也没法知晓官方是否会污染你的提示词。
2 月 26 日
回复了 worldgg 创建的主题 职场话题 职场的 AI 困局
如果只从管理者的视角来看,其实“工艺”并不是其考虑的维度。
谁成本低,谁产量高,谁就上。就这么简单。

所以不管是现在的 AI 还是 10 年前“自愿加班”的卷王,本质上没区别。
4 、目前的 AI 还是很难主动提问。他就像是一个想疯狂证明自己的实习生。为了输出内容,不惜隐藏错误,掩盖信息缺失,不懂装懂。
目前丝滑程度还差一些,但也是临门一脚了。

1 、对于前后端结合产品,AI 很难做实际测试、验证。换句话说,AI 只能告诉你“编译通过了”。但很难告诉你,业务在 UI 上展示是否正常。

2 、上下文还是短,理想的情况应该是覆盖一个业务的整个垂直链条(从数据一直到 UI )。这样才不会因为上下文缺失导致频繁的误读与误解。

3 、对于既有产品,以及既有的团队分工,因为充斥很多人员、商务、管理上的妥协,所以 AI 接手的效率很低。
2 月 13 日
回复了 GSMillet 创建的主题 程序员 Trae 新计费模式
楼主标题是“新计费模式”,但内容对于计费模式之口不提。标题党都没这么干的。

新计费模式就是按量付费。10$的套餐,trae 会给你 20$的用量。
然后具体的模型消耗量如下:
https://docs.trae.ai/ide/models

所谓的“新计费模式的优势”,在我看来就是扯。
从次数计费改成按 token 计费,还按之前的限制 ai 的执行轮数与上下文总量,不是左右脑互博么?
所以流程都失效了,讨论管理还有什么意义……
code review 是不是没做?像这种延时 1 秒的硬编码,是怎么通过审核的?
设计文档写了吗?如果写了,同步调用远端这种设计流程是怎么过的?
从公司业务的角度来讲,“责任”其实包含两个含义。

一个是生产的产物本身不合法律法规。一个是生产的产物不符合预期。这是完全两种逻辑。

对于产物本身不合法的,本质上就是谁拍板谁负责。一般来讲,正规公司都有一系列固定的决策流程,结果也都是公司决策,所以是公司主体以及法人负责。除非执行者在非公司知情的情况下自行改动,但这也符合拍板既负责这个情况。

如果是最终产物与预期不符,就是谁未尽职谁负责。公司主体作为最后的兜底者。


所以回到楼主的问题,你使用 AI Coding ,如果生产的程序不符合法律法规,那么是你这个“决策者”的责任。
如果 AI Coding 的结果你不满意,理论上讲你可以起诉 agent 提供者,当然,前提是你要证明对方的服务确实有不符合协议的过失或失误。
@drymonfidelia 数据库侧,慢哈希的意义是相较于其他算法而言的。
假设你知道密码字段的加密算法、加盐逻辑以及取值范围。按照你的理解,一个 6 位纯数字,慢哈希的破解是以天为维度。

如果是其他算法的话,使用 GPU 加速,那暴力破解的单位将会是毫秒。
一天已经把整个银行系统的所有用户都轮完了。
2 月 10 日
回复了 keyu1103 创建的主题 信息安全 如何保障个人的信息安全?
最起码你要有一个固定的需求和场景才能讨论安全。没有需求讨论无限的安全不是耍流氓吗?

另外,你注重隐私,然后你把别人的照片丢给大模型,这是什么行为?
没太懂楼主想表达什么,不安全指的是哪一侧?

如果是用户侧的话,问题不大,因为六位数字往往伴随着尝试次数限制。
如果是数据侧用于非明文存储的话,确实没意义。

但是你光拿到 hash ,你怎么知道他的算法是什么,以及他的明文是什么范围?
1  2  3  4  5  6  7  8  9  10 ... 73  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5455 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 54ms · UTC 09:06 · PVG 17:06 · LAX 01:06 · JFK 04:06
♥ Do have faith in what you're doing.