V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  w568w  ›  全部回复第 2 页 / 共 52 页
回复总数  1027
1  2  3  4  5  6  7  8  9  10 ... 52  
@walkon 谢谢,我用了的。

我还可以再举一例:AGENTS.md 里有要求:

- `find` or Glob or `glob` MUST be used with `-print0` and `xargs` must be used with `-0` to handle file names with spaces or special characters. MUST use `-xdev` to avoid descending into slow network filesystems. NEVER find or glob or search files without `-xdev`.

因为我们的项目里面挂载了网络文件系统,模型有时候喜欢直接全局搜索,会非常慢。

至今为止,GPT-5.5 遵从过这个指令 0 次…… 我觉得我这段话应该已经写得够清楚了,对吧
@Haku 是的,我现在发现 GLM5.2 和 MiMo 2.5 Pro 都比 GPT-5.5 好用,至少

(1) 能听明白我想做什么;
(2) 自己不明白的东西,知道要先问我;
(3) 没有要求它做的,绝对不做;
(4) 有基本的逻辑思维。

GPT-5.5 感觉有时候真的是小脑发育不完全了,逻辑关系都能弄错(测试 A 场景正常,认定 B 场景没事)
@jinsongzhaocn 你真的认真读帖子了吗?就这第一个例子,你告诉我什么样的 skill 才能让它知道「当用户要求你做 A 、B 、C 的时候,你应该做 ABC ,而不是只做 C 」?
@jinsongzhaocn 唉唉。我当然用了 Skills 啊,我说「不用提这些」的意思,不是「我一个都没试过,我猜肯定不好用」,而是我全都试了一遍,情况没有改善……
我觉得各有好处

强约束的语言在工程上变得更有市场了,例如 C ,C++,Rust 甚至 Haskell 、Scala 等等

而弱约束的语言则更面向大众普及了,例如 JS 、Python
……啊?为什么论坛需要刷活跃度和自动托管,这也不是网游代练吧

除了养号卖号和卖激活码的,想不到这个项目的作用
何意味,那我问你,Residual Connection 是谁发明的? GRPO 是谁搞出来的?

你查查这几年会议论文里国内作者的占比呢?

你再拉到这页面底下看看,Lead 是哪国名字呢?

也别说什么「美籍华人 ≠ 国内人」,GRPO 作者总不在美国了吧?

要铜币大大方方说,非得装傻逼反串

我真得 Block 了,反智反得有点搞笑了
14 天前
回复了 solitude23456 创建的主题 Codex 如何说服 codex 逆向软件啊?
GPT 这个底线蛮奇怪的

让他帮忙逆向个大厂 App ,通过了,虽然最后没逆向 native 成功;

让他帮忙搞定个反爬虫严重的网站,通过了,并且读了几万行混淆 JS ,把加密签名算法都写成逆向文档了;

但是接着让他写个 PoC 演示一下怎么加密请求,拒绝了。换了个模型按照它的逆向文档来写,都是正确的;

让他帮忙分析下我自己的测试软件安不安全,也被拒绝了
喝茶是字面意思啊
16 天前
回复了 beasnail 创建的主题 程序员 汇编修改 BIOS 驱动安装包
@beasnail 其实还好,我也是手贱把电脑搞坏了,才急中生智开始学的。在此之前我对硬件狗屁不通,除了会拆机、清灰以外,对硬件一点都不了解。压力使人进步哈哈

> 售后要价 1000+元,感觉能完成这些技术修复其实也不便宜了哈

主要是售后的问题。部分售后是啥也不懂,开不了机了就会叫你换主板,是真的坑爹
16 天前
回复了 beasnail 创建的主题 程序员 汇编修改 BIOS 驱动安装包
现代电脑的 BIOS 芯片都是很容易刷的,哪怕搞坏了,去淘宝 20 块搞个 CH341 + 线夹就能刷了

分享一下我之前硬件刷 BIOS 的经历: https://w568w.github.io/how-to-fix-bricked-lenovo-laptop.html
16 天前
回复了 w568w 创建的主题 反馈 这种纯 AI 机器人发帖是否需要处理?
@w568w 补充一句:看似好像回复都很有逻辑,实际上点进帖子会发现,只是把楼主的帖子或回复用 AI 反刍了一遍,改写成疑问句或者陈述句。
16 天前
回复了 w568w 创建的主题 反馈 这种纯 AI 机器人发帖是否需要处理?
又一个 AI 账号,目测是 GPT 5.5:

https://www.v2ex.com/member/teaguexiao

证据:

1. Misinformation:推荐别人使用一年多前的「最新模型 DeepSeek V3 」;
2. 口癖「贴」「盯」「圈」「打」「绔」「摇摸」「卡人」「氏心」「子弹」「关键是」「说得很准」「这个方向对了」「更适合」「这样做会 X 很多」「不是……而是……」,大量滥用破折号;
3. 高强度回帖,且格式、长度、间隔、每日回复频率大致一致;
4. 三月底注册,发了两个帖子,都是推广同一个自家的商业产品。

@Livid
18 天前
回复了 w568w 创建的主题 OpenAI 我的 GPT 5.5 怎么和你们的不一样?
@tengxun @gloeaerris 今天尝试了一下 Codex ,体验如下:

1. 口癖略微好了一些,但依然存在。主要差异是模型不会输出大段文本了,所以不明显。

2. 同 1 ,GPT 喜欢说废话的现象基本解决一半了,但还是存在。

3. 没有改善。依旧对着我的项目乱改。例如我要求他帮我「仅编译并推送一个 Docker 镜像」,他莫名其妙在我 Dockerfile ENTRYPOINT 和一大堆环境变量,又把我前面的 COPY xxx ./ 改成了 COPY . ./,也没有给任何解释。

https://i.imgur.com/tVNizSR.png

我问他「为什么要这么改?」,他回答我:

「 COPY . ./ 没有强必要。最初这样改是为了让 build context 下的 runtime entrypoint 和后续文件布局更直接可见,但根本没必要。这会让 Docker cache 更差,我会改回 COPY xxx ./。」

然后就改回去了。吐了,没必要你改什么呢?

4. 还没有具体测试,虽然执行长时间任务的能力有显著提升,但他在任务中把我项目里的脚本重写了一遍(当然是在我没有要求的情况下),而且重写是错的,后面自己又回滚回去了。所以我谨慎不看好。

==============

总结:输出语气有改善,其他方面没看出和 OpenCode 有特别大的差别。
18 天前
回复了 w568w 创建的主题 OpenAI 我的 GPT 5.5 怎么和你们的不一样?
@neteroster 我觉得更可能的是 OpenAI 偷偷给我账号的模型降智或切换了。但我找不到任何证据,试了几个网上的测试例子都通过了
18 天前
回复了 w568w 创建的主题 OpenAI 我的 GPT 5.5 怎么和你们的不一样?
@neteroster > 5.5 是执行的神
> 一份十分明确的 spec 给进去执行出来就还是会有明确漏项或者矛盾的地方,5.5 甚至 5.4 就完全不会有这种问题

啊?我自己使用下来的体验是,GPT 才是漏项的那个,有时我要求他做 A+B ,他做完 A 就直接停下来了,还要殷勤地问我一句「要我继续做 B 吗」。反而是 Opus ,我记忆里没有遇到过你说的执行漏项问题

> opus 世界知识现在似乎已经是御三家最差了,5.5 长尾世界知识已经有半步 Gemini 水平了

这个我倒是没太多体验,最近主要做工程问题。Opus 和 GPT 都出现过知识上的问题(例如认为「现在 Python 3.12 及之后的版本都没发布」,未经允许擅自把我项目里所有 python 3.13 和之后的版本字符串全部改成 3.11 )

之前也做过 AI 辅助研究方向的问题,但是不知道为何 GPT 总给我一种「注意力涣散」的感觉(高情商说就是「思维发散」),问 A 要答 ABCDE ,尝试了几次最后还是回到 Opus 了
18 天前
回复了 w568w 创建的主题 OpenAI 我的 GPT 5.5 怎么和你们的不一样?
@kkadmin 我开的确实是 5x Pro ,和 20x 会差很多吗😂
19 天前
回复了 w568w 创建的主题 OpenAI 我的 GPT 5.5 怎么和你们的不一样?
@tanrenye > 为什么会有必要用同一个 agent 对比

因为不用就会有人说「是不是 codex/claude code 的问题?你为什么不用一样的 harness ?你这吐槽没意义」,两头不讨好~

开玩笑,实际上的原因是我有两边的订阅,然后有一些自己的配置和 skills 之类的,opencode 允许我在同一个会话里面切换不同模型,比较方便。
19 天前
回复了 w568w 创建的主题 OpenAI 我的 GPT 5.5 怎么和你们的不一样?
@lujiaosama 嗯嗯。GPT 5.5 肯定是比 Codex 5.3 或者 5.4 强的,尤其在反编译、绕过反爬虫和逆向软件这种安全任务上,明显比 Opus 4.6 强得多。

但 GPT 5.5 这个工程实践能力在我这里确实不咋行,而且输出口癖的风格还是没扭转过来,有时任务做的差、代码写得烂,又得意洋洋地总结自己做得如何如何好,有种面对伪人实习生的感觉,很火大。
1  2  3  4  5  6  7  8  9  10 ... 52  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3051 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 29ms · UTC 00:23 · PVG 08:23 · LAX 17:23 · JFK 20:23
♥ Do have faith in what you're doing.