V2EX › 0x636a 的所有回复 › 第 1 页 / 共 1 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

3 月 9 日

回复了 YunFun 创建的主题 › 推广 › [中转] Opus-4-6 上线，免费开蹬一周！回帖直接狂送 💰100 刀！

来自站点：bestaigate.top ，我的 id 是:4903

3 月 5 日

回复了 xiaotianhu 创建的主题 › OpenClaw › OpenClaw 跟我远程操作 Claude/Codex 的区别在哪儿？

受龙虾创始人的话“所有应用都是慢速 api”启发，刚买了 mini ，看看龙虾到底能多大程度复用已有软件。

蹲蹲技巧

2025 年 10 月 14 日

回复了 jqknono 创建的主题 › 程序员 › 大模型召回率为何重要

深有同感。
推理模型的遵循能力也是强于非推理模型的，现在我的生产场景中如果一个 prompt 中有复杂指令的我基本都让推理模型去做了，非推理模型总是会出现遗漏的情况。

2025 年 7 月 18 日

回复了 jackal 创建的主题 › 随想 › 目前的 AI，既不聪明，也不愚笨，它只是工具

目前在特定生产场景下有同感，本身用 prompt 精准描述自己的需求就很难，LLM 还有可能无法完全遵守同一个 prompt 中的多条指令。
前一条让 LLM 无法像神一般想我所想。
后一条让基于 LLM 的工程必须不断的通过多 agent 反思迭代优化结果。
这两步还是需要人工投入大量的精力去适配 LLM 的输入和输出。

再来一句断言：
后一个缺点可以通过不断优化 LLM 通过一步步增量去减少人工投入量，前一条需要 LLM 完全超越人类，帮人类提前想好自己想要的做的，帮人类拟定 prompt ，不过这个时候也就没人类什么事了。

2025 年 7 月 8 日

回复了 moxiaowei 创建的主题 › Python › 模型在测试集上的准确率卡在 95%上不去，能想的办法都试过了就是不行，都 3 天了，求各位大佬帮我看下有没有优化的方案！跪谢!

@moxiaowei 如果说是同样的代码的话，你试试其他随机数，每个机器上相同随机数表现应该不同的。

2025 年 7 月 8 日

1.看看测试集是哪几张图不对，是不是异常图。
2.试试正则化手段 dropout ，l1 l2 损失，预先训练权重
不过为啥非要追求 100%呢