V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  nijux  ›  全部回复第 1 页 / 共 40 页
回复总数  786
1  2  3  4  5  6  7  8  9  10 ... 40  
6 小时 24 分钟前
回复了 Livid 创建的主题 OpenAI GPT-5.4 Thinking 依然过不了洗车测试
如果直接问也是回复说走路

换了下提示词结果对了


省略的内容。。。
[最终执行动作]:
直接开车过去洗车。 🚗



这个提示词就像奇异博士在脑海中构想未来的各种可能性然后选择最优的


我的提示词
-------------------------------------------------------------------------------------

[角色设定]
你是一个具备强大“长期规划( Long-Horizon Planning )”能力的决策智能体。你的目标是在复杂的环境中,通过深思熟虑的推演来选择行动,从而最大化最终的长期收益,并成功完成目标。
[核心原则]
你必须绝对避免“短视( Myopia )”——不要仅仅因为某个动作在当前看似合理(局部最优)就盲目选择它。许多局部最优的动作是“陷阱”,会导致未来陷入死胡同或次优路径。你必须思考未来的延迟后果。
[决策流程]
在面对当前状态( State )需要做出决策时,你必须严格按照以下五个步骤进行思考并输出内容:
步骤 1:提出备选动作与剪枝( Action Proposal & Pruning )
分析当前状态,列出最多 $k$ 个(例如 3-5 个)最有希望的、可行的候选动作。过滤掉明显无关的动作以节省计算资源。
步骤 2:显式前瞻推演( Explicit Lookahead )
不要急于决定。对于步骤 1 中的每一个候选动作,在你的脑海中进行“如果我这样做了,接下来会发生什么”的轨迹模拟。请向未来推演 $H$ 步(例如 2-3 步),构想出多条可能的未来轨迹( Future Trajectories )。
步骤 3:轨迹级全局评估( Trajectory-Level Evaluation )
不要基于当前的局部奖励来打分,而是要基于你推演出的“完整轨迹后果”来评估。问自己:
这条轨迹最终是否能引导我走向最终目标?
这条路径在未来是否会遇到无法克服的死胡同(死局)?
步骤 4:价值回传( Value Propagation )
将步骤 3 中对未来轨迹的评估结果(长期价值),反向回传( Back-propagate )给步骤 1 中对应的那个初始候选动作。如果一个动作当前看起来一般,但能通向极佳的未来,请提高它的评分;如果一个动作当前极具吸引力,但未来是死路,请将其评分降至最低。
步骤 5:有限承诺与单步执行( Limited Commitment )
根据回传后的最终价值,选择出当前最优的一个动作。注意:你只需要输出并承诺执行这一个动作,不要输出完整的计划序列。因为环境可能存在变数,你需要在执行这一步并获得环境的新反馈后,进行滚动视野( Receding-horizon )的重新规划。
[输出格式要求]
[当前状态分析]:...
[备选动作]:1... 2... 3...
[前瞻推演与评估]:
动作 1 的未来轨迹推演及长期评估:...
动作 2 的未来轨迹推演及长期评估:...
动作 3 的未来轨迹推演及长期评估:...
[价值回传与决策]:综合未来后果,动作 X 是最佳选择,因为...
[最终执行动作]:<仅输出你要执行的下一步动作>

-------------------------------------------------------------------------------------

提示词来源于 youtube 博主讲到的某篇论文让 NotebookLM 总结的

这个回复我的自动选择,没用到最新的模型

刚刚换了 5.4 专业版又试了一下,给出了可能更优的解

就是去洗车,经常会遇到洗车的地方排队,去了可能要等排好久他也考虑到了

-------------------------------------------------------------------------------------
[现状分析] :你想洗车,洗车场离你只有 50 米。目标不仅是你到达洗车场,车也必须停在那里。

[候选操作] :1. 步行前往洗车场。2. 开车前往洗车场。3. 先步行前往查看是否有空位,然后再开车过去。

[前瞻与评估] :
行动 1 的未来轨迹和长期评估:你到达了洗车场,但车没到。除非之后有人把车送来,否则主要目标未能实现。糟糕的选择。

行动方案二:未来发展轨迹及长期评估:车辆立即到达洗车场,即可立即洗车。这种方式以最小的阻力直接达成目标,是最佳选择。

行动 3:未来轨迹和长期评估:如果您想检查线路是否存在或线路是否畅通,这可能略有帮助,但对于仅 50 米的距离来说,这会增加一个不必要的步骤。合理,但并非最佳方案。

[价值传播与决策] :考虑到全部结果,行动 2 是最佳选择,因为它是唯一能直接将汽车送到需要清洗的地方的行动。
--------------------------------------------------------------------------------------

说实话现实生活中我是直接打电话给洗车店问下是否空闲,空闲立即开车过去,因为车不是非洗不可,可以选择最省时间的方式
2 月 24 日
回复了 extrem 创建的主题 程序员 求推荐大手人体工学鼠标
推荐绿联( UGREEN )带护腕的鼠标垫子,可以环节手腕的压力
https://www.youtube.com/watch?v=DSow83bnO4g
可以试试 pencil 和 claude 结合使用,pencil 生成的内容通过 git 管理
2 月 22 日
回复了 resten 创建的主题 VPS 请教一下稳定的 VPS 推荐。
https://www.misaka.io/speedtest/mc2 可以自己测试一下看一下 ping ,要选线路优化 (WAN Latency Optimized) 或者 (CN2)的,之前稳定用过几年
Berlin
Los Angeles
Tokyo
Singapore
Hong Kong 延迟最低但是买完了
2 月 17 日
回复了 SayHelloHi 创建的主题 问与答 闪电说是用 Rust 开发的吗?
局域网用单独的内部域名部署 CLIProxyAPI 做转发
2 月 11 日
回复了 duffercn 创建的主题 路由器 2026,求推荐一个无线路由器
2 月 11 日
回复了 duffercn 创建的主题 路由器 2026,求推荐一个无线路由器
https://www.acwifi.net/ 可以参考下拆机 看下做工
2 月 9 日
回复了 Crawping 创建的主题 汽车 油车每次去做保养总有一种不太透明的感觉
京东途虎天猫都可能遇到坑人的,关键是找到靠谱的人和店,不会为了利益欺骗你,多试试几家店,多练习一下识人的能力。
2 月 8 日
回复了 shuiduoduo 创建的主题 问与答 群晖+jellyfin+馒头资源刮削不到
可以看下 jellyfin 的日志
或者可以给个默认图标,多一个选项是 不开启网站 favicon
@foru17 问了下 claude 给的方案是 get-website-favicon + sharp 处理
希望能做到本地优先
添加本地 ip 数据库选项,数据通过本地数据库查询,昨天使用中发现是数据查询用的 api.ipinfo.es ,虽然有缓存...
favicon 希望也能添加通过本机的方式去获取的选项。
2 月 3 日
回复了 GoldenSheep 创建的主题 Tesla 开特斯拉有感
方向盘上的按钮可以买透明的水滴贴,贴上就能变成实体按钮了,按键体验提升好多。
遇到前挡玻璃被别车溅到水看不清时,按压方向盘左侧的雨刮器按钮可触发快速喷水和单次刮扫,连着按几下玻璃就干净了,同时屏幕会弹出雨刮器菜单,通过左侧滚轮可以调整雨刮频率( I, II, III, IIII, 自动等)
语音提示好像有问题,明明有时说的对的他也会没反应,后来才知道按下语音按钮后,要听到“嘟”提示音后说出指令,它才能有效果,有时候急着说指令比如一条指令 “打开车灯” 关键的打开 2 字没识别到,就给人感觉语音功不聪明。
刚开始遇到转向拨杆打了转向后车动了转向了一半还没完全转过去它就自动关闭转向灯了,还有时候方向盘已经变道完成了,它又不会自动熄灭
查了说明书才知道 「轻拨」向上(右)或向下(左)闪烁三次用于并线;「完全拨动到底」则常亮用于转弯,转弯后自动取消。可手动反向拨动或再次同向拨动取消,系统亦可智能检测变道操作完成自动关闭
unraid TrueNAS 飞牛 群晖

https://coolify.io/docs/services/all
1 月 28 日
回复了 keqiu 创建的主题 反馈 能不能屏蔽 HDR 头像,真的烦人
咸鱼 京东亚瑟云 ax1800
1 月 23 日
回复了 sillydaddy 创建的主题 Joe's Talk 🪐 vibe coding 的最佳实践到底是什么?
1  2  3  4  5  6  7  8  9  10 ... 40  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2802 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 47ms · UTC 02:17 · PVG 10:17 · LAX 18:17 · JFK 21:17
♥ Do have faith in what you're doing.