$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 sillydaddy 打赏,数额会 100% 进入 sillydaddy 的钱包。
 sillydaddy 最近的时间轴更新
sillydaddy
5.5D
4.58D

sillydaddy

V2EX 第 472822 号会员,加入于 2020-02-27 19:30:20 +08:00
今日活跃度排名 17
MOD
具有移动主题的权限
对 HodlAI 的可持续性的质疑
HodlAI  •  sillydaddy  •  9 天前  •  最后回复来自 workbest
24
ARC-AGI 测试这帮人疯了!
  •  1   
    分享发现  •  sillydaddy  •  1 月 29 日  •  最后回复来自 LiuJiang
    3
    vibe coding 的最佳实践到底是什么?
    Joe's Talk 🪐  •  sillydaddy  •  1 月 23 日  •  最后回复来自 goodboy95
    28
    编程已死!
  •  1   
    职场话题  •  sillydaddy  •  2025 年 12 月 31 日  •  最后回复来自 Livid
    63
    让你们的 AI 做做这道题,见真章!
    OpenAI  •  sillydaddy  •  2025 年 12 月 27 日  •  最后回复来自 itechify
    5
    不知不觉 AI 可以算乘法了
    分享发现  •  sillydaddy  •  2025 年 12 月 24 日  •  最后回复来自 sillydaddy
    5
    sillydaddy 最近回复了
    7 小时 13 分钟前
    回复了 SupDigitalOcean 创建的主题 分享创造 带你从头训练一个 LLM
    这个思路很好。不过看了下,似乎透露的信息太少,不登录完全不知道内容是什么,至少把可视化的内容透露出来一些吧。
    8 小时 46 分钟前
    回复了 rayeaster 创建的主题 阅读 看到本有趣的书 准备过年的时候读一读
    答案就在 OP 的头像里 :doge
    同问。我也感觉现在自动化测试是 vibe coding 的核心关键,而限制自动化测试的就是成本。

    我感觉只能等 token 价格下降了。刚试了这个帖子( /t/1192001 )的图片,125KB 左右的一个 jpeg 文件,问里面有几个小人儿,花费了 1 万多的输入 token (这里不排除有系统提示词之类的,但大体是 1 万 token ),说明截图还是很费 token 的,Sonnet4.5 的话大概两三毛钱。

    有没有可能优化一下测试流程,尽量直接一步到位加载目标网页的数据,而不是逐步点击,也就是把测试也模块化,当然我没有做过测试,只是瞎猜。但 token 贵的话,只能人工优化测试流程了。
    14 小时 19 分钟前
    回复了 gogo_tutu 创建的主题 问与答 一个不接受回复的帖子一直置顶?就纯广告呗
    更大的可能是你被版主拉黑了: /t/1192367
    16 小时 25 分钟前
    回复了 Phycheez 创建的主题 随想 你觉得 AI 会把一切以事实为根基的内容创作也替代吗
    @94 付诸行动吗,有些难点:1 是我觉得它是水到渠成的事,到未来真假难辨时,其他商业实体自然会去做,我的主要兴趣也不在那里。2 是那个帖子本意是看个人有哪些**低成本**的相关机会,讨论下来感觉都是硬件、厂商这些基础设施的事,没有太多外溢给个人的机会。
    16 小时 37 分钟前
    回复了 Phycheez 创建的主题 随想 你觉得 AI 会把一切以事实为根基的内容创作也替代吗
    @94 没有任何削弱,反而加强了——事实是空气,无论对人类还是对 AI 。因为它们最终都要活在现实世界中,如《黑客帝国》这部电影讲述的,有几个愿意活在 matrix 的世界里面呢?
    16 小时 40 分钟前
    回复了 buydip 创建的主题 问与答 咨询几个问题
    自建节点有屏蔽功能,你是不是被屏蔽了: /t/1187999
    16 小时 49 分钟前
    回复了 Phycheez 创建的主题 随想 你觉得 AI 会把一切以事实为根基的内容创作也替代吗
    你说的有 2 个层次:

    1 是人类还需不需要从前端来获取信息。肯定需要啊,又没有进化成直接读取 token 和 html 代码。
    2 是前端还需不需要人来参与创建。这个视情况吧:
    2a. AI 实时的动态创建,你给 AI 一个请求,AI 把数据动态拼装起来,再动态生成前端页面展示给你。
    2b. AI 动态拼装太复杂太慢,或者不精确,那么就由用户指令 AI 「培育」一个符合用户喜好的 UI 界面。当然这种培育出来的 UI 都在本地了,也不需要产品开发者去发布了。
    2c. UI 比较具有普适性(每个人用法差不多),或者较为复杂,没有必要每个人用 AI 自己开发一套,费时费钱,那一套打磨好的通用 UI 可能会比较节省成本。每个用户的 AI 可以自己拿过来接手定制,甚至有不同 UI 的竞争。到时候一套 UI 的开发者就会利用这个 UI 的定制授权来盈利。
    我是在 cursor 里面试的。感觉上面的成绩,跟 ARC-AGI 这个图形推理的测试成绩高度相关:

    https://arcprize.org/leaderboard
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1049 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 39ms · UTC 17:53 · PVG 01:53 · LAX 09:53 · JFK 12:53
    ♥ Do have faith in what you're doing.