$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 slowgen 打赏,数额会 100% 进入 slowgen 的钱包。
 slowgen 最近的时间轴更新
slowgen

slowgen

V2EX 第 83209 号会员,加入于 2014-11-23 14:34:54 +08:00
今日活跃度排名 15598
根据 slowgen 的设置,主题列表只有在你登录之后才可查看
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
slowgen 最近回复了
@mewking code 的能力差不多(仅针对我的 Go 和 TypeScript 需求),agent 的话 Qwen3-Coder-Next 差一点。
最近在搞创意类的东西,Step-3.5-Flash 的创意非常差,MiniMax M2.5 好很多。

现在的模型根本测不完……今天凌晨 Qwen3.5 中等型号发布,Qwen3.5-35B-A3B 直接打上一代 235B ,4bit 量化还几乎无损,太夸张了……去年还有很多项目是基于 235B 跑的,现在成本直接暴降了,等年底这个尺寸的模型不知道又能暴打什么了。

试想一下今年年初的 Qwen3.5-397B-A17B 水平的模型明年被 35B 尺寸的模型打,还被刻到本贴的芯片里,直接上万 token/s 输出的话,都不敢想能拿来做什么。
煎东西粘锅肯定是温度不够,温度不够的原因大概率是因为没吸干肉表面的水分,有水进去温度就不够容易粘,而且也不容易发生美拉德反应(毕竟水温上限也就 100 度)。
或者你参考冷煎法: https://www.bilibili.com/video/BV1jUmbBFEhZ 反向利用粘的特性,煎好的那一面自己会脱落,然后就可以翻面了,非常简单。
我以前也是用不粘锅,后面看了铁锅不沾的原理之后就都是用铁锅了,所谓的养锅都是物理化学没学好也不知道底层原理所以口口相传搞出来的,压根不需要养,大胆用洗洁精就完事了。https://www.bilibili.com/video/BV1yhpjeKETT/
这才第一款,刻了个老得不行的 LLama3.1 8B ,要知道去年 Qwen3 30B A3B 2507 系列和 GPT-OSS-20B 系列在对话任务上就很能打了(对话模式下写 Go 的准确性很高)。

如果它能塞下 Qwen3-Coder-Next 这个 80B 的模型,甚至 196B 的 Step-3.5-Flash ,整机定价低于 3 万都算白菜价了(对比苹果官翻的 M2 Ultra 192GB )。这个时候应该考虑的是当 token 成本趋于 0 的时候用来干什么了。
1 月 29 日
回复了 summerLast 创建的主题 Local LLM 30B 尺寸哪个小模型编码能力会好一些
GLM-4.7-Flash
1 月 21 日
回复了 yifangtongxing28 创建的主题 Local LLM 个人玩 ai,显卡最低起步是 5080 嘛?
@yifangtongxing28 大显存 + 凑多张,比如 4 张 4090 魔改的 48G ,或者 4 张 5090 32G ,或者 RTX PRO 6000 96G 。
算力差不多就够用了,举个例子,5 秒总帧数 81 帧的 480x480 视频,在 M2 Ultra 要 1 小时,一张 2080ti 22g 要 120 秒,一张 7900XTX 也是 120 秒左右,一张 5090 就只需 20 多秒,一张 H20 也是 20 多秒。
但是如果你要做 1080x720 分辨率的视频,差距就更大了,因为一张卡的显存可能会爆,比如你用 LTX2 这个能同时生成声音的模型,一张卡也不够用了,除非用社区的量化方案。不同量化程度的方案出来的画质也不一样,需要自己去评估的。
我现在做短剧,一人用一张 H20 ,做 5 秒的精细镜头,单张显卡的显存占用就来到了 70G 。
1 月 21 日
回复了 yifangtongxing28 创建的主题 Local LLM 个人玩 ai,显卡最低起步是 5080 嘛?
16g 在 AI 眼里是电子垃圾,你这个价格买两张 2080ti 22g 或者 7900xtx 24g 都更好,能退就退了。不信邪的话去 autodl 租个 4090 或者 5090 跑 comfyui 生成 720p 规格,一秒 15 帧,持续 5 秒的视频,看 nvidia-smi 显存占用。

目前买 API 便宜的只针对 LLM 和图片类,要是玩视频那是贵上天的,重度使用要么租卡要么自己买卡。
1 月 15 日
回复了 after1990s 创建的主题 Local LLM intel b60 48G 可以买吗
这个售价飘了,不如 2 张 AMD 的 7900XTX
A4YJGZtiFZJywxC3vmK7aJngFJWCotVLbfFQ5TgvaAwx 感谢
2025 年 12 月 3 日
回复了 fingers 创建的主题 问与答 AI 分析视频的底层逻辑是什么,成本有多高?
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3596 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 10:43 · PVG 18:43 · LAX 02:43 · JFK 05:43
♥ Do have faith in what you're doing.