cwcc's recent timeline updates
cwcc

cwcc

V2EX member #530166, joined on 2021-01-24 11:08:01 +08:00
Today's activity rank 1578
五一的『爱达魔都号』邮轮返程回来,说一下体验
旅行  •  cwcc  •  May 7, 2025  •  Lastly replied by cwcc
30
有办法把中国联通的“欢迎使用中国联通业务”屏蔽?
iPhone  •  cwcc  •  Jan 11, 2025  •  Lastly replied by bao3
24
MacBook Air M2 好像有硬件问题
MacBook  •  cwcc  •  Apr 8, 2025  •  Lastly replied by lsvl
1
cwcc's recent replies
倒不是不工作,我觉得人还是不管什么状态下,不能闲着,总要做点什么才行。单纯说自己打算工作到多少岁没什么意义。退休的人都每天逛超市打牌聊天呢,久而久之也算是一种工作了。

但如果单纯地说拿到钱就躺平啥也不干,我觉得没几个人会这么做。就算不继续眼前的工作,也肯定会想办法要么玩、要么旅游、要么做别的事情去了,那就相当于换了一种工作而已。

如果非要问这个问题,倒不如说,你想用劳动换钱到什么时候为止。
May 20
Replied to a topic by YanSeven Claude Code claude code 突然日文跟我对话
我用 Copilot 的 Claude 模型也是会有这个问题,感觉像是模型的问题。
@YanSeven 显卡+主机不好移动啊。
May 17
Replied to a topic by Karlbaey 问与答 国内的企业是压根不在乎域名吗
@tars13344 结果阿里还把饿了么改名淘宝闪购了
May 17
Replied to a topic by Karlbaey 问与答 国内的企业是压根不在乎域名吗
感觉 pointer 开发 web 应用更加习惯,如果使用 web 开发桌面应用的话 pointer 能省则省。
DeepSeek 叫 DeepSeek ,不叫 WideSeek ,说明了什么。
不是算力的问题,是显存太紧张了,只能跑个 7b 左右的才能达到每秒 70-100tok 的速度,跑更大模型受限的情况瓶颈基本全在 PCIe 带宽和显存上。

真要横向比较的话,我自己的 36G 的 MacBook Pro 能跑 qwen3.6035b-a3b 模型,每秒能到 30token ,但长上下文直接把内存撑爆死机;相比我的 5060Ti 只能直接跑小模型,或者 CPU 混合计算下利用 64G 的 RAM 能以很慢的速度跑很大的模型也不会爆内存死机。总之各有各的瓶颈,你得知道自己的硬件瓶颈在哪里。
说白了还是要解决一个 Agent 的根本问题:有限的显存空间和膨胀的上下文之间的问题。不过模型的拆分确实能更好地解决一个复杂项目下上下文爆炸的问题,不管是大模型还是小模型。这点我甚至感觉可以通过优化现有的 Copilot 、Copilot 、Roo Code 等 prompt 和 tool call 实现,比如加入 subagent 、优化子项目流程、自动 compact context 等。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1155 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms · UTC 18:01 · PVG 02:01 · LAX 11:01 · JFK 14:01
♥ Do have faith in what you're doing.