MrLonely's recent timeline updates
MrLonely

MrLonely

V2EX member #127428, joined on 2015-07-16 14:56:09 +08:00
Today's activity rank 26123
MrLonely's recent replies
3 days ago
Replied to a topic by davidyin Local LLM 想折腾一个 AI 主机,请行家出手
@davidyin 显存大小决定能不能跑,GPU 高低决定跑得快慢。
5 days ago
Replied to a topic by kim886 云计算 最便宜的云服务器方案是什么?
OVH 有$0.97 套餐,netcup 有€0.99 套餐,这些付费的应该都是可以长期稳定使用的。不用依赖于特殊的 policy 。
能运行,和运行起来什么性能,是两码事。
@crac 这玩意是真的吗?怎么判断呢?真的手感一模一样的话, 我觉得这个价格能接受。
以前也喜欢折腾这些,还试过黑苹果。但是现在慢慢折腾不动了。因为工作的连续性不允许我的主力电脑有任何一个工作日无法正常工作。羡慕你们依然能从中找到乐趣。
@craftsmanship 占用空间 70%和内存压力 70%是两码事。
@dreamerblue 整机 Reset ,然后把软件一个一个装回来,配置一个一个配好,就没有这个问题了。其实就跟重启大法一样。只不过是个操作一轮两三天的大重启。

但如果想偷懒,用 Time Machine 恢复备份,可不管用。至少对我来说不管用。
Oh? 那岂不是说 Composer 2 是蒸馏了蒸馏 Claude 的模型?
但是这种 app 最后能用组播网络吗?如果用单播,那岂不是带宽负担爆炸?
Mar 14
Replied to a topic by JYii Claude Code 咨询 skill 使用中文英文区别大吗
@andforce 我把你这个问题用中英文两种语言和 Claude ,Grok ,Gemini ,ChatGPT 四个平台,一共八个 conversation ,并且在每种语言的第一轮对话后,把另外三个平台的回复发送给它让重新思考。无法支持你所说的结论。



Grok 是其中分析深度明显更差的,只简单地考虑到了语言本身的编码效率。ChatGPT 思考更完善。最终的结论基本落脚在
1. 对于旧一些的模型,例如 GPT-4 ,Opus3.5 ,英文有明显优势。
2. 更 Modern 一些的模型中英文基本打平,因为在分词器上进行了不同语言的平权优化。
3. 只有国产模型,例如 DeepSeek ,QWen ,在分词器上对中文进行了特殊的加强优化,最终可以实现消耗 Token 更少。
4. Claude 的英文对话的结论是其他模型的结论对于语言平权优化的效果过于乐观。依然认为中文要消耗更多的 Token 。

所以不加定语地说:“结论就是中文消耗 token 更少。“明显是错误结论。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1837 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 16:15 · PVG 00:15 · LAX 09:15 · JFK 12:15
♥ Do have faith in what you're doing.