目前开源可以本地部署的模型有哪些？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 54 天前的主题，其中的信息可能已经有所发展或是发生改变。

可以瑟瑟的，本地部署，要求 12G 内存以下，或者 16G 勉强上，可以本地部署的模型有哪些比较好用的？

11 条回复 • 2025-12-23 10:31:07 +08:00

neosfung

2025 年 12 月 21 日 via Android

比较简单的计算方法，例如 6B 模型，如果用 BF16 的话，乘以 2 ，就是 12GB 运存（显存/内存）。然后还有激活 activation ，就是我们常说的 KV Cache ，也会随着上下文长度增加，具体不太好估计，得看看是 MHA ，GQA 还是 MLA 结构才知道增长倍数

neosfung

2025 年 12 月 21 日 via Android

好吧，才看到不是语言大模型

euph

2025 年 12 月 21 日 via Android

z-images

miusmile

2025 年 12 月 21 日

“可以瑟瑟的”是什么意思，屌大的解释一下

chanssl

2025 年 12 月 21 日 via Android

crackself

2025 年 12 月 21 日 via Android

难道是 goonsai/qwen2.5-3B-goonsai-nsfw-100k

crackself

2025 年 12 月 21 日 via Android

tomclancy

2025 年 12 月 22 日

借楼问一下 gemma3 27b 怎么解开道德限制

salor

2025 年 12 月 22 日 via iPhone

小体积的模型瑟瑟也是智障，上下文长了就成复读机了，Grok 才是真神。

goodryb

2025 年 12 月 22 日

CraftDeadMRC

2025 年 12 月 23 日

@goodryb qwen-image 是 20b 的，而且文生图的模型计算瓶颈较大，如果 offload 比较多很影响性能。z-image-turbo 相对低要求