gemma4:e4b 的效果出乎意料， 1050ti 也能很好的生成文章

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

之前使用 deepseek qwen 在超迷你模型（ 32b 以下）上写小说，基本驴唇不对马嘴。
这次的谷歌的模型确实牛逼了。
本地部署未审查版本，简直就是写文利器

1050ti：

模型

文章

本地

29 replies • 2026-04-07 20:36:15 +08:00

oreader996

22 days ago

体验了下 e4b 还行

andyskaura

22 days ago

@oreader996 不能和全尺寸的比，横向对比真的厉害，感觉这算是大模型真正走进本地电脑了

Shaar

22 days ago

这玩意驱动龙虾够不够用

andyskaura

22 days ago

@Shaar 不够用。太慢太笨

changnet

22 days ago

放一段出来看看是啥样的？我以前试过 30B 左右的本地部署写文章基本没法看

不过就小说而言，我觉得线上的模型写出来的也没法看的，明显不是一个正常人的逻辑思维，用词修饰这些都不行。要是写个短篇再人工改改还行

andyskaura

22 days ago

这个我有经验，做个生成器，

如果要写长篇小说，要和人写一样，先做好提纲，写好角色性格，矛盾。再一次性生成完章节标题和大纲，再根据大纲扩写单个章节。

andyskaura

22 days ago

@changnet 忘了 @

tf2

22 days ago

我 1060 6G 能跑不

Brightt

22 days ago

能写黄文不

kooze

22 days ago

4090 24G 26b 的好快

Brightt

22 days ago

@kooze 效果怎么样老哥，我也想部署个玩玩

andyskaura

22 days ago

@tf2 可以我在公司用 1050ti 4g 做的测试

andyskaura

22 days ago

@Brightt #9 自己部署未审查版本

lemonda

22 days ago

试试可不可以从不规则的文本文件，比如使用 tab 上下对应的文本文件中提取出正确的信息。比如：
username
example
username dataname extname
example1 example2 example3

kooze

22 days ago

@Brightt #11 速度不错，简单测试几个还可以。不过没深入测试，不知道智力如何

andforce

22 days ago via iPhone

@kooze 兄弟试过 31b 吗？

pxiphx891

22 days ago

未审查版本从哪里下载？

villivateur

22 days ago

e4b 不是需要 12G 左右才能跑吗？ 4G 显存是怎么实现的？

kooze

22 days ago

@andforce 我来试试

changnet

22 days ago

@villivateur 这东西内存也可以跑，无非就是速度慢些。用 mac 来跑就是钻这个空子。常用的工具比如 LM studio 之类的都可以配置显存和内存的比例

Tiger1994

22 days ago

笔记本显卡 R760M 能跑吗

andyskaura

22 days ago

@pxiphx891 https://huggingface.co/TrevorJS/gemma-4-E4B-it-uncensored-GGUF 随便找的

andyskaura

22 days ago

@villivateur 我跑的 q4 量化

villivateur

22 days ago

@andyskaura 就是 Q4 量化呀，我试了下，128K context ，需要 16G 左右的显存

burp2019

22 days ago

楼主哪里能看到成品，最近经常刷到 AI 小说，生成的动画

andyskaura

21 days ago

@villivateur #24 那我就不清楚了我没有指定 context ，不过你这 128K 也许设太大了

andforce

21 days ago via iPhone

@kooze 等你好消息

BD8NCF

21 days ago

感谢楼主。
下午在 1050Ti 上跑了一下，发现还可以。只是速度有点慢。

iango

21 days ago

@villivateur 对于 16G 显存 128K context 太大了，从 4K 开始测试，一点点往上拉。