简单聊聊刚开源的 Gemma 4，顺便做个免折腾的体验小站

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

简单聊聊刚开源的 Gemma 4 ，顺便做个免折腾的体验小站

大家好，前两天 Google 刚发布了 Gemma 4 系列模型，这几天上手看了一下，感觉这次的更新确实有点东西。简单和大家分享几个我觉得比较值得关注的点。

Gemma 4 到底有哪些亮点？ 这次最大的感觉是基础能力和生态都给得很足，依然是 Apache 2.0 商用友好开源：

原生多模态：不再只是纯文本，这次原生支持了视觉和音频数据的处理。
256K 超长上下文：在开源阵营里直接给到这个窗口非常良心，很适合用来做长篇内容的总结和检索。
**主打 Agentic (智能体)**：大幅强化了复杂逻辑推理和离线代码生成能力，官方定位它非常适合用来跑多步骤的 Agent 任务流。
尺寸全覆盖：从小杯的 E2B 、E4B （这两款也是下一代端侧 Gemini Nano 4 的底子），到大杯的 31B 和 26B MoE ，不论是边缘计算还是云端重负载都有得选。

目前哪里能调到 API ？

官方接口：Google Cloud Vertex AI 上已经全面上线，可以去开 Endpoint 。
本地与开源生态：这次是发布即首发支持了全家桶，算力够的话直接用 vLLM 、Ollama 、LM Studio 或者 Hugging Face 跑本地推理就行。安卓端也上了 ML Kit Prompt API 。

一个小分享 自己部署模型稍微有点费环境和算力，调 GCP 的接口有时也挺繁琐。如果是只想尝鲜的大佬，我顺手搭了个壳子小站：**gemma4.io**。

初衷就是接好了 API 提供一个开箱即用的环境。如果大家懒得折腾，欢迎来试试。新注册账号都有 30 点初始积分，足够大家先零成本随便玩玩、测测新模型的水平了。

小站刚起步比较简陋，如果遇到 Bug 或者有什么建议，欢迎轻喷，非常感谢各位大佬的时间！

—— HaND

1 replies • 2026-04-05 11:55:22 +08:00

kuhung

21 days ago

好奇目前的定价依据，似乎不低诶