V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
VulcanEon
V2EX  ›  人工智能

简单聊聊刚开源的 Gemma 4,顺便做个免折腾的体验小站

  •  
  •   VulcanEon · 13 小时 57 分钟前 · 396 次点击

    简单聊聊刚开源的 Gemma 4 ,顺便做个免折腾的体验小站

    大家好,前两天 Google 刚发布了 Gemma 4 系列模型,这几天上手看了一下,感觉这次的更新确实有点东西。简单和大家分享几个我觉得比较值得关注的点。

    Gemma 4 到底有哪些亮点? 这次最大的感觉是基础能力和生态都给得很足,依然是 Apache 2.0 商用友好开源:

    • 原生多模态:不再只是纯文本,这次原生支持了视觉和音频数据的处理。
    • 256K 超长上下文:在开源阵营里直接给到这个窗口非常良心,很适合用来做长篇内容的总结和检索。
    • **主打 Agentic (智能体)**:大幅强化了复杂逻辑推理和离线代码生成能力,官方定位它非常适合用来跑多步骤的 Agent 任务流。
    • 尺寸全覆盖:从小杯的 E2B 、E4B (这两款也是下一代端侧 Gemini Nano 4 的底子),到大杯的 31B 和 26B MoE ,不论是边缘计算还是云端重负载都有得选。

    目前哪里能调到 API ?

    • 官方接口:Google Cloud Vertex AI 上已经全面上线,可以去开 Endpoint 。
    • 本地与开源生态:这次是发布即首发支持了全家桶,算力够的话直接用 vLLM 、Ollama 、LM Studio 或者 Hugging Face 跑本地推理就行。安卓端也上了 ML Kit Prompt API 。

    一个小分享 自己部署模型稍微有点费环境和算力,调 GCP 的接口有时也挺繁琐。如果是只想尝鲜的大佬,我顺手搭了个壳子小站:**gemma4.io**。

    初衷就是接好了 API 提供一个开箱即用的环境。如果大家懒得折腾,欢迎来试试。新注册账号都有 30 点初始积分,足够大家先零成本随便玩玩、测测新模型的水平了。

    小站刚起步比较简陋,如果遇到 Bug 或者有什么建议,欢迎轻喷,非常感谢各位大佬的时间!

    —— HaND


    1 条回复    2026-04-05 11:55:22 +08:00
    kuhung
        1
    kuhung  
       9 小时 41 分钟前
    好奇目前的定价依据,似乎不低诶
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2768 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 13:36 · PVG 21:36 · LAX 06:36 · JFK 09:36
    ♥ Do have faith in what you're doing.