做了个 Gemma 4 本地部署的硬件匹配工具，求各位大佬指点

爱意满满的作品展示区。

This topic created in 98 days ago, the information mentioned may be changed or developed.

最近对 Gemma 4 感兴趣，发现一个问题：模型版本太多了（ E2B 、E4B 、26B MoE 、31B Dense ），每个对硬件要求都不一样，看群里经常有人问"我这个配置能不能跑 xx 模型"。

自己踩了一圈坑之后，把经验整理成了一个小工具：

→ 自动检测你的 GPU （ WebGPU/WebGL ，不需要装任何东西） → 根据你的硬件推荐最合适的模型 + 量化方案 → 直接给 Ollama / llama.cpp / Transformers 的运行命令 → Mac 、Windows 、Linux 、手机都覆盖了

纯前端，没有后端，不收集任何数据。

目前数据主要是从 r/LocalLLaMA 和社区 benchmark 整理的，肯定有不准的地方，特别是：

如果各位跑过 Gemma 4 ，欢迎反馈下实际体验，我可以把数据补进去，让推荐更准一些。

5 replies • 2026-04-08 14:18:53 +08:00

y2f0

Apr 8

lume 的 vm 可以检测硬件自动推荐吗？

Barhe

Apr 8

建议再提供一个 curl 调用的模式。

slax

Apr 8

SiddhaDo

Apr 8

@Barhe 数据现在还不多😂

SiddhaDo

Apr 8

@y2f0 这还真没试过