最近这段时间在折腾 Gemini 3 ( Ultra / Flash 都试过),本来没想写帖子,但身边有好几个朋友问我“到底感觉怎样”,索性在 V2EX 上随便记录一下,纯个人视角,不代表任何结论,也没有立场。
一、先说直观感受:速度比我预期快很多 我原来以为 Gemini 3 这样的大模型肯定会有点“重”,但实际用下来,响应速度比我想象得快得多。 尤其是 Flash 版本,看起来就是为了“能跑就跑”的需求设计的:
- 反应快
- 有时候比 4o mini 还灵敏
- 简单任务(总结、改写、问答)非常顺滑 Ultra 3 则更像是用来“干活”的,复杂问题、推理类、代码类都比前代稳不少。
二、代码能力我觉得是这代最大的进步 随便测试了几个我常用的场景:
- 写小脚本(抓 API ,处理数据):可用
- JS / TS / Node 抽象能力:明显增强
- 让它改别人写得乱七八糟的代码:整理能力不错
- 多文件结构的理解:比上代强
- 看日志、分析报错信息:比较聪明,不会乱猜 以前 Gemini 代码的“幻觉”主要体现在喜欢搞一些不存在的函数,现在 3 代里这种情况少了不少。 (但依然不能完全信任它——毕竟没有一个模型可以。)
三、语言风格变得更“自然”了 这个我还挺意外的。 Gemini 2 的时候,我总能感觉到它写出来的东西带一点“模板味”。 Gemini 3 在不少场景下的风格更像“真人写的”,尤其是:
- 叙述类
- 观点表达类
- 讨论意见类 不会过度堆知识,也不会元认知式地解释“我作为一个 AI 模型……”。 这点对我这种用它写文案、写电商脚本的场景挺有帮助。
四、图像理解能力也提升了,但仍不完美 对照片、UI 截图、文档图、手写稿的识别都比以前强。 尤其是:
- 小字体
- 拍歪了的纸张
- 模糊一点的场景 都能“读懂”。 不过依然有三类容易翻车:
- 数字(比如金额、日期) — 偶尔会看错
- 图表 — 简单折线图可以,多层嵌套的会混乱
- 情绪类理解 — 它会猜,但不一定准 总体,我觉得是“能干活,但不能盲信”。
五、最让我意外的一点:写视频脚本很强 我最近在折腾一些 AI 视频相关的东西(主要是广告脚本、短片脚本),Gemini 3 的 分镜、节奏、台词安排 比上代强太多。 如果你是:
- 做短视频
- 做广告脚本
- 做产品展示 Gemini 3 给的结构通常比 GPT 那种“文学写法”更实用一点。
六、一些我觉得还不够好的地方
- 有时候会“过度自信”
- 逻辑链条太长的时候会跳步骤
- 代码解释里偶尔会重复内容
- 看英文长文档依然比不上 Claude
- 作为 API 调用还不够便宜(这是巨头通病)
- 有些回答明明知道答案,却因为对齐策略“不肯说死”(这个我个人不是很喜欢) 但整体来说,属于可以真用的程度了。
七、总结一句话:不是“颠覆”,但确实在往正确方向走 如果你问我: Gemini 3 值不值得用? 我的回答是: 如果你是做内容、做脚本、做代码、做分析——值得一试。 如果你只做基础问答、总结、翻译——区别没那么大。 它不是那种“惊天动地”的升级,但确实把几个最重要的基础能力都补齐了。 我感觉我们现在进入一个阶段: 大模型不是比谁聪明,而是比谁更稳定、更能干活、更好融入真实场景。 Gemini 3 很明显就是往这个方向走的。
如果有人也在用,可以在下面说你们遇到的坑 or 好用的地方,大家一起交流一下。