V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
gnash
V2EX  ›  程序员

antigravity 中的模型清单列表都是骗人的, gemini 3 pro 实际是 Gemini 2.0 Flash, claude Opus 4.5 实际是 Claude 3.5 Sonnet

  •  
  •   gnash · 1 月 31 日 · 4120 次点击

    实操:使用 gemini 3 pro(high) 问题:你现在思考用的是哪个模型? 回答:我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash ( Thinking process is powered by Gemini 2.0 Flash )。

    实操:使用 gemini 3 flash 问题:现在是对话模式,你现在思考用的是哪个模型? 回答:我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash ( Thinking process is powered by Gemini 2.0 Flash )。

    实操:使用 claude Opus 4.5(Thinking) 问题:你现在思考用的是哪个模型? 我现在使用的模型是 Claude 3.5 Sonnet (由 Anthropic 开发)。 刚才您切换了模型设置,因此我从 Gemini 2.0 Pro 切换到了 Claude 3.5 Sonnet 。

    太垃圾了,活生生的欺骗,难怪越调 bug 越多。

    发现场景,做了一个功能图片识别文字,我让他用 gemini-2.5-flash 模型,它一直反馈 Google Gemini 系列目前的最新 Flash 版本是 2.0 Flash Experimental (gemini-2.0-flash-exp)。我推测您提到的“2.5”可能是指代这个最新的 2.0 版本(目前尚无官方 2.5 发布)。

    33 条回复    2026-02-01 16:58:25 +08:00
    renchong
        1
    renchong  
       1 月 31 日   ❤️ 1
    谷歌顶不住了,这波估计涌进来的人太多了
    asen001
        2
    asen001  
       1 月 31 日
    最近一个星期,gemini3 pro,连把接口文档丢过去生成一下定义文件( api/*.js )写完都会有错误,还不如 deepseek 网页端
    germain
        3
    germain  
       1 月 31 日
    无法复现
    YanSeven
        4
    YanSeven  
       1 月 31 日   ❤️ 9
    早期我记得使用这种问模型的方式不是说判断不准吗,从什么时候开始,变得可信了。
    metalvest
        5
    metalvest  
       1 月 31 日
    程序员基操:进度条基本全是骗人的
    YanSeven
        6
    YanSeven  
       1 月 31 日   ❤️ 1
    用 antigravity 的至少有一半人是为了用 claudeopus ,给谷歌用破防了。
    QS0x01
        7
    QS0x01  
       1 月 31 日
    反正我没花钱,我觉得有的用就不错了
    freefcw
        8
    freefcw  
       1 月 31 日
    这你也信。。。如果谷歌能够靠其他能力把 sonnet 3.5 的智商优化到 opus 4.5 的水准,那真是功德无量了
    evilcat
        9
    evilcat  
       1 月 31 日
    啊这,刚整的 antigravity 会员
    iorilu
        10
    iorilu  
       1 月 31 日
    opus 表现还是可以的

    但 gemini-pro 基本垃圾, 还不如 gemini-flash
    actopas
        11
    actopas  
       1 月 31 日
    @germain 可以复现确实 3.0flash 是 2.0flash
    zhang2e
        12
    zhang2e  
       1 月 31 日   ❤️ 22
    2026 年了,还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗。
    zjttfs
        13
    zjttfs  
       1 月 31 日
    碰到过一次, 用的 Sonnet 4.5 , 报错返回说 Gemini Pro 网关错误....
    mitu233
        14
    mitu233  
       1 月 31 日   ❤️ 1
    怎么所有人都在用这种方法测试模型? gemini1.5 的时候问他是谁他还会说自己是百度的混元呢,测试模型不是有一堆方法吗看知识库截止日期之类的?
    billzhuang
        15
    billzhuang  
       1 月 31 日 via iPhone   ❤️ 2
    不可能的,OP 你这个方法是不准确的
    msg7086
        16
    msg7086  
       1 月 31 日   ❤️ 1
    你这调教得不行啊。我之前在网页端问 Gemini 他是什么模型,他还告诉我他是 Claude 的呢。
    lscho
        17
    lscho  
       1 月 31 日   ❤️ 2
    2026 年了,还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗?
    NewMoorj
        18
    NewMoorj  
       1 月 31 日   ❤️ 1
    兄弟真把大模型当人了,大模型之间会互相拿对方的数据来训练的,数据流里不认识真实的自己太正常了。
    korvin
        19
    korvin  
       1 月 31 日   ❤️ 1
    今惜是何年~😅
    hash
        20
    hash  
       1 月 31 日   ❤️ 1
    我以为不要问 Transformer 模型你是谁这种常识应该 GPT3 时代大家就明白了
    hanssx
        21
    hanssx  
       1 月 31 日
    这种问法是不对的,实际模型到底是多少,只有背后做的人和少部分人会调优的人知道
    yuuluu
        22
    yuuluu  
       1 月 31 日   ❤️ 1
    日经贴,只能说骗回复你成功了
    kimaky
        23
    kimaky  
       1 月 31 日   ❤️ 1
    antigravity 模型造假吗?
    deplives
        24
    deplives  
       1 月 31 日   ❤️ 1
    6202 年了还有人这么判断模型???
    1351161572
        25
    1351161572  
       1 月 31 日
    你怎么确定这不是大模型幻觉呢
    CodeLaunchur
        26
    CodeLaunchur  
       1 月 31 日
    那么到底怎么判断大模型版本呢?
    acisky
        27
    acisky  
       1 天前
    Antigravity Tools 使用 claude 模型,都映射到了 gemini ,额度也是用的 gemini 的
    YanSeven
        28
    YanSeven  
       1 天前
    @acisky ...google 至少是国际性大厂吧。。。不至于这么没品吧
    qq316107934
        29
    qq316107934  
       1 天前
    额,谷歌前两天刚到发邮件说要把 2.0 系列模型从 GCP 下架了,要用也是 2.5 Flash 啊...
    coolmenu
        30
    coolmenu  
       1 天前
    不能这么判断,可能是基座的训练集,最好你弄个比较难的问题,比较回答,能看的清楚点
    realpg
        31
    realpg  
    PRO
       1 天前
    @lscho #17
    大模型能直接对话的一般会有一个 overwrite 的配置应对这种问题

    一般是写死的配置 且更新了总忘改

    本身也是形象宣传的一种

    这个相对可信的, 因为我用 claude sonnet 时 对话到一半给我报 gemini 的错误代码
    realpg
        32
    realpg  
    PRO
       1 天前
    @qq316107934 #29
    同一系列的版本号不对很常见

    一般在对话网关, 都直接固化一个配置 "我是谁" 本身也是品牌宣传策略的一种

    一般这种是一个独立的覆盖拦截配置 很多时候升级后端对接总忘这种接口

    比如我在 chat 的前端
    给对接 gemini 2.x 做一个配置 我是 gemini 2.0
    给对接 gemini 3.x 做一个配置 我是 gemini 3.0

    当后端 2.0 升级到 2.5 时候 很容易忘了改这个配置里的文字
    ethusdt
        33
    ethusdt  
       1 天前


    即使不清楚,也要做多方面实验。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2660 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 11:50 · PVG 19:50 · LAX 03:50 · JFK 06:50
    ♥ Do have faith in what you're doing.