实操:使用 gemini 3 pro(high) 问题:你现在思考用的是哪个模型? 回答:我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash ( Thinking process is powered by Gemini 2.0 Flash )。
实操:使用 gemini 3 flash 问题:现在是对话模式,你现在思考用的是哪个模型? 回答:我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash ( Thinking process is powered by Gemini 2.0 Flash )。
实操:使用 claude Opus 4.5(Thinking) 问题:你现在思考用的是哪个模型? 我现在使用的模型是 Claude 3.5 Sonnet (由 Anthropic 开发)。 刚才您切换了模型设置,因此我从 Gemini 2.0 Pro 切换到了 Claude 3.5 Sonnet 。
太垃圾了,活生生的欺骗,难怪越调 bug 越多。
发现场景,做了一个功能图片识别文字,我让他用 gemini-2.5-flash 模型,它一直反馈 Google Gemini 系列目前的最新 Flash 版本是 2.0 Flash Experimental (gemini-2.0-flash-exp)。我推测您提到的“2.5”可能是指代这个最新的 2.0 版本(目前尚无官方 2.5 发布)。
1
renchong 1 月 31 日 谷歌顶不住了,这波估计涌进来的人太多了
|
2
asen001 1 月 31 日
最近一个星期,gemini3 pro,连把接口文档丢过去生成一下定义文件( api/*.js )写完都会有错误,还不如 deepseek 网页端
|
3
germain 1 月 31 日
无法复现
|
4
YanSeven 1 月 31 日 早期我记得使用这种问模型的方式不是说判断不准吗,从什么时候开始,变得可信了。
|
5
metalvest 1 月 31 日
程序员基操:进度条基本全是骗人的
|
6
YanSeven 1 月 31 日 用 antigravity 的至少有一半人是为了用 claudeopus ,给谷歌用破防了。
|
7
QS0x01 1 月 31 日
反正我没花钱,我觉得有的用就不错了
|
8
freefcw 1 月 31 日
这你也信。。。如果谷歌能够靠其他能力把 sonnet 3.5 的智商优化到 opus 4.5 的水准,那真是功德无量了
|
9
evilcat 1 月 31 日
|
10
iorilu 1 月 31 日
opus 表现还是可以的
但 gemini-pro 基本垃圾, 还不如 gemini-flash |
12
zhang2e 1 月 31 日 2026 年了,还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗。
|
13
zjttfs 1 月 31 日
碰到过一次, 用的 Sonnet 4.5 , 报错返回说 Gemini Pro 网关错误....
|
14
mitu233 1 月 31 日 怎么所有人都在用这种方法测试模型? gemini1.5 的时候问他是谁他还会说自己是百度的混元呢,测试模型不是有一堆方法吗看知识库截止日期之类的?
|
15
billzhuang 1 月 31 日 via iPhone 不可能的,OP 你这个方法是不准确的
|
16
msg7086 1 月 31 日 你这调教得不行啊。我之前在网页端问 Gemini 他是什么模型,他还告诉我他是 Claude 的呢。
|
17
lscho 1 月 31 日 2026 年了,还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗?
|
18
NewMoorj 1 月 31 日 兄弟真把大模型当人了,大模型之间会互相拿对方的数据来训练的,数据流里不认识真实的自己太正常了。
|
19
korvin 1 月 31 日 今惜是何年~😅
|
20
hash 1 月 31 日 我以为不要问 Transformer 模型你是谁这种常识应该 GPT3 时代大家就明白了
|
21
hanssx 1 月 31 日
这种问法是不对的,实际模型到底是多少,只有背后做的人和少部分人会调优的人知道
|
22
yuuluu 1 月 31 日 日经贴,只能说骗回复你成功了
|
23
kimaky 1 月 31 日 antigravity 模型造假吗?
|
24
deplives 1 月 31 日 6202 年了还有人这么判断模型???
|
25
1351161572 1 月 31 日
你怎么确定这不是大模型幻觉呢
|
26
CodeLaunchur 1 月 31 日
那么到底怎么判断大模型版本呢?
|
27
acisky 1 天前
Antigravity Tools 使用 claude 模型,都映射到了 gemini ,额度也是用的 gemini 的
|
29
qq316107934 1 天前
额,谷歌前两天刚到发邮件说要把 2.0 系列模型从 GCP 下架了,要用也是 2.5 Flash 啊...
|
30
coolmenu 1 天前
不能这么判断,可能是基座的训练集,最好你弄个比较难的问题,比较回答,能看的清楚点
|
31
realpg PRO @lscho #17
大模型能直接对话的一般会有一个 overwrite 的配置应对这种问题 一般是写死的配置 且更新了总忘改 本身也是形象宣传的一种 这个相对可信的, 因为我用 claude sonnet 时 对话到一半给我报 gemini 的错误代码 |
32
realpg PRO @qq316107934 #29
同一系列的版本号不对很常见 一般在对话网关, 都直接固化一个配置 "我是谁" 本身也是品牌宣传策略的一种 一般这种是一个独立的覆盖拦截配置 很多时候升级后端对接总忘这种接口 比如我在 chat 的前端 给对接 gemini 2.x 做一个配置 我是 gemini 2.0 给对接 gemini 3.x 做一个配置 我是 gemini 3.0 当后端 2.0 升级到 2.5 时候 很容易忘了改这个配置里的文字 |
33
ethusdt 1 天前
|