V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dwhh
V2EX  ›  分享发现

目前我已知的 ai 排行榜, 那个是更可信的, 国内 ai 哪个是体验接近的

  •  
  •   dwhh · 4 小时 44 分钟前 · 417 次点击
    第 1 条附言  ·  4 小时 9 分钟前
    第 2 条附言  ·  2 小时 41 分钟前
    (arena)用一段简单代码对比测试(prompt 由 claude opus 生成, 不完全测试), 简单评价(模型均为最新最好)一下:
    顶级: claude > chatgpt
    优等: gemini > grok
    对比 1: glm-5 > qwen
    对比 2: kimi > longcat mimo
    劣等: 豆包, deepseek, minimax, ernie

    推荐使用方式:
    关注模型评测网站, 选择表现好的实际网站, 在实际网站上选择表现好的最新最好模型, 不要使用快速模式.
    生活化选择手机的语音 ai 或者豆包/品牌自带, 工作用顶级优等模型, 学习用优等及国产顶级模型, 龙虾关注次等模型厂商的 coding plan, 不要关注过于小众表现差的模型.
    2 条回复    2026-04-03 19:06:18 +08:00
    avenger
        1
    avenger  
       4 小时 20 分钟前
    kuhung
        2
    kuhung  
       4 小时 10 分钟前
    我认为 arena 的主观打分盲测更靠谱 只要有排行,就免不了那啥
    要不就是使用主流最新模型,其他的看看就得了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2544 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 15:16 · PVG 23:16 · LAX 08:16 · JFK 11:16
    ♥ Do have faith in what you're doing.