目前靠谱的 AI 模型水平排行榜有哪些？ marena.ai 的 leaderboard 是否值得参考？ - V2EX

Home Sign Up Sign In

This topic created in 577 days ago, the information mentioned may be changed or developed.

目前靠谱的 AI 模型水平排行榜有哪些？ marena.ai 的 leaderboard 是否值得参考？

我看经常有大佬们提及 https://lmarena.ai/?leaderboard ，但是我看 gpt-4o 居然排名第二，比 gpt-o1-preview 和 Claude 3.5 Sonnet 还要强。个人平时用 AI 提问写代码，感觉 gpt-o1-preview 和 Claude 3.5 Sonnet 提供的基本都是可以直接用的，gpt-4o 提供的有时候不能使用。

有没有靠谱的 AI 模型水平排行榜？ marena.ai 的 leaderboard 的排名依据是啥？应该不是生成代码能力吧？

5 replies • 2025-02-17 01:48:02 +08:00

1

eremit

Dec 11, 2024 via Android

2

https://livebench.ai

2

laraws

OP

Dec 11, 2024

@eremit 不错，这个感觉比较靠谱，和我自己的一些使用感觉相符

3

Persimmon08

Dec 11, 2024

我也觉得 gpt4o 写代码的能力不如 o1 ，最近发布会后 4o 的表现更是比不上之前，似乎把算力都分配给 o1 了

4

Liftman

Dec 11, 2024

1

反正都是第一梯队的。这个所谓的排名也只是针对特定情况下的分数。

你看国产模型的名次也不低，但是实际差太远了，全靠拟合。

只能说自己试才知道哪个最好。

5

NianBroken

Feb 17, 2025 via iPhone

@eremit #1 这个数据有点旧了，有没有新的排行榜网站呢？

About · Help · Advertise · Blog · API · FAQ · Solana · 2997 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 38ms · UTC 08:59 · PVG 16:59 · LAX 01:59 · JFK 04:59
♥ Do have faith in what you're doing.