1
Fike 7 天前 via iPhone
poe
|
3
mumbler 7 天前 1
|
6
mumbler 7 天前
@laraws #5 排名比 o1-preview 也高,o1 满血版还没参加评测,你可以自己看 https://lmarena.ai/?leaderboard 的排行榜,这是依赖人工盲测的,目前业内最权威的排行榜
|
7
liulicaixiao 7 天前
再注册一个账号,我就是这么干的哈哈
|
8
wweerrgtc 7 天前
|
9
laraws 7 天前
@mumbler 感谢分享。但是我有点疑惑这个排行榜,上面 4o 排名第二,比 o1-preview 和 Claude 3.5 Sonnet 都强,但是我看上面评论 4o 比较垃圾啊
|
11
mumbler 7 天前
@laraws #9 lmsys 排行榜还有各个领域的子榜,代码,中文,长文理解各种场景下的排名,4o 通用能力还是 openai 的头牌,o1 只适合零知识推理场景,问个搜索引擎的问题没 4o 回答得好
|
13
tita007 6 天前
Sign up again with a new email address.
Avoid frequent changes to your IP address. Make sure the IP address you select is from one of the officially authorized places. |