V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
akjarjash
V2EX  ›  OpenAI

Gemini Advanced 一如既往,还是挺垃圾的🤣🤣🤣

  •  
  •   akjarjash · 286 天前 · 3716 次点击
    这是一个创建于 286 天前的主题,其中的信息可能已经有所发展或是发生改变。
    今天看到可以绑定而且还前两个月免费,于是就绑定试用了下,那是啥呀,真的很垃圾👎👎👎
    37 条回复    2024-02-20 14:19:54 +08:00
    kebamt
        1
    kebamt  
       286 天前
    图都没有无能狂怒?
    kebamt
        2
    kebamt  
       286 天前
    图都没有,无能狂怒?
    int80
        3
    int80  
       286 天前 via Android   ❤️ 12
    楼主以往的帖子,这就解释得通了:

    OpenAI • akjarjash
    Gemini Advanced 一如既往,还是挺垃圾的🤣🤣🤣
    4 小时 55 分钟前 • 最后回复来自 kebamt 2
    OpenAI • akjarjash
    试用了一下感觉 Bard 真的可以称得上是二傻子了 简直弱智
    63 天前 • 最后回复来自 akjarjash 2
    OpenAI • akjarjash
    如何看待文心一言专业版(4.0)定价 59.9 元/月
    98 天前 • 最后回复来自 bestkayle 123
    程序员 • akjarjash
    我已经测试了百度文心一言 4.0 模型,效果很好👍🏻👍🏻👍🏻
    114 天前 • 最后回复来自 akjarjash 8
    程序员 • akjarjash
    文心一言 4.0 大模型发布了,你们用着感觉怎么样? 有没有已经申请通过体验的?
    114 天前 • 最后回复来自 FrankAdler
    akjarjash
        4
    akjarjash  
    OP
       286 天前
    @int80 用事实说话

    我都不用贴图,你们直接测试

    我要上银行存款,打算每年都存 10 万元,假设银行的年利率是 1.5%,那么本金和利息最快多长时间账户总额能达到 80 万?
    akjarjash
        5
    akjarjash  
    OP
       286 天前
    @kebamt 你们再试试智谱清言的 chatglm4 回答最快 8 年,你们都可以直接测试
    akjarjash
        6
    akjarjash  
    OP
       286 天前
    @int80 你们再试试智谱清言的 chatglm4 回答最快 8 年,你们都可以直接测试
    snw
        7
    snw  
       286 天前
    没试付费版。Gemini 免费版中文确实不行,不过如果是英文倒是可以……

    "Suppose bank annual interest rate is 1.5%. If I deposit $100k in my bank account every year, how long does my bank account balance take to reach $800k?"
    showgood163
        8
    showgood163  
       286 天前
    “用事实说话”

    chatglm4 可还行,官方自己都没有计划的

    https://github.com/THUDM/ChatGLM3/discussions/773

    再看楼上对楼主的发帖总结,拉黑了
    ffgrinder
        9
    ffgrinder  
       286 天前
    Gemeni Advanced 感觉奇奇怪怪的,是一种介于 ChatGPT3.5 和 4 之间的产物。一方面它有 Vision 功能,用了一下还不错,各种功能的完成度比 ChatGPT 4 高,但是另一方面作为大模型最基本的回答问题的能力停留在 3.5Turbo 阶段。 目前看付费是不值得的。
    akjarjash
        10
    akjarjash  
    OP
       286 天前
    @ffgrinder 对 感觉一样 目前最强的还是 OpenAI
    akjarjash
        11
    akjarjash  
    OP
       286 天前
    @showgood163 看实测看实测
    hanqian
        12
    hanqian  
       286 天前   ❤️ 1
    你拿中文测的? It is available and optimized only for English with our Ultra 1.0 model, but can respond to queries in other languages that Gemini is available in.

    中文本来就没用上 Gemini Ultra 模型。
    taotaodaddy
        13
    taotaodaddy  
       286 天前
    @snw 我把你发的这段英文贴到 gemini advance 里,回答是约 3 年
    拉开 draft,有 3 个选择,2 个是约 3 年,1 个是约 8 年
    akjarjash
        14
    akjarjash  
    OP
       286 天前
    @taotaodaddy 可是凭你的直觉 你感觉三年对吗?啧啧啧
    akjarjash
        15
    akjarjash  
    OP
       286 天前
    @taotaodaddy 请大家翻译实测 我用英文实测了下 在手机上是 12 年
    akjarjash
        16
    akjarjash  
    OP
       286 天前
    @akjarjash 抱歉,看了下上下文 评论错对象了原谅我的错误🥲
    SiLenceControL
        17
    SiLenceControL  
       286 天前
    大聪明
    Aaarnold
        18
    Aaarnold  
       286 天前
    @akjarjash 中文没有 gemini ultra
    taotaodaddy
        19
    taotaodaddy  
       286 天前
    @akjarjash 3 年当然不对,但是它毕竟也有 1/3 是 8 年
    然后刷新了一下 draft,这一轮 3 个结果都是 8 年

    如果它没有像 gpt4 一样使用 Code Interpreter 的话,有做错的概率,不能说明它就垃圾
    毕竟数学不是大模型擅长的事
    Aaarnold
        20
    Aaarnold  
       286 天前
    @akjarjash “Based on these calculations, it will take approximately 8 years to reach your target amount of 800,000 yuan.” 这是 advanced 的结果
    Liftman
        21
    Liftman  
       286 天前   ❤️ 7
    不懂 llm 就不要乱黑了。大语言模型的核心是语言表达。说白了就是看完了海量的数字化材料后学人说话而已。任何有关计算的事情和现实存在的问题,其实不管是 gpt 还是 gemini 都可能会错。

    不管是 gpt 还是 gemini 做计算都需要多模态。需要把文字理解之后转换成代码,执行计算后给你答案。

    我测试了一下,gemini 可以正确的回答这个问题,并且制作出正确的表格。

    本身语言模型还是无法知道到底答案是多少。因为这不是九九乘法表。
    没有什么预训练的材料里面能包含列出所有自然数存款的所有有理数利率在所有自然年之后的利息。。这个问题真的无聊到完全不用纠结。没有任何意义。

    llm 要比谁的语言功底好才是真的。谁好谁坏不是一个简单的数学问题能测出来的。需要大量的应用场景对比测试的。

    我日常工作会同时用中文或英文 去 使用 4.0 ,gemini 和国产大模型。各有优点。为了黑而黑真的无聊。
    toobad666
        22
    toobad666  
       286 天前
    用你的文心一言去吧 免费 2 个月的 Gemini ultra 配不上高贵的你
    akjarjash
        23
    akjarjash  
    OP
       285 天前
    @kebamt #1 在论坛网友的帖子中出现的图 https://imgur.com/TyRobwp.jpg 哈哈哈😄
    akjarjash
        24
    akjarjash  
    OP
       285 天前
    akjarjash
        25
    akjarjash  
    OP
       285 天前
    @hanqian #12 但是好像翻译成英文也不是很理想,这是论坛网友的一个帖子中的图片 https://imgur.com/TyRobwp.jpg
    哎 看谷歌发展吧
    FuzzySloth2
        26
    FuzzySloth2  
       285 天前
    我这边用英语三个答案都是 8 年
    NnMmOo
        27
    NnMmOo  
       285 天前
    @int80 建议进来的都 block 楼主
    akjarjash
        28
    akjarjash  
    OP
       285 天前
    @FuzzySloth2 额 好吧 我昨天测试的 给的 12 年
    hanqian
        29
    hanqian  
       285 天前 via iPhone
    @akjarjash 还要观察。第一天的反馈确实有点消极,但我看到越来越多的正面评价例如 https://reddit.com/r/singularity/comments/1ampk5v/an_objective_comparison_of_gemini_ultra_and_gpt4/
    Rnreck
        30
    Rnreck  
       285 天前 via Android
    @akjarjash use english to prove the power of Gemini advanced.not the chinese
    akjarjash
        31
    akjarjash  
    OP
       285 天前
    @hanqian 嗯嗯
    param
        32
    param  
       283 天前 via Android
    这帖会进水深火热吗
    akjarjash
        33
    akjarjash  
    OP
       283 天前
    @param 啥意思 哈哈😄
    randychoi
        34
    randychoi  
       282 天前 via Android
    @akjarjash 意思是帖子不让上论坛首页。
    akjarjash
        35
    akjarjash  
    OP
       281 天前
    @randychoi 哦 好吧😂
    Jame00001
        36
    Jame00001  
       275 天前
    他是只支持英文的,中文还是普通版的性能
    akjarjash
        37
    akjarjash  
    OP
       275 天前
    @Jame00001 #36 嗯嗯 但是我用的沉浸式翻译将我在输入框中输入的中文翻译成英文,然后编程方面好像还是不理想(用的高级版)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2944 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 14:37 · PVG 22:37 · LAX 06:37 · JFK 09:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.