V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lyxxxh2
V2EX  ›  OpenAI

各个 ai 平台稍微复杂的代码测试

  •  
  •   lyxxxh2 · 2 天前 · 369 次点击

    给 ai 的问题

    我有一个 yolov8 模型,路径:/media/duyu/model/have_and_none/runs/detect/train66/weights/best.pt
    训练集路径:train/labels train/images
    验证集路径:val/labels val/labels
    训练集和验证集都是 labelme 软件标注的,标注文件也就是.json 文件,labelme 这个软件挺多人用的,你应该知道。
    有 3 个标签:have none other,对应的 yolov8 就是 0 1 2
    
    现在我需要你根据我提供信息编写验证模型正确率的脚本。
    示例流程:
    1. 推理图片: train/images/1.jpg
    2. 打开图片对应的标注文件,获取标注文件的框。
    3. 将标注的框和推理框进行 iou 匹配,即两个框 iou 有.4,则可以判定为同个框
    4. 如果标注的框都能找到推理框,且标签正确,则判定此张图片没问题。
    5. 没问题就可以结束这张图的处理了
    6. 此时是有问题了,即: 有标注框找不到推理框,或者找到的框标签错误。
    7. 标注框和推理框画在图片上,框左边加上字符串标识
        - 如: "l_have"  "y_none"   (l 代表 labelme 的框  y 代表 yolo 的推理框)
    8. 保存图片到 model_test 文件夹,文件别改变。
     
    请编写脚本
    

    gpt

    https://i.imgur.com/vlYshea.png

    1. import 一堆库,又不使用
    2. 加载模型 torch.load,官方写得那么清楚,国内的 ai 都不会犯这个错。
      • 给我感觉,就是故意恶心人。

    豆包

    https://i.imgur.com/2Xp9rjN.png

    import os 呢??? 我手动给他补上,执行脚本。 https://i.imgur.com/nZAObvG.png 看来对库认知有问题

    通义

    https://i.imgur.com/zETA2WA.png

    连我话都理解错,我只是举例而已。

    感觉就像: 太复杂了,我逃避,忽悠过去得了。

    通义是我印象最差的,来自之前的积累,傻逼的不像话。

    https://i.imgur.com/MHZuRGs.png

    文心

    https://i.imgur.com/RReliS8.png

    1. 上面有 import cv2,又不用,学 gpt 是吧。
    2. arial.ttf 我又没这个文件
    3 条回复    2025-01-17 12:24:39 +08:00
    yiios
        1
    yiios  
       2 天前
    通过 chat 界面来对话测试不太合适,建议直接使用大模型竞技场 https://lmarena.ai/ 来对比测试,没有预制的提示语,更准确。
    PearDecOne
        2
    PearDecOne  
       1 天前
    千问你找错地方了,真正的 Qwen 团队的项目是 qwenlm ,你这是用的是通义千问,落后真正的 Qwen 团队好几个版本迭代
    地址: https://chat.qwenlm.ai/
    lyxxxh2
        3
    lyxxxh2  
    OP
       1 天前
    @PearDecOne
    刚看你消息,原来是我用错姿势了。

    ***
    然后我将旧问题给千问,让我无语,一样智障。


    ```
    1. 3447682963FLOPs
    2. 14243643203FLOPs
    3. 2.7GFLOPs
    4. 2707554304FLOPs
    5. 28600000000FLOPs

    求以上加起来,并换算成 tops 。
    ```
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2726 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 05:19 · PVG 13:19 · LAX 21:19 · JFK 00:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.