V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
oldj216
V2EX  ›  问与答

大模型训练数据接口有搞头吗

  •  
  •   oldj216 · 329 天前 · 785 次点击
    这是一个创建于 329 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我发现高质量的大模型训练数据不多,把公开数据集好好清洗,做成付费 api 有搞头吗?

    malusama
        1
    malusama  
       329 天前
    训练数据通过你 api 获取啊?
    还是你就直接卖训练数据。 你这问题是人工清洗成本哪来, 你做的过标注数据的公司吗
    oldj216
        2
    oldj216  
    OP
       329 天前
    @malusama 大模型没那么依赖标注数据,比如把 commoncrawl 的数据做一层清洗整理,往外卖
    me221
        3
    me221  
       329 天前
    「大模型没那么依赖标注数据」
    骗哥们可以,别把你自己也骗了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1488 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 17:26 · PVG 01:26 · LAX 09:26 · JFK 12:26
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.