V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
hefish
V2EX  ›  问与答

关于自建大模型

  •  
  •   hefish · 17 天前 · 931 次点击

    领导说要自建一个大模型,所以有几个问题。。 1 、是不是可以基于现有的一些开源大模型来搞 2 、是不是先从 github 上,下载了某个开源大模型,然后下载好预训练的数据,load 起来,能跑起来。。 3 、是不是接下来可以训练一些自定义的数据。。。 4 、训练一般是怎么搞的,有没有相应的文档。。。 5 、自定义的数据是怎么组织的。。有没有相应的文档看看。。。

    4 条回复    2024-12-01 10:01:34 +08:00
    gaobh
        1
    gaobh  
       17 天前 via iPhone
    是为了备案吧,不用训练,直接下载羊驼 3 ,然后重点做敏感词那一套就行了。如果真的公司用或者给用户用的话,先让老板拿出几百万搭一套 GPU 出来吧,没这钱跑不起来你也训练不了
    cowcomic
        2
    cowcomic  
       17 天前
    个人感觉现在大部分说要自建大模型主要还是针对某个领域创建一个相对可以进行宣传的大模型应用,重点还是在商务侧,而不是产品和研发侧,也不是真的训练一个大模型出来
    所以要先搞清楚领导的需求到底是为了干啥
    wangritian
        3
    wangritian  
       17 天前   ❤️ 2
    想复杂了兄弟,搞个开源 10 几 B 的 int4 量化版本跑起来 demo 发给领导即可,服务器先随便租一下按量的
    Seanfuck
        4
    Seanfuck  
       17 天前
    一般是拿开源的当基座训练。
    训练的话,各云平台比如阿里云都有这种服务了,喂一问一答的数据就行了,云平台有格式文档的。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5173 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 77ms · UTC 03:45 · PVG 11:45 · LAX 19:45 · JFK 22:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.