V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
hapsinge
V2EX  ›  问与答

V 友如何看待复旦发布的国内首个类 ChatGPT 模型 MOSS?

  •  
  •   hapsinge · 2023-02-21 10:57:05 +08:00 · 6187 次点击
    这是一个创建于 640 天前的主题,其中的信息可能已经有所发展或是发生改变。
    小苔藓
    55 条回复    2023-04-24 16:06:36 +08:00
    gzyguy
        1
    gzyguy  
       2023-02-21 11:00:47 +08:00   ❤️ 18
    起这个名字就觉得为了热度而来。
    fixxxx
        2
    fixxxx  
       2023-02-21 11:05:10 +08:00
    没有邀请码
    TcDhl
        3
    TcDhl  
       2023-02-21 11:07:06 +08:00
    限制肯定颇多
    对不起, 不符合 xxxx, 不予显示
    hzw
        4
    hzw  
       2023-02-21 11:08:52 +08:00   ❤️ 9
    高校浮夸 可见一斑
    silypie
        5
    silypie  
       2023-02-21 11:11:06 +08:00   ❤️ 1
    实验室没有很多计算资源的,学生的工程技术也应付不了大流量访问
    eason1874
        6
    eason1874  
       2023-02-21 11:12:01 +08:00
    名字蹭热度,技术不知道,现在没账号,没法体验
    cherbim
        7
    cherbim  
       2023-02-21 11:15:20 +08:00   ❤️ 1
    学校哪有大规模计算资源,所以纯属蹭热度的,而且盲猜会很智障
    Alan3
        8
    Alan3  
       2023-02-21 11:17:46 +08:00   ❤️ 1
    非常感谢大家的关注,MOSS 还是一个非常不成熟的模型,距离 ChatGPT 还有很长的路需要走。我们一个学术研究的实验室无法做出和 ChatGPT 能力相近的模型,MOSS 只是想在百亿规模参数上探索和验证 ChatGPT 的技术路线,并且实现各种对话能力
    Alan3
        9
    Alan3  
       2023-02-21 11:17:54 +08:00
    cherbim
        10
    cherbim  
       2023-02-21 11:19:25 +08:00   ❤️ 5
    哈哈哈哈,我就怕 MOSS 本质就是一群人在某个小屋子里帮你百度搜索答案
    ostrichb
        11
    ostrichb  
       2023-02-21 11:23:49 +08:00
    这个问题应该出现在知乎 会更精彩
    zxCoder
        12
    zxCoder  
       2023-02-21 11:24:35 +08:00   ❤️ 2
    学术界就这样,这个邱还算是 NLP 大牛呢
    Pastsong
        13
    Pastsong  
       2023-02-21 11:44:16 +08:00   ❤️ 1
    学术界蹭热度的程度严重多了
    ykk
        14
    ykk  
       2023-02-21 11:47:33 +08:00
    模型在哪呢 链接在哪呢? 作为一个 AIGC 从业者,你倒是让我看到模型我再评价啊,不然我评价什么?
    hapsinge
        15
    hapsinge  
    OP
       2023-02-21 12:02:41 +08:00
    @ykk https://moss.fastnlp.top/
    但是必须邀请才可以使用。
    hapsinge
        16
    hapsinge  
    OP
       2023-02-21 12:08:18 +08:00
    @TcDhl 据报道:
    “MOSS 的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。”
    中文支持小,甩锅给互联网环境了。
    LaurelHarmon
        17
    LaurelHarmon  
       2023-02-21 12:09:04 +08:00
    虚空发布吗,希望比画只饼靠谱点
    swulling
        18
    swulling  
       2023-02-21 12:13:01 +08:00
    是骡子是马拉出来溜溜。

    我觉得这种保密发布,贴几个对话截图没有什么意义,学学 chatgpt ,直接公开使用

    至少也得和 bing 一样给大规模发码。
    glfpes
        19
    glfpes  
       2023-02-21 12:16:18 +08:00 via iPhone
    模型整到 hugging face 上,不需要占用预测资源,是骡子是马让大伙看看吧
    dunn
        20
    dunn  
       2023-02-21 12:17:34 +08:00
    没有算力,也就是个智障
    LaurelHarmon
        21
    LaurelHarmon  
       2023-02-21 12:19:10 +08:00   ❤️ 19
    邱总在 ChatGPT 刚发布的时候还怀疑人家是误打误撞搞出来的(参见知乎回复),而且当时他对于 InstructGPT 等技术细节还不是很熟,根本就没有 follow 到最新最前沿的研究进展,只是了解个大概,属于 NLP 各个领域啥都做的样子,你觉得他手下的人会专注大模型这块的研究吗?然而两个月过去后突然上线 demo ,这谁信啊;
    出名后又说什么我们只是学术团队,工程能力欠缺,你代表的可是复旦啊,中国科研的尖尖子,既然敢宣发,就要敢检验,想要名利,就得有两把刷子,欲戴王冠,必承其重。
    tanranran
        22
    tanranran  
       2023-02-21 12:55:51 +08:00
    @hapsinge #15 居然是 flutter 写的网页
    tanranran
        23
    tanranran  
       2023-02-21 12:56:50 +08:00
    中文互联网的数据质量不行,爬取小红书的最后养成一个只会说家人们绝绝子的人工智能,爬取知乎会出一个谢邀钢鞭怪,爬取豆瓣微博会出一个女拳怪,爬取 V2EX ,会出什么?
    hapsinge
        24
    hapsinge  
    OP
       2023-02-21 13:03:52 +08:00
    @tanranran Chatgpt 也没说自己对中文支持的弱。
    cwyalpha
        25
    cwyalpha  
       2023-02-21 13:14:35 +08:00 via iPhone
    看截图的问答还行
    xingye163
        26
    xingye163  
       2023-02-21 13:22:17 +08:00   ❤️ 4
    恶意的猜测可能代码是套西方成品的,不然不可能中文能力弱,说中文环境的话有甩锅嫌疑,西方环境也是大量政治、种族等言论,而且英语是通用语,跨地区,跨国别、跨种族,可能更复杂才对。
    希望是我个人小人之心了。
    imrei
        27
    imrei  
       2023-02-21 13:34:19 +08:00
    人家官方自己说离 ChatGPT 还远,我国做这个要么会巨大成功,要么就是歇菜,没有第三选择
    icyalala
        28
    icyalala  
       2023-02-21 13:37:29 +08:00
    @tanranran chatgpt 正常中文能好好回答。让它用小红书 /微博 /知乎风格来写帖子,或者问它这几个平台发言有什么特点,它也能写出来。说明 chatgpt 训练数据是有这些平台抓取内容的。
    ytll21
        29
    ytll21  
       2023-02-21 13:44:40 +08:00
    挺聪明的做法,先借这个风口拉投资,占住国内的先发优势。至于产品,都说了因为没钱做不出同样的产品,换言之,有钱就肯定行啦。
    callmesmc
        30
    callmesmc  
       2023-02-21 13:47:02 +08:00 via iPhone
    高校有这个财力和资源吗?还不如指望百度...
    areschen
        31
    areschen  
       2023-02-21 13:47:52 +08:00
    一蹭蹭俩热度,啧啧
    itskingname
        32
    itskingname  
       2023-02-21 13:52:53 +08:00   ❤️ 3
    吹牛都不会吹。还搞内测。复旦的教职工和校友那么多,要内测为什么不找他们?直接向互联网公布了,还美其名曰内测,真是坟地里面撒花椒,麻鬼呢。
    zh584728
        33
    zh584728  
       2023-02-21 14:11:56 +08:00
    @tanranran #22 会说: 体制问题
    ershierdu
        34
    ershierdu  
       2023-02-21 14:17:14 +08:00
    - 起这个名没啥问题吧,就像它官网提到的,BERT 也是某个角色的名字。作为面向大众的产品,取一个既能表现自身特点、又有广泛群众基础的名字挺好的
    - 高校确实没有足够的资源去做到像 ChatGPT 那么成熟,但收集用户真实的交互数据是很有用的。例如,对用户提问方式的认知,可以反过来优化模型本身。我以前做过一点跟搜索相关的科研,一个难题就是没有真实的 query 数据集,隐私、合规性等原因导致能拿到这个数据的商业公司不可能把这些数据开源给你用。这应该也是 ChatGPT 在去年没有明确盈利点的情况下提供免费使用的重要原因之一。
    - 对于国内高校提供的工程型平台,我个人觉得鼓励应该多于批评,在当前的环境中还是很难能可贵的
    InvincibleDream
        35
    InvincibleDream  
       2023-02-21 14:32:22 +08:00   ❤️ 4
    BERT 是 Bidirectional Encoder Representations from Transformers 的首字母缩写,MOSS 代表什么意思? Moron-Oriented Search System ?
    wateryessence
        36
    wateryessence  
       2023-02-21 14:41:13 +08:00 via iPhone   ❤️ 6
    复旦有中国研究院提供优质语料,非常看好,winwin
    hapsinge
        37
    hapsinge  
    OP
       2023-02-21 14:54:54 +08:00
    @wateryessence 那为什么还说“MOSS 的最大短板是中文水平不够高”呢?
    iv2usr
        38
    iv2usr  
       2023-02-21 15:00:00 +08:00
    @wateryessence 哈哈哈哈,艹
    wateryessence
        39
    wateryessence  
       2023-02-21 15:01:47 +08:00 via iPhone
    @hapsinge 邱组可能还没想起来内部的优质资源,相信复旦,相信邱老师
    gniviliving
        40
    gniviliving  
       2023-02-21 16:21:20 +08:00
    @callmesmc 指望百度多卖点医疗广告?
    抱歉,魏则西事件永远不会过去!
    javahuang
        41
    javahuang  
       2023-02-21 16:36:21 +08:00   ❤️ 3
    申请了内测,内测的邀请问卷网站竟然是用的我写的 SurveyKing ,很荣幸能做出一点微小的贡献...
    lambdaq
        42
    lambdaq  
       2023-02-21 16:36:40 +08:00
    @hapsinge
    > Chatgpt 也没说自己对中文支持的弱。

    其实说过。不仅弱,而且很弱 /t/917704
    Mark24
        43
    Mark24  
       2023-02-21 16:48:23 +08:00   ❤️ 5
    蹭热度。一蹭蹭两个,Moss 、chatGPT

    chatGPT 训练一次多少费用?!
    openAI 吸引了多少投资? 从 2015 年就一直苟着至今。
    openAI 的算力,微软投了多少 Azure 资源,给了多少优惠券。

    这还不算几亿高质量语料,怎么来,存储、清洗,分析。
    高质量中文语料,光是中文的维基百科都快没了。

    能做出来,我真不信。复旦不吸收投资,打算怎么做?
    根本没有这个土壤。

    最烦装逼的。
    o00o
        44
    o00o  
       2023-02-21 16:53:35 +08:00
    孵蛋教授:不管咋样,MOSS 这个域名我抢注上了🐶
    zhchyu999
        45
    zhchyu999  
       2023-02-21 17:05:31 +08:00
    这都还没见着东西呢,就开始喷上了,生在国内是原罪
    都不能多些宽容么
    wangritian
        46
    wangritian  
       2023-02-21 17:24:24 +08:00   ❤️ 2
    @zhchyu999 你说的情况在其他地方确实普遍存在,但 MOSS 我觉得从起名开始就是蹭热度的
    hapsinge
        47
    hapsinge  
    OP
       2023-02-21 17:59:12 +08:00
    @zhchyu999 难道不正是因为没办法见着东西所以才讨厌蹭热度吗?作为学术研究不更应该沉下去做事吗。
    Bad0Guy
        48
    Bad0Guy  
       2023-02-21 19:50:15 +08:00
    又可以让国内的营销号带一波沸腾的节奏了
    Sting1226
        49
    Sting1226  
       2023-02-21 20:35:17 +08:00
    ChatGPT 最后要么跟 Google 一样被赶走,要么和 Baidu 一样贪得无厌。
    moss 的未来还不明朗。
    BigShot404
        50
    BigShot404  
       2023-02-21 20:53:51 +08:00
    观察者网没必要存在了,B 站输麻了
    Dragonphy
        51
    Dragonphy  
       2023-02-21 21:13:43 +08:00
    这滚动条🤣
    Janji
        52
    Janji  
       2023-02-22 09:34:04 +08:00   ❤️ 3
    @zhchyu999 骗补贴,骗上级,都是常态了,我们也希望能有打脸的,可是没有啊,全是欺上瞒下,鸿蒙系统、国产打飞机、还有这次的 moss ,以及后面百度的 chatgpt......
    wind8866
        53
    wind8866  
       2023-02-22 12:58:14 +08:00
    最关键的是有人用过吗?没见别人发截图啊
    Mark24
        54
    Mark24  
       2023-02-22 14:47:31 +08:00
    @zhchyu999 喷的就是东西还没见到呢,就开始吹了。这怎么宽容? :D
    totoro52
        55
    totoro52  
       2023-04-24 16:06:36 +08:00
    @wind8866 已经开源了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5241 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 08:55 · PVG 16:55 · LAX 00:55 · JFK 03:55
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.