V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
jimmyismagic
V2EX  ›  奇思妙想

AI 生成凡尔赛体

  •  
  •   jimmyismagic · 2020-11-16 14:29:08 +08:00 · 5288 次点击
    这是一个创建于 1467 天前的主题,其中的信息可能已经有所发展或是发生改变。
    华为发布了一个纯 GPT 的古诗生成模型,用中文语料预训练,然后用诗词喂进去训练,就能得到效果非常好的古诗词生成器,详见 https://www.huaweicloud.com/ascend/apps/poem

    “特别令人惊讶的是,我们对 GPT 模型没有进行任何定制修改,没有人工输入创作古诗所需要的字数、韵律、平仄、对仗等任何知识,没有定义任何这方面的特征,也没有输入任 何人工编制的词典,系统完全从语料中学到了作诗能力,掌握了这些复杂的作诗技巧。”

    那么我们能不能把网络上的凡尔赛文学体的段子拿过来训练一下,然后让 AI 也能创作这类段子呢?
    18 条回复    2020-11-25 08:41:11 +08:00
    tfdetang
        1
    tfdetang  
       2020-11-16 15:19:06 +08:00
    当然可以,不过训练一套 GPT 所需要的算力成本从 几万-几千万 不等,应该不会有人这么闲吧
    jtacm
        2
    jtacm  
       2020-11-16 15:22:00 +08:00
    训练 GPT 所需的数据和 GPU 都不是个人能承担的。我们顶多拿一些数据做 fine tune,但是效果不一定好(训练数据太少)。

    生成凡尔赛还是不能指望 GPT,这种有明显套话的场景还是 template based 的 solution 比较靠谱。
    jimmyismagic
        3
    jimmyismagic  
    OP
       2020-11-16 19:49:30 +08:00
    @tfdetang 预训练模型要花不少钱,后面的单独训练不需要花太多吧?

    @jtacm 上面的古诗词连平仄都能学的出来,好像 openAI 开放出来的模型也不需要太多继续训练吧
    indev
        4
    indev  
       2020-11-16 23:50:18 +08:00
    [柯南和小兰是一对]

    雅好春风不爱香,幽芳千卉费雕镂。

    清游胜似人无价,佳品殊嫌国有光。

    深院静怜蜂蝶醉,落花轻笑燕鹦狂。

    何如采访同携酒,踏月闲过野水塘。
    treblex
        5
    treblex  
       2020-11-17 13:45:01 +08:00
    诗云
    CaffreySun
        6
    CaffreySun  
       2020-11-17 16:26:35 +08:00
    [闪电五连鞭]

    青蛇飞过白龙潭,

    走马奔来取次看。

    一夕天威动星斗,

    盘鸡平地起风澜
    WhiteLeft
        7
    WhiteLeft  
       2020-11-17 16:38:31 +08:00
    [胭脂水粉术]
    鸦雀枝上飞,无人愿谄媚。
    孔雀开屏后,舔狗一大堆。
    若欲上枝头,则需尽显美。
    胭脂水粉术,助其天上飞。
    WellLee
        8
    WellLee  
       2020-11-17 17:42:53 +08:00
    [年轻人不讲武德]

    壮士旗常事远游,南山石壁久风流。

    身同箭戟三千岁,心在乾坤一点秋。

    顾我尚称前进士,如君合是古诸侯。

    争教独步功名下,未肯低回学钓舟。
    Hanzone
        9
    Hanzone  
       2020-11-17 17:50:57 +08:00
    [耗汁尾汁]

    月蚀霜侵夜转长,星垂河没尚飘汤。

    染余霑在微微白,浸尽明渠一寸凉。

    咽处若随金谷坠,梦时犹作华胥狂。

    从今不入中庸里,免使流离困道傍。
    Smash
        10
    Smash  
       2020-11-17 23:08:23 +08:00
    狗屁不通 doge
    jimmyismagic
        11
    jimmyismagic  
    OP
       2020-11-18 10:19:29 +08:00
    @CaffreySun
    @WhiteLeft
    @WellLee
    @Hanzone
    我落伍了,原来都是马保国
    jishankai
        12
    jishankai  
       2020-11-19 10:04:59 +08:00
    狗屁不同的古诗
    no1xsyzy
        13
    no1xsyzy  
       2020-11-19 13:27:47 +08:00
    GPT 就是典型的狗屁不通故弄玄虚啊……
    not informative at all
    a1gslyghmqnl
        14
    a1gslyghmqnl  
       2020-11-20 18:53:00 +08:00
    这个没对敏感词做限制
    iceytea2
        15
    iceytea2  
       2020-11-21 16:00:17 +08:00
    [闻马保国打闪电五连鞭]

    惊雷几动北山威,天遣神龙应阵奇。

    定是并驱韩信日,会须一战郭汾时。

    机轮有待诸军破,诡遇相如驷马追。

    正值霜风来助急,莫教闲客独吟思。
    nigoteng
        16
    nigoteng  
       2020-11-24 14:41:55 +08:00
    生成的内容跟标题完全不搭啊...都写的啥
    jimmyismagic
        17
    jimmyismagic  
    OP
       2020-11-24 19:24:01 +08:00
    @nigoteng 感觉作的挺好的啊
    BingoXuan
        18
    BingoXuan  
       2020-11-25 08:41:11 +08:00 via Android
    @jimmyismagic
    纯粹是把联想词和按照诗格式输出而已,就联想词的来看确实做得不错,但诗确实是狗屁不通,无意境。比打油诗还要无聊。就如下国际象棋知道棋子怎么走和胜利条件,但开局和战术一窍不通。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2588 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 05:03 · PVG 13:03 · LAX 21:03 · JFK 00:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.