V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
yushuxin
V2EX  ›  分享创造

AnyVoice - 3 秒语音即可克隆的任何声音,用你朋友的声音回复她的语音消息

  •  
  •   yushuxin · 21 小时 38 分钟前 · 2807 次点击

    老铁们好!最近搞了一个 AI 克隆声音产品,只需要 3 秒的原始语音,就可以克隆音色!在这里想跟大家分享一下。

    事情是这样的: 我一个朋友老给我发语音,我想调戏一下她,想着能不能用她自己的声音回复她?正好现在 AI 技术成熟了,我就做了一个,哈哈哈,可好玩了。

    来试试看吧

    https://anyvoice.net/ai-voice-cloning

    是什么让 AnyVoice 与众不同?

    • 只需 3 秒音频就可以复刻! 没错,就是这么简单。你在网页界面里录个"今天天气真好,我们晚上去吃火锅吧"的就够了,随便说点什么都行。网上其他方案动辄要求录音几十句话,谁有耐心啊...

    • 支持中日韩英四种语言:测试下来,中文效果特别自然,连我朋友听到这个声音时,自己都吓傻了,觉得是被电话诈骗了

    实际使用场景分享

    1. 调戏朋友:用朋友的声音,回复她的语音消息。你只需要把她的语音录下来(一般来说一条语音信息是超过 3 秒的吧?),然后在网站里录音,就直接复刻好了。 小窍门:根据我的实战经验,你用两台手机操作比较方便。手机 A 播放朋友声音、手机 B 打开 https://anyvoice.net/ai-voice-cloning 录制和复刻声音;复刻好后,手机 B 播放声音,手机 A 长按微信发送语音,朋友立马吓傻。

    2. 短视频配音:做视频的朋友们应该懂,配音要么找人要么自己来,累。如果从剪映或者其他地方想找一些自己喜欢的声音,往往是收费的。我们主打全免费、任何声音你都可以得到!

    3. 语言学习:把外语课文用自己的声音念出来,感觉特别神奇,激发了不少学习兴趣。

    4. 假装自己会说外语:你用中文录音,复刻自己的声音,装 x 。然后输入英文、日文、韩文,你就可以得到用你的音色说的外文了。

    使用体验

    界面设计得很简洁,就三步:

    1. 上传/录制语音样本( 3-10 秒)
    2. 选择想要生成的文本,每次不超过 200 字符 (毕竟是免费服务,大家请理解,未来如果我做收费版,会加长)
    3. 等待生成(一般几秒钟就好)

    体验地址

    https://anyvoice.net/ai-voice-cloning

    最后

    目前处于公测阶段,完全免费,没有做任何收费功能!欢迎各位 V2EX 的朋友试用反馈。如果觉得好用请帮忙点个赞 ❤️

    有什么建议或者遇到问题都可以在下面留言,我会一一回复。

    55 条回复    2025-01-10 10:25:34 +08:00
    DigitaIOcean
        1
    DigitaIOcean  
       21 小时 30 分钟前
    (我有点怕这种技术)
    ospider
        2
    ospider  
       21 小时 28 分钟前   ❤️ 1
    不建议提供中文版,更不建议在中文社区宣传。你这个东西万一被诈骗团伙用了,抓不到诈骗分子,还抓不到你吗?分分钟用你的项上人头冒功。
    pol
        3
    pol  
       21 小时 22 分钟前
    我很想知道这些是不是套的那种 gpts-vits ,这种东西
    yushuxin
        4
    yushuxin  
    OP
       21 小时 19 分钟前
    @pol 类似的,但不是,现在技术都差不多
    yushuxin
        5
    yushuxin  
    OP
       21 小时 18 分钟前
    @ospider 谢谢建议,你说得有道理。
    Eddiegaao
        6
    Eddiegaao  
       21 小时 10 分钟前
    字符限制太严格了,不够玩,一次只能生成一句话
    sakujo
        7
    sakujo  
       21 小时 10 分钟前
    有点意思 玩玩看
    pol
        8
    pol  
       21 小时 7 分钟前
    @yushuxin #4 大佬。不会是自己开发的吧
    yushuxin
        9
    yushuxin  
    OP
       21 小时 4 分钟前
    @Eddiegaao 是啊,成本有点高,所以做了限制。回头我想想办法。谢谢反馈
    ChefIsAwesome
        10
    ChefIsAwesome  
       20 小时 59 分钟前   ❤️ 4
    "妈,我出车祸受伤了,现在在医院,你给我转 5 万。"
    “王会计,你往这个账户打 30 万。”

    这个世界有点疯狂。
    spiffing
        11
    spiffing  
       20 小时 57 分钟前
    可别让诈骗团伙看到
    server
        12
    server  
       20 小时 45 分钟前
    CosyVoice ?
    RobinzzZ
        13
    RobinzzZ  
       20 小时 42 分钟前
    感觉离进去不远了,OP 肉身应该不在国内吧
    sunmacarenas
        14
    sunmacarenas  
       20 小时 38 分钟前
    通过免费体验方式,采集声纹?
    rick2c
        15
    rick2c  
       20 小时 26 分钟前
    大家防范意识还挺强的,但其实这类的 ai 应用已经一搜一大把了,所以别想太多
    panxi
        16
    panxi  
       20 小时 12 分钟前
    你有备案吗? 没有的话请规避钱还没到手,银手镯先到手
    shmilypeter
        17
    shmilypeter  
       20 小时 4 分钟前
    克隆了前女友的声音。
    哎~
    barantt01
        18
    barantt01  
       19 小时 58 分钟前
    @sunmacarenas 细思极恐,但应该不至于哈哈
    zlife116
        19
    zlife116  
       19 小时 51 分钟前
    你以为园区的技术人员,都是那里来的?都是我们 v 站的,谢谢你了,技术可以升级了
    idblife
        20
    idblife  
       19 小时 39 分钟前
    @shmilypeter
    出息
    yushuxin
        21
    yushuxin  
    OP
       19 小时 23 分钟前
    @shmilypeter 我隔着屏幕感到了你的心酸
    liqinliqin
        22
    liqinliqin  
       19 小时 19 分钟前
    @yushuxin #21 我有订制需求,可以加 V 吗 andy433928
    barantt01
        23
    barantt01  
       18 小时 59 分钟前
    想请问一下,这个服务是你自己搭的吗?租的 GPU 吗?
    meeop
        24
    meeop  
       18 小时 59 分钟前
    这个技术基本没啥有价值的合法的使用场景
    ixcode
        25
    ixcode  
       18 小时 54 分钟前
    @panxi 域名和服务器都在国外的话,不需要备案
    damonzhang
        26
    damonzhang  
       18 小时 48 分钟前
    有点可怕,用这个过了微信的声音锁验证。。
    guisheng
        27
    guisheng  
       18 小时 29 分钟前
    要是能私有部署就好了,好家伙现在还不能泄漏自己的声音了。
    cat
        28
    cat  
       18 小时 11 分钟前   ❤️ 1
    @damonzhang 于是楼主也拥有了你的声音……
    woorz
        29
    woorz  
       18 小时 5 分钟前 via Android
    @guisheng 自已可部署啊,一大把
    guisheng
        30
    guisheng  
       17 小时 41 分钟前 via iPhone
    @woorz 你说的是使用付费的 sdk 套一层么
    securityCoding
        31
    securityCoding  
       17 小时 26 分钟前
    @meeop 这个市场已经非常非常卷了,比如阅读类应用
    tangping
        32
    tangping  
       17 小时 20 分钟前 via iPhone
    能克隆新闻联播中那个人物的声音吗 狗头🐶
    yushuxin
        33
    yushuxin  
    OP
       17 小时 9 分钟前
    @tangping 当然可以啊。你试试看。
    yushuxin
        34
    yushuxin  
    OP
       17 小时 8 分钟前
    @damonzhang …… 快收起你的虎狼之词,我感觉,你离踩缝纫机越来越近了 😂
    lwldcr
        35
    lwldcr  
       16 小时 45 分钟前
    能提供对方言的支持就好了

    我把父亲生前的语音上传,尝试生成了一个语音,效果感觉还有很大提升空间
    x86
        36
    x86  
       16 小时 44 分钟前
    睿声那个平台八成因为克隆这玩意给整治了,维护了 1 个多月
    meeop
        37
    meeop  
       14 小时 12 分钟前
    @securityCoding 这类应用的重点在于生成语音,而不是模拟语音呀
    模拟语音,或者说复制某个人的声音,更直白一点,假装某个人的声音说话,通常都不是啥正经用途
    coshawn
        38
    coshawn  
       13 小时 56 分钟前 via iPhone
    在 ios17 和 ios18 上面录音,即使允许了 safari 的麦克风权限,录音还是没有声音,导致复制的声音也没有声音。这是为何
    wyman222
        39
    wyman222  
       13 小时 10 分钟前
    @yushuxin #5 说实话,不支持中文,我觉得你在国内就不好卖,当然你在国外卖当我没说。 支持中文,你应该添加内容审查,所有敏感词都该限制,打钱,银行卡,账户, 出车祸等等等
    vfx666
        40
    vfx666  
       12 小时 50 分钟前 via iPhone
    @yushuxin 楼主可以透露一下用了什么技术吗?
    Kolar
        41
    Kolar  
       11 小时 12 分钟前
    就是不知道成本咋样
    Donaldo
        42
    Donaldo  
       10 小时 30 分钟前
    @spiffing #11 早就有了
    yushuxin
        43
    yushuxin  
    OP
       9 小时 31 分钟前
    @wyman222 有道理
    sublime8
        44
    sublime8  
       6 小时 27 分钟前
    之前国内唯一提供音频上传克隆的公司“睿声”目前处于无限期停业整顿状态,其他大大小小的类似服务提供商都只能读固定文本来克隆,就是为了避免克隆其他人的声音
    gletec
        45
    gletec  
       3 小时 6 分钟前 via Android
    这很刑,楼主却挺有成就感的
    twinsant
        46
    twinsant  
       2 小时 34 分钟前
    Coys? F5 ? GPT-Sovits?
    SaltyMouse
        47
    SaltyMouse  
       2 小时 34 分钟前
    vfx666
        48
    vfx666  
       2 小时 8 分钟前 via iPhone
    @twinsant 这些工具想要克隆的好最少要几条样本一起训练,他这个就一条音频,效果还是很不错的
    liyafe1997
        49
    liyafe1997  
       1 小时 58 分钟前 via Android
    @ospider 要是 op 不在中国/非中国籍呢
    panxi
        50
    panxi  
       1 小时 39 分钟前
    @vfx666 #40 开源的主要还是 sovits 和 cosyvoice 吧, 其他的或多或少技术方向和这两个差不多
    Seanfuck
        51
    Seanfuck  
       1 小时 38 分钟前
    @twinsant 是 GPT-Sovits 拉
    ZsmHub
        52
    ZsmHub  
       42 分钟前
    @ospider 完全没必要说这种。工具都是一把双刃剑,只看用的人怎么使用。比如一把菜刀,如果担心别人用菜刀杀人而不卖菜刀,你能接受吗?现在所有大平台都在开发声音克隆技术,没必要畏手畏脚的。中国人就是太保守,这样只会离先进越来越远~
    ZsmHub
        53
    ZsmHub  
       42 分钟前
    @yushuxin 工具都是一把双刃剑,只看用的人怎么使用。比如一把菜刀,如果担心别人用菜刀杀人而不卖菜刀,你能接受吗?现在所有大平台都在开发声音克隆技术,没必要畏手畏脚的。中国人就是太保守,这样只会离先进越来越远~
    ynwx
        54
    ynwx  
       26 分钟前
    这个太强了,给楼主点赞
    ospider
        55
    ospider  
       24 分钟前
    @ZsmHub 不是我担心啊,是有人钳住我们的手脚。我也没说这个东西不好,我是说在国内没法弄。大公司大不了接受下窗口指导下架就行了,或者罚酒三杯,小公司可能就得牢狱之灾了。你搞清楚源头是啥比较好,怼我没用的……
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5827 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 02:49 · PVG 10:49 · LAX 18:49 · JFK 21:49
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.