logictan89 最近的时间轴更新
logictan89

logictan89

V2EX 第 475248 号会员,加入于 2020-03-09 01:21:39 +08:00
今日活跃度排名 8225
logictan89 最近回复了
4 天前
回复了 Zhipuai 创建的主题 程序员 Ask Me Anything with 智谱!有问必答!
@Zhipuai 我是在 audio.z.ai 里面体验的,随便找了个干声进行克隆。当前其他开源模型( indextts2/cosyvoice2/3/vibevoice 等)虽然在情绪和语调上还达不到非常理想的程度,但是至少音色方面差的不会很多。但是在 audio.z.ai 上,是目前唯一一个在音色方面就让我觉得“不像”输入音频的体验。更不必说,生成的语音说话一板一眼的,一点特色都没有。所以我后续也没有去 github 上尝试开源版本,毕竟下载和搭建也挺费劲的。
如果 audio.z.ai 上的模型版本和开源版本不一样,那你们是否要考虑更新一下;
如果是一样的,那我不知道官方自己用的多不多,是不是被评测蒙蔽了双眼;又或者我使用的音源比较特殊。

无论如何,当前 AI 竞赛,不管是大语言模型还是 TTS ,都陷入了拼评分的怪圈。实际上,常年在一线使用产品的用户,对于模型的实际能力是很敏感的。我们团队半年前用 minimax 的 2.0 版本,体验很惊艳,立马充值。但是不久之后开始降智,官方不断出新的模型版本,每次都号称比之前版本好,但我们自己用下来就知道,不行就是不行,和新出来的开源模型都比不了。

所以奉劝你们,不要被评测评分迷了眼。它是一个评判方式,但不是唯一一个。我的建议是,自己多用用。
7 天前
回复了 Zhipuai 创建的主题 程序员 Ask Me Anything with 智谱!有问必答!
GLM TTS 克隆效果不行,为啥比开源的还差?
53 天前
回复了 VisualStudioCode 创建的主题 互联网 Linux Do 为何发展得如此之快?
因为大家都喜欢薅羊毛。现在除了特意去找羊毛,已经懒得上了,一堆推广
多年前买的 nuc8 ,装的 unraid ,现在还服役中
坚持喷辅舒良,几乎没有副作用,可以常年喷。根治就别想了。
108 天前
回复了 DaisyParallels 创建的主题 macOS 全新 Parallels Desktop 26 登场!
就这么点东西,就算个大版本了?
2024-07-12 12:05:00 +08:00
回复了 june4 创建的主题 编辑器 未来最牛编辑器 zed 的 Linux 版终于出来了
动不动最牛、降维打击、秒杀,先出个 Windows 版本可好? Mac 和 Windows 我也都用过,除了果子家封闭的开发生态(出 iOS 包只能用 mac ),也没觉得 mac 开发有多便利啊?
最近隔三岔五看见类似的贴子,莫不是买通稿了?
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   820 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 20:23 · PVG 04:23 · LAX 12:23 · JFK 15:23
♥ Do have faith in what you're doing.