logictan89 最近的时间轴更新
logictan89

logictan89

V2EX 第 475248 号会员,加入于 2020-03-09 01:21:39 +08:00
logictan89 最近回复了
2025 年 12 月 17 日
回复了 Zhipuai 创建的主题 程序员 Ask Me Anything with 智谱!有问必答!
@Zhipuai 我是在 audio.z.ai 里面体验的,随便找了个干声进行克隆。当前其他开源模型( indextts2/cosyvoice2/3/vibevoice 等)虽然在情绪和语调上还达不到非常理想的程度,但是至少音色方面差的不会很多。但是在 audio.z.ai 上,是目前唯一一个在音色方面就让我觉得“不像”输入音频的体验。更不必说,生成的语音说话一板一眼的,一点特色都没有。所以我后续也没有去 github 上尝试开源版本,毕竟下载和搭建也挺费劲的。
如果 audio.z.ai 上的模型版本和开源版本不一样,那你们是否要考虑更新一下;
如果是一样的,那我不知道官方自己用的多不多,是不是被评测蒙蔽了双眼;又或者我使用的音源比较特殊。

无论如何,当前 AI 竞赛,不管是大语言模型还是 TTS ,都陷入了拼评分的怪圈。实际上,常年在一线使用产品的用户,对于模型的实际能力是很敏感的。我们团队半年前用 minimax 的 2.0 版本,体验很惊艳,立马充值。但是不久之后开始降智,官方不断出新的模型版本,每次都号称比之前版本好,但我们自己用下来就知道,不行就是不行,和新出来的开源模型都比不了。

所以奉劝你们,不要被评测评分迷了眼。它是一个评判方式,但不是唯一一个。我的建议是,自己多用用。
2025 年 12 月 14 日
回复了 Zhipuai 创建的主题 程序员 Ask Me Anything with 智谱!有问必答!
GLM TTS 克隆效果不行,为啥比开源的还差?
2025 年 10 月 29 日
回复了 VisualStudioCode 创建的主题 互联网 Linux Do 为何发展得如此之快?
因为大家都喜欢薅羊毛。现在除了特意去找羊毛,已经懒得上了,一堆推广
2025 年 10 月 10 日
回复了 idblife 创建的主题 Linux 放在家里稳定运行的 Linux 小主机有啥推荐没?
多年前买的 nuc8 ,装的 unraid ,现在还服役中
坚持喷辅舒良,几乎没有副作用,可以常年喷。根治就别想了。
2025 年 9 月 4 日
回复了 DaisyParallels 创建的主题 macOS 全新 Parallels Desktop 26 登场!
就这么点东西,就算个大版本了?
2024 年 7 月 12 日
回复了 june4 创建的主题 编辑器 未来最牛编辑器 zed 的 Linux 版终于出来了
动不动最牛、降维打击、秒杀,先出个 Windows 版本可好? Mac 和 Windows 我也都用过,除了果子家封闭的开发生态(出 iOS 包只能用 mac ),也没觉得 mac 开发有多便利啊?
最近隔三岔五看见类似的贴子,莫不是买通稿了?
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3098 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 13:47 · PVG 21:47 · LAX 05:47 · JFK 08:47
♥ Do have faith in what you're doing.