体验了最新的 Lyria 3 音乐模型，顺手做了个小站 (附与 Suno/Udio 的主观对比)

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

如果想在 V2EX 获得更好的推广效果，欢迎了解 PRO 会员机制：
https://www.v2ex.com/pro/about

最近 Google DeepMind 放出了他们第三代音乐模型 Lyria 3，试用之后感觉在音质和多模态输入上非常惊艳。于是我趁热打铁，搓了这个封装了 Lyria 3 能力的在线 AI 音乐生成站，今天来 V 站向大家自荐一下，希望能得到大家的反馈。

🌐 网站地址： https://lyria3.pro

✨ 核心亮点 & 为什么选择接入 Lyria 3 ？

和目前市面上的主流 AI 音乐工具相比，我在开发和测试过程中，发现 Lyria 3 有几个非常硬核的特性：

多模态输入（看图生音）：这是我觉得最抓人的一点。除了常规的文本 Prompt （风格、情绪、BPM 等），你现在可以直接上传一张照片。模型会自己读取画面的情绪、色调，直接谱写出贴合氛围的配乐。

真·高保真音质 (48kHz/24-bit)：懂音频的老哥应该知道，很多 AI 音乐的立体声是通过后期算法“伪造”的。Lyria 3 是从底层的波形合成阶段就原生输出 48kHz/24-bit 的立体声，声音的声场和细节非常能打。

高密度的 30 秒短曲：相比于 Suno 动辄生成几分钟（且后期容易出现结构崩坏幻觉），Lyria 3 专注于生成 30 秒的高质量片段。非常适合直接拿来做 YouTube Shorts 、TikTok 、播客的 Intro 或 Outro 。

多语言人声 & 自动作词：支持 8 种以上语言（包括中、英、日等），发音极其自然，没有明显的机器口音，而且自带押韵连贯的自动作词功能。

为了让大家有个直观感受，我总结了一个简单的对比：

音质表现：竞品大多在 44.1kHz ，Lyria 3 原生 48kHz 。

交互方式：竞品仅支持文本；我们支持文本 + 图片/视频画面。

版权安全：Lyria 3 底层强制集成了 SynthID 水印，平台生成的音乐 100% 免版税（ Royalty-Free ），可以直接商用，不用担心后续被 Youtube 警告。

开发过程中难免还有一些 Bug 和体验不佳的地方，欢迎各位 V 友在帖子里或者通过网站向我吐槽，我会重点记录并优化！

感谢大家的时间！

1 条回复

wersero

1 天前

刚在谷歌 site 里做了个简单的页面，不知道有没有用。 https://sites.google.com/view/lyria-3-premier-ai-song-music-/home