最近 Google DeepMind 放出了他们第三代音乐模型 Lyria 3,试用之后感觉在音质和多模态输入上非常惊艳。于是我趁热打铁,搓了这个封装了 Lyria 3 能力的在线 AI 音乐生成站,今天来 V 站向大家自荐一下,希望能得到大家的反馈。
🌐 网站地址: https://lyria3.pro
和目前市面上的主流 AI 音乐工具相比,我在开发和测试过程中,发现 Lyria 3 有几个非常硬核的特性:
多模态输入(看图生音): 这是我觉得最抓人的一点。除了常规的文本 Prompt (风格、情绪、BPM 等),你现在可以直接上传一张照片。模型会自己读取画面的情绪、色调,直接谱写出贴合氛围的配乐。
真·高保真音质 (48kHz/24-bit): 懂音频的老哥应该知道,很多 AI 音乐的立体声是通过后期算法“伪造”的。Lyria 3 是从底层的波形合成阶段就原生输出 48kHz/24-bit 的立体声,声音的声场和细节非常能打。
高密度的 30 秒短曲: 相比于 Suno 动辄生成几分钟(且后期容易出现结构崩坏幻觉),Lyria 3 专注于生成 30 秒的高质量片段。非常适合直接拿来做 YouTube Shorts 、TikTok 、播客的 Intro 或 Outro 。
多语言人声 & 自动作词: 支持 8 种以上语言(包括中、英、日等),发音极其自然,没有明显的机器口音,而且自带押韵连贯的自动作词功能。
为了让大家有个直观感受,我总结了一个简单的对比:
音质表现: 竞品大多在 44.1kHz ,Lyria 3 原生 48kHz 。
交互方式: 竞品仅支持文本;我们支持文本 + 图片/视频画面。
版权安全:Lyria 3 底层强制集成了 SynthID 水印,平台生成的音乐 100% 免版税( Royalty-Free ),可以直接商用,不用担心后续被 Youtube 警告。
开发过程中难免还有一些 Bug 和体验不佳的地方,欢迎各位 V 友在帖子里或者通过网站向我吐槽,我会重点记录并优化!
🌐 网站地址: https://lyria3.pro 🌐 github: https://github.com/lyria-3-ai
感谢大家的时间!
1
wersero OP 刚在谷歌 site 里做了个简单的页面,不知道有没有用。 https://sites.google.com/view/lyria-3-premier-ai-song-music-/home
|