谷歌发布Lyria 3 Pro音乐生成模型,支持创作长达三分钟的自定义曲目
谷歌于本周三正式发布其升级版音乐生成模型Lyria 3 Pro,这是继一个月前Lyria 3发布后的又一次重要更新。新模型将单曲生成时长从30秒大幅提升至三分钟,并显著增强了创作控制与自定义能力。
核心升级:时长与结构控制
与Lyria 3相比,Lyria 3 Pro最直观的改进在于生成长度。用户现在可以生成长达三分钟的完整音乐片段,这为创作更复杂、更具叙事性的作品提供了基础。更重要的是,模型对音乐结构的理解能力得到提升,用户可以在提示词中明确指定前奏、主歌、副歌、桥段等不同段落,实现更精细的编排控制。
多平台部署策略
谷歌正将Lyria 3 Pro快速整合到其产品生态中:
- Gemini应用:继Lyria 3后,Pro模型也已上线,但仅限付费订阅用户使用。
- Google Vids视频编辑应用:为视频创作者提供AI生成的背景音乐。
- ProducerAI:谷歌上月收购的生成式AI音乐制作工具,将直接受益于新模型。
- 企业级工具:通过Vertex AI(公开预览版)、Gemini API和AI Studio,为企业客户提供音乐生成能力。
训练数据与版权考量
谷歌强调,Lyria 3 Pro使用了合作伙伴数据以及来自YouTube和谷歌的合规数据进行训练。公司明确表示,模型不会直接模仿特定艺术家的风格。但如果用户在提示中指定某位艺术家,模型会从该艺术家的作品中汲取广泛灵感进行创作。
所有由Lyria 3和Lyria 3 Pro生成的曲目都会被打上SynthID水印,以标识其AI生成属性。这一做法恰逢音乐流媒体平台加强AI内容治理——本周早些时候,Spotify推出了新工具,允许艺术家审核以其名义发布的歌曲,防止AI内容冒名;Deezer也发布了供流媒体服务识别AI生成音乐的工具。
行业背景与意义
谷歌此次快速迭代Lyria系列,反映了AI音乐生成赛道正从“玩具级”演示向实用化、商业化加速迈进。三分钟的生成能力已接近主流流行歌曲的常见长度,结合结构化控制,使得AI辅助创作真正具备了产出完整作品的可能性。
同时,将模型嵌入Gemini付费层、企业API及视频编辑工具,显示出谷歌正试图将AI音乐能力转化为直接的产品差异化优势和收入来源。在Meta、Stability AI等公司纷纷推出音乐模型的竞争格局下,谷歌通过生态整合与时长突破,试图巩固其在该领域的领先地位。
然而,版权与艺术家权益问题仍是悬而未决的挑战。尽管谷歌采取了水印和“不模仿”策略,但“灵感汲取”的边界依然模糊。随着AI生成音乐质量提升,平台、创作者与法律界如何平衡创新与保护,将成为下一阶段的关键议题。