SheepNav
新上线9天前0 投票

苹果AI歌单生成器Playlist Playground表现糟糕,连音乐都搞不定

苹果最近在Apple Music中推出了AI驱动的歌单生成器Playlist Playground的测试版,用户可以通过文字提示来创建个性化歌单。然而,根据《The Verge》编辑Terrence O'Brien的实际测试,这一功能的表现令人失望,不仅无法准确理解音乐类型、年代等基本要素,甚至在简单的地理常识上都频频出错。

测试案例:从黑金属到儿童友好嘻哈

O'Brien首先尝试了一个相对小众但明确的提示:“Atmospheric instrumental black metal to write to”(适合写作的氛围器乐黑金属)。结果,Apple Music返回的歌单中包含了三首带人声的金属歌曲、一段田野录音、一首氛围电子乐和一首厄运爵士乐——这与“器乐黑金属”的要求相去甚远。相比之下,YouTube Music的AI歌单生成器在同样提示下,直到第五首才出现带歌词的曲目,整体表现明显更优。

随后,O'Brien又测试了更具体的提示:“modern ambient black metal from the American South”(来自美国南部的现代氛围黑金属)。苹果只找到了三首可能符合的歌曲,其中一首来自南达科他州的乐队Woman is the Earth——而南达科他州并不属于美国南部。这暴露了AI在理解地理概念上的严重缺陷。

为了验证是否只是黑金属这类小众音乐的问题,O'Brien转向了更主流的类型:“kid-friendly modern hip hop”(儿童友好的现代嘻哈)。结果同样令人啼笑皆非:

  • 第一首是Kendrick Lamar的“DNA”的审查版,虽然歌词被处理过,但内容本身并不适合儿童。
  • 第二首是Kid Capri于1998年发行的“We’re Unified”的审查版,这显然不符合“现代”的定义。
  • 在生成的16首歌曲中,有6首超过15年历史,3首超过25年历史。
  • 最离谱的是包含了Chicken P的“ABC”,这首歌列举了歌手睡过的所有女性名字,歌词内容完全不适合儿童。

AI音乐推荐的核心挑战

Playlist Playground的失败并非偶然,它反映了当前AI在音乐理解领域的普遍困境:

  1. 语义理解的局限性:AI可能通过关键词匹配(如“metal”、“hip hop”)来筛选歌曲,但无法深入理解“氛围”、“器乐”、“现代”、“儿童友好”等复杂概念的组合与语境。
  2. 数据与标签的依赖:AI严重依赖歌曲的元数据(如流派、年代、地区标签),如果这些标签不准确或不完整,输出结果就会失真。小众音乐或跨流派作品尤其容易出错。
  3. 常识与逻辑的缺失:将南达科他州误认为美国南部,或把1998年的歌曲归类为“现代”,说明AI缺乏基本的地理和历史常识,这在处理需要上下文理解的提示时是致命弱点。

行业背景与竞争态势

苹果并非唯一尝试AI歌单生成的玩家。YouTube Music、Spotify等平台都已推出类似功能,但效果参差不齐。整体而言,AI音乐推荐仍处于早期阶段,面临以下挑战:

  • 个性化与准确性的平衡:过于宽泛的推荐可能无法满足细分需求,而过于严格的过滤又可能限制探索性。
  • 文化与时事的敏感性:音乐与时代、地域、文化紧密相关,AI需要动态更新知识库以适应变化。
  • 用户体验的落差:当AI无法理解用户意图时,容易产生“智能智障”的体验,反而降低用户信任度。

小结:AI音乐之路任重道远

Playlist Playground的糟糕表现提醒我们,AI在创意和娱乐领域的应用仍充满挑战。音乐不仅是数据的集合,更是情感、文化和语境的产物。苹果作为科技巨头,在AI布局上显然还有很长的路要走——从基础语义理解到常识推理,都需要更深入的优化。对于用户而言,在享受AI便利的同时,或许也该保持一份合理的期待:当前的AI歌单生成器,更像是一个有趣的实验,而非可靠的音乐伙伴。

延伸阅读

  1. 太空数据中心能否支撑SpaceX的巨额估值?
  2. 在日本,机器人不是来抢工作的,而是填补没人愿意干的岗位
  3. 我让Google Maps里的Gemini规划我的一天,结果出乎意料地好
查看原文