苹果AI歌单生成器Playlist Playground测试翻车，音乐推荐不准

苹果最近在Apple Music中推出了AI驱动的歌单生成器Playlist Playground的测试版，用户可以通过文字提示来创建个性化歌单。然而，根据《The Verge》编辑Terrence O'Brien的实际测试，这一功能的表现令人失望，不仅无法准确理解音乐类型、年代等基本要素，甚至在简单的地理常识上都频频出错。

测试案例：从黑金属到儿童友好嘻哈

O'Brien首先尝试了一个相对小众但明确的提示：“Atmospheric instrumental black metal to write to”（适合写作的氛围器乐黑金属）。结果，Apple Music返回的歌单中包含了三首带人声的金属歌曲、一段田野录音、一首氛围电子乐和一首厄运爵士乐——这与“器乐黑金属”的要求相去甚远。相比之下，YouTube Music的AI歌单生成器在同样提示下，直到第五首才出现带歌词的曲目，整体表现明显更优。

随后，O'Brien又测试了更具体的提示：“modern ambient black metal from the American South”（来自美国南部的现代氛围黑金属）。苹果只找到了三首可能符合的歌曲，其中一首来自南达科他州的乐队Woman is the Earth——而南达科他州并不属于美国南部。这暴露了AI在理解地理概念上的严重缺陷。

为了验证是否只是黑金属这类小众音乐的问题，O'Brien转向了更主流的类型：“kid-friendly modern hip hop”（儿童友好的现代嘻哈）。结果同样令人啼笑皆非：

第一首是Kendrick Lamar的“DNA”的审查版，虽然歌词被处理过，但内容本身并不适合儿童。
第二首是Kid Capri于1998年发行的“We’re Unified”的审查版，这显然不符合“现代”的定义。
在生成的16首歌曲中，有6首超过15年历史，3首超过25年历史。
最离谱的是包含了Chicken P的“ABC”，这首歌列举了歌手睡过的所有女性名字，歌词内容完全不适合儿童。

AI音乐推荐的核心挑战

Playlist Playground的失败并非偶然，它反映了当前AI在音乐理解领域的普遍困境：

语义理解的局限性：AI可能通过关键词匹配（如“metal”、“hip hop”）来筛选歌曲，但无法深入理解“氛围”、“器乐”、“现代”、“儿童友好”等复杂概念的组合与语境。
数据与标签的依赖：AI严重依赖歌曲的元数据（如流派、年代、地区标签），如果这些标签不准确或不完整，输出结果就会失真。小众音乐或跨流派作品尤其容易出错。
常识与逻辑的缺失：将南达科他州误认为美国南部，或把1998年的歌曲归类为“现代”，说明AI缺乏基本的地理和历史常识，这在处理需要上下文理解的提示时是致命弱点。

行业背景与竞争态势

苹果并非唯一尝试AI歌单生成的玩家。YouTube Music、Spotify等平台都已推出类似功能，但效果参差不齐。整体而言，AI音乐推荐仍处于早期阶段，面临以下挑战：

个性化与准确性的平衡：过于宽泛的推荐可能无法满足细分需求，而过于严格的过滤又可能限制探索性。
文化与时事的敏感性：音乐与时代、地域、文化紧密相关，AI需要动态更新知识库以适应变化。
用户体验的落差：当AI无法理解用户意图时，容易产生“智能智障”的体验，反而降低用户信任度。

小结：AI音乐之路任重道远

Playlist Playground的糟糕表现提醒我们，AI在创意和娱乐领域的应用仍充满挑战。音乐不仅是数据的集合，更是情感、文化和语境的产物。苹果作为科技巨头，在AI布局上显然还有很长的路要走——从基础语义理解到常识推理，都需要更深入的优化。对于用户而言，在享受AI便利的同时，或许也该保持一份合理的期待：当前的AI歌单生成器，更像是一个有趣的实验，而非可靠的音乐伙伴。

苹果AI歌单生成器Playlist Playground表现糟糕，连音乐都搞不定

测试案例：从黑金属到儿童友好嘻哈

AI音乐推荐的核心挑战

行业背景与竞争态势

小结：AI音乐之路任重道远

延伸阅读

相关资讯