从詹姆斯泰勒到泰勒斯威夫特:音乐像生物有机体一样发展

在20世纪90年代早期,说唱音乐占据了广播:Snoop Dogg和Jay Z的歌曲到处播放。 这是一场音乐革命还是仅仅是随着时间的推移逐渐改变口味的结果? 研究人员表示,由于有史以来对流行音乐的最大数据驱动研究,他们现在能够回答这些问题。 他们说,将进化理论应用于这一数据集可以解决几十年来流行音乐肆虐的争论。

在艺术形式中,音乐似乎特别适合数据驱动的分析。 毕竟,区分一首音乐与另一首音乐,和声,旋律的特征本质上是数学的。 研究人员长期以来一直希望用生物学家用来研究物种进化的相同严谨工具来研究音乐的演变。 但纠结的版权保护使得难以大规模访问音乐数据集,因为即使未经许可也不允许对音乐录音进行数据挖掘。 确定特定地点和时间的代表性音乐文化样本具有挑战性。 例如,尽管我们有来自巴洛克时代的数百万乐谱,但我们不知道它们中的任何一个实际执行的频率。

为了解决抽样问题,由伦敦玛丽女王大学的计算机科学家Matthias Mauch领导的团队求助于美国音乐界每周流行单曲榜单美国Billboard Hot 100。 研究人员从Billboard网站上搜集了数据,收集了大约17,000首歌曲的标题和艺术家,这些歌曲在1960年至2010年之间排名。

获得实际的歌曲录音是一个棘手的问题。 幸运的是,Mauch曾经在英国在线音乐推荐服务Last.fm工作,他知道该公司有一个庞大的30秒音乐样本数据库,用于预览其商品。 这些样本足够大,可以进行大规模的比较分析。

该团队不是依靠人类的判断来比较歌曲,而是使用一种统计技术,在将它们分组成簇之前,提取录音的特征,如音色和和声。 为了确保集群的意义,研究人员将它们与Last.fm的数百万用户创建的歌曲组进行了比较。 例如,用户将Snoop Dogg,Ludacris和Jay Z的歌曲放在“说唱和嘻哈”类别中。 但是,只使用音色和和声功能,计算机将它们聚集成几乎相同的组。 受到相似性的鼓舞,该团队随后通过进化分析对这些海量数据进行了分析,处理了生物特征等歌曲之间共享的统计特征。

研究人员发现,正如一些评论家认为的那样, ,而不是变得公式化和同质化。 它并没有逐渐发展。 相反,分析 。 第一次是在1964年摇滚和灵魂音乐的兴起期间,当披头士乐队等乐队吸引了大批观众。 接下来的开始于1983年的迪斯科,新浪潮和硬摇滚。 最新的,也是迄今为止最具变革性的,始于1991年,随着说唱和嘻哈的爆发。 正如Mauch和他的团队今天在皇家学会开放科学中所做的那样,说唱是“过去50年来塑造美国排行榜音乐结构的最重要事件”。 它对流行音乐结构的强大影响至今仍在继续; 例如,偶尔的说唱插曲现在可以进入许多摇滚歌曲。

“这是严谨的,”哈佛大学和Palantir Technologies的数据科学家Jean-Baptiste Michel说道,该公司总部位于加利福尼亚州帕洛阿尔托,是主要作者,该 。 “更多的研究人员需要采用这种方法。” 他说,其中一项突出的发现是,流行音乐表现出一种被称为间断均衡的生物进化模式,其中逐渐变化的时期被复杂性的爆炸所分隔。 地质历史上最着名的例子是寒武纪爆发,即5.42亿年前化石记录中生物多样性突然大量增加。 “当然,存在差异,”他说,“因为生物进化具有直接的亲子关系,我们甚至不知道生物学中的机制。所以我们必须小心。”

(链接PDF的信用:M。Mauch等人皇家学会开放科学[2015])