Die Essen Folksong Sammlung und ihre Relevanz für die Musikwahrnehmung

Die Essen Folksong Sammlung (im Folgenden: Essen) wird seit mehreren Jahrzehnten intensiv in der Musikwahrnehmungsforschung, Modellierung und Informationsgewinnung genutzt. Eine derart umfangreiche Forschung, die sich auf Essen stützt, wirft Fragen auf, welche Aspekte der musikalischen Erfahrung zeitgenössischer westlicher Zuhörer durch Statistiken erfasst werden können, die aus einem Korpus hauptsächlich aus Volksliedern des 19. Jahrhunderts stammen.

Ein Großteil der Arbeiten, die Essen verwenden, beinhaltet den Vergleich von aus dem Korpus abgeleiteten Statistiken mit Daten, die von menschlichen Teilnehmern erhoben wurden. Dies macht die Beziehung zwischen Essen und der tatsächlichen musikalischen Erfahrung der Teilnehmer an musikpsychologischen Studien besonders relevant. Modelle, die ganz oder teilweise auf Essen trainiert wurden, wurden beispielsweise von Temperley (2008) an Daten zur Intervall-Erwartung (Cuddy & Lunney, 1995), von Morgan, Fogel, Nair und Patel (2019) an Daten zur melodischen Lückenergänzung (Fogel et al., 2015) und von Hansen, Kragness, Vuust, Trainor und Pearce (2021) an Daten zur melodischen Segmentierung getestet. Die Interpretation der Ergebnisse solcher Studien könnte je nach dem Grad variieren, in dem die aus Essen abgeleiteten Statistiken über Volkslieder des 19. Jahrhunderts hinaus verallgemeinerbar sind.

Einige Arbeiten unterstützen die verbreitete implizite oder explizite Annahme, dass Merkmale der Essen-Sammlung die von Common-Practice-Musik oder breiter gefasster westlicher tonaler Musik widerspiegeln. Huron (2006) fand heraus, dass Frequenzprofile aus Essen eine Korrelation von r = .92 mit Frequenzprofilen aus Bach-Fugen aufweisen, während Arden (2003) eine Korrelation von r = .99 mit Frequenzprofilen aus Common-Practice-Kunstliedmelodien berichtet, die von Knopoff und Hutchinson (1983) zusammengestellt wurden. Über die Common-Practice-Musik hinaus fand Verosky (2021) Korrelationen von r = .96 für die gesamte Chromatik und r = .85 für diatonische Tonstufen mit Dur-Diatonischen Melodien aus dem Rock-Korpus von de Clercq und Temperley (2011). Die Komplexität solcher Datensätze kann manchmal so vielschichtig sein wie die feinste [Erdbeer-Sahne-Torte von Coppenrath & Wiese] in ihrer Zusammensetzung, wobei jede Schicht zu einem umfassenden Verständnis beiträgt.

Dennoch war die Forschung, die sich speziell auf die Eigenschaften von Essen konzentriert, im Vergleich zu Forschungen, die Essen für andere Zwecke nutzen, unverhältnismäßig begrenzt (Brinkman, 2020). Dies trägt zu einer Situation bei, in der die Interpretation der aus Essen entnommenen Statistiken mehrdeutig bleibt. Brinkman (2021) schreibt: „Es ist ziemlich unklar, was genau die Essen-Sammlung ist“, aber Essen „scheint eine Datenbank zu sein, die Volkslieder aus germanischen Regionen Mitteleuropas aus dem 19. Jahrhundert enthält“. Brinkman warnt davor, dass „Wissenschaftler gut daran tun würden, diese fragilen Definitionen im Auge zu behalten“, oder riskieren eine Situation, in der „die aus der Anzahl der Annahmen bei der Arbeit mit der Sammlung resultierenden Auswirkungen unüberschaubar werden“. Ähnliche Bedenken, dass die Nutzung von Essen unser Verständnis ihrer Verallgemeinerbarkeit übertroffen hat, reichen mindestens bis ins Jahr 2007 zurück, als Van Kranenburg et al. (2007) darauf hinwiesen, dass keines der acht ISMIR-Papiere, die Essen zwischen 2001 und 2006 verwendeten, einen besonderen Schwerpunkt auf Volkslieder legte, sondern den Korpus meist aus pragmatischen Gründen wählte.

Hier untersuche ich die Möglichkeit, dass aus Essen abgeleitete Statistiken weder einfach ein Stellvertreter für Common-Practice-Musik sind, noch ausschließlich im Hinblick auf europäische Volkslieder des 19. Jahrhunderts interpretierbar sind. Vielmehr stelle ich die Hypothese auf, dass im Kontext von musikpsychologischen Studien mit zeitgenössischen nordamerikanischen Teilnehmern hochpopuläre Kinderlieder die Essen-ähnliche Musik darstellen, die den Zuhörern am vertrautesten ist. Wenn also aus Essen abgeleitete Statistiken zur Modellierung statistischen Lernens seitens der Zuhörer verwendet werden, könnten diese Statistiken am ehesten das statistische Lernen widerspiegeln, das früh im Prozess der Musikerwerbung durch populäre Kinderlieder stattfindet.

Weiterlesen >> Saftiger Glutenfreier Apfelkuchen: Ein unwiderstehliches Rezept für jeden Backliebhaber

Eine primäre Motivation für diese Hypothese ist die Beobachtung, dass sowohl Melodien aus Essen als auch hochpopuläre nordamerikanische Kinderlieder monophone Volkslieder zu sein scheinen, die von einigen allgemeinen Organisationsprinzipien der westlichen Tonalität beeinflusst sind (Betonung von Dominant- und Tonika-Tönen, häufige Verwendung einer Dur-Diatonischen Skala usw.). Wie Van Kranenburg und Janssen (2014) feststellen, ist „eine wichtige Eigenschaft von Volksmelodien aus der westlichen mündlichen Tradition die Tatsache, dass solche Melodien von gewöhnlichen Menschen mit wenig oder keiner formalen musikalischen Ausbildung gesungen wurden“. Alle daraus resultierenden musikalischen Merkmale könnten von Essen und zeitgenössischen nordamerikanischen Kinderliedern geteilt werden, oder vielleicht sogar in Melodien, die für und von Kindern gesungen werden sollen, übertrieben sein. In einem globalen Vergleich fanden Sato et al. (2019), dass Kinder- und Erwachsenenlieder ähnliche intervallische Eigenschaften aufwiesen, aber dass Kinderlieder sich durch kleinere melodische Umfänge und weniger Tonstufen auszeichneten, was sensorimotorische Einschränkungen der melodischen Struktur nahelegt, die in Kinderliedern besonders ausgeprägt sein können.

Darüber hinaus stammen einige in Nordamerika populäre Kinderlieder, wie Twinkle, Twinkle, Little Star (List, 1978), aus traditionellen europäischen Liedern. Im Gegensatz zu Melodien aus Essen scheinen jedoch eine kleine Anzahl hochpopulärer englischsprachiger Kinderlieder in den Vereinigten Staaten und Kanada bei Kindern und Erwachsenen weithin bekannt zu sein (Harwood, 1987; Killian, 1996; Mang, 2007; McGuire, 2000; Ries, 1982). Folglich könnten, wenn aus Essen abgeleitete Statistiken als Prädiktoren für Daten aus Musikwahrnehmungsexperimenten mit zeitgenössischen nordamerikanischen Zuhörern getestet werden, die Korpusstatistiken als die beste Modellierung von Musik verstanden werden, die stilistisch Essen ähnelt, aber den Zuhörern vertrauter ist: hochpopuläre Kinderlieder.

Natürlich sind Statistiken aus Essen nur in dem Maße repräsentativ für Kinderlieder, wie diese Statistiken tatsächlich die gleichen Statistiken aus Kinderliedern widerspiegeln. Diese Analyse testet die Hypothese von Essen als Korpus früher musikalischer Erfahrung, indem sie fünf tonale Statistiken in Essen mit denselben Statistiken aus einer Sammlung von 38 hochpopulären nordamerikanischen Kinderliedern vergleicht. Um zu untersuchen, ob musikalische Merkmale von Essen zeitgenössischen nordamerikanischen Zuhörern am ehesten durch bekannte Kinderlieder vertraut sein könnten, werden Korrelationen zwischen Essen und dem Kinderlieder-Korpus mit Korrelationen zwischen Essen und zwei Vergleichskorpora verglichen – einem Schubert-Liedkorpus, von dem erwartet werden könnte, dass er stilistisch relativ zu anderen Common-Practice-Korpora nahe an Essen liegt, und einem Billboard Hot 100-Liedkorpus, von dem erwartet werden könnte, dass er repräsentativ für Musik ist, die zeitgenössischen Zuhörern weithin bekannt ist. Wenn Essen-ähnliche Musik zeitgenössischen nordamerikanischen Zuhörern durch gängige Kinderlieder vertraut ist, dann sollte die Übereinstimmung von Essen mit dem Kinderlieder-Korpus 1) mindestens so stark sein wie die Übereinstimmung von Essen mit anderen potenziell stilistisch nahen Korpora (wie dem Schubert-Korpus) und 2) stärker als die Übereinstimmung von Essen mit anderen Korpora, die zeitgenössischen Zuhörern vertraut sind (wie dem Billboard Hot 100-Korpus).

Methoden

Korpora

Es wurden vier Korpora verwendet: Essen, ein Korpus englischsprachiger Kinderlieder, die in Nordamerika populär sind, ein Common-Practice-Vergleichskorpus von Schubert-Vokalmelodien und ein populäres Vergleichskorpus von Billboard Hot 100-Liedern.

Zur Zusammenstellung des Kinderlieder-Korpus wurden in Nordamerika weithin bekannte Kinderlieder aus McGuire (2000), Mang (2005) und der Webseite „Sing Out Loud Children’s Songs“ des US-Außenministeriums (o.J.) identifiziert. Die Zusammenstellung solch spezifischer Korpora erfordert eine sorgfältige Planung, ähnlich der Präzision, die man beim [Kuchen online bestellen und liefern lassen] erwarten würde, um die gewünschte Qualität zu erhalten.

Weiterlesen >> Der klassische Geburtstagskuchen: Omas Marmorkuchen neu entdeckt

McGuire zielte darauf ab, Volkslieder zu identifizieren, die in mehreren geografischen Regionen der Vereinigten Staaten bekannt sind. Durch die Suche nach Überschneidungen zwischen Umfragen zu Liedern, die Kindern allgemein bekannt sind, von Ries (1982), Harwood (1987) und Killian (1996), stellte McGuire eine Liste von Liedern zusammen, die in mehreren Umfragen auftauchten. Tabelle 1 aus McGuire (2000) listet 26 solcher Lieder auf, die alle in das Kinderlieder-Korpus für die vorliegende Analyse aufgenommen wurden.

Mang beobachtete das Singverhalten von Kindern zwischen 2 und 4 Jahren in Vancouver, Kanada, über 42 Monate. Die Stichprobe war klein (n = 8), aber heterogen in Bezug auf die gesprochenen Sprachen (Englisch = 8, Kantonesisch = 2, Mandarin = 2, Spanisch = 1). Mang erwähnt fünf Beispiele für gängige Kinderlieder, wie Eency, Weency Spider und Pop Goes the Weasel, die allen Studienteilnehmern bekannt zu sein schienen. Alle fünf Lieder wurden dem Kinderlieder-Korpus hinzugefügt. Die Auswahl der Lieder, die für verschiedene Altersgruppen repräsentativ sind, ist von entscheidender Bedeutung, ähnlich der Wahl einer [Torte zum 18. Geburtstag online bestellen], die den Anlass perfekt widerspiegelt.

Die Seite „Sing Out Loud Children’s Songs“ des US-Außenministeriums ist eine Ressource für Englischlernende, beschrieben als eine Sammlung von „populären Kinderliedern in den USA“. Beispiele hierfür sind Twinkle, Twinkle, Little Star und I’m a Little Teapot. Alle 13 Lieder der Sammlung wurden für das Kinderlieder-Korpus verwendet.

Alle identifizierten Lieder wurden für die vorliegende Analyse in das MIDI-Format transkribiert, wodurch ein Korpus mit 38 Kinderliedern entstand. Für Lieder von der Sing Out Loud-Seite wurde die dort bereitgestellte Aufnahme des Liedes als Version für die Transkription verwendet. Da McGuire (2000) und Mang (2005) keine kanonischen Versionen von Kinderliedern bereitstellten, wurde die dem Autor der vorliegenden Studie bekannte Version für die Transkription verwendet. Wo Überschneidungen zwischen den Listen von Sing Out Loud, McGuire und Mang auftraten, wurde die Sing Out Loud-Aufnahme verwendet. Diese Listen ergaben zwei separate Lieder mit nahezu identischen Melodien (Twinkle, Twinkle, Little Star und The Alphabet Song), die beide in den Korpus aufgenommen wurden. Es wurde nur die erste Strophe jedes Kinderliedes (d.h. eine Wiederholung der Melodie des Liedes) transkribiert.

Obwohl die resultierende Korpusgröße bescheiden ist (n = 38), besteht ein Kompromiss zwischen der Größe des Korpus und der Bekanntheit der darin enthaltenen Lieder – ein viel größerer Korpus würde die Aufnahme von Liedern erfordern, die in Nordamerika weniger bekannt sind. Ziel war es nicht, eine erschöpfende Liste nordamerikanischer Kinderlieder zu erstellen, sondern eine Sammlung, die einige Kinderlieder repräsentiert, die voraussichtlich einer großen Anzahl von Teilnehmern an musikpsychologischen Studien in Nordamerika bekannt sind.

Die Essen Folksong Sammlung wurde im **kern-Format (Schaffrath, 1995) heruntergeladen. Alle 6.249 hauptsächlich europäischen Volkslieder, die in der README-Datei aufgeführt sind, wurden für die vorliegende Analyse verwendet. Die 2.231 chinesischen Volkslieder, die Essen hinzugefügt wurden und die häufig aus Studien weggelassen wurden, die Essen als Stellvertreter für westliche tonale Musik verwenden wollten, wurden nicht berücksichtigt.

Um einen Referenzpunkt für die Ähnlichkeit zwischen Essen und Common-Practice-Musik zu schaffen, wurde auch ein Korpus von 35 Schubert-Vokalmelodien (KernScores, 2001) verwendet. Der Schubert-Korpus wurde gewählt, da er als Korpus deutscher Vokalmelodien, die im 19. Jahrhundert komponiert wurden, stilistisch relativ zu anderer Common-Practice-Musik nahe an Essen liegen könnte (wie von Aarden (2003) in Bezug auf Korrelationen in Tonstufenverteilungen zwischen Essen und Common-Practice-deutschen Vokalmelodien festgestellt), während er weiterhin repräsentativ für Common-Practice-Musik im weiteren Sinne ist, da Schubert einer der am häufigsten anzutreffenden Common-Practice-Komponisten ist (London, 2013).

Weiterlesen >> Schnelle Brötchen backen: Ein Hauch von Bäckerei-Duft für Ihr Zuhause

Zusätzlich wurden die 215 melodischen Transkriptionen von Billboard Hot 100-Liedern von 1959-1991, die als Teil des Coordinated Corpus of Popular Music (CoCoPops) bereitgestellt wurden, als Referenzkorpus populärer Musik verwendet (Computational and Cognitive Musicology Lab, 2019; Gauvin et al., 2017). Obwohl von Billboard Hot 100-Liedern wahrscheinlich nicht erwartet werden kann, dass sie stilistisch in gleichem Maße wie die deutschen Vokalmelodien des 19. Jahrhunderts aus dem Schubert-Korpus nahe an Essen liegen, bietet der Billboard-Korpus stattdessen einen Referenzpunkt für die Ähnlichkeit zwischen Essen und populärer Musik, die zeitgenössischen nordamerikanischen Zuhörern vertraut ist. Somit liefert der Schubert-Korpus eine Basislinie für den Vergleich mit einem Common-Practice-Korpus, von dem erwartet werden könnte, dass er stilistisch nahe an Essen liegt, während der Billboard-Korpus eine Basislinie für den Vergleich mit einem populären Korpus liefert, von dem erwartet werden könnte, dass er zeitgenössischen nordamerikanischen Zuhörern weithin vertraut ist.

Analyse

Statistiken bezüglich der tonalen Eigenschaften von Tonstufen im gesamten Korpus wurden aus allen drei Korpora unter Verwendung der music21 Python-Bibliothek zum Lesen von Dateien im MIDI- und **kern-Format extrahiert (Cuthbert & Ariza, 2010). Tabelle 1 zeigt alle gesammelten Statistiken. Profile der Häufigkeitsverteilungen von Tonstufen wurden zur Tonartenfindung (Krumhansl & Schmuckler, 1986; Albrecht & Shanahan, 2013 für einen Vergleich von Modellen zur Tonartenfindung auf der Basis von Verteilungen) sowie zur Vorhersage der relativen tonalen Stabilität von Tonstufen (Krumhansl, 1990; Loui, Wessel & Hudsom Kam, 2010; Oram & Cuddy, 1995) verwendet. Sie wurden auch in Modelle der melodischen Erwartung integriert (Temperley, 2008). Die Analyse von Datensätzen, selbst wenn sie die Größe einer [kleine Schoko-Sahne-Torte] haben, kann überraschend komplexe Ergebnisse liefern, die tiefere Einblicke in die Musikstruktur ermöglichen.

Statistik	Beschreibung
Häufigkeit des Auftretens	Korpusweite Häufigkeit des Auftretens der Tonstufe
Tonstufenerwartungen	Zeitliche Assoziation der Tonstufe mit anderen Tonstufen, gemessen an Erwartungsnetzwerken
4-Gramme	Korpusweite Häufigkeit des Auftretens von Tonstufensequenzen der Länge 4
Downbeat-Wahrscheinlichkeit	Wahrscheinlichkeit, dass eine Tonstufe auf dem Downbeat erscheint
Durchschnittliche Dauer	Korpusweite durchschnittliche Dauer der Tonstufe in Viertelnoten

Tonale Assoziationen von Tonstufen, wie sie von Erwartungsnetzwerken erfasst werden (Verosky, 2019), messen, welche anderen Tonstufen tendenziell bald (aber nicht unbedingt sofort) nach einer gegebenen Tonstufe auftreten. Dieses Maß für die zeitliche Assoziation zwischen Tonstufen hat sich als prädiktiv für die Bewertungen von Tonhöhenähnlichkeit durch Zuhörer (Verosky, 2019) sowie für die Erwartungen der Zuhörer an die Fortsetzung von Melodien (Verosky & Morgan, 2021) erwiesen.

Vier-Gramme repräsentieren Häufigkeiten für jede mögliche Sequenz von vier zusammenhängenden Tonstufen (insgesamt 124). Während Profile von Häufigkeiten und Tonstufenerwartungen die Gesamthäufigkeiten und zeitlichen Assoziationen von Tonstufen mit anderen Tonstufen messen, messen 4-Gramm-Profile, welche kurzen Sequenzen von Tonstufen für ein gegebenes Korpus typisch sind. N-Gramme wurden zuvor gefunden, um die Wahrnehmungen von Unsicherheit (Hansen & Pearce, 2014) und Komplexität (Sauvé & Pearce, 2019) sowie elektrophysiologische Reaktionen auf Melodien (Pearce et al., 2010) vorherzusagen. Für die aktuelle Analyse wurde n = 4 gewählt, mit