Schon vor Ernst Kurth und Victor Zuckerkandl gibt es Autoren, die Musik als eine Art virtuelles Universum beschreiben – beherrscht von Kräften, ähnlich denen der realen Physik. Bereits Rameau vergleicht die in der Musik wirkenden Gesetze mit der zu seiner Zeit gerade neu entdeckten Gravitation, und auch Schenker spricht vom «Willen der Töne». Beide jedoch bringen ihre Beobachtungen nicht in ein System. Auf der andern Seite geht Fred Lehrdahl nach GTTM mit eingehenden Untersuchungen zu Tonräumen eigene Wege. Er schliesst dabei einerseits an die Resultate der Chomsky-inspirierten generativen Musiktheorie an und versucht, dabei noch ungelöste Probleme anzugehen – in erster Linie die Stabilitätsbedingungen tonaler Musik. In einem bemerkenswerten Kapitel seines Buches «Tonal Pitch Space»[1] über Tonspannung und -anziehung greift er aber auch explizit die Ideen von Kurth und Zuckerkandl auf. Er präzisiert sie.
Der genauere Blick beschränkt sich nicht auf die Rahmentheorie und die Klärung der psychologischen Vorgänge, die dem Phänomen zugrunde liegen. Qualitative Muster von Spannungshierarchien finden sich ja bereits in den Prolongationsanalysen von GTTM. Lerdahl geht einen – spektakulären – Schritt weiter: Er quantifiziert die Tonenergien und «Gravitations»-Kräfte und setzt sich damit auch über das Verdikt Zuckerkandls hinweg, dass der musikalische Raum eben nicht vermessbar sei.
Die Kräfte, die zwischen einzelnen Tönen in einem Musikstück zum Tragen kommen, analysiert Lerdahl auf zweierlei Art. Zum einen untersucht er diejenigen zwischen unmittelbar aufeinander folgenden Ereignissen als sequentiell vorliegende Verhältnisse. Zum andern untersucht er die Kräfte zwischen den Ereignissen, die in Prolongationsanalysen hierarchisch aufeinander bezogen sind. Er nennt dies das hierarchische Modell der musikalischen Kräfte.
Um Lerdahls Modell nachvollziehen zu können, muss man zuerst seine Konzeption eines Basisraumes und die Differenz der Tonhöhen kennen. Es ist dabei nicht so wichtig, genau zu verstehen, was hier weshalb geschieht. Die darunterliegende Theorie ist zwar nicht unbedingt schwierig zu verstehen, aber ziemlich komplex und formalistisch. Es genügt deshalb fürs erste, einfach einen Eindruck davon zu haben, wie Lerdahl vorgeht.
Zu jeder Tonleiter gehört laut Lerdahl ein abgestufer Tonraum, der auf der höchsten Ebene von den Oktaven gebildet wird und auf der nächstfeineren vom Oktav-Quint-Rahmen. Dahinein passt sich die Dreiklangsebene mit Grundton, Terz und Quinte, in die wiederum die diatonische Tonleiter eingepasst wird. Die feinste Strukturierung schliesslich ist die chromatische Tonleiter. Die Ebenen sehen zum Beispiel für die C-Dur-Tonleiter folgendermassen aus:
Ebene a: | c | |||||||||||
Ebene b: | c | g | ||||||||||
Ebene c: | c | e | g | |||||||||
Ebene d: | c | d | e | f | g | a | h | |||||
Ebene e: | c | cis | d | dis | e | f | fis | g | gis | a | ais | h |
Dazu definiert Lerdahl drei entscheidende Kennzahlen. Zwei davon beziehen sich auf Verschiebungen im Quintenzirkel. Zum einen werden die Anzahl Verschiebungen im Quintenzirkel gezählt, die benötigt werden, um den einen Dreiklang auf den andern abzubilden. Um den C-Dur-Dreiklang auf den d-Moll-Dreiklang abzubilden, braucht es zum Beispiel zwei Schritte: einen Quintschritt von C auf G und einen von G auf D. Diese Kennzahl wird mit «j» bezeichnet. Die zweite Kennzahl wird auf der Ebene der Tonleiterverhältnisse ermittelt. Dabei zählt man, wieviele Schritte man im Quintenzirkel machen muss, um die dem einen Akkord zugrunde liegende Tonleiter auf die dem andern zugrunde liegende abzubilden. Diese Kennzahl wird mit «i» bezeichnet. Sie entspricht der Anzahl Kreuze oder Bs, welche die beiden Tonarten unterscheiden. So ist i etwa für den Schritt vom C-Dur-Dreiklang zum D-Dur-Dreiklang gleich 2, von C-Dur zum E-Dur-Dreiklang gleich 4 oder vom B-Dur- zum D-Dur-Dreiklang gleich 4 (2 Bs, 2 Kreuze).
Die dritte Kennzahl weicht etwas von gewohnten Theorien ab. Um sie zu ermitteln, verschieben wir von oben nach unten gesehen alle Ebenen bis zur Dreiklangsebene c entsprechend zwei zu vergleichenden Dreiklängen. Der d-Moll-Dreiklang sieht im C-Dur-Basisraum etwa so aus:
Ebene a: | c | d | ||||||||||
Ebene b: | c | d | a | |||||||||
Ebene c: | c | d | f | a | ||||||||
Ebene d: | c | d | e | f | g | a | h | |||||
Ebene e: | c | cis | d | dis | e | f | fis | g | gis | a | ais | h |
Nun zählt man von der oberen Ebene an alle Einträge, die vom einen zum anderen Basisraum neu hinzukommen (die, welche wegfallen, ignoriert man). Vom C-Dur-Dreiklang zum d-Moll-Dreiklang kommen folgende hinzu:
Auf der Ebene a: ein d
Auf der Ebene b: ein d und ein a
Auf der Ebene c: ein d und ein f und ein a.
Insgesamt sind also 6 neue Einträge dazugekommen. Diese Kennzahl der unterschiedlichen Tonhöhen wird mit «k» bezeichnet.
Die (lokale) Spannung zwischen zwei aufeinander folgenden Akkorden definiert Lerdahl als Summe der drei Kennzahlen. Als Beispiel für die Spannungsverhältnisse gibt er eine vereinfachte Analyse eines Mozart-Sonatensatzes an:
Lerdahl-Analyse eines Mozart-Sonatensatzes
Vom ersten Schritt zum zweiten ist die sequentielle Spannung = 0, da derselbe Akkord vorliegt. Vom zweiten zum dritten (erste Stufe auf den Sextakkord der fünften Stufe) ist i = 0 (die Tonleiter ist dieselbe), j = 1 (der Akkord ist ein Schritt im Quintenzirkel entfernt) und k = 4 (hinzu kommen 4 Tonhöhen gemäss der angegebenen Zählmethode), die sequentielle Spannung ist also gleich 5. Die Messreihe für die Spannungsabfolge lautet:
I | I | V6 | vii06/V | V | V | V4/ii | ii6 | V4 | I6 | ii7 | V7 | I |
0 | 0 | 5 | 8 | 5 | 0 | 11 | 5 | 7 | 5 | 8 | 5 | 5 |
Es ist wichtig, im Auge zu behalten, dass diese Spannungs-«messung» nicht auf den Grundton bezogen ist, sondern vom einen jeweils auf den nächsten Schritt. Der Schritt von V6 auf vii06/V bedeutet also etwa das grössere Spannungsverhältnis, als derjenige von vii06/V auf V.
Soviel zur sequentiellen Spannung. Die Ermittlung der hierarchischen ist etwas komplizierter, weil die Prolongationsreduktion ins Spiel kommt.
Zur Erinnerung: Prolongationen widerspiegeln die Vereinfachung oder Vergröberung musikalischer Strukturen aufgrund der Beobachtung, dass einige Ereignisse fundamentaler sind als andere. So kann etwa die Schlussformel:
vereinfacht werden zu
In dem Beispiel sind also nicht nur die Töne e, d, c, h und c sequentiell aufeinander bezogen, sondern auch e und c sind auf einer höheren Ebene direkt aufeinander bezogen. In GTTM wird dies, wie wir bereits wissen, mit Hilfe einer Baumstruktur verdeutlicht:
Hierarchische Analyse der Schlussformel
d steht hier in einem gewissen Spannungsverhältnis zum übergeordneten c, und dieses Spannungsverhältnis nennt Lerdahl in TPS eben das hierarchische.
Die Grundidee bei der Festlegung eines Masses für die hierarchische Spannung ist nun folgende: Sie wird zunächst einmal aufgeteilt in eine lokale und eine globale Komponente. Die lokale Komponenten wird im Grunde genommen auf die gleiche Weise ermittelt wie die sequentielle Spannung, nur dass statt der sequentiell aufeinander folgenden Ereignisse ein Ereignis mit dem ihm direkt hierarchisch übergeordneten verglichen wird. Die globale Komponente erhält man, indem man auch noch das Spannungsverhältnis hinzuaddiert, in welchem das übergeordnete Ereignis zu einen wiederum ihm übergeordneten steht. Sind noch höhere Stufen der Hierarchisierung vorhanden, so können diese Werte rekursiv weiter ermittelt werden. Diese globale Komponente nennt Lerdahl die vom dominanten Ereignis weitervererbte Spannung.
Dies alles tönt schon nach ziemlich schwer verdaulicher Kost. Dabei bleibt es aber nicht, denn wenn man sich mit den subtilen Spannungen und Hierarchien in der Musik näher beschäftigt, stellt man fest, dass da eine Fülle an subtilen Kräften ins Spiel kommt, die zusammen – um mit Hermann Hesse zu sprechen – eine Art Glasperlenspiel ergeben. Die bislang quantifizierten Spannungsverhältnisse betreffen ja auch bloss die Kräfte, die aufgrund der Positionen von Ereignissen innerhalb des «Kraftfeldes» der Tonleiter und Akkordstufen entstehen. Dazu kommen etwa auch die vor allem von Ernst Kurth immer wieder beschworene melodische Energie, die Anziehung melodischer Ereignisse durch andere.
In dieser Hinsicht greift Lerdahl explizit auf die klassische Physik zurück. Es existiert hier, meint er, ein melodisches Gegenstück zur newtonschen Gravitationskraft. Die Formel für melodische Gravitationen hat überdies ebenso die Gestalt eines invers-quadratischen Verhältnisses. Salopp ausgedrückt nimmt die Anziehung zwischen zwei melodischen Ereignissen proportional ab – eben in einem quadratischen Verhältnis zur Distanz. Eine Rolle spielt in der angegebenen Formel überdies die Stabilität der beiden Ereignisse innerhalb des Basisraumes. Die resultierende Formel hat tatsächlich das Flair eines virtuellen physikalischen Gesetzes:
Seien s1 die Stabilität der Tonhöhe p1 und s2 diejenige der Tonhöhe p2, von der p1 angezogen werde. n sei die Anzahl der Halbtonintervalle zwischen p1 und p2 (um eine Division durch 0 zu vermeiden, wird überdies verlangt, dass p1 und p2 nicht gleich sind). Die melodische Anziehung folgt dann dieser Formel:
Ein Beispiel: Der Wert von s für C ist 4, derjenige für f ist 2, zwischen C und f sind 5 Halbtonschritte. Die melodische Anziehung zwischen C und f ist also:
Lerdahl ist der Meinung, dass die Formel plausible Resultate ergibt. Allerdings räumt er ein, dass man sie experimentell überprüfen und gegebenenfalls modifizieren müsse, wenn sie sich mit der menschlichen Wahrnehmung nicht decke. Übrigens fällt auf, dass die melodische Anziehung asymmetrisch ist. Die ermittelte Anziehung von C durch f (0,02) fällt mit derjenigen von f durch C nicht zusammen:
Intuitiv gesprochen zieht der Grundton den auf vierter Stufe stehenden Ton mehr an als umgekehrt, weil der Grundton mehr «Masse» in Form von Stabilität innerhalb des Basisraumes hat.
Spannung und Anziehungskraft können auch kombiniert werden, etwa indem Stimmführungsprinzipien bei der Ermittlung der Spannung zwischen Akkorden berücksichtigt werden (in Tat und Wahrheit tut dies Lerdahl in der verfeinerten Form seiner Spannungsdefinition). Allerdings ist Lerdahl der Meinung, dass die «Gravitationskräfte» nur in einem lokal sehr begrenzten Bereich ins Spiel kommen und auf grössere Entfernungen zu einer blossen Fiktion werden. Auf grössere Distanzen kommen seiner Meinung nach als Spannungserzeuger eher Erinnerungen an globale strukturelle Eigenschaften zum Zug.
Lerdahl zeigt sich der Gravitationsmetapher gegenüber allerdings auch skeptisch. Ein Grund dafür, sie fallenzulassen sieht er etwa in der Tatsache, dass Raumvergleiche in Bezug auf Musik zwar universell sind, nicht jedoch die Richtungen, die in diesem Raum gesehen werden. Mit andern Worten: Auch wenn sich alle darüber einig sind, dass Musik in einem wie auch immer gearteten Raum stattfindet, so herrscht doch keineswegs Einigkeit darüber, was darin oben und unten, respektive vorne und hinten oder rechts und links sein soll. Lerdahl kommt zum Schluss, dass die «bemerkenswerte expressive Kraft der Musik eine Manifestation des verinnerlichten Wissens über Objekte, Kräfte und Bewegungen ist – widerspiegelt im Medium von Tonhöhen und Rhythmen».
————————–
[1] Fred Lehrdahl, Tonal Pitch Space, Oxford University Press, Oxford 2001