Kivys moderate Form einer Cooke-Theorie

Der Amerikaner Peter Kivy, ein bemerkenswerter zeitgenössischer Musikästhetiker, geht in seinem Hauptwerk «The Corded Shell»[1] davon aus, dass eine Theorie der musikalischen Expressivität nur  entwickeln werden kann, wenn zuvor geklärt wird, was wir genau meinen, wenn wir sagen, Musik sei ausdruckshaft (expressive).[2]

Sprechen wir von Ausdruck, so setzen wir – nach Kivy – üblicherweise voraus, dass die Emotion tatsächlich vorhanden ist. Herabhängende Mundwinkel sind nur dann Ausdruck von Traurigkeit, wenn die entsprechende Person tatsächlich traurig ist. Die herabhängenden Mundwinkel im Gesicht eines Bernhardiners haben lediglich den Ausdruck von Traurigkeit, ohne dass der Bernhardiner tatsächlich traurig ist[3]. Wenn Kivy von Ausdruckshaftigkeit der Musik spricht, meint er letzteres: «Musik ist traurig» meint zum Beispiel, dass Musik den Ausdruck von Trauer hat, ohne dass sie selber traurig ist.

Dass Musik nicht traurig sein kann in dem Sinne, in dem ein Mensch (oder ein Bernhardiner) traurig sein können, liegt daran, dass nur empfindungsfähige Wesen Gefühle besitzen können. Die Absurdität der Annahme, dass Musik selber zur Traurigkeit fähig ist, zeigt sich auch darin, dass wir nicht die angemessene Reaktion auf einen solchen Befund zeigen, wenn wir Musik hören: Wir gehen nicht hin und versuchen, sie zu trösten.

Mit welcher Genauigkeit kann Musik Gefühle zum Ausdruck bringen? Ist es zum Beispiel möglich, detaillierte Bezüge herzustellen zwischen musikalischen Kunstwerken und der Biografie ihres Schöpfers, wie dies Cooke mit Beethoven unternimmt? Kivy diskutiert als Beispiel eine Passage über den ersten Satz der Hammerklaviersonate aus J.W.N.Sullivans Beethoven-Biographie[4]: «Diese für Beethovens Spätwerk so charakteristischen kalten Harmonien vermitteln nicht mehr das warme, menschliche Vertrauen eines Mannes, der weiss, dass am Ende der Sieg stehen wird. Sie bringen eine starke, nüchterne Entschiedenheit zum Ausdruck, furchtlos zwar, aber ohne die Lebhaftigkeit der Freude am Widerspruch.»

Kivy führt die Passage als Beispiel für die Überzeugung an, dass Musik Ausdruck von bestimmten Gefühlen ist. Sie illustriert jedoch zugleich die unbotmässige Genauigkeit, mit welcher der Ausdrucksgehalt der Musik gerne beschrieben wird, und das nicht belegbare Bemühen, in der Musik Biografisches festzumachen.

In seiner Klassifikation der Gefühle bleibt Kivy bewusst vage. Vagheit entspricht nämlich, wie er meint, durchaus dem Gegenstand. In einer Antwort auf Einwände seines Kritikers Anthony Newcomb[5] unterscheidet er – stilistisch etwas unschön (wie er selber zugibt) – zwischen pauschalen Ausdruckseigenschaften (Geps, von: «gross expressive properties») und subtilen Ausdruckseigenschaften (Seps, von: «subtle expressive properties»). Geps bezeichnen so allgemeine Gefühle wie Traurigkeit, Fröhlichkeit, Jubel, Wut und so weiter. Seps bezeichnen ganz spezifische Gefühle wie im obigen Beispiel die entschlossene Kälte eines desillusionierten alten Mannes. Die Unterscheidung deckt sich weitgehend mit derjenigen Hanslicks.

Werden in Beschreibungen von Musik lediglich Geps benutzt, drohen sie trivial zu bleiben. Seps hingegen können – zumindest in reiner Instrumentalmusik – nicht rational festgemacht werden. Um der Trivialität zu entgehen, lässt Kivy auch sogenannte Meps (von: «moderate expressive properties») als mögliche Beschreibungen von Musik zu. Meps bilden die Mitte zwischen Geps und Seps.

Seps sind, wie erwähnt, in der Instrumentalmusik nicht auszumachen. Texte jedoch, die Musik unterlegt werden (also vor allem Liedtexte), können Meps in Seps verwandeln, weil der konkrete Inhalt des Textes eine Konkretisierung des entsprechenden Ausdrucksgehalts der Musik zur Folge hat. Mit anderen Worten: Worte machen Seps, sie enthüllen sie nicht. So kann zum Beispiel das Programm der «Symphonie fantastique» von Berlioz den darin vorfindlichen Meps genauer bestimmbaren Inhalt geben. Die «Symphonie fantastique» mit Programm ist mithin ein anderes Werk als diejenige ohne[6].

Was bietet uns Gewähr dafür, dass unsere Beschreibung in Meps von Musik auch tatsächlich zutrifft? Auch was diese Frage betrifft, bleibt Kivy vage, allerdings fragt sich diesmal, ob die Vagheit gerechtfertigt ist – wir sehen uns vor der Frage wieder, die Hanslick vermied und an der Cooke scheiterte.

Ein Beleg dafür, dass ein Musikstück tatsächlich diese oder jene Meps besitzt, ist nach Kivy die nicht bestrittene, intersubjektiv diskutierbare eigene Erfahrung. Kivy weist darauf hin, dass meistens Konsens darüber besteht, ob ein Musikstück diese oder jene Meps besitzt und setzt sich damit eines ähnlichen Zirkularitätsverdachts aus wie Cooke, der behauptet, wenn jemand die Musik nicht richtig fühle, dann sei er eben unmusikalisch. Möglicherweise beisst sich Kivys Argumentation aber auch in den Schwanz, wenn er Meps als diejenigen in der Musik festmachbaren Eigenschaften definiert, über die intersubjektiver Konsens besteht.

Eine weitergehende Analyse der Meps hätte theoretische Überlegungen zu den logischen, psychologischen und erkenntnistheoretischen Mechanismen der musikalischen Ausdruckshaftigkeit zur Voraussetzung; dies jedoch leistet Kivy nicht, was er selber als Mangel anzusehen scheint[7]. Seine Theorie des musikalischen Ausdrucks liefert lediglich «eine Beschreibung, nicht aber eine Erklärung der musikalischen Ausdruckshaftigkeit».

Wie bereits erwähnt, verwirft Kivy die Vorstellung, dass der Musik Gefühle zu eigen sind, wie sie einem Menschen angehören. Musik ist nicht in dem Sinne traurig, in dem ein empfindungsfähiges Wesen traurig ist. Weitere Vorarbeiten zur Formulierung einer Theorie des musikalischen Ausdrucks müssen deshalb geleistet werden mit Blick auf die Beziehung zwischen einem Gefühl G und der Musik, die den Ausdruck von G hat.

Kivy diskutiert zwei mögliche Positionen. Die erste, die er die Sprachtheorie des Wachrufens (Arousal Speech Theory) nennt, stellt drei Behauptungen auf:

  • Musik hat den Ausdruck von G, weil sie das Gefühl G im Zuhörer wachruft.
  • Sie ruft das Gefühl G im Zuhörer wach, weil sie der menschlichen Stimme beim Äussern von G ähnelt.
  • Hörende erkennen die Ähnlichkeit und fühlen aufgrund von Empathie oder Mitgefühl ein ähnliches Gefühl[8].

Die Zuhörenden verhalten sich also ähnlich wie Kinder, die zu weinen beginnen, wenn sie ein anderes weinen hören.

Kivy bringt gegen die Theorie des Wachrufens die üblichen Einwände vor. Zunächst ist nicht einsehbar, weshalb wir uns Musik, die den Ausdruck Leiden bringender Gefühle hat, überhaupt aussetzen würden, da sie uns ja Leiden schaffen müsste. Tatsächlich aber finden wir auch im Erlebnis solcher Musik einen Genuss.

Das Argument ist wichtig, steht und fällt aber damit, dass die Beschaffenheit des behaupteten Genusses genauer charakterisiert wird (um die Unfall-Falle zu vermeiden: Menschen sind ähnlich fasziniert von Unfällen und Schaden anderer, die tatsächlich Leiden zum Ausdruck bringen). Kivy scheint sich dieses Problems zu wenig bewusst zu sein. Zum zweiten kann häufig die Beobachtung gemacht werden, dass das Gefühl, das von Musik in den Zuhörenden geweckt wird, nicht identisch ist mit demjenigen, dessen Ausdruck die Musik hat, was aber mit Punkt 3 unverträglich ist. Kivy zitiert zum dritten einen Einwand Richard Wollheims: Eine Voraussetzung der Sprachtheorie des Wachrufens ist die Ansicht, dass die Eigenschaften des Ausdrucks von der Musik nicht auf bewusstem Weg auf die Zuhörenden übertragen werden. Sie verschiebt demnach Eigenschaften der Musik, die wir durchaus als offenkundig ansehen, auf die Ebene versteckter oder dispositioneller Vermögen[9].

Kivy entscheidet sich aus diesen Gründen für die zweite Theorie, die er die Sprachtheorie des Wahrnehmens nennt (Cognitive Speech Theory).

Zwei Punkte charakterisieren diese:

  • Musik hat den Ausdruck von G, weil sie die expressiven Charakteristiken der menschlichen Stimme repräsentiert.
  • Der Hörer erkennt und identifiziert die von der Musik zu diesem Zweck geschaffenen Zeichen (Icons). Die beiden Punkte nun sind verträglich mit einem dritten: Die Identifikation des repräsentierten Gefühls G löst in den Zuhörenden ein Gefühl aus, das nicht notwendigerweise mit G identisch ist.[10]

Ein Herzstück der Sprachtheorie des Wahrnehmens ist der Begriff der Repräsentation. Tatsächlich ist die Frage danach, wie die Repräsentation von Gefühlen in der Musik möglich ist, äusserst komplex, und Kivy widmet ihr ein eigenes Buch[11], welches das Projekt von «The Corded Shell» weiterführt.

Die Idee, dass wir in der Musik bestimmte Gefühle erkennen, weil diese die Natur nachahmt (Mimesis), verwirft Kivy nicht, er verweist allerdings darauf, dass «The Corded Shell» keine Theorie darüber liefern kann, wie diese Nachahmung möglich ist. Die Existenz des Phänomens erklärt er auf biologistische Weise: Wir hören in der Musik Gestalten, weil wir dazu disponiert sind, in Formen allgemeine Gestalten zu sehen. Aus einer solchen Disposition liess sich in der Menschheitsgeschichte ein evolutionärer Vorteil gewinnen[12] – der entsprechende Gestaltungsprozess bleibt jedoch unbewusst.

Man darf dabei die Unbewusstheit der Art und Weise, wie wir Ähnlichkeiten schaffen, nicht verwechseln mit der Unbewusstheit, die von der Sprachtheorie des Wachrufens postuliert wird in Bezug auf die Gefühle, deren Ausdruck die Musik hat. Letztere werden erst mit Hilfe der Ähnlichkeiten transportiert, sind mithin erst auf einer höheren Ebene anzutreffen.

Als Voraussetzungen zur Formulierung einer Theorie des musikalischen Ausdrucks skizziert Kivy mögliche Weisen der Repräsentation und nähert sich dabei der Konzeption Deryck Cookes: Die erste – er nennt sie Konturtheorie (Contour Theory), ist die bereits vorgestellte, die davon ausgeht, dass Musik den Ausdruck des Gefühls G aufgrund irgendwelcher Ähnlichkeiten hat. Die zweite – von ihm als Konventionstheorie (Convention Theory) bezeichnet – sieht vor allem gewohnheitsmässige Assoziationen zwischen bestimmten musikalischen und emotiven Merkmalen (features) als für die Repräsentation verantwortlich. Solche Merkmale brauchen keineswegs strukturell analog zu sein. Am musikalischen Ausdruck haben nun sowohl Kontur als auch Konvention Anteil. Es existiert zudem die genetische Hypothese, die besagt, dass Ausdruckshaftigkeit aufgrund von Konvention sich auf ursprüngliche Ausdruckshaftigkeit aufgrund von Kontur zurückführen lässt.

Damit sind die Bausteine der Theorie des musikalischen Ausdrucks bereitgestellt. Wir formulieren sie in vier Punkten: Die Musik der abendländischen Tradition besteht aus Mustern (features), die mindestens einer der vier Kategorien angehören:

i) solchen, die Ähnlichkeit aufweisen mit ausdruckshaftem Verhalten irgendwelcher Art.
ii) solchen, die nicht für sich allein Ähnlichkeit aufweisen mit ausdruckshaftem Verhalten, aber in bestimmten Kontexten dazu beitragen, Ähnlichkeit zu formen.
iii) solchen, die zu einem früheren historischen Zeitpunkt Ähnlichkeiten aufwiesen mit ausdruckshaftem Verhalten und zu einem späteren aus Konvention oder Gewöhnung als ausdruckshaft angesehen werden.
iv) solche, zwischen denen und ausdruckshaftem Verhalten nie Ähnlichkeit bestand, die aber zu einem früheren historischen Zeitpunkt aufgrund ihrer syntaktischen Funktion dazu beigetragen haben, Ähnlichkeit zu schaffen und zu einem späteren, nach gewandelter syntaktischer Funktion, aus Konvention oder Gewöhnung als ausdruckshaft angesehen werden.

Die Punkte i und ii betreffen die Beiträge der Konturtheorie zum musikalischen Ausdruck, die Punkte iii und iv die aufgrund der genetischen Hypothese postulierten Wandlungen der Kontur in Konvention: iii bezeichnet die historische Wandlung der unter i erfassten Merkmale, iv diejenige der unter ii erfassten.

Ein Beispiel als Illustration von Punkt i der Theorie: Wo finden wir Ähnlichkeiten zwischen musikalischen Merkmalen und ausdruckshaftem Verhalten? Kivy führt ein bekanntes Beispiel an: die melodische Linie, die einen klagenden Seufzer nachahmt[13]. Sie findet sich zum Beispiel im letzten Akt von Mozarts «Le nozze di Figaro». In ihrer f-Moll-Arie beklagt Barbarina den Verlust einer Brosche («L’ho perduta, me meschina! ah chi sa dove sarà») mit einer fallenden kleinen Terz auf «sa dove sarà», welche die charakteristische, Schmerz evozierende kleine Sext der Molltonleiter auf schwerer Zeit betont.

Dieselbe Figur findet sich nach Kivy im Nebenthema des ersten Satzes der beethovenschen Pathétique-Sonate (das in der Reprise sogar auch in f-Moll steht), in der Arie der Desdemona im IV. Akt von Verdis «Otello» («Salce! Salce!»). Allerdings scheint die starke Seufzer-Terz in Otellos Arie dem Text angemessen, nicht jedoch Barbarinas Klage über den Verlust der Brosche.

Punkt ii lässt sich verdeutlichen mit der gewandelten Funktion des verminderten Dreiklangs. In der klassischen Harmonielehre bleibt er auflösungsbedürftig, ist er aktiv in dem Sinne, dass er irgendwohin führen muss. Syntaktisch bleibt er in traditionellen Kontexten unvollständig, etwa wie ein Prädikat ohne Subjekt. Die Funktion hat er jedoch nicht aus sich selber, und im erweiterten harmonischen Verständnis späterer Zeit geht sie weitgehend verloren. Dennoch hören wir ihn auch in solchen Zusammenhängen noch immer als ruhelos, quälend-spannungsreich. Das Beispiel ist allerdings ungeschickt gewählt, weil der verminderte Dreiklang ursprünglich nicht in die Kategorie i, sondern in die Kategorie ii gehörte.

Kivys Beispiel zur Illustrierung von Punkt iii ist die chromatische Skala in bestimmten melodischen Zusammenhängen. Er führt es nicht weiter aus, vermutlich aber denkt er an solche Formeln wie das chromatisch fallende barocke Seufzermotiv.

Punkt iv schliesslich lässt sich mit Hilfe des Moll-Dreiklangs und des Dur-Dreiklangs in bestimmten Kontexten verdeutlichen. Der Moll-Dreiklang besass früher eine ähnliche Funktion wie zwischen 1700 und 1900 der verminderte Dreiklang (was zum Beispiel die barocke Gepflogenheit zeigt, in Moll stehende Musik mit einem Dur-Dreiklang, der für sich alleine stehen kann – mit der sogenannten pikardischen Terz –, abzuschliessen). Wir verleihen dem Moll-Dreiklang heute aber gerade deshalb gerne das Prädikat «traurig», weil wir in früherer Musik Anklänge an seine Unvollständigkeit als Ausdruck von Trauer wahrnehmen.

Wie bereits erwähnt, versteht sich Kivy trotz seiner Verteidigung des musikalischen Ausdrucks als Formalist im Sinne Hanslicks. Die Position ist konsistent, weil seine Theorie nicht behauptet, dass Musik Gefühle zum Thema hat, sondern lediglich, dass sie den Ausdruckscharakter bestimmter Gefühle trägt. Die Sprachtheorie des Wahrnehmens behauptet ja, dass die Gefühle, die der Hörer beim Anhören von Musik empfindet, nicht notwendigerweise identisch sein müssen mit denjenigen, von denen die Musik den Ausdruck hat. Zwar gibt es Musik, die Gefühle repräsentiert, und sogar solche, die Geschichten erzählt. Der weitaus grössere Teil, vor allem der Instrumentalmusik, ist jedoch ausdruckshaft, aber nicht repräsentierend[14].

Es bleibt demnach die Frage zu beantworten, zu welchem Zweck Musik Geps und Meps besitzt. Die üblichen Analysen reiner Instrumentalmusik lassen sich nach Kivy in drei Typen einteilen (aus Gründen der Klarheit wird in dieser Aufstellung Kivys Punkt 2 als Punkt 3 angesehen und umgekehrt):

  • Sie sind rein formalistisch und betrachten Qualität des musikalischen Ausdrucks als nicht existent oder irrelevant.
  • Sie sind rein gefühlsmässig und reduzieren Instrumentalmusik auf geheime Programme.
  • Sie weisen Mischformen auf, behandeln Qualität des Ausdrucks aber nicht als formale Strukturen, auch wenn sie in solche eingebettet sind.

Kivy schlägt eine nach seiner Überzeugung völlig neue Alternative vor: Qualitäten des Ausdrucks sind nach seiner Auffassung solche der musikalischen Struktur (insofern konstitutiv für die Form). Das heisst, eine Analyse reiner Instrumentalmusik im Sinne Kivys hat zur Aufgabe, die strukturelle und syntaktische Funktion der Ausdrucksqualitäten aufzuschlüsseln.

Geps und Meps besitzen demnach nicht die Funktion einer Mitteilung über Gefühle, sondern sie sind grammatikalische Bestandteile zum Bau der Musik, genauso wie Harmonie, Rhythmus und so weiter. Formale Analyse ohne Analyse der Ausdrucksqualitäten ist in diesem Licht betrachtet unvollständig, formale Analyse, die den Ausdrucksqualitäten bloss semantische oder repräsentierende Funktion verleiht, sogar falsch.

Das Ende von Sound and Sentiment bildet die Skizze eines Forschungsprogrammes. Zwei Punkte stehen im Vordergrund: Es geht darum, die Aufgabe der Ausdrucksqualitäten der Musik in reiner Instrumentalmusik im Sinne obiger Alternative zu üblichen Analysen zu präzisieren. Und zum zweiten bedarf das genuin ästhetische Erlebnis der Schönheit (und wie diese in die Musik kommt) genauerer Betrachtung. Denn dass diese Schönheit vorhanden ist und dass sie uns bewegt, davon ist Kivy überzeugt. Allerdings bleibt auch ihm die Frage, wie das möglich ist, rätselhaft.[15]

———————————————-

[1] Peter Kivy, Sound Sentiment, An Essay on the Musical Emotions, Including the complete Text of The Corded Shell, Temple University Press, Philadelphia 1989

[2] Ob im Englischen die Bedeutungsunterschiede zwischen «Ausdruck sein von» (to express) und «den Ausdruck haben von» (to be expressive of) denen im Deutschen analog sind, soll uns nicht weiter beschäftigen.

[3] a.a.O., Seite 12

[4] J.W.N. Sullivan, Beethoven, His Spiritual Development, Vintage Book, New York 1960 (The Corded Shell,  Seite 13

[5] Anthony Newcomb, «Sound and Feeling», Critical Inquiry, X (1984)

[6] Peter Kivy, Sound Sentiment, Seite 192

[7] a.a.O., Seite 171

[8] Peter Kivy, The Corded Shell, Seite 22

[9] im Original: «hidden or dispositional endowment», Corded Shell, Seite 23)

[10] (Corded Shell 24)

[11] Peter Kivy, Sound and Semblance, Reflections on Musical Representation, Cornell University Press, Ithaca 1984

[12]  (Sound Sentiment, Seite 172)

[13]  (Corded Shell, Seite 71)

[14] (Sound Sentiment, Seite 234)

[15]  Sound Sentiment, Seite 258