Band 69 der ORPOEUS-Schriftenreihe zu Grundfragen der Musik herausgegeben von Martin Vogel
Uwe Seifert
Systematische Musiktheorie und Kognitionswissenschaft Zur Grundlegung der kognitiven Musikwissenschaft
Verlagfür systematische Musikwissenschaft GmbH Bonn1993
©Verlag flir systematische Musikwissenschaft GmbH Bonn 1993 All rights reserved Printed i.n Germany
ISBN 3-922626-69-6
FÜR GITTA
7 INHALT
I.
1.1
EINLEITUNG
Das Vordringen der lnformationstechnologien in die musikwissenschaftliche Forschung .. . .... ...... ... . . ... .... .. . 1 3 Computermusik, musikalische Informatik und Kognitive Musikwissenschaft . . ......................... 16 .
1.2
.
..
.
..............................
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..............
.
.
...
.
. ....
2. SYSTEMATISCHE MUSIKTHEORIE & KOGNITIONSWISSENSCHAFT WISSENSCHAFTSTHEORETISCHE UND EPISTEMOLOGISCHE PROLEGOMENA
2.1
Methodelogische Probleme der Entwicklung einer Systematischen
Musiktheorie .. .. ... ... .... .. ... .. . ...... . .. .. . ... ...... .. . ... .... .. .. . .. . ...... . .. ... ... ... ... 21 2.1.1 Walter Wioras programmatische Idee einer Systematischen Musiktheorie 23 2.1.2 Aktuelle Forschungen zu einer Systematischen Musiktheorie . .. .. 26 2.1.3 Hinwendung zur Kognitiven Musikpsychologie .. . . .. 35 .
. . . . . . . . . . . . . ........................ . . . . . . . . . . . . . . . . ..................... . . . . . . . ............ .
...
.. ...
.
.
. . . . . .. . . . . . . . . . . .
2.2. Grundlegende Konzepte der Kognitionswissenschaft in ideengeschichtlicher Darstellung .. .. . . ... . . ...... 2.2.1 Die Kognitionswissenschaft als neue wissenschaftliche Disziplin . 2.2.2 Neurologische Grundkonzepte . . ..... .. ......................... 2.2.2.1 Zur Anatomie des Nervensystems . ... . . 2.2.2.1.1 Das Nervensystem in der black box-Betrachtungsweise .............
..
. .
........
..
.....
..
. .......
.
...
...
. . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .
.
....
.......
41 41 43 43 44
8 Die Informationsaufnahme und -weiter!eitung am Beispiel des
22212 0
0
0
.
auditorischen Systems
22212 22212 22212 22213 222l 3 22213 2222 0
0
0
.
0
0
0
0
0
0
0
0
0
0
0
0
0
0
.
o
o
o
o
o
0
0
0
.
0
0
0
0
oooooooooooooooOoooooooooo...... o. .ooooooo. . . . . . . .o ..ooo. . . o
1 Die periphere Umsetzung 2 Die Hörbahn 3 Das Hörzentrum
oo . . . . . . . . .. . . . . . . . . . . . . . . . .......... oo................
. . . . . . oooo. . . . ...... oo. . oo. . . .oo ..........o o..........0 0 0 0 0 0 0 0 0 0 o o 0 0 0 0 o o 0 0 0
oo...... oooooo. . . . oo. . . . oooooooooooooooooooo .... oo . . . .oooooooo.......
Der Schichten-und Säulenaufbau des Cortex l Die Schichten 2 Die Säulen (Kolumnen) als funktionale Einheiten
oooooooooooooooooooooooo
ooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooo
o o o o o o.... oo. . . . . . .
Die Nervenzelle und die Signalübertragung zwischen den Nervenzellen Die Modellvorstellung des "klassischen" Neurons als funktional-anatomische Recheneinheit in der Neurophysiologie
000 00 0 0 00000 0 0 0 000 o o. . . . 000000000 o o.....o o 0 0 0 0 00 0 0 0 0 00000 . .0 oo•ooooooooo 0 0 0
22221 0
0
0
.
oo. . .
47 47 48 SO
53 53 55 56 57
2 2 2 2 l l Histologisch-anatomische Darstellung des Neurons und der o
o
o
o
.
Synapse
222 222 222 223 223 o
0
0
0
0
0
0
0
0
ooooooooooooooooooooooooooooooooooooooo ooooooooooooooooooooooooooooo. . . . .o .. o o o o o o
2 l l l Das Neuron 2 1 1 2 Die Synapse 2 1 2 Die Signalübertragung zwischen den Neuronen o
o
oooooooooooooooooooooooooooo. . . . oo . . . . ...... oo..oooooooooooooooooooooooooo
.
0
0
O O o o O O O O O O O O o o O O O O O O O O O o o O O O O O O O O O O O O O O O O o o O O O O O O O OOOooOOOOoooooooooooooo
0
.
.
OOOOOOOOOOO O o o O O O O o o O
Strukturelle Automatentheorie 1 Elementare Modeliierung des Verhaltens des Nerven systems mittels aus McCuUoch-Pitts-Neuronen bestehenden Nervennetzen 2 2 3 1 1 Das McCulloch-Pitts-Neuron 2 2 3 1 2 Eine wissenschaftshistori sche Anmerkung 0
0
..... oo........... oo......... oo.. oooo . . . . . . . . . . . . o
0
0
0
0
0
0
.. 00.......... 0.................000 ...... oo.... oo......... o.. o ..0oo...... o..
0
0
0
.
.............................. o o. . . . . o o............ 0
.
. . . . . . .o o..... 0 0...... o o.........
2 2 3 1 3 Oie formalen Nervennetze 2 2 3 l 4 McCulloch-Pitts-Neuronen, aussagenlogische Funktionen und 0
0
0
.
o
o
o
.
........ oooooooooo.......oo.... oo.... o o o o o o o o o o O O O O o o O O O
Schaltfunktionen logischer Gatter 2 2 3 1 5 Informationsspeicherung und Gedächtnis in Schaltwerken und
00 . . oo . . . . o o 00 00 0 0 . . . . . . 00........ 00 . . . . . . . .0
0
0
0
formalen Nervennetzen 0
0
0 0 0 0 00 0 0 0 0 0 0 0 00 00 0 0 0 0 0 00 0 0 0 00 0 0 0 0 0 00 ..o 00 0..0 000 000 ..o 000 00
.
..oo...oo .... oo ........o o . . . . . . . .
.. o
0
0
0
.
0
0
0
.
0
0
0
. . . . . . . . . . . . . . . . . . . . 00.....................
Automaten
22 22 22 22
321 322 4 41
o
o
o
.
0
0
0
0
0
.
0
0
.
66 66 69 70 71
.
2 2 3 1 6 Formale Neuronen und die xor-Funktion 2 2 3 1 7 Die "Realitätsnähe" der McCulloch-Pitts-Neuronenverbände 2 2 3 1 8 Die Bedeutung der Forschungsergebnisse von Warren Sturgis McCulloch und Walter Pitts (1943) 2 2 3 2 Nervennetze, logische Funktionen, logische Netze und endliche 0
57 58 58 60 66
Oooooooooooooo oooooooooOOOoooOOOooooooooooooooooooooo..o..oooooo...... o.. oooooooo
Nervennetze als endliche Automaten Logische Netze als endliche Automaten Abstrakte Automatentheorie
oooooooooooooo . . . . o o.... oo. . ooooooooOoooo
oooooooo. . . .oo..........o o. . . . . . o
. . . . oooo. . . . . . . . . .....o o . . . .......... oooo....... oo..o
Grammatische Regeln, endliche Automaten und reguläre Ereignisse
. . . 0 .... oo 0 0 0 ..o 0 0 0. . . oo 0 0 0 0 0 00 ......o 00 ..o 0 0 0 0 0 00 00 .. o 000..0000000 .. o00 0 00......
73 78 82 85 88 88 91 97
97
9 2.2.4.1.1 Kleenes Konzept des regulären Ereignisses als interne Reprä sentationen bei physikalischen Automaten und Organismen 2.2.4.1.2 Chomskys Konzept der grammatischen Regel als interne Repräsentation sprachlicher Strukturen . . . . . ... 2.2.4.2 TOTE-Hierarchien, Flußdiagramme und endliche Automaten in der "informationsverarbeitenden" Kognitiven Psychologie . 2.2.4.3 Turingmaschinen, effektiv berechenbare Funktionen, Algorithmen und LISP .. . 2.2.4.3.1 Turings introspektive Analyse des Rechenprozesses . . . . ... 2.2.4.3.2 Die Turing-Maschine in zwei Formulierungen 2.2.4.3.2.1 Die Turing-Maschine als endlicher Automat mit potentiell abzählbar unendlich vielen Feldern 2.2.4.3.2.2 Die Wang-Formulierung einer Turing-Maschine 2.2.4.3.3 Die primitiv-rekursiven Funktionen als Teilklasse der partiellrekursiven Funktionen . . . . 2.2.4.3.4 Die Programmiersprache LISP . 2.2.5. Die Idee des Physical Symbol System (PSS) . . . 2.2.5.1 Die logisch-funktionale Struktur des Von-Neumann-Rechners . 2.2.5.2 Das Physical-Symbol-System-Paradigma Computa tion, Churchs-These, Kognitionswi�senschaft 2.2.6 und Neomechanismus - ein erstes Fazit ...... ...... ...... .. .... .... .... ....
. . . . . . . . . . ..........
.
.....
.
.... .. .......
......
97
. . ..
105
..
118
....................................... . .... . .
..
. . . . ............ . . . . . . . . . .
............ . . . . . . . ........ . . . . . . . . . . . .
...................
......
. . . ..........
... . . . . . . . . . . . . .
........................
......... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .... . . . . . . ..................
..
. . . . . . . . ..
. . . . . . . . . . . .............
..
127 128 132 132 137 141 149 159 159 162 170
3. ANWENDUNGEN KOGNITIONSWISSENSCHAFTLICHEN DENKENS IN DER MUSIKFORSCHUNG
3.1 Grammatiken zur Repräsentation musikalischer Strukturen . . . 174 3.1.1 Das Erwartungskonzept bei der Perzeption musikalischer Strukturen und seine Explikation durch das Konzept des abstrakten Automaten 174 3.1.2 Lindenmayersysteme zur Explikation des Konzeptes der Melodievariation . . .................................... ... ... ......... ...... ...... 193 3.1.3 Graphgrammatik und frühe Riemannsche Funktionstheorie . . 200 3.1.4 Grammatik und Jazz . .. . .. .. . . 207 3.1.5 Petri-Netze als Beschreibungsmittel musikalischer Strukturen im Rahmen der Computermusik und Kognitiven Musikpsychologie . 217 3.1.6 Grammatik, Künstliche Intelligenz und nord-indische TablaMusik 234 . .....
...
.......
..
.
..............
.........
.
. . . . . . . . . . . . . . ............
.......
.
....
.......
... .......
.......
.. .
. . . . ........... . . . . . . . . . .......... ................ . . . . . . . . ............ ........................
10 3 . 2 Künstliche Intelligenz, Kognitive Musikpsychologie und . 253 . . .... . .. .. . Musiktheorie . . ....... .. 3.2.1 Prozedurale Musikanalyse, LISP, constraints und Jazz ...... ........... 253 3.2.2 Schenkersehe Analyse mit LISP ... ....................... ... ...... . ..... . . . 272 3.2.3 Prozedural versus deklarativ - Semantische Netze und PROLOG in der Musikforschung . . . . ........ ...... . . . .. . . .......... .. ........ 295 3.2.4 Propositionale Wissensdarstellung und das Schemakonzept in der ... ....... .. ............ ... ............ ............ . 305 Kognitiven Musikpsychologie 3.2.5 Beschreibung von Bewegungsverhalten und rhythmischen Strukturen 318 3.2.6 Produktionsregeln und die Erklärung von Lernprozessen ........ ..... 328 3.2.7 Produktionsregeln, blackboard-Modell und die generative . . 332 Musiktheorie . . . . . . . . ........... ............ . . . . ... ..
. .
.
............. ......
. .
..
.
..
..................... ....... .
.
.
.
.
.
.
.
. .... ...
.
.
..
. .. . .
.
.
.
.
.
.
......
...
.
..................
.
.
.
.
..
. .
.
....
.
..
.......
.
. .. . 3. 3 Neurale Netzwerke in der Kognitiven Musikpsychologie 3.3.1 Tendenzielle Hinwendung zum Konnektionismus .... . . 3.3.2 Die Struktur eines neuralen konnektionistischen Netzwerkes ... . .. .. 3.3.2.1 Das Lernen . . . . . .. ... ..... ........ .............. ..... . . 3.3.2.2 Das funktionale Verhalten einer Einheit und eines Netzwerkes 3.2.2.3 Die Schichten eines formalen neuralen Netzes . . . . 3.3.2.4 Die Netztypen mit Bezug auf die Richtung des Informationsflusses 3.3.2.5 Die Idee des neuralen Netzwerkes an dem klassischen Beispiel der xor-Funktion ................. . . ..... . . .. ...... .. .. .............. . 3.3.2.6 Die Funktion xor in der symbolverarbeitenden Sprache LISP .. 3.3 .2. 7 Lernen in konnektionistischen Netzwerken - Ein Beispiel 3.3.3 Ein konnektionistisches Netzwerk zur Erkennung der Dur-Tonarten . . .. .... .. . ....
..
......
.
... ...
............... .
. ......
. ..
..
..
.
.
.
..
..
...........
..
.
..
.
...
.
.
...............
..
.........................................................................................
. .. .
.. . . .
...
...
..
.
.
.
.
.........
......
4.
........................ ...
....................
........
. .....
341 341 343 344 344 345 346 346 353 355 359
SCHLUSSBETRACHTUNG UND FORSCHUNGSPERSPEKTIVEN
4.1 Rückblick: Zusammenfassung der Arbeitsergebnisse . .. . .......... . 363 4.2 Gliederung der Kognitiven Musikwissenschaft und Ausblick auf weitere Forsc�ungen . . ...... ........ 368 4.2.1 Zur weiteren Forschungsstrategie der Kognitiven Musikwissenschaft .. . . . .. 370 .
............
.................
............................
. ..
...................
.
..
.
.
......
................... .........
.....
.
.
...
11 4.2.2 Zur Neuromusikologie .......................................................... ... ..... 375 4.2.3 Kognitive Musikwissenschaft als rein syntaktischer Forschungsansatz .............................................................. .. ... .... 375 .
..
.
.
..
ANHÄNGE
Anhang A Synopsis zur geschichtlichen Entwicklung der Kognitionswissenschaft .................................................. ....... Anhang B Elementare Mengenlehre ............. .............. .. ....................... Anhang C Diagramme............................... .............................................. Anhang D Tabelle häufig benutzter Programmiersprachen zur Bearbeitung von Problemstellungen kognitionswissenschaftlicher Musikforschung ... ... ......... ...... ...... ... ... ......... ................ Anhang E Beispielprogramme ................................................................
391 392
........................ LISTE DER ABBILDUNGEN ......................................... ....................... PERSONENREGISTER ..................................... ............ . ... ................... SACHREGISTER ....................................... .............................................
405 450 451 454
.
.
LITERATURVERZEICHNIS
.
.
·····-······················· · · · · · · · · · · · · · ·
.
.
.
.
379 385 390
13 1. EINLEITUNG 1. 1.
Das Vordringen der Informationstechnolo gien in die musikwissenschaftliche Forschung
Die Entwicklung der ersten programmspeichernden digitalen Computer in den 40er Jahren, sodann deren Kommerzialisierung in den SOer Jahren und die Miniaturisierung der Hardware, die einherging mit einer weitge henden Spezialisierung der Softwareangebote sowie immensen Kostensen kungen in den 70er Jahren, leitete einen Umbruch ein, dessen Folgen noch nicht abzusehen sind. 1 Neben den sozialen und ökonomischen Folgen sind speziell im Bildungsbereich, dem Kommunikationswesen und der For schung Auswirkungen2 zu spüren, wobei im letztgenannten Bereich neben dem vielfältigen Einsatz des Computers ein Entstehen neuer Disziplinen und Theorien zu verzeichnen ist. Um nur einige zu nennen: die Informatik mit der KI (Künstlichen Intelligenz) und deren Forschungsfelder der Bild und Sprachverarbeitung, der Robotik und der Expertensysteme; die Theo retische Informatik mit den Forschungsfeldern der Logik, der formalen Sprachen, der formalen Grammatiken, Theorie der Automaten, der Kom plexitätstheorie, der Berechenbarkeitstheorie, der Semantik der Program miersprachen sowie dem Rechnerentwurf. Diese Veränderungen hatten und haben direkt oder indirekt Einfluß auf andere Forschungsfelder und deren Theorienbildung. Zu nennen sind hier die Kognitive Psychologie, die Neu rowissenschaften mit Neurobiologie und Neurophysiologie, die Theoretische Biologie, die Linguistik mit der Komputationellen Linguistik und der generativen Transformationsgrammatik, Theoretische Linguistik und neu erdings, seit etwa 1973, die Kognitionswissenschaft. In der Kognitionswis senschaft zeichnet sich die Zusammenführung der dieser Entwicklung zugrundeliegenden Ideen ab, die erstmals in den 40er Jahren formuliert wurden und in diverse Wissenschaftsgebiete Einzug hielten.3 Dieser Um strukturierungsprozess betrifft sowohl die Natur- wie die Geisteswissen1) Die weltweiten gesellschaftlichen Veränderungen und Risiken behandelt Arbib 1984. Hierbei werden nicht nur die Umstrukturierungen im Bildungswesen, der Forschung so wie dem Sektor der nationalen und internationalen Kommunikation behandelt, sondern auch die ethisch-moralischen Probleme, die durch veränderte militärische Kriegsstrate gien wie z. B. pinball battle fields entstehen (vgl. Arbib 1984, 387 u. bes. 390). 2) Für den Bildungsbereich sei auf Diekmann 1987 verwiesen. Die Transformation des Wissens durch die Informationstechnologien wird aus "post.moderner" Perspektive von Lyotard 1980 behandelt. Einen Einblick in die Forschungen zur Kommunikation mit neuen Medien gibt Brand 1990. Den Einfluß der Informations:technologien auf die
französische Kultur arbeitet Levy 1987 heraus. 3 ) Die Kognitionswissenschaft kann als Fortführung der Kybernetik angesehen werden ; vgl. hierzu Arbib 1987, 1-15; Grundkonzepte der Kybernetik werden von Flechtner 1968 und Anschütz 1970 behandelt.
14 scharten, stellt sogar deren Trennung in Frage, und wirft neben wissen schaftstheoretischen auch epistemologische Probleme auf, da mit ·ihm eine Veränderung des anthropozentrischen Weltbildes1 einhergeht . Im Bereich der künstlerisch-musikalischen Tätigkeit als auch bei der wissenschaftlichen Durchdringung von Musik setzte die genannte Entwick lung in den SOer Jahren ein; erwähnt seien hier die ersten Versuche zur Computer-Komposition2 von Lejaren und Hiller und die Verwendung der Informationstheorie3 zur Untersuchung musikalischer Strukturen, sowohl als Kompositionsmittel wie hinsichtlich der Perzeption. Da ich mich mit den Auswirkungen der hier nur knapp skizzierten Entwick lung im Bereich der Musikwissenschaft beschäftige, ist zuerst der Gegen stand der Untersuchung einzugrenzen, wobei festzuhalten ist, daß trotz der vielfältigsten Aktivitäten im Bereich der Musik eine klare Klassifizierung der Anwendungen von Computern noch aussteht und der Aufarbeitung bedarf. Ich werde daher als erstes eine Gliederung der verschiedenen For schungs- und Anwendungsfelder für den Bereich Musik vorschlagen, wie sie sich m. E. für Forschung und Lehre in den nächsten Jahren ergeben werden, bevor ich mich mit den meiner Meinung nach wichtigsten und aussichtsreichsten Veränderungen für die Musikforschung zuwende. Die vorgeschlagene Klassifizierung ergibt sich für mich aufgrund schon bestehender Tendenzen und soll die Arbeitsteilung berücksichtigen, die ftir jeden komplexen Forschungsbereich notwendig ist und sich gerade mit Bezug auf Musik, in der künstlerische, technt'logische und wissenschaftli che Betrachtungsweisen aufeinandertreffen, anbietet. Daß die einzelnen Bereiche auf der Ebene der Grundlagenforschung zu sammenarbeiten, ist selbstverständlich; es ergibt sich jedoch gerade iür die Lehre die Forderung nach einer klaren Trennung der zu vermittelnden Kenntnisse, die zwar eine Verständigung zwischen den verschiedenen Dis ziplinen noch ermöglicht, aber auch die Spezifität der verschiedenen Forschungsansätze wahrt. Ausgangspunkt bildet also das für die jeweilige Fachrichtung vorherrschende Erkenntnisinteresse. In wissenschaftlicher Hinsicht steht die theoretische Durchdringung ei nes Forschungsgegenstandes im Vordergrund, die einen Begründungszu sammenhang fordert. Aussagen haben hier einen Geltungsanspruch, der sie von dem des bloßen Vermeinens unterscheidet. Es wird daher gemeinhin angenommen, daß das zu untersuchende Phänomen einer rationalen Analy se zugänglich ist. Für die Sphäre des rationalen Diskurses über den 1) Es sei auf Mazlish 19<67 verwiesen, der in der Geschichte der Menschheit vier ent scheidende Änderungen im anthropozentrischen Weltbild ausmacht: Kopernikus und die Abkehr von der geozentdschen Sicht des Universums: Darwin und die Evolutionstheorie; Freuds Entdeckung des "Unbewußten" und der zunächst letzte Schritt, in dem der Mensch als Maschine betrachtet wird. 2) vgl. z. B. Hiller 1956 und Neumann & Schappert 1959. 3) Cohen 1962 erörtert verschiedene Applikationen auf die Musik.
15 Forschungsgegenstand Musik ist insoweit die Musikwissenschaft als wis senschaftliche Disziplin zuständig. Der künstlerische Bereich ist gekennzeichnet durch ein mehr unbewuß tes, meist wenig wissenschaftlich-reflektiertes, jedoch stark ausgeprägtes ästhetisches Vermögen, etwa die individuellen "Schönheitsvorstellungen"; diese mögen einhergehen mit religiösen und sonstigen weltanschaulichen Überzeugungen. Der enge Umgang mit dem Material und die Kenntnis bestimmter ein geschränkter Traditionen wird vorwiegend durch eine Institution wie Hochschule oder Konservatorium vermittelt, wobei auch pädagogische Probleme im Vordergrund stehen. Die technologische Komponente greift häufig auf mathematisch-natur wissenschaftliche Forschungserkenntnisse zurück, um mit den zu einem Zeitpunkt gegebenen Mitteln effizient und kostengünstig Problemlösungen anzubieten. Ich unterteile daher die f Anwendung informationstechnologi schen Denkens im Musikbereich in folgende drei Felder1: a) Anwendung in der musikwissenschaftliehen Forschung; b) Anwendung an den Musikhochschulen und Konservatorien, sowohl flir künstlerische wie für pädagogische Zwecke; c) Anwendung in der Informatik, wie technologische Entwicklungen mit Bezug zur Musik (etwa Rechnerarchitekturen für die Computermusik) 1) Das jeweilige Forschungsinteresse bedingt natürlich die Komplexität des notwendigen Wissens aus dem Bereich der Informatik. Da die Computerbildung (computer literacy) gerade in den Geisteswissenschaften bisher unterentwickelt ist, l
of computation.
2. Understanding how to use computers.
3. Understanding how to program computers.
4. Understanding the science of computation. Unter Punkt 1 werden allgemeine Kenntnisse über grundlegende Begriffe wie "Algo rithmus", "Programm", "e-mail" etc. verstanden. Auch Kenntnisse der sozialen und er zieherischen Probleme, die im Zusammenhang mit der Computerisierung stehen, sind auf dieser Stufe zu vermitteln. Die Benutzung von Software wie Musik·, Textverarbei· tungs- und Datenbankprogrammen bildet den Inhalt der zweiten Stufe. Auf der dritten Ebene wird die Kenntnis mindestens einer Programmiersprache sowie die Bekannt schaft mit Kontroll- und Datenstrukturen gelehrt. Die Kenntnis der Inhalte dieser Ebene ist nicht für jede Person notwendig. Auf der vierten Stufe wird die theoretische Durchdringung der Konzepte der ersten, zweiten und dritten Stufe vermittelt. Wenn auch nicht die Kenntnisse der vierten Ebene für alle Personen notwendig sind, so sollte - auch um eine Entmystifizierung des Com puters und mit ihm verbundener Anwendungen und Forschungen zu bewirken -. so Nor man (1984, 224): every person
. (should, U. S.) become acquainted with the knowledge of
..
at least one of the other stages.
16 1. 2
Computermusik, musikalische Informatik und Kognitive Musikwissenschaft
Für die schon angesprochene Gliederung des Musikbereiches1 ergibt sich daher folgendes Bild: Der künstlerisch-pädagogische Sektor läßt sich differenzieren in die Anwendungen der Computermusik und des computer gestützten Lernens2 (CAI, computer assisted instruction). Es werden vor wiegend die Kenntnisse der ersten bis dritten Ebene (vgl. S. 1 5 Anm. 1 ) erforderlich sein. I m Gebiet der Computermusik lassen sich wiederum zwei Standardapplikationen benennen: zum einen der Bereich, in dem der Computer als Musikinstrument 3 zur Synthese und Manipulation von Klän gen eingesetzt wird; und zum anderen das Fachgebiet der Komposition, in dem die computerunterstützte Komposition4 (CAC; computer aided com position) von der automatischen Komposition5 (AC; automated composition) 1) Diese Klassifizierung bezieht sich vorwiegend auf die zu lehrenden Inhalte und die Herangehensweise an Musik mit der entsprechenden computer Jiteracy. Auf der Ebene der Grundlagenforschung ist diese Trennung sicherlich nicht aufrechtzuerhalten. Die Forschungsschwerpunkte des neu gegründeten "Zentrums für neue Musik und Audio technologien" (CNMA; The Center for New Music and Audiotechnologies in Berkeley. California) sind daher auch auf verschiedene Bereiche ausgerichtet (Wessel, Felcia no, Freed & Wawrzynek o. J, 1): a) die Entwicklung neuer Hardware-Technologie wie z. B. Klangprozessoren in paral leler VSLI-Architektur (very !arge scale Integration; d. h. mehr als 500 Gatter pro Chip; zur Klassifikation der verschiedenen Integrationstufen vgl. Coy 1988, SO); b) die Untersuchung perzeptueller und kognitiver Aspekte von Musik; c) neue Medien für den Musikunterricht in der Musikerziehung; d) technische und musikalische Probleme von Computermusik-Aufführungen. Ebenso verbindet die Abteilung für Computermusik des Media-Lab am MIT (Massachu setts Institute of Technology) künstlerische, technologische und wissenschaftliche Inter essen. Am IRCAM (Institut de Recherche et Coordination Acoustique-Musique) in Paris werden ebenfalls wissenschaftliche Untersuchungen zur Musikwahrnehmung neben Anwendungen neuer Technologien zur Komposition durchgeführt. Auch das 1983 in Marseille gegründete MIM (Laboratoire Musique et lnformatique de Marseille) zeichnet sich durch einen hohen Grad an interdiziplinärer Forschung aus (vgl. die Liste der Forschungsprojekte in Laboratoire o. J.). Für Italien sei nur auf die Forschungen zur Musik des DIST (Dipartimento di lnformatica Sistemistica e Telematica) in Genua und des Konservatoriums "L. Cherubini" in Florenz hingewiesen.
2) Zur CA! allgemein vgl. Suppes 1966 sowie Chambers & Sprecher 1980. Mit dem in den 70er Jahren begonnenen LOGO-Projekt unter Seymour Papert am MIT sollen u. a. neue Wege der Vermittlung von Musik erforscht werden (s. Goldstein & Papert 1977, 118). Für die Anwendung der CA! im Musikbereich s. auch Flender 1987. 3) Oie Anwendung des Computers als Musikinstrument wird z. B. in Mathews 1963, Mathews & Pierce 1987, Thies 1987 und Boulez & Gerzso 1988 diskutiert. Die Schriften von Koenig 1990, Stroh 1990 und Bickel 1990 spiegeln die verschiedenen Ebenen, auf denen Computermusik betrieben werden kann. 4) Zur CAC vgl. Lerdahl & Potard 1986.
5) Oie automatische Komposition wird ausführlicher von Ames 1987, Hiller & Ames
17 unterschieden werden kann. Der technologische Aspekt tritt in der musikalischen Informatik1 in den Vordergrund. Zentrale Forschungen sind auf die Entwicklung von Musik sprachen, Interfaces und Mensch-Maschine-Interaktionen ausgerichtet. Dieser Sektor setzt profunde Kenntnisse im Bereich der Rechnerarchitektur und der Programmiersprachen, d. h. Hardware- und Softwarekenntnisse, voraus. In der musikwissenschaftliehen Forschung lassen sich gängige Anwen dungen zur Auswertung von Daten, wie z. B . die multidimensionale Ska lierung, von der zentralen Stellung abgrenzen, die der Computer, bzw. die Computermetapher, in der neueren musiktheoretischen Forschung zu einer komputationellen Musiktheorie innerhalb des kognitionswissenschaftlichen Forschungsprogrammes einnimmt. Ein zunehmendes Interesse an systema tischer musiktheoretischer Forschung ist seit den 70er Jahren zu verzeichnen2• Es wird in diesem Zusammenhang auch von der Kognitiven Musikwissenschaft 3 gesprochen, die ebenso wie die Musiktheorie als Dis ziplin der Kognitionswissenschaft4 betrachtet wird. Diese Untersuchungen 1985 und Barbaud 1965 behandelt. 1) Mare Leman (1989, 3) spricht von einer Trennung der Kognitiven Musikwissenschaft (CM; Cognitive Musicology) und Forschungen der Künstlichen Intelligenz zur Musik (AlM; Artificial lntelligence & Music). Allerdings scheint mir der Term "Al & Music" zu eingegrenzt, da er angewandte Informatik im Bereich der Musik auf die Methoden der Kl einschränkt. Ein Produkt der angewandten Informatik wie die MIDI-Schnittstelle wäre nicht diesen Forschungen zuzurechnen. Daher ist m. E. der Term "musikalische In formatik" wie er schon seit Jahren in Frankreich - als informatique musica/e - be nutzt wird, vorzuziehen. Musikalische Informatik ist im Kern als Ingenieurwissen schaft anzusehen (vgl. Laske 1987, 79) und somit der Informati!k zuzurechnen. Nähere Informationen über die Entwicklungen in der musikalischen Informatik finden sich in Loy & Abbott 1985, Pennycook 1985, Gordon 1985 und Buhlert 1987.
2) vgl, auch Schneider & Seifert !986. 3) Der Ausdruck ''Kognitive Musikwissenschaft" dürfte auf Otto E. Laske 1977 zurückge hen. War !986 (Seifert 1986. 162) noch nicht ganz klar zu sehen, welche Bezeichnung sich für die von der Musiktheorie ausgehenden Forschungen innerhalb der Kognitions wissenschaft etablieren würde, so kann heute davon ausgegangen werden, daß sich der Begriff "Kognitive Musikwissenschaft" durchsetzen wird (vgl. Leman 1989, 3; Lischka 1987, 191; Laske 1977, 1986, 1987). 4) Der Terminus "Cognitive Science" wird meines Wissens zum ersten Mal 1973 in den "Comments on the Lighthili Report" von Longuet-Higgins benutzt (wieder abgedruckt in
Longuet-Higgins 1987, 45 u. 46). In einem Buchtitel tritt er bei Bobrow & Coltins 1975 auf. Als deutsche Übersetzungen des Wortes "Cognitive Science" sind in der Literatur "Kognitionswissenschaft", "Kognitive Wissenschaft" und "Kognitionsforschung" anzu treffen. Jedoch scheint sich im deutschsprachigen Raum der Terminus "Kognitions wissenschaft" durchzusetzen. In den anglo-amerikanischen Ländern wird dieses For schungsgebiet schon seit Jahren intensiv gefördert, und es existieren Forschungsinstitute und Studiengänge. Für Europa (vgl. lmbert et al. 1988) wurde hinsichtlich der Kogniti onswissenschaft ein "cultural lag" festgestellt, der durch intensivere Förderung in den
18
zeigen eine enge Beziehung von Musiktheorie und Kognitiver Musikpsy chologie, in der die Vorgänge musikalischer Kognition zu erforschen sind. Der italienische Komponist und Forscher Lelio Camilleri (1986, 1 ) formu liert diese Zusammenhänge wie folgt und ordnet diesen Forschungsansatz der Kogitionswissenschaft zu: . . . music theory as the theory of music
cognition, thus as part of cognitive science. Since in this view the com puter metaphor plays a relevant roJe, it can be defined as a computatio nal theory of music cognition.
'/... Aufgabe dieser Forschungen zur musikalischen Kognition, die als Er
rechnung interpretiert wird, ist es, die mentalen Repräsentationen musi kalischer Strukturen und deren Verarbeitungsprozesse zu untersuchen. Vorherrschende Denkmodelle für die Beschreibung perzipierter musikali scher Strukturen sind die aus der Linguistik stammende Idee der Gram matik und verschiedene in der Künstlichen Intelligenz2 entwickelte Ansätze.
90er Jahren ausgeglichen werden soll. Eine allgemeinere verstärkte Berücksichtigung dieses Forschungszweiges. innerhalb akademischer Institutionen in Europa läßt sich erst in neuerer Zeit feststellen (zur Kognitionswissenschaft vgl. Charniak 1984. Andler & Livet 1989, Lischka & Diederich 1987, Varela 1990, Gardner 1989, Münch 1992 sowie die seit September 1990 in Deutschland erscheinende Zeitschrift "Kognitionswissenschaft"). Die Beziehung von Kognitionswissenschaft und Musikforschung wird von Lerdahl & Jak kendoff 1983, Jackendoff 1987, Camilleri 1986, Lischka 1987a, McAdams & Deliege 1989, Agmon 1990, Seifert 1990 und Vecchione 1990a unter verschiedenen Aspekten diskutiert. 1) Der französische Musikwissenschaftler Bernard Vecchione (1990a) spricht in bezug auf die methodologischen Entwicklungen der letzten 20 Jahre von einer Revolution in der musikwissenschaftliehen Forschung. 2) Der Terminus "Künstliche Intelligenz" (KI) ist eine Übersetzung des seit 1956 in der amerikanischen Wissenschaft benutzten Wortes "artificial intelligence". Es soll von John McCarthy 1956 in Abgrenzung von den Forschungen zur Automatentheorie geprägt wor den sein. Die erste mir bekannte Schrift, welche die Wörter "artificial intelligence" im Titel enthält, ist Marvin Minskys Bericht "Some Methods of Artificial Intelligence and Heuristic Programming" anläßtich des "Symposium<s> on the Mechanization of Thought Processes" aus dem Jahr 1958. Die deutsche Übersetzung des amerikanischen arti ficial inte/Jigence mit "Künstliche Intelligenz" dürfte auf Karl Steinbuch (1961, 400) zu rückzuführen sein. Eine Übersetzung mit "Erkünstelte Intelligenz" bzw. "Scheinintelli genz" dürfte angemessener sein, wenn man die verschiedenen Systeme der angewandten
Künstlichen Intelligenz betrachtet. Eine konzise methodologische Kritik der Künstlichen Intelligenz in bezug auf die Erforschung intelligenten Verhaltens biologischer Systeme
geben Reeke & Edelman 1988 (vgl. auch die zum Teil anders motivierten Kritiken von Dreyfuß 1985, Winograd & Flores 1989, Weizenbaum 1980, Marr 1977). Zur schnellen Information über die Künstliche Intelligenz und ihre Forschungen sei auf Boden 1987 verwiesen. Seit den Anfängen der Künstlichen Intelligenz war auch die Musik For schungsgegenstand. Karl Steinbuch (1961, 400) schrieb: Als weiteres Beispiel Künstlicher Intelligenz möchte ich das automatische Komponieren von Musikstücken erwähnen
(._).
Hierbei werden Harmonielehre, Statistik bestimmter Stilfolgen und zufällige Signalfol gen nach rationalen Regeln kombiniert. Berücksichtigt man den geringen Aufwand und die geringe Entwicklungszeit, so ist es erstaunlich, was schon jetzt geleistet wurde. Daß
die Musikforschung in de:r KI cferzeit keinen ähnlichen Platz einnimmt wie die Sprach-
19
Ziel dieser Arbeit ist es einerseits, zentrale Konzepte des kognitions wissenschaftlichen Forschungsprogrammes1 herauszuarbeiten und einsichtig zu machen; andererseits dieses Forschungprogramm in Beziehung zu der Idee einer Systematischen Musiktheorie setzen. Es handelt sich also in wesentlichen Punkten um eine methodelogische Arbeit. Weiterhin werden die innerhalb dieses Forschungsparadigmas stehenden Arbeiten diskutiert, beginnend bei den "Klassikern" der 70er Jahre bis hin zu den neuesten Forschungen, in denen der symbolische und subsymbolisch-konnektionisti sche Ansatz derzeit als Paradigmen diskutiert werden. Ich gehe in fol gender Weise vor: Zuerst wird die Herkunft der Idee einer Systemati schen Musiktheorie innerhalb der Musikwissenschaft erarbeitet und einige neuere, punktuelle Forschungsbeiträge vorgestellt. Des weiteren wird der Hintergrund der Annahme erläutert, Kognition sei Errechnung bzw. Mu sikwahrnehmung sei musikalische Informationsverarbeitung. Zu diesem Zweck werden zentrale Konzepte der Kognitionswissenschaft und deren Beziehung in ideengeschichtlich-systematischer Weise eingeft.ihrt und un tersucht. Es wird hierbei weniger auf die formalen Aspekte dieser Kon zepte eingegangen, als vielmehr die inhaltliche Interpretation, wie sie ft.ir die Kognitionswissenschaft von Bedeutung ist, herausgearbeitet. Dies wird einsichtig machen, warum Forscher der Kognitionswissenschaft Computer simulationen mentaler Phänomene als Forschungsmethode fordern und betreiben. Eine Einordnung der philosophischen Grundposition dieses Forschungsansatzes bildet den Abschluß dieses Teiles. Behandelt werden die Konzepte: formales Nervennetz aus McCulloch-Pitts-Neuronen, logi sches Netz (sequentielles Schaltwerk), endlicher Automat, reguläres Ereignis (bzw. reguläre Menge, Sprache), TOTE-Einheit, Grammatik, Turingmaschine, Algorithmus, partiell- rekursive Funktion, LISP, Physical Symbol-System, Church-Turing-These (CT), Babbage-These (C) und Mechanismus-These (M). Anschließend werden verschiedene Anwendungen und Ausprägungen des kognitionswissenschaftlichen Forschungsprogrammes in der musiktheo retischen und musikpsychologischen Forschung vorgestellt und analysiert. forschung, dürfte
nicht zuletzt
auf
die
andersartigen
Erkenntnisinteressen
dieser
vorwiegend ingenieurwissenschaftlichen Disziplin :zurückzuführen sein. Dennoch zeich net sich seit Mitte der 80er Jahre eine verstärkte Hinwendung der Kl zur Musikfor schung ab, wie aufgrund der verschiedenen Workshops und Konferenzen mit dem The ma "Musik und KI" ersichtlich wird. Genannt seien nur (s. Laske 1989; Desain & Honing
1989): die seit 1988 in Amerika stattfindenden "Workshops on Artificial lntelligence and Music" der AAAI (American Association of Artificial Intelligence); der "First Workshop on Artificial Intelligence and Music 1988" der GMD (Gesellschaft für Mathematik und Datenverarbeitung) in St. Augustin bei Bonn; sowie der "European Workshop on Artifi cial lntelligence and Music 1989" in Genua. Antonio Camurri 1990 und Curis Roads 1985 geben einen Überblick über die Entwicklungen des Forschungszweiges "Al und Musik". 1) vgl. auch Seifert 1989, 1990.
20 Ausgegangen wird von der Idee der Grammatik, wobei verschiedene Gram matikkonzepte wie Graphgrammatiken, Lindenmayersysteme, Pattern Grammar, generative Grammatik und Petri-Netze zur Beschreibung unter schiedlicher musikalischer Strukturen vorgestellt und deren Anwendung diskutiert werden. Es wird sich zeigen, daß sich seit Mitte der 80er Jahre ein verstärktes Vordringen von in der KI entwickelten Methoden in die Bereiche Musik theorie und Musikpsychologie aufweisen läßt. Neben den Arbeiten der Klassiker aus der von der KI beeinflußten Musikforschung, wie Terry Winograd und Stephen Smoliar, werden u. a. neuere Ansätze von Levitt sowie Jenes, Miller und Scarborough vorgestellt. Aus der Kognitiven Mu sikpsychologie werden u. a. die propositionalen Repräsentationsformen, wie Herbert Bruhn und John Sloboda sie benutzen, untersucht. Gestreift werden hierbei Diskussionen, die in der Kognitionwissenschaft von Bedeu tung waren: die Debatte um propositionale oder piktorale Wissensreprä sentation sowie die Diskussion um prozedurale oder deklarative Repräsen tationsformen. Abschließend wird der Unterschied des subsymbolischen konnektionistischen Ansatzes gegenüber dem Physical-Symbol-System her ausgearbeitet und ein konnektionistisches Modell der Tonartwahrnehmung diskutiert. Eine Zusammenfassung der Arbeitsergebnisse mit einer Gliederung der Kognitiven Musikwissenschaft - in strukturelle oder theoretische Musikolo gie, Psychomusikologie und Neuromusikelegie -, die ich als "Systematische Musiktheorie" verstehe, sowie ein Ausblick auf weitere Forschungsperspek tiven bilden den Abschluß des Buches. Im Anhang befinden sich ein Überblick über die Geschichte der Kognitionswissenschaft mit Bezug auf die Musik forschung, drei von mir entwickelte Programme zur Illustration der angesprochenen Probleme und unterschiedlichen Programmierstile. Weiter hin gibt es eine tabellarische Darstellung der Anwendung verschiedener Programmiersprachen auf unterschiedliche musiktheoretische Probleme in der Kognitiven Musikwissenschaft.
21 2. SYSTEMATISCHE MUSIKTHEORIE & KOGNITIONSWISSENSCHAFT
WISSENSCHAFTSTHEORETISCHE UND EPISTEMOLOGISCHE PROLEGOMENA 2. 1
Methodologische Probleme der Entwicklung einer Systematischen Musiktheorie
Eine Abhandlung, die Systematische Musiktheorie und Kognitionswissen schaft als Forschungszweige in Beziehung setzt bzw. musiktheoretische Forschung als Grundlagenforschung innerhalb der Kognitionswissenschaft versteht, muß, bevor sie die Beziehung dieser beiden Zweige sowie deren Stellenwert in der Systematischen Musikwissenschaft angeben kann, auf zeigen, was unter Systematischer Musiktheorie und Kognitionswissenschaft zu verstehen ist. Schon bei der begrifflichen Bestimmung der Systematischen Musiktheo rie ergeben sich grundlegende Probleme: Sie existiert nicht institutio nalisiert und man findet sie als wenig entwickeltes Projekt in der musik wissenschaftlichen Literatur. Systematische und somit wissenschaftliche Musiktheorie als Fach existiert nicht in der deutschen Musikwissenschaft. Musiktheorie überhaupt wird als Handwerkslehre verstanden, die auf ver schiedene Bereiche der Musikwissenschaft verstreut ist. Rudolph Stefan (1957, 238) merkt zum Status der Disziplin Musiktheorie innerhalb der Musikwissenschaft an: Die eigentliche Musiktheorie, also etwa Harmonie lehre und Kontrapunkt, ist reine Handwerkslehre. In einem wissenschaft lichen Sinn gehört dieser Komplex. zu den verschiedenen Zweigen der Musikwissenschaft. Die reine Tonsatzlehre ist historisch bestimmt, sie gehört also zur Musikgeschichte, die Frage nach dem »Wesen« klangli cher Erscheinungen (etwa des Dreiklangs) zur Tonpsychologie.
Ausgehend von solch einer Situation, in der Musiktheorie auf verschie dene Forschungsbereiche verteilt ist, wird es natürlich schwierig, eine Systematische Musiktheorie mit eigenständiger Methode und einheitlichem Forschungsziel zu entwickeln. Die Situation wird weiterhin dadurch erschwert, daß eine Systematische Musiktheorie von einem Großteil musikhistorischer Forscher für unmöglich gehalten wird, wobei sich die Begründung auf die Unterscheidung von Na tur- und Geisteswissenschaft stützt. "Physikalismus" und "Historismus" sind die Schlagwörter, die den Kern der Argumentation gegen eine Sy stematische Musiktheorie im Sinne einer Grundlagenforschung kennzeich nen (vgl. Dahlhaus 1971, 103 ff.). Teilweise wurde sogar soweit gegangen, nicht nur der Möglichkeit einer Systematischen Musiktheorie zu wider sprechen, sondern sogar ihr und der Systematischen Musikwissenschaft insgesamt die Existenzberechtigung abzusprechen (vgl. Feder 1978; 1980). Daß die musiktheoretische Forschung in der Bundes-republik über Jahr zehnte keinen wissenschaftlichen Status hatte, wird besonders deutlich,
22
wenn man sich die Diskussion um den Stellenwert der Systematischen Musikwissenschaft innerhalb der Musikwissenschaft in den 70er Jahren anschaut. Für die Kontrahenten aus den Gebieten der Historischen Mu sikwissenschaft und der Systematischen Musikwissenschaft spielte der Be zug auf die musiktheoretische Forschung eine untergeordnete, wenn nicht gar keine Rolle. Es ist ein gewisses Einvernehmen in dem Punkt zu erkennen, daß Musiktheorie zwar als "Handwerkslehre" - vornehmlich von Musikhochschulen und Konservatorien - zu tradieren sei, aber Musik ei ner wissenschaftlichen Erforschung innerhalb einer systematischen musik theoretischen Forschung nicht bedürfe bzw. diese nicht möglich sei. Sollte es sich sowohl bei der "dogmatischen" als auch der "systemati schen" Musiktheorie um Gebiete handeln, die dem zu erforschenden Ge genstand wesensfremd sind? Allem Anschein nach wird diese Meinung in nerhalb der musikwissenschaftliehen Forschung vertreten ! Gleichwohl gab es Tendenzen - zumal von Amerika ausgehend - , sich mit Musiktheorie wissenschaftlich zu beschäftigen, die sich in den 80er Jahren zunehmend verstärkten, allerdings in der bundesdeutschen Musik forschung wenig Beacbtung fanden. Die Situation für eine Systematische Musiktheorie innerhalb eines solchen wissenschaftlichen Umfeldes ist äus serst schwierig, und dies, obwohl sich in den letzten Jahrzehnten grundle gende Veränderungen in der wissenschaftlichen Forschung abzeichnen, die zwar einen positiven Einfluß auf musiktheoretische Forschungen haben, deren Auswirkungen aber gerade in der Musikwissenschaft bisher noch nicht genügend erkannt wurden. Allerdings wurde eine programmatische Konzeption der Systematischen Musikwissenschaft vorgeschlagen, in der die wieder steigende Bedeutung musiktheoretischer Forschung hervorgeho ben wurde, nachdem deren Absinken in der musikwissenschaftliehen For schung konstatiert wurde. So schreiben Vladimir Karbusicky und Albrecht Schneider (1980, 95): nachdem diese (d. h. die Musiktheorie; U. S.) über lange Zeit nicht allein Kerndisziplin der Systematischen Musikwis senschaft, sondern zentraler Gegenstand der Beschäftigung mit Musik gewesen, nahm ihre Geltung und ihr Rang soweit ab, daß sie manchen nur mehr als "Propädeutik und Handwerks/ehre" möglich scheint und . "Musiktheorie" nicht mehr als eigenständiger Teil der Systematischen Musikwissenschaft begegnet. Da man den überlieferten Bestand der Musiktheorie aber nicht vernachlässigen und auch nicht der Musikhisto rie überantworten kann, ... , kommt nur eine kritische Aufarbeitung in Betracht, die heutige Problemstellungen mit einbezieht. Zu einer "Mu siktheorie" der Gegenwart gehören auch neue Einsichten, welche die Anwendung von untraditionellen disziplinären Blickpunkten erbrachte. Da dieser Prozeß sehr vielfältig ist, erweist sich die nach systematischen Kriterien vorgenommene Sichtung und Auswertung der gesamten neue ren Literatur zur "Musiktheorie" als dringend gefordert. ... Neben der Tendenz, die Systematische Musiktheorie wiederherzustellen und/oder
23
neu zu entwickeln, finden sich Ansätze zu einer philosophisch-wissen schaftstheoretisch bestimmten "Theorie der Musik".
Auch wenn der Hinweis auf die Möglichkeit einer Systematischen Mu siktheorie verdienstvoll ist, so kann es allein mit einer Aufarbeitung der neueren Literatur zur Musiktheorie nicht getan sein. Es stellen sich viele Fragen und Probleme, von denen ich einige nenne: Was ist die Aufgabe, das Ziel einer Systematischen Musiktheorie? Welches sind ihre Methoden? Inwieweit ist an frühere Forschungen zur Systematischen Musiktheorie anzuknüpfen und an welche? Ist nicht ein vollständiger Bruch mit der bisherigen Forschungstraditi on notwendig und können nur elementare Ideen aus den bisherigen Forschungen übernommen werden? Diese Unsicherheit drückt sich in dem Passus die Systematische Mu siktheorie wiederherzustellen und/oder neu zu entwickeln aus, in dem offen gelassen wird ob: a) die Systematische Musiktheorie wiederherzustellen ist bzw. b) vielleicht sogar neu zu entwickeln bzw. c) wiederherzustellen und neu zu entwickeln ist. Bevor solche Fragestellungen jedoch beantwortet werden können, muß man sich einerseits Klarheit über die Herkunft des Terminus "Systemati sche Musiktheorie" verschaffen und andererseits fragen, welches das Ziel einer Systematischen Musiktheorie sein könnte und ob es nicht schon verschiedentlich Ansätze zu einer solchen Theorie gegeben hat. 2. l . 1
Walter Wioras programmatische Idee einer Systematischen Musiktheorie
Um über diese Fragen Klarheit zu gewinnen und entscheiden zu können, welches Vorgehen notwendig und das aussichtsreichste ist, muß zunächst Klarheit über den Begriff "Systematische Musiktheorie" gewonnenen wer den. Auch in geschichtlicher Betrachtung scheint es im wesentlichen bis her nur programmatische Äußerungen zu geben und eine Forschungstradi tion, die sich in Lehrwerken oder ausgearbeiteten Konzepten nieder schlägt, ist nicht auszumachen. Jens Rohwer (1967, 131) der für eine Systema tische Musiktheorie argumentiert, muß eingestehen, daß ein Forschungs feld mit genauen Aufgabendefinitionen bisher fehlt: Diese Blätter fixieren Anmerkungen zu einem Begriff, den Walter Wiora der Fachwelt seit 15 Jahren ins Bewußtsein zu bringen sucht: Systematische Musiktheorie. Daß Zweifel an der klaren Umrissenheil dieses Begriff bestehen, ist wohl niemandes Schuld, sondern scheint in der jahrhundertelangen Zerris-
24 senheit des Forschungszweiges zu liegen. Eine Klärung der Ziele, Grundannahmen und Methoden der Systemati schen Musiktheorie scheint um so notwendiger, da bekanntlich schon Al bert Wellek gerade dieses Argument - das nicht genau umrissene Kon zept einer wissenschaftlichen Musiktheorie - dazu benutzte, musiktheore tische Forschung zugunsten einer Reduktion auf Musikpsychologie und Musikästhetik aus dem Arbeitsbereich der Systematischen Musikwissen schaft zu entfernen. Albert Wellek (1948, 166) argumentierte: Streng ge
nommen ist der Begriff "Musiktheorie" zu allgemein und unbestimmt, um wissenschaftlich ernstgenommen zu werden: er bezeichnet kein fest um schriebenes Gebiet. So wie diese sog. Musiktheorie gewöhnlich (...) ge lehrt wird, ist sie technisch praktisch ausgerichtet: eine technische, eine angewandte Hilfswissenschaft. Und er (Wellek 1948, 166) fährt fort: Als eigentliche Wissenschaft ist alle Angewandte Musikwissenschaft - Musikpädagogik und auch so verstandene "Musiktheorie" - ... nur denkbar auf dem Boden einer Systematischen Musikwissenschaft insbesondere einer Musik� chologie . ... Eine selbständige "Musiktheorie" gibt es nicht daneben; und der eben formulierten Forderung an diese (Musiktheorie im wesentlichen als Musikpädagogik zu begreifen; U. S.), auf der Musikpsychologie auf zubauen, steht die bisherige Geschichte dieser "Musiktheorie" stark im Wege. Auf die Forschungen Hugo Riemanns zurückgreifend, hielt Walter Wiora (1948, 188) dieser Reduktion von Musiktheorie auf Musikpsychologie die Idee einer "wissenschaftlichen Musiktheorie" entgegen, die sich 1951 (Wiora 1951, 173 -175) zu der Vorstellung einer "Systematischen Musik theorie" verdichtete, von der Walter Wiora (1937/1972, 445) sich, wie zu vermuten ist, die Grundlegung einer neuen Kompositionslehre aus ur sprünglicher Besinnung auf das Wesen der Musik erhoffte. Die Syste matische Musiktheorie wird der dogmatischen Musiktheorie - als im we sentlichen auf Lehre ausgerichtete Theorie - gegenübergestellt (Wiora 1951, 174): Zur Herausbildung der systematischen Musiktheorie (im Ge
gensatz zu dogmatischen Zweigen, wie der Kontrapunktlehre als Normie rung des Palestrinasti!s, der klassischen Harmonielehre oder den Dogmati sierungen heutiger Richtungen) ruhrt die Verbindung vergleichend-historischer Zusammenfassung und phänomenologisch-denkerischer Wesenserkenntnis. Systematische Musiktheorie muß sich auch um ihre Grundlegung bemü hen, denn, so Walter Wiora (1951, 174), im Gegensatz zu Ideologien,
welche Richtungen alter und neuer Musik begrifflich überbauen und pro pagieren, baut systematische Musiktheorie auf eigenem Grunde. Die Idee einer Systematischen Musiktheorie - einer wissenschaftlichen Musiktheorie - innerhalb einer Systematischen Musikwissenschaft, die als Grundlagenforschung verstanden wird, verdichtet sich in weiteren Schrif ten Wioras. Er (Wiora 1960, 52) formuliert diese Idee mit folgenden Worten: ... ein Grundzug cfer gegenwärtigen Musikwissenschaft (ist; U. S.) der
25 Aufstieg ihrer systematischen Seite, welche auch
"Musikalische Grundla
genforschung" genannt wird. Er wurde durch Carl Stumpf, Riemann,
von
Hornborstel, Ernst Kurth und andere engeleitet i und vollzieht sich sowohl in naturwissenschaftlichen Zweigen (Akustik, Physiologie,
gie)
und in der Musikpsychologie, auf
die
stalt- und Strukturlehre fruchtbar auswirkt, als auch schen
Musiktheorie
und Analyse
des
Gehörpsycholo
sich besonders die neue Ge
musikalischen
in
der
Systemati
Kunstwerks.
Durch
Eritillung mit historischem und ethnologischem Stoff und dessen verglei chende Betrachtung überwindet
sie
die frühere
Beschränktheit
auf
die
abendländische Neuzeit.
Neben der Systematischen Musiktheorie fällt die Betonung der methodi schen Bedeutung "vergleichenden Denkens" auf, wie es im ausgehenden 19. Jahrhundert propagiert wurde. Die Systematische Musiktheorie erhält dementsprechend einen festen Platz in einer Systematischen Musikwissen schaft, die als "musikalische Grundlagenforschung" verstanden wird (Wio ra 1961, 1199 ff.). Innerhalb dieser Forschung wird Systematische Musik theorie wie folgt bestimmt: Wie die auf Musik bezügliche Psychologie, so ragt die MTh. (Musiktheorie; U. S.) nur mit einem Teilbereich ins Kernge biet der systematischen Mw. (Musikwissenschaft; U. S.) hinein: wegen der bisherigen Verknüpfung ihrer systematischen mit der dogma tischen und piidagogischen Seite. Von allen Seiten ist sie der älteste, und ihr Schrifttum das umfangreichste ; ... Systematische Theoria ist nicht praktische Handwerks/ehre, sondern wiss. Forschung und Betrach tung. Sie untersucht die Musik als Logos und als Geist, als Spiel mit festen Spielregeln, die teils naturgegeben , teils geworden sind (. . .). Auch 1966 hebt Walter Wiora (1966, 253) die wissenschaftliche Seite der Musiktheorie hervor: Deren wissenschaftliche Seite entwickelt sich auf aussichtsreichsten Wegen weiter und differenziert sich von der piidagogischen und propädeutischen Fachlehre. Im Namen "Systematische Musiktheorie" ist der ursprüngliche Sinn des Wortes "theoria" lebendig zu halten: weder Handwerkslehre noch Konstruktion von Doktrinen, sondern sachliches Betrachten eines Sachgebietes als solchen. Walter Wiora erblickte in einer Systematischen Musiktheorie einen dritten Weg neben jeder dogmatischen Musiktheorie, wie er sie besonders im Werk Hugo Riemanns sah, und einem durch Historismus induzierten posi tivistischen Relativismus. Noch 1986 schreibt er (Wiora 1986, 1 3 ) daher: Die fortschreitende Untersu chung und Zusammenfassung solcher Tatsa chen kann und sollte zur Festigung von Fundamenten der Systemati schen Musiktheorie beitragen. Sie ist ein Weg, die A lternativ e, zwischen Dogmatismus und Relativismus zu überwinden. Es ist unproduktiv, die gesamte Musiktheorie als "Handwerks/ehre" aus der eigentlichen Musik wissenschaft zu verbannen. Die Begründung der Systematischen Musiktheorie glaubte er vorwiegend in vergleichender Musikforschung zu finden; er entging dabei allerdings
26 nicht einem eurozentrischen Evolutionismus, der glaubte, in der Untersu chung von Musik außereuropäischer Musikkulturen universell gültige Prin zipien musikalischer Strukturen zu finden (vgl. bes. Wiora 1962a, b). Aus dem · bisher Dargestellten ergibt sich, daß Walter Wiora den Ter minus "Systematische Musiktheorie" prägte; es sich bei seinen Ausführun gen zu ihrer Ausgestaltung allerdings nur um programmatische Ideen handelt, deren Durchführung zur Disziplin einer "Systematischen Musik theorie" bis heute ausblieb. Jens Rohwer (196 7, 139) schlug daher vor, um eine Realisierung der Idee "Systematische Musiktheorie" voranzutreiben, zuerst ein systema tisch-sachliches "Handbuch der systematischen Musiktheorie" zu erstellen, in dem die wissenschaftlichen Schätze ... der musiktheoretischen Literatur erscheinen. Ein solches Projekt steht bis beute aus, auch wenn es zu ei ner historisierenden Darstellung der Geschichte der Musiktheorie ein großes Unternehmen gibt� welches aber eine Ideengeschichte wie Jens Rohwer sie forderte nicht entwickelt. Wies Jens Rohwer (1967, 139) darauf hin, daß etliche Dissertationen notwendig wären, um solch ein Handbuch zu erstellen, so ist offensicht lich, daß dies nicht ·in einer einzigen Arbeit zu leisten ist. Außerdem scheint mir dieser Weg in der derzeitigen Situation nicht der angebrachte zu sein, da in den letzten Dezennien wesentliche Veränderungen innerhalb der Wissenschaft stattgefunden haben, die, wie ich zeigen werde, Bedeu tung für den Aufbau einer wissenschaftlichen Musiktheorie - einer Syste matischen Musiktheorie - haben, und daher vordringlich aufzuarbeiten und in die musikwissenschaftliche Forschung zu integrieren sind. Aber waren Wioras Ideen nicht die Ideen eines Außenseiters, zumal die Durchführung einer Systematischen Musiktheorie letztendlich ausblieb?
2. 1. 2
Aktuelle Forschungen zu einer Systematischen Musiktheorie
Obwohl es derzeit keine etablierte Systematische Musiktheorie gibt, lassen sich verschiedene Arbeiten, die den systematisch-erklärenden Aspekt ihrer Forschung in den Vordergrund stellen, unabhängig von den Vorstellungen Waller Wioras als Arbeiten zur Systematischen Musiktheorie verstehen. Gerade in der amerikanischen Forschung hat sich unter dem Einfluß des logischen Empirismus eine musiktheoretische Forschungstradition her ausgebildet, die den explikativ-theoretischen Charakter von Musiktheorie betont und an den wissenschaftlichen Standards mathematisch-logischer Forschungen mißt. Sind die Residuen europäischer musiktheoretischer For schung - die "Han·dwerkslehre" - in einer Fachsprache verfaßt, die für 1) siehe die i m Auftrag des staatlichen Instituts für Musikforschung Preußischer Kultur besitz unter der Leitung von Frieder Zaminer herausgegebene Geschichte der Musik theorie in 15 Bänden.
27 praktische Zwecke eine ausreichende Genauigkeit der Darstellung mit ei nem Maximum an Verständlichkeit aufweist, so geht es. in der amerikani schen Forschung darum, im Rahmen der Explikation eine größtmögliche Genauigkeit in der Darstellung von Sachverhalten und deren Beziehungen zu erlangen, die in einer Konstruktsprache formuliert wird, deren Verständlichkeit mit zunehmender Komplexität des Darzustellenden abnimmt.1 Zu erwähnen sind vor allem die Forschungen zur Zwölftonmu sik in der Tradition von Milton Babbitt (1955, 1960, 1961) und die von Allen Forte (1964, 1973) ausgehenden Arbeiten zur atonalen Musik, die in dem Lehrbuch von John Rahn (1980 a) eine einfUhrende systematische Darstellung fanden. Mengenlehre und Gruppentheorie bilden die grundle gen Beschreibungsmittel musikalischer Strukturen und wurden sowohl bei der Analyse als auch Komposition angewandt 2 • Weiterhin sind die Beiträge von Boretz (1969, 1970, 1971, 1972, 1973) und Kassler (1963, 196 7, 1977) anzuführen, welche die mathematische Logik zur Begriffsexplikation musiktheoretischer Konzepte heranziehen 3. Innerhalb dieser Forschungen wurde schon sehr früh der Computer sowohl zur Untersuchung musikalischer Strukturen als auch als Hilfsmittel bei der Komposition eingesetzt. In diesem Zusammenhang werden die Ansprüche an den Wissenschaftlichkeitscharakter von Musiktheorien dadurch verstärkt, daß Musiktheorie, "komputationelle Musiktheorie" zu sein hat. Die Bewährung und Überprüfung der benutzten musiktheoretischen Konzepte erfolgt letztend lich durch eine Implementierung in einem "lauffähigen" Computerprogramm.4· John Rahn5 (1980a, 66), einer der derzeit führenden Forscher dieses 1) Die Unterscheidung von Fachsprache, Konstruktsprache und Standardsprache findet sich in Schnelle (1973, 78 ff.). Grob gesagt zeichnet sich die Fachsprache durch die beste Verständlichkeit, aber größere Ungenauigkeit der Darstellungsfun!ktion aus, wohingegen die Konstruktsprache einer zusätzlichen Aneignung bedarf, weniger verständlich ist; da·
für aber ein hohes Maß an Präzision im Rahmen ihrer Darstellungsfunktion hat. In ei· ner Standardsprache wird versucht, die allgemeine Verständlichkeit einer Fachsprache und die Präzision der Konstruktsprache zu vereinigen. 2) Eine Darstellung dieser Arbeitsweise und eine Kritik findet sich in Seifert 1986, 53 ff.; Schneider & Seifert 1986, 316 ff.; eine ausführliche Rezeption und somit Diskussion der Untersuchungsergebnisse dieser Forschungen hat es meines Wissens bisher in der deutschen Musikwissenschaft nicht gegeben. Erwähnenswert sind in diesem Zusam menhang die Arbeiten von Klemm 1966 und Stroh 1974. 3) näheres vgl. Schneider & Seifert 1986, 328. 4) Es handelt sich hierbei nicht nur um die besonders geeigneten dodekaphonischen und atonalen Theorien, sondern auch konzeptuelle Entwürfe traditioneller Theorien, inson derheit die in Amerika verbreitete Theorie Heinrich Schenkers, sollen auf diese Weise einer Explikation zugeführt werden (vgl. Kassler 1977; Rahn 1980b; Smoliar 1974b, 1976a, 1976b, 1977, 1979, 1980; Rothgeb 1967, 1980). S) Eine sehr gute Darstellung der von Rahn angesprochenen Entwicklung mathematisch· logischer Forschungen und deren philosophischer Implikationen gibt Webb 1980. Eine weitere Webb ergänzende Darstellung der Resultate dieser Forschungen und ihrer
28 Gebietes, formulierte den in diesem Forschungsbereich vorherrschenden Wissenschaftsanspruch für die Explikation musiktheoretischer Konzepte und der durch sie beschriebenen Sachverhalte wie folgt: The prevailing
image of the present intellectual epoch, perhaps soon to be supplanted, is that of the machine, interpreted in its widest sense to subsume formali sations of any kind. The work of Frege, Russell, Gödel, Hilbert, Carnap, and so many others laid the foundations of the current civitatis mentis machinosae, Jeading naturally through Church's Thesis and Turing. To explicate something is, ultimately, to formalize it, that is, to make it into a machine . .. As a child of my epoch, this is my belief. Daß diese Ma thematisierungstendenzen nicht als retrospektiv orientiert verstanden werden können wie im Falle der Begriffsexplikation traditio neller musiktheoretischer Konzepte durch Formalisierungen und "komputa tioneller Musiktheorie" und der mit ihnen durchgeführten Analysen, bele gen vornehmlich die Versuche, im Rahmen der Computermusik . mit neuen Tonsystemen zu experimentieren, ihnen angemessene Instrumentalstim mungen zu berechnen und neue Instrumente zu konzipieren. Beispielhaft sei hier auf die Arbeiten des Musikers und Mathematikers Rudolf Wille (1980, 1985) und des Musikwissenschaftlers Wilfried Neu maier (1989) hingewie.sen, von denen im Rahmen des Forschungsvorhabens "Mathematische Musiktheorie" an der TU Darmstadt eine exakte Sprache der Musiktheorie, eine extensionale Standardsprache der Musiktheorie, erarbeitet wird, in der ein eindeutiges und differenziertes Sprechen über musiktheoretische Sachverhalte möglich ist 1 Dieses Vorhaben steht in enger Beziehung zu den Forschungen Rudolf Willes bezüglich einer for malen Begriffsanalyse , die inzwischen ebenfalls auf musikpsychologische Forschungen angewandt wurde .2 Obwohl sich die Forschungen zu einer extensionalen Standardsprache der Musik mit unterschiedlichsten Pro blemstellungen wie Form, Rhythmik, Harmonik, Tonsystemen und Stim mungen befassen, kann das Hauptarbeitsgebiet der bisherigen Forschungen als eine Theorie der Klangklassifikation3 angesehen werden, deren Aus gangspunkt die "Lehre von den Tonbeziehungen" des Musikwissenschafterkenntnistheoretischen Bedeutung gibt Stegmüller 1973. Solange sich Churchs These nicht als falsch erweist, dürfte, worauf besonders Post (1936, 105) aufmerksam machte, mit dem Konzept der abstrakten Maschine eine Grenze der mathematischen Leistungs fähigkeit menschlichen Denkens erreicht und somit dieses Konzept des Mechani schen ein nicht weiter veränderbares sein. Es ist daher nicht anzunehmen, daß dieses Konzept, wie Rahn einschiebt, im Bereich der "komputationellen Musiktheorie" bald er setzt werden wird. 1) Aus einem persönlichen Schreiben von Herrn Professor Wille. 2) Zur formalen Begriffsanalyse liegen derzeit (Stand März 1990) 88 Titel vor. Es sei nur auf die im musikpsychologischen Bereich angewandte Arbeit von Rudolf Wille 1989 verwiesen. 3) vgl. Seifert 1986, 14 ff..; Schneider & Seifert 1986, 317 ff.
29 lers Martin Vogel (1975, 1984) bildet. Den Kriterien einer "komputatio nellen Musiktheorie': wie sie zum Teil an die Arbeiten in der amerikani schen musiktheoretischen Forschung gestellt werden, wird bei den Unter suchungen zu einer Standardsprache der Musiktheorie insofern Rechnung getragen, als die Entwicklung eines neuen Musikinstrumentes - des MU TABORs1 - , das ermöglicht in unterschiedlichen Stimmungen zu spielen, den Prüfstein der innerhalb der Standardsprache entwickelten Konzepte bildet. Das im Bau befindliche Instrument MUTABOR II soll u. a. Musikern die Mög lichkeit geben, ausgiebige Erfahrungen mit mikrotonaler Musik2 zu machen. In den 70er Jahren verstärkte sich zusätzlich die Mathematisierungstendenz3 in der Musikforschung, ausgehend von musikethnologischen Untersuchungen,4 durch den Einfluß der in der Linguistik erfolgreichen generativ-grammati kalischen Forschungen Noam Chomskys.5 Da Chomsky zur Beschreibung syntaktischer Beziehungen in natürlichen Sprachen auf Konzepte der Meta mathematik, die Semi-Thue-Systeme,6 Bezug nimmt und außerdem seine Klassifizierung der Komplexität verschiedener Grammatiken, die Chomsky- Hierarchie; ein zentrales Konzept der theoretischen Informatik ist, so ist es nicht verwunderlich, daß es auch in den linguistisch beeinI) Eine Darstellung dieses Instrumentes findet sich in Ganter, Henkel & Wille 1985. Es wurde 1986 auf dem Kongress 'Musik und Mathematik' an der TU Darmstadt vorgeführt. 2) Gerade der Bereich mikrotonale Musik erfreut sich seit einigen Jahren sowohl in der historisch als auch systematisch orientierten musikwissenschaftliehen Forschung und in der Komposition größerer Beliebtheit (e. g. S. Schneider 1975; A. Schneider 1986). Dies verstärkte Interesse an mikrotonalen Tonsystemen dürfte nicht zuletzt auf die gute Realisierung verschiedener Stimmungen durch den Computer zurückzuführen sein, obwohl es schon vor dem Einsatz des Rechners als Musikinstrument ausgiebige For schungen zur mikrotonalen Musik und der Entwicklung brauchbarer Instrumente gab (e. g. Fokker 1975; Partch 1949). Ebenso lassen sich Arbeiten der Kognitionswissenschaft finden, in denen formale Beschreibungen wie kontextfreie Grammatiken und Perzeptionsprozesse mikrotonaler Systeme in Beziehung gesetzt werden (e. g. Rasch 1985, Szeider 1990). 3) Über einige mathematische Konzepte in der amerikanischen Musikforschung refe riert Rothgeb 1966; weitere Literatur findet sich in Stoffer & Boroda 1980 besprochen. 4) Bei diesen musikethnologischen Forschungen spielt das Konzept der Grammatik eine zentrale Rolle. Um nur zwei der bekanntesten Ansätze zu nennen: Eine Grammatik für
das Genre Srepegan der Gamelan-Musik wurde von Alton und Judith Becker 1979 angegeben, für schwedische Lieder griffen Sundberg & Lindbiom 1976 die Idee der Grammatik auf. Ausführliche Besprechungen dieser und weiterer Grammatiken fin den sich in Seifert 1986, 97 ff.; sowie in dieser Arbeit Kap. 3. 1. Weitere Litera tur zu dem Themenkomplex "Grammatiken" vgl. Stoffer & Boroda 1980; Baroni 1983; Roads 1984, 1985b; Schneider & Seifert 1986, Hughes 1991 sowie Sundberg & Lindbiom 1991. 5) Die generativ transformationeHe Grammatik wurde von Noam Chomsky (1957, 1959, 1963, 1965, 1975, Chomsky & Miller 1963) entwickelt. Die Darstellung einiger Grundi deen findet sich in Seifert 1986, 88 ff.
6) Elementare Begriffe werden in Seifert 1986, 61 ff. erläutert. 7) Diese Hierarchie geht auf die Arbeit von Chomsky 1959 zurück und wurde in Chom sky 1963 modifiziert.
30 flußten musiktheoretischen Untersuchungen Chomskyscher Provenienz sowohl mathematisch-logische als auch "komputationell" orientierte Ansätze gibt.l Gerade den mathematisch-logischen Forschungen, aber auch den gram matikalischen Forschungsvorhaben, wurde oft von der traditionellen Mu sikforschung der Vorwurf gemacht, es handele sich um paper and pencil reasoning, das mit der musikalischen Realität wenig zu tun habe. Zwei Aspekte wurden hierbei verkannt. Zum einen handelte es sich häufig um Arbeiten, in denen die Explikation musiktheoretischer Termini im Vorder grund stand, und diese somit darauf ausgerichtet sind, den Bedeutungsge halt traditioneller Termini präziser zu fassen; zum anderen wird oft ver gessen, daß es sich auch in der traditionellen Musiktheorie aufgrund ihres modellhaften Charakters2 im wesentlichen um paper and pencil reaso ning in einer Fachsprache handelt, das der weiteren psychologischen oder gar physiologischen •Begründung bzw. Überprüfung bedarf. Gerade in na turwissenschaftlich orientierten Studien wird der wissenschaftliche Status von Musiktheorie aufgrund mangelnder begrifflicher Klarheit und empiri scher Forschung in dieser Hinsicht häufig angezweifelt. Der Psychephysi ker Ernst Terhardt (1986, 107) beschreibt die Situation der zeitgenössi schen traditionellen Musiktheorie wie folgt: Komponisten und Musiker
sehen in ihr ein Hilfsmittel und Werkzeug und stellen immer wieder fest, daß dasselbe ihren Wünschen und Vorstellungen nicht in ausrei chendem Maße gerecht wird. Die Wissenschaftler andererseits haben Vorbehalte, weil die Musiktheorie gewissen anerkannten Kriterien natur wissenschaftlicher Theorien kaum standhält. Wie zu erkennen handelt es sich um eine Kritik von Musikern und Komponisten an der Brauchbarkeit der "Handwerkslehre" und um eine Kritik an der Wissenschaftlichkeit musiktheoretischer Gebilde aus der Perspektive des Naturwissenschaftlers. Die Forderungen an die Explikation innerhalb der deduktiv-nornelogischen naturwissenschaftlichen Theorienbil dung sind von dem logischen Explikationskonzept Carnaps zu unterschei den und wurden in dem von Hempel und Oppenheim entwickelten cove ring-Jaw-Modell ausflihrlicher untersucht.3 1) Hierzu vgl. man besonders die Artikel von Baroni 1983 und Roads 1984, 198Sb sowie den Sammelband Baroni & Callegari 1984. Interessant ist auch die kritische Besprech ung des von Baroni & Callegari 1984 herausgegebene·n Buches durch Stephen Smoliar 1986. 2) Der modellhafte Charakter der traditionellen Funktionsharmonik findet sich beson ders gut herausgearbeitet in Karbusicky 1979, 117 ff. Es sei hier besonders auf die di versen Interpretationen einfacher, notierter musikalischer Stellen verwiesen, wie sich aufgrund einer Untersuchung mit Studenten des musikwissenschaftliehen Institutes der Universität Harnburg zeigte (Karbusicky 1979, 136 ff.). 3) Carnaps Konzept der "Explikation" kann vereinfacht als eine Überführung eines umgangssprachlich bzw. fachsprachlich benutzten Terminus, dem Explikandum , in ein Konzept eines formalen Systems, das Explikat, verstanden werden. Es handelt sich also um eine Begriffserläuterung durch Präzisierung des Sprachgebrauchs. Daher werden die Forderungen der Ähnlichkeit, der Exaktheit, Fruchtbarkeit und Einfachheit des Explikats
31 Da also weder traditionelle Musiktheorien noch deren historisierende Betrachtungen als auch individuelle Poetiken\ welche besonders zeitge nössische Komponisten ihren Werken beigeben, weder die Form l ogischer Explikation aufweisen noch durch experimentelle Forschung empirisch gestützt werden und den wissenschaftlichen Ansprüchen deduktiv-nomolo gischen Erklärungen genügen, kommt Ernst Terhardt (1986, 107) zu dem Schluß: 2 Angesichts dieses Standes der Musiktheorie erscheint es wenig aussichtsreich, dieselbe dadurch voranbringen zu wollen, daß man vor behaltlos mit hergebrachten Ansätzen und Methoden weiterarbeitet. Viel mehr ist eine kritische Rückbesinnung auf die Zwecke und fundamenta len Voraussetzungen der Musiktheorie angebracht. Die fundamentalen Voraus setzungen von Musiktheorie werden häufig in gegenüber dem Explikandum bei einer Begriffsexplikation gesteE!t. Die logische Expli kation kann als Präzisierung der aus der klassischen Logik bekannten Realdefinition aufgefaßt werden, in der, im Gegensatz zu der Nominaldefinition, das "Wesen" einer Sache erfaßt wird. Näheres zu diesem Konzept der Explikation, vom dem auch Rudolf Willes Idee einer Standardsprache der Musiktheorie ausgeht, findet sich in Carnap 1951, 1-18; sowie eine ausführliche Erörterung der Erklärung der Explikation in Schnelle 1973, 100 ff. und Wunderlich 1974, 201 ff. bes. 204 ff. Das Hempel-Oppenheim-Schema (H-O-Schema; vgl. Hempel 1977, 72 ff.) des deduktiv nomologischen Erklärens innerhalb naturwissenschaftlicher Theorienbildung, wie es sich im covering law Modell findet, besteht aus Explanans und Explanandum. Das Expla
nandum ist die Beschreibung des zu erklärenden Sachverhaltes, während das Explanans aus den Sätzen A1, -·· An • welche die Antezedensbedingungen beschreiben, und den all gemeinen Gesetzmäßigkeilen (den covering Jaws; umfassenden Gesetzen) Gl'
-·
Gr be
steht. Es werden folgende Forderungen an eine gültige deduktiv-nomologische Erklärung gestellt (vgl. Wunderlich 1974, 100; Stegmüller 1983, 124 ff.): a) Der Argumentationsschritt, der vom Explanans zum Explanandum führt, muß eine logische Folgerung des Explanans sein. b) Das Explanans muß mindestens ein allgemeines Gesetz enthalten bzw. einen Satz, der aus einem allgemeinen Gesetz logisch folgt. c) Das Explanans muß empirischen Gehalt besitzen. d) Das Explanans darf nur wahre Sätze enthalten. Außerdem wird angenommen, daß naturwissenschaftliche Prognosen dieselbe logische Struktur haben wie Erklärun gen. Allein der Zeitbezug des Explanandum ist ein anderer: Bei der Erklärung wird sich im Explanandum auf ein vergangenes Ereignis bezogen, wohingegen bei der Prognose das durch das Explanandum charakterisierte Phänomen in der Zukunft stattfinden wird. 1) vgl. Schneider & Seifert 1986, 310 ff. Es soll indes nicht verkannt werden, daß die Äußerungen von Komponisten über ihre Werke zuweilen Aufschlüsse über deren inten dierte Strukturierung geben, aber es bleibt die Frage, ob sie ebenfalls auf die vom Komponisten intendierte Weise vom Hörer perzipiert werden. Hierzu dürfte ein Kom ponist normalerweise eher wenig Informatives zu berichten haben. Insgesamt dürften diese Berichte auch eines empirischen psychologischen Gehaltes ermangeln. 2) Daß diese wissenschaftstheoretische Naivität in der musiktheoretischen Forschung keineswegs sein muß, belegt die Diskussion um die Methodologie musiktheoretischer Forschung in der Zeitschrift "Journal of Music Theory"; vgl. hierzu die Beiträge ·von: Brown & Dempster 1989: Rahn 1989; Boretz 1989; Cook 1989; Taruskin 1989.
32 der physiologischen und psychologischen Verfassung des perzipierenden Subjektes bzw. seines Nervensystems gesehen, so daß neuropsychologische und psychologische Forschungen in den Vordergrund systematisch musik theoretischer Forschungen 1 treten. Gerade die durch den Einsatz elek tronischer Musikinstrumente und des Computers als Musikinstrument2 gewonnene Freiheit, neue Klangwelten zu erforschen und deren Klänge durch bisher nicht zugängliche Parameter zu erzeugen und zu manipulie ren, erfordert auch von Komponisten3 die Kenntnis der Grenzen des menschlichen Wahrnehmungsapparates, um die musikalischen Effekte zu realisieren, die sie erreichen wollen. So wurden psychoakustische Forschungen am Institut de Recherche et de Coordination Acoustique-Musique (IRCAM) in Paris und der Universi tät Stanford betrieben, deren vorwiegendes Ziel jahrelang die psychoaku stische Erforschung des Timbre4war. Ein zentrales Problem bildet, neben der Identifizierung der wichtigen manipulierbaren Parameter, die Frage nach der adäquaten verbalen Beschreibung der Perzepte wie z. B. Schär fe-Weiche, Fülle oder Dünne eines Klanges etc. (vgl. Gabrielsson 1981, 25). Im Bereich der Melodieforschung5 interessi�ren u. a. die Prinzipien, die dafür verantwortlich sind, daß bestimmte Klangfolgen als melodisch zusammengehörig erfahren werden w.ä.hr_e_Qp wiederum andere als vonein ander getrennt wahrgenommen werden. Diese Forschungen wurden be sonders bekannt unter dem Begriff der auditorv stream segregation� Dieses Phänomen kann man sich an einem einfachen Beispiel veranschau lichen (Wright & Bregman 1987, 66-67). Die präsentierte Reizquelle besteht aus einer wiederholten Folge von sechs computergenerierten Klängen, wobei hohe und tiefe Klänge einander abwechseln. Wenn diese l in einem langsamen Tempo vorgespielt werden, Zyklen von sechs Kängen wird eine sich wiederholende Folge von hohen und tiefen Klängen wahr genommen (vgl. die dünnen Pfeile in der Abb. auf S. 33). Erhöht man die Geschwindigkeit, werden zwei getrennte Folgen perzipiert: Hohe Klänge werden ebenso wie tiefe als zusammengehörige Folge perzipiert, (vgl. die fettgedruckten Pfeile in der Abb. auf S.- 33). Der perzeptuelle Trennungs vorgang in getrennte Ströme von Klängen wird als auditory stream se•.
1) Einen Überblick über die Forschungen bis 1980 geben Gabrielsson 1981 u. Deutsch 1980. McAdams 1987 informiert über die neueren Forschungen der 70er und 80er Jahre. 2) vgl. Mathews 1963; neuerdings wieder Thies 1987. 3) Der Komponist Tod Machover 1985 weist auf die Notwendigkeit der Verbindung wissenschaftlich-technologischer mit musiktheoretischer Forschung hin. 4) Vgl. hierzu z. B. die Forschungen von Risset & Wessei 1982; Wessei 1979, Balzano 1980, 1982. 5) Weitere Forschungen zur Melodie wurden besonders von Dowling 1978, Diana Deutsch (e. g. Deutsch & Feroe 1981),-Kumhansl 1991 und Rosner & Meyer 1982 geleistet. 6) Bregman & Campbell 1971; McAdams & Bregman, A. S. 1979; Wright & Bregman 1987; Bregman 1990, 1991 sowie Hartmann 1988.
33 gregation bezeichnet.
>0 z w ::> 0 w a: ...
�� -��e.1f'f1 �
.� .��.. : ' , ' ;, / ' / I ' \ I \ \ • • I ' I • �\ I �\ I '. 1 I
I
I
1
'
1
I
·�}f
Abb. aus
I
I
1
I
I I
I
'
I
'
1
I
·�Jf
TIME
Wright & Bregman 1987, 67
Das Ergebnis, daß kleine Intervalle einen Zusammenhang zwischen Klän gen induzierten, wurde in Verbindung mit dem "Gesetz der Nähe" der Gestaltpsychologie gebracht, in dem davon gesprochen wird, daß benach barte Stimuli als zusammengehörig perzipiert werden. Zur empirischen Rhythmusforschung liegen ebenfalls viele Arbeiten1 vor. Bei der Untersuchung des Rhythmusphänomens, wobei Rhythmus als Reaktion auf Schallfolgen mit gewissen Eigenschaften definiert wird, wer den diverse Wirkungen unterschieden: psychische, verhaltensmäßige und physiologische Reaktionen. In der empirischen Rhythmusforschung (Ga brielsson 1981, 27) stehen Fragen wie die folgenden im Vordergrund: 1 ) Was unterscheidet Rhythmen von Nicht-Rhythmen?
2 ) Was unterscheidet unterschiedliche Rhythmen voneinander? 3 ) Wie erzeugen Musiker durch ihre Spielweise den intendierten Rhythmus beim Hörer? Bisher gibt es noch keine befriedigenden Antworten auf diese Fragen. Besonders hervorzuheben sind allerdings die Arbeiten von Bengtsson und Gabrielsson, die sich besonders mit den Fragen 2) und 3 ) beschäftigten.2 1) Es seien hier nur die Arbeiten von Michon 1974; Martin 1972; Restle 1970; Steedman 1975; Longuet-Higgins & Lee 1984; Lee 1991; Povel 1984; Povel & Essens 1985; Clarke 1987, 1988; Shaffer 1980, Shaffer & Clarke & Todd 1985 angeführt, man vgl. auch das Themenheft "Rhythm perception, rhythm production, and timing" der Zeitschrift "Psy chological Research" (1989) 51/1 sowie Handel 1989. 2) Bengtsson 1974, 1985; Gabrielsson 1982, 1985, 1988; Gabrielsson, Bengtsson & Ga brielsson, 1983. Ähnlich gelagerte Untersuchungen gibt es auch von der Forschergruppe um Haruhiro Katayose (Katayose & Inokuchi 1990), die ein Computersystem entwickelt, das in der Lage ist, aufgrund musikalischer Eingaben innerhalb der Lernkomponente des Systems Regeln zu extrahieren, die es dem System ermöglichen, bei Vorlage des Notentextes von Musik ähnlichen Stils eine musikalische Interpretation des Werkes auszuführen. Die dem System zugrundeliegenden formalen Beschreibungen werden ebenfalls als Hypothesen über die die menschliche Wahrnehmung leitenden Vor-
34 Es wurde angenommen, daß bei Aufführungen von Musik systematische Variationen der Tondauern in bezugauf die mechanische Regularität auftreten, welche auf verschiedenen Ebenen gemessen wurden. Bei der Untersuchung von Aufführungen der A-Dur Klaviersonate Mozarts (KV 331) wurden die Abweichungen auf der Ebene der Tondauern und der halben Takte gemessen. Die Abzisse, die waagerechte Linie, gibt die zeitliche Entwicklung des Musikbeispiels wieder. Die Zahlen an der Ordinatenachse, dem vertikalen Strich, geben die relativen Abweichungen von der mechanischen Regulari tät in Promille an, dabei entspricht 1 pro mille in dem angegebenen Beispiel einer Abweichung von 20 Millisekunden. Bei der Zahl 0 findet keine Ab weichung statt, negative Zahlen geben ein kürzere Dauer an als mecha nisch gefordert; Verlängerungen der Tondauern werden durch positive Zahlen angezeigt. Deutlich zu erkennen ist das Ritarando am Phrasenende des vierten Taktes, das seinen Ausdruck durch eine Verlängerung der Dauer der letzten vier Töne findet. Auf der Ebene der halben Takte zeigt sich diese Abweichung noch deutlicher. o(oo •
/ \
,./
:
Abb.
\.,
�
aus Oabrielsson et al. 1983, 201
Auch ftir den Bereich der Tonalitätstrukturen der Harmonik1 lassen sich einige interessante Arbeiten aufweisen. Ernst Terhardts (1986, 111 ff.) theoretischer sowie empirisch fundierter Ansatz gibt eine physiologische Erklärung der basse fondamentale. In Analogie zu dem Konzept der vir tuellen Tonhöhe,Z charakterisiert er die Extraktion des Grundtones eines Akkordes als Tendenz des auditorischen Systems, unvollständige Akkorde um gänge angesehen. Das System stellt somit eine empirisch testbare Hypothese über mu sikalische Wahrnehmungsprozesse dar. 1) Besonders zu nennen sind die Arbeiten von Ernst Terhardt 1974, 1976177, 1982, 1986, 1991; Parncutt 1988, 1989; Krumhansl & Shephard 1979; Castellano, Krumhansl & Bharu cha 1984; Longuet-Higgins & Steedman 1971, Krumhansl 1990, Cross, West & Howell 1991 sowie Zannos 1991.Über die Forschungen von Longuet-Higgins s. Seifert 1986, 142 ff. 2) Hierzu vgl. Roederer 1977, 45 ff.; Terhardt 1974, 1979.
35 ihre basse fondamentale zu vervollständigen, ähnlich wie bei der Wahrneh mung eines Klanges (Tones ), dem der Grundton, die Grundschwingung, fehlt. Carol Krumhansl und Roger Shephard (1979; vgl. auch Krumhansl 1990, 21 ff.) entwickelten eine Methode, um die Tonalitätsbezogenheit von Tö nen zu quantifizieren: die probe tone method. Bei dieser Methode wurde der tonale Kontext dadurch hergestellt (Krumhansl & Shephard 1979, 583), daß eine Skala ohne den oktavidentischen Anfangston aufwärts oder abwärts gespielt wird. A sc ending
Con-tex"t:
c
Descending �
lf
1$
d
Con-cex'1:
....0...
---
h2
c3
e
a2
cl
�
0
cis1 dl
Abb.
�eo
dis1
9
el
g
a
0
B
I I
g2
Final
-&-
f
Ii
fl
Mo�es 1 ' 11
fisl
f2 9
gl
h B
d2
e2 lf9
gisl
Ii i I P
al
9
II II
ais l hl c2
nach Krurnhansl & Shephard 197 9, 583
Dann wurde ein chromatischer Ton aus dem Oktavbereich des ausgelas senen oktavidentischen Anfangstones gespielt. Der Hörer wurde aufgefor dert anzugeben, inwiefern dieser Ton zu der vorgegebenen Sequenz "paß te". Es ergab sich (Krumhansl & Shephard 1979, 585) eine hierarchische Tonalitätsstruktur, so "paßten" z. B. die Töne d, e, f, g, a, h, besser als die Töne cis, dis, fis, gis, ais. Mit der probe-tone Methode konnten ebenfalls perzeptuelle hierarchische Tonalitätsstrukturen für nordindische Musik nachgewiesen werden (Castellano, Krumhansl & Bharucha 1984 ). 2.1.3
Hinwendung zur Kognitiven Musikpsychologie
Zwar weisen alle diese Arbeiten ein hohes Maß an empirischem Gehalt und ausgeprägtes Methodenbewußtsein auf, allerdings ist anzumerken, daß es sich um punktuelle Forschungen handelt, die sehr oft, aus methodelo gisch sicherlich zu rechtfertigenden Gründen, Teilaspekte des musikali schen Phänomens an einfachen Strukturen untersuchen. Trotz der Punktu alität der Forschungen zeigte sich ein gemeinsames Ergebnis: die hierar chische Struktur der zeitlichen, d. h. der rhythmisch-melodischen und der harmonischen Struktur. Es bleibt z. B. fraglich, inwieweit Rhythmus und Melodie in der psychologischen Untersuchung voneinander getrennt werden können, da beide Phänomene eng miteinander verbunden sind.
36 Auch stehen sicherlich harmonische und rhythmische Struktur in Wech selwirkung, die in einer musiktheoretischen und psychologischen Analyse nicht vernachlässigt werden sollte. Weiterhin ist festzustellen, daß häufig als Reizquelle nur einfache Klangfolgen benutzt werden und ein Modell der komplexen Musikwahrnehmung nicht erstellt wird. Es handelt sich im wesentlichen um empirische Forschung, die Datenmaterial liefert, aber dieses meistens nicht ernsthaft begrifflich-theoretisch durchdringt. In der psychologischen Musikforschung zeichnet sich jedoch seit einigen Jahren durch den Einfluß der Kognitiven Psychologie eine verstärkte Hinwen dung zu kognitiven Modellen der Wahrnehmung komplexerer musikalischer Strukturen ab. Es bildete sich die Kognitive Musikpsychologie1 heraus, in der die menschliche Informationsverarbeitung in bezug auf die musikalische Reiz quelle untersucht wird. Ziel dieser Forschungen ist es, ein Modell der mentalen Repräsentation musikalischer Strukturen im informationsverar beitenden System, dem menschlichen Geist bzw. dem Gehirn, anzugeben. Als Hilfsmittel zur Modeliierung dienen vorwiegend in der Forschung zur Künstlichen Intelligenz entwickelte Formalismen. Es war bisher festzustellen, daß ein Großteil der empirischen musikpsy chologischen Forschungen zur Musiktheorie punktuell waren und sich aufgrund mangelnder Komplexität der Reizquelle ein Graben zwischen musik theoretischer und musikpsychologischer Forschung auftat, da viele Proble me aufgrund methodologischer Vorsicht nicht von musiktheoretischen Fra gestellungen geleitet waren. Andererseits formulierte gerade die traditio nelle Musiktheorie ihre Anliegen nicht so, daß sie die Möglichkeit boten, der psychologischen Forschung Leitideen zu vermitteln. Es zeichnet sich jedoch neuerdings eine Annäherung von Musiktheorie und Kognitiver Musikpsychologie in einem einheitlichen Forschungsrahmen ab, so daß Thomas Stoffers (198Sb, 148) Forderung in realisierbare Nähe rückt:
Strukturbeschreibungen der Musiktheorie sollten Eingang finden in die Bildung von Hypothesen zu strukturellen Aspekten der Verarbeitung beim Hören von Musik, und Aufgabe der experimentellen Musikpsychologie wiire es, die Nützlichkeit solcher Hypothesen im Rahmen der Theorie der Verarbeitung und Repriisentation musikalischer Strukturen zu beschreiben. Einen ersten Versuch der Synthese verschiedener Forschungen von mu siktheoretischer Seite stellt die generative Theorie tonaler Musik von 1) Es muß allerdings erwähnt werden, daß sich viele Arbeiten, die sich als Kognitive Musikpsychologie verstehen, aufgrund der mangelnden Komplexität der musikalischen Reizquelle und der Unters·uchungsebene der "Tonpsychologie" zuzuordnen sind. Thomas Stoffer (1985a)
unterteilt
dementsprechend
den Forschungsbereich
der
Kognitiven
Musikpsychologie in: Kognitive Tonpsychologie und Kognitive Musikpsychologie. Aus kunft über diese Wende in der musikpsychologischen Forschung geben die Arbeiten von Seifert im Druck; McAdams 1987; Bharucha 1985; West, Howell & Cross 1985; West, Cross & Howell 1987; Sloboda 1986. Bekanntere Monographien sind Stoffer 1981, Sloboda 1985, Dowling & Harwood 1986 sowie Serafine 1988.
37
Lerdahl und
Jackendoff (1983) dar. Sie will eine explizit formale Theorie der mentalen Repräsentation hierarchischer musikalischer Strukturen sein. Lerdahl und Jackendoff (1983, 300) kennzeichnen ihre Forschung1 abgren zend von anderen amerikanischen Untersuchungen: Most theory of con temporary music has been occupied either with the description of com positional systems or with the systematization of ana[ytic procedures not directly related to the Iistener's understanding. Our approach emphasizes that there is a crucial distinction between the principles by which a pie ce is composed and the principles by which it is heard (that is, those that permit the listener to construct a mental representation of the pie ce). As theorists, we are concerned only with the laffer. Die hierarchische Struktur musikalischer Phänomene kann, wie aus den referierten musikpsychologischen Arbeiten ersichtlich wurde, aufgrund von empirisch psychophysiologischen Untersuchungen als relativ gesichert an gesehen werden. Ein gemeinsamer Begriffsrahmen, der auch in anderen Wissenschaften benutzt wird, wird durch die Annahme erhalten, der mensch liche Geist bilde Repräsentationen kognitiver Bereiche in Form von Regelsy stemen aus. Durch diese Regelsysteme wird, von der musikalischen Oberflä che ausgehend, eine strukturelle Beschreibung des betreffenden musikali schen Objektes erhalten. sc he O be-r f l ä c h e
t1us i ka 1 i
11
S'truk t: ure � Beschreibun8
Rttgelsys'te"
(Sequenz Yon Ereigni s sen)
CGr�MMa "t i k
des
Hörensl
CAbb.
nach
Lerdahl
1988,
237;
(Gehörte
1989,
St:ruk'tur)
68)
Die Beschreibung musikalischer Strukturen erfolgt dementsprechend durch ein Regelsystem, unter anderem deshalb, um eine möglichst ein deutige, exakte Explikation der perzipierten musikalischen Struktur zu bekommen. Das Regelsystem besteht aus drei Typen von Regeln: 1 ) den well formedness rules, 2) den preference rules und 3) den transtorrnational rules. 1) Die Entwicklung dieser Theorie begann in den 70er Jahren und fand eine erste zusammenfassende Darstellung in der Monographie Lerdahl & Jackendoff (1983: s. auch Lerdahl & Jackendoff 1984 u. Jackendoff 1987, Kap. 12) und wurde seitdem einigen Änderungen und Erweiterungen unterzogen. Es wurde u. a. die Bedeutung der Stabili
tätsbedingungen betont, welche die prologational reduction und time span reduction beeinflussen. Weiterhin wird versucht sie für eine Analyse von atonaler Musik einzu setzen. Eine ausführlichere Darstellung findet sich in Seifert 1986, 165
ff. Diese
Theorie
stimulierte viele Arbeiten in der Kognitiven Musikpsychologie, der Musiktheorie und der Künstlichen Intelligenz: e. g. Deliege 1985: Baker 1989a, 1989b.
38
Durch die weil formedness rules (Wohlgeformtheitsregeln) werden di verse grammatisch korrekte Strukturen erhalten. Aus diesen wird mittels der preference rules (den Präferenzregeln) die aufgrund psychologischer Kriterien akzeptabelste Struktur ausgewählt. Die transtorrnational rules (Transformationsregeln) bewirken eine Veränderung einer schon vorhande nen Struktur, wie z. B. die Auslassung eines Tones in einer Folge von Tönen. Dieser Regeltyp ist der unbedeutendste (Lerdahl 1989, 72), so daß allgemein von zwei Hauptregeltypen gesprochen werden kann. Es werden vier Analysen unterschieden, die durch jeweils ein Regelsystem beschrieben werden. Es handelt sich um: I ) die grouping structure, 2) die metrical structure, 3) die time-span reduction und 4) die prolongational reduction. Die Regelsysteme der grouping - und metrical structure führen zu ei ner Segmentierung der musikalischen Oberfläche in Phrasen. Diese bilden die Basis für die Durchführung der time-span reduction der musikali schen Oberfläche. Leitende Idee ist, daß einzelne Töne Verzierungen an derer Töne und somit unwichtiger sind. Es kommt zur Zuordnung einer Baumstruktur. Nachdem die time-span reduction durchgeführt wurde, er folgt die prolongationa/ reduction, welche der Zurückführung auf die harmonische Grundstruktur dient. In neuen Arbeiten werden die time-span reduction und die prolongational reduction särker t durch "Stabilitätsbedin gungen" beeinflußt, die sozusagen den Tonalitätscharakter der entspre chenden Stellen reflektieren.
CAbb.
n�ch Lerd�hl
1988,
238;
1989,
72;
Jackendott
1987,
223.)
Meines Erachtens weist die Theorie zwei wesentliche Defekte auf:
1 ) Sie ist wie die meisten Musiktheorien eine theory of final sta te comprehension, d. h. die Analyse erfolgt erst nach Beendigung des ganzen Musikstückes. Für eine psychologische Theorie ist je-
39 doch eine zeitliche "links- rechts" Verarbeitung (parsing) anzuneh men, also eine prozedurale (prozessuale) Theorie, eine des musical processing (vgl. Szeider 1990; Seifert 1986, 37; Jackendoff 1991 ). 2) Sie ist nicht explizit genug, d. h. viele Intuitionen wurden nicht formuliert, so daß Computermodeliierungen auf Schwierigkeiten stoßen (Jenes, Miller & Scarborough 1988). Lerdahl und Jackendoff (1983, 332) stellten in ihrer Monographie Mu siktheorie als Teildisziplin der Kognitionswissenschaft dar. Hier ist jedoch das Kriterium der Operationalität, das durch die Forderung nach Theorie bildung in dem durch Algorithmen - und Berechenbarkeitstheorie gesteck ten Rahmen gewährleistet ist (Johnson-Laird 1981, 1983; Seifert 1990 ), wesentlich für die Überprüfbarkeit der vermuteten mentalen Repräsentationen. Gerade die Operationalisierbarkeit theoretischer Konstrukte spielt in der Kognitiven Musikwissenschaft (Laske 1977, 1986, 1987, 1988) eine entscheidende Rolle. Die Kognitive Musikwissenschaft wird ebenfalls als Disziplin der Kognitionswissenschaft betrachtet, die musikalisches Denken erforscht. Christoph Lischka (1987, 191) schreibt: Cognitive Musicology is that branch ofCognitive Science which investigates musical thinking. As such it enters a well-established discussion with a completely new methodology.
Das Konvergieren solch verschiedener Bereiche der Musikforschung wie der Psychoakustik, den Ansätzen zu einer Systematischen Musiktheorie, der Kognitiven Psychologie und den physiologischen Forschungen zu einem einheitlichen, zusammenfassenden Forschungprogramm innerhalb der Kog nitionswissenschaft ist seit Beginn der 80er Jahre festzustellen und wurde schon verschiedentlich erörtert.1 In der Kognitionswissenschaft wird der Mensch unter dem Aspekt des informationsverarbeitenden Systems betrachtet. Ziel dieser Forschungen ist es (Pylyshyn 1987, 121 ), to discover the representational and computatio nal capacities of the mind and their structural and functional repre sentation in the brain.
Kognition wird als Errechnung (computation) aufgefaßt (vgl. Barr 1984). Die methodelogischen Forderungen, die sich innerhalb der Kognitionswis senschaft für die Erforschung und Modellbildung der "mentalen Repräsen tationen" und des Kognitionsprozesses ergeben, faßt Christoph Lischka (1987, 192; vgl. Lischka & Diederich 1987) treffend zusammen: The
ultimate goal of Cognitive Science is to construct a computational model of some cognitive process. There are at least two strategies: 1) We can strive for simulation, as detailed as possib[e, of both the hu man neural architecture and of human cognitive behavior in order to get some insight into the functional structure of the cognitive systems. 1) vgl. Kaden & Bierwisch 1983; Agmon 1990; Seifert 1986, 28; Seifert 1990; Schneider & Seifert 1986, 312; McAdams 1987; McAdams & Deliege 1989.
40 2) We can neglect concrete neural details and build some artificial cog nitive systems in order to explore their "cognitive" behavior. Here we are {for the present) only interested in the cognitve adequacy of the constructed process not so much in an empirical theory of human neu ral architecture.
Die erste Strategie ist in der Kognitionswissenchaft als Konnektionismus bekannt, während die zweite zur Erstellung eines komputationellen Mo dells des Wahrnehmungsprozesses als Physical-Symbol-System-Paradigma bekannt ist. Es ist derzeit das leitende Paradigma des Funktionalismus1 in der amerikanischen Psychologie. Die nächsten Kapitel werden dazu die nen, in ideengeschichtlicher Entwicklung zu zeigen, was es heißt "Kog nition ist Errechnung", außerdem dazu, die Beziehung zur Computersimu lation kognitiver Prozesse herzustellen, den Ort der "mentalen Repräsen tation" zu erhellen sowie philosophisch-epistemologische Voraussetzungen2 dieses Forschungsprogrammes aufzuzeigen. Des weiteren wird dargelegt, daß es schon zahlreiche musiktheoretische Arbeiten innerhalb dieses Forschungfeldes gibt, von denen einige ausführlicher diskutiert werden. Es dürfte anzunehmen sein, daß eine Systematische Musiktheorie, die von der Musiktheorie ausgehend in enger Beziehung zur psychologischen und neuropsychologischen Forschung steht, sich vornehmlich im Programm der Kognitionswissenschaft entwickeln läßt bzw. derzeit schon entwickelt.
1) Block 1981a, 198lb; Fodor 1981, Miller 1981. 2) vgl. Seifert 1989, 1990.
41 2. 2.
Grundlegende Konzepte der Kognitionswissenschaft in ideengeschichtlicher Darstellung
2. 2. 1 Die Kognitionswissenschaft als neue wissenschaftliche Disziplin Der Forschungsbereich der Kognitionswissenschaft 1 bildete sich in den letzten 40 Jahren heraus und wird meist als Verbund verschiedener Dis ziplinen angesehen, die das Phänomen der Kognition erforschen. Als Kern disziplinen werden häufig die Neurowissenschaften, die Künstliche Intelligenz, die Kognitive Psychologie, die Linguistik und die Epistemologie angeführt. Bei solch einer Vielzahl divergierender Arbeitsfelder besteht die Ten denz, sich zu einem losen Konglomerat verschiedener Disziplinen zu ent wickeln, die es erschwert, die Einheit dieses neuen Forschungsprogram mes aufzuzeigen und erkennen zu lassen. Diese Tendenz wird verschärft, wenn mit der fachspezifischen For schung begonnen wird, bevor die wesentlichen methodologischen und phi losophischen Annahmen der Kognitionswissenschaft klar herausgearbeitet sind, die es einerseits ermöglichen, Kriterien zur Abgrenzung von anderen Forschungszweigen zu erstellen und andererseits die Selbständigkeit der Kognitionswissenschaft als eigenständige Forschungsdisziplin innerhalb der Wissenschaft auszuweisen. Dies ist um so dringlicher, da es zunehmend ernstzunehmende Kritiken ehemaliger Verfechter kognitionswissenschaftli chen Denkens wie den Philosophen Hilary Putnam2 und den KI- und Sprachforscher Terry Winograd3 gibt, welche die ErheBung des Erkennt nisprozesses durch die Kognitionswissenschaft für undurchfUhrbar halten:
In unserer Kritik ist damit auch implizit eine Stellungnahme zur For schungseinrichtung der Kognitionswissenschaft enthalten. Wir halten die se zwar nicht für geistlos und unnütz, aber ihr wird es doch wesentlich an Weitblick und Fiihgkeiten i fehlen, um zu der Frage, was wir sind und was wir tun, beitragen zu können. Der gemeinsame Ausgangspunkt des kognitionswissenschaftlichen For schungsprogrammes der verschiedenen Kerndisziplinen Linguistik, Neuro wissenschaften, KI und Kognitiver Psychologie und Philosophie sei noch einmal skizziert. In der generativen Linguistik wird angenommen, daß der menschliche Geist durch formale Regelsysteme beschreibbare Regeln als Repräsenta tionen des kognitiven Bereiches Sprache entwickelt. In den kognitiven Neurowissenschaften bildet die Arbeitshypothese, daß das Gehirn interne Modelle, d. h. Repräsentationen der Umwelt, ausbilde und Kognition Er rechnung sei, den Ausgangspunkt der weiteren Forschungen.4 Diese Ar1) Zur Entwicklung der Kognitionswissensschaft s. Gardner 1989 und Varela 1990. 2) s. Putnam 1988. 3) Winograd & Flores 1989, 54. 4) vgl. Pribram 1982.
42
beitshypothese wird zuweilen von der kognitionswissenschaftlichen KI Forschung aufgegriffen (Charniak & McDermott 1985, 6): Artificial Intel
ligence is the study of mental faculties through the use of computational models. .. . What the brain does may be thought of at some level as a kind of computation.
Ergänzt werden diese Annahmen durch die Physical-Symbol-System Hypothese der "informationsverarbeitenden" Psychologie, die von Terry Winograd und Fernando Flores (1989, 52) zusammengefaßt wird. Die psy chologische Arbeitshypothese für Computersimulationen kognitiver Prozes se lautet dann:
1. Alle kognitiven Systeme sind Symbolsysteme. Sie erlangen ihre In telligenz durch Symbolisieren externer und interner Situationen und Ereignisse, sowie durch Manipulation dieser Symbole. 2. Alle kognitiven Systeme verfügen über eine gemeinsame, zugrunde liegende Menge symbolmanipulierender Prozesse. 3. Eine allgemeine Theorie solcher kognitiven Leistungen kann also in einem geeigneten, symbolischen Formalismus als informationsverarbeiten des Programm abgefaßt werden. D. h.: Wenn dieses Programm in der entsprechenden Umgebung abläuft, ist es in der Lage, das beobachtbare Verhalten hervorzurufen. Mit Hilary Putnam (1983, 141), der den formalen Ansatz dieser For
schungen im Bereich der Kognitiven Psychologie betont, lassen sich die Annahmen der verschiedenen Disziplinen wie folgt zusammenfassen: The mind (or the brain; U. S.) uses a formalized language ( or some signifi
cantly like a formalized language} both as a medium of computation and a medium of representation.
Aus philosophischer Sicht zeigen sich in diesen Forschungen Tendenzen neomechanistischen Denkens, das in den exakt beschreibbaren Verhaltens funktionen, wie z. B. der Kognition des Menschen, die Arbeitsweise eines abstrakten Automaten zu erkennen glaubt (so z. B. in Burks 1972/73 ). Ziel der folgenden Kapitel wird es sein, die zentralen Konzepte der Kognitionswissenschaft herauszuarbeiten, zu analysieren und ihre Bezie hungen aufzuzeigen , um einerseits die angeführten Arbeitshypothesen und die daraus resultierenden methodelogischen Forderungen einsichtig zu ma chen, sowie andererseits die Leistungsfähigkeit und Grenzen dieses For schungsprogrammes aufzuzeigen. Ausgangspunkt der weiteren Untersu chungen wird dabei die heutzutage allgemein angenommene Funktionsweise des Nervensystems bilden.
43
Neurologische Grundkonzepte
2. 2. 2. 2. 2. 2. 1 .
Zur Anatomie des Nervensystems
Heute wird meist angenommen, daß psychische Phänomene ein mate -rielles Korrelat besitzen und der Mensch über seine Sinnesorgane, ver: mittelt durch das Nervensystem, speziell das Gehirn, Kenntnis über seine Umwelt erhält, obwohl er sich subjektiv-phänomenal "direkt" mit der Welt verbunden fühlt. Dies wurde von Mountcastle (nach Popper & Ecc les 1982, 312) wie folgt beschrieben: Jeder von uns glaubt von sich selbst,
. daß er direkt in der Welt, die ihn umgibt, lebt, ihre Gegenstände und Ereignisse genau fühlt und in einer realen und gegenwärtigen Zeit lebt. Ich behaupte, daß dies ntusionen der Wahrnehmung sind, denn jeder von uns begegnet der Welt mit einem Gehirn, das mit dem was "draus sen" ist, über wenige Millionen gebrechliche sensible Fasern verbunden ist. Diese sind unsere einzigen lnformationskanäle, unsere lebendigen Verbindungen zur Realitiit.
Nimmt man seiner Umwelt gegenüber einen externen Beobachterstand punkt ein, erscheint ein Mensch, dessen Körperoberfläche als Grenze be trachtet werden kann, als black box, die, eingebettet in eine Umgebung, auf gewisse Veränderungen der Umwelt reagiert und durch Aktivitäten Veränderungen erzielt. Man kann versuchen, eine funktionale Beziehung zwischen der Eingabe und der Ausgabe zu ermitteln. Um diese Vorstellung zu illustrieren, sei an die schulische Situation ge dacht, in der z. B. im Musikunterricht ein Schüler auf die Frage nach der Tonfolge zweier Töne mit der Benennung des Abstandes der beiden Töne zu antworten hat oder aufgrund eines Notentextes eine Bewegungs folge für die Erzeugung von entsprechenden Tönen auf einem Instrument leisten soll. Wie diese Beispiele andeuten, können verschiedene "Kanäle" unterschie den werden. Im ersten wird aufgrund von "akustischen Phänomenen" mit der Auslösung einer Bewegungsfolge der Sprechmuskulatur reagiert, deren Endresultat die Benennung des Ereignisses ist. Im zweiten Beispiel wird aufgrund der Sehwahrnehmung mit motorischen Reaktionen geantwortet. UMgebung
U111gebung
bzw.
\) x 71.._Körper __,��� r•a•b•,r
Eingabe
_ _ _
Aussabe
44
Es werden bei der systemtheoretischen Betrachtungsweise zwei Berei che (Systeme) unterschi;den: Zum einen die- Umgebung , � der die black box Eingaben erhält und in die sie Ausgaben abgibt, und zum anderen die black box selbst. Der Beobachter, der bestimmt, welche die relevanten Ein-und Ausgaben sind und sie in Beziehung setzt, wird hier nicht ange zeigt. Der Beobachterstandpunkt ist vorzufinden in Untersuchungen der Funkti onsweise des Nervensystems, bei denen Ideen und Konzepte der Nach richtentechnik eine zentrale Rolle spielen. Denn ebenso wie bei der Un tersuchung tierischen Verhaltens ist es nicht möglich, verbale Beschrei bungen der Funktionsweise des Gehirns, der Neuronengruppen oder ein zelner Neurene nach der durch einen Reiz ausgelösten Zustandsänderung und Reaktion von den Versuchspersonen zu erhalten. Es kann daher nur der Standpunkt des externen Beobachters eingenommen werden, der aufgrund seiner Messungen (Beobachtungen) Schlüsse über die Verhal tensweise zieht. Abhängig von der Untersuchungsebene wird bei der funktionalen und strukturellen Untersuchung entweder das gesamte Gehirn oder eine bestimmte Anzahl von Neuronen oder das einzelne Neuron als black box betrachtet. 2. 2. 2. 1. 1 Das Nervensystem in der black box-Bettachtungsweise
Bei der Untersuchung des menschlichen Nervensystems erwies es sich als nützlich, folgende drei Bereiche1 voneinander zu trennen: (1) den Bereich der Reizaufnahme, die Rezeptoren (Sinneszellen,
die spezielle Nervenzellen sind),
(2) das eigentliche Nervensystem (aus den Nervenzellen beste (3)
hend) und die Effektoren (z. B. Muskelzellen).
Rezeptoren sind die Zellen der Sinnesorgane, die den adäquaten Sinnes reiz aufnehmen und die neurale Erregung in den neuronalen Code um wandeln (Keidel 1971, 47 ff.). Es handelt sich also um Transduktoren. Effektoren sind z. B. Muskelzellen, die neurale Erregung empfangen und z. B. in eine Muskelfa.serkontraktion umsetzen können. Das eigentliche Nervensysten - das Zentralnervensystem - mit seinem Grundbaustein, dem Neuron, wird als Rechenmechanismus begriffen, welcher die Realität errechnet.
I) Zu dieser Unterscheidung vgl. Arbib 1987, 16; Arbib 1989, 50; Sinz 1978, 55.
45 UH6EBUH6 ------------------------------------------------------------------,
Effektaren
t.eJ.D- 10 l.l.
Meu
aus ron•n •rr•chne't Sismal•n n•u• Signale
..
u
CTransduk � i o n u . T ransforha"t:ion )
Das
"e'tzwerk
aus
eingehend&n
Muskeln.
• A • .. .. � 4
Drüs•n
Körper
- -----------------------------------------------------------------� Abb.
nach Arbib
1964, 1989
Sowohl die Einteilung in die drei Bereiche Rezeptoren, Nervensystem und Effektoren als auch die Betrachtung des Nervensystems als ein kom plexes Rechensystem wird durch eine phylogenetische Argumentation ge stützt. Heinz von Foerster (196 7, 66) spricht davon, daß es das letztend liche Ziel des (eigentlichen) Nervensystems sei to serve as a computer that links detection with appropriate action.
Gemeint ist hiermit natürlich nicht eine Datenverarbeitungsanlage, son dern ein Rechner (Errechner, Prozessor), ein Mechanismus, der Funktio nen (und Relationen) berechnet. Phylogenetisch wird diese Annahme durch folgende Fakten gestützt: Die phylogenetisch älteste Form 2 ist die, in der die Zelle Sensorium und Effektor (Kontraktion) vereint (Abb. A in untenstehender Abbildung). Im nächsten Stadium läßt sich eine lokale Trennung von DetektorfunKtion (Rezeptor) und Effektorfunktion aufweisen, die eine Spezialisierung des Sensoriums ermöglicht (Abb. B). Den letzten Schritt bildet die Zwischen schaltung einer Nervenzelle - als "computer" - zwischen Rezeptor und Effektor (Abb. C).
Abb.
aus
Hofstätter
1957, 259
Diese Unterteilung ist keine neue Erkenntnis der Forschung des 20. Jahrhunderts, sondern schon im 19. Jahrhundert nachzuweisen. Sehr schön läßt sich die Bedeutung der Nervenzelle flir psychische Funk2) Zu dieser phylogenetischen Argumentation, die als Stütze der These dient, in der Neuronen funktional als Errechnungseinheiten aufgefaßt werden vgl. Förster 1967, 66; 1985, 31-33.
46
tionen, wie sie aus der Perspektive des die Darwinsche Evolutionstheorie voraussetzenden Mate-rialismus im 19. Jahrhundert gesehen wurde, in Haek kels (1899/1984, 166) berühmten Werk 'Die Welträtsel' aufzeigen: Erst
wenn das "dreizellige Reflexorgan" sich entwickelt ... , wenn zwischen die sensible Sinneszelle und die motorische Muskelzelle die selbständige dritte Zelle eingeschaltet wird, die "Seelenzelle oder Ganglienzelle", können wir diese als ein selbständiges Elementarorgan des Willens . anerkennen. Der Wil le bleibt aber hier, bei den niederen Tieren, mei stens noch unbewußt. Erst wenn sich bei den höheren Tieren das Be wußtsein entwickelt, als subjektive Spiegelung der objektiven inneren Vorgänge im Neuroplasma der Seelenzellen, erreicht der Wille jene höchste Stufe, ...
Auch wenn Haeckel vorschnell bewußte Geisteszustände mit Hirnvor gängen, d. h. der Aktivität von Neuronen, identifiziert, zeigt sich die Grundargumentation neurophysiologischer Erforschung des Gehirns und des menschlichen Geistes. 1 Das gesamte (eigentliche) Nervensystem (ZNS) erweist sich als sehr komplex, so daß weitere Unterteilungen vorgenommen werden. Sinz (1978, SS; Kahle 1986, 2) differenziert das Nervensystem (animalisches Nerven system) in das Zentralnervensystem (ZNS), bestehend aus Gehirn (Enze phalon) und Rückenmark, und das periphere Nervensystem mit Rezepto ren, Effektoren und dem Vegetativum, bestehend aus Sympathikus und Parasympathikus, während Birbaumer (1975, 12; eine neuere psychobiologi sche Darstellung des Nervensystems fil)det sich in Birbaumer & Schmidt 1989) das vegetative Nervensystem nicht dem peripheren Nervensystem zuordnet, sondern es dem cerebrospinalen Nervensystem, bestehend aus zentralem und peripheren Nerve·nsystem (Effektoren und Rezeptoren) gegenüberstellt. Die bewußte Wahrnehmung, willkürliche Bewegungen und Nachrichten verarbeitung (Integration) sind mit diesem (cerebrospinalen ) Nervensystem bzw. Zentralnervensystem verbunden. Über afferente (sensible) Bahnen werden von den Sinneszellen Nachrichten (Informationen) zum ZNS ge schickt, im Gehirn verarbeitet und über efferente Nerven gegebenenfalls motorische Reaktionen ausgelöst. Sinz (1978, 37) beschreibt die neuronalen Mechanismen des Wahrneh mungsprozesses (Empfindung), Rezeptoren und Effektoren einschließend. Die Funktion des rezeptiven Abschnittes, der sensorischen Verarbeitung, kann durch folgende Aufgaben charakterisiert werden (Birbaumer 1975, 1 5 ): a) Aufnahme exterozeptiver (Umweltreize) und propriozeptiver Reize (Reize aus dem Körperinneren) 1) Zu diesem argumentativen Kategorienfehler, der sehr häufig in der neurophysiologi schen Forschung begangen wird, wenn höhere mentale Prozesse mit neurophysiologi schen Sachverhalten korreliert werden und dem auch der "neurologisch" orientierte Forschungszweig der Kognitionswissenschaft, der Konnektionismus, ausgesetzt ist vgl. besonders Mackay 1984.
47
b) Umwandlung
Die Informationsaufnahme und -weiterleitung am Beispiel des auditorischen Systems
Um eine konkretere Vorstellung über diese Einteilung zu erhalten, seien die anatomischen Stationen der Informationsaufnahme und Verarbeitung des Gehörs dargestellt, die für di·e Wahrnehmung von musikalischen Struk turen vorausgesetzt werden. Es ist festzuhalten, daß im wesentlichen strukturelle Momente (wo; welcher Weg; also Projektion und Lokalisation) bei dieser Darstellung im Vordergrund stehen und die funktionellen Aspekte (wie, auf welche Art und Weise) wenig berücksichtigt wurden. Für das Gehör - hierunter werden das Ohr, die Nervenbahnen und Ge hirnzentren verstanden (Eckel 1982, 72) - sei dies skizziert.1 2. 2. 2. 1 . 2. 1
Die periphere Umsetzung
Anatomisch werden das Außenohr mit der Ohrmuschel, dem äußeren Gehörgang, dem Trommelfell; das Mittelohr mit den drei Gehörknöchel chen (Hammer, Amboß, und Steigbügel) und das Innenohr mit der Schnecke (Cochlea) unterschieden. In der Cochlea liegt das Certische Organ, das den rezeptorischen Apparat bildet.
Schema des Aulb�us des Ohres
Abb. aus
Eckel
1982, 7 4
1) näheres hierzu findet sich z. B. in Ecke! 1982; Roederer 1987; Sidtis 1984; Wehner 1980; Marin 1990.
48
Das Certische Organ enthält die ft.ir die Hörwahrnehmung zuständigen Rezeptoren - Sinneszellen - : die inneren und äußeren Haarzellen.
SCALA VESTIBULI 1Ptrily"'4'htl
SCALA TYMPANI (Ptfilympht)
Abb. aus Ecke! 1982, 76
Über die sensorische Informationsaufnahme und Umwandlung an der Ba silarmembran und den Sinneszellen gab es verschiedene Theorien, auf die an dieser Stelle nicht näher eingegangen werden soll (vgl. die Monogra phie von Hesse 1972). Die Haarzellen führen aufgrund der mechanischen Reizung einen Transduktionsprozeß der auditarischen Information in den neuronalen Code durch (näheres in Keidel 1975). 2. 2. 2. 1. 2. 2
Die Hörbahn
Nachdem der Transduktionsprozess erfolgte, gelangt über eine Diver genz-Konvergenz-Schaltung, durch die u. a. das Prinzip der lateralen Inhibition verwirklicht ist, die vorwiegend kreuzweise Weiterleitung der Erregung (und der Information) über verschiedene Stationen der Hörbahn zu den Projektionsfeldern des Cortex. Die folgende Abbildung zeigt schematisch die Konvergenz- und Diver genzschaltung sowie ihre Kombination zu einer Divergenz-Konvergenz schaltung1:
1) vgl. Keide! 1971, 47-64; Keidel 1989, 151-162; Zimmermann 1972, 251-253.
49 Divergenz
Konvergenz
Informations
schaltung
schaltung
leitung im ZNS
Abb. aus Keidel 1989, 160
Eine Vorstellung der Informationsleitung i.iber die Divergenz-Konver genz-Schaltung zu den zentralen Projektionsrindenfeldern des primären akustischen Cortex (Al in der Abb.) und sekundären akustischen Cortex (All in der Abb.) sowie zum tertiären visuellen akustischen somaästheti schen Cortex (der Assoziationsrinde; VAS in der Abb.) innerhalb des Gehirns vermittelt die nächste Graphik:
Abb.
aus
Keidel 1989, 160
An der Basis der Haarzellen findet, nachdem der Transduktionsvorgang erfolgte, über synaptische Kontakte die Weitergabe der Erregung statt. Das Ganglion spirale cochleae enthält bipolare Neuronen, die durch ihre Dendriten von den Haarzellen über synaptische Kontakte die Erregung aufnehmen können und über ihre Axone, die sich zur Radix cochlearis vereinigen, weiterleiten, um dann in dem Nucleus cochlearis ventralis und dorsalis zu enden. Über den Nucleus cochlearis dorsalis - von diesem Punkt an wird auch von der Hörbahn im engeren Sinn gesprochen - er folgt die Weiterleitung über mehrere Umschaltungstellen über das Lemnis lateralis zum Corpus Geniculatum mediale. Ab dem Corpus Geniculatum mediale spricht man von der Hörstrahlung,
so
die ihre primäre Endigung in der Hörregion A ! des Cortex hat.
Med;al geniculate
Inferior colliculus Brainstem auditory nuclei
�
Cf}
Cochlear nucleus
d;tory nerve
Cochlea
Abb. aus Rosenzweig & Leiman 1982, 281
2. 2. 2 . 1 . 2. 3
Das Hörzentrum
Die Hörstrahlung steigt im Temporallappen zur primären Hörrinde1 auf. Von der primären und sekundären Hörrinde2 erfolgt eine Weiterleitung, um dann in der Assoziationsrinde (tertiäre Rinde) zu einer Integration des visuellen, akustischen und somaästhetischen Kanals zu führen? Die Phase der Weiterleitung und Verrechnung, nach der Transformation des Reizes bis hin zu den ersten Projektionsfeldern, möchte ich als Vor verarbeitung4 (preprocessing) bezeichnen, die das akustische Material im Prinzip so aufbereitet, daß unter Einbeziehung der Assoziationsrinde "symbolische Verrechnungen" möglich werden, die den Ubergang zu Vor gängen des bewußten Erkennens - d. h. den Eintritt in das Bewußtsein komplexer musikalischer Strukturen ermöglichen. Über diese Zusammen hänge ist allerdings bislang so gut wie nichts bekannt, obwohl gerade sie 1) Es wird auch von der auditorischen Region Al, oder dem Brodmannschen Area 41, der die Heschlsche Querwindung (Gyri temporalis transversi) bedeckt und die Endigung der Hörstrahlung bildet gesprochen. Zur Lage der Region Al bzw. 41 vgl. die beiden Karten auf S. 51. Vgl. auch Popper &. Eccles 1982, 333. 2) Hierbei handelt es sic!h um die auditorische Region A II bzw. das Brodmannsche Area 42 sowie das Area 22, mit dem nach Wernicke benannten Sprachzentrum. Vgl. ebenfalls die Karten der Hirnrindenfelder auf S. 51. 3} Eine genaue Darstellung findet sich in Keidel 1989, 158 und Kahle 352, 228 u. 229.
4} vgl. auch Kap. 3. 1. 1, S. 174 ff. und Kap. 3. 2. 4, S. 305 ff.
1986, 236,
51
Abb.
aus
Ecke!
1982, 67
Das Bild zeigt die linke Hemisphäre. AI bezeichnet die primäre Hörrinde, und All kennzeichnet den Bereich der sekundären Hörrinde.
Abb. aus Kahle 1986, 2 2 9 Die Rindenfelder der Hemisphäre nach Brodmann. Die Be reiche 41 und 42 kennzeichnen die auditorischen Projekti onsbereiche.
/
52
für die Verarbeitung von komplexen musikalischen Strukturen, die den Musikwissenschaftler interessieren, zentral sind! Ecke! (1982, 66) führt hierzu aus: Für das Verstehen der musikalischen Klanggestalt ist wahr scheinlich das Einbeziehen der sogenannten tertiären Sinnesrinde, d. i. die Assoziationsrinde, die den größten Teil des Stirnhirns und große Teile des Schläfenlappens ausmacht, ebenso notwendig wie diese für das Gestalterkennen innerhalb aller Modalbezirke nötig ist.
Dies ist der Ort, an dem die kognitive Modellierung2 musikalischer Vorgänge ansetzt. Wenn auch wenig über die "Verrechnung komplexer musikalischer Strukturen" auf dieser Ebene bekannt ist, so läßt sich doch zeigen, daß im Cortex eine bestimmte, klar abgrenzbare Struktur von Neuro nenverbänden vorliegt, in der grundlegende Berechnungen ftir die Wahrneh mung von Formen vorgenommen werden und die interagieren. Es handelt sich um die Differenzierung des Cortex in verschiedene Schichten und Kolumnen.
1) In der deutschsprachigen psychologischen Literatur wird von psychophysischen Ni veau (Bischof 1966), in der amerikanischen bzw. der amerikanisch beeinflußten psy chologischen Forschung von mentaler bzw. cerebra/er Repräsentation gesprochen. Roederer (1987, 92) charakterisiert diese Ebene in seinem Aufsatz über auf Musik bezogene auditarische Informationsverarbeitung wie folgt: Most germane to the questi on of neurophysiological aspects of perception and processing of Information is the way in which animal brain hand/es the Operation of the environmental representation. resentation We shaJI define as the mental or cerebral rep
(Hervorhebung U. S.)
object the specific distribution of electrical signals in the
neural JJetwork
cerebral cortex that appears in causal, one-to-one correspondence
with
of an of the
the specific
Features sensed during the representation of that particular object.
Er (Roederer 1987, 94) merkt weiterhin an, daß über diese Ebene allerdings bisher wenig bekannt ist und ihre Erforschung sich als sehr schwierig erweist: W1Jereas in the peripheral and Jower stages of neural Information processing relatively smaJI ensem bles of spatiaJiy contiguous neurons detectors in
vision;
execute definite functions audition), at the
"meow" detectors in cats'
of the brain even the
(e. g. spatial frequency higher cognitive Ievels
ssimplest" neural representation engages millions of cortical
neurons cooperatively at the same time, there is no spatial continuity in the corre sponding neural activity distribution,
·-
These
Facts make an experimental verification
of the hypothesis about representation and cognition (... ) an extremely difficult enter prise.
2) Es ist zu unterscheiden zwischen neuronaler und kognitiver Modellierung. Die neuronale Modellierung ist an einer genauen Abbildung des "realen" Verhaltens von Neuronen bzw. Neuronenverbänden interessiert, während die kognitive Modellierung - Colby 1978 spricht in diesem Zusammenhang von mind models -, die Simulation der den Bewußtseinsvorgängen unterliegenden Repräsentationen und Prozesse durchführt; es handelt sich also um eine psychologische Modeliierung Im ersten Fall, in dem sich die Forschungsrichtung insgesamt mehr der Hirnforschung zuwendet, kann in der musik wissenschaftlichen Forschung von Neuromusikolo gie (Botez, Botez & Aube 1983) ge sprochen werden. Im zweiten Fall ist, innerhalb der Musikwissenschaft von PsYdlo musikologie zu reden. Seide Forschungsrichtungen führen ihre Modellierungen im Rahmen von operationalen Modellen, d. h. des Berechenbaren, durch.
53 2. 2. 2. 1. 3 2. 2. 2. 1. 3.
Der Schichten- und Säulenaufbau des Cortex Cerebri Die Schichten
Der 3mm dicke Neocortex besteht aus sechs in charakteristischer horizonta ler Weise angeordneten Hauptschichten (vgl. Sinz 1978, 105-109) von Nerven zellen, die wiederum in "vertikalen Ketten", den Kolumnen (Säulen) oder Mo dulen1 durch die Rinde ziehen, welche anatomisch-funktionale Einheiten sind. Bei den sechs unterscheidbaren Schichten handelt es sich um: I) die Lamina molecularis (auch zonalis) (äußere Schicht vgl. in der Abb. A 1/4 auf S. 54 die Darstellung mittels Silberimprägnation); II) die Lamina granularis externa (die äußere Körnerschicht Abb. A 1/5) mit Körner- oder Sternzellen; III) die Lamina pyramidalis (die äußere Pyramidenschicht, Abb. A 1/6); IV) die Lamina granularis interna (die innere Körnerschicht Abb. A 1/7); V) die Lamina ganglionaris (die innere Pyramidenschicht, Abb. A 1/8) mit den großen Pyramidenzellen VI) die Lamina multiformis (Abb. A 1/9).
I) Die Darstellung aus Szentagothai (1977, 238) zeigt Modul- und Schichtenstruktur. Die Module - auch Kolumnen genannt - können als physiologische und anatomische Spezi fizierung der Hebbschen cel/ assernblies angesehen werden und bilden somit im Sinne der Hebbschen Theorie (Hebb 1949, 1975) das neuronale Substrat geistiger Funktionen.
54 Die Schichten werden durch unterschiedliche Färbungsverfahren aufge zeigt. Es handelt sich um die Silberimprägnation nach Golgi (1 ), die Nisslfärbung (2) und die Markscheidenfärbung (3), bei denen die Schichten unterschiedlich in Erscheinung treten. Das folgende Bild gibt die vertikale Architektonik in den verschiedenen Darstellungsformen wieder, die bedingt ist durch die unterschiedlichen Präparate (Golgi- (1), Nissl- (2) und Markscheidenpräparat (3)). Aufgrund der unterschiedlichen Ausprägung der einzelnen Schichten sowie der Größe der in ihnen enthaltenen Zellen können einzelne Rindenfelder unterschieden werden. Diese zytoarchitek tonisch unterschiedlichen Ausprägungen bilden die Basis für die "funktio nale Kartographie" der Cortexoberfläche. So weisen die Rindenschichten der sensorischen Projektionsfelder1, es handelt sich um die Endstätten der einzelnen aufsteigenden Bahnen, eine für diese grundlegende Struktur auf, in der die Körnerschichten (IV und li) verbreitert, während die Pyrami denzellschichten zurückgetreten sind. Ich gebe daher - neben der verti kalen Schichtung und der Brodmannsche Karte - auch die Schichtung der Hörrinde der Area 41 an (vgl. Abb. B), in der die Lamina granularis in terner (IV) und Lamina granularis externa (II) der Sternzellen stark ver breitert sind, wohingegen die Lamina ganglionaris (V) und Lamina pyra midales (111) der Pyramidzellen nur schmal ausgebildet sind.
Schic hten des Neocortex. Sllbe�mprlgnatlo n . ZeiiiJrbung, M a rksch eidenlärbung
Abb.
A
aus Kahle
1 9 8 6 , 227
Area �I, Hörrinde Abb.
B aus Kahle
1986, 237
1) Die Endstätten der Hörbahn, die als Area 41 und 42 bezeichneten Rindenfelder der Brodmannschen Karte bzw. die Regionen AI und All, sind beispielsweise die Projekti onsfelder des auditiven Wahrnehmungsprozesses, vgl. die Karten auf S. SI.
55 2. 2. 2. l . 3. 2
Die Säulen (Kolumnen) als funktionale Einheiten
Die aus bis zu 10 000 Neuronen bestehenden modularen Netzwerke (Module, Säulen, Kolumnen) von 0,2-0,5 mm Durchmesser werden als grundlegende Einheiten der integrierenden Informationsverarbeitung be trachtet, die wiederum untereinander verbunden sind (vgl. Popper & Ecc les 1982, 283-305). Sinz (1978, 1 1 1 ) bezeichnet die Kolumnen als lokalisato rische und modalitätsspezifische funktionelle Einheiten eines Rezeptortypes.
Am besten sind bisher die für die Sehwahrnehmung zuständigen Kolum nen in ihrer funktionellen Bedeutung erforscht. Die nächste Abbildung dient dazu, einen Eindruck davon zu geben, wie die verschiedenen Schichten und Säulen in Beziehung zu ihrer funktionellen Aufgabe stehen. Es handelt sich um die sogenannten, ftir die Sehwahrnehmung bedeutsa men, orientation columns. Diese Kolumnen dienen dazu, die Orientierung - senkrecht, waagerecht, schräg etc. - von Geraden zu erkennen. Sehr deutlich sind die zytoarchitektonischen Schichten (ganz links) und die Säulensequenz mit ihrer "Erkennungsfunktion" (ganz rechts) differenziert:
Oculäre Dominanz Säule Abb. aus
Grüsser 1979, 258
Bis hierher wurden die notwendigsten neurologischen sowie physiologi schen Kenntnisse vermittelt, die für das Verständnis der formalen Dar stellung neurophysiologischer Vorgänge durch Nervennetze notwendig sind und die Verbindung zur Automatentheorie einsichtig machen.
56 2. 2. 2. 2
Die Nervenzelle und die Signalübertragung zwischen den Nervenzellen.
Ende des 19. Jahrhunderts setzte sich die Neuronentheorie,1 in der das Nervensystem als ein Netzwerk aus isolierten, untereinander verknüpften anatomischen, genetischen und funktionellen Einheiten - den Neuronen (Ganglienzellen, Nervenzellen) - betrachtet wird, gegenüber der Kontinui tätstheorie des Nervennetzes (von den Retikularisten vorgestellt als kon tinuierliches Geflecht von Nervenfasern) durch. Die Verknüpfung der Neurone erfolgt über Synapsen. Zentral für dieses Modell sind die Sy napsentheorie Sherringtons, das Konzept des Neurons (eingeführt von Waldemeyer und Cajal) und das 1874 von Bodwitch formulierte Alles oder-Nichts-Gesetz (vgl. Förster 196 7; es wird meistens Adrian zuge sprochen), welches die Arbeitsweise der Neuronen charakterisiert. Das Nervengewebe besteht aus Nerven- und Gliazellen. Obwohl der Anteil der Gliazellen (der Neuroglia) den der Nervenzellen im Nervenge webe überwiegt, ist über Bedeutung und Einfluß der Gliazellen auf Pro zesse der nervösen Erregung wenig bekannt. Allgemein wird angenommen, daß sie eine Ernährungs- und Stützfunktion erfüllen. Als eigentliche funktionale Elemente der Signalverarbeitung und Infor mationsübertragung gelten die Neuronen (Nervenzellen). Es wird davon ausgegangen, daß das Nervensystem aus 1010 Nervenzellen besteht? Nach funktionalen Gesichtspunkten können bei den Neuronen Rezepto ren, Verrechnungselemente und Effektoren unterschieden werden. ' Die Rezeptoren sind die Schnittstellen des Nervensystems mit seiner 1) Diese Neuronentheorie, welche die Grundideen der heutigen Vorstellungen über den Aufbau des Nervensystems widerspiegelt war bis 1933 (Cajal 1933; der Streit mit den Retikularisten) umstritten und konnte erst in neuerer Zeit durch elektronenmikroskopi sche Untersuchungen bestätigt werden. Allerdings findet seit den fünfziger Jahren eine weitere "stille Revolution" statt, welche das Denken über die Arbeitsweise neuro naler Schaltungen erheblich verändern wird. Das Konzept des Lehrbuch-Neurons muß erweitert werden. So wurden Neurone mit zwei Axonen gefunden, die unterschiedlich Impulse weiterleiten. Die Unidirektionalität axonaler Informationsweiterleitung über axo-axonale, axo-dendritische und axo-somatische Synapsen ist um die Idee der rezipro ken Informationsübertragung über dendro-dendritische Kontakte zu erweitern. Ebenso scheinen elektrische Felder modulierende Einflüsse zu haben. Diese "stille Revolution" findet sich dokumentiert in Bullock 1959; Schmitt , Dev & Smith 1976. Die Vorstellun gen über die Informationübertragung im Rahmen der klassischen Neuronentheorie fin den sich bei Grüsser, Klinke & Kossow 1968. Für Hebb 1949, 1975 bildet sie die Basis zur Erklärung psychischer Prozesse im Rahmen seiner Theorie der Zellverbände (ceJJ assemblies) und phase-sequences. 1 2) Die Zahl von 10 Milliarden (10 0) Nervenzellen findet sich in vielen Lehrbüchern zur Neurophysiolo/bie e. g. Schmidt 1972, 2. Nach neueren Schätzungen besteht das Ge 1 Neuronen (vgl. Mountcastle 1978). In Schwartz 1988 findet man hirn aus SO x 10 weitere Angaben über die Zahl der Synapsen etc.
57
Umgebung, der körperexternen und körperinternen Welt. Die Rezeptoren sind Transduktoren und wandeln die adäquaten physikalischen Reize in den elektro-chemischen Code des Nervensystems um. Die Effektoren wirken auf die körperexterne Welt durch Auslösung mo torischer Prozesse wie Sprechen, Gehen etc. ein oder auch auf die kör perinterne Welt. Die Modellvorstellung des "klassischen" Neurons als funktional-anatomische Recheneinheit in der Neurophysiologie
2 . 2 . 2. 2 . 1
2. 2. 2. 2. 1. 1
Histologisch-anatomische Darstellung des Neurons und der Synapse
Das Neuron (die Nervenzelle, Ganglienzelle) unterscheidet sich von an deren Zelltypen durch die Fähigkeit, Informationen weiterzuleiten (Bir baumer 1975, 7). Neuronen können die unterschiedlichste Form aufweisen, so daß schon die Grundvorstellung des "klassischen" Neuron eine Ab straktion darstellt. Hatte ich vorhin schon zwei grundlegende Zelltypen die Sternzelle (Körnerzelle, vgl. Kahle 146-149; 226) und die Pyramiden zellen (vg!. Kahle 226) des Neocortex unterschieden -, so kann gesagt werden, daß diese Zelltypen in ihren verschiedenen Ausprägungen die zentralen Elemente der "neuronalen Maschine" Gehirn ausmachen. Verschiedene Arten von Neuronen
Abb.
aus
Schmidt
1972,
3
Trotz der unterschiedlichen Form und Größe der Neuronen läßt sich eine gemeinsame Struktur aufweisen. Ausgangspunkt für die Darstellung des abstrahierten gemeinsamen Bauplanes bildet häufig das Motoneuron des mammalischen Rückenmarks (Arbib 1989, 51; vgl. Eccles 1982, 340).
58
2. 2. 2. 2. 1. 1. 1
Das Neuron
Ein Neuron besteht aus einem Zellkörper (Soma, Perikaryon), den Den driten (Fortsätzen) und dem Axon (Neurit, Hauptfortsatz, Nervenfaser). Der Zellkörper eines Neurons weist eine Größe von 5 bis 100 Mikron (1 mm = 1 000 1.1 = 1 000 Mikron). Er besteht wie jede Zelle aus Zyto plasma, Zellkern (Nukleus), Golgi-Apparat, Mitochondrien etc. Die Dendriten vergrößern durch ihre Verzweigungen die Oberfläche der Nervenzelle. Sie sind die Orte des Erregungsempfanges und an ihnen en den die Axone bzw. Axonkollaterale anderer Neurone mit ihren Endknöpf chen. In diesem Fall wird von axo-dendritischen Verbindungen (Synapsen) ge sprochen. Es gibt aber auch axo-somatische und axo-axonische Verbindungen. Das Axon dient der Signalleitung und leitet die Erregung weiter. Die Länge eines Axons kann von einigen Mikron bis zu weit über einem Me ter betragen. Das Axon entspringt am Axonhügel (Ursprungskegel) des Soma, dem Ort, an dem die Erregungsbildung stattfindet, und bildet Äste, sogenannte Axonkollaterale, aus; es verzweigt sich schließlich zu Telo dendren (den Endverzweigungen des Axons), um mit den boutons termi � (den Endknöpfchen) an Nerven- oder anderen Zellkategorien wie Muskel- oder Drüsenzellen zu enden.
Abb. nach Arbib
2. 2. 2. 2. 1 . 1. 2
1989,
52
Die Synapse
Die Erregungsübertragung von einem Neuron zum nächsten findet an der Synapse statt, die von der Membran des Endknöpfchen des Axons mit der Membran der nachgeschalteten Zelle und dem synaptischen Spalt ge bildet wird. An einer Nervenzelle können sich bis zu 10 000 Synapsen befinden, über die diese Nervenzelle Informationen von anderen Nerven zellen erhält (siehe Abb. S. 59)
59 Die Synapse in schematischer Darstellung
Abb. aus Schmidt 1972, 92
Bei der Synapse können die Endknöpfchen (boutons te·rminaux), der � aptische Spalt und die postsynaptische Membran des nachgeschalteten, die Erregung empfangenden Neurons unterschieden werden. Der synapti sche Spalt ist etwa 0, 2 millionstel Millimeter breit. Die rein chemische Erregungsüberleitung erfolgt an der Synapse mittels chemischer Substan zen, den Neurotransmittern, die durch das elektro-chemische Signal der anliegenden Endknöpfchen ausgelöst wird. Die Neurotransmitter befinden sich in sogenannten synaptischen Bläschen, auch synaptische Vesikel ge nannt. Es handelt sich um submikroskopische, nur mit dem Elektronenmi kroskop erkennbare kugelförmige Strukturen mit einem Durchmesser von etwa 500 Ä (Angström), welche die in ihnen enthaltene Überträgersub stanz, die Neurotransmitter, bei Auftreten eines Aktionspotentials an der zu ihnen gehörigen präsynaptischen Endigung, in den synaptischen Spalt entlassen (vgl. Schmidt 1972, 71 u. 72). Die Neurotransmitter bewirken an der postsynaptischen Membran eine Potentialänderung. Funktionell können erregende (exzitatorische) und hemmende (inhibitori sche) Synapsen unterschieden werden, wobei die exzitatorischen Synapsen meistens an den Dendriten anliegen, während die inhibi torisehen Synapsen am Zellkörper oder am Axonhügel lokalisiert sind. Die" erregenden Synap sen bewirken eine Depolarisation des Membranpotentials des betreffenden Neurons, während die hemmenden Synapsen eine Hyperpolarisation bewir ken. Es wird in diesem Fall von exzitatorischen postsynaptischen Potenti alen (EPSP) und inhibitorischen postsynaptischen Potentialen (IPSP) ge sprochen. EPSP und IPSP stellen die Grenzfälle der Membranpotentialver änderung dar, welche durch die Neurotransmitter ausgelöst und experi14 Das .Ä.ngström ist eine Längeneinheit, die bis zum 31. 12. 1977 zulässig l 10 - O m = 1/10 000 000 000 m. =
1 .A.
war.
60
mentell nachgewiesen werden können (Keidel 1989, 1 54 u, 155). 2. 2. 2. 2. 1. 2
Die Signalübertragung zwischen den Neuronen
Um diese Mechanismen zu verstehen, muß kurz auf die für die Be schreibung des elektrophysiologischen Verhaltens des Neurons wichtigen Begriffe eingegangen werden, denn die experimentelle Erforschung der Signalübertragung, d. h. die physikalische Darstellung bzw. Messung der Erregung, der Informationsübertragung der Nervenzellen, erfolgt durch elektrophysiologische Messung der Veränderung des Membranpotentials der Zelle sowie der des Axons. Das Membranpotential ist die Potentialdifferenz, die zwischen dem Zell inneren und der die Zelle umgebenden Flüssigkeit besteht (vgl. Schmidt 1972, 19 ff.) und wird in Millivolt (mV) gemessen. Die Ruhepotentiale der Zellen sind die Membranpotentiale der sich in Ruhezustand befindlichen Zelle. Der für den einzelnen Zelltyp charakteri stische, konstante Wert des Ruhepotentials ist immer negativ und beträgt bei den Nerven- und Muskelfasern von Warmblütern -55 mV und -100 mV. Bei einer Depolarisation findet eine Erhöhung des Membranpotentials statt. Der negative Wert des Membranpotentials bewegt sich in Richtung Null. Die Hyperpolarisation ist eine Vergrößerung des negativen Mem branpotentials. Das Ruhepotential bildet die Voraussetzung für die Funktionsweise der Nervenzellen, Informationen (Nachrichten) aufzunehmen, weiterzuleiten und zu verarbeiten.
Ex tl"'�c •lluliir•s Po't•n'tl al
\ Z•l�
Abb. nach Schmidt
> 1972,
28
61 Wurde das Neuron an mehreren Synapsen erregt, indem es zu EPSP und IPSP kam, so kann eine Weiterleitung der übertragenen Information bis zum Axonhügel erfolgen. Die Information ist amplitudencodiert und die Fortpflanzung des Potentials ist passiv, d. h. mit zunehmender Zeit und zurückgelegter Strecke wird ihre Amplitude kleiner. Sinz (1978, 35) spricht in solch einem Fall von lokalen Potentialen. Passive Weiterleitung
Time I
Time 2
Time 3
-
Time 4
Abb. aus Arbib 1989,
S3
IPSP und EPSP beeinflussen sich gegenseitig:
/PSP
Abb. aus Keidel 1989, 156
62 So können z. B. im Fall der räumlichen Summation die EPSP durch in der Nähe befindliche IPSP angemessener Stärke "neutralisiert" werden. Die hemmenden bzw. exitatorischen Potentiale können sich verstärken, wenn sie in kurzer Folge an einer Synapse auftreten, wenn von einem Axon kurz hintereinander Impulse au�g�sandt wurden. Man spricht in die sem Fall von zeitlicher Summation (vgl. Arbib 1989, 57).
Präsynaptische Faser
Synapse
/Potential der Membran/
subsynaptischen
Postsynaptische Faser /Aitionspotenti.>ll
_i _ _ _ _ _
l_
Abb.
_ _ _ _ _ _
aus
Keidel
1989, 155
Das Membranpotential des Soma reflektiert diese vorangegangenen Ak tivitäten durch eine kontinuierliche Änderung. Erreicht das am Axonhügel gemessene Potential aufgrund einer durch die vorangegangenen Aktivitäten erreichte Depolarisation einen bestimmten Wert - den Schwellenwert - , dann kommt es zu einem selbsttätigen Prozess: der Auslösung eines Akti onspotentials. Diese Aktivität der Nervenzelle findet ihren Ausdruck in Aktionspotentialen (Spikes, Impulse) der Axone. Ab einer gewissen Potentialänderung am Axonhügel - dem Schwe11en wert, der + 10 bis +30 mV vom Ruhepotential entfernt liegt, kommt es zu einem Aktionspotential, indem der Potentialwert sehr schnell auf einen positiven Wert springt und sich dann wieder langsam dem Ruhepotential nähert. Die Depolarisation vom Ruhepotential zur Schwelle wird als Rei zung bezeichnet. Den Reiz f'l.ir die Auslösung eines Aktionspotentials bil det normalerweise ein elektro-chemischer Vorgang. Das an dieser Schwelle beginnende, weiterhin selbsttätig verlaufende Aktionspotential wird auch als Erregung bezeichnet. Das Aktionspotential ist (Dudel 1972, 41) ein für jede Zelle konstanter Ablauf von Depolarisation und Repola risation der Membran, der immer selbsttätig auftritt, sobald die Membran über das Schwellenpotential hinaus depolarisiert wird.
63 In den ersten 2 ms nach Beginn des Aktionspotentials ist die Zelle überhaupt nicht erregbar, diese Phase wird als absolute Refraktärphase bezeichnet (Dudel 1972, 51/52). Durch die absolute Refraktärphase wird die maximale Frequenz der Aktionspotentiale festgelegt. Bei einer absolu ten Refraktärphase von 2 ms ergibt sich eine Obergrenze von maximal 500 Aktionspotentialen pro Sekunde. Weiterhin kann noch eine relative Refraktär phase unterschieden werden, in der der Schwe1lenwert erhöht ist.
mV ·20 0
1
-20 _ ,0 _.
.
-80 -100
0
2
--absolute----relative.._
ms
Refraktärpilose
Abb. aus Schmidt 1972, 51
Das Aktionspotential ist eine aktive Weiterleitung am Axon, auch als Impuls oder Spike bezeichnet, das sich von den PSP (postsynaptischen Potentialen) dadurch unterscheidet, daß die Amplitude immer konstant ist, sie somit keine Information tragen kann und sie aktiv weitergeleitet wird, d. h. die Amplitudengröße bleibt bei der Weiterleitung konstant (vgl. Ar bib 1989, 53; Sinz 1978, 35: fortgeleitete Potentiale) . Die Information wird freguenzcodiert. Aktive
Weiterleitung
eines
Impulses
Time !
Time
2
Time 3
Time 4 ----'
Abb.
aus
Arbib 1989, 53
64
Die beiden Formen der Informationsleitung durch ein Neuron können graphisch wie folgt zusammengfaßt werden:
kann
bis •uf
�
herun'tergehen;
Abb. nach Arbib !989, 56
Das Auftreten eines Aktionspotentials nach Überschreiten eines be stimmten Schwellenwertes erfolgt nach dem 1874 von Bodwitch postulier ten sogenannten Alles-oder-Nichts-Prinzip: Solange der Schwellenwert nicht erreicht ist, geschieht nichts; sobald der Schwellenwert erreicht ist, entsteht ein Aktionspotential mit charakteristischer Amplitude. Grob läßt sich sagen: Je stärker ein Reiz, desto mehr Aktionspotentiale (AP), um so mehr exzitatorische postsynaptische Potentiale (EPSP), desto eher ent steht aufgrund zeitlicher Summation ein AktionspotentiaL Beim EPSP ist die Information analog in der Höhe und Dauer des Signals codiert, wäh rend sie beim AP digital durch die Frequenz codiert ist. Wenn auch das Auftreten eines Aktionspotentials unabhängig von der Intensität der Über schreitung der Schwelle ist, so spielt die Intensität, mit der ein Reiz (bzw. PSP) auftritt, jedoch eine Rolle für das zeitliche Auftreten des AP. Je stärker der Reiz, desto eher tritt das AP auf. Dies kann zur Folge haben, daß es trotz synchroner Reizung zu einer Desynchronisation von APs kommt (vgl. S. 83-85 sowie Braitenberg 1986, 104-105). Aktionspotentiale des Axons sind in der Amplitude konstant, die Infor mation ist impulsfrequenzmoduliert (mittlere Impulsfrequenz, d. h. die re lative Dichte der Impulse), mit aktiver Fortpflanzung (vgl. Foerster 1967). Wenig in Frage kommen binär-digitaler Code und Pulsintervallmodulation. Aufgrund der strukturellen Komplexität des Gehirns ist es notwendig, will man Klarheit über die Funktionsweise und Leistungsfähigkeit des Nervensystems gewinnen, Modellierungen vorzunehmen. Die erste Arbeit, die die logische Leistungsfähigkeit des Nervensystems beschrieb, war die von McCulloch und Pitts (1943/1965). Zuvor sei aber noch einmal der bisherige Weg zusammengefaßt:
65 Es wurde von einer externen Beobachterposition ausgegangen und der Aufbau - die Struktur - des Nervensystems aufgezeigt. Drei Bereiche wurden unterschieden: die Rezeptoren, die "Errechner" zur Weiterleitung und Integration von Information, und die Effektoren. Bei einer näheren Betrachtung zeigte sich, daß die Felder der Cortexoberfläche durch Ver bände von Neuronen zu charakterisieren sind, die eine bestimmte Schich tung und Säulenbildung aufweisen. Als nächstes wurde die elementare Einheit dieser Verbände, das Neu ron, und mit diesem das Konzept der Synapse näher beschrieben. Hierbei näherten wir uns fast der molekularen Darstellungsebene (Neurotransmit ter; Vesikel; Potentialveränderungen). Danach wurde die Signalübermittlung zwischen den iNeuronen beschrie ben, wobei zwei grundlegende Arten der Signalübertragung im Nervensy stem unterschieden werden konnten: Die sich aktiv-fortpflanzenden Akti onspotentiale mit konstanter Amplitude am Axon, und die sich passiv fortpflanzende intrazellulären Potentiale mit sich verändernder Amplitude. Die intensitätscodierte Information wurde einmal in der Amplitude co diert, zum anderen in der mittleren Intervallfrequenz. Je stärker ein Reiz war, desto größer die Amplitude, desto häufiger die Aktionspotentiale. Es läßt sich sagen, daß wir bei der Umwandlung von der rein physikalischen Beschreibung der energetischen Ebene bei der Betrachtung des Nervensy stems und dessen Signalübertragung eine Ebene weitergingen, indem die Informationsübertragung betrachtet wurde. Auch hier befinden wir uns auf der Ebene der Beschreibung von "bewußtlosen Vorgängen", denn es han delt sich immer noch um eine rein syntaktische Betrachtungsweise. Auf dieser Ebene werden nun Modellierungen vorgenommen.
66 2. 2. 3
Strukturelle Automatentheorie
2. 2. 3.
Elementare Modeliierung der Funktionsweise des Nervensystems mittels McCulloch-Pitts-Neuronen
2. 2. 3. 1 . 1
Das McCulloch-Pitts-Neuron
Es gibt zwei grundlegend verschiedene Möglichkeiten, die Funktionswei se - das Verhalten - des Neurons zu modellieren (Foerster 1967, 55): analog und digital. Ihnen ist jedoch gemeinsam, daß das Neuron als computing element betrachtet wird, das Berechnungen durchführt, d. h. aus einer endlichen Anzahl einkommender Signale ein neues errechnet. Empirische Ausgangsbasis bildet die Messung des Auftretens von Signalen, den Trägern der Information, innerhalb des Nervensystems. Bei der digi talen Modellierung wird von den zuvor beschriebenen experimentellen Be funden ausgegangen. Grundlegend bei der digitalen Modellierung ist es, die absolute Refrak tärphase eines am Axon auftretenden Impulses als "Beobachtungseinheit" zu nehmen. Innerhalb dieser Zeiteinheit ist entweder ein Impuls nachzu weisen oder nicht, der Zustand dieser Zeiteinheit kann also mit 1 oder 0 repräsentiert werden. Dadurch kann das Verhalten eines Axons innerhalb eines Zeitraumes zu den verschiedenen aufeinanderfolgenden Zeitpunkten 0 , 1 , 2, 3, ... , deren durch die Refraktärphase gebildete Beobachtungs einheit, in Abhängigkeit von den eingehenden Signalen durch eine Folge aus Nullen und Einsen beschrieben werden? Michael A. Arbib (1989, 62 u. 63) formuliert diesen Sachverhalt wie folgt: The basic idea is to divide time into units comparable to a refrac tory period so that in each time period at most one spike can be gene rated at the axon hillock of a given neuron. Die leichte zeitliche Verzögerung des Auftretens eines Aktionspotentials innerhalb des Zeitraumes der Refraktärphase hat keinen Einfluß auf die Re präsentation, so daß trotz dieser kleinen zeitlichen Verzögerung gleiche Binär folgen entstehen können. Zwei Aktionspotentiale, die in ihrem zeitlichen Auf treten minimal differieren, liefern dennoch die gleiche Folge von Binärziffern. Skala der Zeiteinheiten i n Refraktär phasen Il'!pulsfolge 1
IMpulsfolge 2
Codierte Folge 1
Codierte folge 2
1
0
e
2
1 I 1 1
3
4
5
l
0 0
'I
1
1
0
e
6
I I 1 1
7
0
0
1
Abb. nach Arbib 1987, 19
1) vgl. Arbib 1989, 10 ff. und Sampson 1976, 25 ff.
8
I 1 1
'
0 B
10
I I 1
1
11
0
e
12
1 I 1 1
67 Als weiteres wesentliches Element des funktionalen Verhaltens eines Neurons wird der Schwellenwert t repräsentiert. Allerdings wird auch hierbei eine Idealisierung vorgenommen, indem der Schwellenwert t als konstant angenommen wird. Es können endlich viele Eingabefasern x1 , . . . , Xn an einem Neuron anliegen. Es gibt nur eine sich verzweigende Ausga befaser y (das Axon).
Jede Faser kann nur zwei Zustände annehmen: Impuls vorhanden Impuls nicht vorhanden, d. h. y(t) = 1 wenn ein Spike (Aktionspotential) auftrat, y(t) = 0 wenn kein Spike zum Zeitpunkt t auftrat. Das Axon feuert nur, wenn die Summe der Zustandswerte der anliegenden Eingabe fasern x1, . . . , Xn den Schwellenwert t überschreitet. Für die Übertragung an den Synapsen wird eine Zeitverzögerung von einer Zeiteinheit ange nommen, so daß, nachdem Impulse der präsynaptischen Eingaben zum Zeitpunkt t an dem Neuron ankamen, das Axon y mit einer Verzögerung zum Zeitpunkt t+l feuert, wenn der Schwellenwert t des Neurons aufgrund räumlicher Summation überschritten wurde. Das gesamte inner halb einer Refraktärphase beobachtbare funktionale Verhalten des als black box betrachteten Neurons, nämlich aufgrund räumlicher Summati on der präsynaptischen aktiven Fasern x1, , Xn zu einem Zeitpunkt t einen Schwellenwert zu erreichen, und wegen der angenommen synapti schen Verzögerung um eine Zeiteinheit t+ 1 verzögert ein Aktionspotential am Axon y auszulösen, findet seinen Ausdruck in einer sogenannten Schwellenwertfunktion f: •••
f(x1 (t), . . . ,
X n (t) )
= y(t+1)
{
1' falls
n L Xj(t) i=l
;!:;
'(
0, sonst ; d. h. falls
n L xi (t) .1•1
<
t
Diese Grundidee der Modeliierung des Verhaltens eines Neurons findet sich in modifizierter Form in den konnektionistischen Netzwerken1 (neu ralen Netzwerken) wieder. Allerdings ist auch die Grundidee etwas er weitert in unterschiedlichen Formulierungen anzutreffen. So wird häufig eine Gewichtung der einzelnen präsynaptischen Eingaben vorgenommen, um die Verbindungsstärke der betreffenden Synapse zum Ausdruck zu bringen; denn man geht davon aus, daß Lernprozesse sich in der verän derten molekularen Synapsenstruktur niederschlagen (Palm 1988, Hebb
I) näheres zu den konnektionistischen Netzwerken findet sich in Kap. 3. 3, S. 341 ff.
68
Ein Lernvorgang bewirkt eine "Bahnung", welche in den Modellie rungen häufig durch Multiplikation mit einer positiven reellen Zahl ausge drückt wird. Diese "Bahnung" bewirkt, daß die betreffende Synapse we sentlich mehr als vorher zum Erreichen des notwendigen Schwellenwertes beiträgt. Bei den "neuronalen" Lernmodellen sind die Gewichtungen varia bel und bilden somit die Voraussetzung für die Modellierung von Lern vorgängen, indem der Wert der Gewichtungen gemäß einer bestimmten Lernregel verändert wird. In dem grundlegenden auf Warren Sturgis McCulloch und Walter Pitts (1943/1965) zurückgehenden Modell werden ebenfalls Gewichtungen w hinzugenommen, um die Verbindungsstärke der einzelnen Synapsen auszudrücken. Diese Gewichtungen werden ebenso wie der Schwellenwert 't konstant gehalten. Sie haben die Funktion, den Un terschied zwischen inhibitorischen und exzitatorischen Synapsen (IPSP, EPSP) auszudrücken und dienen, da ihre Werte unveränderbar sind, nicht der Modeliierung von Lernvorgängen. Wenn die Werte der Gewichtung wi einen negativen Wert (wi < 0, wi ( IR) annehmen, spricht man auch von inhibitorischen Synapsen, ist wi ,. 0, so spricht man von exzitatorischen Synapsen. So wirken bei der Summation die aktiven Verbindungen Xj (ausgedrückt durch xi = 1 ) die mit einem negativen Wert wi multipliziert werden, der Summierung entgegen. Mit wi = 0 wird erwartungsgemäß keine Verbindung bzw. die Zerstörung einer Verbindung ausgedrückt. Die graphische Darstellung des um die Gewichtungen erweiterten Neu ronmodelles nimmt folgende Form an: 1949).
,
Außerdem ergibt sich die durch Multiplikation der Gewichtungen wi veränderte Schwellenwertfunktion f (Arbib 1987, 17; 1989, 11): y( t+1 )
{
1, genau dann wenn
� wi*Xi(t)
i=t 0, falls t Wi *Xi(t) < 't i=l
:!: 't
In der Originalarbeit von McCulloch und Pitts (1943/1965) wurde aller dings angenommen, daß die Aktivität einer einzigen hemmenden Synapse die Bildung des Aktionspotentials verhindert. Es ist daher in der Literatur (Minsky 1971, Sampson 1976) auch folgende Definition der McCulloch Pitts-Neuronen und ihrer entsprechenden Schwellenwertfunktion anzutreffen: Ein formales Neuron (vgl. die Abb. auf S. 69) besteht aus a ) einer einzigen Outputline y (dem Axon), welche sich verzweigen
69 kann und als Input weiterer Neuronen dient; b) einer endlichen Zahl n von Inputlinien x1 , . . , Xm, Xm•t• . . , X0, , Em = X m und inhi welche exitatorisch (erregend) E1 x1 , bitorisch (hemmend) I1 = X m•t .. , I0 = x0 wirken; c ) einer unveränderlichen reellen Zahl t - meistens werden natürliche Zahlen benutzt - dem Schwellenwert (threshold). .
.
••.
=
.
E� ("t) EM("t)
1 � ( 1: ) In (·t)
• • •
• • •
y ( 1: +�) -
'C
�
0 0
Abb. nach Sampson 1976, 26
Die Schwellenwertfunktion dieses formalen Neurons wird durch folgende Funktionsdefinition bestimmt: y (t+l) =
{
n
1, falls L Ij (t) = 0 j:l
und
:f
i:l
Ei(t)
0 , sonst
Nach dieser Definition gibt ein formales Neuron einen Output y = 1 genau dann, wenn keiner der inhibitorischen Inputs Ii aktiv, d. h. 1 war, und die Summe der exitatorischen Inputs Ei größer oder gleich dem Schwellenwert t ist. Es kann folglich schon ein einziges aktives Ij das Neuron hemmen und die Auslösung des Aktionspotentials unterbinden. Das Verhalten des formalen Neurons wird in diesem Fall als absolut (vgl. Minsky 1971, 61) bezeichnet. Aus den McCulloch-Pitts-Neuronen werden mittels Kombinationsregeln die formalen Nervennetze aufgebaut. 2. 2. 3. 1 . 2
Eine wissenschaftshistorische Anmerkung
Wissenschaftshistorisch interessant scheint mir die Tatsache - und hierauf weist auch Va1entin Braitenberg (1986, 101 u. 102) hin -, daß die von McCulloch und Pitts gewonnenen Ergebnisse als Schlußfolgerungen aus makroskopischen elektrophysiologischen Eingangs- Ausgangsexperimen ten der Motoneuronen des Rückenmarks gewonnen wurden. Untersucht wurden die Eingangs-Ausgangsbeziehungen der Signale am Eingang, der Hinterwurzel (radix dorsalis), zu den Signalen in der Vorderwurzel
70 (radix dorsalis; zur Anatomie vgl. Kahle 1986, 56 u. 64; Arbib 1989, 99). Die von McCulloch und Pitts gewonnenen Erkenntnisse wurden formuliert, bevor überhaupt gezielte elektrophysiologische Untersuchungen einzelner zentraler Neuronen möglich waren und konnten allerdings nachträglich bestätigt werden. Außerdem handelte es sich um Ergebnisse, die nur das Verhalten von Neuronen des peripheren Nervensystems betrafen. Die von McCulloch und Pitts getroffenen Schlußfolgerungen konnte aber auch für die anderen Neuronen bestätigt werden. Um die neurophysiologischen Un tersuchungergebnisse zu modellieren, machten McCulloch und Pitts (1943/1965, 22) folgende Annahmen: (1) Ein Neuron arbeitet nach dem Alles-oder-Nichts-Prinzip. (2) Eine gewisse Anzahl von Synapsen muß innerhalb einer bestimmten Zeitspanne erregt sein, um das Neuron zu erregen und diese Anzahl ist unabhängig von der vorhergegangenen Aktivität und Position des Neurons. (3) Die einzige Verzögerung von Bedeutung bei der Signalweitergabe innerhalb des Nervensystems ist die synaptische Verzögerung. (4) Die Aktivität einer inhibierenden Synapse zum Zeitpunkt t verhin dert absolut die Aktivierung des Neurons und somit die Signalwei tergabe zum Zeitpunkt t+l. (5) Die Struktur des Netzes verändert sich nicht im Laufe der Zeit. Die Kernidee der "digitalen" Modeliierung des funktionalen Verhaltens eines Neurons, die den McCulloch-Pitts-Neuronen zugrunde liegt, sei ih rer besonderen Bedeutung wegen noch einmal zusammgefaßt: Die flir die se Modeliierung zentralen Messungen der Signalverarbeitung innerhalb des Nervensystems sind Aufzeichnungen der Spikes (Aktionspotentionale ), die das Axon entlangwandern. Eine Zeitskala von aufeinanderfolgenden Inter vallen wird angenommen, wobei jedes Intervall die Länge einer Refrak tärperiode umfaßt. Die absolute Refraktärphase dauert ungefähr 1-2 ms, in denen das Neuron überhaupt nicht erregbar ist; die maximale Frequenz der Aktionspotentiale einer Zelle beträgt daher durchschnittlich 500/s (Schmidt 1972, 52; Sampson 1978, Arbib 1989, 51 ff.). Es wird am Axon hügel gemessen, ob innerhalb des Zeitintervalls der Refraktärphase ein Aktionspotential auftritt oder nicht. Weiterhin wird die Abhängigkeit des Auftretens dieses Aktionspotentials zum Zeitpunkt t+1 von der Aktivität der an den Dendriten des Neurons anliegenden Axone zum Zeitpunkt t untersucht. 2. 2. 3. 1 . 3
Die formalen Nervennetze
Bisher habe ich nur die Modellbildung für die Funktionsweise eines ein zelnen Neurons anband der grundlegenden Phänomene der synaptischen Erregung und Hemmung, des Schwellenwertes, der Refraktärphase und des Aktionspotentials erläutert. Es bleibt noch die Gesamtaktivität des
71 Nervensystems zu bestimmen, die als aus der Verknüpfung dieser Einhei ten entstehend betrachtet wird. Der Neurophysiologe und Hirnforscher R. F. Schmidt (1972, 104) bemerkt hierzu: Axonale Impulsleitung einerseits und erregende und hemmende synaptische Übertragung andererseits sind die Grundprozesse neuronaler Tiitigkeit. Die komplexen Fiihigkeiten des Gehirns werden vor allem durch eine entsprechende Verknüpfung der Neurone erzielt. Wenn jetzt die einzelnen formalen Neurone miteinander verbunden werden, sind folgende Einschränkungen zu beachten: Ein Neuron kann be liebig endlich viele Eingänge haben. Die Eingangsleitungen können von an deren Neuronen kommen (einschließlich vom ihm selbst). Eingangsleitun gen, die von keinem anderen Neuron kommen, können als von Sinneszel len - von Rezeptoren - kommend betrachtet werden. Jedes Neuron hat nur eine Ausgangsleitung, diese kann sich allerdings verzweigen und Eingangsleitungungen anderer Neurone darstellen. Ausgangsleitungen, die keine Eingangsleitungen bilden, können als zu Effektoren führend vorge stellt werden. Das Neuronennetz arbeitet synchron auf einer diskreten Zeitskala, d. h., daß zu jedem Zeitpunkt t der Zeitskala jedes Neuron die Werte der Eingangsleitungen empfängt und aufgrund der Schwellenwert funktion errechnet, ob es zum Zeitpunkt t+l feuert oder nicht. Die Neu ronen eines Netzes feuern nicht bzw. feuern simultan zum Zeitpunkt t + l in Abhängigkeit vom Ergebnis der Schwellenwertfunktion. Das funktionale Ein- Ausgabeverhalten des Netzes ist also bestimmt durch das Verhalten der einzelnen Neuronen. Ein neuronales Netz läßt sich graphisch darstel len, indem die formalen Neuronen durch Dreiecke dargestellt werden und die eingehenden und ausgehenden Ax�ne eines Neurons durch Linien mit Balken kenntlich gemacht werden.
Informationsfluß
-+
2. 2. 3. 1. 4. McCulloch-Pitts-Neuronen, aussagenlogische Funktionen und Schaltfunktionen logischer Gatter McCulloch und Pitts verbanden ihre Analyse der Funktionsweise des Nervensystems mit Erkenntnissen über formal-logische Systeme. Ihre Ar-
72 beit war eine der Grundlagen für die Herausbildung der Automatentheo rie. So konnte u. a. gezeigt werden, daß ein McCulloch-Pitts-Nervennetz in der Lage ist, jede aussagenlogische Funktion zu berechnen. Da bekannt ist, daß die 16 zweistelligen aussagenlogischen Funktionen durch ein paar Grundfunktionen darstellbar sind; sollen im folgenden die aussagenlogi schen Funktionen "" (Konjunktion; und), v (Disjunktion; oder) und --. (Ne gation; nicht) in Nervennetzdarstellung vorgestellt und die Funktionsweise eines Netzes an einem einfachen Beispiel erläutert werden. Hierfür nehme ich als Gewichtungen w = 1 für exzitatorische Synapsen und w = -1 für inhibitorische Synapsen. Weiterhin beschränke ich mich auf formale Neuronen. mit maximal 2 Synapsen. Gleichzeitig soll die Be ziehung zu den aus Gattern aufgebauten Schaltwerken aufgezeigt werden. Die Gatter (Schaltglieder), Schaltelemente zur Verarbeitung digitaler Signale und Grundbausteine der Hardware eines Computers, realisieren ebenfalls die aussagenlogischen Funktionen. In digitalen Computern erfolgt die Verarbeitung binärer Informationen durch kombinatorische Schaltwer ke, die aus elementaren Gattern wie z. B. UND-Gatter, ODER-Gatter und NICHT-Gatter aufgebaut sind. Die Gatter werden durch Rechtecke dargestellt und realisieren die angegebene logische Funktion: UND-Gatter
-"--;>�
�
ODER-Gatter
�� �
u
NICHT-Gatter
~
xt
Xz
1 1
0
1
y
0 0
0
0 0 0
xt
Xz
y
1 0
1 0 0
0
0
X1
-.X
=
1
0
1
:
A
V
:
min(x1 , x 2 )
max(x 1 , x2)
1
1
--. =
1 - x1
0
1) So können alle zweistelligen Funktionen der Aussagenlogik durch eine der folgenden Mengen von Funktionen { v,--.} , {A ,--.}, { v. A,--.} formuliert werden. Es wird ge sagt, sie seien funktional vollständig (vgl. Kfoury, Moll & Arbib 1981).
73 Das logische "Und" (A) kann durch folgendes Schwellenwertelement berechnet werden und realisiert somit die aussagenlogische Verhalten des UND-Gatters. Zu beachten ist der entscheidende Unterschied zwischen dem formalen Neuron und dem UND-Gatter: Das formale Neuron arbeitet mit einer zeitlichen Verzögerung um eine Takteinheit, während der Wert des Schaltgliedes unmittelbar erhalten wird.
Eine ähnliche Situation ergibt sich für das aussagenlogische "Oder"
(v) . Ebenfalls unterscheiden sich Gatter und formales Neuron wieder nur
in ihrem zeitlichen Verhalten:
xl(t) v x2(t) = y(t+l) oder
Die Negation wird durch ein Neuron mit dem Schwellenwert t 0 und der Gewichtung w = 1 realisiert: Das formale Neuron feuert (y(t+ 1 ) = 1), solange kein Impuls eingeht, d. h. xi (t) = 0, denn der Schwellenwert wird mit xi * wi = 0 * - 1 = 0 erreicht. Sobald jedoch die Eingangsleitung den Wert xi (t) = 1 annimmt, also aktiv ist, hört das Neuron auf zu feuern, d. h. y(t+1) 0, denn mit xi * wi = 1 * -·1 = - 1 wird der Schwellenwert nicht erreicht. =
-
=
Negation
� .
��-: y=�
2. 2. 3. 1 . 5 Informationsspeicherung und Gedächtnis in Schaltwerken und formalen Nervennetzen Neben der Realisierung aussagenlogischer Funktionen müssen die forma-
74 len Netzwerke in der Lage sein, sich zu "erinnern", sie müssen also ein elementares "Gedächtnis" aufweisen, denn das Erinnern bzw. das Gedächt nis ist eine Grundvoraussetzung geistiger Tätigkeit. Die organisch-materi elle Basis des Phänomens Gedächtnis konnte bis heute nicht geklärt werden. Mit William James (1890/1902) werden häufig zwei grundlegende Formen von Gedächtnis unterschieden: das Kurzzeitgedächtnis (primary memory) und das Langzeitgedächtnis (secondary memory). Diese Unterscheidung bildet den Ausgangspunkt vieler sogenannter Multi-Speicher-Modelle der Kogni tiven Psychologie, die häufig noch um ein sensorisches Gedächtnis ergänzt werden.1 Daß die zeitliche Speicherung von Information auch für den Aufbau logischer Netze notwendig und ebenfalls eine Voraussetzung der technischen Informationsverarbeitung durch den Computer ist, möge folgendes Beispiel illustrieren. Betrachten wir zuerst das mit einer Schleife ausgestattete, die Negation realisierende kombinatorische Schaltwerk
und nehmen an, daß es zu einem bestimmten Anfangszeitpunkt einen Im puls empfängt und das weitere Verhalten von seinen Ausgaben abhängt. Der Eingabewert x(t) und der Ausgabewert y(t) müßten denselben Wert annehmen. Dies wäre im Falle der Negation ein Widerspruch, da bei ei nem kombinatorischen Schaltwerk keine Verzögerung der Ausgabe eintritt und x(t) der Eingabe y(t) = 1 - x die Ausgabe bestimmt. Dies ist leicht einzusehen, denn x(t) = 1 liefert bei der Negationsfunktion y(t) = 1 - 1 = 0, d. h. 1 = 0; genauso ergibt sich für x(t) = 0 mit y(t) = 1 - 0 = 1 für x(t) y(t) der Widerspruch 0 = 1 . Wird ein Verzögerungsglied S zwischen die rückläufige Ausgabe und die Eingabe geschaltet, kann es zu keiner widersprüchlichen Situation kom men, da die Ausgabe um t+l verzögert wird. Ein Verzögerungsglied S speichert die Information für eine Takteinheit: =
)( (�)
1) vgt. z. B Waugh & Norman, D. A. 1965; Brander, Kompa & Peltzer 1985, 22 ff.; Wes sets 1984. Einige Modelle des musikalischen Gedächtnisses - der Informationsspeiche
rung musikalischer Strukturen • innerhalb der Kognitiven Musikpsychologie werden in Nauck·Börner 1988 erörtert. Über neuere formale psychologische Gedächtnismodelle informieren ausführlich Rumelhart & Norman 1988.
75
Für das mit einer Schleife versehene NEGATIONS-Gatter ergibt sich folgende Darstellung: Y (�+J.)
y (�)
Nehmen wir als Starteingabe x(t) = 0 an, dann ist y(t)= I x = 1 . Die nächste Eingabe erfolgt aber zum Zeitpunkt y(t+ 1) und hat dann den Wert 1, so daß die Ausgabe y(t), die zum gleichen Zeitpunkt erfolgt, den Wert 0 annimmt. Wie wichtig die Speicherung von Information fl.ir biologische Systeme ist, speziell für das Gehirn, hatte ich schon erwähnt. Wenn also das Phä nomen des Gedächntisses auf neurophysiologischer Ebene erklärt werden soll, so müssen auch die auf ihnen aufbauenden Modeliierungen Mecha nismen der Informationspeicherung aufweisen. Bei den Schaltgliedern war der entscheidende Baustein zur Realisierung der Informationsspeicherung und der Vermeidung von logischen Widerspüchen das Verzögerungsglied 1\. In der Modellannahme des formalen Neurons wird die Informationsspei cherung durch Verzögerung aufgrund der Annahme der synaptischen Ver zögerung der Signalübertragung um eine Takteinheit reflektiert. Ein for males Neuron, das z. B. einmal erregt wurde, kann sich, mittels einer Schleife und ohne daß eine widersprüchliche Situation entsteht, merken, daß es zu irgendeinem Zeitpunkt in der Vergangenheit erregt wurde: -
Dieses Neuron kann sich nur "erinnern", daß es irgendwann einmal ein Aktionspotential erhielt; daß in der Vergangenheit ein Ereignis eintrat. Dieses "neuronale" Konstrukt bildet allerdings die Grundlage für die Modeliierungen der physiologischen Basis von Gedächtnis und Lernen. Die physiologischen Untersuchungen über das Gedächtnis haben bisher nicht viel Aufschluß gegeben, noch immer steht eine physiologische Theorie des Gedächtnisses aus. Marvin Minsky (1971, 100) charakterisierte diesen Zu stand mit folgenden Worten: Leider gibt es noch immer ein sehr gerin ges festumrissenes Wissen und nicht einmal eine allgemein anerkannte
76
Theorie darüber, wie Informationen in Nervensystemen gespeichert werden , d. h. wie sie lernen. Der größte Teil des Materials führt zu der Annahme, daß es mehrere Mechanismen gibt - zumindest verschiedene für kurzfristiges und langzeitiges Gedä"chtnis. Bei einer theoretischen Richtung wird davon gesprochen, daß kurzfristiges Gedächtnis "dyna misch" ist - in Form von Impulsen gespeichert, die um geschlossene Neuronenketten reverberieren -, während das langfristige Gedächtnis statisch ist - gespeichert in Form von Veränderungen in den Anschlüs sen, in den Schwellen, der Mikroanatomie.
Läßt sich die von Minsky angesprochene Theorie des Kurzzeitgedächtnis mit dem bisherigen Konstrukt des formalen Neurons modellieren, so muß bei einer Modellierung des Lernens und des Langzeitgedächtnisses diese grundlegende Einheit erweitert werden. Für die Modeliierung des kurzfri stigen Erinnerns lassen sich Neuronenkreise angeben� Bei einer ange nommenen Größe von 1 ms für die synaptische Verzögerung und einer angenommenen absoluten Refraktärphase von 100 ms werden nach Eccles Kreise mit mindestens 100 Neuronen benötigt, um ein Ereignis kurzfristig zu erinnern: >
199
Effektoren
Für eine Erklärung des langfristigen Gedächtnisses kommt dieser theo retische Ansatz einer "dynamischen" Informationsspeicherung innerhalb des Nervensystem allerdings nicht in Frage. So führen z. B. Elektro schocks, wie sie therapeutisch in Nervenkliniken eingesetzt wurden, kurz fristig zu einer immensen Veränderung der elektrischen Hirnaktivität, so daß die angenommenen Kreisprozesse erheblich gestört, wenn nicht sogar zerstört werden, weshalb die Annahme solcher Kreisprozesse für ein Lang zeitgedächtnis unwah·rscheinlich wird. Von einigen Forschern innerhalb der Neurophysiologie wie Palm (1988) wird für das Lernen und das Gedächt nis von einer Veränderung an den Synapsen ausgegangen und darauf hingewiesen, daß diese theoretischen Annahmen verstärkt tierexperimen1) Die Modellvorstellung reverberierender geschlossener Neuronenkreise zur Modellie rung des Kurzzeitgedächtnis ist auf den Neurophysiologen lorente de No zurückzuführen (vgt. Hofstätter 1957, 113).
77
teile Stützung erfahren, so daß sie auch ftir Modeliierungen sinnvoll sind. Jedoch weisen andere Spezialisten der Hirnforschung wie Schwartz (1988, 134 u. 135) darauf hin, daß sehr wenig über die Mechanismen des Ler nens bekannt ist und derartige Modeliierungen insofern von nicht gesi cherten Fakten ausgehen: ... learning based theories of the origin of
neural function remain subject to the objection that we know hardly anything about the actual locus or mechanism of other memory storage in the brain and even less about the way memories are modified to accomplish abstract learning. Though it is widely believed that synapses represent the elementary loci of memory strorage and that memory storage is somehow accomplished by modifying synaptic reactivity, we have not yet been able to develop much clear biochemical evidence to support this believe. Most of the evidence relating to mammalien brains is still very indistinct. ... Thus, theorists who take some hypothesis about learning as their starfing point are choosing to begin in a particulary dark area of neuroscience.
Da die Modeliierung des musikalischen Lernens mit neuralen Netzwer ken - innerhalb des Konnektionismus - auch in der Kognitiven Musikpsy chologie zunimmt, sei die Kernidee der Erweiterung des ursprünglichen Modells kurz entwickelt1 : Waren zuvor die Schwellenwerte und Gewich tungen als konstant betrachtet worden, so erlaubt man jetzt, daß sich z. B. die Gewichtungen gemäß bestimmter Regeln - den Lernregeln - ver ändern dürfen, um die Idee der zu- und abnehmenden "Bahnung" aufgrund von Lernprozessen zu realisieren. Je häufiger eine Verbindung aktiviert wurde, desto besser leitet sie bzw. desto mehr Einfluß erhält ein Impuls, der bei ihr auftritt. Dieser Sachverhalt wird durch ein Ansteigen des Gewichtungswertes ausgedrückt. Das ursprüngliche System, das nur das Auftreten von Impulsen betrachtete, wird so unter Einbeziehung der vermuteten molekularen Veränderungen an den Synapsen erweitert. Es werden also zwei "Zustandsveränderungen" betrachtet, zum einen diejeni gen, die sich schnell verändern - d. h. die Aktionspotentiale an den Axonen, und die Zustände, die sich langsamer verändern, d. h. die struk turellen molekularen Veränderungen an den Synapsen, ausgedrückt durch die Gewichtungen -. Im ersten Fall kann vom Zustand des Systems gesprochen werden, im zweiten handelt es sich um sogenannte Adaptions parameter.
1) Näheres zur Modeliierung von Lernvorgängen mittels neuraler Netzwerke findet sich in Kap. 3. 3, S. 341 ff. Aus der zahlreichen Literatur innerhalb der Musikforschung seien Bharucha 1988; Bharucha & Todd 1989; Bharucha & Olney 1989; Leman 1989, 1990; Gjerdingen 1990; Marsden & Pople 1989; Lischka 1987, 1990; Stoffel' 1990 erwähnt.
78
"der" Zus"tand Kurz zel�gedächn�nls
Abb. nach Arbib 19 7 3 , 221
Diese Ideen liegen den Modeliierungen innerhalb des Konnektionismus zugrunde, die sowohl neurophysiologische als auch psychologische Theo riebildung in bezug auf Lernen und Gedächtnis zusammenbringen sollen. 2. 2. 3. 1 . 6
Formale Neuronen und die xor-Funktion
Formale Neuronen können, wie zu sehen war, aussagenlogische (Boote sehe) Funktionen darstellen (realisieren). Kann aber jede aussagenlogische Funktion durch ein einziges formales Neuron dargestellt werden? Dies ist nicht möglich, denn es gibt eine Funktion, die nur durch ein Nervennetz realisiert werden kann: die xor-Funktion. Ich werde an dieser Stelle auf dieses scheinbar nebensächliche Problem aus zwei Gründen näher eingehen: I) Zum einen spielt die angesprochene Funktion in der Diskussion um den Neokonnektionismus eine zentrale Rolle� Die zweistellige xor Funktion, wird nur wahr (= 1), wenn genau eines der Argumente wahr (= 1 ) ist. 2) Zum anderen läßt sich an einem einfachen Beispiel eine Beweisform aufzeigen, die von besonderer Bedeutung für die Theoretische Informatik und Metamathematik ist. Es handelt sich um den Unmöglichkeitsbeweis. Man kann versuchen, eine Zeichnung mit entsprechenden Gewichtungen und dem Schwellenwert zu erstellen. Nach einigen erfolglosen Versuchen ist man versucht zu behaupten, daß es nicht möglich ist, ein formales Neuron zu definieren, das die xor-Funktion realisiert. Wie bei empiri schen Untersuchungen im allgemeinen hätten wir keine Gewißheit, ob es nicht doch möglich wäre, ein solches Neuron anzugeben. Vielleicht hatten wir bis zum gegebenen Zeitpunkt nicht die richtigen Ideen. Daß dies je-
1) Zur generellen Diskussion vgl. Cowan & Sharp 1988, 91-92 u. 104-106 sowie Rumel hart, Hinton & Williams 1988, 318-322 u. 330-334. Bharucha & Olney 1989 erörtern die mit der Realisierung der xor-Funktion durch neurale Netzwerke verbundenen Probleme in bezug auf musikalische Fragestellungen. Die in diesem Abschnitt folgenden Erörte rungen können als vertiefende Ergänzungen zu dem von Bharucha & Olney 1989 angesprochenen Problem betrachtet werden.
79
doch nicht der Fall ist, läßt sich durch etmge Überlegungen aufweisen. Es handelt sich im Kern um eine reductio ad absurdum, d. h. es wird eine Annahme gemacht und nachgewiesen, daß aus ihr ein Widerspruch folgt. Daraufhin wird dann geschlossen, daß die Annahme falsch gewesen sein und somit. ihre Negation wahr sein muß. Annahme: Es gibt ein formales Neuron, das die xor-Funktion realisiert. ?
Welche Bedingungen müssen erfüllt sein, damit das formale Neuron diese Funktion realisiert? Da die Werte der Variablen x1, x2 der Funktion xor als aktiv (= 1 ) oder nicht aktiv (= 0 ) vorgestellt sind, steHt sich die Frage, welchen Wert der Schwellenwert t und die Gewichtungen w1, w2 anneh men müssen, um bei den Eingaben (xl' x2 ) die gewünschten Ausgaben zu erhalten. Es muß folglich das Verhalten des Neurons bei den vier mögli chen Eingaben (1, 1 ) , (1, 0), (0, 1 ) und (0, 0 ) betrachtet werden. Die Schwellenwertfunktion f (vgl. S. 68) wird angenommen. Im Fa11 der Eingabe (0, 0) wird nach der xor-Funktion die Ausgabe 0 erwartet, was heißt, daß die Gewichtungen w1 , w2 beliebig sein können, da die Multipli kation mit x1 = x2 = 0 wieder 0 ergibt und die Summe von w1x1 + w2x2 = 0 ist; somit muß auch der Schwellenwert t größer als 0 sein (bzw. 0 kleiner als der Schwellenwert, d. h. 0 < t ) , da ja nicht gefeuert werden soll. Da bei der Belegung der Eingabe mit (0, 1 ) oder (1, 0 ) aufgrund der Multiplikation nur die Faser x1 = 1 bzw. x2 = 1 Einfluß auf die Gewich tung w2 bzw. w1 hat, muß die Gewichtung w2 bzw. w1 größer oder gleich dem SchweBenwert t sein (d. h. w1 � t bzw. w2 � t ) damit das Neuron feuert und die für die xor-Funktion gewünschten Werte erhalten werden. Bei der Eingabe (1, 1 ) haben beide Gewichtungen Einfluß auf das Errei chen des Schwellenwertes t, so daß in diesem Fall die Summe von w1 und w2 den Schwellenwert t unterschreiten muß, wenn das Neuron nicht aktiv sein soll. Es ergeben sich also insgesamt folgende Bedingungen ftir die Realisierung der xor-Funktion durch ein formales Neuron: x, x2
0 0
0
x, xor x2 = y 0
1
0
0
Bedingungen 0
w2 w, w1 + w2
<
� � <
't 't 't 't
Da die Gewichtungen w1, w2 bei den Eingaben (0, 1) und (1, 0) minde stens die Größe von t haben müssen, kann man folgern, daß die Summe
80
von w1, w2 mindestens gleich der Summe von t + t sein muß: w1 + w2 l!:: t + t . Weiterhin ist die Summe von t + t größer als t , da nach der Eingabe von (0, O) der Schwellenwert t positiv, d. h. größer als 0 sein muß: t + t t. Wir können also feststellen, daß: w1 + w2 i!!: t + t t . Aufgrund der Transitivität der Relationen l!:: und kann somit be hauptet werden, daß w1+ w2 > t . Um bei der Eingabe (1, 1 ) den Wert 0 zu erhalten muß jedoch die Summe von w1 1 w2 kleiner als der Schwellenwert t sein: w1+w2 t . Wir haben also w1+ w2 < t und w1+ w2 t und folglich einen Widerspruch. Aus unserer Annahme, daß es ein formales Neuron gibt, das die Funk tion xor realisiert, erhalten wir also einen Widerspruch. Hieraus kann geschlossen werden, daß die Annahme falsch war und es kein formales Neuron gibt, daß die xor-Funktion realisiert. Jeder Versuch, ein solches formales Neuron anzugeben, ist also zum Scheitern verurteilt. Hatte ich zuvor behauptet, daß ein neuronales Netz (McCulloch-Pitts Netz) in der Lage wäre, die aussagenlogischen Funktionen zu realisieren, so könnte jetzt Zweifel entstanden sein, da ich gezeigt habe, daß ein for males Neuron nicht geeignet ist, eine bestimmte Funktion auszuführen. Warum sollte jedoch ein neuronales Netz nicht in der Lage sein, solch eine Funktion auszuführen? Es kann gezeigt werden, daß ein solches Netz existiert, indem es formal dargestellt wird. Ich gebe daher jetzt ein McCulloch-Pitts-Netz an, das die xor-Funktion - in disjunktiver Normalform - realisiert: >
>
>
<
>
Cx1Ct) A xZCt))
v
CiiZCt)
A
x1 Ct) )
=
y(t+3)
Die Ausgabe des Netzes auf eine Eingabe ist verzögert und erfolgt drei Takteinheiten (Zeiteinheiten) später. Die folgende Tabelle gibt die Belegung der einzelnen Axone y1, , y7 zu den einzelnen Zeiteinheiten t nach Eingaben von x 1, x2 wieder. Aus gegangen wird von einer Belegung der Axone y1 = ... = y7 = 0 zum Zeitpunkt t = 0. Die den Eingabepaaren (x1 , x2) zum Zeipunkt t korre spondierenden Werte y zum Zeitpunkt t+3 wurden graphisch hervorgehoben. •.•
81 Input Input Axon Axon Axon Axon Axon Axon Output/Axon
0
Q x2 1
XI
Yt Y2 YJ Y4 Ys Y6 y,
0 0 0 0 0 0 0
1
1 0
1 1 Q Q
0 0 0
2
1 1 0 0 1 1 1 Q
0
3
Q Q 0 1 1 0 0 1
1
4
5
6
7
6
9
0 0
0 0 1 0 0 1
0 0 1 0 0 1 0 0
0 0 1 0 0 1 0 0 0
0 0 1 0 0 1 0 0 0
0 0 1 0 0 1 0 0 0
1 Q Q
1
0 0
1
Q Q
0
Q
10 0 0 1 0 0 0 0 0
Die formalen Neurone haben eine "interne" Verzögerung um eine Zeit einheit, die die Zeitverzögerung durch die Übertragung am synaptischen Spalt modelliert und die zeitliche Verzögerung der Ausgabewerte der formalen Nervennetze bewirkt. Dies ist auch der wesentliche Unterschied zu den kombinatorischen Schaltwerken, deren Ausgabe ohne zeitliche Verzögerung erfolgt. Um die Verzögerung zu erhalten, müssen die kombinatorischen Schaltwerke um das Verzögerungselement & erweitert werden, diese Verzögerung ist, wie ich gezeigt habe (vgl. S. 74 ), flir Netze mit Schleifen (Joops) notwendig, um widersprüchliche Situationen zu vermeiden. Die zeitliche Verzögerung ist von Bedeutung il.ir Zyklen: wenn keine Verzögerung angenommen wird, kann es zu widersprüchlichen Situationen kommen, sobald Schleifen benutzt werden. Die xor-Funktion kann aller dings von einem kombinatorischen Schaltwerk, d. h. einem Schaltwerk oh ne Schleifen, realisiert werden: Sch.;altwer-k
y
x1(t) xor x2(t)
=
y(t)
Es wurde bisher die Bedeutung der Verzögerungsglieder & (delays) bei der logischen Analyse von Schaltwerken hervorgehoben. Diese haben nur die Funktion, eine Eingabe vom Zeitpunkt t erst zum Zeitpunkt t + 1 weiterzugeben . Es werden daher kombinatorische Schaltwerke ohne Schleifen von Schaltwerken mit Verzögerunsgliedern und Schleifen unterschieden. Die um Verzögerungsglieder erweiterten kombinatorischen Schaltwerke werden
82 als sequentielle Schaltwerke bezeichnet, oder im Rahmen logischer Un tersuchungen, als logische Netze. Ein McCulloch-Pitts-Neuron, das eine verzögerte Ausgabe um eine Zeiteinheit aufweist, kann am einfachsten durch ein sequentielles Schaltwerk simuliert werden, indem hinter jede Schaltfunktion ein Verzögerunsglied geschaltet wird (Gössel 1972/1, 72 u. 73).
l(t) x1Ct) � x � y(t+1) m�y(t+1) x�u· /�� � Neur-on
Sc: n.. l �wer-k 111 . Uerzögerungste il
Ich fasse die bisherigen Ergebnisse noch einmal zusammen: Das elektrophysiologisch nachweisbare Phänomen der Refraktärphase findet sich in dem Neuronenmodell von McCulloch und Pitts wieder, in dem die Arbeitsweise jedes Neurons auf einer diskreten Zeitskala 0, 1, 2, . . . betrachtet wird, deren Zeitintervall die absolute Refraktärphase der betrachteten· Neuronenart beträgt. Es zeigt sich, daß die Aktivität eines Neurons als Folge des Auftretens oder Nichtauftretens der Aktionspoten tiale am Axon innerhalb dieser Periode erscheint. So können dann zwei Folgen von Aktionspotentialen, deren Aktionspotentiale nicht exakt zum gleichen Zeitpunkt zu messen sind, aber in das gleiche Zeitintervall fal len, zu einer identisch codierten Folge von 0 und 1 führen. Die zeitliche Verzögerung bei der elektrochemischen Nachrichtenübertragung an der Synapse findet ihren Niederschlag in dem Modell darin, daß die funktio nale Abhängigkeit des Ergebnisses von dem Eingangswert als um eine Zeiteinheit verzögert vorgestellt wird. Es zeigte sich weiterhin, daß ge rade die zeitliche Verzögerung - interpretiert als Informationsspeicherung - in der Nachrichtenübermittlung für die psychologischen Phänomene Gedächtnis und Lernen von Bedeutung ist. Dies zeigte sich besonders an den kombinatorischen und sequentiellen Schaltwerken, welche die Grund bausteine des digitalen Computers sind. Es wurde außerdem beschrieben, daß sowohl die formalen Neuronennetze als auch die sequentiellen Schalt kreise die Funktionen der Aussagenlogik realisieren. 2. 2. 3. 1 . 7 Die "Realitätsnähe" der McCulloch-Pitts-Neuronenverbände Daß es sich bei dem von McCulloch und Pitts (1943/1965) angegebenen Modell keineswegs um eine "vollkommen" adäquate Modeliierung der Funktionsweise eines "echten Neurons" handelt, ist vollkommen klar und wurde von ihnen auch nicht behauptet. Da ihr Modell jedoch häufig so interpretiert wurde, sei noch einmal ausdrücklich auf die Warnung Marvin
83
Minskys (1971, 57) hingewiesen, der schrieb: Weder McCulloch noch Pitts
noch der Autor betrachten diese Vorrichtungen und Maschinen in dem Sinne, als seien sie genaue physiologische Modelle von Nervenzellen und Nervengeweben. Sie wurden nicht mit diesem Ziel vor Augen ent wickelt. Sondern sie sind für die Darstellung und die Analyse der logischen Zusammenhänge von Situationen erdacht, die in jedem Vor gang entstehen, mag er sich nun in einem Gehirn, im Computer oder sonst wo abspielen. Bei Theorien, die ernsthafter darauf abzielen, als Gehirn modelle zu gelten, müssen die "Neuronen" sehr viel komplizierter sein. Michael A. Arbib (1987, 20 u. 21) weist auf verschiedene stark simpli
fizierende Annahmen hin, die sich bei experimentellen Untersuchungen von Neuronen nicht nachweisen lassen: (1) Ein fester Schwellenwert und konstante Gewichtungen wurden ange
nommen.
(2) Der Einfluß von Hormonen und Drogen, welche die Verhaltensweise
des Gehirns verändern, wurde nicht berücksichtigt.
(3) Die Interaktionen von Neuronen, die auf anderen Mechanismen als
der synaptischen Übertragung wie z. B. elektrischen Feldern beru hen, die mit den Impulsen verbunden sind (vgl. Cherry 1963), blei ben außer Betracht. (4) Die Rolle der Gliazellen wurde ebenfalls vollkommen vernachlässigt.
Sind die Einschränkungen 2, 3 und 4 auch in anderen, "realistischeren" Modellen anzutreffen, so muß noch auf die grundlegenden Annahmen hin gewiesen werden: die Binaritätsannahme, d. h. entweder feuert ein Neu ron oder nicht, und die Annahme der Synchronisation der Arbeitsweise aller Neurene auf einer diskreten Zeitskala gemäß der absoluten Refrak tärphase. Zu dem Gebrauch binärer Modeliierungen in der Neurophysiologie und ihrer Anwendung im neural engineering - dem Konnektionismus - merkt Michael A. Arbib (1989, 409) an: Modern computational neuroscience no
longer uses the binary model of the neuron, instead using continuous time models that either represent the variation in average firing rate of the neuron (. ) or actually capture the time course oj membran potenti al. It is only through such correlates of measurable brain activity that brain models can really feed back to biological experiments. Such mo dels require the brain theorist to know a great deal of detailed anatomy and physiology as well as behavioral data. While the McCulloch-Pitts neuron no langer plays an active part in computation.al neuroscience, it is still widely used in neural engineering, especially when augmented with rules for how synapses may change automatically. ..
Auch ist eine desynchronisierte Arbeitsweise einzelner Nervengeflechte innerhalb des Gehirns mit hoher Wahrscheinlichkeit anzunehmen. Wie es
84
zu einer Desynchronisation von Nervenimpulsen kommen kann, sei kurz dargelegt. Hatte ich darauf hingewiesen, daß die Intensität der Reizung keinen Einfluß auf die Amplitude des ausgelösten Impulses hat, so zeigt Valentin Braitenberg (1986, 104 ), daß allerdings durch einen stärkeren Reiz schneller der Schwellenwert erreicht werden kann und es daher eher zu einem Aktionspotential kommt als bei einer schwächeren Reizung. Die Abbildung zeigt die zeitliche Abhängigkeit des Eintretens eines Aktionspotentiales von der Stärke der Reizung. Die Form und Höhe des Aktionspotentiales ist nicht abhängig von der Intensität des Stimulus (vgl. in der Abb. oberhalb des Schwellen wertes e, d. h. der gestrichelten Linie). Allerdings hängt die Zeit innerhalb der der Schwellenwert e erreicht wird von der Intensität der Reizung ab. Bei stärkerer Reizung (obere Kurve) wird der Schwellen wert e schneller erreicht. Bei schwä cherer Reizung (untere Kurve) wird er langsamer erreicht.
Abb. nach Braitenberg 1986, 104
Valentin Braitenberg verdeutlicht die Auswirkung dieses Mechanismus an einem kleinen Neuronengeflecht.
Um I1 zum Feuern zu bringen, genügt die Aktivität eines der Neurone A, B, C, da es einen Schwellenwert von 1 besitzt. Es können aber maxi mal alle drei gleichzeitig auf das Neuron I1 einwirken. In diesem Fall
85 kann davon gesprochen werden, daß I 1 stärker gereizt wird als von zwei oder auch nur einem vorgeschalteten Neuron. Das Neuron l2 dagegen kann nur von Neuron D aktiviert werden. Damit Neuron E aktiviert wird, müssen zuvor I 1 und I2 gefeuert haben, da das Neuron E den Schwellen wert 2 hat. Nehmen wir an, die Neurone A, B, C und D sind alle zum gleichen Zeitpunkt t aktiv, dann wird, aufgrund des stärkeren Reizes, das Neuron I1 schneller aktiviert als das Neuron I2. Somit erreichen die Impulse von 11 und 12 nicht gleichzeitig das Neuron E. Es kann also nicht feuern, da die Impulse von 11 und 12 desynchronisiert wurden. Braitenberg (1986, lOS; vgl. auch Sinz 1978, 38 u. 39) merkt dann ebenfalls an: Die einfa che Interpretation eines Nervennetzes als eines Automaten mit fester Struktur, der auf einer diskreten Zeitskala arbeitet, wird unwahrscheinlich. 2. 2. 3. I . 8
Die Bedeutung der Forschungserg·ebnisse von Warren Sturgis McCulloch und Walter Pitts (1943)
Wenn also offenkundig die "Realität" in diesem Modell nur unzureichend erfaßt wird, worin liegt dann seine zentrale Bedeutung fl.ir die kognitions wissenschaftliche Forschung - ja, für die wissenschaftliche Forschung überhaupt? Heinz von Foerster (1967, 68) sprach sicherlich zu recht von dem wichtigsten epistemologischen Resultat des 20. Jahrhunderts. Um dies einzusehen, muß zunächst zwischen neuronaler Modellierung, die möglichst viele empirisch gefundene Fakten erfaßt, und Modellen, die die logische Komplexität eines Formalismus aufzeigen, unterschieden werden. Das Modell von McCulloch und Pitts ermöglicht es, über die empirisch gestützte logische Mächtigkeit des Nervensystems zu sprechen, denn un ter einfachen, neurophysiologisch gestützten Annahmen kann gezeigt wer den, daß alles, was präzise formulierbar ist, von einem Nervensystem be rechnet werden kann. Es können aufgrund dieses Ergebnisses sowohl in trospektiv als auch behavioristisch gewonnene Daten, wenn sie präzise formulierbar sind, als gleichwertig betrachtet werden. Dies ist von beson derer Bedeutung, wenn man bedenkt, daß lange Zeit von Idealisten argu mentiert wurde, daß komplexe geistige Funktionen, zu denen auch viele mathematische Rechenverfahren zählen, nicht von einem Verband von Neuronen ausführbar seien und man entsprechende "geistige Kräfte" annehmen müsse, die dies ermöglichten. Andererseits wurde aber auch von Naturwissenschaftlern, die an die Überlegenheit des Menschen gegenüber Maschinen glaubten, gerade die Komplexität des yehirns angefl.ihrt, um zu zeigen, daß es wesentlich mehr leisten könne als eine Maschine. Noch 1988 paraphrasieren Cowan und Sharp (1988, 86 u. 87) ohne Kommentar die Interpretation der For schungen McCulloch und Pitts durch den Hirnforscher Donald M. Mackays
86 von 1953: McCulloch and Pitts nets are important in that they can em
body whatever operations and processes can be described in logical terms. Donald M. Mackay has expressed this capacity as follows: if you assert that there is a certain process that a tomputer cannot go through, and if you can describe in words exactly what constitutes such a pro cess, then at least one McCulloch-Pitts net that can embody and carry out the process exists.1
McCulloch und Pitts (1943/1965) konnten nun trotz der von ihnen formu lierten vereinfachenden Annahmen über die Funktionsweise der Neuronen zeigen, daß ein neuronales Netzwerk unter gewissen ldealisierungen (im wesentlichen die einer unendlichen Lebensdauer [Rechenzeit] und unbe grenztem Rechenraum) alles das zu leisten vermag, was mechanisch-al gorithmisch von einem menschlichen Rechner, aber auch von einem Com puter, durchgeführt werden kann. John von Neumann (1951/1967, 164 ff.) faßt dieses Ergebnis von McCulloch-Pitts in folgende Worte?- Wenn ir gendein Funktionsablauf dieser Art (die Eingabe-Ausgabebeziehung; U. S.)
überhaupt logisch, genau und eindeutig mittels endlich vieler Wörter festgelegt werden kann, dann kann er auch durch solch ein formales Neurengeflecht verwirklicht werden. ... Man hat oft behauptet, die Tätig keiten und Funktionen des menschlichen Nervensystems seien so kom pliziert, daß kein gewöhnlicher Mechanismus imstande sei sie auszufüh ren. Man hat auch versucht, spezielle Funktionen anzugeben, die ihrer Natur nach diese Grenze zeigen. Man hat zu zeigen versucht, daß diese speziellen Funktionen, obwohl logisch und vollständig beschrieben, ihrem 1) Es ist jedoch anzumerken, daß ein Prozeß, der präzise beschrieben werden kann, d. h. durch einen Algorithmus, sowohl von einem Netzwerk bestehend aus McCulloch-Pitts Neuronen als auch von einem Computer ausgeführt werden kann. Das Gehirn und der Computer weisen unter dieser Modeliierung die gleiche logische Komplexität auf. Sie können als endlicher Automat oder als Turingmaschine interpretiert werden. Die Einführung des Konzeptes des neuralen Netzwerkes fand 1943 durch die Arbeit von McCulloch und Pitts statt. In dieser Arbeit wurde die Funktionsweise des Nerven systems mithilfe logisch-mathematischer Begriffe aufgezeigt. So konnten McCulloch und Pitts in ihrer Analys.e zeigen, daß das Nervensystem mit einem unendlichen exter nen Speicher das gleiche leistet wie das von Turing 1936 durch introspektiv "psycho logische
Analyse" gewonnene Konzept
der
Turing-Maschine
(McCulloch
&
Pitts
1943/1965, 35). Es ließe sich an dieser Stelle von physiologisch-psychologisch gestützten Forschungsergebnissen sprechen. Diese Konzepte und Zusammenhänge werde ich in den folgenden Kapiteln erörtern. Die Ableitung einer größeren logischen Leistungsfähigkeit des Gehirns aus den Forschungsergebnissen von McCulloch und Pitts ist gerade nicht der Fall. Sie bilden vielmehr die Basis für Computersimulationen mentaler Prozesse unabhängig von der Erforschung ihrer neuronalen Realisierung. Diese Position kommt im Funktionalismus der amerikanischen Psychologie (Block 198la, b; Fodor 1981; Johnson-Laird 1981, 1983) und Philosophie (Putnam 1960/1977) zum Ausdruck. 2) In dieser Übersetzung wird von Neurengeflechten gesprochen. Es handelt sich um die neuralen Netzwerke wie sie in McCulloch & Pitts (1943/1965) entwickelt wurden.
87 Wesen nach nicht als Neurengeflecht realisiert werden können. Das Ergebnis von McCulloch-Pitts setzt dem allen ein Ende. Danach ist bewiesen, daß alles, was vollstiindig und eindeutig in Worte gefaßt wer den kann, eben deswegen durch ein geeignetes endliches Neurengeflecht realisierbar ist. Da die umgekehrte Aussage offensichtlich auch richtig ist, können wir also sagen, daß kein Unterschied besteht zwischen der Möglichkeit, eine wirkliche oder angenommene Verhaltensweise vollstän dig und eindeutig mit Worten zu beschreiben, und der Möglichkeit, die se durch ein endliches formales Neurengeflecht zu realisieren. Beide Begriffe umfassen das gleiche. Grundsätzliche Schwierigkeiten, irgendei ne Verhaltensweise in solch einem Geflecht zu verkörpern, kann es nur geben, wenn wir dieses Verhalten nicht vollständig beschreiben können. Zwei Fragen ergeben sich nach John von Neumann (1951/1967, 165): die nach der Realisierung von Funktionen im realen Nervensystem und die, ob jede Verhaltensweise, die es gibt, wirklich vollständig und eindeutig in Worte gefaßt werden kann.
An der Beantwortung beider Fragen arbeitet die Kognitionswissenschaft.
88 2. 2. 3. 2
Nervennetze, logische Funktionen, logische Netze und endliche Automaten
Wie zu sehen war, kann die Funktionsweise eines McCulloch-Pitts-Neu rons im Kern als eine aussagenlogische (Boolesche) Funktion der Zeit verstanden werden. Dies ermöglicht es, das Verhalten eines Neuronennet zes durch funktionale Gleichungen zu beschreiben, in denen die Argumen te n-Tupel von Wahrheitswerten sind und der Wertebereich ebenfalls von Wahrheitswerten gebildet wird: f(x1(t), ... , x0 (t)) = y(t+l). Sowohl die McCulloch-Pitts-Netze als auch die logischen Netze können als endliche Automaten mit Ausgabe, sogenannte Transduktoren, betrach tet werden. Hier ist von einem Übergang von der strukturellen Automa tentheorie - der Theorie der Nervennetze und logischen Netze - zur ab strakten Automatentheorie, der Theorie der Turingmaschinen, zu spre chen. Es handelt sich bei beiden Bereichen natürlich um abstrakte Mo dellbildungen, die sich nur hinsichtlich ihres Abstraktionsgrades unter scheiden. 2. 2. 3 . 2. I Nervennetze als endliche Automaten
Wie sind diese Zusammenhänge zu verstehen? Wenn wir noch einmal ein Nervennetz betrachten, so können verschiedene Bereiche unterschie den werden.
Q
0
Die Eingaben xi in das Netz und die Ausgaben uj aus dem Netz sind zu unterscheiden, außerdem die Aktivität des Axons Yi eines jeden Neu rons Ni des Netzes. Die Werte der Eingabefasern xi und der Ausgabefa sern Uj, die zu den Effektoren führen, werden benutzt, um zu der Menge I der Eingabezeichen und der Menge 0 der Ausgabezeichen des entspre chenden Transduktors FSO zu gelangen. Nehmen wir an, das neurale Netzwerk hat n Eingabefasern x1, ... , x0, die zu einem Zeitpunkt t ent weder aktiv (xi = 1 ) oder nicht aktiv (xi = 0) sind. So kann die Ge-
89 samteingabe, der Zustand aller Fasern zum Zeitpunkt t, durch ein n-Tu pel (x1(t), ... , x0(t)) mit 1 � i � n repräsentiert werden. Es gibt insge samt 2° mögliche n-Tupel. Sinnvollerweise kann dann das n-Tupel (0, 0, 0, ... , 0) durch z0, das n-Tupel (0, 0, 0, .. , 1 ) durch z1, das n-Tupel (0, 0, 0, ... , 1, 0) durch z2, das n-Tupel (0, 0, 0, . . , 1, 1) durch z3 usw. bezeichnet werden. Die Symbole 'z' können also entsprechend der durch die als Binärzahl interpretierten n-Tupel in dezimaler Darstellung indi ziert gedacht werden. Es gibt also bei n in das Netz eingehenden Fasern xi mit 1 � i � n eine neue Eingabemenge I = {z0, z1, , Zm_1} für den Transduktor FSO von m = 2n möglichen Eingabezeichen zi mit 0 � i � m - 1. Betrachten wir die Gesamtaktivität der .!s. Axone Y; zu einem bestimmten Zeitpunkt t, so kann auch diese durch ein k-Tup-el der Aktivitätswerte beschrieben werden. Auch hier ergeben sich wieder 'i< mögliche k-Tupel (y1 (t), y2(t), ..., Yk (t)), die ähnlich der Eingabezeichen durch q0, q1, ... , q2k_1 Symbole kodiert werden. Man spricht in diesem Fall von den Zuständen bzw. der Zustandsmenge Q = {q0, q1, ... , q2 k_ J Da die Eingabefasern das "Feuern" einiger Neuronen bewirken, kann der Zustand q'€ Q, d. h. die Aktivität aller Axone des Netzes zu einem be stimmten Zeitpunkt t+1, als von der Eingabeaktivität, d. h. dem Eingabe zeichen z € I, und der Aktivität aller Axone zum Zeitpunkt t, d. h. dem Zustand q € Q, abhängig betrachtet werden. Die Zustandsänderung eines neuronalen Netzwerkes kann somit als Funktion 8 aufgeiaßt werden, mit: .
.
.••
8:
Q X I � Q;
(q, z)
t-7
q' bzw. S(q, z)
=
q'
Die Funktion 8 wird als Zustandsüberführungsfunktion oder Transitions funktion bezeichnet. Sie besagt, daß der Automat, wenn er sich in Zu stand q befindet und das Zeichen z liest, in den Zustand q' übergeht. Die beiden Mengen Q und I sind disjunkt. Werden jetzt noch nur die 1 Axone ui mit 1 � i i 1, d. h. die Ausgabefasern, betrachtet, die das Netzwerk verlassen und deren Aktivität zum Zeitpunkt t die Ausgabe o € 0 bildet, so lassen auch diese sich wieder als 1-Tupel (u1(t), u2(t), ... , u1(t)) co dieren. Auch hier sind wieder 21 Ausgabezeichen o möglich, die entspre chend numeriert werden. Die Ausgabezeichen bilden die Ausgabemenge 0 = {o0, o1, , o21_1} des Netzes. Die Ausgabe ist, ·da es sich um die Aktivitäten einiger Axone des Netzes handelt, abhängig von einer Teil menge Q' der Zustandsmenge Q, die ja die Kombintionen der möglichen Aktivitäten aller Axone repräsentiert. Die Ausgabe eines Netzes kann als folgende Funktion ). definiert werden: ..•
A.:
Q' �
0;
q t-?o bzw. A.(q) = o
Die Funktion A. wird als Ausgabefunktion bezeichnet und ist wie folgt zu lesen: In Zustand q gibt der Automat das Zeichen o aus.
90
Ein endlicher Automat mit Ausgabe (FSO) besteht also aus drei Men gen der Ausgabemenge 0, der Zustandsmenge Q, der Zustandsüberfüh rungsfunktion S und der Ausgabefunktion A. Ein endlicher Automat (finite state automaton with output, FSO) mit Ausgabe wird daher auch als Quintupel FSO = (I, Q, 0, S, ).. ) definiert. Man spricht in diesem Fall auch von einem Moore-Automaten, wobei die Ausgabefunktion ).. im allgemeinen auf ganz Q definiert wird und die Transitionsfunktion S wie erläutert definiert ist. Die Mengen 0 und I können verschieden sein, müssen es aber nicht. Allerdings ist Q von I und 0 verschieden. Kennzeichnend für diesen Automaten ist die Abhän gigkeit der Ausgabe o von dem Zustand q. Eine Variante bildet der Mealy-Automat, der formal dem Moore-Auto maten äquivalent ist, d. h. es läßt sich zu jedem Mealy-Automaten ein Moore-Automat konstruieren, der das gleiche Ein-Ausgabeverbalten zeigt (vgl. Hopcroft & Ullman 1979, 42-45), dessen Ausgabefunktion ß aller dings wie folgt formuliert ist:
ß : Q x i -) 0;
(q, z) H o bzw. ß (q, z )
=
o
Diese Ausgabefunktion erhält die folgende Interpretation: Befindet sich der Automat in Zustand q € Q und liest das Zeichen z € I, dann gibt er das Zeichen o € 0 aus. Die Ausgabe o ist also von dem Zustand q und der Eingabe z abhängig. Ein McCulloch-Pitts-Nervennetz kann auf abstrakterer Ebene als ein endlieber Automat aufgefaßt werden, was im wesentlichen durch eine Co dierung der Netzeingaben, der "internen" Aktivität der Axone und der Netzausgaben erreicht wird. Es ist weiterhin nachweisbar, daß nicht nur zu jedem McCulloch-Pitts Nervennetz ein endlicher Automat existiert, sondern auch zu jedem endlichen Automaten ein McCulloch-Pitts-Nervennetr. Diese Konzepte erweisen sich somit hinsichtlich ihres funktionalen Verhaltens als äquiva lent. Es ist jedoch zu beachten, daß ein McCulloch-Pitts-Nervennetz bis auf Isomorphie einen endlichen Automaten bestimmt, d. h. wenn ein Ner vennetz gegeben ist, kann genau ein Automat konstruiert werden. Umge kehrt ist es möglich, wenn ein endlicher Automat gegeben ist, sein Ver halten (die Eingabe-Ausgabebeziehung) durch strukturell verschiedene Nervennetze zu realisieren. Dies Ergebnis ist für die Unterscheidung von Struktur und Funktion2 in 1) vgl. Arbib 1987, 24-26, Minsky (1971, 86-88) gibt eine Codierung eines endlichen Automaten, der einen Addiermechanismus für Binärzahlen repräsentiert, um ein Nervennetz zu erhalten, welches das gleiche funktionale Verhalten aufweist. 2) Oie Unterscheidung von Struktur (neuronaler Architektur) und Funktion (das Verhal ten) wird ausführlicher in Arbib 1989, 10 ff. behandelt.
91
der neuropsychologischen Forschung von Bedeutung. Überträgt man näm lich diese Unterscheidung auf die neuropsychologische Erforschung der Musikwahrnehmung, so kann unter der Annahme, daß ein Wahrnehmungs prozess durch einen endlichen Automaten beschrieben wird, dieser durch verschiedene neurologische Strukturen (Nervennetze) des Gehirns reali siert werden. Andererseits können unterschiedliche neurophysiologische Strukturen nur einen "psychologischen" Prozess realisieren. Forschungs strategisch leitet sich hieraus für neuropsychologische Untersuchungen die Forderung nach der Bestimmung der der Musikwahrnehmung unterliegen den psychologischen Mechanismen ab, bevor deren neurophysiologische Korrelate erforscht werden .1 2. 2. 3. 2. 2.
Logische Netze als endliche Automaten
In einem ersten Schritt habe ich informell die Beziehung zwischen neu ronalen Netzwerken, logischen Netzen und aussagenlogischen Funktionen dargelegt. In einem zweiten Schritt habe ich gezeigt, welche Überlegun gen es ermöglichen, ein neuronales Netzwerk als endlichen Automaten mit Ausgabe aufzufassen. Die Kernidee bestand in einer Codierung der Netz eingaben, Netzausgaben und der Gesamtaktivität der Axone in Zeichen mengen von Eingabesymbolen, Ausgabesymbolen und Zuständen. Weiterhin habe ich nachgewiesen, daß Nervennetze das gleiche leisten wie logische Netze. Es ist also zu vermuten, daß Computer, die als logisches Netz betrachtet werden können, auf abstrakterer Ebene eben falls als endlicher Automat mit Ausgabe aufzufassen sind. Dies ist tat sächlich der Fall. In diesem Zusammenhang wird dann von einer sequen tial machine oder einem finite transducer gesprochen. Die Beziehung zwischen logischen Netzen (Schaltwerken) und endlichen Automaten soll an dem Beispiel des Binäraddierers erläutert werden. Ein Binäraddierer nimmt zwei natürliche Zahlen in binär codierter Form entgegen und liefert als Ausgabe deren Summe. Die Eingabe erfolgt, mit den Ziffern der niedrigsten Stellen der beiden Operanden beginnend, schrittweise und liefert ebenso schrittweise eine Ausgabe. Für die Additi on der Zahlen 1 und 3 ergibt sich folgendes Bild: 1 = 00 1 3 = 01 1 Zuerst wird das Paar } genommen und liefert 0 als Ausgabe. Wir ha ben einen Übertrag von 1 zu merken, ähnlich wie bei der normalen Addition. Im nächsten . �chritt wird das Paar genommen, dies ergäbe 1 . Da allerdings der Ubertrag berücksichtigt werden muß, er.gibt sich als näch ste Ausgabe wieder eine 0 und ein Übertrag 1 . Der d-ritte Schritt liefert
?
1) vgl. auch Gregory 1974.
92 dann als Ausgabe eine 1, so daß das Ergebnis 100 = 4 lautet. Es läßt sich jetzt ein endlicher Automat mit Ausgabe (in diesem Fall ein Mea ly-Automat) definieren, der bei geeigneter Interpretation das gewünschte Verhalten zeigt. Hierzu werden die vier möglichen Eingabepaare (0, 0), (0, 1), (1, 0) und (1, 1) in folgender Weise als Eingabezeichen des Auto maten codiert: (0, 0 ) � z0
( 1 , 0 ) � z2
Dem Additionsbeispiel entsprechend mit der Eingabe (I, 1 ), (0, 1 ) und (0, 0) und erhält der endliche Automat die Zeichenkette "z0z1z3" als Eingabe. Das Eingabealphabet I des Automaten ADD besteht aus der Menge {z0 , Zp z2, z3}. das Ausgabealphabet 0 aus der Menge {0, 1}. Weiterhin muß der Automat sich "merken" können, ob ein Übertrag vorlag oder nicht. Dies kann durch jeweils einen Zustand q geschehen. So nehmen wir an, daß der Automat sich merkt, wenn er im Zustand q0 ist, daß kein Übertrag vorlag. Dagegen befindet er sich in Zustand q1, wenn es einen Übertrag gibt. Der Automat ADD weist also folgende Struktur auf: ADD = = {q0, q1} , I
(Q
=
{ O , t },
{ z0, z 1 , z2, z 3 } , 0
�,
ß)
Es müssen noch die Funktionen � und ß spezifiziert werden, damit der Automat ADD das gewünschte Verhalten zeigt: 8
Zo
zl
z2
z3
Qo
Qo
Qo
Qo
ql
Go
ql
qt
ß
Zo
ql
Qo
0
ql
ql
----------------
zt
z2
z3
------------------
0 0
0
Die Tabellen sind wie folgt zu lesen: In Zustand qi liest der Automat ADD das Zeichen Zj , geht (nach der Tabelle der Transitionsfunktion S ) in den Zustand q1 über und gibt (gemäß der Tabelle der Ausgabefunktion ß ) ein Zeichen o k € 0 aus. Eine graphische Repräsentation ist durch einen Zustandsgraphen mög lich, indem die Kreise des Graphen als Zustände des Automaten inter pretiert werden und die beschrifteten, gerichteten Kanten die Überführung des Zustandes q zu q' bezeichnen, wobei an der Kante das gelesene Zeichen z steht, dem, durch einen Strich "/" abgetrennt, das Ausgabezeichen o folgt.
93
Will man einen endlichen Automaten mit Ausgabe durch ein logisches Netz realisieren, das aus logischen Gattern und Verzögerungsgliedern be steht - also ein sequentielles Schaltwerk ist -, so muß man sich klar machen, daß dieses nur Folgen von binären Zeichen verarbeitet. Es müs sen also Eingabe-, Ausgabe- und Zustandsmenge binär codiert werden. Nun werden bekanntlich, um n Zeichen einer Menge binär zu codieren, m m Binärstellen mit 2 ;:, n benötigt. Es ergibt sich für unser Beispiel, daß die vier Eingabezeichen z0, z1 , z2, z3 (d. h. n 4) durch 00, 01, 10, 11 (d. h. m 2) binär codiert werden können. Für die zwei Ausgabezeichen ergibt sich die Codierung 0 � 0, 1 � 1 und ebenso für die Zustände q0 � 0, q1 � 1. Durch Aufstellen einer Wahrheitstafel für Ausgabe- und Überführungsfunktion erhalten wir die Codierung des Verhaltens. Für die Ausgabefunktion ß und die Transdukti onsfunktion 8 ergeben sich folgende Tabellen: =
=
ß
Ausgabefunktion z q 0 XI 0 0 0 0
x2 0 0 1 0 0
V 0 1 0 1 0 1 0
0 1 0 1 0 0
Transduktionsfunktion z q' q xl x2 0 0 0 0 0 0 0 0
V 0 1 0 1 0 0
V 0 0 0 1 0
1. Zeile 2. Zeile 3. Zeile 4. Zeile 5. Zeile 6. Zeile 7. Zeile 8. Zeile
Nach Erstellung der Tabellen werden die disjunktiven Normalformen gebildet:1 Man betrachtet die Zeilen der betreffenden Tabelle an denen q' = 1 bzw. o = 1 ist. Nun wird ermittelt, unter welchen Bedingungen die Verbindung des logischen "und" bei (x1 und x2), d. h. z , sowie (z und q) ((x1und x2 ) und q) den Wert 1 ergeben und bildet mit allen =
I) In Hersehe! (1974, 52 u. 53) und Nelson (1982, SO u. SI) findet sich dieses Verfahren mit weiteren Beispielen dargestellt.
94 auf diese Weise formulierten Zeilen Disjunktionen. Für die Tabelle der Ausgabefunktion ß ergibt an den Zeilen, in denen o = 1 ist: oder oder oder
((not x1 und not x2 ) und q)
für
((not x1 und x 2 ) und not q)
für Zeile 3
((x1 und not x2) und not q)
für
((x1 und x2 ) und q)
für Zeile 8
Zeile 2
Zeile
s
Oder mit den aussagenlogischen Symbolen:1 (( --. XI " -. X2) " q) V ((-o X1 A X2) A -. q) V (( X1 A --. x 2 ) A -. q) V (( X1 A. X2) A q) Die Überführungsfunktions ll erhält folgende aussagenlogische Beschrei bung, damit q' den Wert 1 animmt: oder oder oder
((not x1 und x2) und q )
für
((x1 und not x2 ) und q)
für Zeile 6
((xt und x:2) und not q)
flir Zeile 7
((xt und x:2) und q)
für Zeile 8
Zeile 4
Durch Vereinfachung aufgrund aussagenlogisch äquivalenter erhält man ilir die Transitionsfunktionsfunktion 8:
Formeln
Da alle rdings q seinen nächsten Zustand in Abhängigkeit von der Ein gabe und sich selbst bildet, muß es verzögert werden, um eventuell ein tretende widersprüchliche Situationen zu vermeiden. Es ergibt sich in aussagenlogischer Form, mit Berücksichtigung der ge takteten Zeit, für die Zustandsüberführungsfunktions ll (mit q = y):
1) Des weiteren werde ich auf die aussagenlogische Darstellungsform verzichten, da die informelle Darstellungsweise für die mit der Aussagenlogik nicht vertrauten Personen aufgrund des höheren mnemotechnischen Gehaltes leichter nachvollziehbar ist. Die Übersetzung der informellen Redeweise in die aussagenlogische dürfte jedoch keine Probleme bereiten.
y(t+l)
=
95
[x1(t) und x2(t)] oder [{(x1(t) oder x 2 (t)) und (not (x1(t) und x2 (t)))} und y(t)]
Die Ausgabefunktion ß nimmt nach Vereinfachung folgende Gestalt an:
[ { (x1 oder x2) und not (x1 und x2)}ode r q] und [not { q und (x1 oder x2) und not (x1 und x2 )}] Mit Zeitbezug t ergibt sich (mit z z(t)
=
o und q
=
y):
=
[{( x1(t) oder x2(t)) und not ( x 1 (t) und x 2(t)) } oder y(t)] und [not {y(t) und (x1 (t) oder x2 (t)) und not ( x1 (t) und x2 (t))}]
Das sequentielle Schaltwerk muß für das Verzögerungsglied noch eine Anfangsbelegung erhalten y(O) = 0, d. h. y befindet sich bei Beginn zum Zeitpunkt t = 0 auf 0. Das sequentielle Schaltwerk erhält die erste Ein gabe für x1 und x2 zum Zeitpunkt t = 1 und liefert bei z zum Zeitpunkt t = 1 die erste Ausgabe. Dieses durch die aussagenlogischen Formeln beschriebene Schaltwerk, das die Addition von natürlichen Zahlen in binärer Darstellung realisiert, läßt sich in Schaltzeichen folgendermaßen darstellen:
BIHN\ER ADDIERER, bestehend •us ZMei HALBADDIERERM
Das Addierwerk bildet den Kern der arithmetisch-logischen Einheit (ALU; Rechenwerk) des Von-Neumann-Rechners. An dem Beispiel des Binäraddierers ist zu erkennen, daß der Computer ebenfalls als endlicher Automat aufgefaßt werden kann. Hierbei wird allerdings von der Be schreibung der Hardware durch logische Netze (sequentielle Schaltwerke) ausgegangen. Als Ergebnis der letzten Kapitel bleibt folgendes festzuhalten: Allmäh-
96 lieh zeigt sich, was gemeint ist, wenn von gleicher logischer Leistungsfä higkeit des Gehirns und des Computers gesprochen wird und warum an genommen werden kann, daß Berechnungen, die bei Computersimulationen durchgeftihrt werden, ebenfalls vom Gehirn ausgeführt werden können. So kann, wenn es sich bei diesen Simulationen um Beschreibungen von psy chologischen Phänomenen wie der Musikwahrnehmung handelt, davon aus gegangen werden, daß das Gehirn diese Prozesse ebenfalls ausfUhren kann. Es muß aber besonders betont werden, daß die Äquivalenz des Computers und des menschlichen Gehirns rein auf der abstrakt- funktio nalen Ebene gilt und beide Systeme keine substantiellen Ähnlichkeiten aufweisen: Das Gehirn besteht aus wetware, der Computer dagegen aus hardware. Auch dürfte die Redeweise, in der vom Gehirn als einem endlichen Automaten gesprochen wird, ihren mystischen Schleier verloren haben. Die Charakterisierung der logischen Komplextität des funktionalen Ver haltens des Gehirns durch den endlichen Automaten bildet seit den SOer Jahren eine grundlegende - häufig nicht explizit formulierte - Annahme theoretisch-linguistischer und theoretisch-psychologischer Forschungen.1 In der Linguistik und Psychologie wird allerdings davon gesprochen, daß Grammatiken Repräsentationen kognitiver Bereiche sind. Die Zusammen hänge zwischen Grammatiken und Automaten werde ich in den nächsten Kapiteln untersuchen.
1) vgl. z. B. Peters 1969 für die Linguistik und Pylyshyn 1973 für die Psychologie.
2. 2. 4
97
Abstrakte Automatentheorie
2. 2. 4. 1 Grammatische Regeln, endliche Automaten und reguläre Ereignisse
Bisher habe ich gezeigt, wie aufgrund verschiedener empirischer Sach verhalte Beschreibungen entstanden, die sich als formal gleichwertig er wiesen. Es handelt sich um die formalen Nervennetze für die Funktions weise des Nervensystems und die logischen Netze (sequentielle Schalt werke) als Beschreibungen der Verhaltensweise des Computers auf der "logischen" Hardwareebene. Beide Formalismen können in bezug auf ihr Verhalten auf abstrakterer Ebene als endliche Automaten betrachtet werden. Des weiteren möchte ich zwei Konzepte erläutern und mit den bisher vorgestellten in Beziehung setzen, die mit der Untersuchung der Produkte des menschlichen Geistes, wie z. B . der natürlichen Sprache, in enger Verbindung stehen. Es handelt sich um die Konzepte der "Regel" und der "formalen Sprache", wie sie besonders von Noam Chomsky1 in die Lingui stik eingeführt wurden. Chomsky greift für die Beschreibung der Regeln einer natürlichen Sprache auf Regelformen eines formalen Systems, dem Semi-Thue-System, zurück, die in ihrer allgemeinsten Form "cp � q," lau ten und wie folgt gelesen werden: die Zeichenkette
Transformationsgrammatik in den Schriften: Chomsky 1957, 1963 u. 1965. Eine kurze Darstellung gibt Seifert 1986, 61 ff. 2) In Anhang B werden die Mengenbildungsprinzipien und die fundamentalen Opera· tionen auf Mengen erläutert.
98 führt werden können und dann nur Regeln der Form "A �aB" und "B �a" aufweisen dürfen, wobei A, B nichtterminale Zeichen sind und a termi nales Zeichen ist. Es gibt auch äquivalente Grammatiken, deren Regeln die Form "A �Ba" und "B �a" aufweisen, die ebenfalls zu den regulären Grammatiken1 gerechnet werden. Die von diesen Grammatiken beschrie benen Sprachen werden als finite state Janguages oder reguläre Spra chen bezeichnet. Sie sind auch noch unter den Begriffen "reguläre Men gen" und "reguläre Ereignisse" bekannt. Es ist nicht offensichtlich, inwie fern diese Konzepte mit dem des "endlichen Automaten" und somit dem des "Nervennetzes" und "logischen Netzes" in Beziehung stehen. Es war jedoch Kleene (1951/1956/1974) der nachwies, daß die von ihm definier ten regulären Ereignisse von einem endlichen Automaten akzeptiert wer den. In seiner Arbeit von 1956 setzte er sich mit den Forschungsergeb nissen von McCulloch und Pitts (1943/1965) auseinander und definierte den endlichen Automaten als Akzeptor, d.h. als Automaten, der eine Sprache akzeptiert und wie folgt definiert ist: Ein FSA (finite state � ceptor) ist ein Quintupel (Q. S, q0, S, F) mit der Menge der Zustände Q, der Menge der Eingabezeichen S, der Menge der Endzustände F, die eine Teilmenge der Menge Q ist, einem besonders ausgezeichneten Zustand q0 - dem sogenannten Anfangszustand - und der Zustandsüberführungsfunkti on S. Alle Mengen sind endlich und die Mengen Q und S disjunkt, d. h. Q (', S = { } Betrachten wir noch einmal den binären Addierer,2 so läßt sich der Zustand q0 als Anfangszustand und q1 als Endzustand auffassen. Eine Zeichenfolge s aus der Menge der Wörter über dem Eingabealpha bet S = {z0, z1 , z2, z3} gilt als akzeptiert, wenn der Ausgangspunkt für das erste Zeichen der Zeichenfolge der Anfangszustand q0 ist und der Automat sich nach Einlesen des letzten Zeichens in einem Endzustand befindet. .
1) Links- und rechtslineare Grammatiken haben Regeln der Form "A -Bx", "A -x" bzw. "A�B", "A�" mit A, B E vr und x E VN*. Die von mir als regulär bezeich neten Grammatiken sind mit diesen identisch und stellen nur eine andere Formulierung dar (vgl. Levelt 1974, vgl. auch S. 110). Anstalt einer Kette x € vr* enthalten die Re geln nur ein Zeichen z € vr. Dies hat zur Folge, daß das leere Wort A € VT* geson dert behandelt werden muß. Mit regulä.ren Grammatiken sind also die links- und rechts linearen Grammatiken mit den Regeln der Form "A -+Ba" (linkslinear) bzw. "A -aB"
(rechtslinear) und "A �" gemeint mit A, B E VN und a € VT (vgl. Chomsky 1963, 393). 2) Der binäre Addierer, automatentheoretisch als Transduktor (Mealy-Automat) inter pretiert, wurde auf den S.eiten 91-93 besprochen.
99 So akzeptiert der Automat z. B. die Kette "z0z0z3z0z3", nicht jedoch die Kette "z0". Eine von einem Automaten akzeptierte Sprache � (FSA) kann als die Menge der von dem Automaten akzeptierten Zeichenketten ver standen werden. L(FSA) = { s I s E S* und FSA startet im Anfangszustand q0 und der FSA befindet sich, nachdem das letzte Zeichen der Zeichenkette s gelesen wurde, in einem Endzustand q' E F} Will man die von einem endlichen Automaten akzeptierte Sprache durch einen kompakten Ausdruck beschreiben, so bildet die obige Dar stellung nicht das geeignete Mittel. Stephen Cole Kleene (195111956/1974) entwickelte einen Formalismus, der es erlaubt, die sogenannten regulären Ereignisse (Mengen) in kompakter Weise zu beschreiben. Es handelt sich um die regulären Ausdrücke. Kleene setzt in seiner Arbeit die regulären Ausdrücke mit der Kapazi tät (Akzeptanz) eines endlichen Automaten in Beziehung, wobei seine Un tersuchung auf die Arbeit von McCulloch und Pitts (1943/1965) gründet und reguläre Ereignisse die Strukturen darstellen, die ein Organismus (z. B. das Zentralnervensystem) oder physikalischer Automat (zu denken ist z. B. an einen Computer) intern zu repräsentieren in der Lage ist. Kleene (1951/1956/1974, 3 u. 4) versteht unter Ereignissen folgendes: Organis
men oder Automaten erhalten Reize über ihre Sinnesrezeptoren und entwickeln Aktivitäten durch ihre Erfolgsorgane. ... Wir gehen von der Überlegung aus, daß jede Art von Reizung oder kurz: jedes Ereignis, das eine Aktivität auslöst, eine Darstellung im Zustand des Organismus haben muß, und diese muß sich nach dem Auftreten des auslösenden Ereignisses und vor der Reaktion im Zustand des Organismus oder des Automaten manifestieren . So fragen wir, welche Art von Ereignissen im Zustand eines Automaten dargestellt werden können . ... Unser Haupt ergebnis wird der Nachweis sein ... , daß genau die Ereignisse einer bestimmten Klasse, die man "reguläre Ereignisse" nennt, darstellbar sind. .
.
.
Kleene sprach auch davon, daß eine bestimmte Klasse von Ereignissen
realisiert wird, wenn ein endlicher Automat sie akzeptiert und nannte
diese reguläre Ereignisse. In der Literatur gibt es (unerheblich) verschie dene Definitionen der Klasse der regulären Ereignisse (Mengen), die wie folgt rekursiv charakterisiert werden:1 1) Die leere Menge { } , die Menge mit dem leeren Wort { A } sowie jede Menge, die genau ein Element aus dem Bezugsalphabet A enthält, also die Mengen {a} mit a E A, sind reguläre Ereignisse (Mengen). 2a) Die durch Mengenkonkatenation o zweier regulärer Ereignisse (Mengen) R 1, R2 erhaltene Konkatenationsmenge R1 o R2 ist ein(e) I) Ich beziehe mich auf die Definitionen von Moll, Arbib & Kfoury 1988, 34 sowie Hall Partee
1978, 149 ff.
100 reguläres Ereignis (Menge). Die Mengenkonkatenation A o B ist de finiert durch A o B := {ab I a E A und b E B}. 2b) Die durch die Vereinigung v zweier regulärer Ereignisse (Men gen) R 1 und R2 erhaltene Vereinigungsmenge R1 v R2 ist ein(e) re guläre(s) Ereignis (Menge). Die Mengenvereinigung A v B ist hier bei folgendermaßen definiert: A v B := {x I x E A oder (vel) x € B} 2c) Die durch Anwendung der Sternoperation • (die Iterierte, Itera tion) auf ein reguläres Ereignis (eine Menge) R erhaltene Menge R• ist ein reguläres Ereismis (eine MenRe).1 Die Kleensche Stern operation • ist definiert als:l B* = {A} v B v B2 v B3 v ... 3) Nur die unter 1 und durch endliche Anwendung der unter 2a, 2b, 2c spezifizierten Operationen gewonnenen Mengen sind reguläre Ereignisse. Um die regulären Ereignisse kompakt darstellen zu können, wurde das Konzept der regulären Ausdrücke eingeführt. Die regulären Ausdrücke kön nen als Metasprache verstanden werden, welche die regulären Ereignisse bezeichnet und auf folgende Weise gebildet wird: Die n Zeichen eines endlichen Alphabetes A = {a1 , , an} werden als neue Zeichen "a1", , "an" eingeführt. Ebenso wird ftir die leere Menge das Zeichen "(])' und für das leere Wort A das Zeichen "A" eingeführt. ' Das neue Alphabet A = { a1 , , an, A,
•••
•••
1)
2) 3) 4)
a, a,
ß ß a
--+ --+ --+ --+
a1 1 ... 1 &n i A I
Die Regel 1) - die Basisregel - ist eine Zusammenfassung mehrerer Regeln und besagt, daß jedes der angegebenen einzelnen Zeichen ein re gulärer Ausdruck ist. Das Zeichen "I" gehört nicht zum Alphabet und dient als Abkürzung für "oder". Regel 1) ist zu lesen als: "�" oder die folgenden, durch "... " angedeuteten Zeichen oder "&n" oder "A" oder "
=
•
•
•
•
101 geschieht durch Angabe einer Interpretationsfunktion SE() von der Menge der regulären Ausdrücke R in die Menge der Teilmengen von A� welche mit P(A*) bezeichnet wird. mit
SE: R � P(A*) SE(A) {A} SE(
=
=
e
R
Wie kann man sich nun klar machen, daß die Klasse der endlichen Automaten die regulären Ereignisse akzeptiert? Eine Plausibilitätsbetrach tung soll an dieser Stelle die Beziehung zwischen endlichen Automaten und regulären Ereignissen näher beleuchten und einsichtig machen. Man stelle sich vor, die möglichen Zeichenketten endlicher Länge über einem Alphabet A werden nach gewissen Formkriterien zu Teilmengen zusammengefaßt und als formale Sprachen bezeichnet. Eine formale Spra che L ist also eine Teilmenge von A*. Als besondere Teilmengen sind die leere Menge { } , die Menge mit dem leeren Wort {A}, das Alphabet A und die Menge A* selbst hervorzuheben. Weiterhin kann zwischen endli chen und unendlichen formalen Sprachen unterschieden werden. Die Klasse der endlichen Automaten als Akzeptoren "filtert" nun Spra chen aus den möglichen Mengen der Zeichenketten aus A*, also der Po tenzmenge P von A* , d. h. P(A*) bzw. 2JA•J, genau die Klasse (Familie) der Sprachen heraus, die Kleene (1951/1956/1974) als reguläre Ereignisse bezeichnete und die auch reguläre Sprachen bzw. Mengen genannt wer den.1 Ein Automat kann daher als Klassifikator einer Teilmenge von Zei chenketten aus der Menge der Zeichenketten A* gelten. Da in der Praxis die Menge mit dem leeren Wort und die leere Men ge nicht von großer Bedeutung sind und man nur an den real auftreten den "Ereignissen" - den Eingaben - interessiert ist, werden die regulären Ausdrücke oft nur durch die Zeichen des Alphabets und die Operationen der Konkatenation, Sternoperation sowie die Vereinigung charakterisiert. Die leere Menge und die Menge mit dem leeren Wort können dann durch Definition den regulären Mengen zugerechnet werden, indem man die endlichen Teilmengen aus A* als reguläre Mengen definiert. Auch auf die Klammerung wird häufig verzichtet, wenn aus dem Kontext ersichtlich wird, welche Operation zuerst auszuführen ist. So wird statt "(b+(b(a)*))'' häufig "b + ba*" und statt "((ba))*" als "(ba)*" geschrieben. Implizit wird 1) vgl. Chomsky 1963a, 333. In Chomsky & Miller 1958 wird diese Klasse (Familie) von Sprachen als finite state languages bezeichnet. In Anlehnung an den endlichen Auto· maten, dessen en,glische Übersetzung finite state automaton lautet.
102 eine Rangfolge der Operatoren angenommen - zuerst wird die Sternope ration, dann die Konkatenationsoperation und zuletzt die Vereinigungsope ration angewandt. Nur wenn diese implizite Annahme durchbrechen wer den soll, wird eine Klammerung benutzt. Ich werde von diesen Konventio nen bei der folgenden Darstellung Gebrauch machen und mich auf das { 0, 1 } beschränken, um einige endliche Automaten zu Alphabet A {A, 0, 1, 00, betrachten, die bestimmte Teilmengen aus A* = { 0 , 1}* 01, 10, 11, 000, 001, 010, ... } beschreiben, die zugleich reguläre Ereig nisse darstellen. =
=
Beispiel 1: Die leere Menge { } die durch den regulären Ausdruck
Beispiel 2: Die Menge mit dem leeren Wort { A } mit A wird von nebenstehendem Auto maten akzeptiert: Beispiel 3: Die Menge {0, 1}� dargestellt durch den regu ären l Ausdruck (0 + 1)*, wird von folgendem Automaten ak zeptiert: Beispiel 4: Die Menge A+ der Zeichenreihen ohne das Ieere Wort A, also A+ A*/{A } / { A } = {0, 1, 01, 10, ... } , = {0, 1}* repräsentiert durch den re ulären 1 Ausdruck ((1 + 0) (0 + 1) ) bzw. (1 + 0)(0 + 1)* bzw. (1 + o)+, findet sich vom nächsten Auto maten akzeptiert: =
Beispiel 5: Die Menge {0, 1} mit dem regulären Ausdruck: (1 + 0) bzw. 1 + 0 wird akzeptiert von:
1
103 Prinzipiell läßt sich anmerken, daß die Konkatenation o zweier Zeichen eines Alphabets im Zustandsgraphen durch aufeinanderfolgende Zustände ausgedrückt wird. Beispiel: Die Folge 10 {10}: =
Dem regulären Zeichen "+" läßt sich eine Verzweigung im Zustandsdia gramm zuordnen. Allerdings muß die Definition des deterministischen endlichen Automaten zu der des nichtdeterministischen erweitert werden, d. h. es dürfen auch Kanten, die von einem Knoten wegführen, das glei che Zeichen als Beschriftung erhalten.1 Diese Erweiterung führt jedoch nicht aus der Klasse der von einem deterministischen endlichen Automaten akzeptierten Sprachen heraus, da die Klassen der deterministischen und nichtdeterministischen endlichen Automaten formal äquivalent sind, d. h. flir jeden nichtdeterministischen kann ein deterministis eher endlicher Au tomat und vice versa konstruiert werden, der dieselbe Menge akzeptiert? Als Beispiel soll 1 + 0 = {1, o} dienen: Das Zeichen "•" des regulären Alphabets findet seinen Ausdruck in einer Schleife: t• = {A, 1 , 11, 111, } : ...
Dies mag genügen, um die Beziehung von regulären Ereignissen und endlichen Automaten einsichtig zu machen, der genaue Nachweis ist we sentlich umfangreicher und komplizierter.3 Ich fasse die inhaltliche Entwicklung noch einmal zusammen: McCulloch und Pitts (194 3/1965) modellierten das Verhalten von Ner vennetzen ausgehend von neurophysiologischen Tatsachen. Das Gehirn wird als Nervennetz verstanden. Die logischen Netze dienten der Be schreibung von sequentiellen Schaltkreisen, die die Grundlage der Hard ware des Von-Neumann-Rechners bilden. Beide Konzepte erwiesen sich als äquivalent, indem sie auf abstrakter Ebene als endlicher Automat aufgefaßt wurden. Kleene stellte sich die Frage, welche Ereignisse ein Organismus, speziell das Gehirn oder eine physikalische Maschine, intern repräsentieren kann und kam zu dem Er gebnis, daß genau die Ereignisse, die von einem endlichen Automaten I) vgl. Moll, Arbib & Kfoury 1988, 40 u. 41. s. Hall Partee 1978, 145.
2)
3) Für weitere Ausführungen sei daher auf Hall Partee 1978, 149 ff4 Hersehe! 1974, 91 ff. sowie Moll, Arbib & Kfoury 1988, 34 ff. verwiesen.
104 akzeptiert werden, die regulären Ereignisse sind, welche durch reguläre Ausdrücke dargestellt werden. Bisher wurden vier Konzepte, die sich hinsichtlich ihrer Leistungsfähig keit als äquivalent erwiesen und zum Teil als Darstellungen verschiedener Sachverhalte entwickelt wurden, vorgestellt: die formalen Nervennetze, die logischen Netze, die endlichen Automaten und die regulären Ausdrük ke. Seit den fünfzige:r Jahren ist es üblich, davon auszugehen, daß der Mensch (bzw. das menschliche Gehirn) in stark idealisierter Form die logische Komplexität eines endlichen Automat aufweist. Untersucht wer den hierbei Zeit-diskrete, deterministische, informationsverarbeitende Sy steme. Die folgenden Annahmen sind hierfür von Bedeutung: 1 . Zeiteinheit und Taktfrequenz: synchrones Arbeiten auf einer diskreten Zeitskala (t0, t1 , ... , t0, ... ) ; 2. interne Zustände werden als Vermittler zwischen Eingabe-Ausga bebeziehung angesehen, sie repräsentieren vergangene Ereignisse bzw. die elektrophysiologisch meßbare Aktivität der Axone; 3. Endlichkeit der Eingaben, Ausgaben, internen Zustände sowie die Effektivität der Funktionen 8 , A; 4. zunächst externe, neurophysiologische Betrachtungsweise; 5. Determiniertheit: Die Eingabe und der Zustand des Systems bestimmen die Ausgabe und neuen Zustand des Systems. Das "Paradigma" der Forschungen in den 50er Jahren sei noch einmal anders formuliert: Seit 1956 wird aufgrund neurophysiologischer Untersu chungen des Nervensystems und Modellvorstellungen über das Verhalten des Neurons angenommen, daß die Funktionsweise des Gehirns sich mit automatentheoretischen Begriffen zureichend charakterisieren läßt und der endliche Automat das angemessene Konzept dieser Modeliierungen bildet. Diese Sichtweise wird besonders deutlich in der Einleitung zu dem von Claude Shannon und John McCarthy herausgegebenen Sammelband "Auto mata Studies" (Shannon & McCarthy 1956/1974, vi), in der auf Automa ten mit endlich vielen internen Zuständen Bezug genommen wird: In the
usual quantized model of this type, the automaton has a finite number of inputs and outputs and operates in a quantized time scale. Thus, such a device is characterized by two functions of the current state and in put, one function giving the next state and the other the next output. . .. , it should be remernbered that essentially all actual physical machines and even the brain itself are, or can be, reasonably idealized to be of this form. Neurophysiologists have proposed a number of models for the neuron and Kleene, in his paper, investigates the capabilities and Iimita tions of automata from these idealized components.
Wie ich gezeigt habe, handelt es sich um die Klasse der regulären Ereignisse (Mengen), welche durch die kompakten regulären Ausdrücke beschrieben und von der Klasse der endlichen Automaten akzeptiert werden.
105 2. 2. 4. 1. 2 Chomskys Konzept der grammatischen Regel als interne Repräsentation syntaktischer sprachlicher Strukturen
Kleene beschäftigte sich, wie ich zeigte, mit der logischen Charakteri sierung der Komplexität der in einem Organismus wie z. B. dem Gehirn darstellbaren Ereignisse. Vor diesem Hintergrund formuliert der Linguist Noam Chomsky seine sprachbezogene Forschungsarbeit. Er (vgl. bes. Chomsky 1964/1961) setzt die Ergebnisse Kleenes, nach denen die logi sche Komplexität des Gehirns der eines endlichen Automaten entspricht, mit den Forschungsergebnissen über die logische Komplexität natürlicher Sprachen, die als objektivierte Produkte der Leistungen des Gehirns ver standen werden, in Beziehung. Chomsky verbindet bei seinen Untersu chungen weiterhin die Erforschung der syntaktischen Struktur einer Spra che mit dem Konzept des "Kalküls" und des "formalen Systems", genauer des kombinatorischen Systems. Er zeigte auch, daß die statistisch-infor mationstheoretischen Verfahren, speziell das der Ma-rkov-Ketten, nicht ausreichen, um sprachliche Strukturen vollständig zu erfassen. Seine Untersuchungen der natürlichen Sprache ergaben, daß Grammatike:1, welche die Komplexität von natürlichen Sprachen charakterisieren, Eigen schaften aufweisen, die zu der Annahme führen, daß die Komplexität der von ihnen charakterisierten Sprachen so groß ist, daß. sie weder durch Markov-Ketten erfaßbar noch von einem endlichen Automaten akzeptier bar sein müßten.1 Gleichwohl wird an der Charakterisierung des menschlichen Gehirns als einem endlichen Automaten festgehalten und der Widerspruch, daß ein System, das nur Strukturen eines gewissen Komplexitätsgrades akzeptie ren kann, dennoch mit Strukturen arbeitet, die komplexer sind, durch die Einführung der Unterschiedung von Kompetenz und Performanz aufgehoben. Um diese Zusammenhänge einzusehen - sie spielen auch in der musik theoretischen Forschung 2 eine zentrale Rolle - soll Chomskys Theorie bildung hinsichtlich dieser Problemstellung vorgestellt werden. Noam Chomsky untersuchte die logisch-strukturelle Komplexität einer natürli chen Sprache, der englisch-amerikanischen, die als Produkt des menschli chen Geistes/Gehirns aufgefaßt wird. Er korrelierte seine Forschungser gebnisse zur Komplextität dieser natürlichen Sprache miit den gewonnenen 1) Noam Chomskys Argumentation wurde schon bald auch für den Bereich der Musik aufgegriffen und gegen die Beschreibung musikalischer Strukturen mittels Markov Ketten gerichtet (vgl. Livant 1961; Cohen 1963). Gleichwohl wurde gerade im Bereich der Komposition dieser Formalismus immer wieder eingesetzt (vgl. Moore 1990, 429-439 als jüngstes Beispiel aus dem Bereich der Komposition u. Lerdahl & Potard 1986, die eine kritische Erörterung des Einsatzes von Markov-Ketten für die Untersu chung kognitiv-musikalischer Strukturen geben).
2) Zu denken ist z. B. an die Forschungen zur nordindischen tabl a-Musik von Bernard Bel und Jim Kippen (s. Kap. 3. 1. 6, S. 234 ff.) und die Untersuchungen zum Kadenzkon zept von Pylkkö (s. Kap. 3. 1. I, S. 341 ff.).
106 Ergebnissen über die logische Leistungsfähigkeit des menschlichen Ge hirns, wie sie aufgrund der Arbeiten von McCulloch-Pitts und Kleene verstanden wurden. Seine Untersuchung gründet auf eine Kritik an der Unzulänglichkeit des elementaren stochastischen kommunikationstheoretischen Modells der Sprache, wie es in der Informationstheorie entwickelt wurde: der Mar kov-Kette. Noam Chomsky (1957, 20) spricht von finite state Markov processes (finite Markov-Ketten). Es handelt sich im Kern um stochastische endliche Automaten, deren Transitionen mit Übergangswahrscheinlichkeiten versehen sind, welche die stochastischen Prozesse charakterisieren. Chomsky merkt an, daß dieses Modell, obwohl seiner Meinung nach nicht ausreichend für die Charakte risierung der grammatisch-syntaktischen Komplexität einer natürlichen Sprache wie z. B. Englisch, dennoch ein mächtiges Mittel zur ideali sierten Beschreibung des Benutzers einer Sprache liefert: This conception
of language is an extremely powerful and generat one. If we can adopt it, we can view the speaker as being essentially a machine of the type considered. In producing a sentence, the speaker begins in the initial state, produces the first word of the sentence, thereby switching into a secend state which Iimits the choice of the second word, etc. Each state through which he passes represents the grammatical restrictions that Ii mit the choice of the word at this point in the utterance. In view of the generality of this conception of language, and its utility in such related disciplines as communication theory, it is important to inquire the con sequences of adopting this point of view in the syntactic study of some language such as English or a formalized system of mathematics.
Diesem Zitat ist zu entnehmen, daß Chomsky ein Modell der Sprach verwendung, oder, wie er (Chomsky 1963) später sagen wird, ein Modell der Performanz (das sich auf die Beschreibung der Sprachverwendung wie Produktion und Verstehen von Sätzen bezieht) von einem Modell unter scheidet, das die syntaktische Struktur einer Sprache bestimmt. Weiterhin deutet sich eine Beziehung zur Theorie formaler Systeme - der Theorie der Kalküle - an.1 Die Beziehung zu den formalen Systemen stellt Chomsky durch Benut zung einer speziellen Form von kombinatorischen Systemen her, mittels derer er die Konzepte "Grammatik einer Sprache L" und "Regel einer Sprache L" faßt. Classen (1976, 4-7) unterteilt formale Systeme in Kal küle und kombinatorische Systeme, wobei sich kombinatorische Systeme von Kalkülen im wesentlichen dadurch unterscheiden, daß ein kombinato risches System genau ein "Axiom" aufweist, während bei der Betrachtung 1) Die Stellung der von Noam Chomsky zur Explikation des Grammatik· und Regel· konzeptes herangezogenen Semi·Thue·Systeme innerhalb der Theorie formaler Systeme findet sich in Claasen 1976 dargestellt.
107 von Kalkülen meistens eine endliche Menge von "Axiomen" angenommen wird. Bei den kombinatorischen Systemen können Semi-Thue-, Thue-, Normal-, und Postsehe Systeme unterschieden werden. Bei den von Noam Chomsky benutzten Systemen handelt es sich im wesentlichen um eine modifizierte Form von Semi-Thue-Systemen� in die er die Unterscheidung von terminalen und nichtterminalen Symbolen ein führte, um das Konzept der Grammatik einer Sprache zu explizieren.2 Die Idee hierbei ist, daß die terminalen Zeichen, je nach Interpretations ebene, als Morpheme oder Wörter einer Sprache interpretiert werden können, wohingegen die nichtterminalen Zeichen die Klassifizierungen der syntaktischen Klassen einer Sprache wie Satz, Nominalphrase, Verbalphrase, Artikel, Verb, etc. darstellen? Die Phrasen-Struktur-Grammatik G einer Sprache - diese muß keine natürliche Sprache sein, man denke z. B. an eine Programmiersprache ist nach Chomsky ein Quadrupel (VN, VT, S, R) mit VN einer endlichen nichtleeren Menge von nichtterminalen Zeichen VT einer endlichen nichtleeren Menge von terminalen Zeichen S einem besonders ausgezeichneten Zeichen aus VN, dem Startsym bol oder "Axiom" R einer endlichen Menge von Regeln, auch Produktionen genannt, der Form (jl � ljl, wobei (jl und ljJ Zeichenketten über V VN v VT sind, für (jl E V • gilt und (jl mindestens ein nichtterminales Zeichen enthält, während ljJ e V � =
Eine Sprache wird als die Menge der Zeichenketten L(G) aufgefaßt, die mittels der angegebenen Regeln R vom Startsymbol S ausgehend ge wonnen werden können und deren Ketten nur aus Terminalsymbolen be stehen. Ein kleines Beispiel soll die bisher eingeführten Konzepte illustrieren.4 Die Grammatik GL ( { S }, { a }, {S ---? aS, S � a}) erzeugt die Sprache L(GL) {a, aa, aaa, .. } = {t I t e VT* und t wurde mittels der Regeln aus S abgeleitet, d. h. S � * t, t an mit n � 1}. =
=
.
=
I) vgl. Classen 1976, 13; Nelson 1968, 87 ff. 2) vgl. Seifert 1986, 61 ff. 3) Man vgl. neben Chomsky 1956/1975, 1957, 1959, 1963, 1965 auch Nelson 1968, 335 ff. , Levelt 1974, besonders Bd. I ; Classen 1976 gibt eine ausführliche Darstellung der Verän· derung der unterschiedlichen Definitionen und Klassifizierungen der Grammatiken,
Sprachen und Automaten bei Chomsky 1959, 1963 als auch bei anderen Autoren; Hall
Partee 1978; Moll, Arbib & Kfoury 1988, 3 ff. u. 145 ff. für eine prägnante Darstellung formaler linguistischer Ansätze und der neueren Theorie Chomskys; Volker Beeh 1977 diskutiert nach einer kurzen Einführung in die formalen Konzepte auch deren philoso phische Bedeutung für die Sprachforschung. 4) vgl. Levelt 1974, 22.
108 Es handelt sich um eine reguläre Grammatik, die einem endlichen Au tomaten äquivalent ist, d. h., die von ihr generierte Sprache kann von ei nem endlichen Automaten akzeptiert werden. Wie ist nun die formale Beziehung zum Konzept des Automaten? Die Grundidee ist die folgende: Werden die nichtterminalen Zeichen als Zustände und die terminalen als Kantenbeschriftung eines Automaten interpretiert, so ergibt sich fol gende Darstellung eines (endlichen) Automaten\ den man sich als System vorstellt, das ein in Felder eingeteiltes Band liest?
crp lsß 11sß2l · · · lsßil · · ·l sßml begrenztes Band
sß1sß 2... sßm des Eingabealphabetes I = {s11 s2, ... ,
Auf dem Band befindet sich eine zusammenhängende Zeichenkette c:l = sn } Es wird pro Feld ein Zeichen eingetragen und der "Lesekopf" auf das erste Zeichen der .
Zeichenkette gesetzt.
Die Regeln sind in dem Kasten des Lesekopfes gespeichert. Der Auto mat befindet sich im Anfangszustand und nimmt, abhängig vom gelesenen Zeichen, gemäß den Regeln einen neuen Zustand ein und bewegt sich ein Feld weiter. Ist die Kette noch nicht ganz gelesen aber keine Regel mehr anwendbar, blockiert der Automat, und die Kette ist nicht akzeptiert. Ist das Feld mit dem letzten Zeichen der Zeichenkette erreicht und nimmt der Automat nach dem Lesen einen Endzustand ein, dann gilt die Kette als akzeptiert. Eine andere Sichtweise ist ebenfalls möglich: der Automat wird als Generator betrachtet.3 Das System aus Lesekopf und Band ist wieder das näheres bei Hersehe! 1974. Chomsky 1963, 331-335. vgl. auch Abschnitt 2. 2. 3. 2. 1, S. 88 ff. In der Abbildung befindet sich der Automat der zu im Anfangszustand qo und liest das auf dem Band stehende erste Zeichen lesenden Zeichenkette o. Danach geht er gemäß einer Regel in einen neuen Zustand q', und der Lesekopf bewegt sich ein Feld nach rechts - oder äquivalent: das Band wird ein Feld nach links bewegt -, um das nächste Zeichen zu lesen. Diese Arbeitsweise wird fortgesetzt, bis keine Regel mehr anwendbar ist. Die Zeichnung wurde Chomsky 1963, 332 u. Hopcroft & Ullman 1979, 17 folgend angefertigt. 3) Eine Beschreibung des endlichen Automaten als Generator findet sich in Gross 1972, 81 ff. Eine etwas andere Definition im Zusammenhang mit diesen beiden Sichtweisen des endlichen Automaten als Generator oder Akzeptor s. Chomsky 1963, 331 ff.
1) 2)
Sßt
109 gleiche, nur ist das Band zu Beginn leer. Der Automat befindet sich wieder im Anfangszustand, schreibt ein Symbol auf das Band und geht in einen weiteren Zustand über. Um zu erkennen, wann das Schreiben einer Zeichenkette beendet ist, kann ein zusätzliches Endzeichen, z. B. % , eingeführt werden, das immer dann auf das Band geschrieben werden soll, wenn das Generieren der Zeichenkette beendet ist. Chomsky (1963, 332) beschrieb demgemäß das Verhalten eines Automa ten durch eine endliche Menge von Tripein der Form (q, s1, q') mit 1 ,;: i :�: n, die entsprechend interpretiert werden: I n der ersten Interpretation sind sie zu lesen als: der endliche Automat befindet sich in Zustand q, liest das Zeichen s;. geht in den Zustand q' und bewegt sich ein Feld nach rechts. Die Variante wird entsprechend gelesen: Der endliche Automat befindet sich in Zustand q, schreibt das Zeichen s; in ein Feld des Bandes, geht in den Zustand q' und bewegt den Schreib-Lesekopf ein Feld nach rechts. Die Beziehung zu Grammatiken wird ersichtlich: Haben wir bei der Grammatik die Regel A � bB, so kann die Regel für einen Automaten1 qs � q' geschrieben werden, wobei z. B. der Zu stand q dem nichtterminalen Zeichen "A" entspricht, und bei der Regel A � b muß gegebenenfalls ein Endzustand eingeführt werden qb �qe.2 Chomsky (1957, 21 u. 22) zeigte, daß die englische Sprache nicht durch rechtslineare bzw. reguläre Grammatiken beschrieben werden kann und somit keine reguläre Sprache - d. h. keine finite state Janguage - ist. Grundlegend für seine Argumentation ist das Selbsteinbettungsargument. Eine Grammatik G wird als selbsteinbettend bezeichnet, wenn es ein nichtterminales Zeichen A und Zeichenketten a: , ß E v• mit einer Ablei tung A � * a:Aß gibt. Das nichtterminale Zeichen A wird im Laufe einer Ableitung mittels Regelanwendungen durch eine Zeichenkette ersetzt, in der es in der "Mitte" auftritt. Reguläre Grammatiken sind somit ausge schlossen, da z. B. die nonterminalen Zeichen immer nur am Ende auf treten (vgl. A � aB). Eine Sprache L ist selbsteinbettend, wenn alle ihre Grammatiken selbsteinbettend sind (vgl. Chomsky 1963, 394 ). Die Grammatik mit den Regeln S � aSa, S � a, S � aa ist selbsteinbettend, ihre Sprache L = { a, aa, aaa, . .. } jedoch nicht, da die zu Anfang gegebene reguläre Grammatik sie ebenfalls erzeugt. Endliche Automaten akzeptieren genau die "regulären" Sprachen (Ereig nisse, finite state languages), die von den regulären Grammatiken erzeugt werden, d. h. selbsteinbettende Sprachen werden von ihnen nicht akzep tiert. Ohne in die Tiefe dieser Argumentation zu gehen, soll kurz Chom skys (1957, 21 u. 22) Strategie vorgestellt werden. Die Grammatik GS = ({ S } , { a, b } , S, { S __. ab, S � aSb } ) ist I) näheres hierzu findet sich
n i
Abschnitt 2. 2. 3. 2. 1, S. 88 ff.
2) Eine andere genauere Formulierung gibt Chomsky 1963, 369 in bezug auf seine Definition des endlichen Automaten, ebenda S. 333 ff.
110 selbsteinbettend und kann nicht durch eine reguläre Grammatik ersetzt werden. Die von ihr generierte Sprache ist L(GS) { anbn I anbn E VT+ , n � 1 } d . h. die Menge {ab, aabb, aaabbb, .. } . Sie wird von einer Grammatik erzeugt, die zu einer speziellen Klasse (echten Teilmenge) der kontextfreien Grammatiken gehört: den linearen Grammatiken. Die Regeln der kontextfreien Grammatiken (Chomsky 1963, 366) zeigen die Form cp � q, mit der Einschränkung cp A, d. h., das Antezedens der Regel besteht aus einem nichtterminalen Zeichen und cp ist eine beliebige Zeichenkette aus v•. Die kontextfreien Grammatiken können durch ein Umformungsverfahren in die sogenannte Chomskysche Normalform ge bracht werden.1 Chomsky2 spricht von der Normalform, deren Regeln die Form A �Be und A �a aufweisen. Bei den linearen Grammatiken wird q, eingeschränkt auf die Form q, = xBy mit x,y E VT + und B E VN, d. h., die Zeichenkette q, enthält genau ein nichtterminales Zeichen und links und rechts terminale Zeichenketten, oder sie hat die Form q, = x mit x E VT+ , d. h. sie besteht nur aus einer Kette terminaler Zeichen. Schränkt man diese Form weiter wahlweise auf entweder \jJ = xB und q, g-linearen = x oder q, = Bx und q, = x ein, so erhält man die einseiti Grammatiken, die entsprechend der Stellung des nichtterminalen Zeichens als rechtslineare bzw. linkslineare Grammatiken bezeichnet werden (vgl. Chomsky 1963, 369). Durch einfache Umformung dieser Regeln wird die Klasse der regulären Grammatiken erhalten, bei denen q, = aB oder q, = a ist, d. h. q, nur aus einem terminalen Zeichen oder einem terminalen Zeichen gefolgt von einem nichtterminalen Zeichen besteht, bzw. q, Ba oder q, a ist. Die regulären und die einseitig-linearen Grammatiken charakterisieren dieselbe Klasse von Sprachen: die regulären Sprachen (finite state languages). L(GS) kann also nicht durch eine einseitig-lineare Grammatik bzw. reguläre Grammatik bestimmt werden und gehört daher nicht zu der Klasse der regulären Sprachen. Finden sich Strukturen in einer natürlichen Sprache, die eine Beschrei bung durch mindestens lineare Grammatiken erfordern und deren Darstel lung durch einseitig-lineare Grammatiken wie z. B. bei der Sprache L(GS) nicht möglich ist, so ergibt sich das Problem, daß ein endlicher Automat (das Gehirn) Strukturen zu akzeptieren und generieren hat, die er nicht verarbeiten kann. Die Kernaufgabe einer Grammatik ist es, Sätzen Struk turbeschreibungen (P-Marker ; Ableitungsbäume) zuzuordnen� In der englischen Sprache läßt sich beispielhaft eine syntaktische Struktur auf zeigen, welche die Struktur der eben erwähnten Sprache L(GS) aufweist.4 =
.
=
=
=
1) Levelt 1974, 17-19 erläutert dieses Verfahren. 2) Chomsky 1963, 393 gibt eine Zusammenfassung der von mir im folgenden geschil derten Beziehungen zwischen den Grammatiktypen. 3) Die Aufgaben einer grammatischen Sprachtheorie finden sich in Chomsky 1963, 276 bes. 285 u. 363. formuliert. 4) vgl. Moll, Arbib & Kfoury 1988, 163; Chomsky 1963, 286.
111
Nehmen wir a = NP (Nominalphrase) und b = VP (Verbalphrase), dann zeigt der Satz "The boy died" die Struktur [s NP VP ]. Durch syntakti sche Selbsteinbettung ergibt sich z. B. der Satz "The boy that the dog bit died", welcher die Strukturbeschreibung (Phrase-Marker) Cs NP [s NP VP ] VP ] erhält. In dem Satz "The boy that the dog that the horse kicked bit died" zeigt sich eine weitere Selbsteinbettung. Er erhält die Struktur beschreibung: [s NP [s NP [s NP VP ] VP ] VP ]. Bei zunehmender Schachtelungstiefe nimmt allerdings die Verständlich keit ab, so daß ab einer bestimmten Grenze n zu erwarten ist, daß der Hörer solch einen Satz ohne zusätzliche Hilfsmittel nicht mehr versteht. Es handelt sich hier um ein psychologisches Problem, das allerdings keine gram matischen Grenzen motiviert. Es ist daher angebracht davon auszugehen, daß es für dieses Satzbil dungsverfahren prinzipiell keine Grenze geben kann, denn: warum sollte diese Satzstruktur, die bis zur 499. Einbettung als grammatisch galt, ab der 500. Einbettung ungrammatisch sein, nur weil niemand mehr versteht, worum es in diesem Satz geht? Wird dies akzeptiert, so ist klar, daß ein endlicher Automat nicht in der Lage ist, Sätze dieser Struktur zu ver stehen bzw. zu analysieren, wenn die Satzstruktur nicht auf eine Einbet tungstiere n eingeschränkt wird. Wir erinnern uns, daß das Gehirn durch einen endlichen Automaten modelliert wurde und nur in der Lage ist, reguläre Ereignisse intern zu repräsentieren. Außerdem scheint es vernünftig, anzunehmen, daß das menschliche Gedächtnis endlich ist. Wir stehen also vor dem Problem, wie ein endlicher Automat (das Ge hirn des Menschen bzw. das endliche menschliche Gedächtnis) Strukturen produzieren und verstehen kann, die seine Leistungsfähigkeit übersteigen. Auch Chomsky bezog dieses Problem in seine Überlegungen ein und führ te eine Lösung herbei, indem er zwischen Kompetenz und Performanz unterschied. Noam Chomsky (1963, 390) zieht folgenden Schluß: We have
seen that a finite automaton can be represented as a one-sided linear grammar and that such a device is much more restricted in generative Capacity than a contex.t-free or even a linear grammar may be. We have also observed that such elementary formal properfies of natural langua ges as recursive nesting of dependencies make it impossible for them to be generated by finite automata, although these properlies do not exclu de them from the class of contex.t-free (even linear) languages. From these Observations we must conclude that the competence of the native speaker cannot be characterized by a finite automaton. The grammar stored in his brain cannot be a one-sided linear grammar, ... Neverthe less, the performance of the speaker-hearer must be representable by a finite automaton of some sort. The speaker hearer has only a finite memory, a part of which he uses to store the rules of his grammar (a set of rules for a device with unbounded memory), and a part of which
112 he uses for computation in actually producing a sentence or "perceiving" a structure and understandins it.1 Obwohl Chomsky nachwies, daß die Typ-3 Grammatiken2 und struktu rell auch die Markov-Prozesse als endliche Automaten aufgefaßt werden können, und er außerdem zeigte, daß die Typ-3 Grammatiken nicht aus reichen, die syntaktische Komplexität einer natürlichen Sprache zu be schreiben, blieb er bei seiner Überzeugung, daß das menschliche Gehirn bzw. kurz, der Mensch, ein endlicher Automat ist. So ist auch seine Äußerung (1957, 23) in den 'Syntactic Structures' zu verstehen: Hence it seems quite clear that no theory of linguistic structure based exclusively (Hervorhebung U. S.) on Markov process models and the like, will be able to explain or account the abi/ity of a speaker of Englisch to produ ce and understand new utterances, while he rejects other new sequences as not belonging to the language. Neben dem "Kreativitätsargument" impliziert diese Äußerung m. E., daß Chomsky die Anwendung stochastischer kommunikationstheoretischer Mo delle zur psychologischen Modeliierung des Sprachverhaltens - der Per formanz - für sinnvoll und fruchtbar hält, jedoch nicht zur Erklärung und Beschreibung komplexer syntaktischer natürlichsprachlicher Strukturen, die in Form der Kompetenz diesem Verhalten zugrundeliegen. Chomsky und andere Forscher, die exakt beschreibbare, interne for male Repräsentationen für einen kognitiven Bereich eines Organismus an nehmen, müssen über den Widerspruch Aufschluß geben, daß ein Organis mus objektivierte Strukturen erzeugt und versteht, die seine "logische" Leistungsfähigkeit überschreiten. Wie ist dieses Problem zu lösen? Einmal durch Benutzung mächtigerer Modelle wie z. B. der Turingmaschine; wobei sich die Frage stellt, ob das unendliche Band als die Umwelt oder als Teilbereich des Gehirns zu interpretieren ist. Als Umwelt, die zusätzliche Hilfen zur Verfügung stellt, mag diese Idealisie rung noch einsichtig erscheinen (man denke an einen Rechnenden und sein Rechenpapier), jedoch als Teil des Gedächnisses, das biophysikalisch im Gehirn realisiert gedacht wird, scheint diese Idealisierung nicht haltbar. Andererseits wäre es auch nicht vernünftig anzunehmen, jemand, der z. B. die Multiplikation erlernt hat, hätte ein Verfahren erlernt, das ihm nur erlaubt, Zahlen bis zu einer gewissen Grösse zu multiplizieren, wobei die
1) Der Mechanismus mit dem unbeschränkten Gedächtnis ist die Turing-Maschine mit unendlichem Band (vgl. Abschn. 2. 2. 4. 3, S. 127 ff.). Chomsky verlagert also sowohl die Regeln einer Turingmaschine (... rules of his grammar __) als auch deren Band (... a part
which he uses for computation _.) "in das Gehirn", nur ein Band endlicher Länge zur Verfügung steht.
so
daß für die Berechnungen immer
2) Es handelt sich um die regulären Grammatiken, welche die finite state Janguages
(reguläre Sprachen bzw. regulären Ereignisse) beschreiben. 3) Die Turingmaschine wird in Kap. 2. 2. 4. 3, S. 127 ff. vorgestellt.
113 Anwendung des Verfahrens von der internen Speicherkapazität abhängig wäre. Man wird also nicht annehmen daß, wenn aufgrund der Speicherka pazität n nur Zahlen einer bestimmten Größe muHtpliziert werden können, bei Erhöhung der Speicherkapazität auf n + m das alte Verfahren geän dert werden, d. h. ein neues Regelsystem eingeführt und die Maschine vollständig neu entworfen werden müßte, um größere Zahlen zu multiplizieren. Dies gilt natürlich auch für andere kognitive Bereiche, von del)en exakt beschreibbare interne Repräsentationen wie z. B. Regelsysteme angenom men werden und macht es sinnvoll, eine Unterscheidung von Kompetenz und Performanz einzuführen? Ein kurzer Rückblick soll die wichtigsten Ergebnisse zusammenfassen: Chomsky (vgl. z. B. 196111964) ging von der durch die Arbeiten von McCulloch und Pitts (1965/1943) und Kleenes (195111956/1974) neurophy siologisch gesicherten "realistischen" Annahme aus, daß das menschliche Gehirn (bzw. die in einem Teilbereich desselben gespeicherten Regeln und ein weiterer Bereich ft.ir die notwendigen Berechnungen) die logische Komplexität eines endlichen Automaten aufweist und nicht von der "unrea listischen" Annahme, daß es sich um eine (allgemeine) Turingmaschine handele: hierbei verlagert er auch das Band des Systems Turingmaschine ins Gehirn. Außerdem wies er nach, daß eine natürliche Sprache in eine Komplexi tätsklasse fallen muß, die unter gewissen ldealisierungen die strukturelle Komplextitätsklasse der regulären Ereignisse, die von einem Organismus intern repräsentiert werden können, eindeutig überschreitet. Noam Chom sky (1961/1964, 125) schreibt: A set of sentences cannot be represented by a finite automaton (i. e. is not a regular event) just in case alt of its constituent structure grammars contain self-embedding symbols. Chomsky (vgl. 1963, 329 u. 330) führte daher die Unterscheidung in Kompetenz- und Pe"rformanzmodelle ein, wobei logisch die Kompetenzmo delle Vorrang vor den Performanzmodellen haben, da sie die potentiellen objektivierten Strukturen, die ein kreativer Organismus verarbeiten könn te, beschreiben. Abstrakte Performanzmodelle müssen Limitationen in der Größe dieser potentiellen Strukturen ermöglichen. Chomskys2 Argument hierfür wird am Beispiel mathematischer Opera tionen entwickelt und macht indirekt von dem Ergebnis Gebrauch, daß ein endlicher Automat prinzipiell nicht in der Lage ist, zwei beliebig große Zahlen zu multiplizieren? was natürlich genau so erstaunlich ist wie das Ergebnis, daß natürliche Sprachen von einem endlichen Automaten nicht akzeptiert werden können, wenn man annimmt, daß der Mensch ein endliI) s. auch die interessanten kritischen Erörterungen von Kripi<e 1988, 44 ff. zu diesem Problemkomplex. 2) Dieses Argument wird ausführlicher in Miller & Chomsi
114 eher Automat ist, der aber doch multipliziert. Chomsky versteht den Kompetenzbegriff auch als unterbewußtes Wis sens über einen Gegenstandsbereich (knowledge of a Janguage; knowledge of multiplication). Dies kann so verstanden werden, daß ein Mensch im Laufe seines Lebens Regeln erworben hat, die ihn befähigen, die Multi plikation auszuführen. Zumeist kann er diese Regeln nicht explizit ange ben, sie bilden jedoch die interne Repräsentation (Chomsky 1966/1971, 93 u. 94) des Organismus, das unterbewußte Wissen über das Verfahren der Multiplikation. Es handelt sich um prinzipielle Prozesse derart, daß ein Mensch zwar jede Multiplikation durchführen kann, andererseits aufgrund der Begrenztheit seines Gedächtnisses sicherlich nur in der Lage ist, sich Zahlen einer gewissen Größe als Zwischenergebnisse zu merken. Prinzi piell sollte es aber möglich sein, das "Gedächtnis" zu erweitern, ohne daß das grundlegende, repräsentierende Regelsystem neu entwickelt werden müßte. Da ähnliches für die Sprache und andere kognitive Phänomene von Or ganismen gilt, spricht Chomsky bei diesem Wissen über einen Gegen standshereich von der Kompetenz des Organismus in bezug auf diesen Gegenstandsbereich. Diese Unterscheidung von Kompetenz und Performanz ist für die Kognitionswissenschaft zentral. Chomsky sieht den Aufbau einer allgemeinen linguistischen Theorie so, daß neben der expliziten Spezifikation ( � der Generierung, d. h. der Aufzählung) von Sätzen und deren struktureller Beschreibung ( � P-Mar ker oder Ableitungsbaum) einer bestimmten Sprache durch eine Gramma tik, diese eine Theorie der Sprache bzw. des menschlichen Sprachvermö gens sein sollte, die folgenden Kriterien Genüge leisten müßte: ... the
theory of grammar should meet requirements of the following kind. It should make available: a class of possible grammars CJ, C2, ... , (Ja) a class of possible sentences sJ, s2, ... , (Jb) a function / such that j{r; J) is the set of structural descriptions of the sentence si that are provided by the grammar Cj, (Je) a function m(r) which evaluates Ci (Jd) a function g such hat g{r; n) is the description of a (Je) finite au tomaton that takes Sentences of (Jb) as input and gives structural descriptions assigned to the sentences by Crammar Ci (i. e. various, perhaps alt members of j{r; ;) as output, there n is a parameter de termining the capacity of the automaton. Dies wäre die Chomskysche Theorie in Grundzügen. la, b, d ent spräche dem Erwerbsmodell; la und l c dem Kompetenzmodell und l e enthält erste Schritte zu einem PerformanzmodelL Wie zu sehen, hebt Chomsky für ein Performanzmodell (le) hervor, daß es sich bei g(i, n) um einen endlichen Automaten handeln muß. Mit n
115 wird die Leistungsfähigkeit des endlic.hen Automaten bestimmt, denn es ist für ihn durchaus möglich, Sätze mit einer Selbsteinbettung bis zum Grade n zu analysieren bzw. Zahlen bis zu einer bestimmten Größe zu multiplizieren.! Zentral für die Behauptungen Chomskys2 ist die Aussage: (4) There is a mechanical procedure g such that where Ci is a consti
tuent structure grammar, g(i, n) is the description of a finite automaton which given a string s as input, will give as output all P-Markers of degree < n assigned to s by Ci. Chomsky (196111964, 125) fügt zwei Interpretationen hinzu: .. , Eq (4) provides a program for a generat purpose computer such that when the rules of a constituent structure grammar C are put in memory and the size of memory is fixed, the "device" will understand any sentence generated by C that does not contain too much nesting of constituents of a single type. This device, is, furthermore, optimal. That is, ... that the construction g cannot essentially improved upon. Jf a grammar generates P-markers of arbitrary degree, there will not, in general, exist a finite device that will accept (produce) just the sentences of the language specified by C. Therefore, the procedure g gives the best possible way of meeting the requirement of equation 1(e), in the case of the linguistic theory that Iimits grammars to context-free constituent structure gram mars. The automaton fails only where success in principle is unattainable.
Da in den vorangehenden Abschnitten gezeigt wurde, daß das Verhalten der Computerschaltkreise (logischer Netze) und der Nervennetze auf ab strakter Ebene logisch äquivalent ist und durch das Konzept des endlichen Automaten erfaßt wird, so verwundert es nicht mehr, wenn Chomsky (1961/1964, 125), zur zweiten Interpretation kommend, fortfährt: We may think of the automaton g(i, n) as being, indifferently, a model for the speaker or hearer who knows and uses the grammar Ci but has a finite memory that determines the permitted degree of self-embedding n. Of course, if the memory restriction is relaxed by allowing more time or computational ·aids, the bound increases.
Chomsky (1961/1964, 125) warnt jedoch davor, dieses Modell als reali stisches Performanzmodell anzusehen, da zuviele Aspekte, die für den Wahrnehmungsprozess bedeutend sind, keine Berücksichtung finden. Ein psychologisches Wahrnehmungsmodell eines kognitiven Bereiches muß sich jedoch mit diesen von Chomsky (1961/1964, 125) angesprochenen theore tischen Problemen auseinandersetzen, wenn es selbst einen realistischen Anspruch geltend machen will: It should be reemphasized that g(i, n) as it stands is by no means a realistic modell of the speaker or hearer who has mastered the grammar Ci, but at most, a first step toward such a model.
Daß es sich hierbei um ein grundlegendes Problem kognitionswissennäheres vgl. Chomsky 1963, 396-401, bes. S. 400. Chomsky 1961/1964, 125. Dieser Gedanke wird besonders in Chomsky 1961/1964, 125 ff. entwickelt. Das effektive Verfahren g wird in Chomsky 1963, 396-401 dargelegt. 1)
2)
116 schaftlieber Forschung (und somit auch der Kognitiven Musikwissenschaft) handelt und nicht als historisch veraltet gelten sollte, scheint offenkundig, soll aber durch ein weiteres Zitat aus der sprachwissenschaftlichen For schung der KI untermauert werden. Es dürfte aber inzwischen einsichtig sein, warum die folgende Forderung von Koskenniemi 1983 an Sprachpro duktions- und Erkennungsmodelle gestellt wird:1 [Criterion of} Reducibi lity to finite state automata: A model of the recognition andI or producti on processes should be simple enough to be simulated with finite state automata. A model satisfying this criterion has the advantage that we can speculate that neural networks could perform the same task as the model . . Wie wir sehen, verbindet Chomsky in seiner Grammatiktheorie die Idee der Grammatik (als Kompetenz) mit dem endlichen Automaten (als Mo dell der Performanz, als Annäherung an eine psychologische Modellbildung des Produktions- oder Rezeptionsprozesses). Zwei Problembereiche zeich neten sich ab, die im folgenden noch zu erörtern sind. Zum einen kann man sich die Frage stellen, ob man alle Prozesse, die exakt zu beschrei ben sind, schon durch das Konzept des endlichen Automaten erfassen kann, was nach den bisherigen Erörterungen zweifelhaft ist: es konnte ei ne Grammatik angegeben werden, deren Sprache nicht von einem endli chen Automaten erzeugt oder akzeptiert werden konnte. Welches ist nun das Mittel, mit dem alle exakt beschreibbaren Prozesse erfaßt werden? Es stellt sich heraus, daß es sich um das Konzept des Algorithmus han delt, das seine Explikation, wie zu zeigen sein wird, durch das Konzept der Turingmaschine erhält. Handelt es sich hierbei um theoretische Un tersuchungen, die von philosophisch-epistemologischer Bedeutung sind, aber, denkt man an die bisherigen Erörterungen, für praktische Forschun gen nur den Rahmen abstecken können, so stellt sich gerade für psycho logische Modeliierungen die Frage, wie der Wahrnehmungsprozess denn zu modellieren und ob nicht doch ein Überschreiten der logischen Kom plexität des endlichen Automaten möglich sei? Erste Hinweise auf die Modeliierung des Wahrnehmungsprozesses gibt Chomsky selbst. Er stellte fest, daß eine psychologische Wahrnehmungstheorie auf der Sichtweise der "Wahrnehmung als Hypothesenbildung" aufgebaut werden muß� Diese über Craik (1943) auf Helmholtz' Idee des "unbewußten Schließens" zurückführbare Interpretation des Wahrnehmungsvorganges bildet den Kern informationsverarbeitender Wahrnehmungstheorien und dürfte gegenüber anderen Theorien zu bevorzugen sein.3 Chomsky .
1)
zitiert nach Barton, Berwick & Ristad 1987, 148.
2) Die Betrachtung des Wahrnehmungsprozesses als Hypothesenbildungsprozess wurde
der Linguistik auch als analysis by synthesis bezeichnet (vgl. Halle & Stevens 1964). Hermann von Helmholtz (vgl. besonders Helmholtz 1867/1896, 602 u. 612) ent wickelte die Vorstellung des Wahrnehmungsvorganges als einem "unbewußten Schlies
in 3)
sen" in seinem "Handbuch der Physiologischen Optik", das zuerst 1867 erschien und
117 ( 1959/1964, 546) bringt ebenfalls zum Ausdruck, daß ein information processing system nichts anderes sei als ein hypothesis formation system. Wahrnehmung wird verstanden als ein Prozeß der Hypothesenbildung aufgrund sensorischer Daten, der durch symbolische Schlußprozesse aus verschiedenen Hypothesen durch Überprüfung die adäquateste auswählt. Daher ist für diese Forschung nicht so sehr die Frage der physiologischen Realisierung von Bedeutung, sondern - so Gregory (1'974, 280): Just how
the nervaus system represents the logic is a secondary - though cer tainly important - question: What is performed must be first understood.
Chomsky (1963, 3 1 8 u. 319) beschrieb diesen theoretischen Ansatz in Zusammenhang mit einem Modell der Spracherkennung : We might imagine
a sentence-recognizing device (that is to say, a perceptual model) that incorporates both the generative rules of the grammar and a heuristic component that samples an input to extract from it certain cues relating to the rules used to generate it, selecting among alternative possibilities by a process of successive approximation. .. . On the basis of the sam pled cues, a hypothesis can be formulated about the spoken input; from this hypothesis an internal representation can be generated; by compari son of the input and the internally generated representation the hypo thesis can be tested; as a resuZt of the test, the hypothesis can be ac cepted or revised (. . .).
Eine Arbeit, welche die Idee des Testens und Veränderns in den Vor dergrund stellt und ein Beschreibungmittel dieser Vorgänge angibt, ist die von Miller, Galanter und Pribram (1960/1970). Sie gilt als die Arbeit, mit der sich in der amerikanischen Psychologie die Abkehr vom Behavioris mus durchzusetzen begann und eine Hinwendung zur kognitiven psycholo gischen Forschung erfolgte. Ihr Beschreibungsmittel zum Testen und Ver ändern von Hypothesen, der PLAN, soll daher als nächstes vorgestellt werden, bevor ich mich dem Konzept des Algorithmus zuwende. Es wird sich zeigen, daß auch dieses Konzept dem endlichen Automaten äquivalent ist.
mehrere Auflagen erlebte. Eine prägnante Formulierung seiner Theorie des "unbewußten Schließens" gibt er in den "Tatsachen der Wahrnehmung" (Helmholtz 1878, 26 u. 27). Eine Diskussion verschiedener theoretisch-psychologischer Richtungen, wie die Gestalt theorie, den Gibsensehen Ökologischen Realismus, den Hebbschen phase-sequences, die "Hypothesenbildungs"-These, etc., zur Erklärung des Gregory 1974. R. L.
Wahrnehmungsphänomens
gibt
Gregory 1974 legt weiterhin überzeugend dar, inwiefern die
Hypothesenbildungsannahme in Verbindung mit dem "unbewußten Schließen" und den Hebbschen ceJJ-assemblies und phase sequences den Erklärungen des Wahrnehmungs prozesses durch andere psychologische Richtungen, wie z . B die Gestalttheorie und den Ökologischen Realismus, überlegen ist.
118 2. 2. 4 . 2 TOTE-Hierarchien, Flußdiagramme und endliche Automaten in der "informationsverarbeitenden" Kognitiven Psychologie
Von George A. Miller, Eugene Galanter und Karl Pribram wurde in die psychologische Forschung die Idee der formalen Darstellung von Plänen, Intentionen und Zielien eingeführt, welche durch einen Test-Operate Test-Exil-Prozess (TOTE-Prozess) ihre Erklärung fanden. Ihr Forschungs ansatz wurde als "kybernetische Modellierung" und in der psychologischen Forschung als "subjektiver Behaviorismus" bezeichnet.1 Es wird in diesem Zusammenhang auch von information processing theories gesprochen (Ne weH & Sirnon 1963, 424 ). Ihre Arbeit gilt als eine der ersten der Kogni tiven Psychologie. Noch 1971 bezieht sich der Hirnforscher Pribram auf den in ihr entwickelten Beschreibungsmechanismus der TOTE-Einheiten. Mit dem Konzept des PLANES sollte eine Synthese des behavioristi schen Standpunktes, der Beschreibung von Verhalten, mit der introspekti ven Psychologie, die an inneren psychischen Erscheinungen interessiert ist und introspektiv gewonnene Aussagen über diese Phänomene zulässt, er reicht werden. Darüber hinaus sollten mit diesem Konzept nicht nur psy chische Zustände beschrieben, sondern auch die Prozessualität der Zu standsänderungen, wie sie Brentano in seinem "Aktkonzept" zu fassen suchte, einer Beschre,ibung zugänglich gemacht werden. Die grundlegenden Konzepte, die diese Verbindung ermöglichen sollen, sind die des "Planes" (Plan) und des "Bildes" (Image).2 Ein PLAN, welcher der vollständigen Beschreibung des Verhaltens eines Organismus dient, wird von ihnen3 wie folgt definiert: Plan. . . . a hierar chy of instructions. A Plan is any hierarchical process in the organism that can control the order in which a sequence of operations is to be performed. A Plan is, for an organism, essentially the same as a pro gram for a computer, especially if the program has the sort of hierar chical character as described.
Ein PLAN ist für die Kontrolle des sequentiell-hierarchischen Verhal tensablaufes zuständig. Die "inhaltlichen" Kriterien der Überprüfung der Bedingungen werden aufgrund eines internen Modells definiert, das ein Organismus von sich und seiner Umwelt gebildet hat; sie dienen als Leit faden für Operationen, die darauf abstellen, gewisse Diskrepanzen, die der Organismus aufgrund seines internen Modells und der eingegangen In1) Der Terminus "subjektiver Behaviorismus" wurde von den Autoren selbst kreiert. Miller, Galanter & Pribram 1960/1970, 26; 211 ff. Mir lag die unveränderte Ausgabe des Buches von 1970 vor, das 1960 zum ersten Mal erschien. In einigen Fällen ergänze ich die Verweise auf die englische Originalausgabe durch Hinweise auf die entsprechenden Stellen in der deutschen Übersetzung aus dem Jahr 1973. 2) vgl. Miller, Galanter & Pribram 1960/1970, 16 u. 19; 1973, 25 u. 27. 3) s. Miller, Galanter & Pribram 1960/1970, 16.
119 formationen festgestellt hat, zu minimalisieren. Das modifizierbare interne Modell, mit dem die eingehenden Informationen verglichen und aufgrund dessen Hypothesen aufgebaut, Handlungsfolgen geplant, in dem Pläne entwickelt, verändert, integriert und mit Namen bezeichnet werden, wird von Miller, Galanter und Pribram (1970, 17 u. 18) als Bild bezeichnet: Image. The Image is all the accumulated, organized knowledge that the organism has about itself and its world. The image consists of a great deal more than
imagery,
...
lt
includes
everything
the
organism
has
learned - his values as weil as his facts - organized by whatever con
been able to master. Beeinflußt wurden sie durch Ideen von Warren Stur.gis McCulloch, Ken neth Craik, Donald Mackay, Marvin Minsky, Noam Chomsky und vor al lem von Allen Newell und Herbert A. Simons information processing language.1 Letztere ist eine Listenverarbeitungssprache, deren grundle gende Datenstruktur die Liste ist, für Modeliierung und Beschreibung kognitiver Prozesse? Miller, Galanter und Pribram identifizierten ihren "PLAN" mit der Idee des "Programmes", das ebenso wie der Plan als Beschreibung und Steuerung von Prozessen verstanden werden kann. Eine nähere Beschreibung erfährt diese Idee des Planes durch soge nannte TOTE-Einheiten (Test-Operate-Test-Exit-Einheiten); ein PLAN ist eine hierarchische Struktur von TOTE-Einheiten. Die TOTE-Einheiten sollten Aspekte der grundlegenden Ideen "Feed back", "Zielgerichtetheit" 3 und· "Hierarchie" erfassen, die, wie die kyber netischen Forschungen der SOer Jahre gezeigt hatten, zentral für Wahr nehmungs- und Steuerungsprozesse sind, welche zumeist eine hierarchi sche Organisation aufweisen. Diese Ergebnisse, vorwiegend durch Unter suchungen des Nervensystems gewonnen bei denen die "Energieverände rungen" der neuralen Impulse betrachtet wurden, werden bei der Inter pretation der TOTE-Einheiten durch Abstraktionen auf die psychologische Ebene hin erweitert .4 Die grundlegende Idee des Feedback 5wird von Miller, Galanter und cepts, images, or relations he has
1) Die informationsverarbeitenden Sprachen wie IPL (information processing Janguage) und LISP (Iist processing Janguage) bildeten die Voraussetzung für die Forschungen der Künstlichen Intelligenz und die Computersimulationen der Kognitiven Psychologie. Zur IPL vgl. Newell & Sirnon 1963, 419-425. LISP spielt ebenfalls in der Modeliierung der Musikwahrnehmung und in der musikalischen Analyse eine Rolle (vgl. Kap. 3. 2. 1, S. 253 ff. u. 3. 2. 2, S. 272 ff.). Aufgrund ihrer besonderen Bedeutung für die KI, Kogniti onswissenschaft und Kognitive Musikwissenschaft behandele ich die Programmierspra che LISP ausführlicher in Kap. 2. 2. 4. 3, S. 127. 2} vgl. auch Miller, Galanter & Pribram 1960/1970, 16. 3} In diesem Zusammenhang wird auch von teleological mechanisms wie goal, purpose, expectation und e(ltelechy gesprochen. 4) Miller, Galanter & Pribram 1960/1970, 27 u. 28. 5} Arbib (1987, 30 u. 31) erläutert das negative Feedback am Beispiel des Thermostaten.
120 Pribram (1970, 26) darin gesehen, den Unterschied zwischen einem IST Zustand und einem geforderten SOLL-Zustand zu minimieren, um diesen zu erreichen. Es kann, bei psychologischer Interpretation, auch von einem Ziel gesprochen werden. Um diese Idee der Feedback-Schleife in den TOTE-Einheiten zu fassen, sind zwei grundlegende "Aktionen" notwendig. Zum einen ist ein Vergleich 1 notwendig, ob der SOLL-Zustand erreicht wurde, d. h. ob keine Differenz mehr zwischen dem IST-Zustand und dem SOLL- Zustand besteht. Zum anderen muß eine Operation 2 ausge führt werden, die den festgestellten Unterschied zwischen diesen beiden Zuständen minimiert. Zwischen diesen beiden grundlegenden "Aktionen" findet ein Wechselspiel statt, solange der erwünschte Zustand - der SOLL-Zustand - nicht erreicht ist. Miller, Galanter und Pribram (1970, 26; 1973, 34) sprechen in dem Fall eines bestehenden Unterschiedes von Inkongruenz (incongruity) und bei Erreichen des SOLL-Zustandes von Kongru enz (congruity); sie repräsentieren die TOTE-Einheit in einem Diagramm:
Eine hierarchische Strukturierung der Handlungsbeschreibung wird er reicht, indem zugelassen wird, daß der Operationsteil wiederum TOTE Einheiten enthalten kann. Zur Illustration ihrer Idee geben sie die Hand lung des Nageleinschlagens an, die aus drei TOTE-Einheiten besteht.3
Nageleinschlagen als Hierarchie
i"'\
Operation
Heben
Operation
Zuschlagen Operation
1) Miller, Galanter & Pribram 1960/1970, 26 sprechen von test phase Miller, Galanter & Pribram 1973, 34 wird von "Prüfphase" gesprochen.
und
to test; in
Original Miller, Galanter & Pribram 1960/1970, 26: operational phase, to operate; in der deutschen Übersetzung Miller, Galanter & Pribram 1973, 34: Handlungsphase. 3) s. auch Miller, Galanter & Pribram 1960/1970, 33-39; 1973, 39-44. 2) Im
121
Die zentrale, in der Hierarchie der Handlung des Hämmerns leitende TOTE-Einheit, besteht aus dem Test, ob der Nagelkopf sich im Holz be findet, während der Operationsteil des Hämmerns aus den zwei subordi nierten TOTE-Einheiten mit den Operationsteilen des Hebens und des Zusehtagens besteht. Der Operationsteil des Hebens wird kontrolliert durch einen Test, ob der SOLL-Zustand "Hammer erhoben" erreicht ist, während der des Zusehtagens durch einen Test auf den SOLL- Zustand "Hammer auf Nagelkopf" überwacht wird.
C sch�u1: ... . .. . . .. .. .. t"!r��r�
Prüfung des Hagels
. ----------------- -----------------------------------------
Miller, Galanter und Pribram (1970, 27; 1973, 35) geben drei mögliche Interpretationen ihrer Diagramme an, denen drei Betrachtungsebenen sie sprechen von Abstraktionstufen - entsprechen. So können die Dia gramme ihrer Meinung nach (1970, 27; 1973, 35) als den Energie- (ener gy), Informations- (information) ode r Steuerungsfluß (control) darstellend interpretiert werden. Den ersten beiden Ebenen entsprechen Forschungen der Neurophysiologie, indem im ersten Fall auf rein biophysikalischer Ebene Energieumwandlungen innerhalb des Nervensystems betrachtet wer den und auf der pächsten Ebene die Informationstheorie zur Untersuchung der Weiterleitung und Codierung der Signalübertragung benutzt wird? Für die psychologische Betrachtungsweise2 ist dann die Ebene des Kontrollflusses von zentraler Bedeutung: Here we are not concerned with a flow of energy or transmission of information
...
but merely with the
order in which "instructions" are executed.
Das TOTE-Konzept wird von Miller, Galanter und Pribram (1970, 29) als a general description of the controll process betrachtet, das den transfer of control von psychologischen Prozessen und von Handlungen beschreibt und diese verbindet.
1) Die hier angesprochene Unterscheidung der Energie-, Informations- und Bewußtseins ebene hat der Neurophysiologe Wolf D. Keidel (1989, 115-118) zu einem Dreischichten modell-Schema der sinnesphysiologischen Informationsverarbeitung ausgearbeitet. 2) vgl. Miller, Galanter und Pribram 1973, 35 u. 36.
122 Die Begriffe instruction (Befehl), test (Vergleich) und control (Steuerung) deuten schon die Nähe zu Konzepten der Informatik1 an, so daß es nicht verwunderlich ist, daß die Autoren ihren PLAN dem Begriff des Pro gramms beim Compute r gleichstellen, während Autoren wie Newell und Sirnon (1963, 382 lll . 484) ihr Konzept des Programms mit dem des PLANs von Miller, Galanter und Pribram in enge Verbindung bringen. Vereinfacht kann dlie Idee des PLANs mit der des Programms und die des Bildes mit den Daten (der Wissensbasis) identifiziert werden. Wei terhin ist es nicht überraschend, daß sich die TOTE-Einheit mit den von John von Neumann entwickelten Flußdiagrammen zur Beschreibung des Kontrollflusses eines Programmes (bzw. des zu realisierenden) Algorith mus darstellen läßt (vgl. die TOTE-Hierachie):
0 =
T
. . . .. .. . ..- - - - - - - .. .. - - - .. .. .. .. - - - - - -
.
.. .. .. .. .. ..
.
.. .. ..
.
=
Operation
Teat
. .. . ..
Die wesentlichen Symbole eines Flußdiagramms sind, wenn wir Einga be-, Start- und Stop-Symbol vernachlässigen, ein Rhombus und ein Recht eck. Der Rhombus steht für eine Bedingung (einen Vergleich, einen Test) und bewirkt eine P rogrammverzweigung, wohingegen das Rechteck flir Aktionen steht. Ebenso wie bei den TOTE-Einheiten kann der Aktionsteil wiederum aus komplexen Aktionen mit Tests bestehen. Die Richtung des Kontrollflusses wird durch Pfeile indiziert. Eine TOTE-Einheit weist als Flußdiagramm folgende Form auf: 1) In der Informatik bedeutet "instruction" soviel wie Befehl oder Anweisung (state ment). Ich vernachlässige hier des weiteren den Unterschied Anweisung {Statement) Befehl {instruction), der im wesentlichen nur einer der Beschreibungsebene ist: Bei
Befehlen und bei problemorientierten einer problemorientierten Sprache be aus mehreren Befehlen {vgl. Arbib 1984).
maschinennahen Programmiersprachen wird von von Anweisungen gesprochen. Eine Anweisung steht auf der Ebene der maschinennahen Sprache
123 WHILE test > DO < operate > <-
Die Transformierbarkeit von TOTE-Einheiten in Flußdiagramme, wel che einen Programmablaufplan repräsentieren, nutzten Miller und Chom sky, um zu zeigen, daß die durch TOTE-Hierarchien repräsentierten Plä ne von Miller, Galanter und Pribram dem Konzept des endlichen Auto maten äquivalent sind. Miller und Chomsky (1963, 485-488) griffen hierfür die von Karp1 aufgewiesene Äquivalenz der Darstellung von Flußdiagrammen und Gra phen auf. Die wesentlichen Ideen der Umwandlung von TOTE-Hierarchien über Flußdiagramme in Graphendarstellungen, die wiede:rum als Regeln fl.ir endliche Automaten interpretiert werden können, seien an einem Beispiel wiedergegeben (vgl. das vorangegangene Flußdiagramm und die entspre chende TOTE-Hierarchie des Nageleinschlagens): B� Begin s� Stop T� Test 0=
Operate
1) s. Karp 1960. Eine 1981, 185.
kurze Darstellung dieser Beziehung geben Arbib, Kfoury & Moll
124 Nachdem Miller und Chomsky in der hier skizzierten Weise die Gleichheit von TOTE-Hierarchien und endlichen Automaten nachgewiesen haben, kommen sie (Miller & Chomsky 1963, 486) zu der Schlußfolgerung: Since
a
tote
hierarchy
is analogaus to a program of instructions for
a serial computer, it has been referred to as a plan that the system is trying to execute. Any postponed parts of the plan constitute the system's intentions at any given moment. Viewed in this way, therefore, the finite devices . . . are clearly applicable to an even broader range of behavioral processes than language and communication.
Es muß allerdings angemerkt werden, daß dieser Nachweis sich nur auf die rein syntaktische Verbindung der Kontrollflußbeschreibungen wie Se quenzierung, Test (Verzweigung, Bedingung), Hierarchisierung und Wie derholung (Schleife) bezieht. Ein große Gefahr, diesen Ansatz von Miller, Galanter und Pribram zu trivialisieren, liegt darin, die "inhaltlichen" Kri terien der Tests und Operationen als selbstverständlich gegeben anzusehen und sie nicht auf elementare, "klar" formulierte Einheiten, zu deren Ver ständnis keine weitere Intelligenz notwendig erscheint, zurückzuführen. Es schleichen sich so aufgrund eines anthropomorphen Subjektivismus Ho munculi wie Geist, Seele, Entelechie etc. in die Theoriebildung ein, die es verhindern, den theoretischen Erklärungsansatz per Computersimulation experimentell zu überprüfen, wie es von den Autoren vorgeschlagen wird.1 Beim Schreiben von Flußdiagrammen unter Mißachtung dieser Proble matik wurde dann in den folgenden Jahren in der kognitiven "informati onsverarbeitenden" Psychologie übersehen, daß nicht nur der Kontrollfluß zu spezifizieren ist, sondern gerade auch die "inhaltlichen" Kriterien, die in den Operationen und Vergleichen angeführt werden. Denn nur so kann es zu einer Implementierung und Überprüfung der vom Beobachter gege benen Beschreibung e:ines Planes und des angenommenen internen menta len Modelles kommen, wie sie den Autoren vorschwebte. Dies macht den bahnbrechenden psychologischen Neuansatz, den Miller, Galanter und Pribram vorschlugen, wissenschaftlich gehaltvoll und die psychologischen Annahmen empirisch überprüfbar; sie2 schreiben: Thus, we are reasonably confident that "program" could be substituted everywhere for "Plan" ... However, the reduction of Plans to nothing but programs is still a scien tific hypothesis and is still in need of further validation. For the pre sent, therefore it should be less confusing if we regard a computer program that simulates certain features of an organism's behavior as a theory about organismic Plan that generated the behavior.
Zur Festigung dieser Hypothese ist es natürlich notwendig, Programme anzugeben, die den in den Flußdiagrammen beschriebenen Kontrollfluß rea lisieren. Hierfl.ir ist allerdings eine "klare" Spezifikation in Form ele mentarer Einheiten für die in den Boxen der Flußdiagramme stehenden 1) vgl. Miller, Galanter & Pribram 1960/1970, 44u. 45; 1973, 48. 2) s. Miller, Galanter & Pribram 1960/1970, 16; 1973, 20.
125
Tests und Operationen unerläßlich, denn nur so läßt sich die auch als kybernetische These (C) bezeichnete Forderung, auf die von Miller, Ga lanter und Pribram (1970, 46) hingewiesen wurde, die Überprüfung psy chologischer Theoriebildung mittels Computersimulation, realisieren: It seems .. . that the attempts to simulate psychological processes with machines are motivated . .. by the desire to test - or to dernonstrafe the designer's understanding of the theory he espouses. History suggests that man can create almost anything he can visualize clearly. The crea tion of a model is proof of the clarity of the vision. If you understand how a thing works weil enough to build your own, then your under standing must be nearly perfect.
Weiterhin weisen die Autoren darauf hin, daß die Beschreibung "klar" und "exakt" genug sein muß, damit sie als Test der Beschreibung des Verhaltens bzw. als Simulation des beschriebenen Verhaltens auf einem Computer durchgeführt werden kann. Die Grenzen zwischen dem Testen einer Beschreibung, der Simulation eines beschriebenen Verhaltens und der Ausführung des Verhaltens sind fließend, daher schwierig festzustellen und sollen hier nicht weiter diskutiert werden. Miller, Galanter und Pribram (1970, 4 8 ) stellen gemäß ihrem Verständ nis der psychologischen Computersimulation das Testen einer Beschrei bung - einer theoretischen Erklärung - in den Vordergrund: This agree ment is normally established by requiring the machine to simulate, not the behavior per se, but the psychologis(s record of the behavior. A theorist is, therefore, at the mercy of the person who decides what the aspects of the behavior are worth recording and simulating.
Die kybernetische These, die sich noch in anderen Formulierungen fin det (vgl. Minsky 1971; von Neumann 1967), läßt sich allgemein wie folgt formulieren:1 (C) Alles, was klar verstanden wurde und logisch formulierbar ist, kann programmiert bzw. maschinell realisiert werden. Wesentlich für die Computersimulation der Beschreibung eines Beob achters ist die Annahme, daß der Beobachter seine Erläuterungen expli zit formuliert und auch verstanden hat� Insgesamt sind also drei Punkte hervorzuheben: (a) Einerseits wird das Verständnis des Theoretikers in bezug auf seine Konstrukte überprüft; (b) Weiterhin muß die Beschreibung bestimmten Bedingungen genü gen; diese werden formalisiert. (c) Es wird unterstellt, daß Prozesse, die den Organismus in seiner Umwelt leiten, im wesentlichen den Kriterien genügen, die auch in den Beschreibungen gelten. I) Die Beziehung zwischen Simulatio n und Ausführung eines psychologischen Prozesses wurde von Newell & Simon 1963 erörtert. 2) vgl. Miller, Galanter & Pribram 196011970, 46 u. 47; 1973, SO u. 51.
126 Die letzte Annahme (c) findet ihren klarsten Ausdruck in der Physical Symbol System Hypothese von Newell und Sirnon (1976). Um die Bezie hung zwischen den Punkten (b) und (c) näher zu bestimmen, muß auf die Arbeiten der Logiker Turing, Post und anderen zum Begriff des Algorith mus näher eingegangen werden. Daß ein Organismus mit einem Zentralnervensystem wie dem des Men schen in der Lage ist, Prozesse durchzuführen, die Beschreibungen im Rahmen eines endlichen Automaten entsprechen, wurde schon von McCul loch und Pitts1 nachgewiesen. Daß ein Computer ebenfalls in der Lage ist, diese zu realisieren, zeigte ich im Rahmen der Theorie logischer Netze.2 Es stellt sich die Frage, ob mit diesen Beschreibungsmitteln diejenigen gegeben sind, die es erlauben, alles, was unter dem noch zu erklärenden Konzept "exakt" gefaßt wird, zu beschreiben; auch geht es darum, wie das Verhältnis der Beschreibungsmittel zu den realisierenden Prozessen zu verstehen ist. Daher wird im nächsten Kapitel der Begriff der "exak ten Beschreibung", d. h. des Algorithmus, eingehend untersucht.
I) 2)
s.
s.
Kap. 2. 2. 3, S. 66-96. Kap. 2. 2. 3. 2, S. 88-96.
127 2. 2. 4. 3
Turingmaschinen, effektiv berechenbare Funktionen, Algorithmen und LISP
Das Konzept des Algorithmus ist als grundlegendes Hilfsmittel zentral für die Beschreibung und Beurteilung wesentlicher Züge der Mathematik, der Informatik, der exakten Naturwissenschaften und der von ihnen beeinflußten Wissenschaften.1 Trotzdem gab es bis zu Beginn des 20. Jh.s keine formale Charakterisierung dieses intuitiven Konzeptes. In erster Annäherung ist ein Algorithmus als Handlungsanweisung zu verstehen, deren Befolgung bei gegebenen Anfangswerten als Resultat die gewünschten Endwerte liefert, wobei für die Ausführung der einzelnen Schritte keinerlei "Intelligenz" und Verständnis notwendig ist. So sind die Verfahren zur Addition, Subtraktion, Multiplikation, Logarith misierung, die in der Schule erlernt werden, genauso Beispiele flir Algorithmen wie die Verfahren zur Differentiation und Integration der Schulmathematik.2 Daß deren Ausführung keinerlei "Intelligenz" erfordert, mag Nichtmathema tiker wundern, die sicherlich während der Schulzeit schmerzhafte Erfahrun gen beim Erlernen dieser Verfahren machten. Eine genauere Charakterisierung des Algorithmusbegriffes führt, abhän gig vom betreffenden Autor, zur Betonung unterschiedlicher Aspekte;3 al lerdings lassen sich einige generelle Merkmale anführen, die einen Algo rithmus auszeichnen: Ein Algorithmus ist eine Anweisung - zumeist ein Text - von endlicher Länge, deren einzelne für die Ausführung notwendi gen elementaren Schritte genau beschrieben sind, so daß keine "Intelli genz" zur Befolgung notwendig ist, d. h. der Algorithmus kann auch mechanisch, ohne Intuition, ausgeführt werden. Die zu bearbeitenden Objekte müssen manipulierbar und durch Symbole repräsentierbar sein, d. h. sie müssen physikalisch durch elektrische Impulse, Tinte etc. realisier bar sein. Wenn man z. B. addiert, so arbeitet man nicht mit Zahlen, sondern mit deren Repräsentanten, den Ziffern.4 Eine Zusammenfassung der relevanten Eigenschaften eines Algorithmus ergibt folgende Charakterisierung: a) Allgemeinheit der Anwendbarkeit, d. h. nicht nur ein einzelnes I) Zur Geschichte des Algorithmenbegriffes in der Mathematik vgl. Krämer 1988. Be sonders in der Informatik, Kognitionswissenschaft und Kognitiven Musikwissenschaft kommt dem Algorithmusbegriff eine besondere Bedeutung zu. Zentral ist er außerdem für die künstlerische Musikpraxis (e. g. Batel , Kleinen & Salbert 1987) wie z. B. des "algorithmischen Komponierens" (Stroh 1990b). 2) Eine kurze Darstellung der mit dem Algorithmusbegriff verbundenen Forschungser gebnisse im Hinblick auf die Leistungsfähigkeit von Computern gibt Hunter 1988; ebenda auch andere Beispiele flir Algorithmen. 3) Begriffsexplikationen verschiedener Autoren gibt Krämer 1988, 203 Anm. 54.
4) Lorenzen 1974, 193 macht deutlich, wie über das Operieren mit konkreten Gegen ständen (Strichen) durch Abstraktion konstruktiv-operational abstrakte Objekte (die natürlichen Zahlen) gebildet werden.
128 Problem, sondern 'eine Klasse von Problemen kann mit ihm gelöst wer den, wie z. B. nicht nur die Aufgabe 2 + 3 = z, sondern ebenso x + y = z, wenn x, y als beliebige natürliche Zahlen gegeben sind; b) die Endlichkeit (statische Finitheit) der Darstellung (Anweisung, Vorschrift); c) exakte Formulierung, in der alle Einzelheiten der einzelnen schrittweisen Ausführung genau beschrieben werden; wenn nach je dem Schritt höchstens ein weiterer Schritt möglich ist, heißt der Algorithmus deterministisch. d) die Ausführung bedarf prinzipiell keinerlei "Intelligeni' oder "In tuition" und könnte auch von einer Maschine durchgeflihrt werden; e) der Algorithmus muß terminieren (dynamische Finitheit), d. h. wenn er ein Ergebnis liefert, dann muß dies nach endlich vielen Schritten geschehen. Ein nichtterminierendes Verfahren ist z. B. die Berechnung von J : 7 0, 428571... f) die Objekte eines Algorithmus müssen manipulierbar sein. g) angewandt auf dieselben Argumente, liefert er immer dieselben Werte. Er ist determiniert. Sybille Krämer (1988, 159-160) führt als Charakteristika von Algo rithmen deren textuelle Endlichkeit, Determiniertheit, Allgemeinheit und Elementarität an. Diese Charakterisierungen bilden die ersten Anhalts punkte für eine Explikation des Algorithmusbegriffes. Trotz seiner Be deutung für verschiedene Wissenschaften fand eine Explikation erst in den 30er Jahren des 20. Jahrhunderts statt.1 =
2. 2. 4. 3. 1
Turings introspektive Analyse des Rechenprozesses
Das Konzept des Algorithmus, des effektiven Verfahrens bzw. der ef fektiv berechenbaren Funktion, fand seine Explikation durch formale Be griffe wie der partiell- rekursiven Funktion, des Lambda-Kalküls und der Turing-Maschine. leb werde mich dem Konzept der Turingmaschine zu wenden, da es einerseits ermöglicht, die enge Beziehung zur Theorie der endlichen Automaten aufzuweisen und ebenfalls als Explikation des "Me chanischen" gelten kann, andererseits ist instruktiv die Verbindung der durch neurophysiologische (McCulloch & Pitts 1943/1965) und introspek tive Untersuchung (Turing 1937/1987) gewonnenen Erkenntnisse über Rechenprozesse aufzuzeigen. Turing (1939/1965, 160) schrieb zu seinem Konzept der "Turing-Ma schine" und der "effektiv berechenbaren Funktion": A function is said to be
"effectively computable" if its value can be found by some purely mechanical process. We may take this statement literally, understanding by a purely mech1) Gandy 1988 schildert konzis und detailliert die Entwicklungen dieser Phase der mathematischen Logik.
.)
129
anical process one which could be carried out by a machine. lt is possible to give a mathematical description, ... , of the s truc ture of these machines.
Das Konzept der Turing-Maschine ist Turings formale Beschreibung der Struktur und des Verhaltens dieser Maschinen, die er durch mathematisch logische Analyse und Introspektion gewann. Aufgrund Turings introspekti ver Analyse eines Rechenprozesses werden die Zustände eines (abstrakten endlichen) Automaten als "Geisteszustände" verstanden, seine Eingabe- und Ausgabesymbole dagegen als Repräsentationen von Gegenständen, die es dem Organismus ermöglichen, diese zu manipulieren und mit ihnen zu interagieren. Zur Erinnerung: In der Interpretation der neurophysiologischen For schung repräsentiert der Zustand des endlichen Automaten die Gesamtak tivität der untersuchten Axone zu einem bestimmten Zeitpunkt, während die Eingabesymbole die Codierung der Gesamtaktivität der afferenten Verbindungen und die Ausgabesymbole die Gesamtaktivität der efferenten Verbindungen zu einem bestimmten Zeitpunkt darstellen.1 Sowohl Emil Post (1936) als auch Alan Turing (1937/198 7) nahmen eine durch Introspektion geleitete "psychologische" Untersuchung des Rechen vorganges vor. Turing (1937/1987, 41 u. 40 ff.) beschrieb, nachdem er die Umgebung eines Rechnenden analysiert und die Linearität (Eindimensionalität) der Niederschrift beim Rechnen, die Einteilung in Felder dieses Bandes2 und die endliche Anzahl der benutzten Symbole hervorgehoben hatte, sein Kriterium für die Unterscheidung einfacher und zusammengesetzter Sym bole: Von unserem Standpunkt aus bestehen die Unterschiede zwischen einfachen und zusammengesetzten Symbolen darin, daß zusammengesetzte Symbole nicht mit einem Blick erlaßt werden können, wenn sie zu lang sind.
Turing teilt durch den eingenommenen introspektiven Standpunkt die inne re Selbstbeobachtung des nach außen gerichteten Sehvorganges mit, indem er anführt, daß "zusammengesetzte Symbole nicht mit einem Blick erfaßt werden können. An · die vermutete gleiche Erfahrung des Lesers appellierend I) Dies habe ich ausführlich in den Kap. 2.2.3.1 und 2.2.3.2 dargelegt. Die Strategie be·
steht in der Modeliierung neurophysiologischer Sachverhalte wie dem Axonpotential, der Refraktärphase, der synaptischen Verzögerung etc. durch McCulloch-Pitts-Nerven netze, aus welchen dann durch Codierung die Eingabe·, Ausgabe· und Zustandsmenge gewonnen werden. 2) Es kann bei dieser Vorstellung an die Beschreibung des endlichen Automaten mit Band, Lese-Schreibkopf und Bewegungsvorrichtung gedacht werden, wie er im vorange gangenen Kapitel vorgestellt wurde. Oie Turingmaschine wird weiter unten vorgestellt. Oie Idee des Bandes wurde von Turing aus der Vorstellung eines Rechenheftes entwik kelt, in dessen Kästchen die Zeichen (d. h. Zahlen, Funktion und Operationen) bei der Lösung einer Rechenaufgabe eingetragen werden. Die "Zweidimensionalität" des Blattes (d. h. die Möglichkeit die Zeichenketten hintereinander und untereinander zu schreiben) erweist sich für die Ausführung des Rechenvorganges als unwesentlich. denn die Zeichenketten können auch "eindimensional", d. h. hintereinander, geschrieben werden. Es wird folglich nur eine Folge von .Kästchen. das in Felder eingeteilte Band, benötigt.
130
und Zustimmung erwartend argumentiert er weiter: Das stimmt mit der
überein. Wir können nicht auf einen Blick sagen, ob und 999999999999999 gleich sind.1 Turing fährt in seiner Analyse fort: Das Verhalten des Rechnenden wird zu jedem Zeitpunkt durch die wahrgenommenen Symbole und durch seinen momentanen "Geisteszustand" bestimmt. Wir gehen davon aus, daß es ei ne Grenze G für die Anzahl der Symbole gibt, die der Rechnende in einem Augenblick erfassen kann. Will er mehr erfassen, muß er sich ei ner Reihe aufeinanderfolgender Wahrnehmungsakte bedienen. Wir gehen außerdem davon aus, daß die Zahl der Geisteszustände, die berücksichtigt werden müssen, endlich ist.
Erfahrung
9999999999999999
Nachdem Turing die Endlichkeit der Menge der unterscheidbaren Symbole für die "Symbole" der Bandinschrift2 ebenso aufgewiesen hat wie die End lichkeit der Menge der Geisteszustände3 eines Rechnenden (computer) und ferner die Abhängigkeit des Verhaltens desselben von dem jeweils betrach teten Symbol und dem Geisteszustand bestimmt hat, beginnt er die elemen taren Operationen zu spezifizieren, die der Rechnende in der Lage sein muß auszuführen, um komplexe Berechnungen zu realisieren. Turing (1937/1987, 41) fährt in seiner Analyse fort: Wrr stellen uns die vom Rechnenden
durchgeführten Operationen in "einfache Operationen " aufgeteilt vor, die so elementar sind, daß es schwerfällt, sie sich noch weiter aufgespalten vorzustellen. Jede dieser Operationen besteht in irgendeiner Veränderung im physikalischen System, das vom Rechnenden und seinem Band gebildet wird. Wir kennen den Zustand des Systems, wenn wir die Symbolfolge auf dem Band, die Symbole, die vom Rechnenden (. . .) wahrgenommen werden, und den Geisteszustand des Rechnenden kennen. Wir nehmen an, daß in einer einfachen Operation nicht mehr als ein Symbol verändert wird. Das System, von dem Turing spricht, besteht folglich aus zwei Teilen: dem Rechnenden und seiner Umgebung, d. h. das eindimensionale in Fel der eingeteilte Band. Der Rechnende ist gekennzeichnet durch seinen augenblicklichen Gei steszustand und das von ihm wahrgenommene Feld bzw. Symbol. Das Band ist charakterisiert durch Linearität und Einteilung in einzelne Felder und die Inschrift von endlicher Länge, bestehend aus Symbolen, die sich auf dem Band befinden; es sei per Definition maximal immer nur ein "elementares" Symbol in einem Feld. Weiterhin muß der Rechnende in 1) Sie sind es nicht: Die erste Ziffernfolge enthält
16 mal das Vorkommen der Ziffer in der zweiten Folge 15 mal auftritt. dem Ausgabealphabet vereinigte Eingabealphabet, wel ches gegebenenfalls noch um Sonderzeichen erweitert wird. 3) In der automatentheoretischen Interpretation handelt es sich um die Zustände eines endlichen Automaten, die wiederum - wie gezeigt wurde - in einer neurophysiologi schen Interpretation als die Gesamtaktivität der Axone zu einem bestimmten Zeitpunkt reflektierend angesehen werden können (vgl. Kap. 2. 2. 3. 2. 1, S. 88 ff.). "9", während die gleiche Ziffer 2) Es handelt sich um das mit
131 der Lage sein, auf seine Umgebung einzuwirken. Er muß in der Lage sein, die Symbole auf dem Band zu verändern, d. h. sie zu löschen und neue hinzuzuschreiben bzw. alte Symbole zu überschreiben. Es kann pro Operation nicht mehr als ein Symbol verändert werden. Außerdem muß der Rechnende in der Lage sein, seinen Blick auf ein anderes Feld zu lenken, d. h. das Band in seinem Gesichtsfeld ein paar Felder weiterzu schieben bzw. sich selbst am Band entlang zu bewegen und einzelne Felder in sein Gesichtsfeld zu bringen. Nachdem der Rechnende ein Symbol gelesen (erkannt) und eine der elementaren Operationen1 in Ab hängigkeit von seinem Geisteszustand ausgeführt hat, verändert sich gegebenenfalls auch sein Geisteszustand, denn er sieht z. B. ein neues Symbol und ein anderes Feld mit einem weiteren Symbol. Turing (1937/1987, 43) faßt seine Analyse zusammen: Die einfachen Operationen
müssen daher folgendes umfassen: (a) Veränderungen des Symbols auf einem der wahrgenommenen Felder. (b) Veränderungen eines der wahrge nommenen Felder in ein anderes Feld ... Es ist möglich, daß einige dieser Veränderungen notwendig eine Veränderung des Geisteszustandes implizieren. Die Interaktion von Band und Rechnendem beschreibt Turing mit fol genden Worten: Die tatsächlich durchgeführte Operation wird, ... , durch
den Geisteszustand des Rechnenden und durch die wahrgenommenen Sym bole bestimmt. Insbesondere bestimmen sie den Geisteszustand des Rech nenden, nachdem die Operation ausgeführt worden ist. Das Verhältnis von Rechnendem und Umgebung wird oft durch folgende Graphik veranschaulicht:
CE ng abel
Schre i b pap i e r i
�
uft�tae'2';.1'��un
r'
ITif"'sc sh hecnheen-.", : CRechenwerkl II a
r c
i
I I
�
,,,
.J"
eibDapie,l. §ch,.. CAusgab•l
Schre-ibpap i �r
.......
_ ....
&....."
--..
"'
CSp•ich•rl
Zwischenergebnisse
......"
I
.,.,.
' , ::j
.J?· ,--
... ... ... --... .· .. --··• .. :::�"T
.,.
...�""
E r g ebn i sse
"enschlich•r RechnifH'· CLei'twerkl
Abb. nach Händler 1974, 1 1 9 1) d. h, das Band wird z. B. um ein Feld nach links oder nach re chts bewegt, oder ein Symbol mit einem neuen Symbol überschrieben.
132 Die Turing-Maschine in zwei Formulierungen
2. 2. 4 . 3. 2
Turing (1937/1987, 20 ff. ) gab entsprechend seiner Analyse ein forma les System - eine abstrakte Maschine - an, welche die notwendige Struktur und elementaren Operationen aufwies. In der Folgezeit gab es verschiedene formale Darstellungen und Modi fikationen der Turingmaschine. Ich werde zwei vorstellen, von denen eine die Beziehung zu den Ergebnissen der Arbeit1 von McCulloch & Pitts (1943/1965) erkennen läßt und die andere die Beziehung zur Idee der Programmierung betont. In der ersten Fassung wird ein endlicher Automat2 sozusagen als "formales Gehirn" der Turingmaschine verstanden und die Beziehung zur Idee der Regel aufgezeigt. In der zweiten Fassung handelt es sich um die sogenannte Wang-Formulierung einer Turingmaschine.
2. 2. 4. 3 . 2. 1
Die Turing-Maschine als endlicher Automat mit potentiell abzählbar unendlich vielen Feldern
In der ersten Formulierung der Turing-Maschine wird auf das Konzept des endlichen Automaten rekurriert. Ähnlich wie der endliche Automat kann eine Turing-Maschine als ein Mechanismus vorgestellt werden, der Lesen und Schreiben kann und für diese Aktivitäten über ein in Felder eingeteiltes Band verfügt. In dem als "Kopf" vorgestellten Kasten der Schreib-Lese-Vorrichtung sind die Regeln gespeichert, welche alle Akti vitäten des Systems3 in Abhängigkeit von dem gerade betrachteten Zei chen steuern. Das Band ist in beide Richtungen unendlich, d. h. es gibt abzählbar unendlich viele Felder bzw. die Turingmachine ist, von einer endlichen Bandinschrift ausgehend, in der Lage, ein weiteres Feld anzufü gen, wenn es für ihre Berechnungen nötig wird: Gesantsysten: TURING-Maschine End l i c h er Au1:on.a1: FSO
I
t•s •n� schreiben Hechani s"'us D : u.
b•wegen
J · ·I I I = I I L I I III #
#
#
#
#
b e i d s e i 1: i $
I
I
#
I
unendliche s S and
I
I I I··· #
1) Die Ergebnisse wurden in Kap. 2. 2. 3. 1, S. 66 ff. und Kap. 2. 2. 3. 2, S. 88 ff. dargelegt. 2) Das Konzept des endlichen Automaten wird in Kap. 2. 2. 4. 1, S. 97 ff. vorgestellt. 3) Das System wird aus der Box (dem endlichen Automaten) und dem Band gebildet.
133
Zur Erinnerung sei die Definition des endlichen Automatent angegeben: Ein endlicher Automat mit Ausgabe (FSO; transducer) ist ein Quintupel A = (I, 0, Q, &, ß ), wobei I, 0, Q endliche Mengen sind: I ist die Eingabemenge (input, symbol) , 0 ist die Ausgabemenge (output), Q ist die Zustandsmenge (Menge interner Zustände, states). o : Q x I H Q ist die Zustandsüberführungsfunktion (next-state function) ß : Q x I H 0 ist die Ausgabefunktion (next-output function) Mit dieser Definition des endlichen Automaten erhält eine Turingmaschine (Arbib 1964, 14) die Definition: Eine Turing-Maschine TM ist ein endli cher Automat FSO mit einem potentiell unendlichen, in Felder eingeteil tem Band, welches zu jedem Zeitpunkt nur eine endliche Anzahl der Zeichen des Eingabealphabetes I als Inschrift aufweist. Jedes Feld enthält genau ein Symbol des Bandalphabetes B. Das Bandalphabet2 B ist das Eingabealphabet I, erweitert um das Leerzeichen "=", auch Blank ge nannt, d. h. B = I v { = }. TM enthält weiterhin eine Vorrichtung D, die es TM ermöglicht, jeweils in einem Arbeitsschritt den Inhalt eines Band-Feldes zu lesen, ein neues Symbol b des Bandalphabets B auf das aktuelle Feld zu drucken (d. h. das alte Symbol zu überschreiben) und das Band einen Schritt nach rechts, links oder gar nicht zu bewegen. Die Eingabe in FSO ist zu jedem Zeitpunkt ein auf dem Band befindliches, jeweils mittels D gelesenes Symbol b . Die Ausgabe von FSO, gegebenenfalls von dem Mechanismus D auf ein Feld des Bandes geschri<eben, wird durch den innernen Zustand q des FSO sowie das aktuell gelesene Symbol b determiniert. Formal besteht die um die stop-Anweisung erweiterte Ausgabemenge 0 aus dem kartesischen Produkt des Bandalphabetes B und der Menge M, deren Elemente die Verschiebungen des Bandes angeben, d. h. 0 = B x M v {stop}. M ist die Menge {L, R, N}. wobei L die Verschiebung des Bandes nach links, R nach rechts und N keine Verschiebung indiziert. Bei 'stop (halt, h) beendet TM ihre Ausführungen. Handelt es sich bei der Ausgabe o € 0 um (b, m) € B x M, dann veranlaßt FSO die Vorrichtung D, das Zeichen b auf das gerade betrachtete Feld zu drucken, um danach den Schreib-Lese-Mechanismus in Abhängigkeit von m (d. h. m = L, R oder N) nach links, rechts oder gar nicht zu bewegen. Wie zu erkennen, ist die wesentliche Information über TM durch die Struktur des endlichen Automa ten A gegeben: FSO = (I = B, 0 = B X M V { stop }, Q, ß , o ) . Die Beziehung zu den Funktionen o und ß ergibt sich i n folgender Weise: Die Ausgabefunktion ß : Q x B -7 0 mit ß (qf, b y = (bn, m) oder stop. Die leitende intuitive Idee für diese Formulierung einer Turing-Maschine ist das physika lische System, das vom Rechnenden und seinem Band gebildet wird (Turing 1937/1987, 41). 1) Der Begriff des "endlichen Automaten" wurde in Kap. 2. 2. 3. 2, S. 88 ff. eingeführt. 2) Dies ist formal nicht ganz exakt, da das Bandalphabet bei der Definition der Tu ringmaschine ebenfalls das Ausgabealpabet umfaßt, das beim endlichen Automaten nicht mit den Eingabealphabet übereinstimmen muß (vgl. auch S. 88·91 sowie S. 108-109.).
134 Es ergibt sich die folgende Interpretation für die Ausgabefunktion: Wenn FSO sich im Zustand qf befindet und mittels der Vorrichtung D das Zeichen b1 liest, dann überschreibt FSO das Zeichen b1 mit dem Zeichen bn, und der Mechanismus D bewegt sich gemäß m nach links, rechts oder gar nicht. Die Zustandsüberführungsfunktion S : Q x B � Q mit S ( qf, b1) = q 8 Die Zustandsüberführungsfunktion kann wie folgt gelesen werden: Wenn FSO sich im Zustand qf befindet und mittels der Vorrichtung D das Zeichen b1 liest, dann geht FSO in den Zustand q8. Ein BeispieP soll das bisher Gesagte veranschaulichen: Es wird eine Turingmaschine TMl: durch das folgende Quintupel definiert: (B = { u, 1}, 0 = { u, 1} x M v { stop}, Q = {q0, q1, q2}, S, ß ) TMl: Die Funktionen S und ß werden näher bestimmt durch:
1. 3. 5.
7.
2.
S (q0, l) = qt , S (q l, I) = q2, ß(q1 , u ) = (u, R), ß(q 2, I) = stop,
4.
6. 8.
S (ql , u ) = ql ß(q0, I ) = (u, R), ß (q1 , I ) = (u, R), ß (q2, u) = stop
Die Werte aller anderen Argumentpaare werden willkürlich bzw. gar nicht definiert. In letzterem Fall handelt es sich um partielle Funktionen, die nicht fl.ir alle Argumente definiert sind. Um die Arbeitsweise der Turingmaschine näher zu bestimmen, muß eine Anfangs- und eine Endkonfiguration beschrieben werden. Als Anfangszustand wird q0 gewählt. Es werden zwei zusammenhängende Folgen von Strichen "I" aus I, getrennt durch ein "u", auf das Band geschrieben. Der Lese Schreibmechanismus D wird auf das Feld mit dem ersten Strich der er sten Strichfolge gesetzt. Eine Anfangskonfiguration von TMl: ist bei spielsweise: q01 I u I I . Nach dem Abbruch der Arbeit durch "stop" werden die auf dem Band stehenden Striche als Ergebnis der von FSO geleisteten Arbeit angesehen. Eine Überprüfung der Arbeitsweise der Turingmaschine FSl: zeigt, daß sie die ersten zwei auf dem Band befindlichen Striche löscht. Um dies ein zusehen, müssen nur zwei Fälle betrachtet werden: In dem ersten Fall besteht die erste Strichfolge aus genau einem Strich und die zweite aus einer Strichfolge von endlicher Länge mit mindestens einem Strich. Im zweiten Fall besteht die erste Strichfolge endlicher Länge aus mindestens zwei Strichen.
1) Ich folge im wesentlichen Arbib 1964,
16 ff.
135
1. Fall
nach
nach
qo I
u
qo
1., 4.
u
ql
2., s.
u
3.
u
7.
stop
2.Fall
u
1., 4 .
u
ql
u
ql
3., 6.
u
u
u
u
q2 ...
q2 . . .
7. oder 8. stop
Sicherlich stellt man sich zu Recht die Frage, was dieses Verhalten der Turingmaschine bedeuten soll. Um ihm einen Sinn zu geben, muß das Verhalten noch semantisch interpretiert werden: Das Verhalten der Tu ringmaschine TML: kann als die Berechung der Additionsfunktion der natürlichen Zahlen interpretiert werden, wenn die Strichfolgen n, m mit n +1, m + 1 Strichen als Repräsentationen der natürlichen Zahlen n, m E IN0 interpretiert werden. Die Anzahl k der Striche der nicht notwendigerweise zusammenhängen den Strichfolge k, die nach Beendigung der Berechnung durch "stop" auf dem Band steht, wird als Ergebnis der Addition interpretiert, d. h. k m + n. In der Literatur finden sich noch zwei häufig benutzte Varianten dieser Darstellung einer Turingmaschine, welche auch die Nähe dieses Konzepts zu Regelsystemen1 leichter erkennen lassen. Eine Turingmaschine kann ebenfalls als Menge YQ!l Quintupeln der Form ' (alter Zustand qf, gelesenes zeichen b1, neues Zeichen bk, Bewegung des Bandes m, neuer Zustand q8� - d. h. (qf, bp bn, m, q8 ) bzw. qrb1 bnmq8 - gelesen werden mit der Forderung, daß es ein Quintupel für alle Paare Cqr, b1) gibt, für die (3 (qf, �) � stop gilt, und für die weiterhin S (qf, b1) q8 und ß (qf b1) (bn, m) gilt. Die Funktionen sind eben:so zu interpretieren wie weiter oben angegeben� =
=
=
1) Regelsysteme werden von dem Linguisten Noam Chomsky (1963, 1965, 1980) zur Beschreibung der mentalen Repräsentationen syntaktischer Strukturen natürlicher Sprachen benutzt. In der neueren musiktheoretischen Forschung (e. g. Lerdahl & Jak kendoff 1983; Jackendoff 1987; Longuet-Higgins 1987; Becker & Becker 1979; in Stoffer 1981) wird ebenfalls von einer als Regelsystem darstellbaren mentalen Repräsentation musikalischer Strukturen ausgegangen, die der Musiktheoretiker zu erforschen hat.
Seifert 1986 diskutiert verschieden Arbeiten. In Kap. 2. 2. 4. 1, S. 97 ff. wird die Idee des Regelsystems expliziert (vgl. auch Seifert 1986, 61 ff.) 2) Für eine andere genauere Quintupel-Darstellung von Turing-Maschinen, die statt des "stop" einen zusätzlichen "Haltezustand" einführt, sei auf Kfoury, Moll und Arbib 1982, 196 verwiesen.
136
Eine Quadrupel-Darstellung folgender Form, in der nur die Verschiebun gen nach links (L) und rechts (R) berücksichtigt werden, ist auch anzutreffen und benutzt ebenfalls kein "stop": (i) qrb1bnq8 (ii) qrb1Rq8 (iii) qrb1Lq8 (i) wird wie zuvor gelesen als: Die Turingmaschine TM befindet sich in dem Zustand qf und liest das Zeichen b1, überschreibt es mit dem Zeichen bn und geht in den Zustand q8 über. (ii) und (iii) erhalten folgende Interpretation: TM ist in Zustand qf und liest b1 bewegt sich ein Feld nach rechts (R) bzw. links (L) und nimmt den Zustand q8 ein. Eine Turingmaschine TM kann in dieser Form als jede nichtleere Menge von Quadrupeln, die keine zwei Quadrupel enthält, deren erste zwei Symbole - d. h. Zustand und gelesenes Zeichen - iden tisch sind, aufgefaßt werden. Die Bedingungen, die eine Berechnung charakterisieren, müssen entsprechend verändert werden: Es läßt sich anband dieser Formulierung sehr schön zeigen, wie eine solcherart formulierte Turingmaschine ebenfalls als eine Menge von Regeln geschrieben werden kann. Für (i) ergibt sich die Regelform2 qrb1 --t bnq8 ftir (ii) qrb1 --t b1q8 und (iii) erhält die Form: qrb1 --tq8ob1 , mit o € B. Wenn man sich nun vergegenwärtigt, daß die Modeliierung des Verhaltens der Neuronen des Gehirns zum Konzept des endlichen Automaten führte, indem das "Gehirn" als passiv Reizen ausgesetzt betrachtet wird, so kann das Gehirn bei der Modeliierung durch eine Turingmaschine, die ein Ge samtsystem bestehend aus endlichem Automaten (Gehirn) und Band (Um welt) darstellt, interpretiert werden als ein endlicher Automat, der mit sei ner Umwelt aktiv in Interaktion tritt. Das Gehirn empfängt bei dieser Modellierung also nicht mehr passiv Reize und verarbeitet Informationen nicht mehr allein in Abhängigkeit von früherer Erfahrung� Da eine Darstellung durch ein Regelsystem ebenfalls möglich ist, dürfte nochmals klar geworden sein, was es heißt, wenn in der Kognitionswissen schaft davon gesprochen wird, daß der "menschliche Geist bzw. das Gehirn" Regeln als Repräsentationen kognitiver Bereiche ausgebildet habe:4 Aber auch die Idee des Programmierens (des Programmes) kann durch die Turingmaschine erhellt werden. Allerdings bringt eine andere Darstellungs form diese besser zum Ausdruck: es handelt sich um die Wang-Formulierung der Turing-Maschine.
1)
Über diese
Form der Formulierung informiert Hall Partee 1978, 162 ff.
2) vgl. z. B. Hall Partee
Formulierungen.
1978, 165
u.
166.
Sehr ausführlich entwickelt Nelson
1968
diese
3) Seinen Ausdruck findet dieses "aktive" Verhalten durch die Möglichkeit der Verän· derung der Bandsymbole durch Löschen und Schreiben durch die Turingmaschine,
während der endliche Automat nur liest. 4) so
z.
B.
Chomsky 1980.
137 2. 2. 4. 3. 2. 2
Die Wang-Formulierung einer Turing-Maschine
Eine Wang-Turing-Maschine (WTM) benutzt nur zwei Symbole auf ih rem Band { I, "}, die auch durch 0 = " und I = 1 dargestellt werden (vgl. Sampson 1976). Es gibt sechs Grundinstruktionen: "
+
* j(n)
schreibe auf das gerade untersuchte Feld ein Leerzeichen (Blank) """ schreibe auf das gerade untersuchte Feld einen Strich I bewege den Lesekopf ein Feld nach rechts bzw. das Band nach links bewege den Lesekopf ein Feld nach links bzw. das Band nach rechts stop; die Arbeit der Maschine ist beendet wenn das Feld "I" enthält, dann gehe (springe, jump) zu Instruktion n
Eine Wang-Maschine ist eine numerierte Folge von Instruktionen, die der Reihe nach durchlaufen werden. Die Instruktion j(n) erlaubt das Verzweigen, d. h. ein Abweichen von der durch die Numerierung vorgegebenen Arbeits folge. Es handelt sich um den bedingten Sprungbefehl in maschinennahen Sprachen, der in problemorientierten Programmiersprachen häufig durch die Anweisung "IF «Bedingung" THEN GO TO «Label"" realisiert wird. Die Berechnung wird unterbrochen wenn "*" oder "j(n)" den Sprung zu einem nicht vorhandenen n der Numerierung verlangt. Zwei Programme sollen zur Illustration der Arbeitsweise einer Turingma schine in der Wang-Formulierung dienen: Maschine WTM1 1 + 2 j(1) 3 I 4 + s j(4) 6 7 8
Maschine WTM2
-
1$
-
9 j(8) 10 * Die Information vor der Berechnung auf dem Band:
1
+
s
+
6
1$
7
*
2 1$ 3 + 4 j(6)
138 Das Zeichen "§" stellt den Lese-Schreibkopf dar, der das rechts von ihm stehende Zeichen liest. Er wird zu Beginn auf das erste Blank gesetzt, das links von der ersten auf dem Band stehenden Strichfolge steht, es handelt sich um die Anfangskonfiguration von WTMl und WTM2. Es erfolgen nun die einzelnen Berechnungsschritte gemäß den Anweisun gen der betreffenden Programme: Nach Schritt(en)
Nach Schritt(en)
Situation
Situation
IS § I
IS I
I IS
2,
IS I §
IS I
I IS
2
IS §
2,
IS I I § I IS I I I I IS
3
a a § Ia I a
2, 1
IS I
4, 6
IS IS § IS IS I IS
3
IS I
§ I I
I IS
7
stop
IS I
§ I
I IS
4 4 mal S, 4
I § IS I I I I IS
IS I
I § IS
6
IS I
§ I IS
7
IS I
§ IS IS
8 7 mal 9, 8
IS I
10
I I
I
IS
I IS I IS
§ I IS IS
§ IS I I I I I I
IS IS
stop
Nach Beendigung der Programme kann die jeweilige Bandinschrift - die Striche - als das Ergebnis einer Berechnung interpretiert werden. Die Endkonfigurationen der beiden Maschinen lauten: WTMl § IS I I I I I I I
IS IS
Der Leser wird sich sicherlich wieder gefragt haben, was das Drucken von "I" und "a" überhaupt soll. Ist es nicht Nonsens? Oder liegt ebenfalls eine semantische Interpretation vor?
139 In einem gewissen Sinn ist es Nonsens , denn die Turing-Maschine muß noch eine Semantik erhalten, damit sie etwas "Sinnvolles" macht. Den Zei chen müssen Bedeutungen zugeordnet werden, sie müssen zu Symbolen werden. Fassen wir 'u' als Markierung ftir ein leeres Feld des Bandes auf, so muß noch "I" eine Bedeutung zugeordnet werden. Wird bei der Maschine WTMI zu Beginn der Berechnung die Anzahl n der Striche als natürliche Zahl n interpretiert und vereinbart, daß, wenn zwei Zahlen auf das Band geschrieben werden sollen, diese durch ein Blank getrennt werden, so stehen zu Beginn der Arbeitsfolge von WTM1 zwei Zahlen k, 1 auf dem Band. Nach Ausführung des Programmes kann die auf dem Band stehende Strichfolge wieder als natürliche Zahl m € IN0 interpretiert werden. Keine Strichfolge wird als 0 interpretiert. Nach Beendigung der Operation befindet sich der Schreib-Lese-Kopf in der Anfangsposition. Eine Überprüfung wird ergeben, daß die Maschine WTM1 die bekannte zweistellige Funktion + , die Addition (k + l = m) im Be reich der natürlichen Zahlen IN0 realisiert. Auch die zweite Maschine WTM2 realisiert die Addition. Oie Anfangs konfiguration für A2 ist die gleiche wie für WTMl. Allerdings müssen in der Anfangssituation n+ 1 Striche als natürliche Zahl n interpretiert werden. Wenn die Maschine anhält, dann bilden jedoch die n Striche, welche nicht notwendigerweise zusammenhängend auf dem Band stehen müssen, das Ergebnis der Addition. Auch geht der Schreib-Lese-Kopf nicht in die An fangskonfiguration zurück. Oie Maschine WTM2 berechnet auf ähnliche Weise die Addition wie die TML: des vorangegangenen Abschnittes. Ich fasse die Ergebnisse dieses Kapitels zusammen. Es wurde gezeigt, warum davon gesprochen werden kann, daß der end liche Automat das "formale Gehirn" einer Turing-Maschine ist: In neuro physiologischer Interpretation beschreibt ein endlicher Automat, der aus Abstraktion der Nervennetzmodelle von McCulloch und Pitts (1943/1965) entstand, das Verhalten eines Nervennetzes in Abhängikeit von den Ein gaben. Seine Zustände repräsentieren die Gesamtaktivität der Axone zu einem bestimmten Zeitpunkt. Bei psychologischer Interpretation werden die Zustände des Automaten als die Geisteszustände eines Rechnenden betrachtet. Sein Verhalten während des Rechenvorganges, die Interaktion mit der Umwelt, spiegelt sich in der Manipulation der Bandsymbole wi der. Das Band ist jedoch unendlich; diese Idealisierung ist notwendig, um beliebig große Zahlen berechnen und deren Zwischenergebnisse speichern zu können, welches die Kapazität des "eigentlichen Gedächtnisses" - der Zustände des endlichen Automaten - überfordern würde. Valentin Brai tenberg (1986, 27) illustriert dies: Stellen sie sich ein Wesen vor, das ei
ne Rechnung mit Zahlen auszuführen hat, die viel größer sind als die Zahl der Teile in seinem Inneren. Man könnte mei nen, daß diese Aufgabe auf alle F älle über das Begriffsvermögen dieses besonderen Wesens
140
hinausgeht. Das muß nicht unbedingt so sein, wenn wir folgende Strategie anwenden. Wir setzen unser Vehikel an einen weiten, sandigen Strand aus. Es kann über den Sand kriechen und Abdrücke hinterlassen, welche die Aufeinanderfolge von Ziffern in den Zahlen anzeigen, wie sie bei seinen Berechnungen auftauchen. Dann kriecht es zurück und folgt dabei seiner eigenen Spur, liest noch einmal die Abdrücke und nimmt sie in die Berechnung der folgenden Stufen wieder auf. Es ist nie in der Lage, die se großen Zahlen auf einmal ganz zu erfassen. Als Teil eines umfassen den Ganzen, das auch die Umgebung mit einschließt, findet es jedoch schließlich das korrekte Ergebnis (Um ganz sicher zu gehen, müssen wir natürlich annehmen, daß die sandige Fläche unbegrenzt ist). Es braucht nur an Turings Analyse gedacht werden, und sofort ist ein rechnender Mensch gegenwärtig, der mit seiner Umgebung (dem Band) ein "physikalisches System" bildet und seine begrenzte Aufnahmekapazität somit überwindet. Weiterhin wurde d!ie Notwendigkeit dargelegt, den Zeichen eines Tu ring-Maschinen-Alphabets und dem skizzierten Arbeitsprozess eine Se mantik zu geben, wenn das Konzept der Turing-Maschine keine bloß for male Spielerei sein soll. Schon Post (1936, 104) wies ausdrücklich auf die Asemantik des Kon zeptes der "Turing-Maschine" und die Notwendigkeit eines "externen" Bedeutungsgebers hin: We do not concern ourselves here with how the
configuration of marked boxes corresponding to a specific problem, and that corresponding to its answer, symbolize the meaningful problern and answer. In fact the above assumes the specific problern to be given in a symbolized form by an outside agency and, presumably, the symbolic answer likewise to be received. Die semantisch sinnvolle Interpretierbarkeit ist eine Notwendigkeit für eine empirische Wissenschaft wie die Kognitionswissenschaft. Im Rahmen logisch-mathematischer Forschungen erhält eine Turing Maschine als Semantik Funktionen, d. h., ihre Zeichen werden als Wörter über einem Alphabet oder als Zahlen, zumeist natürliche Zahlen, inter pretiert. In diesen Fällen handelt es sich um Wort- bzw. arithmetische Funktionen, welche die Maschine berechnet. Es muß jedoch hervorgehoben werden, daß die Turingmaschine nicht nur ein Mechanismus zur Berech nung von zahlen- theoretischen Funktionen, sondern vielmehr - bei gege bener Interpretation - ein Modell eines allgemeinen Symbolverarbeitungs mechanismus ist. Der Begriff des Algorithmus wird dadurch näher bestimmt, daß gesagt wird, es handele sich um die Klasse der Funktionen, welche von einer Turing-Maschine berechnet werden. Es wird davon gesprochen, daß Tu ring-Maschinen die partiell-rekursiven Funktionen berechnen. In enger Beziehung hierzu steht auch das Konzept des Programmierens und des Mechanischen; die WTM-Formulierung bringt die sequentielle
141 Arbeitsweise des Von-Neumann-Rechners, der schrittweisen Abarbeitung eines gespeicherten Maschinen-Programmes, zum Ausdruck! Die genaue Beschreibung von Funktionen - oder anderer Prozesse und Sachverhalte ist Voraussetzung für die Bearbeitung eines Problems durch einen Com puter. Eine Programmiersprache kann als formale Sprache zur Darstellung von Algorithmen aufgefaßt werden, die den Computer veranlaßt, schritt weise von einem physikalischen Zustand zum nächsten überzugehen. Die Turingmaschine erfüllt sicherlich die weiter oben angeführten, einen Al gorithmus kennzeichnenden Kriterien a) bis g) (vgl. S. 128). Die Beschreibung einer Turing-Maschine ist ein endlicher Text, denn es gibt immer nur endlich viele Quadrupel bzw. Quintupel, die eine bestimmte Turingmaschine be schreiben. Auch handelt es sich bei ihren Operationen um elementare Operationen. Wenn die Maschine ein Ergebnis liefert, dann hält sie nach endlich vielen Schritten an. Ihre Objekte - die Zeichen - sind manipu lierbar, auch arbeitet sie deterministisch und ihre Ergebnisse sind determiniert. Bei Identifizierung des Begriffes "Algorithmus" mit dem Konzept der Turingmaschine, der Darstellung von Algorithmen durch Programmierspra chen und der Ausführung dieser Algorithmen durch einen Computer sowie der semantischen Interpretation der Turing-Maschine als Formalismus zur Berechnung arithmetischer Funktionen (partiell- rekursiver Funktionen), kann gesagt werden, daß ein Computer prinzipiell die partiell-rekursiven Funktionen berechnen kann. Es soll daher eine intuitive Vorstellung der Formulierung einer Teil menge dieser Funktionen vermittelt werden, was auch deshalb von Bedeu tung ist, weil in der Literatur der Kognitionswissenschaft auf sie Bezug genommen wird� 2. 2. 4. 3. 3
Die primitiv-rekursiven Funktionen als Teilklasse der partiell-rekursiven Funktionen
Neben Programmen und Turing-Maschinen bilden die zur Kennzeichnung der Klasse der rekursiven Funktionen benutzten Formulierungsmittel ein weiteres Modell, das zur Klärung der Konzepte "Algorithmus", "effektiv berechenbare Funktion" und "mechanisch" dient. Gleichzeitig wird ein Einblick in das Vorgehen des Mathematikers und Logikers gewonnen, wie er bestimmte Begriffe entwickelt. Außerdem findet das Konzept der "Rekursi1) Über den Aufbau und die Arbeitsweise des Von·Neumann·Rechners s. Kap. 2. 2. S. 1, S. 159 ff. 2) Johnson·Laird 1981, 1983 fordert für die Kognitive Psychologie eine Theorienbildung innerhalb des von der Theorie der Berechenbarkeil gesteckten Rahmens. Für die formale Behandlung der Beziehung zwischen partiell-rekursiven Funktionen (abkürzend auch rekursive Funktionen genannt [zur Terminologie vgl. Minsiky 1971, 239 u. 240]) und Turingmaschinen muß auf Minsky (1971, 220 ff.) verwiesen werden.
142 on" in diesem Bereich seine Klärung und Anwendung. Die Beschränkung auf die Formulierung der Menge der primitiv-rekursiven Funktionen scheint mir gerechtfertigt, da der größte Teil der in der angewandten In formatik benutzten Funktionen sich als primitiv-rekursiv erweist� Als Beispiel soll die rekursive Definition der Additionsfunktion plus der na türlichen Zahlen dienen� Stellt man sich oder anderen die Frage "Warum 1 ... 3 = 4 ist", so wird man häufig unbefriedigende Antworten wie "dies habe man eben gelernt" erhalten. Sucht man weiter nach einer Begründung, könnte man auf die Idee kommen, daß, wenn man von einfachsten Funktionen ausginge, deren Aus führung und Ergebnis offenkundig wären und deren Ergebnisgewinnung ei gentlich nicht anzuzweifeln wäre, man eine Basis für die Bestimmung komplexerer Funktionen hätte, die aus diesen Grundfunktionen zusammen gesetzt wären und deren Wertbestimmung ebenfalls durch Zurückführung auf die Grundfunktionen gesichert wäre, wenn die Mechanismen für den Aufbau komplexer Funktionen aus einfachen Funktionen bekannt wäre. Auf diese Art und Weise wird die Klasse der primitiv-rekursiven Funktionen beschrieben. Es werden Grundfunktionen angegeben und die Mechanismen, mit denen aus diesen Grundfunktionen komplexere Funktio nen und dann aufgrund der Mechanismen weitere, noch komplexere Funk tionen erzeugt werden können. Als Grundfunktionen werden die Nullfunk tion Z, die Nachfolgerfunktion succ und die Projektionsfunktionen U� ge nommen. Ihr Anwendungsbereich ist die Menge der natürlichen Zahlen IN0. Die einstellige Nullfunktion Z macht nichts anderes, als daß sie bei ir gendeiner natürlichen Zahl als Argument den Wert Nu11 liefert. Man kann sich gut vorstellen, daß die Bestimmung des Wertes sich als unproblema tisch erweist. Die einstellige Nachfolgerfunktion succ scheint auch nicht weiter kom pliziert: Sie liefert für jede natürliche Zahl die auf sie folgende Zahl. Wenn jetzt eingewandt wird, man müsse schon die natürlichen Zahlen kennen und zählen können, kann entgegnet werden, daß man sich Zahlen, wie in den vorangegangenen Beispiel, durch Striche repräsentiert denken kann; es macht sicherlich keinerlei Probleme, der Aufforderung zu folgen, an diese Strichliste einen weiteren Strich anzufügen. Die n-stelligen Projektionsfunktionen U[' sind Funktionen mit n Argu menten, aus denen entsprechend dem Subskript i das i-te Argument aus gewählt wird und das Ergebnis der Funktion ist. Der erste Schritt in der Definition der Menge der primitv-rekursiven Funktionen besteht demge mäß aus der Definition der Grundfunktionen. la) Die Nullfunktion Z ist eine primitiv-rekursive Funktion: Z(x) = 0. 1) vgl. Kfoury, Moll & Arbib 1982, 206. 2) Ich folge Kfoury, Moll & Arbib 1982, 205 - 207; man vgl. aber auch Minsky 1971, 143 ff. u. bes. S. 220 ff.
143 1 b) Die Nachfolgerfunktion succ ist eine primitiv-rekursive Funktion: succ(x) = x + 1
1c) Die Projektionsfunktionen U� sind primitiv-rekursive Funktionen: U�(x1, ... , x., . . . xn ) = xi für alle i mit 1 � i � n Im nächsten Schritt werden zwei Verfahren bestimmt, die es gestatten, ausgehend von primitiv-rekursiven Funktionen neue primitiv-rekursive Funk tionen zu erzeugen: Es handelt sich um die Funktionskomposition und die primitive Rekursion. Bei der Komposition wird durch Einsetzung von k n-stelligen primitiv-re kusiven Funktionen g in die k-stellige primitiv-rekursive Funktion h eine weitere primitiv-rekursive Funktion gewonnen. 2a) Wenn g1, ... , gk und h primitiv-rekursive Funktionen sind, mit h: IN0 � IN0 und für jedes j, 1 � j � k, gj' IN� IN0 gilt, dann ist h( g l (x 1• ... , xn), ... , gk (x 1, . , Xn)) eine primitiv-rekursive Funktion. Die primitive Rekursion ermöglicht die Definition einer Funktion f durch Rekursion über ihren Namen, d. h. der Wert einer Funktion f mit dem Argument n + 1 wird bestimmt durch Rückgriff auf den Wert der Funktion f, die als Argument den Vorgänger von n + 1 hat, nämlich n. Damit diese Rekursion auch einen Wert liefert, muß eine Terminationsbe dingung gegeben werden. Die Definition weiterer primitiv-rekursiver Funktionen mittels der primitiven Rekursion erfolgt daher in zwei Schritten. 2b) Wenn g eine k-stellige und h eine k+2-stellige primitiv-rekursive Funktion ist, d. h. g: IN� � IN0 und h: IN�+2 � IN0, dann ist die folgende Funktion f ebenfalls primitiv-rekursiv: Abbruchbedingung der Rekursion: f(O, x1 , ... , xk) = g(x1 , ... , xk) Der Rekursionsschritt: f(n+1, x1, ... , xk) = h( f(n, x1 , ... , xk), n, x 1 , .. , xk) Die Funktion h erhält also den Wert von n, sowie x1, .. , xk und den Wert der Funktion f bei diesem Argument als Argumente. Durch 1a, 1b, lc sowie2a und 2b wird die Menge der primitiv-rekursiven Funktionen definiert. Die Additionsfunktion plus kann nun in folgender Weise rekursiv defi niert werden: 1
1
.•
->
.
.
Abbruchbedingung = U� (x1)
plus(O, x 1 ) = g(x1)
x1
Rekursionsschritt
plus(n + 1, x1 ) = succ(� (plus(n, x1 ), n, x1))
Bei dieser Definition ist h(y1, y2, y3) = succ(U� (y1, y2, y3 )) mit plus(n, x1), y2 = n und y3 x1. Die Funktion h ist in diesem Fall 3 schon durch Komposition der beiden Grundfunktionen succ und U ent standen, indem nach 2a - der Funktionskomposition - U3 = g1 ist und in h = succ eingesetzt wurde. y1
=
=
144 Wie zu erkennen, ist die explizite Definition primitiv-rekursiver Funktio nen sehr langwierig und umständlich, daher werden in der Praxis verkürzte rekursive Definitionen für Funktionen angegeben. Die Funktion plus nimmt dann die Definition an: Abbruchbedingung plus(O, x) = x Rekursionsschritt plus(n+ I, x)
=
succ((plus n, x))
Die volle Klasse der partiell-rekursiven Funktionen wird durch einen weiteren Bildungsvorgang mittels eines sogenannten v.- Operators, dem Minimalisierungsoperator, erreicht. Die Kenntnis der Arbeitsweise dieses Operators ist für die weiteren Erörterungen nicht notwendig, daher wird auf seine Darstellung verzichtet. Was habe ich bisher gezeigt? Die Klärung der intuitiven Konzepte "Algorithmus", "effektiv berechen bare Funktion" und "mechanisch" führte zum Konzept der "Turingmaschi ne" und der "partien-rekursiven Funktion", für die jeweils eine formale Definition gegeben werden kann. Bei den von einer Turingmaschine be rechneten Funktionen handelt es sich um die Klasse der partiell-rekursi ven Funktionen, während wiederum jede partiell-rekursive Funktion von einer Turingmaschine berechnet werden kann. Diese Konzepte sind also äquivalent. Somit erfährt der intuitive Begriff der "effektiv berechenbaren Funkti on" durch Identifizierung mit der Klasse der partiell rekursiven Funktion seine Explikation. Es kann daher auch gesagt werden: (CT) Wenn eine Funktion effektiv berechenbar ist, so ist sie auch mittels einer Turingma schine berechenbar, d. h., sie gehört zu der Menge der partiell-rekursi ven Funktionen. Es handelt sich hier um die Church-Turing-These, die nicht be weisbar ist, da sie den intuitiven Begriff der "effektiv-berechenbaren Funktion" mit einem formalen Konzept wie dem der "Turingmaschine" in Verbindung bringt. Es kann angenommen werden, daß, wenn diese These ihre Richtigkeit behält, eine Grenze des menschlichen Denkens aufgezeigt wurde, da dann auch in Zukunft alles, was sich genau, d. h. mittels Al gorithmus, beschreiben läßt, prinzipiell auch innerhalb des Turingmaschi nenformalismus formulierbar ist. Darüber hinaus ist es prinzipiell "me chanisch" durch einen Computer abzuarbeiten. Post (1936, lOS) sprach in Ansehen der Bedeutung dieser These; die Church in Form einer Definition einführte, Post hingegen als Arbeitshypo these verstanden wissen wollte, daher auch von einer Grenze des mathe-
1) Eine Diskussion der verschiedenen Argumente für und gegen diese These gibt Daten 1983, s. 451-454.
145 matischen Denkens des Menschen: And to our mind such (a working hy pothesis; U. S.) is Church's identification of effective calculability with recursiveness. Und Emil Post (1936, lOS Anm.) ergänzt: Actually the work already done by Church and others carries this identification considerably beyond the working hypothesis stage. But to mask this identification under a de finition hides the fact that a fundamental discovery in the limitations of the mathema ticizing power of the Homo Sapiens has been made and blinds us to the need of its continual verification. Diese These bildet einen - wenn nicht sogar den - Pfeiler der Kogniti onswissenschaft, denn die Forderung nach Computersimulation und Theo rienbildung im Rahmen des Berechenbaren bei der Untersuchung mentaler Phänomene führt alle anderen Versuche, "exakte kommunizierbare" For schung zu betreiben, unweigerlich zur Stützung der kognitionswissen schaftlichen Forschung und Thesen. Weiterhin wurde ersichtlich, daß das Konzept des "Algorithmus" eng verknüpft ist mit dem der "Repräsentation", denn die zu bearbeitenden Objekte müssen über eine ihnen entsprechende Repräsentation manipulier bar sein. Diese Repräsentation wiederum hat Einfluß auf den Ablauf des Algorithmus. So ergibt sich aus den besprochenen Beispielen, daß es ver schiedene Algorithmen für die Realisierung einer Funktion gibt. Bei ex tensionaler Betrachtung wird eine Funktion mit der Menge der sie erfül lenden geordneten Paare identifiziert (vgl. Minsky 1 971 , 178 u. 180). Das Paar ((t, 1), 2) erfüllt die Additionsfunktion, wohingegen das Paar ((t, 1), 3) sie nicht erftillt. Die Additionsfunktion wurde einmal realisiert durch Einfügen eines Striches anstelle des die zwei Strichfolgen trennenden Leerzeichens und Streichen eines weiteren Striches, ein .anderes Mal durch ein Wegstreichen von zwei Strichen, außerdem durch eine rekursive Abarbeitung der rekursiven Definition� die auf die Definition der Addition durch elementare · Funktionen und die Mechanismen der Funktionskomposi tion und primitiven Rekursion zurückgriff. Darüberhinaus wurde ersicht lich, wie die Idee einer genauen Beschreibung, vermittelt durch den Begriff des Algorithmus, innerhalb der Theorie der Turingmaschinen ihre Explikation fand. Programmiersprachen sind als Mittel zur Formulierung von Algorithmen zu verstehen. Ein Programm ist folglich ein in einer bestimmten Pro grammiersprache abgefaßter Algorithmus. Die Realisierung von Algorith men durch den Computer bildet das Bindeglied zwischen der abstrakten Theorie rekursiver Funktionen und Automaten. An dieser Stelle beginnt der experimentell-empirische Bereich kognitionswissenschaftlicher For schung, indem die vermuteten, vom Gehirn/Geist durchgeflihrten Berech nungen auf einem Computer simuliert werden können. Programmieren I) vgl. Kap. 2. 2. 6, S. 170 ff.
146
bzw. Implementieren effektiver Prozesse wird somit zu einem grundle genden Bestandteil empirischer kognitionswissenschaftlicher Arbeit bei der Erforschung mentaler Prozesse. Minsky (1971, 143 u. 44) schreibt: Es trifft zweifellos zu, daß das Programmieren - die Aufgabe für einen Computer in ihren Enzelheiten i festzulegen - darauf hinausläuft, von vorn herein alles, was der Computer tun wird, zu bestimmen. In diesem Sinne kann das Programm eines Computers als eine genaue Beschreibung des Verfahrens dienen, das die Maschine durchführen wird, und in dem glei chen Sinn ist es richtig, zu behaupten, das alles, � .YQ!! einem Compu ter ausgeführt werden kann, sich genau beschreiben läßt. Weiterhin merkt er (Minsky 1971, 144) an: Oft bekommen wir die gegenteilige Behauptung zu hören, die darauf hinausläuft, daß ((C); U. S.) jedes Verfahren, das genau beschrieben werden kann, sich auch program mieren läßt, um von einem Computer durchgeführt zu werden. Die These (C) wird auch als kybernetische These 1 bezeichnet und steht in enger Beziehung zur Church-Turing-These (CT). Denn Minsky2 (1971, 145) fragt: Welche Vorgänge Jassen sich beschreiben ? Ganz gewiß bedarf der Begriff der Beschreibung einer Sprache. Könnte irgendeine festumris sene Sprache die Beschreibung aller beschreibbaren Vorgänge ermögli chen? Könnte es Vorgänge geben, die irgendwie zwar gut definiert sind, sich jedoch ganz und gar nicht beschreiben Jassen ? ·Man könnte den Standpunkt vertreten, es könnte bestimmte Vorgänge geben, deren Mit teilbarkeit die Übertragung einer geistigen Einstellung oder Fähigkeit voraussetzt, die sich nicht in einer bestimmten Anzahl von Wörtern begreifen läßt - die also intuitiv bleiben muß. Marvin Minsky ( 1971, 145) findet dann die Antwort im Konzept des effektiven Verfahrens - des Algorithmus: Schon vor dem Aufkommen der Computer hatten solche Fragen die Mathematiker seit einiger Zeit be schäftigt. Sie sind mit der Idee eines Algorithmus - eines effektiven Verfahrens - zur Berechnung des Wertes einer gewissen Menge oder zum Erarbeiten einer Lösung für eine gewisse mathematische Aufgabe verbunden. Die Idee eines Algorithmus oder eines effektiven Verfahrens tritt jedesmal dann auf, wenn wir es mit einer Reihe von Anweisungen über Verhaltensweisen zu tun haben. Dies geschieht, wenn wir im Verlauf unserer Arbeit an einer Aufgabe entdecken, daß ein bestimmtes Verfah ren, richtig durchgeführt, uns am Ende die Antwort liefern wird. Es dürfte klar sein, daß die Sprachen zur Formulierung von Algorith men die Programmiersprachen sind. Eine von ihnen ist die Programmier sprache LISP, die besonders auf den Verfahren der Funktionskomposition und der Definition rekursiver Funktionen basiert und für Probleme der Forschung der Künstlichen Intelligenz entwickelt wurde. Eng mit der Idee 1) vgl. die Ausführungen in Kap. 2. 2. 4. 2, S. 118 ff.; speziell den Abschnitt über TO TE-Einheiten. 2) siehe auch die ausführliche Diskussion in Minsky 1971, 143-159.
147 einer listenverarbeitenden Sprache wie LISP, die ebenfalls die Beschrei bung der partiell rekursiven Funktionen gestattet\ ist die Idee des Physi cal-Symbol-System verknüpft� Besonders im Hinblick auf diese beiden Aspekte ist LISP für die Kog nitionswissenschaft von besonderer Bedeutung, denn prinzipiell kann jeder Algorithmus, der in LISP ausgedrückt wird, in jeder anderen Program miersprache und umgekehrt jedes effektive Verfahren, das in einer ande ren Programmiersprache niedergelegt wurde, ebenfalls in LISP formuliert werden. Es müssen nur gewisse minimale Konstrukte zur Formulierung von Algorithmen vorhanden sein? Verfügt man in einer Programmiersprache mindestens über die Kon strukte der natürlichen Zahlen, der Wertzuweisung (assignment state ment.), der if-Anweisung (conditional statement), der while-Anweisung (while Statement) und das Mittel der Sequentialisierung (in Pascal und C z. B. durch ";" ausgedrückt), so kann man in dieser Sprache ftir jede ef fektiv berechenb�re Funktion prinzipiell einen Algorithmus angeben. Er setzt man die while-Anweisung durch eine for-Anweisung, so kann man nachweisen, daß mit diesen Konstrukten Progamme erstellt werden kön nen, die genau die primitiv-rekursiven Funktionen berechnen. Dies bedeu tet, daß z. B. die Ackermann-Funktion, die nicht primitiv-rekursiv ist, mit diesen Konstrukten nicht berechnet werden kann. Auch besteht keine Möglichkeit, eine Endlosschleife zu programmieren, denn die for-Anwei sung bricht immer ab. Werden nur die for-Anweisung (ohne Veränderung der Schrittweite und Endwerte innerhalb der Schleife), if-Anweisung, Wertzuweisung und Sequentialisierung zugelassen, so !können, wie schon erwähnt, genau die primitiv-rekursiven Funktionen bereclhnet werden� Es gilt also, daß jede durch ein Programm berechnete Funktion eine partiell-rekursive Funktion ist. Jede effektiv berechenbare Funktion kann nach der Church-Turing-These - mit einer Programmiersprache beschrieben werden, wenn sie mindestens folgende Konstrukte beinhaltet:5 - while-Anweisung; Sequentialisierung; Wertzuweisung oder 1)
näheres hierzu vgl. Minsky 1971, 247 ff. bes. 248 u. 251 ff. 2) man vgl. auch die Kap. 2. 2. 4. 2, S. 118 ff. u. Kap. 2. 2. 6, S. 170 ff. 3) Die einzelnen Nachweise sind kompliziert und erfordern viel Raum, es können da her nur einige interessante Aspekte genannt werden, für weitere Ausführungen muß auf Kfoury, Arbib und Moll 1982 verwiesen werden. 4) Johnson-Laird 1983, 22 setzt die Kontrollstrukturen von Programmiersprachen in folgender Weise zu den Konstruktionsverfahren der partiell-rekursiven Funktionen in Beziehung: Funktionskomposition - Unterprogramme (Subroutinen); primitive Rekursion - einfache iterative Schleife (loop; z. B. For-Schleifen); Minimalisierungsoperator (tL-Operator) - While-Schleifen (while loops). 5) Dieses wird in Kfoury & Moll & Arbib 1982, 1 - 44 nachgewiesen.
148 - if-Anweisung (conditional statement; Fallunterscheidung); Sprung Anweisung (go to); Sequentialisierung; Wertzuweisung (assignment Statement)
oder - if-Anweisung (Fallunterscheidung); Mittel zur Definition rekursiver Funktionen; Einsetzung von Funktionen ineinander (LISP) Wie zu sehen, reichen für LISP die schon bekannten Mittel der rekur siven Definition und der Funktionskomposition, ergänzt um die Fallunter scheidung1 aus, um Algorithmen zur Berechnung der partiell rekursiven Funktionen zu formulieren. Die zentralen Prozeduren und Strukturen die ser so wichtigen Sprache sollen im nächsten Abschnitt vorgestellt werden.
I) Die Bedeutung der Fallunterscheidung in LISP für die Konstruktion partiell·rekursi· ver Funktionen wird in Minsky !971, 248 erörtert.
149 2. 2. 4. 3. 4
Die Programmiersprache LISP
Programmiersprachen sind ein Mittel zur Formulierung von Algorith men. Für die Kognitionswissenschaft und die Künstliche Intelligenz gilt LISP als "klassische" Programmiersprache. Auch in der Musikforschung und Computermusik zeigen sich Tendenzen, sich ihr verstärkt zuzuwenden� LISP wurde gegen Ende der 50er Jahre im Rahmen eines Forschungs projektes zur Künstlichen Intelligenz von John McCarthy entwickelt. Gleichzeitig sollte die Beschreibung von LISP eine Darstellung der par tiell-rekursiven Funktionen leisten und somit als Darstellungsmittel in der Rekursionstheorie dienen? Allerdings gibt es bis heute keine normierte Form dieser Sprache� Es kann an dieser Stelle jedoch keine Einführung in die Programmierung mit LISP geleistet werden� deshalb soll nur der Kern der LISP-Prozeduren mit den entsprechenden Formulierungmitteln zur Bildung komplexer Prozeduren sowie den spezifischen Datenstrukturen vorgestellt werden. Dennoch reichen die vorgestellten Konzepte aus, um beliebige Algorithmen zu formulieren, d. h. es sind die partiell-rekursiven Funktionen mit ihnen berechenbar; bzw. es können die aufzählbaren Mengen mit ihnen beschrieben werden. Diese Konstrukte weisen also die gleiche Leistungsfähigkeit wie die Turingmaschinen auf. "LISP" ist ein Akronym für list processing und deutet das grundlegende Objekt von LISP an: die Liste. Eine Liste wird in LISP durch eine öff nende "(" und eine schließende ")" Klammer dargestellt. Ergänzt wird dieses Konzept durch ein weiteres grundlegendes LISP-Objekt: das Atom. Ein Atom kann als ein nicht weiter zerlegbarer Name - Konstante oder Variable - für ein zu repräsentierendes Objekt betrachtet werden, wobei man numerische Atome von literalen Atomen unterscheidet. Numerische Atome werden aus Ziffern gebildet und sind Namen für Zahlen bestimm ter Zahlbereiche. So ist z. B. die Ziffernfolge "12.5" ein Name für die Zahl 12,5. Die literalen (symbolischen) Atome oder Symbole sind Zeichen ketten, die nicht mit einer Ziffer beginnen dürfen. Bei den literalen Atomen können Konstanten und Variablen unterschieden werden. Dies geschieht durch die spezielle LISP-Prozedur QUOTE, die durch " ' " abgekürzt wird. Beispiele: 1) Viele der von mir besprochenen Arbeiten zur Kognitiven Musikwissenschaft benut zen LISP zur Modellierung; vgl. besonders Kap. 3. 2. 1, S. 253 ff.; Kap. 3. 2. 2., S. 272 ff. sowie die Tabelle Anhang E. Rahn 1990 und Desain 1990 heben ebenfalls die Bedeutung von LISP für die Musikforschung und Computermusik hervor. 2) Zur Entwicklungsgeschichte von LISP vgl. McCarthy 1978. 3) Eine Genealogie verschiedenener LISP-Dialekte geben Hußma.nn, Schefe & Fittschen 1988, 8 ff.
4) Es sei auf die Lehrbücher von Winston & Horn 1989 und Stoyan & Görz 1986 hinge wiesen. Kompakte Überblicke zur Struktur von LISP geben McCarthy 1978 u. Allen 1979 sowie Barr & Feigenbaum 1981.
150
Variable: Y3, NAME, AD2 Konstante: (QUOTE NAME) bzw. 'NAME Sowohl ein Programm als auch die zu verarbeitenden Daten werden in LISP als Listen dargestellt. Dies ermöglicht es LISP, ein LISP-Programm als Datum aufzufassen und zu manipulieren. LISP weist somit eine ge wisse Form der "Selbstreferenz" auf. Eine Listenstruktur wiederum kann Listen oder Atome als Elemente enthalten. Ein Beispiel möge einen Teil der bisher eingeführten Bezeichnungen illustrieren. (MULT (ADD DREI FUENF) 2) Die obige Liste enthält drei Elemente: Zwei Atome, davon ein Iiterales Atom - "MULT" -, ein numerales Atom "2", und eine Liste mit drei weiteren Elementen "(ADD DREI FUENF)". Listen und Atome werden zusammenfassend als Ausdrücke bzw. symbo lische Ausdrücke bezeichnet.1 Literale Atome mit besonderer Bedeutung sind T und NIL. Während "T" den Wahrheitswert wahr repräsentiert, kommt "NIL" eine mehrfache Bedeutung zu. So repräsentiert "NIL" einerseits den Wahrheitswert falsch, andererseits aber auch die leere Liste ( ). Eine weitere Struktur muß noch erwähnt werden, auch wenn sie selten benutzt wird: das Punktepaar (dotted pair). Zwei Atome können zu einem Punktepaar zusammengefügt werden. So können die Symbole "HANS" und "MANN" mittels einer speziellen Prozedur zu dem Punktepaar (HANS . MANN) zusammengesetzt werden. Punktepaare können Atome und Punktepaare als Elemente enthalten. Li sten werden als Punktepaare ( dotted pairs) implementiert. Die Liste (HANS MANN) ist als Abkürzung für das Punktepaar (HANS . (MANN . NIL)) zu lesen. Es lassen sich insgesamt folgende elementare Datentypen von LISP unterscheiden:
Die symbolischen Ausdrücke wurden besonders fl.ir die Symbolverarbei1) vgl. Winston & Horn 1989,
13
u. 54.
151
tung in der Künstlichen Intelligenz entwickelt. Um die grundlegenden Prozeduren von LISP einzuft.ihren, gebe ich zuerst noch einmal Definitio nen der grundlegenden Datentypen (-strukturen).1 Oie Menge S(A) der symbolischen Ausdrücke (s-expressions) von LISP kann induktiv wie folgt definiert werden. Es sei A die Menge der Atome, die auch T und NIL enthält. I) Jedes a E A ist ein symbolischer Ausdruck, d. h. a E S(A). 2) Wenn sl und s2 symbolische Ausdrücke sind, dann ist das Punkte paar (dotted pair) (sl . s2) ebenfalls ein symbolischer Ausdruck. 3 ) Nur die nach I und 2 erzeugten Ausdrücke sind symbolische Ausdrücke. Die beiden besonders ausgezeichneten Atome NIL und T dienen nun dazu, das erste wichtige LISP-Prädikat zu definieren, das die Unterschei dung der Atome von den Punktepaaren in der Menge der symbolischen Ausdrücke ermöglicht. ATOM: S(A) � {T, NIL} mit
ATOM(s) =
{
T, wenn s
€
A
NIL, sonst
In LISP versucht der Interpreter normalerweise, das erste Atom einer Liste als Name einer auszuführenden Prozedur zu interpretieren. Oie Prozedur ATOM kann in einem LISP-System wie folgt aufgerufen werden. ) (ATOM 'HANS) Die Auswertung (Evaluierung) der Liste durch das System führt zu der Funktionsanwendung der Prozedur ATOM auf das symbolische Atom HANS (eine Konstante) und liefert als Wert T. Dagegen liefert die Aus wertung von ) (ATOM '(HANS . MANN)) den Wert NIL, da es sich um ein Punktepaar handelt. Wichtig ist noch, zu sehen, daß das Punktepaar mit " ' "quotiert wur de, um dem System kenntlich zu machen, daß es sich um ein Datum handelt und somit zu sich selbst auswertet. Der von dem LISP-System durchgeführte Zyklus des Einlesens, Auswertens und der Ergebnisausgabe wird als Read-Eval-Print-Loop bezeichnet. Hatte ich schon gesagt, daß eine Liste als Punktpaar implementiert ist, so sollen jetzt zwei Darstellungsformen für die Punktepaare gegeben werden. Ein Punktepaar wie (HANS . (MANN . NIL)) kann als Baumstruktur, speziell als L-Baum, dargestellt werden. I) Für die weiteren Ausführungen vgl. auch Arbib, Kfoury und Moll 1981,
65
ff.
152 Wurrel - · ······ ·
�
�: : ::· :: �
:�-��
Knoten �'�::::
�ns ...�-------_."-::;.. 11ann Bl att--:::::::.' "-
'-....._
-- �
................................
NIL
Ein L-Baum ist eine Ansammlung von Linien - auch als Äste bezeich net - , deren Enden Knoten genannt werden. Jeder Knoten ist entweder an der Spitze zweier Äste oder an der Spitze keines einzigen Astes, d. h., er ist normalerweise Knoten eines auslaufenden Astes und wird Blatt genannt. Im letzten Fall - den Blättern - wird auch von terminalen Knoten gesprochen, die mit Atomen gekennzeichnet werden. In der obigen Ab bildung sind die Markierungen die Atome HANS, MANN und NIL. Die anderen Knoten werd-en auch nichtterminale Knoten genannt. Ein spezieller nichtterminaler Knoten ist die Wurzel, die keinen wei teren nichtterminalen Knoten über sich hat und von der aus alle termina len Knoten erreichbar sind. Die Baumdarstellung von symbolischen Ausdrücken läßt sich wie folgt definieren: 1 ) Wenn a � A, dann ist der repräsentierende Baum T(a) einzelner Kno ten, der mit a markiert wurde. 2) Wenn sl und s2 symbolische Ausdrücke sind, die durch die Bäume T(sl) und T(s2) dargestellt werden, dann wird das Punktepaar (sl . s2) durch
T(s2) T(sl) repräsentiert. 3) Nur die nach 1 ) und 2) erzeugten Strukturen sind symbolische Aus drücke repräsentierende L-Bäume. Ein komplexeres Beispiel möge dies illustrieren: Dem Punktepaar ((HANS . MANN) . (TRIFFT . (SEIF . MANN))) entspricht die Baumstruktur T ( ((HANS MANN) . (TRIFFT . (SEIF . MANN))) ) .
Seif
Hann
153
An die physikalische Realisierung durch Speicherplätze in einem Com puter wird bei der Darstellung durch die Box-Notation 1 gedacht. Jeder nichtterminale Knoten eines L-Baumes wird durch eine Box mit zwei Pfeilen ersetzt.
Die Pfeile können als Zeiger auf einen Speicherbereich aufgefaßt wer den, d. h., der Inhalt der durch die Boxhälfte repräsentierten Speicher stelle ist als Adresse einer anderen Speicherstelle zu interpretieren. Die terminalen Knoten werden durch eine Box repräsentiert, welche die Markierung - das Datum - des entsprechenden Knotens enthält. Der Speicherinhalt wird als Datum interpretiert.
A ®
a
HIL
In Box-Notation ergibt sich für die Beispiele folgende Darstellung: ((HANS . MANN) . (TRIFFT . (SEIF . MANN)))
(HANS
MANN)
'r'+�a � I Ma nn I
bzw.
(HANS . (MANN . NIL))
bzw.
Bisher hatte ich nur eine Erkennungsprozedur angeben. Damit man je doch überhaupt die benötigte Struktur der Punktepaare erzeugen kann, 1)
In Winston & Horn 1989, 233 ff. bes. 236 wird die Beziehung zwischen Speicher struktur und Box-Notation für Listenstruktur dargestellt.
154
muß es eine Prozedur geben, die aus den Atomen und schon erzeugten Punktepaaren neue Punktepaare erzeugt. Diese Konstruktionsfunktion wird "CONS" genannt und erhält folgende Definition: CONS: S(A)
-4
S(A) mit CONS(sl, s2) = (sl . s2)
In LISP ergibt sich folgender Aufruf: ) (CONS '(HANS . MANN) 'RAUCHT)) Der Aufruf liefert als Wert das Punktepaar: ) ((HANS . MANN) . RAUCHT) Um auf den geschilderten Strukturen arbeiten zu können, benötigt man Prozeduren, die den Zugriff auf das erste bzw. das zweite Element eines Punktepaares ermöglichen. Es handelt sich um partielle Funktionen, die nicht für alle Argumente a aus der Menge der symbolischen Ausdrücke S(A) einen Wert liefern, d. h., sie sind nicht für alle Argumente defi niert. Die Funktion, die das erste Element liefert, wird "KOPF" (head) genannt und auf folgender Weise definiert:
mit
{ KOPF(a)
KOPF: S(A) r
-4
S(A)
ist undefiniert, wenn a E A, d. h. ein Atom ist KOPF((sl . s2) ) = sl, liefert sonst das erste Element eines Punktepaares =
.
Die zweite Funktion, die den Rest - das zweite Element - gibt, wird "REST" (tail) genannt: REST : S(A) -4 S(A) mit
{
REST (a)
= f,
ist undefiniert, wenn a
E
A
REST ( (sl . s2) ) = s2, liefert das zweite Element (den Rest) eines Punktepaares
In LISP treten diese Funktionen als CAR (content adress register) für KOPF und CDR (content decrement register) für REST in Erscheinung. Diese etwas ungewöhnliche Bezeichnung hat ihren Ursprung darin, daß die erste Hälfte des Speicherinhaltes einer Adresse der IBM 7090, auf der man LISP entwickelte, als adress register bezeichnet wurde, und die zweite Hälfte des Wortes decrement register genannt wurde. Zwei Auf rufe sollen die Arbeitsweise dieser beiden Prozeduren illustrieren. Es sei daran erinnert, daß (A) als Abkürzung für (A . NIL) steht. Der Aufruf von ) (CAR '(A)) liefert ) A. Die Auswertung von ) (CDR '(A)) ergibt dagegen die leere Liste "( )". Ein weiteres grundlegendes Prädikat, das benötigt wird, ist EQ. EQ prüft, ob zwei Atome gleich sind.
155
EQ(sl, s2)
{
EQ: S(A) X S(A)
�
{T , NIL}
T, wenn sl, s2 Atome sind und sl
s2
NIL, sonst
Des weiteren werden Konstrukte benötigt, die den Informationsfluß bei der Abarbeitung des Programmes steuern. In der reinen funktionalen Pro grammierung ist die Funktionskomposition das Mittel, um die Ausführung eines Programmes zu kontrollieren. Es handelt sich um die Schachtelung von Funktionen. Die innerste Funktion (Prozedur) wird zuerst ausgewertet und liefert den Wert für die nächste Funktion. Hat eine Funktion mehre re Argumente, so werden diese zuerst ausgewertet. Die Werte dieser Argumente dienen dann der Funktionsanwendung, die durch den Namen der Funktion angezeigt wird, als Argumente. Das folgende Beispiel zeigt eine Funktionskomposition und deren Aus wertungsschritte. Aufruf: ) (CAR (CDR (CDR (CAR '((A B C) D))))) Zuerst wertet die quotierte Liste ((A B C) D) der innersten Prozedur zu sich selbst aus, und die Funktionsanwendung von CAR übergibt als Wert die Liste (A B C) an die restlichen drei Prozeduren CAR, CDR und CDR: (CAR (CDR (CDR (A B C)))) Die nächsten beiden Funktionsanwendungen (von CDR) liefern die Liste (C), auf welche die Funktion CAR angewandt wird und als Ergebnis den Wert C ergibt: ) C Um Verzweigungen des Informationsflusses zu ermöglichen, gibt es in LISP ein Konstrukt, das die Fallunterscheidung ermöglicht. Es handelt sich um eine Verallgemeinerung des aus den imperativen Programmier sprachen bekannten "IF ... THEN --- ELSE �". Die allgemeine Form des Konditionals hat die Form: (COND
(Bl SEI) (B2 SE2)
(Bn SEn) Das Konstrukt COND ist wie folgt zu lesen: Wenn die Bedingung Bl zu nicht-NIL auswertet, dann werte SEI aus und gib den Wert zurück. Ist der Wert von BI NIL, so gehe zu B2 und verfahre in derselben Wei se. Führe dies solange durch, bis entweder eine Bedingung zu nicht-NIL auswertet, oder bis Bn erreicht ist. Ist der Wert von Bn ebenfalls NIL, so ist der Wert von COND undefiniert. In LISP liefert COND in diesem Fall NIL, so daß als dritte Bedeutung von NIL 'undefiniert', d. h. r,
156
festgehalten werden muß (vgl. Schefe 1985, 77). Formen wie COND und ' werden auch als spezielle Formen bezeichnet, da ihnen andere Regeln der Auswertung unterliegen als normalen Funktionsanwendungen. Mit dem Datentyp symbolischer Ausdruck, den Funktionen CAR, CDR, CONS, den Prädikaten ATOM, EQ, der Funktionskomposition und den speziellen Formen COND und QUOTE sind die grundlegenden LISP-Kon zepte vorgestellt. Um. aber nicht für jede Funktionsanwendung, die aus diesen elementaren Formen zusammengesetzten komplexen Funktionen wieder neu schreiben zu müssen, bietet LISP die Möglichkeit der Funkti onsdefinition mit Namensgebung. Mit dem LAMBDA-Ausdruck erhalten wir die Möglichkeit einer Funktionsbeschreibung. Die Funktionsbeschreibung (LAMBDA (X) (CAR (CDR X)) wird bei Funktionsapplikation auf eine Liste zur Funktionsdefinition, so daß das zweite Element der Liste geliefert wird. ) ((LAMBDA (X) (CAR (CDR X)) '(HANS MANN)) ergibt als Wert ) MANN Die Funktionsbeschreibung mit aktuellen Parametern hat die folgende allgemeine Form: ((LAMBDA
157
(DEFUN LASTTON (MELODIE) (COND ((EQ MELODIE NIL) NIL) ; die Melodie enthält keinen Ton; es handelt sich um die leere Liste ((EQ (CDR MELODIE) NIL) (CAR MELODIE)) ; prüft ob der letzte Ton erreicht ist; wenn ja wird er zurückgegeben (T (LASTTON (CDR MELODIE)) ) )) da der letzte Ton nicht erreicht ist, wird die Funk tion LASTTON wieder angewandt, allerdings auf die am Anfang um einen Ton verkürzte Melodie; dies geschieht solange bis der letzte Ton erreicht ist. Wie arbeitet diese Funktion? Ein Aufruf von >
=
T ist:
Als abschließendes Beispiel soll gezeigt werden, wie die rekursive De finition der Additionsfunktion plus sehr einfach in LISP definiert werden kann� Zuerst muß eine Repräsentation in LISP für die natürlichen Zahlen gewählt werden. Die Repräsentation der natürlichen Zahlen erfolgt nur mittels des Kon zeptes der leeren Liste NIL und der Prozedur CONS .. NIL repräsentiert dabei die Zahl 0. Weitere Zahlen werden als leere Liste innerhalb einer Liste dargestellt wie z. B. 1 = (( )), 2 = (() ()), 3 = (() () ()) usw. Es wird wegen einer einfacheren Darstellung davon ausgegangen, daß immer eine korrekte Eingabe erfolgt. Des weiteren wird die Nachfolgerfunktion succ definiert: (defun succ (zahl) (cons nil zahl)) Nun ist es möglich die rekursive Definition von plus zu geben: (defun plus (zahl1 zahl2) (cond ((eq zahlt nil) zahl2) (t (succ (plus (cdr zahlt) zahl2))) ) ) 1) Die rekursive Definiton der Funktion plus findet
über rekursive Funktionen S. 143 u. 144.
sich
in Kap. 2. 2. 2. 4 in dem Teil
158
Mit der Funktionsdeklaration, der Funktionskomposition, der Rekursion sowie den elementaren Funktionen CONS, CAR, CDR, den Prädikaten EQ, ATOM, den speziellen Formen COND und QUOTE sind jetzt die Mittel gegeben, die es ermöglichen, in LISP die gleiche Klasse von Funktionen zu berechnen, die mit einer Turingmaschine berechenbar sind (für den Nachweis sei auf Minsky 1971, 24 7 hingewiesen). Es ist also prinzipiell möglich, mit diesen Mitteln in LISP alle Algorithmen auszudrücken. Aufgrund der komplexen Datentypen - den symbolischen Ausdrücken ist LISP besonders für die Symbolverarbeitung geeignet. Die Symbolver arbeitung mit listenverarbeitenden Sprachen durch den Computer spielte eine zentrale Rolle bei der Herausbildung der Idee des Physical-Symbol Systems, die in den nächsten Kapiteln erörtert wird.
159 2 . 2. 5.
Die Idee des Physicai-Symbol-System
Nachdem die Turing-Maschine, der endliche Automat, die logischen Netze (Schaltwerke), die Nervennetze sowie die Beziehungen dieser Konzepte zueinander erläutert wurden und außerdem der Algorithmusbe griff sowie die grundlegenden Konstrukte von LISP eine ausführliche Darstellung fanden, sollen nun, bevor auf das Physical-Symboi-System Paradigma von Allen Newell und Herbert A. Sirnon eingegangen wird, der funktional-strukturelle Aufbau und die Arbeitsweise des Yen-Neumann Rechners erläutert werden.1 2. 2. 5 . I Die logisch-funktionale Struktur des Yen-Neumann-Rechners
Je nach Autor werden vier oder fünf Funktionseinheiten des Von-Neu mann-Rechners unterschieden. Arthur W. Burks (1977, 383), einer der Mitarbeiter John von Neumanns bei der Entwicklung des Von-Neumann-Rechners, spricht, indem er Aus gabe- und Eingabeeinheit zusammenfaßt, von vier Einheiten des Von Neumann-Rechners: der Aus- und Eingabeeinheit, dem Speicher, dem Rechenwerk und dem Steuerwerk. Alan Turing (1950/19 87, I 53) erwähnt nur die zent·ralen Komponenten Speicher, ausfUhrende Einheit (ALU) und Kontrollwerk. Allen Newell und Herbert A. Sirnon (1963, 378-380) sprechen von memory or store (central memory; dem Speicher), working memory (arithmetic unit; dem Rechenwerk), dem interpreter (control unit; dem Leitwerk) sowie von input und output units (den Ein- und Ausgabeeinheiten). Michael A. Arbib (1987, 27- 29 ) unterscheidet Speicher (store), Rechen werk (arithmetic unit), Ein-Ausgabeeinheit (input-output unit ) und Steuer werk (Jogic unit) John von Neumann (1954, 259) selbst gibt folgende Aufzählung, der .
fünf Haupt-Organe
1) Speicher 2) Arithmetisches Organ 3) Steuer-Organ
4) Eingangs-Organ Hiermit
sind
alle
5) Ausgangs-Organ. wesentlichen Bestandteile
einer
vollautomatischen
I) Ich werde mich hierbei auf für die Kognitionswissenschaft relevante Autoren bezie hen. Für eine ausführliche Darstellung sei auf Lehrbücher wie Coy 1988 verwiesen. Der kurze Aufsatz von Ganzhorn & Walter 1968 sei zu einer schnellen Orientierung emp fohlen. Elementare Kenntnisse der Rechnerarchitektur und der Arbeitsweise des Com puters sind für Musikapplikationen wie die MIDI-Programmierung notwendig (vgL Anhang E).
160 Maschine aufgezählt. Alle technologischen Probleme drehen sich darum, wie die fünf Organe verwirklicht werden. Das Eingabewerk (input unit), das Ausgabewerk (output unit), der Speicher (store, memory),
das Rechenwerk (arithmetisch logische Einheit;
arithmetic
Jogical unit; ALU) und das Steuerwerk (Leitwerk; control unit) bilden
also die strukturell-funktionalen Grundeinheiten des Von-Neumann-Rechners. In der Literatur findet sich oft die folgende graphische Darstellung der Struktur des Von-Neumann-Rechners, deren Analogie zu den an einem Rechenprozess beteiligten Einheiten, die durch Turings Analyse gefunden wurden, offenkundig wird:1
Ausgabe�o�erk
/., I i i
/ ! ' .. I
Output Unlt
'-·-·-·-·-·-·-·-·-
i
Contra I Unlt
-------- · Steuersignale
i
·-·-·-·-·-·-·-·-·-.
i
- DatenfluP
Die Ein- und Ausgabeeinheiten bilden die Schnittstellen des Rechners mit seiner Umwelt: heutzutage handelt es sich zumeist um die Tastatur und den Monitor. Im Speicher werden Eingabedaten, Befehle, Zwischenergebnisse und Ausgabedaten gespeichert. Informationen werden in binär codierter Form bearbeitet. Über eine Adresse kann eine Speichereinheit - bei heutigen Personalcomputern zumeist acht Bit - angesprochen werden. Sowohl das Programm (der Algorithmus und die Datenstrukturen) als auch die Daten werden im Speicher abgelegt. Das Rechenwerk (die arithmetisch-logische Einheit) führt die Informati onsverarbeitung durch, indem es addiert, subtrahiert, vergleicht etc. Die gespeicherten Daten werden gemäß dem Programm verändert und dann wieder gespeichert. Das Steuerwerk interpretiert die Befehle und steuert deren Ausführung sowie die Abarbeitungsfolge. Normalerweise werden die Befehle sequen tiell abgearbeitet, sozusagen schrittweise von einer "Adresse zur nächsten Adresse". Diese Folge kann jedoch durch den bedingten Befehl - die bedingte Sprunganweisung - durchbrechen werden. Die bedingte Sprung anweisung erlaubt es dem physikalischen Automaten, die in Abhängigkeit 1) vgl. Kap. 2. 2. 4. 3, S. 127 ff.
161
von einer Bedingung spezifizierte Adresse anzusteuern. Hierdurch kann die Maschine, abhängig von Zwischenergebnissen, "selbsttätig" logische Entscheidungen treffen und Verzweigungen im Programm bewirken. Die Kernidee John von Neumanns war� das Prinzip der Informationsspeiche rung und Informationsverarbeitung zu verbinden.
Die Informationsverarbeitung war in der ersten Phase des Computers auf die Verarbeitung von Zahlen eingegrenzt. Erst in der Mitte der SOer Jahre wurden mit dem Entstehen der Künstlichen Intelligenz und der von ihr benötigten Programmiersprachen wie IPL und LISP zur Lösung kom plexer, nicht rein mathematischer Probleme, Stimmen laut, die darauf hinwiesen, daß der Computer nicht nur Zahlen, sondern, viel allgemeiner, Symbole verarbeite. Diese Verarbeitungsform unterscheide sich sowohl logisch als auch physikalisch von der reinen Zahlenverarbeitung durch die dynamische Speicherververwaltung. In Zusammenhang mit den Forschungs ergebnissen von McCulloch, Pitts und Kleene einerseits sowie den ma thematisch-logischen Analysen des Rechenprozesses durch Turing und Post andererseits kam es zu der These, daß auch intelligentes menschliches Verhalten sich als Symbolverarbeitung auffassen lasse und der Mensch wie der Computer eine spezielle Art (Klasse) der Gattung der informati onsverarbeitenden Systeme sei. Da für die Gattung der informationsver arbeitenden Systeme ein einheitliches exaktes Beschreibungsmittel zur Verfügung steht, können Computersimulationen psychologischer Theorien oder einiger Teilbereiche als empirische Tests dieser Theorien über psychische Vorgänge aufgefaßt werden. Zwei Vorteile dieses Ansatzes sind daher hervorzuheben: 1 ) Zum einen können diese Theorien unabhängig von der neurophysiolo gischen Forschung überprüft und von introspektiv-phänomenalistisch ge wonnenen Daten ausgehend entwickelt werden, da durch die Ergebnisse von McCulloch/Pitts, Kleene und Burks eine bio-physikalische Veranke rung der Theorien gewährleistet ist, wenn diese oder Teilbereiche dersel ben exakt, d. h. algorithmisch, formuliert wurden; 2) zum anderen bieten derart formulierte Theorien die Möglichkeit der empirischen Überprüfung angenommener mentaler Prozesse durch die Computersimulation. In der amerikanischen Philosophie der Psychologie wird diese For schungsposition als Funktionalismus bezeichnet� Die dieser Forschungs strategie zugrundeliegenden, in den SOer Jahren herausgebildeten Ideen, wurden von Allen Newell und Herbert A. Simon3 in der Physical-Symbol System-Hypothese zusammengefaßt und als Kernbeitrag der Künstlichen Intelligenz zur Kognitionswissenschaft verstanden. Aus diesem Grund soll im nächsten Kapitel das Physical-Symbol-System thematisiert werden. 1) Ganzhorn &. Walter 1968, 828.
2) vgl. Johnson-Laird 1983; Fodor 1981 und Block 1981a, 1981b. 3) Newell &. Sirnon 1976; Newell 1980.
162 2. 2. s. 2
Das Physical-Symbol-System-Paradigma
Die Physical-Symbol-System-Hypothese wurde von Allen Newell und Herbert A. Sirnon 1976 anläßlich der "Turing-Award-Lecture" explizit formuliert und 1980 im Rahmen eines kognitionswissenschaftlichen Symposiums1 von Newell (1980) resümiert. Allen Newell und Herbert A. Simon2 führen fünf Etappen an, die von besonderer Bedeutung für die Entstehung der Idee des "Physical-Sym bol-System" (PSS) sind: 1 ) Die Phase der formalen Zeichenkettenmanipulation. Es handelt sich um die Entwicklung des Konzeptes der Turing-Maschine durch Alan Tu ring und Emil Post sowie der Church-Turing-These? 2 ) Die Phase der automatischen Zeichenkettenmanipulation, die gekenn zeichnet ist durch die physikalische Realisierung der Turing-Maschine: die Entwicklung der ers.ten Digital-Rechner. 3) Die Von-Neumann-Architektur für den funktional-strukturellen Auf bau des Computers, die gekennzeichnet ist durch eine gemeinsame Spei cherung von Programmen und zu verarbeitenden Daten.4 4) Die Entstehung der Idee der Listenverarbeitung, in der Daten und Programme als Symbolstrukturen betrachtet werden und das Konzept des Symbolischen Ausdrucks und der Listenstruktu� sich herausbildet. S ) Die Entwicklung der Programmiersprache LISP in Zusammenhang mit den Forschungen der KI.6 In Allen Newells und Herbert A. Simons Argumentation' für das PSS Konzept nehmen die Entwicklung der Programmierung mit Listenstrukturen8 im entstehenden Forschungszweig zur Künstlichen Intelligenz sowie die physikalische Realisierung von komplexen symbolischen Strukturen durch die dynamische Speicherverwaltung des Von-Neumann-Rechners eine zentrale !) Newells Aufsatz und weitere Beiträge von Simon, Minsky etc. dieses Symposiums zur Kognitionswissenschaft finden sich in Norman 1982.
2) vgl. Newell & Sirnon 1976, 117 u. 118. 3) Auf die Church·Turing·These, ihre philosophische Bedeutung und ihren limitativen Charakter für die Kognitionswissenschaft gehe ich in dem folgenden Kapitel (Kap. 2. 2. 6, S. 170 ff.) näher ein. Ergänzt werden diese Ausführungen durch Seifert 1990.
4) s. in Kap. 2. 2. 5. 1, S. 159 ff. die Darstellung der fünf Komponenten des Von-Neu·
mann·Rechners: die Eingabe· und Ausgabeeinheit, die arithmetisch-logische Einheit, den Speicher und die Kontrolleinheit. 5) Die Konzepte "Listenstruktur" und "symbolischer Ausdruck" werden in Zusammen·
hang mit der Programmiersprache LISP in dem Kap. 2. 2. 4. 3. 4, S. 149 ff. erläutert. 6) Auf die Programmiersprache LISP und deren Bedeutung für die Symbolverarbeitung bin ich in Kap. 2. 2. 4. 3. 4, S. 149 ff. näher eingegangen. 7) vgl. Newell & Sirnon 1976, 118. 8) Die Listenstrukturen wurden zuerst in der Sprachen IPL Unformation processing Jan guage) und LJSP {Iist pr.ocessing) realisiert. Allen Neweil und Herbert A. Sirnon arbeiteten zu Beginn ihrer Forschungen mit verschiedenen Versionen von IPL wie z. B. IPL-V.
163
Stellung ein. Die Idee des Phyical-Symbol-Systems wi:rd von Allen Newell (1980, 136) als der fundamentalste Beitrag der KI und Informatik zur Kognitionswissenschaft1 angesehen und als grundlegend für eine wissen schaftliche Theorie des menschlichen Geistes betrachtet: In my own estimation (. .), the most fundamental contribution so far of artificial intelligence and computer science to this joint enterprise (die Kogniti onswissenschaft; U. S.) has been the notion of a physical symbol system. This concept of a broad class of systems that is capable of having and manipulating symbols, yet is also realizable within our physical universe, has emerged from our growing experience and analysis of the computer and how to program it to perform intellectual and perceptual tasks. The notion of symbol that it defines is internal to this concept of system. Thus, it is a hypothesis that these symbols are in fact the same symbols that we humans have and use everyday of our life. Stated another way, the hypothesis is that humans are instances of physical symbol systems, and, by virtue of this, the mind enters into the physical universe. In my own view this hypopthesis sets the terms on which we search for a scientific theory of mind. .
Durch das Physical-Symbol-System-Paradigma wird die Verbindung der mathematisch-logischen Forschungsergebnisse, den neurophysiologi schen Modeliierungen der Funktionsweise des menschlichen Nervensystems und der Entwicklung des digitalen Computers zur empirisch-psychologi schen Erforschung mentaler Prozesse mittels der Computersimulation hergestellt.2 Als eine Konkretisierung der Idee des Physical-Symbol-Sy stems innerhalb psychologischer Forschung gelten die Produktionssysteme? Die leitende Idee der Physical-Symbol-System-Hypothese ist es, sowohl den Mensch�n wie a�ch den Computer als Arten der Gattung informati onsverarbeitender Systeme zu betrachten, die in abstrakter Form durch die Automatentheorie beschrieben werden.4 Der psychologische For schungszweig, der den Menschen als informationsverarbeitendes System betrachtet, wird daher auch als "informationsverarbeitende" Psychologie 1) Eine ausführliche Diskussion der Bedeutung des Physical-Symbol-Systems für die Kognitionswissenschaft findet sich bei Pylyshyn (1984, SO - 86) und Nelson (1987), die sehr schön durch die kritischen Betrachtungen von Weizenbaum (1980, 225- 241) ergänzt werden. 2) Die wesentlichen Ergebnisse der Forschungen aus dem Gebiet der Neurophysiologie, Linguistik, Informatik und Logik sowie deren Beziehungen habe ich in den Kapiteln 2. 2. 3, S. 66 ff. und 2. 2. 4, S. 97 ff. eingehender behandelt. 3) Die Produktionssysteme werden in Davis & King 1977 sowie Young 1979 behandelt. In der Kognitiven Musikpsychologie benutzt John Sloboda 1985 sie ( vgl. auch Kap. 3. 2. 6, S. 328 ff.l. Die Forschergruppe um Jaqueline Jones zieht sie zu:r Modeliierung von Re geln der generativ-tonalen Musiktheorie heran (vgl. Jones, Mille!!' & Scarborough 1988; s. auch die Untersuchung in Kap. 3. 2. 7, S. 332 ff.). 4)
vgl. Arbib
1969.
164 1 bezeichnet. Obwohl Allen Newell und Herbert A. Sirnon die PSS-Hypo these erst 1976 explizit formulierten, so läßt sich die Idee des PSS je doch schon seit den SOer Jahren in ihren Schriften nachweisen.2 Ich wer de mich in der weiteren Analyse des Physical-Symbol- Systems besonders auf die Darstellung desselben in der Arbeit von Newell und Sirnon (1963) beziehen, da gerade sie es erlaubt, die grundlegenden Annahmen über die Beziehung zwischen psychologischer Forschung und KI im Hinblick auf die Untersuchung mentaler Phänomene zu erhellen. Auf eine ausführliche Diskussion der von Newell und Sirnon 1976 in ihrer Turing-Award-Lecture vorgetragenen Thesen3 und Argumente muß an dieser Stelle nicht einge gangen werden, da die Voraussetzungen für das Verständnis der Idee des Physical-Symbol-Systems nach dem bisher Erörterten gewährleistet sein sollten� Konnte man zwar vermuten, daß der menschliche Geist als informationsverarbeitendes System sicherlich Symbolstrukturen verarbeiten kann, so war nicht unbedingt ersichtlich, daß ein Computer ebenfalls in der Lage ist, über Zahlenverarbeitung hinausgehend, Symbolstrukturen zu manipulieren. Genausowenig wie es Anfang der 60er Jahre selbstver ständlich war, daß die rekursive Programmierung in einigen Fällen sinn voller sein könnte als die Programmierung mit Schleifen, so war es auch keineswegs eine Selbstverständlichkeit, daß man Computer als allgemeine symbolmanipulierende Systeme und nicht nur als zahlenverarbeitende Systeme betrachtete .5 Das Hauptargument von Allen Newell und Herbert A. Sirnon sowie anderer Forscher der KI war, daß Listenverarbeitung, wie sie in der KI zur Modeliierung komplexen symbolischen Verhaltens benutzt wird, im Gegensatz zur "reinen Zahlenverarbeitung" flir ihre physikalische Realisierung eine dynamische Speicherverwaltung6 erfordere. Aufgrund dieses Argumentes wird angenommen, daß sowohl der Mensch als auch der Computer physikalische Symbolsysteme sind. Ein physikali sches Symbolsystem wird von Newell und Sirnon (1963, 375) wie folgt charakterisiert: A relatively small set of elementary processes, together with appropriate combinations of them,
will provide
a quite generat
1) Einen Überblick über die verschiedenen Modelle in der "informationsverarbeitenden" Psychologie gibt Simon 1979. Weitere Formalismen zur Modellierung mentaler Prozesse findet man in Rumelhart & Norman 1988 sowie Barr & Feigenbaum 1981. 2) Schon in der Arbeit "Elements of a Theory of Human Problem Solving" von Newell, Shaw & Simon aus dem Jahre 1958 sind erste Formulierungen zum Physicai-Symbol System aufzuweisen. Auch in Newell & Simon 1963 finden sich Ideen zum Physical Symboi-System. 3) s. Newell & Simon 1976 und Newell 1980. 4) vgl. besonders die Kap. 2. 2. 3, S. 66 ff. und 2. 2. 4, S. 97 ff. 5) vgl. Newell & Simon 1976, 118. 6) Normalerweise werde!l'l für die Daten der Berechnungen zusammenhängende Spei cherbereiche konstanter Größe zur Verfügung gestellt wie z. B. bei den arrays. Bei symbolischen Strukturen ist jedoch zu Beginn der Berechnungen nicht zu bestimmen, welche Größe der Speicherplatz dieser Strukturen annehmen wird. Es muß während der
165 capacity for symbol manipulation. To have such a capacity, a symbol manipulating system needs means for reading symbols (taking patterns in some external form and transforming them into an internal representati on), writing symbols (transforming internal patterns into external sym bols), comparing symbols (determining if two patterns are identical or different) and behaving conditionally on the outcome of the comparison (proceeding one way if the sym·bols are equal, another if they are une qual), copying symbols (creating patterns isomorphic to given patterns), and associating symbols (storing with a symbol information that identifies another symbol). The general-purpose, symbol-manipulating systems that we call electronic digital computers have all these means.
Schon 1963 werden von Allen Newell und Herbert A. Sirnon die we sentlichen Mechanismen genannt, die ein informationsverarbeitendes, sym bolmanipulierendes System aufweisen muß, um entsprechende Operationen ausführen zu können:1 Operatoren, die Symbolstrukturen lesen, speichern, schreiben, vervielfältigen, verbinden, vergleichen. Aufgrund des Ver gleichs muß das System außerdem in der Lage sein, in der Arbeitsfolge Verzweigungen zu realisieren, die unterschiedliche Arbeitsprozesse ermög lichen. Weiterhin muß ein Physical-Symbol-System mit seiner Umwelt über Rezeptoren und Effektoren in Verbindung stehen und intern eine Kontrolleinheit (Interpreter) sowie einen Speicherbereich für die Symbol strukturen aufweisen. Graphisch läßt sich der strukturelle Aufbau eines PSS wie folgt darstellen:
(
Abb .
Hewe l l
1. 98 0.,
1. 43>
Berechnung gegebenenfalls neuer Speicherplatz zur Verfügung gestellt werden , oder, falls diese Strukturen wieder weniger Speicherplatz benötigen, so muß dieser "verwal· tet" werden. I) vgl. Newell & Sirnon 1963; Newell, Shaw & Sirnon 1958 mit Newell & Sirnon 1976 u. Newell 1980.
166 Die Ähnlichkeit mit der funktionellen Struktur des Von-Neumann-Rech ners ist offensichtlich� Die funktionelle Analogie der Transduktionsfunkti onen des Nervensystems als Schnittstellen zur Umwelt, die der Effektoren und des Sensoriums zu den Ausgabe- und Eingabeeinheiten eines Compu ters, dürfte ebenfalls offensichtlich sein. Herauszufinden, durch welchen Code diese Transformation geschieht und wie die Funktionen innerhalb des Ner vensystems realisiert sind, ist jedoch Forschungsaufgabe der Neurophysiologie. Da jedoch das Nervensystem, wie ich gezeigt habe, mindestens das gleiche leisten kann wie ein digitaler Rechner, so kann ebenfalls ange nommen werden, daß auch der Mensch als ein Symbolstrukturen verar beitendes, physikalisches System betrachtet werden kann. Es ist zu be merken, daß sich die Argumentation hierbei auf mentale Prozesse bezieht, welche durch das Nervensystems physikalisch realisiert werden, während der Computer gleichfalls als physikalische Realisierung eines Symbolsy stems (der Turingmaschine) betrachtet wird. Nachdem der strukturelle Aufbau eines Physical-Symbol-Systems erör tert wurde, ist noch das Konzept des "Symbols" bzw. seiner physikali schen Realisierung zu betrachten, das ebenfalls zentral für die Idee des Physical-Symbol- Systems ist. Newell und Simon2 sprechen allgemeiner von Symbolstrukturen. Beim derzeitigen Von-Neumann-Rechner wird ein Sym bol als physikalisches Muster elektrischer Impulse realisiert (Newell & Sirnon 1963, 374): Inside the computer a symbol is simply represented by a pattern of electromagnetism of some sort.
Ein symbol ist bei Newell und Sirnon erst einmal ein Zeichen, d. h. ein Muster, das sich von anderen Mustern unterscheidet und etwas re präsentieren, d. h. denotieren kann. Ein Zeichen mit Bedeutung wäre ein Symbol. Die Semantik der Zeichen, d. h. die Bedeutungszuordnung, ist bedingt durch das Programm und erfolgt während des Bearbeitungsvor ganges (dem Prozess der Programmausfübrung), indem Symbolstrukturen 4 verglichen, erkannt und verändert werden� Newell und Simon sprechen in ihren späteren Arbeiten von Designation und Interpretation der Sym bolstrukturen. Sie5 formulieren dies mit folgenden Worten: The meaning of the Symbol (i. e. what it denotes) is determined by the programs that recog nize it, that compare it with other symbols, or that process it in other ways.
Man denke beispielweise daran, daß ein physikalisches Muster elektri scher Impulse als Bitmuster wie z. B. 0000 0010 interpretiert wird, und je nach Programm als ASCII-Zeichen, als Wort des BCD-Code, Verweis auf eine Speicheradresse oder als Befehlsanfang etc. angesehen werden kann. Dem Programm und seinem Ablauf kommt daher eine besondere
I) Kap. 2.2.5.1, S. 159 ff. und die Darstellung der Turingmaschine in Kap. 2.2.4.3.2, S. 132 ff. 2) s. Newell & Simon 1976, 116 sowie Newell 1980, 142. 3)
s.
Newell & Simon 1963, 374 u. 375.
4) vgl . Newell & Simon 1976, 116 sowie Newell 1980, 154-161. 5) vgl. Newell & Simon 1963, 374 u. 375.
167
Bedeutung für die Generierung von Symbolstrukturen zu. Es kann auch nicht verwundern, wenn die Bestimmung der Symbolstruk tur bei der Definition des Physical-Symbol-System an das Konzept der "symbolischen Ausdrücke" in LISP1 erinnert: A physica/ symbol system consists of a set of entities, ca/led symbols, which are physical patterns that can occur as components of another type of entity called an ex pression (or symbol structure). Thus, a symbol structure is composed of a number of instances (or tokens) of symbo/s related in some physical way (such as one token being next to another). At any instant of time the system will contain a co/lection of these symbol structures. Besides these structures, the system also contains a co/lection of processes that operate on expressions to produce other expressions: processes of crea tion, modification, reproduction and destruction. A physical symbol sy stem is a machine that produces an evolving co/lection of symbol struc tures. Such a system exits in a world of objects wider than just these symbolic expressions themselves. Solche, die abstrakten Strukturen realisierenden, physikalischen Maschi nen sind z. B. das Gehirn und der Computer. Für den Computer ist der Nachweis der physikalischen Realisierung von Symbolstrukturen durch die in LISP vorhandenen symbolischen Ausdrücke, die auch in anderen "infor mationsverarbeitenden" Programmiersprachen wie IPL vorhanden sein müssen, erbracht. Für das Gehirn formulieren daher Newell und Sirnon (1963, 425) die plausible Arbeitshypothese: These languages themselves have properfies that amount to implicit psychologicat assumptions: that the centrat nervous system is a SYmbol-processing system, that its me mory is organized in terms of lists and Iist structures of associated sym bols, and that it is capable of executing sequences of behaviors organi zed as hierarchical Iist structures. Sie bekräftigen diese Aussage (Newell & Sirnon 1963, 424 ) : Perhaps the fundamental assumption implicit in the IPL's is that the central nervous system does, in fact, both store and transmit symbols of some kind. Aufgrund dieser Annahme ist es auch möglich, Hypothesen über men schliche Informationsverarbeitungsprozesse mittels des Computers zu testen, denn Computer und Mensch gehören zur gleichen Gattung und weisen somit in einigen Punkten Gemeinsamkeiten auf. Sie arbeiten mit elementaren, einfachen Informationsprozessen, sind in der Lage, komplexe Symbolstrukturen zu bearbeiten, indem sie durch eine endliche Menge von Regeln zu Programmen zusammengesetzt werden, welche den Symbolver arbeitungsprozess steuern, und ermöglichen auf dieser Ebene der Be schreibung eine Erklärung von Verhalten. Newell, Shaw und Sirnon (1958, 151) formulieren die Voraussetzung der Computersimulation wie folgt: At this level of theorizing, an explanation of the observed behavior of the organism is provided by a program of primitive information processes that genera1) vgl. Kap. 2. 2. 4.
3. 4, S. 149
ff. über LISP.
168 tes this behavior.
Für die Forschungsstrategie in der Psychologie mittels Sirnutationen psychologischer Prozesse geben Newell und Sirnon folgende Methodik an:
CAbb.
"•well /Sinon
�963� 423>
Wie unschwer zu erkennen ist, bilden die elementaren Informationsver arbeitungsprozesse, die durch Programme beschrieben und zu komplexen Informationsverarbeitungsprozessen zusammgesetzt werden, um das kom plexe Verhalten eines Systems zu erzeugen, die theoretische Schnittstelle der Computersimulation, denn sowohl die wetware Gehirn als auch die hardware des Computers sind in der Lage, diese elementaren Informa tionsprozesse biophysikalisch bzw. physikalisch zu realisieren. Diese For schungsstrategie ermöglicht es, psychologische Prozesse empirisch und unabhängig von ihrer neurophyiologischen Realisierung zu erforschen, da gesichert ist, daß einerseits das Gehirn sich in der Lage befindet, die notwendigen Operationen auszuführen und andererseits auch eine physika lische Realisierung dieser Symbolstrukturen vorliegt, da sie auf einem Computer ausgeführt werden können. Computer und Gehirn werden also nicht durch einfache Analogie auf der "Hardware-Ebene" in Beziehung gesetzt, sondern auf der algorithmischen, der Programmebene. Der Com puter selbst spielt hierbei eine untergeordnete Rolle und dient dem empi rischen Testen der angenommen algorithmischen, mentalen Prozesse. Da dies sehr häufig übersehen wird, sei nochmals die Warnung von Newell, Shaw und Sirnon (1958, 153) angeführt: We wish to emphasize that we are not using the computer as a crude analogy to human behavior - we are not comparing computer structures with brains, nor electrical relays with synapses. Our position is that the appropriate way to describe a pie-
169 ce of problern solving behavior is in terms of a program: a specification of what the organism will do under varying environmental cicumstances in terms of elementary information processes it is capable of performing. This assertion has nothing to do - directly - with computers. Such programs could be written (now that we have discovered how to do it) if computers had never existed. . .. Digital computers come into picture on ly because they can, by appropriate programming, be induced to execute the same sequences of information processes that humans execute . . .
Wird die Ebene der algorithmischen Beschreibung verlassen und die Klasse der Funktionen betrachtet, die durch ein Physical-Symbol-System berechnet werden, so erhält man wieder die partiell-rekursiven Funktionen. Somit wird durch das Physical-Symbol-System der Redeweise von einer "kom putationellen Theorie des Geistes" eine inhaltlich klare Bedeutung gegeben. In seiner Erörterung des Leib-Seele-Problems (mind-brain), in der Kenneth Colby (1971, 48) die durch eine "komputationelle Theorie des Geistes" bedingten Veränderungen der Fragestellung erörterte, gibt er die von Newell und Sirnon angedeutete Analogie in folgendem Schema wieder: _!!l_e_n_t�!-e�C!C:��s_ brain hardware and programs
���e����
Kenneth Mark Colby hebt hervor, daß es sich hier nicht um eine sub stantielle Analogie, sondern um einen funktionellen Vergleich handelt, wenn die Informationsverarbeitung des Gehirns mit der des Computer verglichen wird. Die einzelnen Gründe, die diese Analogie plausibel er scheinen lassen, habe ich in den vergangeneo Kapiteln angeführt. Für eine philosophische Fragestellung ermöglicht dieser Vergleich eine andere, interessante Sichtweise. Es handelt sich um die Frage: Steuert das Ge hirn die geistigen Vorgänge oder die geistigen Vorgänge das Gehirn? Wenn ein Programm ausgeführt wird, so hebt sich der Gegensatz Pro gramm und Hardware auf, der Fluß der Information wird von beiden be stimmt. Das Programm lenkt die Ausführungen der Hardware, aber die Hardware stellt Grenzen des Ausführbaren dar. Nach den Ausführungen in den vorangegangenen Kapiteln dürfte er sichtlich geworden sein, wie es zur Erforschung mentaler Repräsentatio nen und Prozesse mittels Computersimulation kam, und warum gerade der Computer als Metapher und Hilfsmittel für die Kognitionswissenschaft von zentraler Bedeutung ist, deren Ziel darin gesehen wird (IPylyshyn 1987, 121), to discover the representational and computational capacities of the mind and their structural and functional representation in the brain.
Es bleibt noch der philosophische Bezugsrahmen der Kognitionswissen schaft aufzuzeigen.
170 2. 2. 6
Computation, Churchs These, Kognitionswissenschaft und Neomechanismus - ein erstes Fazit
Bevor ich zu einer philosophischen Einordnung der Kognitionswissen schaft komme, soll der bisherige Gedankengang resümiert werden. Ausge hend von der black box-Betrachtung des Nervensystems und der Ner venzelle ließ sich die Funktionsweise des Gehirns unter einigen ldealisie rungen durch ein formales Nervennetz, bestehend aus McCulloch-Pitts Neuronen, modellieren. Die Leistungsfähigkeit dieses formalen Nervennet zes erwies sich dem der logischen Netze (sequentiellen Schaltkreise) äquivalent, mit denen das Verhalten der Schaltelemente des Computers beschrieben wird. Die logischen Netze und formalen Nervennetze erwie sen sich des weiteren dem abstrakteren Konzept des endlichen Automaten mit Ausgabe äquivalent. Interessant an dieser Interpretation ist, daß die Gesamtaktivität der Axone zum Zeitpunkt t zu einem Zustand q des endlichen Automaten zusammengefaßt wird, während die Eingaben von den Rezeptoren bzw. die Ausgaben an die Effektoren das Eingabealphabet bzw. Ausgabealphabet des endlichen Automaten bilden. Weiterhin zeigte sich, daß genau die regulären Ereignisse (Mengen, Sprachen) von einem endlichen Automaten akzeptiert bzw. von einer links- oder rechtslinearen Grammatik (Typ-3) generiert werden. In der Psychologie erwies sich die Idee der TOTE-Einheiten als dem endlichen Automaten äquivalent. Darü ber hinaus führten die Explikationen der intuitiven Konzepte der "bere chenbaren Funktion" und des "Algorithmus" auf zwei äquivalente formale Systeme als deren Explikate: die partiell-rekursiven Funktionen und die Turingmaschine. Eine Turing-Maschine erwies sich als nichts anderes als ein endlicher Automat mit einem Lese-Schreib-Bewegungsmechanismus und einem im Prinzip unendlichen Band. Außerdem wurde die Nähe der partiell-rekursiven Funktionen zu der Programmiersprache LISP gezeigt, die vorwiegend in den Forschungen zur Künstlichen Intelligenz Anwendung findet. Es kann also behauptet werden, daß sich, ausgehend von Gebieten wie der Neurophysiologie, der "Informatik", der Metamathematik, der Linguistik und der Psychologie, eine Gemeinsamkeit der Konzepte aufzei gen läßt. Die dargelegten verwickelten Beziehungen der unterschiedlichen Begriffe sind die Grundlage für Computersimulationen "mentaler Prozes se", die es erlauben, geistige Phänomene unabhängig von physiologischen Hirnvorgängen zu untersuchen, ohne eine materialistische Grundposition aufgeben zu müssen. En der Philosophie wird daher auch von funktionalem Materialismus gesprochen, während in der Psychologie diese Position als Funktionalismus bezeichnet wird. Die der Kognitionswissenschaft zugrundeliegende philosophische Denk tradition läßt sich als mechanistisch kennzeichnen. Das Konzept des "Me chanischen" findet ebenfalls seine Explikation in der Turing-Maschine. Turing (1939/1965, 160) schrieb: A function is called to be "effective
171 calculable" if its value can be found by some purely mechanical process. We may take this statement litterally, understanding by a purely mecha nical process one which can be carried out by a machine. It is possible to give a mathematical description, in a certain noPmal form, of the structure of these machines. Sowohl das Mechanische als auch das Berechenbare finden also ihre Explikation im Rahmen der Automaten- bzw. Berechenbarkeitstheorie. Die Haupthese des Neomechanismus lautet daher (Webb 1983, 310):
(M) All human reasoning is a mechanical process (computation). Die These (M) steht in enger Beziehung zur These (C) (Webb 1983, 310):
(C) Every "precisely described" piece of human behavior can be simulated by a suitably programmed computer. Die These (C), die den Kern des kognitionswissenschaftlichen For schungsansatzes beschreibt, impliziert zwar die neomechanistische These (M) nicht, stützt sie jedoch empirisch induktiv. So muß der Forscher in der Kognitionswissenschaft nicht annehmen, al les menschliche Denken sei Errechnung (computation) und somit mecha nisch, er muß allerdings annehmen, daß nur der "mechanische" Teil des menschlichen Denkens, der, den er präzise formulieren kann, ihm zugäng lich und wissenschaftlich kommunizierbar ist. Über andere Vorgänge kann er nicht sinnvoll reden. Es gibt für den Kognitionswissenschaftler also eine Grenze der "Ma thematisierbarkeit" kognitiver Funktionen. Nun könnte man annehmen, daß sich eines Tages die intuitiven Konzepte der "berechenbaren Funktion", des "präzise Formulierbaren", des "Algorithmischen" und des "Mechani schen" durch einen Formalismus sinnvoll explizieren lassen, der sich ge genüber den bisher entwickelten formalen Explikaten als nicht äquivalent erweist. Hiergegen steht jedoch die Church-Turing-These, die heutzutage von den meisten Logikern akzeptiert wird (Webb 1983, 311 ):
(CT) Every "effectively computable" function is generat recursive (and vice versa) Church führte diese These, die eine Arbeitshypothese ist, in Form einer Definition1 ein, in der er die effektiv berechenbaren Funktionen positiver ganzer Zahlen mit den rekursiven Funktionen positiver ganzer Zahlen identifiziert. Schon sehr früh erkannte Emil Post (1936, lOS) die limitati1) vgl. Gandy 1988, 76. Gandy 1988 gibt eine ausführliche Darstellung der Situation logischer Forschungen der 30er Jahre.
172 ve Bedeutung dieser These: Actually the work already done by Church and others carries this identification considerably beyond the working hypothesis stage. But to mask this identification under a definition hides the fact that a fundamental discovery in the limitations of the mathema ticizing power of Homo Sapiens has been made and blinds us to the need of its continual verification.
Sollte Churchs These gültig bleiben, so zeigt sich eine Grenze der Ma thematisierbarkeit der Wissenschaften und ist die Turingmaschine, als ab strakte Maschine, das ultimative Explikat des Mechanischen. Die Kognitionswissenschaft, in der Kognition als Errechnung interpre tiert wird, ist daher die einzige Wissenschaft, in der präzise über men tale Vorgänge diskutiert werden kann. Durch ihre Forschungen stützt sie auf empirische Weise induktiv den philosophischen Neomechanismus . Die ser Mechanismus unterscheidet sich von dem Mechanismus Descartes' durch sein Maschinenmodell, das mit der Turingmaschine ein abstraktes - vielleicht sogar ultimatives - Modell ist und sich auch auf geistige Prozesse bezieht. Der Mensch gehört in dieser Betrachtungsweise wie der Computer der Gattung informationsverarbeitender Systeme an. Wesentlich für kognitions wissenschaftliche Untersuchungen ist es, sich vor diesem Hintergrund zu verdeutlichen, daß nicht anthropomorphe Fragestellungen wie "Könnten Computer denken?" oder "Könnten Computer komponieren?" u. ä. von In teresse sind, da sie nicht den Kern des Problems treffen. Es stellt sich vielmehr die Frage: >>Inwiefern ist es gerechtfertigt, den Menschen bzw. sein Verhalten als (abstrakten) Automaten zu betrachten? Der Computer ist nichts anderes als eine Metapher und ein Hilfsmittel zur Überprüfung von Hypothesen über interne mentale Repräsentationen sowie der auf ih nen stattfindenden Berechnungen mittels Simulation. Zwar sind die Modelle der Automatentheorie ftir theoretisch-philosophi sche Untersuchungenl aufgrund ihrer Überschaubarkeit besonders geeig net, sie können jedoch für die physiologische als auch die psychologische Forschung sehr schnell zu komplex und unüberschaubar werden� Durch sie wird, wie ich gezeigt habe, die abstrakte Grenze der kognitionswis senschaftlichen Forschung gezogen und einsichtig gemacht, warum Com putersimulationen mentaler Phänomene möglich sind. Die Argumentation bewegt sich - so kann gesagt werden - auf der Ebene der Kompetenz. Auf der Ebene der Performanz - der Modellierung kognitiver Bereiche bzw. komputationeller Theorien kognitiver Bereiche - sind praktikablere 1) Nelson 1986 hebt die Relevanz automatentheoretischer Konzepte zur Klärung philoso phischer Problemstellungen hervor. In Kap. 3. 1. 1, S. 174 ff. diskutiere ich die Explika tion des Erwartungskonzeptes mittels automatentheoretischer Begriffe. Burks 1977 führt ebenfalls philosophische Analysen mit Konzepten der Automatentheorie durch. Berwick et al. 1987 betonen die B·edeutung der automatentheoretischen Analyse für die Bewer tung von Modellen der Sprachverarbeitung. 2) vgl. Arbib 1969.
173 Modelle, wie in der KI entwickelt, heranzuziehen. Dies gilt auch für eine komputationelle Theorie der Musikkognition. Seit den 70er Jahren werden verstärkt die verschiedensten formalen Systeme zur Beschreibung der mentalen Repräsentation musikalischer Strukturen und deren kognitiver Verarbeitung herangezogen. 1 Naturgemäß überlagern sich auch bei diesen Forschungen theoretisch-philosophische Betrachtungen und praktisch-reali sierbare Vorhaben, die sich etwas verkürzt durch Forschungen mittels des Grammatikkonzeptes - Untersuchungen zur Kompetenz - und die For schungen der KI - Forschungen zur Performanz - beschreiben lassen? Der nächste Abschnitt ist daher den musiktheoretischen Untersuchungen gewidmet, die vom "Grammatikkonzept" ausgehen. Es wird sich hier zei gen, daß seit Mitte der achtziger Jahre eine Tendenz besteht, Ideen und Modelle der KI zur Modellierung kognitiver musikalischer Prozesse und ihrer Implementierung heranzuziehen. Daher werden nach der Diskussion verschiedener "Grammatikansätze" verschiedene von der KI beeinflußte Forschungen analysiert. Es wird sich zeigen, daß es neben den generati ven Grammatiken noch andere Grammatiken gibt. Die nachfolgend vorgestellte Arbeit von Pauli Pylkkö benutzt jedoch die "klassischen" generativen Grammatiken zur Beschreibung der musikali schen "Kompetenz".
1) In Stoffer 1981, 1985; Seifert 1986; Nauck-Börner !988 und Vecchione 1990b werden verschiedene Formalismen vorgestellt und diskutiert.
2) David Marr 1977 unterscheidet in ähnlicher Weise eine Typ-t-Theorie, die er mit Chomskys "Kompetenzkonzept" in Beziehung setzt, von einer Typ-2-Theorie der Al Forschungen.
174 3.
ANWENDUNG KOGNITIONSWISSENSCHAFTLICHEN DENKEN$ IN DER MUSIKFORSCHUNG Grammatiken zur Repräsentation musikalischer Strukturen
3. I
3. I . I . Das Erwartungskonzept bei der Perzeption musikalischer Strukturen und seine Explikation durch das Konzept des abstrakten Automaten Pauli Pylkkö (198 8, 301 u. 306) strebt eine Klärung des von ihm als to nal harmony bezeichneten Konzeptes an. Unter dem Explanandum tonal harmony will Pylkkö (1988, 306) diejenige Komponente des musikalischen Phänomens verstanden wissen, which is used to generate chords to ac company a melody line in homophonic fashion typical to the compositions of the westem classical/romantic period of the 18th and 19th centuries. Es handelt sich letztendlich um das Konzept der Kadenz, das eine formale Explikation1 erhalten soll. Die Explikate sind Konzepte aus den Gebieten der Theorie der formalen Grammatik, der Automatentheorie und der Theorie der formalen Sprachen. Diese Konzepte werden zusätzlich mit einer psychologischen Interpre tation versehen, derzufolge der Hörer eines Werkes als nichtdeterministi scher akzeptierender endlicher Automat begriffen und das Erkennen der akkordischen tonalen Funktionsbeziehungen durch den Hörer als Akzeptie ren einer Zeichenkette durch einen Akzeptor modelliert wird. Die syntak tischen Beziehungen der harmonischen Funktionen lassen sich durch eine diesem Automaten äquivalente Grammatik beschreiben. Pylkkö (1988, 301) formuliert seinen Ansatz wie folgt: A synta:x: of music (for instance the syntax. of tonal harmony}, is a theory about how to generate grammatical musical objects (sequences of chords for instance). And because musical strings are comprehended by people who have an appropriate musical education, the rules of generation can be modified into respective rules of recognition. By recognition we mean that the adressee reacts (at le ast) by 'yes to a grammatical string and by 'no' or no answer at alt to an ungrammatical.
Pauli Pylkkö unterstellt dabei, daß das "erkennende System" ein Ent scheidungsverfahren bzw. eine berechenbare charakteristische Funktion in
bezug auf eine zu erkennende Menge besitzt. So muß jedenfalls seine Formulierung gedeutet werden, daß auf grammatisch wohlgeformte Zei chenketten x mit ja, bei ungrammatischen Zeichenketten gar nicht oder mit nein geantwortet wird. Ch(x)
{
falls ja, d. h. x 0
falls (nein
v
€
L(G)
keine Antwort), d. h.
1) zur Begriffsexplikation im Carnapschen Sinne vgl.
S. 30 f., Anm. 3.
x
t
L(G)
175 Es soll also ein Verfahren bzw. System angegeben werden, das auf die Frage "Ist X E M � v• bzgl. des Alphabetes V ?" mit ja oder nein antwortet. Eine rekursiv aufzählbare Menge, deren Komplement nicht rekursiv aufzählbar ist, kann von dem System folglich nicht adäquat erkannt und damit auch nicht erzeugt werden. Somit wird die These eingeschränkt, daß die Kompetenz eines beschrie benen Erkennungssystems im allgemeinen Rahmen der Theorie der Tu ringmaschinen abgehandelt werden kann. Pylkkö gibt für die Grammatik { t, s , d } an, die als Funkti die Menge der terminalen Zeichen VT onszeichen im Sinne der traditionellen Harmonielehre interpretiert wer den. Die kleinen Buchstaben "t", "s", "d" sollen die harmonischen Funkti onen Tonika, Subdominante, Dominante repräsentieren, wobei allerdings offengelassen wird, ob es sich um Dur- oder Mollfunktionen handelt. Es kann allerdings davon ausgegangen werden, daß entweder eine Durkadenz oder eine Kadenz in natürlichem Moll durch die Grammatik beschrieben werden soll. Im ersten Fall sind die gebildeten Zeichenketten im musik wissenschaftlichen Kontext1 als t = T (Durtonika), s = S (Dursubdominan te), d D (Durdominante) zu lesen, während im zweiten Fall die resul tierenden Zeichenketten als Mollfunktionen t (Molltonika), s (Mollsubdo minate) und d (Molldominate) zu interpretieren sind. Pauli Pylkkö benutzt in seiner Arbeit u. a. wohl deshalb keine Großbuchstaben des lateinischen Alphabets, um die Durfunktionen zu kennzeichnen, weil eine Verwechs lungsmöglichkeit mit den nichtterminalen Zeichen der Grammatik besteht. Pylkkö (1988, 308) gibt folgende Grammatik GO = (VT, VN, S, R) zur Beschreibung einer einfachen Kadenz an (S E VN ist das Startsymbol) : =
=
VT = {t, s , d }
R
=
VN
=
{S, A , B , C}
{ (S, tA), (S, dC), (A, tA), (A, sB) (A, dC), (B, dC), (C, dC), (C, t) }
Was soll die Grammatik GO leisten? Rein formal betrachtet, soll die angegebene Grammatik aus der Menge der Zeichenketten VT* diejenige Menge der grammatisch wohlgeformten Ketten aussondern, die musikwis senschaftlich als Folge von tonalen Funktionen zu interpretieren sind, die wiederum als tonal harmony bzw. Kadenz aufgefaßt werden. Pauli Pylkkö (1988, 311) selbst schreibt hierzu: II GO is considered to be an explana tion, what does it explain? GO is a grammar of a harmonic phrase ... something which is usually called a cadence.
Die musikwissenschaftlich leitende Idee ist hierbei, daß in den einfach sten Fällen eine Kadenz durch eine Folge Tonika-Dominante-Tonika (in Dur: TOT; in Moll: tdt), Tonika-Subdominate-Dominante-Tonika (in Dur: TSDT; in Moll: tsdt) und - unvollständig, aber auch vorkommend - Domi nate-Tonika (in Dur: DT; in Moll: dt) charakterisiert werden kann. I) zur konventionellen Symbolik der Funktionsharmonik vgl. z. B. Maler 1980, Bd. 1, 92 u. 93 sowie Bd. II, 119 u. 120.
176 Ausgeschlossen wird z. B. die sogenannte plagale Kadenz (in Dur: TDST; vgl. Grabner 1974, 42). Die Grundidee wird durch die Annahme erweitert, daß die Grundfolgen der tonalen Funktionen durch Wiederho lung bestimmter harmonischer Funktionen und folglich die entsprechenden Zeichenketten erweitert werden. Die von der Grammatik erzeugte Spra che ist die Menge L(GO) { w I w E VT* und w kann durch Anwendung der Regeln r E R von GO, beginnend mit dem Startsymbol S erhalten werden: S 9* w }. Die von der angegebenen Grammatik GO erzeugte Sprache L(GO) läßt sich in Form eines regulären Ausdrucks wie folgt angeben: =
L(GO)
tt*dd*t
V
tt*st*dd*t V dd*t v t*d•t.
bzw. t•st*d•t
Die Grundstrukturen (tsdt, tdt, dt) als leitende Idee für das Konzept einer einfachen Kadenz sind ohne weiteres zu erkennen. Es stellt sich allerdings die Frage, warum z. B . die Subdominante nur einmal vorkommt und zum Schluß die Tonika ebenfalls nur einmal? Meines Erachtens gibt es keine Begründung, an diesen Stellen eine Wiederholung dieser Funktio nen auszuschließen. Durch Hinzufügen der Regelmenge R' = { (B, sB), (C, tD), (D, tD), (D, t) } , d. h. R" = R v R' wird eine Grammatik GO' erhalten, die auch Zeichenketten generiert, in denen das Zeichen "s" mehr mals hintereinander in Erscheinung tritt und auch eine Folge von "t"'s am Ende der Zeichenketten möglich ist. Die Menge VNT der nichtterminalen Zeichen wird um "D" erweitert, d. h. VN' = VN v {D}. Zu der Grammatik GO gibt Pauli Pylkkö weiterhin einen äquivalenten endlichen Automaten FSA = (Q, q0, o , F) - einen Akzeptor - an. Die nichterminalen Zeichen werden entsprechend als Zustände des A, q2= B , q3 = C, q4 Automaten interpretiert (q0 S, q1 D ) und q4 als zusätzlicher Endzustand bestimmt. Die Zustandsüberführungsfunkti on o wird auf folgende Weise näher bestimmt: =
=
o(qo, t) = ql, o(ql , s) = qz ,
&(qo, d) = q3 q3 , &(qz, d)
•
o (ql, t) = qt, d) = q3,
0 (q3,
=
o(ql , d) = q3 , o(q3, t) q4. =
Die vom FSA akzeptierte Sprache T(G) besteht aus den Zeichenketten v E V* für die gilt T(G) = {v I o*(q0, v) = q, q E F}. Als Semi-Thue-System läßt sich der FSA AO sich mit den Regeln qot � ql , ql d � q 3 , q 3d -? q 3 , beschreiben.
qo d � q3 , qts � q z , q 3 t � q4
177 Eine Ableitung der akzeptierten Zeichenkette "tsdt" lautet:
Der entsprechende Zustandsgraph des zur Grammatik GO äquivalenten Automaten AO nimmt folgende Gestalt an:
Die Darstellung des die Sprache L(GO') akzeptierenden Automaten AO' sieht wie folgt aus:
Pauli Pylkkö (1988, 313) merkt an, daß die von ihm angegebenen Grammati ken empirisch nicht vollständig sind, wobei er unter dem Problem der empirischen Vollständigkeit die Fragestellung versteht, inwieweit der von ihm als Explanans angebotene Rahmen der formalen Grammatiktheorie die reale Kompetenz der die tonal harmony praktizierenden Personen abbildet . Folglich weisen die Automaten AO und AO', wie Pauli Pylkkö (1988, 311) anmerkt, eine recht eingeschränkte Leistungsfähigkeit für die Beschreibung der Kompetenz eines Hörers auf: An agent having the competence described by the function ... is certainly not a very advanced student of tonal harmony.
Diese eingeschränkte "Kompetenz des Hörers" ist sehr leicht einzuse hen, denn der ohnehin auf die minimale Anzahl von tonalen Funktionen eingeschränkte Automat sollte zumindest in der Lage sein, einfache Musikstücke zu charakterisieren, denen entsprechende Folgen dieser tona len Funktionen unterliegen. So akzeptieren die Automaten, welche die von den Grammatiken GO und GO' generierten Sprachen L(GO) und L(GO') akzeptieren, z . B. nicht die Folge "T T D T T T 12 I� I 12 I� I 12 I ", welche, bei schlichter harmonischer Interpretation eines jeden Taktes, dem Volkslied "Horch was kommt von draußen rein" unterliegt.
178
lt!1;·JJ'II J•J T
T
lf D lt J J T
I J' J r
D
I J·;· r
D
T
T
S
I J'J' � 'II'
T
T
S
T
I J J F IJJ'I J• I
I: JJr � J'l J J J T
IJ J J IJJ r�J'lJJJ
IJJrrIr·· �:II D
T
Die Grammatik CO bzw. CO' müßte daher z. B. um folgende Regeln zur Grammatik Cl erweitert werden: R { (B, tE), (E, tE), (E, dC), (C, tA) } Mit der entsprechenden Erweiterung der Menge VN um "E" wird eine Grammatik C1 erhalten, die solche Zeichenketten beschreibt . Für die neue Grammatik Gl haben wir folglich die Regelmenge R"' = R v R" und das nichtterminale Alphabet VN� = VN' v { E }. Der dieser neuen Grammatik Cl äquivalente nichtdeterministische Automat Al erkennt die dem Lied "Horch was kommt von draußen rein" zugrundeliegende Zeichenkette der harmonischen Funktionen und erhält folgende graphische Darstellung durch einen Zustandsgraphen: =
s
A
B
E
c
D
Nachdem Pylk.kö eine Grammatik für einfache Akkordfolgen zur Klärung des Konzepts Kadenz eingeführt hat, stellt Pylkkö (1988, 311) seine zentrale These auf: Any agent, human or artilicial, must have the Iunation S or a
lunction I such that S is included in I ... , stored in its inlormation pro cessor in order to be ab/e to recognize arbitrary subsets ol the language L(GO).
Da er sah, daß sowohl seine rechtslineare Grammatik GO sowie eine andere von ihm aufgestellte Typ3-Grammatik in höchstem Maße unbe friedigend sind, macht Pauli Pylkkö (1988, 321) Vorschläge ftir die weitere Forschung, von denen nur einer angeführt sei: 1. Try to construct con text-free grammars lor tonal harmony to explain regu/arities like modu lations and the major-minor dua/ity.
179 Au� dem bisher Angeführten ist zu entnehmen, daß eine Explikation der tradionellen Harmonielehre im Kontext der Theorie der formalen Spra chen bzw. der Automaten zu erfolgen hat. Hierbei muß ein Entschei dungsverfahren angegeben werden können, und die Komplexität der zu grundeliegende Struktur kann, so Pylkkö, nicht im Rahmen der Theorie der endlichen Automaten erreicht werden. Über die Frage der Explikation hinaus nimmt Pylkkö (1988, 309) eine psychologische Interpretation des Automatenkonzeptes vor: What kind of inner competence must a . .. Iistener minimally have in order to under stand strings betonging to L(GO)? . . .: lt must, at least be a finite automaton ...
Dabei unterstellt er, daß die dem Wahrnehmungsprozess zugrundelie genden psychologischen Mechanismen rekursive Prozesse sind und vertritt somit die neomechanistische Position. Da häufig davon ausgegangen wird, daß Maschinen nicht in der Lage sind "intentionale Bewußtseinsleistungen" wie Gestalterkennung, das Erwarten des Eintretens eines bestimmten Ereignisses etc. zu erbringen, die auch für die Wahrnehmung musikali scher Strukturen angenommen werden müssen, will Pauli Pylkkö in Anlehnung an die Arbeit des Philosophen und Automatentheoretikers R. J. Nelson (1975) nachweisen, daß Automaten prinzipiell in der Lage wären, solche Leistungen zu erbringen und somit adäquate Modelle für den menschli chen Wahrnehmungsprozess sein könnten. Hierftir entwickelt er (1988, 318) das Konzept der "harmonischen Erwartung". Da es sich bei dem Konzept der "Erwartung" um eines handelt, das zu prinzipiellen Erörterungen über die Frage nach dem Unterschied zwischen Mensch und Maschine Anlaß gibt, soll zuerst näher auf die Erörterung dieser Problematik durch R. J. Nelson (1975, 1982) eingegangen werden, der sich um eine extensi onale Analyse des intentionalen Ausdrucks "T erwartet x" bemüht. Speziell setzt Nelson sich mit Quines linguistischer Interpretation der Brentanoschen These1 auseinander, die von Quine ( 1 960/1980, 379) mit Bezug auf den Philosophen Chisholm folgendermaßen formuliert wurde: roughly ... there is no breaking out of the intentional vocabulary by explaining its members into other terms.
Als Explikat dient Raymond Nelson2 ebenfalls das Konzept des endli chen Automaten. Seine Analyse des Erwartungskonzeptes ist allerdings eingebettet in eine "Logik der Wahrnehmung" (Nelson 1982, 162), die ihre Erklärung in einer Jogic of acceptance findet. Ausgegangen wird von ei ner physikalischen Reizquelle, auch perzeptuelles Objekt genannt, welches
I) Zu der in der analytischen amerikanischen Philosophie vorgenommenen Interpretati on der Brentanoschen These als ''intentionalem Sprachgebrauch", in der über psycholo gische Zustände wie glauben, erwarten. erinnern, sehen, wahrnehmen etc. gesprochen wird und diese dann als "kognitive Sätze" {Chisholm 1956, 511) oder propositional attitudes bezeichnet werden vgl. man z. B. Seilars {1958), Chisholm (1956) sowie den Briefwechsel über Intentionalität zwischen Chisholm und Seilars {1956). 2) s. Nelson 1975, 130; Nelson 1982, 162
ff. u. speziell
187 ff.
180 durch eine Irritation der Oberfläche des rezipierenden Systems Stimu lus-Muster erzeugt und dieses somit zu einer Weiterverarbeitung veran laßt. Diese Stimulus-Muster, welche aus einzelnen Stimuli bestehen, werden von dem perzipierenden Organismus als zum Typ 't gehörend akzeptiert oder abgelehnt, je nachdem in welchem perzeptuellen Zustand e r sich befindet. D a es möglich ist, daß ein Organismus ein perzeptuelles Objekt als zum Typ 1: gehörig akzeptiert, obwohl es zu einem Typ <' -,! 1 gehört und andererseits als zum Typ 1 gehörig ablehnt, obwohl es zum Typ 't gehört, definiert Nelson (1982, 163) Wahrnehmen als das Akzeptieren eines physikalischen Objektes bzw. dessen Stimulus-Muster als vom Typ 't durch einen Perzipienten, wenn das perzeptuelle Objekt tatsächlich diesem Typ 1 angehört. Innerhalb des Wahrnehmungsprozesses unterscheidet Nelson (1982, 164) zwei wesentliche Stufen: die Rezeption und die Perzeption. Diese Unterscheidung wird von verschiedenen Autoren vorgenommen (Dretske 1969); in diesem Zusammenhang wird häufig von preprocessing und processing gesprochen; in der Musik ließe sich dies durch den Unterschied zwischen hearing und listening ausdrücken; man vergleiche Arbib (1989, 126 -139) über die Vorverarbeitung (das prepro cessing) bei der visuellen Wahrnehmung von Fröschen, Katzen und Affen und die Beziehung der Arbeiten im Bereich des Maschinen-Sehens (ma chine-vision; vision) zu diesen Forschungen. Litht
Prä-Prozessoren
' .. , .. � -
YorYerarbeitete Codierung
(Abb, nath Arbib 1989, 127l
Das preprocessing liefert sozusagen das "abstrakte Material", welches für die weitere Verarbeitung im Erkennungprozess zur Wahrnehmung ei nes Objektes herangezogen wird. Lettvin et al. (1959/1965, 1950) formu lierten diesen Sachverhalt wie folgt: The eye speaks to the bYain in a language alYeady hghly i oYganized and inteYpYeted, instead of transmit fing some moye OY less accuyate copy of light on the yeceptoYs. Beziehen sich Lettvin et al. noch auf die Vorverarbeitung der Erre gung, die durch Reizung des peripheren Sinnessystems entsteht, so muß bei der Wahrnehmung, dem Processing dieser "stark organisierten Spra che", ein entscheidender Unterschied zum physiologischen preproces sing vermerkt werden. Der entscheidende Unterschied ist, daß bei dem eigentlichen processing - der Verarbeitung, der Perzeption - "intentio nale Elemente" wie etwa Erwartungen und Wissen über den zu perzipie renden Gegenstand sowie Schlußfolgerungen beteiligt sind, welche den
181 Organismus i n einen bestimmten "mentalen Zustand" überführen, während die Rezeption die "Stimuli" konstituiert, welche die Elemente für die "Stimulus-Muster" sind. Nelson (vgl. 1982, 163) gebraucht den Terminus Stimulus nicht wie in der Psychologie üblich in dem Sinne der Reizquelle (distaler Stimulus) oder dem eigentlichen Stimulus (proximalen Stimulus), sondern ersterer entspricht seinem perzeptuellem Objekt, während dem proximalen Stimulus, der auch dem Stimuluskonzept der Physiologie entspricht, Nelsons Konzept der Irritation der Oberfläche des Rezeptions systems entsprechen dürfte. Bei der visuellen Vorverarbeitung - der Rezeption - bei Fröschen, dem amerikanischen Rana pipiens, konnten z.B. vier verschiedene, durch die neu rale Anatomie festgelegte Äquivalenzklassen von Stimulierungen unterschie den werden, welche den Bereich der möglichen Reaktionen determinieren� So konnten von Lettvin et al. (1959/1965, 248) contrast-, convexity-, moving-edge- und dimming-detectors festgestellt werden, welche funktio nal charakterisiert wurden, indem die aufgrund des durch Reizung der Retina zustandegekommenen Outputs durchgeführten Operationen gekenn zeichnet wurden, so daß sie den Reiz - das Bild - in terms of' (1) loca/ sharp edges and contrast; (2) the curvature of edges of dark objects; (3) the movement of edges; and (4) the /ocal dimming produced by move ment or rapid general darkening ausdrücken. Die alte Teilung in Empfin dung und Wahrnehmung wird daher für problematisch erachtet, und schon auf dieser Ebene von Wahrnehmung - bei Nelson Rezeption - gesprochen (Lettvin et al. 1959/1965, 253): The operations thus have much more flavor of perception then sensation if that distinction has any meaning now. That is to say that the /anguage in which they are best described is the /anguage of complex abstractions from the visual image. Lettvin et al. (1959/1965, 253) beschreiben die Operationen wie folgt: We have described each of the operations on the retinal image in terms of what common factors in a [arge variety of stimuli cause response and what common factors have no effect. Die von Lettvin et al. als "stimuli" bezeichneten Phänomene sind bei Nelson diejenigen Stimulierungen, welche zu Äquivalenzklassen von Sti muli zusammengeiaßt werden. Hierbei bilden die beschriebenen Operatio nen der entsprechenden Zellen die Abstraktionsleistung der Äquivalenz klassenbildung, die zu einer Ausgabe des Vorverarbeitungsprozesses von vier Stimuli - d. h. Inputs, Eingaben - im Sinne der Automatenheorie führen. Diese Äquivalenzklassen sind die Stimuli, die in der Automatentheorie durch die Eingabesymbole s E S dargestellt werden können. Wie es zu diesen Eingabesymbolen kam, ist für die philosophische automatentheore tische Erörterungen unwichtig. Die Stimulus-Muster werden von Nelson in der Automatentheorie durch die Zeichenketten X E s + dargestellt. Nelson 1} Lettvin et al. 1959/1965; vgl. Arbib 1972; Arbib 1987; Arbib 1989, 130 u. 131.
182 interessiert sich für die Analyse des Weges vom Stimulus zum perzeptu ellen Zustand, was e r (Nelson 1982, 163) wie folgt formuliert: So using the NFA model our object of study is the M relation of an automaton T, a relation of the paiYs (q, s) to cf where q is interpreted to be an initial state (. . .) and s is a prepared stimulus. q' is interpreted to be an inter nal mental state, a perceptual state. The transition function M is a per ceptual relation or, more properly, the accepting components of the relation.
Die Relationalitätsforderung wird mit dem Konzept des nichtdetermini stischen Automaten NFA erfüllt, der durch die Zustandsüberführungsfunk tion � : Q x S -+21QI definiert wird. Nelson bezeichnet die Funktion � mit "M". An anderer Stelle spricht Nelson (1982, 173) davon, daß die Elemente der Menge der Endzustände F perzeptuelle Zustände sind. Zwar sind alle Zustände aus Q perzeptuelle Zustände und somit die Endzustände aus F, aber Nelson (1982, 173) scheint, da er die Endzustände noch einmal be tont von den anderen Zuständen als perzeptuelle Zustände abhebt, nur diese als perzeptueUe Zustände des akzeptierenden Automaten zu be trachten: As q2 and q3 are both final ... and q2, q3 are perceptual sta tes. T goes to such a state if and only if the air is played. Either of two automaton states corresponds to (is) a percepual state.
Lied in X" Der Automat T seines Beispiels soll Akzeptor des Typs " t sein, welches durch perzeptuelle Objekte instaoliiert wird und somit unterschiedliche Stimulus-Muster für den Typ t erzeugen - (Man denke an ein Stück in einer bestimmten Tonart, das von einer Person mehrmals gesungen wird oder in verschiedenen Büchern erscheint). Da ein Automat T einem Stimulus-Muster Typ t korrespondiert, scheint es berechtigt, die Endzustände als die wesentlichen perzeptue!len Zustände zu betrachten. Den Kern von Nelsons Vorstellung des zu modellierenden Perzeptionspro zesses bildet die Folge: -t perzeptuel!es Objekt T als Instaoliierung des Typs t --+ Ergebnis des rezeptuellen ·preprocessi ng: der Stimulus s bzw. Folgen von Stimuli: die Stimulus-Muster --+ perzeptuelle Zustände q; mit dem Automaten T als zu dem Stimulus Muster Typ t in Beziehung stehend, indem er die Stimulus-Muster, die dem Typ t entsprechen, akzeptiert. Um die Erklärungskraft seiner Modelle zu bestimmen, gibt Nelson Adäquatheilsbedingungen an, welche diese zu erfüllen haben. Diese Adä quatsheitsbedingungen werden aufgrund einiger Ergebnisse der psychologi schen Forschungen und intuitiver Vorstellungen über die mentalen Fähig keiten des Menschen erstellt. Nelson (1982, 170) gibt vier Bedingungen an, die ein Modell erfüllen muß, um als Erklärung bestimmter mentaler Phänomene des Menschen zu gelten: I. Universality and Discrimination. A model must assign types to to =
kens over an indefinitely [arge domain. 11. One-Token-Many-Tvpes. A model should provide for assigning a
183 set of tokens to more than one type. The model must be relational, not functional. III. One-Type-Many-Token. The model should provide for any distinct sets of tokens sharing a single type. IV. Takin g. The model must be able to take input outside the given receptual categorization and assign a type under certain circumstances of contex.t. Die erste Bedingung, die in dem noch zu erläuternden Beispiel illu striert wird, kann aufgefaßt werden als die Fähigkeit, das Allgemeine dem Partikularen zuzuordnen, d. h. aus der prinzipiell unbestimmten empiri schen Vielfalt bestimmte Einheiten auszusondern und zu identifizieren. In der zweiten Bedingung werden einige Erkenntnisse der Gestaltwahr nehmung über Kippfiguren wie den Necker-Würfel, das Hase-Enten-Phä nomen, Machs Buch oder Rubins Pokal erfaßt. Die Reizquellen und die ihnen entsprechenden Stimulus-Muster, die token, lassen verschiedene Typ-Zuordnungen zu, indem das Figur-Grundverhältnis sich verschiebt, was die folgenden Bilder zeigen:
Abb. nach Benesch 1 9 8 9 , 62
Abb. nach Benesch 1989, 61
Abb. nach Wellek 1 96 3 , 56
Abb. nach Wellek 1963, 57
184 Auch die dritte Bedingung versucht, in der Gestaltpsychologie bekannte Phänomene zu fassen. Die one-type-many-token-Bedingung läßt sich sehr schön am Beispiel Musik aufzeigen. So wird ein Werk wie z. B. "Muß i denn ... " unabhängig von der Tonart oder dem Instrument, auf dem es realisiert wird, erkannt. Ehrenfels (1890) sprach in diesem Zusammenhang von den Kriterien der Transponierbarkeit und Übersummativität und leite te mit seiner Schrift. die gestalttheoretische Forschung ein. Die drifte Bedingung steht in enger Beziehung zur ersten. Nur besagt das Univer salitätskriterium der ersten Bedingung, daß any token of a set goes to a type, während die dritte Bedingung fordert, daß (Nelson 1982, 169) there is a family of disjoint sets, and one and the same type is the type of each set of the family. Auch wenn die Bedingt!ngen I - III erfüllt sind, so kann man noch nicht davon sprechen, daß das auf diese Weise beschriebene System gerade wenn es sich um den Menschen handelt - wahrnimmt. So müssen auch die von Eingaben erzeugten Erregungen, welche, bedingt durch die vorgegebene neuronale Architektur des Systems, keiner Klasse entspre chen, innerhalb eines gewissen Kontextes einem Typ zugeordnet werden. Hiermit wird der Erkenntnis Rechnung getragen, daß die meisten Tiere nur auf "Stimuli" reagieren, welche in ihrer "Sprache" abgefaßt sind, die durch die jeweilige Organisaton des Nervensystems bedingt ist, und nicht auf "Stimuli", die in der "Sprache" des Experimentators verfaßt wurden. Für den Bereich der menschlichen Wahrnehmung muß jedoch davon ausgegangen werden, ·daß sie nicht an die von den Vorverbeitungsmecha nismen bedingten Klassifizierungen gebunden ist und auch nicht eindeutig zuordnenbare Objekte aufgrund des Kontextes zuordnen und somit auf sie reagieren kann. So kann, wenn das Problem vereinfacht wird (vgl. hierzu auch Goodman 1973, 140 ff. besonders 145 u. 146) das token d. je nach Kontext dem Typ A oder D zugeordnet werden (Nelson 1982, 169 und 170 ):
a. A d
ua ad
baa
mdn
Abb. nach Goodman 1973, 145
Es soll an dieser Stelle nur auf die erste Adäquatheitsbedingung einge gangen werden, da das Beispiel, an dem sie illustriert wird, zum Ver ständnis der Erörterung des Ausdrucks "T erwartet x", auf das sich Pylk kö (1988) bezieht, ausreicht (man vgl. Nelson 1975; 1982, 171 ff.). Es sei noch einmal das Konzept des Akzeptierens und des Akzeptors in Erinne rung gebracht. Ein Akzeptor T ist ein Quadrupel T (Q, q0 , &, F) mit einem entsprechenden Eingabealphabet V. Dieser Automat T akzeptiert X ( v* =
185 dann und nur dann, wenn S* (q0 , x ) = q' ein Element der Menge F der Endzustände ist, d. h. q'E F. Stellen wir uns eine Person vor, die eine Melodie hört. Ihr auditorisches sensorisches System (vgl. Sampson 1976, 110 ff.) bzw. ihr rezeptorisches System wandelt das Muster der konti nuierlichen Signale (die Schallwellen) in Folgen digitaler Signale um. Die Mög lichkeit solch einer Umwandlung bedarf wohl keiner weiteren Erläuterung.1 Die Melodie ist vom Mustertyp "Lied-in-X", einer Eigenschaft bestimmter akustischer Komplexe. Jedes Erzeugen der Melodie führt zu einer Ausga be des Vorverarbeitungssystems von digitalen Stimuli 0, 1 , so daß die 1 nur in zusammenhängenden Paaren, durch eine Folge von "0", d. h. durch mindestens eine 0 getrennt, auftritt. Es entspricht jeder Folge aus v; in der mindestens einmal die Zeichenkette X = 11 vorkommt, dem Typ "Lied-in-X". Der Automat T muß genau die Menge der Zeichenketten 0*110*(0110*)* akzeptieren und alle anderen Zeichenketten abweisen, welche dann dem Typ "Nicht-Lied-in-X" entsprechen. E:in solcher Automat T kann angegeben werden durch: T = ( { qo, qt, qz, q3 , q4}, qo , S , {qz, q3 } ) mit dem Alphabet V = { 0, 1 }
•
der Zustandsüberführungsfunktion S : Q x S � Q , die wie folgt näher bestimmt ist: o(qo, 1 ) ql, o(qo, 0 ) = qo, o(ql, 1 ) q2, o(q1 , o) q4, oCq2, 1 > = q4, S(q2, 0) = q3 , o(q3, 1 ) = ql, S(q3, 0) = q3, o(q4 , 1 ) = q4 o(q4, o> q4, =
und der Menge der Endzustände F = { q2, q3 } . Der Zustandsgraph sieht folgendermaßen aus:
1
1) man denke an die compact disc. Ansonsten sei hier auf das Abtasttheorem verwiesen s. Pierce 1965, 85-99 bes. S. 88; Bauer & Goos 1982, 288 ff. u. allgemein Moore 1990, 41 ff.
186
Die akzeptierte Menge LiX = { x I S * (q0, x) E F, x E V* } entspricht den Stimulusversionen des Liedes-in-X, und die Endzustände q2, q3 werden als perzeptuelle Zustände interpretiert (Nelson 1982, 173 ). Dieser Automat, der den Typ t = Lied-in-X erkennt, erfüllt die erste Bedingung, denn er unterscheidet zwischen Lied-in-X und Nicht-Lied-in-X. Ein solcher "Hörer" wäre jedoch ein schlechter "Hörer", da er nur ein einzi ges Lied erkennen könnte. Um mehrere Stücke zu unterscheiden, könnte man sich einen Produktautomaten vorstellen, sozusagen eine "parallele Schaltung" von verschiedenen Akzeptoren, die jeweils einem Typ t eines Liedes entsprechen. Dieser aus Subautomaten zusammengesetzte Automat besäße ein bestimmtes Eingabealphabet, z. B. akustische Stimuli, das von den Subautomaten parallel verarbeitet würde (vgl. näheres Nelson 1982, 173; 1968, 187 ff.). Zu den Einschränkungen der Modelle , die nur die Adäquatheitsbedingung I erfüllen, und zu denen das angeführte Beispiel gehört, merkt Nelson (1982, 175) an: Models that satisfy Condition I have rather gross limitaticns. They presuppose no ambiguities amongst the stimuli S; but this is a consequence of the assumption that all receivers, like frogs, divide their quality spaces (per each modality} into disjoint classes of stimuli. This Iimitation will be lifted in considering Condition N.
Da nach Ergebnissen der Gestalttheorie zur Wahrnehmung Teile durch das Ganze bestimmt werden, stellt Nelson die Fragen: Can automata satisfy condition
N?
Can these models cope with degraded characters ...
Um sich der Beantwortung dieser Fragestellung zu nähern, die sich mit Problemen der Bestimmung des Konzeptes der Intentionalität und dem mit ihr in Beziehung stehenden Konzept der Erwartung auseinanderzusetzen hat, soll zunächst der Ausdruck "T erwartet x" erklärt werden, denn es er wartet z. B. ein deutscher Leser beim Lesen des Wortes "bd.ld" aufgrund des Kontextes den Buchstaben "a" und faßt "cl." somit als "a" und nicht als "d" auf. Um den Ausdruck "T erwartet x" mit Mitteln der Automatentheorie zu erklären, führt Nelson den Begriff des Gewinners ein. Es soll modelliert werden, wie eine Person P einem Lied zuhört (Ji sten), von dem sie einen Teil v schon gehört hat und der Teil w noch folgt. Es soll die Idee präzisiert werden, daß P aufgrund des gehörten Teiles v Erwartungen hat, die durch den noch folgenden Teil w erfüllt oder enttäuscht werden. Vorzustellen ist, daß die ersten Tone eines Stückes erklungen sind und dies P eine bestimmte Melodie (z. B. Alle meine Entchen) erwarten läßt. Der nächste Ton könnte seine Erwartung über den weiteren Verlauf der Melodie bestätigen, während jedoch die weiteren Töne seine Erwar tung enttäuschen. Mit dem Automaten T soll jetzt dieses Verhalten von P modelliert und die Konzepte "erfüllen" und "enttäuschen" erklärt werden. Angenommen, T "betrachtet" eine Zeichenkette u = vw mit v, w ( V* und u = v+, und ö* (q0, v) = q' zum Zeitpunkt t und ö * (q', w) = q" mit
187
t' > t, d. h . der Zeitpunkt t' tritt nach dem Zeitpunkt t ein . T wäre wieder als Typerkennungsmechanismus einer bestimmten Melodie zu interpretieren. Das Konzept des Gewinners formuliert Nelson (1975, 132; 1982, 187) folgendermaßen: Gibt es eine Kette X € v + , so daß sie einen Zustand q von T, in dem sich T befindet, in einen Endzustand S * (q, x ) = q'€ F überführt, so wird q Gewinner (winner) genannt. Akzeptiert der Automat überhaupt eine Zeichenkette x € y+ , dann ist der Anfangszustand per definitionem ein Gewinner. In dem angegebenen Beispiel des Akzeptors für den Typ Lied-a-in-X, sind die Zustände q0, q , q2, q3 Gewinner. Der Zustand q4 ist dagegen kein Gewinner. Ein 1 Endzustand kann Gewinner sein, muß es aber nicht. Der Ausdruck "T erwartet x" wird dann mit Rekurs auf den Begriff "Gewinner" definiert� Ein Automat T erwartet x € y+ genau dann, wenn T sich zum Zeit punkt t in einem Gewinnerzustand q befindet und die Zeichenkette x den Gewinnerzustand q in einen anderen (möglicherweise denselben) Gewin nerzustand o*(q, x ) = q' zum Zeitpunkt t' > t überführt. Befindet sich der Automat unseres Beispiels in Zustand q1, dann er wartet er z. B. die Zeichenketten 1, 10, 100, 101, 10110, etc. Diese Zeichenketten entsprechen nicht den Zeichenketten, die der Automat T akzeptiert, aber daß sich der Automat in q1 befindet, beinhaltet, daß er zuvor eine I als Eingabe erhalten hat und eine zweite folgen könnte. Er erwartet sozusagen eine weitere Eingabe mit 1 . Diese Erwartung kann erfüllt oder enttäuscht werden. Dies legt nahe, die beiden Konzepte wie folgt zu erklären (Nelson 1975, 133; 1982, 188): Oie Zeichenkette x erfüllt die Erwartung von T zum Zeitpunk t dann und nur dann, wenn T sich zum Zeitpunkt t in einem Gewinnerzustand q befindet und es einen späteren Zeitpunkt t' gibt, zu dem x aufgetreten ist und S* (q, x ) = q' ein Gewinnerzustand ist. Die Zeichenkette x enttäuscht die Erwartung von T zum Zeitpunkt t genau dann, wenn T sich zum Zeitpunkt t in einem Gewinnerzustand q befindet und für jeden Zeitpunkt t' > t und y :1: x gilt, wenn y zum Zeit punkt t' erscheint, dann ist S *(q, y) kein Gewinnerzustand. Diese Idee läßt sich auch anders ausdrücken: ''Tq" soll angeben, daß der Automat sich in einem Gewinnerzustand befindet. Das Erwartungskonzept kann dann formuliert werden als: Tq erwartet x genau dann, wenn der auf grund der weiteren Eingabe X erreichte Zustand s*(q, x ) = q' ein Gewin ner ist. Zwei Zeichenketten x, y sind g-äguivalent genau dann, wenn gilt, Tq erwartet x und Tq erwartet y. Oie Menge E wird dann aus den q-äquivalenten Zeichenketten x gebildet. Die Konzepte "erfüllen" und "enttäuschen" lassen sich nun in folgender Weise formulieren: x erfüllt Tq genau dann, wenn x € E ist x enttäuscht T q genau dann, wenn x t. E ist Es läßt sich also sagen, daß, obwohl x von Tq erwartet wird, jede Zei-
q € F zum Zeitpunkt "
t) Nelson 1975, 133; Nelson 1982, 187 u. 188.
188 ehenkette y * x die Erwartung von Tq erfüllen kann, wenn sie Element von E ist und es sich somit um eine q-äquivalente Zeichenkette handelt. Ist sie jedoch nicht ·q-äquivalent, liegt also nicht in E, dann wird die Erwartung enttäuscht. Befindet sich in unserem Beispiel der Automat T in Gewinnerzustand q1, gilt also Tq , so erwartet er z. B. die Zeichen 1 kette 1 , aber auch die Zeichenkette 1011 erfüllt die Erwartung. Die Zei chenketten 0, 0101, etc. enttäuschen sie hingegen. Daß Erwartungen beim Musikhören auch nicht nur phänomenal zum Tragen kommen, sondern auch eine physiologische Basis haben könnten, mögen die Äußerungen Juan G. Roederers (1974, 223) vermuten lassen, der m. E. in einer phänomenalen Sprache spekulierend von den Funktio nen des sensorischen Systems redet, indem er u. a. von Antizipationen und Erwartungen1 spricht, wobei allerdings anzunehmen ist, daß er die Konzepte Antizipation und Erwartung im gleichen Sinn gebraucht: Quite generally, the auditory system, like other systems, operates on the prin ciple of "minimum effor(': the identification process of musical (and other sensorial messages), the system first discards all but a certain minimum of information cues. lf the identification process has been succesful it proceeds ahead with the next message. lf not, it goes back to the fast memory and searches for additional cues. This applies not only to a single one-tone input, but also to a musical message as a whole: the nervous system tries to use whatever information is available from previous experiences (e. g., memory stored messages) to anticipate the identification process of new incoming information. This "prediction" or "extrapolation" capability - . .. perhaps the most essential operation of the nervous system .. . - has been confirmed through electro-physiologi cal measurements: when a certain event in a previously learned suc cession of stimuli is expected ... Nachdem gezeigt wurde, wie Nelson die Konzepte "Erwarten", "Erfüllen" und "Enttäuschen" im Rahmen der Automatentheorie expliziert hat, soll gezeigt werden, wie Pylkkö (1988, 315 ff.) sich dieser Konzepte bedient. Pauli Pylkkö (198 8, 318) benutzt sie, um sein Konzept der harmonischen Er wartung zu bestimmen: ... we ... define harmonic expectation of an automaton M by resorting to the set of expected strings. Es soll von Pauli Pylkkö (1988, 316) ausgehend ein vereinfachter Automat K angegeben werden, dessen akzeptierte Sprache L(K) nur die Zeichenket te "tsdt" beinhaltet. Der Automat K wird bestimmt durch die partielle Funktion 8 : t ) = ql &(q3, t) q4
o(qo ,
o(ql, s) q2 &(q3, s) = qs . =
1) In der neueren musikpsychologischen Forschung wird dem Konzept der Erwartung eben falls verstärkt Aufmerksamkeit gewidmet, man vgl. Schmuekler 1989, Jackendoff 1991.
189 Um einen vollständigen Automaten zu erhalten, muß man nur die restli chen Eingaben dem Zustand q5 zuführen, d. h. S(q, a) = % für die rest lichen Eingaben mit q ( Q und a ( V. Die folgenden Erörterungen gelten jedoch nur für den angegebenen Automaten; sein Zustandsgraph sieht folgendermaßen aus:
Die Zustände qo, q1 , q5, kein Gewinner ist. Kq0 - so erwartet er Zeichenketten sind q0
q 2 , q3 sind Gewinner, Endzustand ist q4, der, wie Befindet sich der Automat K in Zustand q0 - also die Zeichenketten "t", "ts", "tsd", und "tsdt': Die äquivalent und Elemente der Menge EO. Tq1 er wartet die Zeichenketten "s", "sd", "sdt", welche die Menge E1 bilden; Tq2 erwartet "d", "dt", welche in E2 enthalten sind; Tq3 erwartet "t" und ist Element von E3. Die Zeichenkette "ds" zum Beispiel wird nicht erwartet. Befindet sich der Automat im Zustand q2, erwartet er "d" und "dt", welche seine Erwartung auch erfüllen, denn "d" und "dt" sind Elemente von E2. Für den Zustand q2 enttäuscht "ds" die Erwartung, denn "ds" ist nicht Element von E2. Wie zu sehen ist, muß die zu erwartende Menge EM = EO v El v E2 u E3 = {t, s, d, ts, sd, dt, tsd, sdt, tsdt} nicht mit der akzeptierten Menge L(K) = { tsdt} identisch sein. Die Menge EM entspricht dem von Pylkkö erwähnten Konzept der harmonischen Erwartung des Automaten K. Es liegt die Vermutung nahe, daß sich ein endlicher Automat - sozusa gen ein "Erwartungsautomat" - konstruieren läßt, der die Menge der er warteten Zeichenketten akzeptiert. Pylkkö (1988, 317) gibt einen Algo rithmus zur Herstellung eines solchen Automaten an, der m.E. nicht ganz korrekt ist: 1) ... , for each state and each terminal wi'th which the state can be transformed write a new function with the state and terminal as arguments but final state as value. 2) .. . Add the original M to the new function created by 1. Denote the result by Mt. 3) . . . , transform each function of Mt which has a non-initial state as its argument into a new function with the state and terminal. Add these new functions to the functions created by 1 and 2. Nehmen wir als Automaten M den oben eingeführten Automaten K, nach 1) erhalten wir: S(q0, t) = q4, S(q1 , s) = q4, S (q2, d) = q4, O {q3, s) = q4. Nun wird, gemäß 2), die Beschreibung der Funktion des Automaten K hinzugefügt: S(q0, t) = q1, S(q1, s) = q2 , S(q2 d) = q3, S(q3, t) = q4, S(q3, s) = q5. Die Zustandsüberführungsfunktion S ist daher:
190
S (q0, t) = q4 S(q0, t) = ql S(q3, s) = qs
S(q1, s) S(qt, s)
=
q4 q2
S(q2, d) = q4 S(q2 , d) q3
O{qJ, s)
S(q3, t)
=
=
q4
q4
Der dritte Schritt des Algorithmus wird durchgeführt: S(q0, s) = q4 S(qo , s) = qs Insgesamt hat der "Erwartungsautomat" folgende Überführungsfunktion S(q0, S (q0, S(q3, S(q0,
t) = q4 t) = qt s) = qs d) = q3
S (qt, !i (q t , S (qo , S (qo ,
s) = q4 s ) = q2 s ) = q4 s ) = qs
S ( q2 , d) = q4 S ( q2 , d) = qJ S (qo , s ) = q 2
S(q3, s) s (q3' t) S ( q0 , d)
8:
q4 q4 q4
und folgendes Zustandsdiagramm:
Wie unschwer zu erkennen ist, akzeptiert der neue Automat auch die Zeichenkette "tsds". Es handelt sich hier um eine Zeichenkette, die nicht in der Erwartungsmenge EM von K enthalten ist. Die Ursache für diese Zeichenkette liegt im ersten Schritt des angegebenen Algorithmus: Auf grund des ersten Schrittes wird die Herstellung der Transition !i(q3, s) = q4 gefordert, die für diese Zeichenkette verantwortlich ist. Ein alter nativer Algorithmus wäre m. E. - wenn die Gewinnerzustände bekannt sind - einfach die Umbenennung aller Gewinnerzustände in Endzustände. Welche Forderungen ergeben sich für Pylkkö aus seiner Untersuchung? Das Ergebnis seiner Arbeit faßt Pylkkö (1988, 321) in den folgenden The sen zusammen: 1. The 'laws' of tonal harmony are grammatical in nature.
2. Musical objects, like chords, are cognitive objects the behaviour of
which is best explained by considering them as syntactic objects of formal systems. 3. A general explanation of tonal music must be ap-
191
proached by applying the theory of recursive formal languages and know ledge about their relation to automata. 4. The main methodological prin ciple underlying this approach is this: Choose the property of tonality you want to explain and reduce it to the weakest possible formalism which still can meet the demands posed by empirical completeness. Wie ist seine Arbeit nun zu beurteilen? Es wurde deutlich, daß im wesentlichen drei Aspekte der Argumentation unterschieden werden:
1 ) die Explikation musikwissenschaftlicher Konzepte;
2) die psychologische Interpretation; 3 ) die allgemeine philosophische Argumentation.
Was den ersten Punkt anbelangt, so muß vom musikwissenschaftliehen Standpunkt aus angemerkt werden, daß eine Grammatik, die sich nur mit einer wenig ausdifferenzierten Folge wie "tsdt" beschäftigt und Probleme wie etwa die Unterscheidung von Dur und Moll vernachlässigt, als äußerst unbefriedigend zu gelten hat, zumal es schon Arbeiten mit Grammatiken gab, die sich differenzierter mit der Explikation des Konzeptes Kadenz auseinandersetzten und einige dieser Grammatiken zur Komposition ein gesetzt wurden� Weiterhin war zu sehen, daß Pylkkö versuchte, durch Einbeziehung des Erwartungskonzeptes auch seine psychologische Interpretation des Auto matenkonzeptes zu erweitern. Gerade bei psychologischen Erörterungen treten häufig Vermischungen mit philosophischen Problemen auf. Nelson benutzt die automatentheoretischen Konzepte, um seine neomechanistische These mit Plausibilitätsargumenten zu stützen, ohne damit schon ein zutreffendes Modell eines psychologischen Phänomens zu geben. Pylkkö dagegen will, wenn ich ihn recht verstehe, ein zutreffendes psychologi sches Modell des Musikhörens erstellen. Er versteht damit m. E. schon den Ansatz von Nelson falsch, und indem er das Konzept der Erwartung als Menge der von einem "Erwartungsautomaten" akzeptierten Zeichenket ten interpretiert, die dann noch als Kompetenz verstanden wird, werden die von Nelson und Chomsky eingeftihrten Konzepte vollends fruchtlos mißinterpretiert.2 Noam Chomsky führte das Konzept der Kompetenz ein, um das theoretische Problem zu lösen wie es möglich ist, daß ein endli cher Automat Sprachen verarbeiten kann, die eine größere Komplexität aufweisen, so daß er sie eigentlich nicht vollständig akzeptieren kann. Ei ne solche Notwendigkeit ist für die von Pauli Pylkkö vorgestellten Kon zepte nicht gegeben. 1) So z. B. von dem französischen K�mponisten Barbaud 1965, 1968; vgl. auch das Kapi· tel 3. 1. 3, S. 200 ff. über Graphgrammatiken. 2) Zur automatentheoretisch motivierten Unterscheidung von Kompetenz und Perfor manz in der Chomskyschen Theoriebildung s. Abschnitt 2. 2. 4, S. 97 ff.; vgl. auch Chomsky 1961/1964 u. Chomsky & Miller 1963.
192 Auch Raymond Nelsons Plausibilitätsargumentation, in der Automatenzu stände als perzeptuelle Zustände interpretiert werden, wird im Rahmen eines 'Erwartungsautomaten' unsinnig, da es darum ging, Erwartung in Abhängigkeit von bisherigen Eingaben bzw. der letzten Eingabe zu be schreiben und somit eine gewisse "Prozessualität" des Wahrnehmungsvor gangs zu fassen, die bei einer statischen Interpretation der Erwartungs kompetenz verloren geht. So werden, wenn sich der Automat K z. B. im Zustand q2 befindet, die Zeichenketten "s", "sd" und "sdt" noch erwartet, aber nicht mehr "tsdt". Insgesamt läßt sich sagen, daß die Arbeit leider keine fruchtbaren Ergebnisse erbrachte, weder in musikwissenschaftlicher noch psychologischer Hinsicht, und der subtilen philosophischen Argumen tation von Raymond .J. Nelson ist sie ebenfalls nicht kongenial. Ein Ansatz, der sich eines anderen Grammatik-Konzeptes zur Erklärung musikwissenschaftlicher Termini im Rahmen semiotischer Forschung be dient, dabei aber psychologische und philosophische Problemstellungen ausklammert, findet sich in den Arbeiten von Bogdan Cazimir (1975, 1976).
193 3. 1. 2
Lindenmayersysteme zur Explikation des Konzeptes der Melodievariation
Eine weitere Form von Grammatiken stellen die Lindenmayersysteme dar, die Bogdan Cazimir (1975, 1976) verwendet, um das Konzept der melodischen Veränderung zu erklären. Lindenmayersysteme LS wurden von Aristid Lindenmayer (1968) zur formalen Beschreibung organismischer Wachstumsprozesse entwickelt. Sie unterscheiden sich in folgenden drei Punkten von den "normalen" generativen Grammatiken:1 1 ) In LS wird parallel ersetzt, d. h., alle anwendbaren Regeln werden in jedem Ableitungsschritt gleichzeitig angewandt. Bei den generativen Grammatiken erfolgt pro Schritt eine Regelanwendung. Die Regelan wendung ist in diesem Sinn sukzessiv. 2) Es gibt nur einen Zeichenvorrat V, der nicht weiter unterteilt wird. Bei den generativen Grammatiken gibt es eine Einteilung des Zeichenvor rates V in nichtterminale und terminale Zeichenmengen V = VN v Vr. 3) Das Axiom (Startsymbol) besteht aus einem Wort aus v+ . Bei den generativen Grammatiken handelt es sich um ein Anfangszeichen S € VN. Ein Lindenmayersystem LS ist ein Tripel (V, s, R), d. h., es besteht aus einem Vokabular V, einem Startwort (Axiom) s aus v + und einer Menge R von Regeln. Als Beispiel soll ein Regelsystem2 angeführt wer den, das die Entwicklungsstadien der Rotalge - einem Fadenorganismus nachbildet (vgl. Salooma 1978, 233). LSROT = (V = { 0, 1 , 2, 3, 4, 5, 6, 7, 8, (, ) II }, s = 1 , R = { 1 �2113, 2 � 2. 3 �2114, 4 �504, 5 � 6, 6 � 7, 7 � so>. 8 � s . c � >. ) � ). 11 ���. o �
Die Ableitung einer Struktur stellt sich wie folgt dar:3 2=3 2112114 2112115Q4
21121160504 2112117060504 2112118(1)07060504 2112118 (2113 )08(1 )07060504 2112113 (2112u4 )08(2113:08(1 )07060504
Axiom s PO Pt P2 nach Anwendung der Regeln 2 � 2, 11 ---+ 11 und 3 � 2114 P3 P4 PS P6 P7 PS
1) Für die weiteren Ausführungen folge ich Salooma 1978, 231-235.. 2) Im Anhang E findet sich ein LISP-Programm, das ebenfalls die hier beispielhaft gegebene Ableitung durchführt. 3) "P" bezeichnet den direkten Ableitungsschritt der simultanen Regelanwendung..
194 Graphisch läßt sich die obige Ableitung so darstellen, daß der Ein druck eines durch Zellteilung wachsenden Organismus entsteht: die Zei chen " 11 " und "0 , werden als I und I bzw. \ in der Zeichnung in terpretiert, während die durch " ( " und " ) " geklammerten Zeichenketten als Verzweigungen in Erscheinung treten. "
(D
PO
Cill)
Pl
Giili)
P2
�
P3
(21216/5\4)
P4
(212��6Zs�4)
P6
P7
P8 Das von Bogdan Cazimir abgewandelte Lindenmayersystem soll als Ex plikat des Explanandums "melodische Umgestaltung" darstellen. Diese Ex plikation ist seiner Meinung nach notwendig, da die Musikwissenschaft es bisher nicht geschafft hat, grundlegende Entitäten der musikalischen Analyse wie z. B. Motiv, Thema, Phrase etc. zu präzisieren, zu denen auch das Konzept der musikalischen Veränderung (transformation musica Je) gehört, welches ebenfalls von zentraler Bedeutung ftir diese ist. Den Mu siksemiologen Jean -Jacques Nattiez zitierend hebt er die bisherige Un bestimmtheit dieses Konzeptes hervor (Cazimir 1975, 981 ) Par example, selon J. J. Nattiez ( . .) "... afin que deux unite soient dans un rapport de transformation, il est necessaire que la deux.ieme conserve quelque chose de la premiere . Dieses quelque chose, das Bogdan Cazimir als Invariante der musi kalischen Veränderung bezeichnet, muß präzisiert werden, denn ein Fehlen der näheren Bestimmung conduirait a tabsurde: n'importe quoi peut etre le transformat de n'importe quoi. Drei Typen musikalischer Veränderungen werden von ihm unterschieden: .
"
:
195 die melodische, die rhythmische und die harmonische Veränderung. Die Begriffsbestimmung der melodischen Veränderung !bildet das zentrale Thema seiner Arbeiten (Cazimir 1975, 984 ) : Le traitement uniforme des transformations melodiques a [' aide des systemes Lindenmayer (1968) constitute un premier pas vers la d{ifinition rigoureuse de la Iransforma tion musicale. Ausgangspunkt ist für ihn das europäische Tonsystem mit seiner tem perierten Stimmung, in dem der Halbtonschritt die kleinste Entfernung zwischen zwei Tönen beschreibt, immer die gleiche Größe aufweist, und ein Tonumfang von C2 bis es vorausgesetzt wird. gva
fl�
-&-
Ii
'U'
'U'
-
Ii
..0..
..0..
±
gvabassa
deutsche Bezeichnungen: c c Cz Ct amerikanische Bezeichnungen: c3 Co Ct Cz
cl
c2
c3
c4
eS
c4
Cs
c6
c7
Ca
Enharmonische Umdeutungen werden in Cazimirs Untersuchungen nicht gesondert berücksichtigt, so daß z. B. cis und des als äquivalente Be zeichnungen eines bestimmten Tonhöhenereignisses genommen werden. Er faßt die durch die Tonnamen bezeichneten Tonhöhen als Menge T zusam men: T = {C 2, CIS2, D2, DIS2, E2 , F2 , FIS2, ... , hs, es}. Diese endliche nichtleere Menge T enthält 97 Elemente. Die Elemente dieser Menge bilden die Zeichen (Cazimir 1976, 52 verwendet dafür das Wort 'mots') des Alphabets. Jedem Tonnamen v ( T wird eine positive ganze Zahl n(v) zugeordnet, welche die Anzahl der Halbtonschritte angibt, die der von ihm bezeichnete Ton von dem Ton C2 entfernt ist. Es gilt (n(C 2) = 0) s n(v) s (96 = n(cS)), d. h. n(v) kann die Werte 0, 1 , ... , 96 annehmen. Ein melodisches Intervall zwischen zwei Tönen v, w wird durch ein geordnetes Paar der Tonnamen (v, w) dargestellt. Die Größe des Abstan des zweier Töne v, w eines melodischen Intervalles h(v, w) wird durch h(v, w) = n(v) - n(w) berechnet und ist eine ganze Zahl, welche den Abstand der beiden Töne voneinander in Halbtonschritten angibt. Ist diese Zahl kleiner als 0, d. h. h(v, w) < 0, dann handelt es sich um ein auf steigendes melodisches Intervall, ist andererseits h(v, w) größer als 0 , al-
196 so h(v, w) > 0, dann ist es ein absteigendes melodisches Intervall. Ein melodisches Intervall m soll die Bedingung (h(C2, eS) = -96) � m � ( +96 = h(cS, C2)) erfüllen, d. h. es soll nur einen Wert von -96 bis + 96 annehmen. Der Ton w%m ist der Ton v, für den n(v) = n(w) + m oder n(v) = n(w) - m gilt. Es handelt sich bei w%m um einen Ton, der von dem Ton w m Halbtonschritte entfernt ist. Damit es solch einen Ton w%m gibt, muß n(w)+m oder n(w)-m größer oder gleich 0 sein und kleiner oder gleich 96, d. h. h(C2 , C 2) = n(C2) = 0 � n(v)� m � +96 = n(cS) = h(c s, c2). Nachdem die Darstellung der einzelnen Töne, der zwischen ihnen be stehenden Intervalle und deren Abstandsgröße bestimmt wurde, soll nun das Konzept der Melodie spezifiziert werden. Eine endliche Folge von Zeichen x = x1x2 x0 ( mit Xj € T, 1 s i � n) - es handelt sich um eine Zeichenkette (ein Wort) über T - wird von Cazimir (1976, 52) Phrase bzw. melodische Phrase (phrase meJodique) genannt. Die Zeichenkette x ist also ein Element aus T* - die Menge der Zeichenketten (bzw. Worte) über T bezeichnet Cazimir als Jangage universei - , die ebenfalls das leere Wort e enthält. Die Länge l(x) einer Zeichenkette x = x1x2...x0 ist n, und im Fall des leeren Wortes e ist wie üblich l(e) = 0. Jede nichtleere Menge von melodischen Phrasen bil det eine Sprache über T. Bogdan Cazimir (1976, 52) betrachtet chaque corpus musicale comme un Iangage sur . . T. Ein musikalischer Korpus wird also als nichtleere Teilmenge von T* aufgefaßt. Um das Konzept der Invarianten einer melodischen Phrase x innerhalb einer Klasse von melodischen Veränderungen näher zu charak terisieren, benutzt Cazimir (1976, 52 u. 53; 1975, 982) das Konzept der di rekten Ableitung innerhalb eines leicht veränderten Lindenmayersystems. Ein Lindenmayersystem LS ist ein geordnetes Paar LS = (V, P), wobei V eine endliche nichtleere Menge von Zeichen und P eine nichtleere end liche Menge von Regeln (Produktionen) der Art v-'tw mit v € V und w E v* ist. Eine direkte Ableitung der Zeichenkette y = y1y2 ...yk aus der Zei chenkette x = x1x2 xm, ist gegeben, wenn es eine Darstellung des ' Wortes y = y1'. . Ym'• (mit Yi € V*; 1 s i � m) und anwendbare Regeln xi -'t y{ gibt. Man kommt direkt von einem Wort x zu einem Wort y, wenn die gleichzeitige Anwendung von Regeln aus P auf das Wort x in einem Schritt zu dem Wort y führt. Cazimir nimmt als Menge V die Menge der Tonnamen T und gibt eine Menge von Regeln P an, die er in ihrer typischen Form anführt: v-'t e, v -'tv, v-'tv%m mit v, v%m € T. Wobei v%m durch n(v%m) = n(v)+m oder n(v%m) = n(v)-m bestimmt und 'm' wieder als melodisches Intervall inter pretiert wird. Das melodische Intervall m muß die Ungleichung 0 � n(v) +m � +96 bzw. 0 � n(v) - m � +96 erfüllen. Innerhalb des zur V erfügung gestellten Rahmens erfolgt dann die Defi..•
.
•••
.
197
nition der Invarianten eines melodischen Satzes x (l'invariant de Ja phrase melodique) sowie verschiedener melodischer Veränderungen (transforma tions melodiques), für die das Konzept der direkten Ableitung (derivation di recte) wesentlich ist. y1y2 ...y0 gegeben, x 1x2 ... x0 und y Sind zwei melodische Phrasen x die in der Beziehung einer melodischen Veränderung stehen, so hat man h(xi , Yi ) f 0 für höchstens eine Zahl z s: n von Indices, d. h., es können maximal n Töne der beiden Phrasen voneinander abweichen. Es wird z der Wiedererkennungsindex (J'indice de reconnaissance) der melodischen Verwandschaft der Phrasen x und y genannt. Je niedriger sein Wert ist, desto ähnlicher sind die beiden melodischen Phrasen. Die Invariante der Phrase x ist die Menge IN = {xi I xi = Yi· 1 s: i s: n}. deren Kardinalität I IN I = n - z ist. Die Menge IN, die Invariante einer Phrase x, besteht folglich aus den Tönen der Phrase x, die mit den Tönen der Phrase y identisch sind. Dies können maximal n Töne sein. Wenn z Töne der beiden Phrasen differie ren, dann handelt es sich um n - z Töne xi der Phrase x. Von den verschiedenen melodischen Veränderungen, die Bogdan Cazimir (1975; 1976) definiert, seien drei vorgestellt: die genaue Wiederholung (Ja repetition exacte), die Rechtshinzufügung (J'addition a droite) und die Transposition (Ja transposition). Die genaue Wiederholung einer melodischen Phrase x ist die durch di rekte Ableitung D aus x erhaltene Phrase y. Die Produktionsregeln haben die Form xi---?Yi mit Yi xi für 1 s: i s: n. Es könnte für die Form der Regeln also auch Xj ---7 Xj geschrieben werden. Nach der direkten Ablei tung bleibt x erhalten, d. h. y x. Der Wiedererkennungsindex z ist gleich 0, und die Invariante IN {xi I 1 s: i s: n} hat die Kardinalität n. Die Rechtshinzufügung ist eine melodische Veränderung, bei der eine melodische Phrase x durch Anfügung eines oder mehrerer Zeichen (Töne) auf der rechten Seite verändert wird. Nach Cazimir (1976, 54; 1975, 983) wird die melodische Phrase y durch direkte Ableitung aus x gewonnen, wenn für die ersten Xj Zeichen mit 1 s: i s: n-1 von x = x1x2 x0 Regeln der Form Xj ---7 Xj vorhanden sind. Die Regel x0 ---7 Yn soll die Bedingun gen l(y0 ) � 2 und a1 = x0 erfüllen, wobei Yn = a1a2 ak sein soll. Hier sind einige Anmerkungen angebracht. Cazimir hatte die Form der Regeln mit u ---7 e, u---7 u, u---7 u%m angegeben. Es sollten u, u%m E T sein. Daher könnte es eigentlich keine Regel der Form u ---7 w mit w E T*I { e} geben, wie durch· die Bedingung l(y0) � 2 gefordert wird. Wird l(yn) � 1 ge fordert, so ist klar, daß auch Yn a1 a2 ...ak nicht durch direkte Ableitung erreicht werden kann. Dies ist nur bei dem Spezialfall l(y0 ) 1 mit a1 x0 möglich, in dem Bogdan Cazimir auch von genauer Wiederholung spricht. Es wäre also zu empfehlen, in die Beschreibung der Regeln die Form u � w mit w E T*/{e} aufzunehmen, wie sie von Bogdan Cazimir für die Lin denmayersysteme im allgemeinen angegeben wurde. =
=
=
=
=
•.•
•••
=
=
=
198 Die Tranposition dürfte die dem Musiker bekannteste Form der melodi schen Veränderung sein. Auch sie wird von Bogdan Cazimir über das Konzept der direkten ·Ableitung definiert. Die melodische Phrase y wird aus x durch direkte Ableitung gewonnen und für alle Regeln xi --7 Yi gilt folgende Bedingung: h(xi, Yi ) = t ist konstant. Das melodische Intervall, das zwischen den in den Regeln angegeben Tonnamen bzw. Tönen besteht, weist eine konstante, in Halbtonschritten angegebene Größe auf. Die Trans position läßt sich dann durch n Regeln der Form xi --7 xi%t definieren, wobei xi%t den von xi ausgehend um t Halbtonschritte erhöhten bzw. erniedrigten Ton bzw. Tonnamen kennzeichnet. Eine genaue Wiederholung kann dann ebenfalls als Transposition um 0 Halbtonschritte verstanden werden. Die Transpositionregeln d --7 c (= n(d) - 2), h --7 a (= n(h) - 2), etc. einer Melodie d, c, etc. beschreiben die Transposition einer Melodie um eine große Sekund!e (einen Ganzton) tiefer. Es mag Bogdan Cazimir zwar gelungen sein, den Konzepten melodische Veränderung und Invariante eine exakte Definition zu geben, die Frage stellt sich allerdings, was insgesamt gewonnen wurde. Wie schon durch die Erläuterungen ersichtlich, würde sicherlich kein Musiker oder Musik wissenschaftler die genaue Wiederholung einer Melodie, die Verlängerung einer Melodie durch Anfügen von Tönen, oder gar das Transponieren ei ner Melodie im temperierten Tonsystem als sprachlich unklar und daher in irgendeiner Form als der Diskussion bedürftig erachten. Da auch die anderen Definitionen nicht über diesen Grad an Aussagekraft hinausgehen und auch nicht im Rahmen eines formalen Systems einen gewissen Stel lenwert erhalten, muß der Forschungsansatz von Bogdan Cazimir als unfruchtbar bewertet werden. Es soll hiermit aber nicht behauptet wer den, daß Lindenmayersysteme für die Darstellung musikalischer Sachver halte nicht geeignet sind, sondern allein die Art kritisierbar scheint, wie diese von Bogdan Cazimir eingesetzt wurden, denn für diese Forma lisierung gilt, wie Bredenkamp und Graumann (1973, 61) nicht nur für den Bereich der Verhaltenswissenschaften zutreffend anmerken: Richtig einge setzt vermag die Mathematik in den Verhaltenswissenschaften in der Formalisierung und Axiomatisierung mit Hilfe mathematisch-logischer Konstrukte zu besseren Theorien, in der Messung zu gesicherten For schungsergebnissen zu führen. Falsch ... eingesetzt, verschafft die Ma thematik der Verhaltenswissenschaft den Glanz der Pseudoexaktheit oder aber die hochgradig gesicherte Erkenntnis von Trivialitäten. Bogdan Cazimirs Arbeiten zeigen exemplarisch den fruchtlosen Einsatz mathematischer Konzepte, indem mit dem Glanz der Pseudoexaktheit . . . die hochgradig gesicherte Erkenntnis von Trivialitäten betrieben wird.
Unter wissenschaftshistorischen Aspekten erweisen sich seine Arbeiten insofern als interessant, als sie an der Schnittstelle der für die 70er Jah re auch in der Musikwissenschaft stark vertretenen semiotisch-semiologi schen Forschungen (Nattiez 1975, 1986; Schneider 1980; Lischka 1987b)
199
und der von Chomsky beeinflußten linguistischen Forschungen stehen, für welche die Idee der Grammatik zentral ist. Eine weiterer Ansatz , der sich an der Schnittstelle Semiotik, Linguistik, Künstlicher Intelligenz (KI) und musikwissenschaftlicher Forschung bewegt, findet sich in den Arbeiten von Christoph Lischka (1984a, 1984b, 1987a, 1990, 199la, 199lb; Lischka & Güsgen 1986).
200 3. 1. 3
Graphgrammatik und frühe Riemannsche Funktionstheorie
War es das erklärte Ziel von Bogdan Cazimir (1975, 1976), mit Hilfe des Konzeptes der direkten Ableitung innerhalb eines modifizierten Lin denmayersystems den ersten Schritt zur Explikation des Konzeptes der musikalischen Veränderung - genauer der melodischen Veränderung - und der melodischen Invariante zu tun, so will Christoph Lischka eine Expli kation der frühen Riemannschen Musiktheorie geben� Hierfür benutzt Christoph Lischka (1984a, 1984b) die Idee der Graph grammatik und stellt die These auf, daß die Riemannsche Musiktheorie sich in Form einer Graphgrammatik, speziell einer Gewebegrammatik2 (web grammar), wiedergeben lasse. Ähnlich wie bei den "normalen" Grammatiken gibt es auch hier die von diesen Grammatiken erzeugten Sprachen und die .sie akzeptierenden Automaten. Christoph Lischka (1984a, 90) formuliert seine These einschränkend: vorbehaltlich der Lösung des Erkennungsproblems auch für die hier angegebene, um Details erweiterte Grammatik zeigt sich damit die Theorie des musikali schen Hörens von Hu.go Riemann als eine Theorie der Gewebe-Automaten.
Es lassen sich gegenüber der Arbeit von Bogdan Cazimir (1975, 1976) nicht nur formale Veränderungen - die Benutzung einer Gewebegramma tik statt eines Lindenmayersystems - , sondern auch des Erklärungsan spruchs feststellen: Die Explikation dieser Musiktheorie bildet das metho delogische Ziel, welches von Christoph Lischka (1984a, 87) angestrebt wird, denn es soll erreicht werden durch logische Analyse und Rekon struktion eine Form musikwissenschaftlicher Theoriebildung zu explizie ren und damit der Fachwissenschaft einen (alternativen) Ansatzpunkt für ihre komplexe wissenschaftstheoretische Diskussion zugä'nglich zu machen.
Dieser Standpunkt, der ähnlich wie die Arbeiten von Pylkkö und Cazi1)Eine ausführliche Untersuchung der verschiedenen Stadien in der Entwicklung der theoretischen Grundpositionen gibt Seidel 1966. Er (Seidel 1966, 40) unterscheidet zwei grundlegende Anliegen Riemanns, die seine Forschungen leiteten: zum einen die Ent wicklung einer spekulativen Musiktheorie, welche die Denkvorgänge beim Hören wissenschaftlich erforscht, und zum anderen die pädagogische, die praktische Unterwei sung im Tonsatz. Für die vorliegende Problematik ist nur der wissenschaftliche Aspekt re levant. Elmar Seidel unterscheidet diesbezüglich drei Phasen des Riemannschen Denkens: 1. Die Periode von 1872-1877, die gekennzeichnet ist durch eine akustisch und hörphy siologische Begründung der Musiktheorie und der Beschäftigung mit der "Lehre von den Tonempfindungen" Herrmann von Helmholtz' (Seidel 1966, 54). 2. Die Periode von 1877-1909, die geprägt ist durch eine Hinwendung zur Psychologie und einhergeht mit der Beschäftigung mit Carl Stumpfs "Tonpsychologie" (Seidel 1966, 54). 3. Die 3. Periode von 1909-1919, in der Riemann Musikhören als eine logische Aktivi tät betrachtet (Seidel 1966, 59). 2) Die Gewebegrammatiken wurden von Pfalz & Rosenberg 1969 zur Mustererkennung eingeführt und in der Kognitiven Psychologie bei der Modeliierung des Gedächtnisses von Anderson & Bower 1973 eingesetzt.
201 mir in den Bereich der Metasprache der musiktheoretischen Forschung fällt, wird folgerichtig von Christoph Lischka (1984a, 89) als "Metalogik der Musik" bezeichnet. Christoph Lischka nimmt hiermit bezug auf Rie manns Forschungsvorhaben einer Logik der Musik, das neuerdings von der Musikpsychologin Helga de Ia Motte-Haber (1982, 210 ff.) in die Nähe der Forschung der Kognitiven Psychologie (Neisser 196 7) und der Heimholtz scben Theorie der Wahrnehmung als "unbewußtes Schließen" gestellt wird� Über die von Chistoph Lischka angestrebte Explikation der frühen Rie mannschen Musiktheorie hinaus läßt sich auch eine Ausweitung des For schungsfeldes auf psychologische Phänomene feststellen, die allerdings schon implizit durch den Anspruch der Riemannschen Theoriebildung ge geben ist. Für Hugo Riemann (1921, 4 70) ist das Ziel wissenschaftlicher Forschung im Bereich sogenannter künstlerischer Erscheinungen wie folgt bestimmt: Fragt man sich, worin die Hauptaufgabe einer Theorie der Kunst bestehe, so kann die Antwort nur lauten, daß dieselbe die natür lichen Gesetzmäßigkeiten, welche das Kunstschaffen bewußt oder unbe wußt regeln , zu ergründen und in einem System logisch zusammenhän gender Lehrsiitze der Musik darzulegen habe. Werden diese "natürlichen Gesetzmäßigkeiten" als exakt beschreibbare natürliche menschliche Funktionen interpretiert, sei es in psychologischer oder physiologischer Hinsicht, so erhalten wir eine Konkretisierung dieses Konzeptes im Rahmen der Automatentheorie, wenn die These von Artbur W. Burks (1972-73, 39) zugrunde gelegt wird, daß a finite deterministic automaton can perform all natural human functions. Ohne diese sehr starke These an dieser Stelle weiter zu diskutieren, sei darauf hingewiesen, daß hier die Explikation der natural human functions in dem Bereich der Berechenbarkeitstheorie ihre Explikate finden soll. Es müssen in der Riemannschen Aussage allerdings zwei Aspekte un terschieden werden: Einerseits die Darstellung der Erkenntnisse über Musik in einem Aussagensystem, dessen Logizität gegeben ist. Es wäre hier z. B. an die Prädikatenlogik 1. Stufe mit Identität zu denken, ähnlich wie sie von Rudolf Wille2 als Basis einer Standardsprache der Musik betrachtet wird. Daß die Prädikatenlogik 1 . Stufe mit Identität nicht das einzig mögliche System zur Formalisierung der Logizität musikalischer Systeme darstellt, ergibt sich schon aus der Vielzahl der bekannten untersuchten logischen Systeme. So wollte z. B. Jaap Kunst (1976) be1) Auch wenn es sich um eine sehr vereinfachte Sichtweise des Riemannschen Denkens handelt, die eine Phase seines Denkens hervorhebt, so ließe sich m. E. zeigen, daß eini ge wissenschaftlich-philosophische
Grundideen sein Denken beherrschen, wie
sich
aufgrund seiner einleitenden Bemerkungen zu den "Ideen einer Lehre von den Tonvor stellungen" vermuten läßt. Zum Konzept des "unbewußten Schließens " als Erläuterung des Wahrnehmungsvorganges vgl. Helmholtz 1867/1896; 1878. 2) Zur von Rudolf Wille vorgeschlagenen Standardsprache der Musiktheorie vgl. Wille 1980, 1985; Neumaier 1989 sowie Schneider & Seifert 1986, 32 ff.
202
kanntlich die Logizität des Verständnisses musikalischer Sachverhalte in einem modallogischen System näher fassen. Andererseits ist die Erklärung der zugrunde liegenden psychologischen und physiologischen Prozesse des "Kunstschaffens", auf die sich Riemann in seiner Formulierung "natürliche Gesetzmäßigkeit" bezieht, so zu inter pretieren, daß es sich um beschreibbare, in Raum und Zeit stattfindende Prozesse - sowohl physikalischer als auch psychologischer Art - handelt, die von "übernatürlichen Gesetzmäßigkeiten" abzugrenzen wären, welche häufig zu intersubjektiv schwer überprüfbaren metaphysischen Spekulatio nen führen, die von Konzepten wie Intuition, dem "Nichtsagbaren der Kunst", etc. ausgehen und diese dennoch "eigentlich nichtsagbaren" Phä nomene in einer Begriffsdichtung aussprechen wollen. Als weitere Inter pretation bietet sich an, dem Adjektiv "natürlich" im Sinne von "durch die Natur bedingt" das "Adjektiv "widernatürlich" bzw. "unnatürlich" gegenüberzustellen. Dies hieße dann, die Frage nach der "Natur des Menschen" oder "Natur der Natur" zu stellen, die, je nach Standpunkt, auch zu "übernatürlichen Gesetzmäßigkeiten" führen könnte, so daß meine Interpretation der "natürlichen Gesetzmäßigkeiten" die Frage, was als Natur zu gelten habe umgeht und ebenfalls auf die Untersuchung der "natürlichen Gesetzmäßigkeilen des Kunstschaffen" verweist, welches per Definition des romantischen Kunstbegriffs und dem mit ihm zusammen hängenden Geniebegriff die "natürlichen" Gesetzmäßigkeilen der "künstle rischen", d. h. eigentlich "übernatürlichen" Arbeitsweise, ausklammert. Daß allerdings Riemarnn nicht nur in seiner frühen Phase eine "musikim manente Stringenz" der musikalischen Wahrnehmung annahm, die er zu erklären versuchte, zeigt sich an seinem späteren Werk, der "Lehre von den Tonvorstellungen" (Riemann 1916/1975; 1917), in dem er Musik aus der "Natur des menschlichen Geistes" begründen wollte. Auch bezog e r (Riemann 1916/1975, 1 5) sich mit seinen Untersuchungen nicht nur auf das "Musikschaffen': sondern auch auf den Apperzeptionsprozeß, indem die in seiner Theorie beschriebenen Elemente und deren Beziehungen die Produkte der angenommen unbewußten und bewußten Segmentierungslei stungen des Perzeptionssystems mittels einer musikalischen Logik erfassen sollen, wie aus der folgenden Textstelle ersichtlich wird: Daß das Musik hören ... , eine hochgradig entwickelte Betätigung der logischen Funktio nen des menschlichen Geistes ist zieht sich durch meine sämtlichen musiktheoretischen und musikiisthetischen Arbeiten seit meiner Disserta tion (Musikalische Logik, Leipzig, C. F. Kant, 1873). Ohne mir selbst vollständig begrifflich klarzumachen, was ich eigentlich suchte habe ich ... ganz allmählich eine Art musikalischer Grammatik entwickelt, welche ä'hnlich wie eine sprachliche Grammatik in den Begriffen "Subjekt", "Prädikat" usw. in den harmonischen Begriffen Tonika, Dominante, Subdominante ... usw. die Elemente handhaben lehrt, über welche die musikalische Logik verfügt, um musikalische Sä'tze zu bilden.
203 Daß es sich hierbei um keine obsolete oder fragwürdige Anschauung handelt, möge die Stellungnahme eines bedeutenden Musikwissenschaftlers belegen (Floros 1986, 212): Die Musik besitzt - wie bereits Franz Liszt treffend bemerkte - eine ihr eigene Grammatik, Logik, Syntax und Rhetorik sowie ein Vokabular, das ständiger Wandlung unterworfen ist. Das ist der Bereich, der Vergleiche mit der Sprache ermöglicht. Be zeichnenderweise orientierte sich die mittelalterliche Theorie der Musik zu einem wesentlichen Teil an der Grammatik. Die Terminologie der neueren musikalischen Formenlehre ist weitgehend der Syntax entlehnt; so sprechen wir von Seitzen und Halbsiitzen, von Phrasen und Perioden. Und gleichfalls sprechen wir von musikalischer Logik. Darunter verste hen wir die Kunst, musikalische Gedanken folgerichtig zu entwickeln ... Es ist jedoch im allgemeinen eine gewisse Hilflosigkeit festzustellen, wenn über die bloße Analogie zur Sprache und Logik hinaus eine Expli kation "des musikalisch folgerichtigen Schließens" gefordert wird. In vie len Fällen wird im Zweifelsfall immer auf die musikalische Intuition verwiesen. Auch Riemann blieb eine Begründung schuldig, so daß es legitim erscheint, das Explikat für den Riemannschen Rekurs auf die natürlichen "logischen Funktionen des menschlichen Geistes" in den Rah men der Automatentheorie zu stellen und somit in den Bereich der For schungen der Kognitionswissenschaft bzw. der Kognitiven Musikwissenschaft. Christoph Lischka (1984a, 89) strebt eine Explikation der frühen Rie mannschen Musiktheorie im begrifflichen Rahmen moderner Semiotik und Sprachwissenschaft an, wobei er allerdings eine Darstellung im Rahmen eindimensionaler linguistischer Verfahren fl.ir ungeeignet hält und anführt, daß zwar durch die zeitliche Sukzession von Klangereignissen eine Ver kettungsrelation wie die der Konkatenation gegeben sei, aber darüber hinaus andere Relationen, wie Tonhöhen- und Tondauerbeziehungen, auch von Bedeutung seien, so daß formal die Situation eher mit der Verknü pfung von Linienelementen in der Ebene, wie sie bei der Bildbeschreibung im Rahmen von Mustererkennungsproblemen benutzt wird, vergleichbar ist, wo z. B. bei der Verknüpfung der einzelnen Elemente der Winkel von Bedeutung ist. Als Explikat der frühen Riemannschen Theorie soll daher eine Gewebe-Grammatik ( web-grammar) dienen, wie sie im Be reich der syntaktischen Mustererkennung 1 eingesetzt wird. Ein Gewebe (web) ist ein gerichteter Graph (Digraph), dessen Kanten (edges) und Knoten (nodes) markiert sind. Eine Gewebe-Grammtik GW ist ein Quadrupel GW = (V, VT, I, R) mit V als Gewebe-Alphabet, wo bei eine Menge VN nichtterminaler Zeichen von einer Menge VT von terminalen Zeichen unterschieden werden kann. Das Gewebe-Alphabet V besteht aus der Menge der nichtterminalen und der Menge der terminalen Zeichen, also V VN u VT mit VN () VT = �. d. h. die Mengen haben =
1) Eine ausführliche Beschreibung der Graphgrammatiken und ihrer Anwendung inner halb der syntaktischen Mustererkennung gibt Fu 1974.
204 kein gemeinsames Element. Das terminale Alphabet ist echte Teilmenge des Gewebe-Alphabets VT c V. I ist das Anfangsgewebe ("Axiom", "Startsymbol"), R ist eine Menge von Ersetzungsregeln cx � ß , E (cx, ß sind Gewebe und E ist die näher zu spezifizierende Einbettungsbedingung). Eine von G erzeugt·e Sprache L(G) ist die Menge der Gewebe, die 1 ) nur terminale Zeichen als Markierungen aufweisen und 2) nur mittels der Regeln der Menge R aus dem Startgewebe I ableitbar sind. Die von Christoph Lischka1 (1984a, 89 ff.) angegebene Grammatik be schreibt wesentliche Aspekte der "Durkadenzen" im Sinne der Riemann schen Theorie. Sie besteht aus V = VN v VT und I mit VN
=
VT =
cx
(antithetisch),
o
(synthetisch),
t
(thetisch),
L
(Kadenz)}
� (erst/dann), T, S, 0, Tp, Sp, Dp,+(Dur-Primklang), o (Moli-Primklang)}
Fünfzehn Ersetzungsregeln in R = {r1 , r15} mit der Einbettungsbe dingung E, daß alle Kanten zu L in cx zu Kanten zu L1 (dem ersten L von links nach rechts gelesen) in ß werden; alle Kanten � L in cx werden zu Kanten YQ!!. E1 in ß; die Ausnahme bildet der Fall, in dem die Kante � L mit der Markierung (dem Label) " � " in cx beschriftet ist; sie startet vom letzten L in ß . Oie Ersetzungsregeln: •.. ,
�
Rl E �
E
R3 E �
E �
E
�
E
R2
�
E
R4 E �
~ �
+
�
E
1) Ich gebe die Regeln im Gegensatz zu Christoph Lischka nicht in zusammengefaßter Form an.
205
R12
R13
�� � }:;
RlS
��
}:;
o
� ��
Zum besseren Verständnis seien beispielhaft zwei Ableitungen angegeben: das Startgewebe
(1 ) I =
0 T
nach Anwendung von RIO
0 T
Ein Stück wird sozusagen nur durch die Tonika bestimmt. Eine weitere Ableitung zeigt eine andere Form der Kadenz: (2)
�
R4
�
RlO
.�
T
Christoph Lischka hatte davon gesprochen, daß für musikalische Berei che nicht nur die Verkettungsrelation von Bedeutung ist, sondern auch die rhythmischen und Tonhöhenbeziehungen eine Rolle spielen, um für den Einsatz von Gewebe-Grammatiken zu argumentieren. Es ist allerdings nicht zu sehen, inwieweit bei der Charakterisierung der Funktionsharmo-
206 nik diese Beziehungen notwendig sind, denn eine Folge von Funktionszei chen wie z. B. +T + s +D 0Tp läßt sie jedenfalls nicht erkennen. Da mir nur eine kurze Darstellung des von Christoph Lischka entwickelten Sy stems zugänglich war, ist es jedoch möglich, daß diese Beziehungen auf einer anderen Ebene des Systems von Bedeutung waren. Ob es eine Im plementierung dieses Grammatik-Systems gab und inwieweit es in erwei terter Form zur musikalischen Analyse eingesetzt wurde, ist mir leider nicht bekannt. Es läßt sich allerdings erkennen, daß die von Christoph Lischka entwickelte Grammatik wesentlich mehr Aspekte der Funktions theorie erfaßt, als die von Pauli Pylkkö (1988) angegebene, in der z. B. keine Unterscheidung der Durfunktionen und ihrer parallelen Mollfunktio nen durchgeführt wurde. Von der Komplexität des Riemannschen Systems wurde, wie Christoph Lischka selbst anmerkt, ein kleiner Teilbereich erfaßt. Er bezeichnet seine für diesen Teilbereich der einfachen Durka denzen erstellte Grammatik als 'korrekt', d. h. den in den Riemannschen Schriften dargelegten Intuitionen angemessen, aber nicht als vollständig. Der von Christoph Lischka (1984a, 1984b) vorgenommene Ansatz wäre dem Physical-Symbol-System-Paradigma1 zuzuordnen, allerdings favorisiert Christoph Lischka (1987a, 1990, 199la, 199lb) seit einigen Jahren den konnektionistischen Ansatz2 innerhalb der cognitive musicolo� Einen weiteren Beitrag zur Kognitiven Musikwissenschaft innerhalb des 4 Physical-Symbol-System-Paradigmas leistet Mark Steedman. Er be schäftigt sich schon seit den 70er Jahren mit der Modeliierung musikali scher Wahrnehmung. In seinem 1984 in der Zeitschrift "Music Perception" erschienenen Artikel A Generative Grammar for Jazz Chord Sequences entwickelt Mark Steedman eine Grammatik zur Beschreibung der harmo nischen Strukturen bestimmter 12-taktiger Bluesschemata. Eine Analyse dieser Arbeit bildet den Gegenstand des nächsten Abschnittes.
1) Zum Begriff des Physical-Symbol-Systems und dessen Relevanz wissenschaftliche Forschung vgl. S. 162 ff.
für
die kognitions
2) Die Relevanz des konnektionistischen Forschungsansatzes innerhalb der Kognitions wissenschaft wird derzeit heftig diskutiert (e. g. Graubard 1988). Auch in der musiktheo retisch orientierten Forschung sind die Diskussionen noch nicht abgeschlossen. Hierzu vgl. Camurri 1990, Lischka 1990, 199!a, 199lb, leman 1989c, 1990a und Todd & loy 1991, um nur einige neuere Beiträge aus dem Bereich der Kognitiven Musikwissenschaft zu nennen. 3) zur Kognitiven Musikwissenschaft s. laske 1977, 1986, 1987, 1988. 4) vgl. longuet-Higgins & Steedman 1971; Steedman 1973, 1977, 1984.
207 3. 1. 4 .
Grammatik und Jazz
Die Arbeiten von Mark Steedman sind dem Kreis der Edinburgher For scher um Christopher Longuet-Higgins zuzurechnen. Mark Steedman {1984) betrachtet seine Arbeit als Ergänzung der früheren Arbeiten von Longuet-Higgins� die mit der Modellierung der menschlichen Musik wahrnehmung beschäftigt waren. Es wurde von unbegleiteten Melodien ausgegangen, aus denen Metrum und Tonart erschlossen werden sollten. Bei dem Modell der Tonartbestimmung legten Fehler in der Bestimmung der Tonart einiger Stücke den Schluß nahe, daß eine Untersuchung der den Melodietönen unterliegenden Akkordstrukturen und -folgen notwendig sei {Steedman 1984, 75). Mark Steedman {1984) geht bei seiner Untersu chung von dem Werk Cokers {1985) aus und untersucht 12-taktige Blu es-Schemata. Coker (1985) systematisierte die wichtigsten in der Jazz Praxis vorkommenden Folgen von Akkordkombinationen. Ziel der Arbeit Mark Steedmans ist es, ein Regelsystem anzugeben, das einige dieser Folgen charakterisiert. Mark Steedman (1984, 55) schreibt hierzu: Defining the full set of legal 12-bar chord sequences is ...
not a trivial problem.
The present study will
attempt
to provide a
small set of rules that characterizes this musical "sublangage".
lt will
then be argued that the rules that are advanced to account for the restric ted domain are in fact quite generat and are part of a [arger set of rules which characterize a much more comprehensive set of chord sequences that are similarly musically coherent within the tradition of wesfern tonal music. The rules will be presented in the form of a "generative grammar", ...
Im Kern kann sein Anliegen als dem von Christoph Lischka und Pauli Pylkkö ähnlich verstanden werden: als Formalisierung des Kadenzkonzep tes. In der Arbeit von Mark Steedman wird das Konzept der authenti schen Kadenz in leicht modifizierter Form formalisiert. Er benutzt diesen Begriff nicht ganz im Sinn der klassischen Harmonielehre, der z. B . bei Grabner (1974, 41) mit T-S-D-T angegeben wird, wenn er (1984,74) von authentic V-1 oder auch der plagal cadence spricht. Er meint hiermit die aus der klassischen Lehre bekannten authentischen bzw. plagalen Schluß wendungen (vgl. Burbat 1988, 25; Grabner 1974, 40 ). Dieser terminologi sche Gebrauch soll hier nicht weiter diskutiert werden, da dies die Erör terung der Unterschiede und Gemeinsamkeiten von Jazz-Harmonielehre und klassischer Harmonielehre erforderte, angefangen bei dem dreistim migen und vierstimmigen Akkordaufbau, Funktionsbegriff, etc., die in die sem Zusammenhang nicht notwendig ist. Es sei nur kurz darauf hingewie sen, daß z. B. Jungbluth (1981, 41 ), ausgehend von der Akkordskalentheo rie, in diesem Zusammenhang die Wendung V-I ebenfa.lls als Kadenz be zeichnet, und Burbat (1988, 27) spricht mit Bezug auf die Form II-V-1 1) Longuet-Higgins 1976; zusammengefaßt in Longuet·Higgins 1987; Longuet-Higgins & Stedman 1971 sowie Steedman 1973, 1977. Man vgl. auch Johnson·Laird 1991.
208 von der "Jazz-Kadenz". Das Ziel seiner Arbeit genauer bestimmend, schreibt Mark Steedman (1984-, 60 Anm. 8), daß sie can be seen as an attempt to formalize the various ways in which an authentic cadence can be expressed.
In diesem Zusammenhang weist er auf zwei Bedingungen hin, die solch eine Grammatik erfüllen muß. Einerseits muß sie vollständig nur die grammatischen Akkordfolgen beschreiben, andererseits muß den Zeichen ketten durch Interpretation eine "Semantik" zugeordnet werden. Die "Se mantik" sind in diesem Fall die gespielten Akkorde bzw. Akkordfolgen. Ausgegangen wird von einer Beschreibung der Akkorde durch römische Zahlen, die in Bezug auf eine Durtonart interpretiert werden . Es gibt ein Grundalphabet von Sleben Zeichen I, II, III, IV, V, VI, VII, das den Grundakkorden entspricht (Steedman 1984, 61), die auf den Tönen der entsprechenden Durtonleiter aufgebaut werden. Allerdings werden diese anders als in der musiktheoretisch üblichen Form durchweg als Durakkor de interpretiert. So bezeichnet "I" die Tonika, "IV" die Subdominate und "V" die Dominante der entsprechenden Durtonart. Mark Steedman benutzt die Zeichen in folgender Bedeutung: Die Zeichen "I;' "IV;' "V" sind Durakkorde z. B . bezogen auf die Tonart C-Dur: I = C = c-e-g, IV = F = f-a-c, V G = g-h-d IV
* c
V
II
6
F
G
II
Die Grundidee dieser Interpretation besteht darin, daß die einzelnen Be zeichnungen "I", "II", etc. durch die aus der Gitarristik bekannten Akkordsym bole ersetzt werden können. So kann man sich bei einer Interpretation, bezo gen auf die Tonart C-Dur, "I" durch "C", "II" durch "D" etc. ersetzt den ken. Arabische Großbuchstaben bezeichnen in diesem Fall die entsprechenden Dur-Akkorde. Mollakkorde werden durch ein angehängtes "m", also "Ern" fUr e-Moll angegeben (weitere Angaben - auch über unterschiedliche Symbole sind z. B. Burbat 1988, 172-174 sowie Jungbluth 1981 zu entnehmen). Im fol genden gebe ich eine Aufstellung der von Mark Steedman benutzten Symbolik: Zeichen: "x7'', "xT•·• Dominantseptakkord, Septakkord; Mark Steedman (1984, 58) unter scheidet die "dominantische" kleine Septe von der kleinen Septe, die in der gleichschwebend temperierten Stimmung physikalisch identisch sind, sich aber in der reinen Stimmung unterscheiden? Er gibt diesen Unterschied durch I) Obwohl Steedman begrifflich zwischen reiner und temperierter Stimmung unter scheidet, so hat diese allerdings keinen wesentlichen Einfluß auf die Entwicklung sei ner Grammatik, so daß die Stimmungsproblematik des weiteren vernachlässigt werden kann. Zu Problemen der Stimmung und Tonsysteme vgl. auch Schneider 1986.
209 ein der 7 angehängtes Hochkomma an, also x7'. 17, ... , IV7, V7, F7, G7, ehe bezogen auf die Tonart C-Dur C7, D7, I7
lf tt C7
entsprä-
Y7
IV7
"II
I
II
G7
F7
Das Zeichen: "x(m)" Wird als Mollakkord verstanden. Die Klammern " (" ")" geben den wahlweisen Gebrauch als x oder xm an. Im allgemeinen bezeichnen die Klammern eine alternative Interpretation. Das Zeichen "xm" wird in be zug auf die Tonart C-Dur als entsprechender Mollakkord interpretiert: ,
,,
Im
"* Cm
IVm
"II
Ym
�u
Gm
Fm
II
Die Zeichen: "11", "b" Diese Zeichen werden vor das entsprechende Grundzeichen geschrieben und alterieren den betreffenden Akkord der Tonleiter um einen Halbton schritt nach oben bzw. nach unten: blll = Es-Dur; blllm = es-Moll; 11IV= Fis-Dur bezogen auf C-Dur:
,,
blii
biiim
tu
h
Es
II
iMI
Esm
Das Zeichen: "xM7" Dies ist der Akkord mit großer Septe z. B. IM7
lf
IM 7
1
CM7
IV
IVM7
II
FM7
II
Fis =
CM7
YM7
jfl
c-e-g-h:
II
GM7
Die Zeichen: "+5", "6", " 7", "0 7'' Diese Zeichen werden hinter das entsprechende Grundzeichen geschrie ben. Das Zeichen "+ S" gibt den Akkord mit der augmentierten Quinte des betreffenden Grundakkordes: I+S = C+S c-e-gis; "6" gibt die Hinzufü gung der großen Sexte zu dem Grundakkord an: 16 = C6 = c-e-g-a; " 7 " den Akkord mit kleiner Terz, tiefalterierter Quinte, und "dominant"=
210
kleiner Septe I
Ii
16
IC D 7
1°7
jf'
lf
l>q
I+S
�
C
C6
C+S
C0 7
II
Die von Mark Steedman erarbeitete Grammatik soll mindestens folgen de der neun bei Coker angegebenen Akkordfolgen beschreiben, wie sie auf der folgenden Seite zu sehen sind. Die Grammatik besteht aus folgenden 21 Regeln: 1
Rl: R2: R3: R4: RS: R6: R7: R8: R9: RIO: R11: R13: R1S: R17: R19: R21:
�
Sl2(m) w w Dx 7 X
1(m)
x(m)(7) x(m)(7) x7 xm7 x(m)(7) X
X
x(m) D x x(m) x(m) St x m7 x(m) x(m) 1xm7 � xM7, X � x9, X x7 � xb9, x7 � 7+5, xm � xm6, xm7 � x
�
17
�
� � � �
� �
�
R12: R14: R16: R18: R20:
X
1V(m) V 7 l(m) I(m) x(m) x(m)(7) x(m)(7) Sd x x7 Dx (m)7 D x7 xm7 bSt x<m)(7) xm7 X M xm Stx m ux07 x(m) Dx ux 0 7 x(m) St x m x(m) ux Cl! Lx m7 � xT �
x13 x7 � xblO xm � xm7' xm7 � xm9 X
Die Bedeutung dieses Regelsystems soll nun näher beschrieben werden: Ausgangspunkt bildet die hierarchische Strukturierung des 12-taktigen Bluesschemas im 4/4 Takt. Es wird eine einfache metrische hierarchi sche Struktur angenommen, so daß auf der nächsten Ebene jeweils vier Takte eine Einheit bilden, die weiter aufgespalten wird in jeweils zwei Takte, welche die nächste Ebene bilden, von denen jeder einzelne Takt wiederum eine Einheit einer Ebene bildet. Die nächste Ebene bildet die Zeiteinheit der halben Note und die letzte die der Viertelnoten. Die har monische Interpretation erfolgt im wesentlichen auf der Taktebene, der Ebene der halben Notenwerte und der Ebene der Viertelnoten. t) nach Steedman 1984, 68 u. 69.
211 Verschiedene Akkordfolgen für den Blues !:! ,... -
!:: -
,... _
,... _
!:: -
!::
!:: -
!:::
-
!:: _
!:: _
!:: -
!:: -
-
....
>-
>
::
�
...
..
>....
>
>
....
E -
.... -
=
!:: >
!::
-
-
,...
> -
.... E
=
> ...
-
-
E
!::
E = -
�-
.:a -
'E -
.... .... -
,... _
= -
....
�=
"'
>
,.. ;. ..
.... :::
.... :::
....
i
,_
>
>
!::
!::
;- _
� -
N
>
2:
.§ -
2:
....
....
.... -
....
� -
�>
E
,..
-
�-
E
- ....
::E
� -
>
....
E
.?! -
....
::: .... -
:::
....
::E
�
.::! ....
....
E -
>
E
!:: s
>
!::
�
� it
>
-
!:.
!::
B
!:::
3
!:: -
:s
!::
>-
�=
�,.. =
-
! -
'0
E
-
:::
�
>
....
Abb. aus Coker 1985, Anhang
.:; -
.... ;.
,;o -
!::
>
'0
.§
.§
...�
,.......
�
:!
>
.§
>
c
-
.... -
s
'0
"'
§
-
!$ -
....
�
�
�-
,.. ::: -
!::
�
...
"'
:::
!:: >
!::
�-
.§ -
.§
E
:::
....
!::
....� -
"'
....
>
2:
-
-
-
'0
....
....
E
-
> -
.... �
e-
!:: =
.... :! >
." _
- -
!::
....
!-
." _
,., _ E
..,
.:a -
!:: >,... E -
....
!-
�....
.... E -
!:: �
." -
....
>
ä ,..
-
,_
E -
... E = -
,..
!::
-
!:: -
....
!:: -
'E -
-
...
....
:::
re >-
E
,_
.:; _
:::. ::: _ ....
....
E
!::
e > -
:::
....
,.,
....
E >
!::
-
..... _
-
�
�
212 Das folgende Baumdiagramm gibt diese metrisch-hierarchische Struktur wieder: 12
Ich beginne mit der Erläuterung einer einfachen modifizierten 1. Regel, bei der die Grundstruktur klar zu erkennen ist: Rl' S12 -+ I 17 IV I V7 Diese Regel besagt, daß ein zwölftaktiger Blues aus jeweils sechs zwei taktigen Einheiten besteht. Nimmt man C-Our als grundlegende Tonart an, so erhalten wir die Akkordfolge C, C7, F, C, G7, C bei der jeder Akkord zwei Takte lang erklingt. Prinzipiell gilt, daß die zeitliche Dauer des durch die Zeichen des Antezedens der Regel bezeichneten Ereignisses durch eine Folge von Zeichen ersetzt wird und die durch sie bezeichneten Ereignisse insgesamt den gleichen Zeitraum einnehmen wie das durch das Antezedens gekennzeichnete Ereignis. "S12" kann als Startsymbol ver standen werden. Die Regeln 2 und 3 des Systems, die vorerst die verein fachte Form (2) x(7) -+ x x(7) bzw. (3) x(7) -+ x(7) Sdx haben sollen, werden folgendermaßen interpretiert: Die geklammerte 7 auf der linken Seite besagt, daß die Regel auf einfache Akkorde oder Durseptakkorde mit dominanter kleiner Septe angewandt wird. Die geklammerte 7 auf der rechten Seite besagt, daß, wenn die Regel auf einen "dominanten" Dur septakkord angewandt wurde, auch an der Stelle "x(7)" ein solcher stehen muß. Die Regel R2 paraphrasiert Mark Steedman (1984, 62) mit den Worten: . . a chord can be replaced by two copies of itself, each Lasting half as long. Jf the original chord was a dominant seventh chord, then the rightmost of its offspring is too. Es ist also möglich, z. B. ein C der Dauer von zwei Takten durch zwei C von eintaktiger Dauer zu ersetzen, ebenso C 7 durch C C7. Die .
213 Anwendung der Regel kann auf den verschiedenen Ebenen bis einschließ lich der Ebene der halben Notenwerte erfolgen. Ausgeschlossen wird die Ersetzung eines Durakkordes, z. B. C, durch C7 allein. Das "Sdx " in der 3. Regel steht für die Subdominante in bezug auf die Tonart des Akkordes x . Ihr Grundton liegt also eine Quarte höher als der Grundton des Akkordes x, d. h. ist x = I z. B., so ist Sdx = IV; ist x dagegen IV, dann ist Sdx bVII. Bezogen auf die Tonart C-Dur ist das Verhältnis im ersten Fall C - F, im zweiten F - B. Mark Steedman (1984, 62) expliziert die dritte Regel folgendermaßen: a chord can be replaced by a copy of =
...
itself, followed by its subdominant each Iasting half as long. If the original chord was a dominant seventh chord, then the leftmost of its offspring is too.
Eine Anwendung der Regeln zeigt das folgende Diagramm� s 12 I
� IV
I
A
A
AA Ä A
Da bisher nur Durakkordfolgen beschrieben wurden, es jedoch sinnvoll scheint, auch Mollakkordfolgen zu beschreiben, können die Regeln leicht verändert werden und lassen eine solche Beschreibung zu. Wir erhalten die von Mark Steedman angegebene erste Regel: Rl: S12(m) � I(m) I7 IV(m) I(m) V7 I(m) Eine Anwendung ergibt die Mollakkordfolge: Cm C7 Fm Cm G7 Cm. Entsprechend lassen sich die Regeln 2 und 3 erweitern: R2: x(m)(7) �x(m) x(m)(7)
R3: x(m)(7) � x(m)(7)
Sd x
Die Interpretation ist ähnlich wie angegeben, nur können die Regeln auch auf Mollakkorde angewendet werden. Die beiden weiteren Regeln 4 und 5 gelten als "Substitutionsregeln", welche die authentische Kadenz rekursiv erweitern. Das Zeichen "w" bezeichnet einen vorhergehenden Akkord. R4: w x7 � Dx (m)7 x7
RS: w xm7 � Dx7 xm7
1) Die arabischen Ziffern geben die angewandte Regel an.
214 so Mark Steedman (1984, 67) -, daß a chord w Die Regel 4 besagt followed by a major dominant seventh chord on x may be replaced by a dominant seventh on the dominant of x which may optionally be minor. -
Diese Regel unterliegt einigen Einschränkungen, so darf z. B. w nicht gleich Dx (7) sein, da sonst "unendlich viele rekursive" Anwendungen möglich wären und keine Extension der authentischen Kadenz erfolgte. Es kann z. B. aus Folge G, G7 die Folge D7 bzw. Dm7, G7 erhalten werden. Die Regel 5 meint, daß ein Akkord, der von seinem Mollseptakkord gefolgt wird, nur durch seinen Durdominantseptakkord ersetzt werden kann. Ein Beispiel fl.ir die Anwendung der "rekursiven" Anwendung der vierten Regel stellt das folgende Diagramm dar� s 12
\ \t'l l \
I
I
I I C
I
�
/ II
I
I
IV
I
I IU I I
I
f
/C
I
I
I
� I
�
I IJ
I
I
II 7
17
I I/
I
I
I711IU C7
II
F
I
IV
I I f
I
IV
11 IC
I
4
117
VI7 II7
I
I
\
U7
I
I
I
I UI7IIII7 IU7 I I I A7
II
D7
167 I c
I
\
I
I
I
I C
Die Regel 6 besagt, daß der Durdominantseptakkord gefolgt von seiner "Tonika" durch die um einen Halbtonschritt erniedrigte Doppeldominante ersetzt werden kann, während die 7. Regel angibt, daß von drei aufeinan derfolgenden identischen Akkorden der zweite durch seine Molldoppeldo minante und der dritte durch seine Mollmediante ersetzt wird. Die Regeln 8, 9 und 10 sorgen für die Einführung des verminderten Septakkordes. Eine Anwendung der Regeln 6 und 7 verdeutlicht das nächste Beispiel. Die Folge "l I l I l I 17 II IV I IV I Ill7 I Vl7 II l!l . "liefert nach Anwendung der 7. Regel auf die ersten drei Takte, und die der 6. Regel auf die Takte 8 und 9 die abgeänderte Folge "l I 11m I Illm I 17 II IV I IV I III7 I blii7 II l!l . . ", welche in C-Our interpretiert folgende Akkordfolge ergibt: "Q I Dm I Em I C7 II F I F I E7 I bE7 II 07 ... " Die restlichen Regeln - die Regeln II bis 21 - besagen, daß das im Antezedens stehende Zeichen wahlweise durch eines der auf der rechten .
.
.
1) Das Zeichen "/" grenzt einzelne Takte voneinander ab; "II" jeweils vier Takte und "," trennt Zeiteinheiten auf der Ebene der halben Notenwerte voneinander.
215 Seite stehenden Zeichen ersetzt werden kann. Die Anwendung der Erset zungsfreiheit muß allerdings eingeschränkt werden, so muß z. B., wenn ein I-Akkord ein IM7 ist, jeder andere I-Akkord ebenfalls IM7 sein. Es soll jetzt die Ableitung der von Coker angegebenen Akkordfolge (b) I ( M 7 ) I IV(T) I I(M7) I Vm7, I 7 I I I V ( 7 ' ) 1 u i V07 I I(M7) I V I 7 I I 1 I m 7 I V 7 I I(M7) I I ( M 7 ) gegeben werden, um die Anwendung der Regeln 1 , 2 , 3 , 4 , S und 8 zu illustrieren. 5 12
17
I I
1
Y'-.1 7
Y"'llJ
zu Cbl
Ableitung
�
u
I
I
I
I I I � tt\ �t,( \ \ IIJ
I
I
I
1
1Jn7
I
17
I
IIJ
IIIIJ 07
I
I
I
I
Ul7 11117 IJ7
I
I
I
I
I
I
IH7 I
IU7 '/IH711Jill7 , 1711 IIJ7' 1 IIIIJ07 / IH7 I IJI711IIM71U7 I IH7 I
CH7 1
f7'1 CH7161'17 , C7 11 f7' 111f07
IH7
I CH7 1 A7 11 DI'I7 1 67 1 CH7 I CH7
Die Ableitung kann folgendermaßen charakterisiert werden. Die erste Regel bestimmt die allgemeine Struktur des 12-taktigen Bluesschemas. Sie besteht zunächst aus 6 Einheiten mit jeweils 2 Takten. Es ergibt sich die Folge "I I7 IV I V7 I", die durch die Anwendung der Regeln 3 und 2 auf jedes Element der Folge zu der Folge "I IV I I7 IV IV I I V V7 I I" auf der Ebene der einzelnen Takte führt. Die weiteren markanten Regel anwendungen der Regeln 8 und S auf die Takte S, 6, 7 und 9, 10 wurden im Ableitungsbaum kenntlich gemacht. Ebenso wurde die Anwendung der Regel S auf die Takte 8 und 9, nachdem die Regel 5 angewandt wurde, indiziert. Eine Interpretation in bezug auf die Tonart C-Dur liefert die gewünschte terminale Kette in einer bestimmten Tonart. Die Ergebnisse der bisherigen Untersuchung sollen kurz zusammengeraßt werden: Mark Steedmans Grammatik kann im Vergleich zu denen von Pylkkö, Cazimir und Lischka in musikwissenschaftlicher Hinsicht, was die Kom pliziertheit der erfaßten Akkorde in den Akkordfolgen betrifft, als kom plexeste Grammatik gelten. Es ist jedoch festzustellen, daß der Grad der "Formalisierung" im Gegensatz zu den anderen Grammatiken als geringer anzusehen ist. So wird der Gebrauch der Regeln in ergänzenden natür lichsprachlichen Formulierungen eingeschränkt, so z. B. der Einsatz der
216 wichtigen Regeln 4 und S (Steedman 1984, 63 u. 71 ) : ... the restriction of w to non-dominant seventh chords and to chords whose root has not been changed by a previous application of a Substitution rufe, and the restriction of the x chord to chords that are dominant sevenths prohibits lots of ill-formed sequences that would otherwise arise. Interessant ist die Unterscheidung der beiden Septen in kleine Septe (7') und dominantische kleine Septe (7), die den Unterschied zwischen der dominantischen Funktion, die weiterleitet, und der kleinen Septe, die keine weiterleitende Funktion hat, manifestiert. Hier spiegelt sich die Ausein andersetzung Mark Steedmans (1973) mit der musikalischen Interpretati on von Melodien unter Berücksichtigung der reinen Stimmung wieder, die in Zusammenarbeit mit Christopher Longuet-Higgins1 erfolgte. War schon bei den Arbeiten von Pauli Pylkkö und Christoph Lischka, neben der Explikation musikalischer Konzepte, eine psychologische Inter pretation involviert, so bildet sie für Mark Steedman den Kern seiner Forschungen, wie schon dem Titel seiner Dissertation The Formal De scription of Musical Perception (Steedman 1973, 2 ff.), in der er ein Programm zur Erkennung der Tonart von Melodien entwickelte, zu ent nehmen ist. So schreibt Mark Steedman (1984) auch noch im Jahr 1984, daß generative rules are only really interesting when they can be used to drive a model of human performance on a task that involves understanding. Mark Steedman steht, da er zu seinen Modellbildungen ergänzend auch Implementierungen derselben vornimmt, um simulierend ihre Tragfähigkeit im Rahmen der Kl zu überprüfen, ebenfalls im methodologischen Rahmen der Kognitionswissenschaft? Da er seine Untersuchungen sowohl im Bereich der Melodik (Steedman 1973, 25; Longuet-Higgins & Steedman 1970), der Rhythmik (Steedman 1977) und der Akko-rdbeziehungen (Steedman 1984) durchflihrte, bleibt abzuwarten, inwieweit es ihm gelingen wird, erste Ansätze zu einer einheitlichen, formalen Theorie der Musikwahrnehmung zu entwickeln. Seine "Blues-Regeln" implementierte er nicht in einem Programm. Es ist jedoch zu vermuten, daß sie Vorstudien zu einem weiteren Projekt sein könnten, in dem solch eine Implementierung vorgenommen wird. Im Bereich der Computermusik mit kognitionswissenschaftlicher Aus richtung findet sich neben den Grammatiken ein weiteres formales In strument zur Deskription musikalischer Sachverhalte, das als Petri-Netz bezeichnet wird und die Arbeiten der Genueser Forschergruppe um Anto nio Camurri3 prägt, die nun diskutiert werden sollen. 1) Longuet-Higgins 1962, 1976, 1979; Longuet-Higgins & Steedman 1971; vgl. Seifert 1986. 2) vgl. hierzu Johnson-Laird 1981, 1983, 1991; Boden 1987; Longuet-Higgins 1987; Seifert 1990; vgl. auch den Teil ab Kap. 2. 2., S. 41 ff. 3) Dieser Forschungsansatz findet sich entwickelt in den Schriften von: Camurri 1984, 1990; Camurri et al. 1986, 1988, 1990; Degli Antoni & Haus 1985; Deg1i Antoni & Haus 1983; Bertoni et al. 1978. Er kulminierte in den Systemern HARP und SOUL; vgl. Camurri 1991a.
217 3. 1. 5. Petri-Netze als Beschreibungsmittel musikalischer Strukturen im Rahmen der Computermusik und Kognitiven Musikpsychologie Eine Beschreibungsform, die im Rahmen der Forschung zur Computer musik eingesetzt wird, sind die Petri-Netze. Sie dienen der Beschreibung musikalischer Strukturen und musikalischen Wissens. Im allgemeinen wer den Petri-Netze als Modellierungsmittel konkurrenter (nebenläufiger) Pro zesse eingesetzt� So wird u. a. von Stephen Pope (1986) Software für den Bereich der Computermusik entwickelt, die als wesentlichen Aspekt die Beschreibung musikalischer Strukturen durch Petri-Netze beinhaltet. Auch eine Forschergruppe des DIST (Qipartimento di lnformatica �isti matica e Ielematica) arbeitet an einem System, das als zentrales Be schreibungsmittel für musikalische Phänomene auf Petri-Netze zurückgreift? Darüber hinaus wurde eine Kassette mit von diesem System erzeugter Musik auf dem 1. Workshop on Artificial Intelligence and Music der GMD (Gesellschaft für Mathematik und Datenverarbeitung), der 1988 in St. Augustin stattfand, vorgestellt, die sehr beeindruckende Resultate enthielt. Im folgenden soll auf die von dieser Gruppe entwik kelten Ideen näher eingegangen werden, da die Petri-Netze über die Anwendung im Computermusikbereich hinaus auch in eine psychologische Interpretation eingebettet werden. Degli Antoni und Haus (1985, 141) gehen bei ihren einleitenden Überlegungen davon aus, daß durch einen Kompositionsprozess ein schriftlich fixierter musikalischer Text entsteht, der eine physikalische und eine semantisch-pragmatische Realisation erlangt. Die physikalische Realisation kann als die Aktivität eines Musi kers betrachtet werden, während die semantisch-pragmatische Interpreta tion die Aktivität des Hörers widerspiegelt, die zur Bildung eines kognitiven Modelles des gehörten Stückes führt, welches durch intensiviertes Hören dif ferenzierter werden kann. In ihrer Arbeit (Degli Antoni & Haus 1985) behan deln sie den semantischen Aspekt der Interpretation eines musikalischen Tex tes; der pragmatische, unter dem sie z. B. die Entstehung von Emotionen, Assoziationen etc. verstehen, wird, ebenso wie der physikalische Aspekt, aus geklammert. Zwei wesentliche Komponenten werden von Degli Antoni und Haus hervorgehoben, die zur Beschreibung auditiver Muster von grundlegen der Bedeutung sind: die musikalischen Objekte und der musikalische Prozess. Unter musikalischen Objekten werden - so Degli Antoni & Haus (1985, 142)- Unterabschnitte eines Musikstücks, aber auch harmonische Abläufe, melodische Einzelheiten, Instrumentationen oder andere identifizierbare Einzelereignisse verstanden. Hierbei wird über die Mittel zur Identifizierung der einzelnen musikalischen Objekte und deren Zahl keine Angabe gemacht, da die Definition der musikalischen Objekte vom Ziel der Untersuchung abhängt. 1) Marino, Morasso & Zaccaria 1986. 2) Camurri, Haus & Zaccaria 1986a, 1986b; Degli Antoni & Haus 1985; Haus & Rodriguez 1989; Haus & Sametti 1991; Camurri 1990.
218 Für die Beschreibung der musikalischen Prozesse nehmen sie eine physikalische Beschreibung an, der allerdings eine Struktur unterliegt. Bei der Darstellung der musikalischen Prozesse sind fünf Ebenen zu unter scheiden, wobei der Übergang von einem niedrigeren Niveau zu einem höheren als bottom-up Vorgehen bezeichnet wird, welches sie als charakte ristisch iUr die musikwissenschaftliche Analysetätigkeit ansehen. Der Über gang von höheren zu niederen Ebenen wird als top-down Vorgehen bezeich net und mit der Anwendung musiktheoretischen Wissens bei der Komposition verglichen. Es könnte auch einfach von Analyse und Synthese gesprochen werden. Als Ebenen werden unterschieden (Degli Antoni & Haus 1985, 142): -
die die die die die
strukturelle Ebene: Beschreibung musikalischer Formen symbolische Ebene: Beschreibung der Aufeinanderfolge von Noten operative Ebene: Beschreibung klanglicher Modelle AufiUhrungsebene: Beschreibung musikalischer Aufführungen klangliche Ebene: Beschreibung physikalischer Klangprozesse
Leider wurde die Bedeutung der unterschiedlichen Ebenen von Degli Antoni und Haus nicht ausiUhrlicher erläutert. Es ist jedoch anzunehmen, daß eine grobe Zweiteilung existiert. Der eine Block - die symbolische, und die operati ve, klangliche Ebene - wird näher durch das CMUSIC-Package beschrieben, während die strukturelle Ebene der Musik mit Petri-Netzen dargestellt wird, welche die Eingabe iUr das MAP (Musical Actors by Petri-Nets) System bilden. Antonio Camurri, Goffredo Haus und Renato Zaccaria (1986b, 337) schreiben hierzu: MAP makes possible the description of the structural Ievel of music ... as a multilevel environment within which musical objects may flow concurrently and interactively; the more detai led Ievels of representation (symbolic, physical, and operafing Ievels) are provided by the CMUSIC package, which is automatically invoked by the MAP description. The final outpul is at the level of sound sample files.
Ich beschränke mich auf die Darstellung der strukturellen Ebene. Diese Beschränkung stellt jedoch für das Verständnis der weiteren Zusammenhänge keine Einschränkung dar, denn die höchste Beschreibungsebene - die struk turelle Ebene, erfaßt durch Petri-Netze, die selbst wieder eine hierarchische Struktur aufweisen kann -, bildet die Kernidee in den Arbeiten von Degli Antoni, Antonio Camurri, Goffredo Haus und Renato Zaccaria. Ein Musikstück ist für Degli Antoni und Goffredo Haus (1985, 142) ein Netz von im Prinzip unterscheidbaren Einzelobjekten. Die leitenden Ideen für die Modeliierung musikalischer Phänomene aufgrund eines musikalischen Tex tes sind: die Annahme einer hierarchischen Struktur, die Parallelität musika lischer Prozesse und die Interaktion musikalischer Objekte. Für die Beschrei bung der höchsten Ebene und die Darstellung der gerade erwähnten Phänomene benutzt die Genueser Gruppe Petri-Netze. Die visuelle Darstellung eines Petri-Netzes erfolgt durch einen bipartiten Graphen, dessen Knoten Stellen
219 (place) und Balken Transitionen (transition) genannt werden. Die Stellen eines Petri-Netzes werden als musikalische Objekte oder Kontrollobjekte interpretiert. Mit den Transitionen wird die Idee des musikalischen Ope rators 1 oder der physikalischen Verarbeitung verbunden� Antonio Camurri, GofCredo Haus und Renato Zaccaria (1986b, 336) geben fünf musikalische Primitiva an, aus denen mittels vier Operatoren komplexere Strukuren aufgebaut werden. Die einzelnen musikalischen Primitiva sind?
a) die Sequenz, die den Fluß von aufeinanderfolgenden Objekten be schreibt:
b) die Alternative, in der nichtde terministische Wahlmöglichkeiten beschrieben werden:
c) die Konjunktion, welche die Verbindung von Objekten erfaßt:
d) die Fusion, die Vereinigung von Objekten zu einem Objekt:
e) die Spaltung, in der aus einem Objekt mehrere Objekte gemacht werden:
I) vgl. Bertoni, Haus, Mauri & Torelli 197&, 39-41. 2) Camurri, Haus & Zaccaria 1986b, 336. 3) Camurri, Haus Zaccaria 1986b, 336
u.
337.
220 Die Petri-Netze dienen der abstrakten Beschreibung eines musikalischen Textes auf einer bestimmten Ebene. Durch Morphismen können verschiedene Beschreibungsebenen der Petri-Netze in Beziehung gesetzt werden. Als Beispiel sei eine Beschreibung des Canon Perpetuus von J. S. Bach aus dem Musikalischen Opfer BWV 1079 gegeben.1 Leider gaben Degli Antoni und Haus nicht die Ausgabe an, die sie benutzten. Mir lagen zwei Ausgaben2 vor, die mit der von Degli Antoni und Goffredo Haus benutz ten Ausgabe nicht identisch zu sein scheinen. So sprechen Degli Antoni und Haus (1985, 145) von einem Basso Continuo Part, bestehend aus Cembalo und Violoncello, einer Fermate und einem Schlußakkord in Takt 15. In der mir vorliegenden Ausgabe von Landshoff ist zwar der Basso Continuo Part mit Violoncello und ausgesetztem Cembalo3 gegeben, es fehlen allerdings die Fermate und der Schlußakkord in Takt 15. In der Ausgabe von Czerny et al. (o. J.) ist die Fermate in Takt 1 5 anzutreffen, das Continuo ist jedoch nicht ausgesetzt. Ich beziehe mich im folgenden auf die Ausgabe von Czerny et al. (o. J.), da sie in größerer Nähe zu den Ausführungen von Degli Antoni & Haus (1982, 1985) steht. In Form einer bottom-up-Analyse, welche die Parameter Tonhöhe und Tondauer berücksichtigt, werden die musikalischen Objekte identifiziert. Grundidee ist hierbei die Aufteilung der Beschreibung auf die einzelnen Instrumente, welche die einzelnen Stimmen realisieren. Es werden Flöte F, Violone M und Basso Continuo mit Cembalo und Violoncello CB un terschieden. In der Flötenstimme werden sechs Einheiten4 betrachtet F1, F2, F3, F4, F5, und Fend - , die folgendermaßen zusammengesetzt sind: Takte 1 , 2 bilden F1; F2 - sind die Takte 3-10 sowie die drei folgenden Noten von Takt 1 1 ; F3 - enthält die letzte Note von Takt 1 1 bis zur Mitte von Takt 13; F4 - die Pausen von Takt 13, 14; F5 - ist Takt 1 5 mit Auftakt einschließlich bis zur Mitte des Taktes 1 8 Fend - besteht aus den letzten drei Tönen des Taktes 1 4 sowie der Fermate des 15 Taktes. In Takt 1 8 ab der Viertelpause bis einschließlich Takt 2 8 kann die Flö tenstimme als Umkehrung der musikalischen Objekte F1, F2 aufgefaßt 1} vgl. Degli Antoni & Haus 1983, Degli Antoni & Haus 1985, 145-147, Camurri, Haus & Zaccaria 1986a, 1986b, 338, Pope 1986, 169-171. 2) Es handelt sich um J. S. Bachs Musikalisches Opfer BW 1079 in der Ausgabe von Landshoff (o. J., 54 u. SS) und Czerny, Griepenkerl & Roitsch (o. J., 40). 3) zur Problematik der Aussetzung des Continuo muß auf das Beiheft zu Landshoff o. J, S. 31 ff. verwiesen werden, die bibliographischen Angaben zu Landshoff und Czerny et al. finden sich im Literaturverzeichnis unter Bach. 4) Degli Antoni & Haus 1985, 145. Die Partitur findet sich auf den Seiten 225 u. 226.
221 werden. Degli Antoni und Haus beschreiben diese Struktur durch die An wendung eines Umkehrungsoperators i. Es ergibt sich für Takt 18, 3. Viertel bis Takt 28 die Beschreibung i(F1 F2). Takt 29, 30 werden von Degli Antoni und Goffredo Haus (1985, 145) als durch Anwendung eines Operators rt auf F3 entstanden verstanden. Die Beschreibung der Flötenstimme nimmt dann folgende Form an: F1 F2 F3 F4 F5 i(Fl F2) rt(F3) F1 F2 F3 F4 Fend. Wie sich zeigt, wiederholt sich der Teil F1 F2 F3 F4. Die strukturelle Darstellung durch ein Petri-Netz sieht folgendermaßen aus:
Flöte
Die durch Start, Stop, A, B gekennzeichneten Stellen machen Kon trollpunkte kenntlich. Die Marken (schwarze Punkte) in der Startstelle und der Stelle A beeinflußen das Verhalten des Netzes. Die dynamische Beschreibung dieses Netzes sei an den entscheidenden Punkten kurz er läutert: Durch die Marke auf der Startstelle wird milt der Aktivierung des Netzes begonnen. Sie aktiviert die von der Startstelle mit einer ge richteten Kante (Pfeil) verbundene Transition (Balken), welche "feuert", und eine Marke wird auf Fl gesetzt. Dieser Vorgang wiederholt sich für die anderen Stellen und Transitionen. Die Marke "wandert" sozusagen von Stelle zu Stelle. An der Stelle F4 angekommen, wird zusammen mit der Marke von A der Übergang nach F5 erreicht, denn die Bedingung ftir das Feuern einer Transition ist, daß sich mindestens eine Marke auf jeder der dieser Transition vorgeschalteten Stelle befindet.
Wir haben also folgende Situation vor dem "Feuern" der Transition:
222
Und diese Situation nach "Feuern" der Transition:
dem
Wenn die Marke an der Stelle rt(F3) angekommen ist und die entspre chende Transition "feuert", dann ergibt sich eine Belegung der Stellen B und Fl mit jeweils einer Marke.
Flöte
Die Belegung der Stelle B mit einer Marke ist wesentlich für den Übergang der durch die mit der Belegung mit einer Marke von Fl einge leitete Wiederholung von Fl, F2, F3, F4 nach Fend. Diesmal wird nicht nach FS fortgeschritten, da nur F4 eine Marke aufweist, A jedoch nicht.
Die Bedingung zum "Feuern" der Transition:
B und F4 weisen jedoch eine Marke auf, so daß die von ihnen beeinflußte Transition feuert und Fend eine Marke erhält:
223 Wie leicht zu sehen ist, wird durch statische und dynamische Beschrei bung des Petri-Netzes die die Flötenstimme darstellende Folge musikali scher Objekte F1 F2 F3 F4 F5 i(Fl F2) rt(F3) Fl F2 F3 F4 Fend be schrieben. Die Arbeitsweise bzw. die Belegung der einzelnen Stellen des Petri Netzes für die Flötenstimme läßt sich auch durch eine Matrix angeben: Arbeitsgang/ Stellen Start A B Fend Fl F2 F3 F4 F5 i(Fl F2) rt(F3)
1.
2.
3.
4.
5.
6.
7.
8.
9.
10. 11.
12. 13.
1 0 0 0 0 0 0 0 0 0
0 1 0 0 1 0 0 0 0 0 0
0 1 0 0 0 1 0 0 0 0 0
0 I 0 0 0 0 1 0 0 0 0
0 I 0 0 0 0 0 I 0 0 0
0 0 0 0 0 0 0 0 1 0 0
0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0
0 0 I 0 1 0 0 0 0 0 0
0 0 1 0 0 1 0 0 0 0 0
0 0 1 0 0 0 0 1 0 0 0
0 0 1
0 0 0 1 0 0 0 0
0 0 0 1 0 0 0 0 0 0 0
Die Belegung der Stellen mit Marken zu Beginn der Arbeitsweise eines Petri-Netzes ist von großer Bedeutung für das dynamische Verhalten des entsprechenden Netzes. Würde z. B. der Anfangszustand des Netzes durch eine Marke auf der Startstelle und eine Marke auf der Stelle B gegeben, so gäbe es keine Wiederholung und die dargestellte Folge der musikalischen Objekte wäre: Fl F2 F3 F4 Fend In ähnlicher Weise wie die Flötenstimme lassen sich die Vialinstimme und der Basso Continuo beschreiben. Die ersten zwei Takte der Vielin stimme weisen jeweils eine ganze Pause auf und werden zu dem musikalischen Objekt VP zusammengefaßt. Da die Vialinstimme sich im wesentlichen als Inversion der Flötenstimme erweist, wird der Inversionsoperator auf die mit "M" bezeichnete Flötenstimme angewandt. Für die Vialinstimme ergibt sich die kompakte Beschreibung VP i(M). In der Petri-Netzdarstellung:
Start Violine
Der Basso Continuo CB wird in folgender Weise zerlegt (Degli Antoni & Haus 1985, 145): CB1 - die ersten zwei Takte CB2 - die Takte 3 bis 14 CB3 - die Takte 15 bis 32 CBend - der Schlußakkord in Takt 15 bei der Wiederholung.
224 Als Folge der musikalischen Objekte für den Basso Continuo ergibt sich: CBl CB2 CB3 CB2 CBend Die Petri-Netz-Beschreibung nimmt diese Form an:
Basso continuo
Es zeigt sich itir die Beschreibung der einzelnen Stimmen des Kanons insgesamt folgendes Bild:1 Flötenstimme: Fl F2 F3 F4 FS i(Fl F2) rt(F3) Fl F2 F3 F4 Fend Violinstimme: VP i(M) Basso Continuo: CBl CB2 CB3 CB2 CBend Um die Beschreibung der einzelnen Stimmen zueinander in Beziehung zu setzen, wird der Kanon auf einer abstrakteren Ebene durch ein wei teres Petri-Netz beschrieben. Die Beziehung wird durch einen Morphis mus hergestellt, so daß man von den Stellen und Transitionen der ab strakteren Beschreibung zu den genaueren Beschreibungen der konkrete ren wechseln kann und umgekehrt. So kann z. B. jede Stelle des abstrak teren Netzes auf mehrere Stellen der anderen Netze verweisen. Die abstraktere Beschreibung des Bachsehen Kanons wird von Degli Antoni und Goffredo Haus (1985, 1 4 7) wie folgt angegeben: CP1 - die ersten beiden Takte Vm - die gesamte Violinpartie CP2 - die Takte 3 bis 14 von Flöte und Basso continuo CP3 - die Takte 15 bis 32 von Flöte und Basso Continuo CPend - die Fermate auf Takt 15
1) vgl. die Partitur auf den Seiten 225 u. 226 in der die musikalischen Objekte durch Rechtecke gekennzeichne1 und entsprechend benannt wurden.
225 Canon II
Flauto traverso Violino (Viola dag-ambaJ Violonc:ello
Fl
,..,...
Aodaote
I� �VP "
)·,
�
.mr_I� I
I� "
)'·,
".....,
.I
r•
t:' 1..1
FJ-..J-----..., �
....... ---
-
II
,..
.,.�
�I
....,.-".-._b� -=
CB2
..---
::::-
�r ·�Ii �
. �--�·
�
,......._
h.Q;:.
-
.------
-
'----
.
FJ
...
-
�
L..J I ,r-
R LPl.J,
·r·� r'l==��I�
��- h,. -.;.
-
•
I"
:
-
.� -
-
� r-r -
t.end I
r�l'r--
FS
!ill II
,..
=-
•
--
i{M
-� b� b,.. �� "----.
I"'
m
,......
-
�
.......
m
_ fi_ .J.. �
...---... "
. b .
--=::;
CBl
r_z I
Andapte
Cembalo
perpetuus
F4
� �··
,...
•' b fL,.. •
�...
.&...b � �b.... I!.
qfL jl: r-;;J
�
CB e�
h. . ......
J.
.___ CB3
��... ,..
t\
226
Canon perpetuus -
� r.T "
-' 1
F2
i(Fl,
(J.
�
fr
'"" .
-
.......
�
l·
�
==--
-=:
..� J·��r-q• ,r::r., Tl��· U.l �
"..
�
.....::::.
• tf�..._ �
�
•
�: 1-'
I!J!
r·
�
': I"'
�
Iei
, .
l
Lh,,�
� • ,
I
r I I�
.-1--
-
�
. _...... ..-...
...
rt(FJ)
_,
-
1'--'f
r .� .�fl�?-��:--c�;-
F2)
.... r"T""!""''
-
-
I
" L"l:' .
--..:..:>'
; ·r
6r a: "---"L.f
�
� -== ..
Fl
"
-..
-
L::!::'c
fr
7-
....___
,�r·� -
�
_ L. I
I
.n::i
r�rnJ ....... ... .�,, �·
-- f
.......
-
r.-��
V
:
-
: I' �r L! "'-..;/�r I r� �-
�.:;
--
:
227 Ihre Darstellung durch ein Petri-Netz sieht aus wie folgt:
Stop
Canon perpetuus
Die Petri-Netz-Darstellung1 des Kanons sowie einige Beziehungen zu den Petri-Netzbeschreibungen der einzelnen Stimmen (angezeigt durch gestrichelte Linien) gibt die Abbildung auf Seite 228. Es ist zu erkennen, wie die Stelle CP2 der Kanonbeschreibung durch die Stellen F2, F3, F4 des Petri-Netzes der Flötenstimme und der Stelle CIB2 des Basso conti nuo "konkretisiert" wird. Die Beschreibung musikalischer Strukturen und Prozesse durch Petri Netze 2 und musikalische Objekte hat für die Genueser Forscher den Status einer Metapher, deren Gehalt durch ein komputationelles Modell des mu sikalischen Prozesses weiter konkretisiert und überprüft wird. Antonio Camurri, Goffredo Haus und Renato Zaccaria (1986b, 340) merken hierzu an: The metaphor and its representing language are intended to formally describe the process, that is analyze it to enhance t.he understanding of the process. To reproduce the process, or use its representation to syn thesize an output rather than analyze its behavior, we have to jump from the Metaphor to a Model. We use this term to emphasize the � putational characteristic (and thus the possibility of performing emulation runs) rather than a purely generic description. Um die Petri-Netze und die durch sie beschriebenen musikalischen Pro zesse zu implementieren, entwickelten Antonio Camurri, Goffredo Haus und Renato Zaccaria (1986b, 340-342) eine linguistische Beschreibung in Form von Anweisungsfolgen. Eine Anweisungsfolge (statement sequence) beschreibt einen vollständigen musikalischen Prozess und wird auch Netz beschreibung genannt. Eine Anweisung definiert: 1) Degli Antoni & Haus 1985, 146. 2) Eine weitere Analyse einer Bachsehen Fuge aus dem "Wohltemperierten Klavier" mit Hilfe von Petri Netzen findet sich in Camurri, Haus & Zaccaria 1986b, 350 ff. Kompositionen mit Petri-Netzen finden sich bei Haus 1990.
228 Morphismus über die Netze des Canon perpetuus und der beteiligten Instrumente
flöte
Vi�line
Conon perpeluus
Slop
Abb. aus Degli Antoni
&
Haus
1985, 146
229 a) b) c) d)
eine Stelle eine Transition eine bestimmte Markierung Anfangs- und Endstellen einer Ausführung.
Es können symbolische Namen vergeben werden, dje z. B. Transitionen charakterisieren. So beschreibt z. B. fus.t(cnt-start score.sc, outl.net out2) die Transition fus.t. Die Transition fus.t - das Suffix "t" zeigt an, daß es sich um eine Transition handelt - besteht aus den zwei vorgeschalteten Stellen cnt start und score.sc. Das Präfix "cnt" in "cnt-start" gibt an, daß es sich um Belegung der Stelle mit Zählmarken handelt. Das Suffix "sc" in "sco re.sc" verweist auf eine Datei des Klanggenerierungsprogrammes CMU SIC. Die der Transition fus.t nachgeschalteten Stellen sind outl.net und out2. Das Suffix "net" indiziert eine Netzbeschreibungsdatei.. Ein default (Fehlen) meint immer eine Klangdatei. Das angegebene Petri-Netz, bei dem dreimal out2 durchlaufen wird, hat folgende graphische Darstellung�
I oop
Man erhält dann diese linguistische Beschreibung:2 fus.t(cnt-start scorel.sc, outl.net out2); loop.t(out2, scorel .sc ); start scorel.sc, cnt-start = 3; end outl.net; Diese Netzbeschreibung besagt, daß das Netz aus zwei Transitionen fus.t und loop.t besteht. Vorgeschaltete Stellen für fus.t sind start und scorel und für loop.t out2. Nachgeschaltete Stellen sind entsprechend outl und out2 für fus.t und scorel für loop.t. Die Ausführung des Netzes be ginnt bei scorel, d.h. es wird eine Marke gesetzt, und start wird mit drei Marken belegt. Mit outl endet die Ausführung des Prozesses. Eine formale Beschreibung dieser linguistischen Beschreibung soll sich in 1) Camurri, Haus & Zaccaria 1986b, 341. 2) Camurri, Haus & Zaccaria 1986b, 342.
230 der Dissertation Antonio Camurris (1984) befinden, die mir allerdings nicht zu gänglich war. Jedoch dürfte die linguistische Darstellung der Petri-Netze im Prinzip klar geworden sein. Antonio Camurri, Goffredo Haus und Renato Zaccarias Implementierung des MAP-Systems besteht im wesentlichen aus den drei Programmen MFORM, REMARK, PERFORM und hat die Aufgabe, Petri-Netz-Be schreibungen, deren Stellen musikalische Objekte sind, auszuführen und zu beschreiben. MAP stellt eine Erweiterung des auf das seit 1969 kommer ziell allgemein zugängliche MUSIC 5 1 zurückgehende CMUSIC2-Kianger zeugungssystem dar, das musikalische Phänomene ähnlich der Notation auf symbolischer Abstraktionsebene erfaßt. MFORM ist im Kern die oben vorgestellte Sprache für die Beschreibung der dargestellten speziellen Petri-Netze, REMARK ein spezieller Editor und PERFORM verarbeitet die durch MFORM und REMARK "aufbereiteten" Petri-Netz-Partituren und führt zur Klangerzeugung. Für eine genauere Darstellung der Funkti onsweise dieser drei Programme des MAP-Systems muß auf die Arbeit von Antonio Camurri, Goffredo Haus und Renato Zaccaria (1986b, 342-349) verwiesen werden, da es an dieser Stelle nur darum geht, die Ebene der strukturellen Beschreibung musikalischer Phänomene darzulegen. Die Arbeit der Genueser Forschergruppe stellt ein gut entwickeltes Sy stem im Bereich der Computermusik dar. Sie greifen das von Stephen W. Smoliar3 eingeführte Konzept des musikalischen Prozesses auf und erwei tern es um die Beschreibung konkurrenter Prozesse durch Petri-Netze. Ausgangspunkt der Beschreibung bildet der musikalische Text, der auf verschiedenen Abstraktionsebenen beschrieben wird. Ich lasse noch einmal Degli Antoni und Goffredo Haus (1985, 1 4 7) zu Wort kommen, die schreiben, daß Petri-Netze brauchbare Modelle zur Reprä"sentation musikalischer Texte liefern können. Sie gestatten es, unterschiedliche Darstellungen desselben Textes, verschiedener Interpretationen oder unterschiedliche Musikstücke mit analogen strukturellen Charakteristika zu untersuchen. Außerdem wird es möglich, unterschiedliche Situationen von Gleichzeitigkeit, Aufeinanderfolge, Hierarchie und Abstraktionsgrad zu beschreiben. Für den Bereich der Forschungen der Computermusik können diese Ar beiten wegweisend sein, jedoch bleibt die weitere Entwicklung abzuwarten. Indessen meinen die Genueser Forscher, ihrer Anwendung von Petri Netzen auch eine musikpsychologische Interpretation unterlegen zu können� Dies scheint mir - jedenfalls in der Art, wie es von der Genueser Grup pe vorgenommen wird - zweifelhaft. Wenn davon ausgegangen wird, daß musikpsychologische Forschung erst einmal die Segmentierungen aufzuklä ren hat, wie sie im Wahrnehmungsprozess auftreten und hieraus ihre 1) vgl. Mathews 1969. 2) vgl. Moore 1990. 3) vgl. Kap. 3. 2. 2, S. 272 ff. 4) hierzu s. Degli Antoni & Haus 1985, 141 u. 147.
231 Evidenz erhalten, so scheint mir - zumindest für diese Ebene der musi kalischen Segmentierung - die konkrete Segmentierung des Genueser Teams psychologisch nicht gestützt zu werden. Sie gestehen allerdings zu, daß ihre Segmentierungseinheit, das musikalische Objekt, schwierig zu bestimmen ist, wenn sie (Degli Antoni & Haus 1985, 142) schreiben: Die Definition musikalischer Objekte hiingt jedoch vom Ziel der Untersu chung ab. Die Identifikation musikalischer Objekte ist jedoch weder einfach noch eindeutig: Zwei Hörer oder ein Hörer in verschiedenen Situationen können ein und dasselbe Stück Musikstück unterschiedlich wahrnehmen. Gleichwohl sind musikpsychologisch motivierte Abstraktionen durchaus nicht willkürlich; die Aufgabe eines Formalismus wäre es daher, diese durch musikalische Intuitionen angedeuteten Abstraktionen formal zu fas sen. Eine willkürliche Segmentierung des musikalischen Textes mag vom Ziel der Untersuchung abhängen und kann unter praktischen Aspekten sehr erfolgreich sein; allerdings dürfte, solange keine Kriterien angegeben werden, welche die Segmentierungen aufgrund musikpsychologischer Ein sichten leiten, kaum von einer musikpsychologischen Relevanz des betref fenden Formalismus - in diesem Fall des Petri-Netzes - gesprochen wer den. Um zu illustrieren, was ich hiermit meine, sei noch einmal auf die ersten drei Takte der Flötenstimme des Canon perpetuus eingegangen. Als zwei mögliche musikalisch und psychologisch motivierte Segmentie rungen sind z. B. Takt 1 , 2 und 3 bis zur Viertelpause als Einheit aufzu fassen; oder aber diese Einheit als noch einmal in zwei weitere Einheiten gegliedert, nämlich Takt 1 und von Takt 2 die punktierte Viertel als eine Einheit und der Rest die andere.
Eine Segmentierung in f1 und F2, die die ersten beiden Viertel des drit ten Taktes aus der melodisch absteigenden Bewegung des zweiten Taktes von F1 herausnimmt, scheint mir nicht musikalisch und psychologisch motiviert zu sein, sondern mehr technisch.
Auch wenn die von der Forschergruppe1 des DIST vorgeschlagene An wendung der Petri-Netze zur Beschreibung psychologischer Prozesse nicht 1) Camurri 1990; Camurri et al. 1986a, 1986b; Degli Antoni & Haus 1985.
232 genügend begründet scheint, so muß allerdings darauf hingewiesen werden, daß diese Gruppe mit einer psychologisierenden Anwendung von Petri Netzen nicht allein dasteht. Oeser und Seitelberger spekulieren in ihrem Buch1, das die Forschungsergebnisse der modernen Hirnforschung in bezug auf Bewußtseinsphänomene beschreibt, über eine "Prozeßlogik" des neuro kognitiven Systems Gehirn im Rahmen einer funktionalen Neuroepistemo logie, die in erster Annäherung mit den Mittel der allgemeinen Theorie der Petri-Netze charakterisiert werden kann. Ausgangspunkt für diese Spekulationen bilden einerseits die physiologi sche "Erkenntnis", daß es sich bei dem Nervensystem um ein stark vernetztes System mit parallel arbeitenden Prozessen handelt, bei denen der Zeitfaktor eine zentrale Rolle spielt, welcher von den bisherigen logischen Mitteln nur ungenügend erfaßt wurde� andererseits wird auf psychologischer Ebe ne das Konzept des Bewußtseinsstromes von William James bemüht� An die Stelle des bisherigen "Computerprogrammodells" des Gehirns muß ei ne noch grundlegendere Auffassung der kognitiven Funktionen des Nervensystems treten, die der realen Struktur und Funktion eines sich selbstorganisierenden lebenden Systems mit massiver Parallelität und grenzenlos verteiltem Bewußtsein entspricht.4 Zu ihrer Beschreibung wird daher5 eine andere Art von Logik (benötigt; U. S.), die dem durch "massive Parallelitii(' ausgezeichneten Netzcha rakter des neuronal getragenen kognitiven Systems des Menschen ge recht werden kann. In einer solchen Logik muß auch der zeitliche Aspekt eine entscheidende Rolle spielen, der sonst in den bisher be kannten Logiken und Logikkalkülen meist ausgeklammert worden ist. Denn die Logik der Neuronen geschieht nicht nur in einem Netzwerk hoher Komplexität, sondern ist selbst ein Prozeß, der in der Zeit abläuft. Die annäherungsweise Darstellung dieser "Logik" ist durch die Netztheo rie Petris gegeben6� Dem Netzcharakter des neurokognitiven Systems entsprechend muß man aber dabei von zahllosen nebenläufigen Prozes sen ausgehen, die zueinander in lokaler Beziehung stehen. Für diese lokalen Beziehungen bietet die Darstellung der Grundsituationen von Veränderungen in der Netztheorie Petris (. . .) eine präzise Beschreibung, die sich in intuitiver Annäherung auch für den Entwicklungsprozeß der Erkenntnisprodukte, d. h. in der Darstellung der Theoriendynamik, bewährt hat (. . .). Ohne hier weiter auf die "intuitiven Annäherungen" von Oeser und Sei telberger einzugehen - so zeigten sie leider nicht einmal ansatzweise, wie 1) Oeser & Seitelberger 1988, 172 ff. bes. 173 2) Oeser & Seitelberger 1988, 173 u. 174. 3) 4) S) 6)
Oeser Oeser Oeser Oeser
& Seitelberger & Seitelberger & Seitetherger & Seitelberger
1988, 1988, 1988, 1988,
178 173. 174. 176.
u.
178.
233 die Petri-Netz-Theorie zur Modeliierung des Verhaltens von Neuronen komplexen eingesetzt werden könnte oder inwieweit psychologische Mo dellierungen möglich wären - ist insgesamt festzuhalten, daß sich eine Tendenz abzeichnet, die Prozessualität und Parallelität bzw. Nebenläufigkeit von Phänomenen zu erfassen.1 Petri-Netze mögen hierzu ein Mittel sein, daß sie aber eine "neue Logik" begründen, mit der die Computermetapher des Gehirns bzw. des Geistes erweitert bzw. gar überwunden würde, kann nicht behauptet werden. So lassen sich z. B. formale Äquivalenzen zu Konzepten der Automatentheorie aufweisen, mit denen bekanntlich je nach Abstraktionsebene ein Rechner beschrieben wird. Die Genueser Forscher nutzen denn auch die Petri-Netze, um die "stati schen Konzepte" der an der Grammatikidee orientierten Beschreibungen zu überwinden. Sie sind sich allerdings des "Metapherncharakters" ihrer Beschreibung bewußt und nutzen eine Implementierung der Petri-Netze, um die "eigentliche" Prozessualität zu modellieren. In dieser Hinsicht steht ihr Ansatz den Vorstellungen der KI-Forscher über die Bedeutung der Prozedu ralität oder Prozessualität der Performanz näher als die bisher von mir erörterten Beschreibungen durch Grammatiken. Ich habe ihre Forschungen allerdings an dieser Stelle besprochen, weil die Petri-Netz-Theorie nicht direkt als Repräsentationsmechanismus der KI entwickelt wurde. Ein weiteres Forschungsprojekt, in dem das Grammatikkonzept als Be schreibungsmittel musikalischer Strukturen eine zentrale Rolle spielt, gleichzeitig eine Implementierung der benutzten Grammatik vorgenommen wird sowie Methoden der KI zum Wissenserwerb (knowledge acquisition) benutzt werden, ist das Forschungsvorhaben zur Entwicklung einer Gram matik für tabla-Musik von James Kippen und Bernard Bel.
1) Helmut Schnelle (1988) ent wickelte mit seiner Netzlinguistik einen fortgeschrittenen Ansatz, um die formal-strukturelle Beschreibung eines kognitiven Bereiches durch Grammatiken mit der Prozessualität der ihm unterliegenden parallel ablaufenden kog
verbinden Ausführlich legt er seine Ideen in dem Buch 'Die Natur der Sprache. Die Dynamik der Prozesse und de s Verstehens. Berlin: de Gruyter, 1991" dar. Die Beziehung seines Ansatzes zu zellulären Automaten und Petri-Netzen findet sich in diesem Buch S. 211 ff. ausgearbeit. nitiven Phänomene zu
.
234 3. 1. 6. Grammatik, Künstliche Intelligenz und nord-indische Tabla-Musik Gerade in der ethnologischen Forschung wird das Problem der Subjek tivität der durch die eigene Kultur bedingten Perzeption und Interpretati on in und für die Rekonstruktion der Wissenssysteme fremder Kulturen offenkundig, so auch in der Musikethnologie. Die vermeintlichen Eviden zen, welche bei der Perzeption und Benennung von Musik der eigenen Kultur noch vorhanden scheinen, zerbrechen häufig bei der Benennung mittels eigener Klassifizierungen, oder aber es ergeben sich Schwierigkeiten bei der Interpretation der vom Informanten gegebenen Hinweise (vgl. Bel 1990; 1991a). Die Arbeiten1 von James Kippen und Bernard Bel werfen ein neues Licht auf die Methodologie der musikethnologischen Forschung. Musiketh nologie und die Theorie der Wissensrepräsentation ermöglichen neue We ge der ethnologischen Forschung, die sich auch der Kognitiven Psycholo gie (Baily 1988; West et al. 1991) annähern. Für die Verbindung der Forschung der Ethnologie mit der Forschung der Künstlichen Intelligenz wird der Einsatz von wissensbasierten Systemen diskutiert. Sie selbst haben ein Experten system2 - den Bol-processor3 - entwickelt, der in der ethnologischen Feldforschung eingesetzt wird. Sich auf Goodenoughs (1957, 167) Definiti on beziehend, wird Musik bzw. der zu untersuchende Teilbereich nordin discher Tabla-Musik als kulturelles Produkt des menschlichen Geistes betrachtet. Die Aufgabe des Expertensystems ist es - so James Kippen (1988b, 318) -, to formalize particular expert knowledge in an attempt to
understand and simulate the processes that generate a cultural product ... Das wissensbasierte System soll dazu dienen (Kippen 1988b, 319), to formalize intuitive knowledge and represent it in a series of statements that our informant can analyse and asses for accuracy and quality. Es werden also die Intuitionen, die der Forscher aufgrund seiner Ana lyse des betreffenden Wissensgebietes und der Mitteilungen von Infor manten erhält, so weit wie möglich explizit dargestellt und dann mittels eines Rechners getestet. Dieses Testen erfolgt zum einen dadurch, daß der betreffende Forscher durch die vom System generierten Ausgaben, die dem charakterisierten Bereich entsprechen sollten, auf Fehler in den Beschreibungformen aufmerksam wird, die ihn veranlassen können, letzte re zu verändern; zum anderen kann ein solches System eingegebene Da ten auf ihre Zugehörigkeit zum untersuchten Wissenbereich überprüfen, was gegebenenfalls den Forscher dazu veranlaßt, die Beschreibung zu 1) Seit Beginn der 80er Jahre arbeiten der Musikethnologe James Kippen und der Mu sikforscher und Informatiker Bernard Bel an der formalen Beschreibung und Erfor schung nordindischer Tabla-Musik; s. Kippen 1986, 1987, 1988a, 1988b, 1990; Bel o. J, 1990. 1991a, 1991b; Kippen & Bel 1984, 1988, 1989. 2) Zur Methodologie des Einsatzes von Expertensystemen in der Ethnologie vgl. Fi scher 1986; Bel 1991a; Kippen 1988. 3) vgl. Bel 1991b
235 erweitern bzw. zu verändern. Aber auch Informanten können in gleicher Weise arbeiten und ihr Urteil über die Korrektheit der Ausgabe des Systems auf eine entsprechende Eingabe abgeben, denn (Kippen 1988b, 318): The know
ledge base constitutes, ... , an initial hypothetical model of musical structure.
In seiner Erörterung der Kritiken computerunterstützter Untersuchungen erwähnt Kippen eine gängige Kritik an dem Einsatz von Expertensyste men in der psychologischen Forschung: Es sei mit ihnen zwar möglich, die Produkte eines psychologischen Prozesses zu beschreiben und zu er klären, sie wären jedoch nicht in der Lage, die unterliegenden psycholo gischen Prozesse zu identifizieren und seien somit nicht brauchbar, um einen Beitrag zur Untersuchung kulturspezifischer Kognitionsprozesse zu leisten. James Kippens nicht überzeugender Einwand gegen diese Kritik ist, daß das Anliegen der Computerwissenschaftler und Wissensingenieure mißverstanden würde, denn for although their distant and ultimate aim
may be to arrive at universal representation of cognition, they have far more realistic and practical shortterm aims that center around the need to develop more efficient analytical tools. Dieser Einwand bestätigt eher die Kritiker, denn es stellt sich die Frage, wenn effiziente analytische Hilfsmittel entwickelt werden, mit welcher Intention dies geschieht. Der widersprüchliche Standpunkt James Kippens ist interessant, da er stellvertretend für die Auffassung der Forscher steht, die zwar den Ein satz von Computern zur Erforschung kognitiver Phänomene vertreten, an dererseits aber den Menschen bzw. menschliche Informationsverarbeitungs prozesse nicht als "maschinelle Prozesse" deuten wollen oder mögen, um die Superiorität des Menschen aufrecht zu erhalten und dem Fehlschluß zu entgehen, da der Computer menschliche Leistungen erbringe, sei der Mensch eine Maschine. Meines Erachtens entspringt der Standpunkt Kip pens einem Problem, das sich folgendermaßen beschreiben läßt: Einerseits sollen Validität und Relevanz des Computers für die Erforschung kogniti ver Phänomene aufgezeigt werden, andererseits kann nicht akzeptiert werden, daß der Computer "kognitive Leistungen" erbringt. Daher nimmt Kippen in seiner ausweichenden Argumentation die Position des "Wissens ingenieurs" ein, der ein System in die Lage zu versetzen sucht, als in telligent bezeichnetes Verhalten durchzufl.ihren. Es interessiert diesen aber nicht, ob der von ihm erarbeitete Mechanismus psychologische Rele vanz hat und somit zur Erklärung psychologischer Phänomene dient, man wolle nur develop more efficient analytical tools. Diese Position kann aus rein praktischen Gründen eingenommen werden, dem Ziel der Entwicklung eines funktionsfähigen Systems, welches die Leistungsspezifikation er bringt, oder aber aus einer nicht bewußten Idiosynkrasie gegen eine mechani stische Grundposition, die einer solchen Interpretation unterliegt. So betont denn James Kippen (1988, 318) auch, daß human beings are not machines und versagt sich somit eine konsistente Argumentation für den Einsatz von
236 Computern. Unterstellt man, daß Kippen mit "Maschine" einen physikali schen Mechanismus meint und nicht einen abstrakten Automaten, so hat er sicherlich recht. Sollte er allerdings gemeint haben, es handele sich dabei um einen (abstrakten) Automaten, so muß diese These geprüft werden. Wesentlich ist jedoch, daß Kippen methodologisch eine formale Darstellung von intuitivem menschlichen Wissen anstrebt. Er muß also unterstellen, daß zumindest ein Teil des menschlichen Wissens berechen baren Prozessen gleichzusetzen ist. Aber wenn etwas überhaupt explizit formulierbar ist, dann ist es prinzipiell auch programmierbar 1 und das Nervensystem kann solche Prozesse ebenfalls durchführen. Dies heißt aber, daß der Mensch sich in Teilbereichen wenn auch nicht genau wie ein Computer, so doch wie ein (abstrakter) Automat verhält bzw. diese Teilbereiche im Rahmen der Automatentheorie adäquat beschrieben wer den können, so daß davon gesprochen werden kann, der Mensch sei in diesen Bereichen eine Maschine (Automat). Sollte James Kippen diese Interpretation nicht akzeptieren, so muß er seine Annahme aufgeben, daß er kognitive Repräsentationen oder Prozesse untersucht, da in der Tat seine Untersuchungen psychologisch nicht relevant sind. Bei meiner Inter pretation würden, trotz der Fragwürdigkeit der Untersuchungen in bezug auf Kippens Standpunkt, seine Forschungsergebnisse eine induktive Stüt zung der mechanistischen Position bedeuten, denn Teilaspekte menschli cher Erfahrung ließen sich algorithmisch beschreiben und es ist somit anzunehmen, daß die unterliegenden psychologisch-physiologischen Prozes se algorithmisch sind. Daß sie genau die angegebene Form haben, kann natürlich nicht behauptet werden ! Der von James Kippen in seinem Forschungsprogramm verfolgte menta listische Ansatz wird weiterhin dadurch offenkundig, daß er (Kippen 1988a, 160) sich gegen die bisherigen taxonomischen Untersuchungen aus spricht: Western methods of analysis have so far been based on the clo se scrutiny of transcribed examples from the repertoire ( ..). Such an approach may tell us much about the structural outline of the composi tions, but it does not necessarily reflect the perceptions of the musicians who created them, for such methods focus essentially on the product of a musical process and consequently tell us little about the actual process itself. In contrast, I have attempted to identify the process involved in creating tabla music. Nach James Kippen (1988a, 160) gibt es in der Tabla-Musik gleitende Übergänge von Kompositionen, welche die Basis für Improvisationen bil den, zu "feststehenden" Kompositionen. Daher sind Ansätze problematisch, die anstreben, an ideal system of classification in which categories of composition are delineated and compartmentalized zu entwickeln. Die Kompositionen, welche die Basis für Improvisationen bilden, nennt er "Thema-und-Variationen-Kompositionen", die anderen "feststehende Kom.
1) Dies ist die Babbagesche oder kybernetische These; näheres s. S. 125 ff.
u.
171.
237 positionen". Eine der bekanntesten Strukturen bildet die Form: qä'ida. Um die dieser Improvisationsform unterliegenden "musikalischen Intuitionen" objektiv zu beschreiben, entwickelte er zusammen mit Bernard Bel eine Grammatik, die Kernstrukturen dieser Form erfaßt, denn das System, das den Improvisationen unterliegt, kann nicht allein durch verbale Beschrei bungen verstanden werden, sondern am besten mittels (Kippen 1988a, 162)
dynamic models that represent formalisations of musical intuition. Musik und Sprache sind für ihn (Kippen 1988a, 162) modelling systems for human thought and action. Bevor eine Darstellung der Grammatik für die qa'ida erfolgt, sollen eini ge Erläuterungen zur Spielweise der Tabla sowie der Notation ihrer Musik ge geben werden. Für die folgende Benennung des Instrumentes und die Struktu ren der tabla-Musik folge ich, da es keine stringente einheitliche Terminologie gibt, den für diese Erörterungen wesentlichen Ausruhrungen James Kippens (1988a), welcher sich auf die Terminologie der Lucknow-Schule bezieht. Bei der Lucknow-Schule oder Lucknow-ghäranä1 handelt es sich um ei ne soziale Gruppierung, die durch erbliche Folge und deren berühmte Schüler näher bestimmt wird und kulturelle Werte sowie einen von ihnen ausgeprägten musikalischen Stil tradiert, die in Lucknow angesiedelt ist. Lucknow ist eine Stadt Nordindiens ungefähr 500 Kilometer südöstlich von Dehli und 200 Kilometer von Nepals Grenze entfernt gelegen. Einer der Hauptvertreter der Lucknow-ghäranif ist der 1930 geborenen Kalifa (Ustad) Afaq Husain Khan, der Informant seines Schülers James Kippen war, welcher bei ihm das tabla-Spiel erlernte. Die tabla besteht aus zwei Trommeln2, welche sitzend mit den Händen bzw. den Fingern gespielt werden. Die kleinere Tommel, die meistens mit den Fingern rechten Hand gespielt wird, wird dähinä (rechte Hand) oder däyän genannt; die größere heißt bäyän (linke Hand) oder duggJ. Von besonderer Bedeutung sind die schwarzen, 7 cm Durchmesser aufweisen den Scheiben, die den Trommeln unterschiedliche Tonhöhen und Resonanz ermöglichen. Die dähinä wird entsprechend der zu benutzenden Skala auf der ersten, vierten oder fünften Stufe eingestimmt, während die bäyän eine ungefähr bestimmten tiefen Ton erhält, dessen Klang z. B. durch Druck modifiziert wird. Die verbale Beschreibung der einzelnen Anschläge erfolgt durch Silben wie dhä , dhl, ghi, ge, tä, tl, ki, te, na aber auch trtk für tirakita etc., die als bols bezeichnet werden. Es handelt sich hierbei um onomapoeti sche, mnemotechnische verbale Symbole zur Repräsentation der Trom melschläge. Es besteht neben den vielen unterschiedlichen Benennungen 1) ghliranli bedeutet soviel wie ·aus dem Hause"; zur näheren soziologischen Bestimmung dieses Konzeptes sowie der verschiedenen ghl!ranli muß an dieser Stelle auf Kippen 1988a, 63 ff. und Neumann 1980 verwiesen werden. 2) Eine Zeichnung von Kalifa Afaq Husain Khan mit einer tabla bestehend aus dl:lhinl:l und bäyän zeigend findet sich auf S. 238.
238
Afaq Husain Khan die Haltung und Handposition
fUr die tabla demonstrierend
Zeichnung nach Kippen 1988a, 144
nicht unbedingt eine eins-zu-eins Entsprechung zwischen den Silben und den Trommelschlägen, so wird z. B. in der Folge dha, dhli (ge) di na das geklammerte ge zwar gespielt, jedoch nicht gesprochen und so beinhaltet z. B. tli, die Möglichkeit zweier Ausführungen� Eine unterschiedliche Tongebung der Trommelschläge wird durch Varia tion der Position des Anschlagfingers und der Anschlagstelle erreicht. So zeigen die folgenden Abbildungen (Kippen 1988a, 146) den Anschlagort (schwarz) auf der dahinliund die Zeichnungen (nach Kippen 1988a, 147 u. 148) die entsprechende Fingerposition des Zeigefingers zur Realisierung des tli, welcher häufig auf den zentralen ersten Ton (der Tonika) der Skala gestimmt und höchstwahrscheinlich der wichtigste (Kippen 1988a, XIX) für das tabla-Spiel ist. I) vgl. die Abbildungen
sowie die Zeichnungen auf den S. 239
u. 240.
239 Name
Symbol
0
ta
Tli zu
Alternative Silben ta
Beginn des Anschlags mit dem Zeigefinger
Der Zeigefinger hat Kontakt
mit
dl!ihinli
Nach dem Anschlag
Zeichnungen nach Kippen 1988a, 1 4 6
nä
na
240 Name tä
Symbol 0
Alternative Silben ta
*
Tl!!
vor dem Anschlag mit dem Zeigefinger
Der Zeigefinger hat Kontakt mit der dllhinll
Nach dem Anschlag
Zeichnungen nach Kippen 1988a, 1 4 7
nä
na
tin
241 Eine weitere wichtige Unterscheidung innerhalb der Anschlagformen ist die Einteilung in resonierende und nicht resonierende Anschläge auf der dähinä und der bäyän. Die resonierenden Anschläge werden erzeugt, in dem die Finger von dem Fell abprallen, wohingegen der nicht resonieren de Anschlag durch Dämpfung des Fells mittels der Handfläche oder Fin ger erreicht wird. Bei den beiden angegebenen Anschlägen für tä handelte es sich um resonierende Schläge auf der dahini!i. Der Ans ehaag ghe ist ebenfalls resonierend, wird allerdings auf der bayän ausgeführt (Kippen 1988a, 153).
Name
Symbol
Alternative Silben
ghe ge
23
ghe ge gad
ghin
1234
ghl ghi
ga
ghin
Zusammen mit dem resonierenden Schlag ghe auf der bäyän bildet das resonierende tä der dähinä in seinen beiden Versionen den zusammenge setzten Schlag bzw. bol dha (Kippen 1988a, 145). So wird im allgemeinen bei Kombinationen wie z. B. ghe + tä, ghe + ti, etc. durch zusammen ziehen und voranstellen von dh zu dhä, dhi, etc. Es wird nun eine kurze Zusammenfassung der für Verständnis der folgenden Beispiele notwendigen bols gegeben. Ich folge der Darstellung und Sym bolik von James Kippen (1988a). Die Abbildungen der bisher noch nicht ange gebenen Anschlagstellen werden ergänzend auf der folgenden Seite angeführt. dähinä:
resonierend: tä, na (leerer Kreis); tä (voller Kreis; Kippen 1988a: IX, 146); ti (volles Dreieck Spitze nach unten; Kippen 1988a: IX, 150) nicht-resonierend: te; ti (1; 2 Kippen 1988a: XX, 151) bav an:
resonierend: ghe, ge (1, 23; Kippen 1988a: XX, 153) nicht-resonierend: ke (A; Kippen 1988a: XXI) ; ke, ki (v; Kippen 1988a: XXI, 155) Die aufeinanderfolgenden bols, die während eines Grundschlages (mäträ) gespielt werden, werden zu Gruppen zusammengefaßt und bei Notierung ebenfalls - den Gruppen entsprechend - zusammengeschrieben. Diese Gruppierungen können bestimmte Anordnungen annehmen, die einen me trischen Zyklus bilden, der täl genannt wird. Diese täls weisen Untertei-
242 Iungen aus Zusammenfassungen von mlfträs - die vibhägs - auf. Die vibhlfgs werden jeweils untereinander in eine Zeile geschrieben, deren einzelne mäträs durch einen Leerraum getrennt werden Den ein zelnen vibhlfgs wird jeweils ein Symbol vorangestellt, das anzeigt, ob der Anfang des betreffenden vibhäg betont (tali) oder unbetont (khali) ist. Die Zeilen der unbetonten vibhägs erhalten jeweils eine "0" vorangestellt, wohingegen die betonten Zeilen mit 1 beginnend, welche aufgrund der Tradition mit "x" bezeichnet wird, durchnumeriert werden. .
Name
Symbol
ti
*
Name
Symbol
te
Alternative Silben tl tin tu te
Alternative Silben te ti ra tak na
ti
2
te te tit ti tak na
ti
23
te
Name
Symbol
ke
V
te na
Alternative Silben
ke ki ki ka
kat
ke
Eine der grundlegendsten Formen ist die schon erwähnte qä'ida, welche die Grundlage für Variationen bildet. Sie wird hauptsächlich durch ihre Struktur und teilweise durch ihren Inhalt bestimmt (Kippen 1988a, 162). Damit ist gemeint, daß die Anordnung der bols von zentraler Bedeutung ist und nicht die verschiedenen Arten der bols. Die Variationen erfolgen durch eine systematische Änderung von reso nierendem und nicht-resonierendem Anschlag in der linken Hand, d. h. des bäyän. Der resonierende Anschlag wird auch als offen (khuli) be zeichnet, während der nicht-resonierende Anschlag als geschlossen (band) gekennzeichnet wird.
243 Für die nachfolgende, von Ustad Afaq Husain Khan angegebene bekann te Dehli qä'ida des Natthu Khan (1875-1940) sowie die erweiterte Fas sung läßt sich folgende Veränderung der resonierenden/nicht-resonieren den Spielweise feststellen (Kippen 1987, 181; 1988a, 162 u. 163):
khuli (resonierend) dhä dhi ghi ge
band (nicht-resonierend) tä ti ki ke
Die Delhi qä'ida des Natthu Khan enthält folgende bols (Kippen 1988a, 162):
(S1) X
(S2) 2
0 2 1 0 dhä�i tedha 1 23 0 21 0 täti tetä
21 0 0 2 1 0 tite dhä dhä tite dhäge 23 1 1 23 2 1 0 21 0 0 tite dhädhä tite dhäge 1 23 1 23
* 0 0 tina klna * 0 0 dhina ghlna 23 1
Es ist klar zu erkennen, wie der erste "Satz" (S1) im zweiten "Satz" (S2) durch die nicht-resanierenden geschlossenen Anschläge des bayan verändert wurde. So wurde aus der ersten bol dhä in S1 tä in S2 , d. h. aus den gleichzeitig erklingenden resonierenden Schlägen tä auf der dä hinä und ghe auf der bayan wurde das resonierende tä auf der dähinä und das nicht-resanierende ke auf der bayan. Ähnliche Veränderungen wurden in der vierten Vierergruppe tinakinä von S1 vorgenommen, so daß S2 an der entsprechenden Stelle die Variation dhinaghina zeigt. Weiter zeigt die qä'ida in S1 und S2 eine Gliederung in vier viergliedrige bols. James Kippen (1988, 163) weist daraufhin, daß, obwohl Ustad Afaq Hu sain Khan eine aus zwei "Sätzen" bestehende Form rezitierte, er diese jedoch in der Aufführung zu einer aus vier Sätzen bestehenden Form er weiterte, in der der grundlegende "Satz" dreimal vorkam. Diese Art der Durchführung bezeichnete James Kippen (1988a, 163) als Lucknower Ver sion. Eine solche qä'ida zeigt also eine Form, die aus vier "Sätzen" (S1, S2, S3, S4) besteht, welche vier Gruppierungen von vier bols aufweisen, die jeweils auf einem Grundschlag zusammengefaßt wurden. Die vierteili ge Form einer Lucknower Version dieser qa'ida gibt James Kippen (1987, 180; 1988a, 163) wie folgt an�
1) Eine EinspieJung dieses Beispiels findet sich auf der der Monographie J ames Kippens (1988a) beiliegenden Kassette. Es handelt sich um das Beispiel Nr. 1 der Kassette.
244 (S1) X (S2) 2 (S3) 0 (S4) 3
dh��itedh�
�itedh�dhä
täti t el! d h lH i ted h �
titeffiE: � i t e dh�dhä
dh�� i � e dh�
�itedh�dhä
� i ted h �ge
d hi n a g hi n a
� itetäke
{inakina tinakina
titedh�ge � i ted h � g e
dhinaghina
Die Variationen, die ich kursiv und unterstrichen angezeigt habe, sind ohne weiteres zu erkennen. S1 zeigt eine Grundform die in S2 und S3 fast genau wiederholt wird. Einzig die vierte Gruppe von bols zeigt eine Veränderung zu band. S3 ist durchgehend durch die band-Variation geprägt. Die qä'ida zeigt folglich die folgende khulilband- Struktur (Kippen 198 7, 181; 1988, 163): (S1) (S2) (S3) (S4)
khuli khuli band khuli
khuli khuli band khuli
khuli khuli band khuli
khuli band band khuli
Bei "Improvisationen" über die Grundstruktur der qli'ida, die in den ersten beiden "Sätzen" S1 und S2 stattfindet, muß sich die gleiche Ver änderung auch in den Sätzen S3, S4 widerspiegeln. Werden z. B. in S2 die ersten vier bols dhlititedhli zu titedhädha verändert, so muß auch in S4 die zu Beginn stehende Folge dhätitedhä entsprechend verändert werden. Aufgrund weiterer Untersuchungen arbeitete James Kippen (1987) eine strukturelle Beschreibung heraus, die zu der hierarchischen Darstellung der Struktur eines "Satzes" durch ein Baumdiagramm führte. Im wesentlichen läßt sich ein "Satz" als aus zwei Teilen bestehend verstehen: eine Anord nung der bol dhä (tir) und tite, sowie der schlußartigen Wendung dhäge dhinaghina bzw. deren band-Variationen. Allerdings kann die Kadenzfor mel dhirgedhinaghina auch verkürzt werden bzw. ganz wegfallen, um Raum für eine weitere Anordnung von dha und tite zu schaffen. Jim Kippen (1987) gibt mehrere Baumdiagramme zur strukturellen Beschrei bung der analysierten qä'ida, die allerdings unterschiedlich zu lesen sind:1 Satz
Anordnung
Kadenz
Dieses Diagramm ist zu lesen als: ein Satz besteht aus einer Anord nung und einer Kadenz. Die folgenden Diagramme (Kippen 1987, 184) I) abgewandelt nach Kippen 1987, 183.
245 sind höchstwahrscheinlich als Wahlmöglichkeiten zu interpretieren - leider gab James Kippen keine Interpretation der Diagramme an. KADENZ
c
CT
�
AG
CT2
CT4
ASA1
Meines Erachtens sind sie zu lesen als: Eine Kadenz (cadence; d. h. Schlußwendung) besteht entweder aus der Folge dhagedhinaghi nä (C)oder aus einer aus sechs bols bestehenden Anordnung (A6), wobei Aufteilungen in Gruppierungen I zu 5 (AIA5), 2 zu 4 (A2A4) etc. möglich sind, die durch die folgenden Diagramme spezifiziert werden, oder aus einer ver kürzten Kadenz (CT), die entweder aus der Folge (CT2) dhägedhina ge folgt von zwei bol (A2) oder der Folge (CT4) dhäge mit vier elementaren bols. AS
~ /1\ A
A!A4
A2Al
AlA2
R4R1
R!A3
A2A2
A3A1
A1A2
A2A1
Diese sind entsprechend zu lesen als: Die drei elementaren bols der Anordnung (A3) können entweder in die Folgen A1A2 oder A2Al zerlegt werden, wobei Al entweder als bol dhä oder Pause (-) zu interpretieren ist, während A2 als Folge der beiden bols ti, te oder als Folge Al, A1 zu lesen ist.
�
tite
A1A1
A
dha
Kippen (1987, 185) gab eine vorläufige Grammatik an, welche die möglichen zulässigen qa'ida-Variationen erzeugt bzw. vorgelegte "Sätze" als passend oder unpassend analysiert. Zusammen mit dem KI-Forscher Bernard Bel erweitete er diese pattern grammar. Eine pattern grammar (Bel o. J; Kippen & Bel !988) zeichnet sich dadurch aus, daß sie aus einer Hierarchie von Subgrammatiken besteht, die eigene Startsymbole besitzen. Die Grammatik enthält folgende Regeln (leicht modifiziert nach Kippen 1987, 185):
246 RND QA16/4 QA16/4 QA16/4
u
GRAM-1 GRAM-1 GRAM-1 GRAM-1
(1) (2) (3) (4)
GRAM-2 GRAM-2 GRAM-2 GRAM-2
u Strukturbestimmung der Variation (1) ORD (2) SlF S2V � (KP CK) ((AlO) CB) * (KP CK) ((AlO) CK) � (Al6) (KP CB) * (Al6) (KP CK) (3) SlV S2F � (Al6) ((AlO) CB)* (Al6) ((AlO) CK) (4) SlV S2V
GRAM-3 GRAM-3 GRAM-3 GRAM-3 GRAM-3 GRAM-3 GRAM-3 GRAM-3
(1) (2) (3) (4) (S) (6) (7) (8)
RND Al6 A16 A16 A16 A16 A16 AlO
GRAM-4 GRAM-4 GRAM-4
(1)
(2)
RND
(3)
A A A
GRAM-S GRAM-S GRAM-S
(1) (2) (3)
RND Al Al
GRAM-6 GRAM-6 GRAM-6 GRAM-6 GRAM-6 GRAM-6 GRAM-6
(1) (2) (3) (4) (S) (6)
ORD KP BP CK CB CT2
(7) CT4
� �
�
Art der Variation SlF S2V SlV S2F SlV S2V
u
Auswahl der möglichen Anordnungen A A A A A A A A A A CK A A A A A A A A A A CT2 A A � A A A A A A A A A A CT4 A A A A � KP CT2 A A � KP CT4 A A A A � A A A A A A A A A A A A A A A A � A A A A A A A A A A
� �
u
�
die bol ti, te oder Al werden ausgewählt
ti te
�
Al u
� �
dhli oder - (Pause) dhä
u
� � �
� � �
feste Muster
dhätitedhli titedhädhä tite tlititetä titetlitli tite dhi n aghina dhlige dhlige tinakina dhlige dhina dhlige
Die Regeln der Grammatik-6 geben die festen Grundstrukturen an. So sind unter der Regel GRAM-6 (2) die zehn resonierend gespielten bol als Anordnung (khuli KP) zu erkennen. Die Regel (3) gibt die 10 bol der Anordnung als nicht-resonierend (band BP) an. Regel (4) und (S) geben entsprechend ftir die 6 bol der Kadenzform die khuli - (CK) oder band Version (CB), während die Regeln (6) und (7) die um zwei bzw. vier bol verkürzten Kadenzen (CT2 bzw. CT4) beschreiben. Die Regeln der Grammatiken 4 und 5 fUhren zu den elementaren bol ti, te, dhli und der Pause "-"
247 Werden die Regeln der Grammatiken 6 und 2 der Reihe (ORD) nach "durchprobiert" bis eine anwendbar ist, so werden die Regeln der Gram matiken 5, 4 , 3, 1 "zufällig" (RND; random) ausgewählt. Die Regeln der Grammatik 3 geben die Art der möglichen Anordnungen an und spezifizieren die in den Regeln 2 angegebenen Strukturen einer Variation. Grammatik 1 legt den Ort der Variation innerhalb der unter suchten qa'ida fest. So gibt ein F nach S1 oder S2 an, daß keine Variati on erfolgt und das V indiziert eine Veränderung innerhalb des entspre chenden "Satzes". Der Doppelpfeil zeigt an, daß sowohl eine Generierung - der synthetische Weg - , als auch ein Parsing - der analytische Weg einer Folge von Zeichen möglich ist. Eine Generierung (Ableitung, Synthese) eines ersten Satzes dieser qä'ida könnte folgende Form annehmen: QA16/4 SF1 S2V ; nach GRAM-1 (2)
(KP CK) ((A10) CB)* (KP CK) ((AlO) CK) ; nach GRAM-2 (2) (dhätitedhä titedhädhä tite CK) (. .. )* (. .. ) (... ) ; nach GRAM-6 (2) (dhätitedhä titedhädhä titedhage dhinaghina) (. .. ; nach GRAM-6 (4) Eindeutig ist die Aufteilung von Sl in die zehn bol umfassende Anord nung und die 6 bol aufweisende - von mir in der Ableitung unterstrichene - vollständige Kadenz (CK) zu erkennen. Alle Vierergruppen werden in diesem Fall resonierend (khuli) gespielt. Um aber ein dynamisches Modell für die Synthese und Analyse zu erhalten, wurde in Zusammenarbeit mit Bernard Bel ein Computerpro gramm, der Bol-Processor, in Form eines wissensbasierten Systems ent wickelt, für das auf in der KI gebräuchliche Techniken flir die Entwick lung von Expertensystemen zurückgegriffen wurde. Das System ist in der Lage, eingegebene Folgen von bols als korrekt bzw. inkorrekt zu klassifi zieren, oder in einem Syntheseprozeß, gemäß der betreffenden Gramma tik, zulässige Formen zu erzeugen. Das System wurde dann, um die Re chengeschwindigkeit der Analyse/Syntheseprozesse zu erhöhen, in As sembler implementiert und wurde u. a. auf einem Apple Ilc erprobt (Kip pen & Bel 1988, 11). Um dieses oder ähnliche Systeme fruchtbar in der ethnologischen For schung einzusetzen, schlägt James Kippen (1987, 187 ff.; vgl. auch Bel 1990b, 199la) einen in vier Abschnitte gegliederten Forschungsprozess vor: Im ersten Arbeitsabschnitt wird aus dem zu untersuchenden Sachgebiet in Übereinkunft mit den Informanten ein zu überprüfender Teilbereich
248 ausgewählt. Zuvor hatte der Forscher dieses Sachgebiet analysiert und dessen vermutete Struktur in einer oder mehreren provisorischen Gram matiken festgelegt, so daß ein funktionsfähiges Computerprogramm erstellt werden konnte, welches in der Lage ist, zulässige Strukturen zu erzeugen bzw. zu erkennen. Die von dem System erzeugte Struktur wird dem Informanten vorge führt, der sie als korrekt oder nicht korrekt klassifiziert. Sollte die angegebene Struktur als inkorrekt bewertet worden sein, wird der Infor mant nach den Gründen befragt und versucht, die Grammatik entspre chend der Angaben des Informanten zu modifizieren. Dieser Prozess wird mehrmals durchgeflih:rt, bis eine befriedigende Grammatik gefunden wur de. Dieser zweite Abschnitt könnte mit dem Begriff der synthetisierenden Forschung treffend charakterisiert werden. Der nächste Schritt kann als der der analytischen Forschung bezeichnet werden. In diesem Abschnitt wird der Informant aufgefordert, Beispiele des zu untersuchenden Bereiches anzugeben, die von dem Computersystem analysiert werden. Sollte es zu Unstimmigkeiten kommen, so ist der Informant in bezug auf die festzustellenden Differenzen zu befragen und die Grammatik entsprechend zu ändern. Nach Abschluß dieser Phase sollten die analytische und synthetische Vergehensweise abwechselnd benutzt werden, um die erreichte Grammatik zu überprüfen. Auch sollten gleiche Informanten zu einem späteren Zeit punkt mit den von ihnen bewerteten Strukturen konfrontiert werden, wo bei besonders darauf zu achten ist, inwieweit die gegebenen Bewertungen differieren und in welchem Maß soziale Umstände oder persönliche Stim mungen dafür verantwortlich sind. Die angegebene Forschungsstrategie wurde von Kippen bei seinen Unter suchungen zur nordindischen tabla-Musik benutzt (vgl. auch Bel 1991a). Aus gangspunkt bildete die qt!i'ida und die von ihm angegebene Grammatik. Sein In formant und Lehrer war Ustad Afaq Husain Khan. Ustad Afaq Husain Khan wurden vom Computer generierte bol-Folgen vorgelegt bzw. gespielt, die Variationen der qt!i'ida sein sollten. Er billigte nur Variationen, in denen die Kadenz (Schlußwendung) mit tite begann, z. B. (Kippen 1987, 189) titetite titedhadha titedht!ige dhinaghina. während Kadenzen , wie titetite titedht!idht!i dhadbidhage dhinaghina oder titetite titedht!idht!i dht!i-dht!ige dhi naghina, welche mit dht!i oder - begannen, von ihm abgelehnt wurden. Im Verlauf weiterer Untersuchungen spielte Ustad Afaq Husain Khan Versio nen, welche in den computergenerierten Folgen nicht vorgekommen waren. Er hatte aber andere Formen als korrekt klassifiziert, ohne darauf auf merksam zu machen, daß weitere Formen bestehen könnten; so waren Formen von titedhäge dhinaghina, denen kein dhädht!i voranging, als zuläs sig betrachtet worden. In seinen Vorspielen stellte er dht!idht!i jedoch häu fig der Folge titedhage dhinaghina voran. Nach einer Besprechung der aufgetretenen Unstimmigkeiten mit Ustad Afaq Husain Khan wurde die
249 Grammatik entsprechend modifiziert (vgl. Kippen 1987, 197). Oie angegebene Grammatik wurde von James Kippen und Bernard Bel er weitert. Dabei wurden nicht nur Grammatiken für im Unterricht verwandte Werke geschrieben. Eine ungefähr 150 Regeln umfassende Grammatik ftir die Aufführung einer improvisierten qä'ida durch Ustad Afaq Husain Kahn wur de von James Kippen und Bernard Bel (1988, 10 u. 17-19) angegeben. Die Arbeiten von James Kippen und Bernard Bel zeigen eine Entwick lung auf, die auch in der Linguistik deutlich wurde. Lag in den 60er und 70er Jahren das Hauptgewicht auf der Entwicklung von "statischen Grammatikmodellen" zur Erforschung natürlicher Sprachen, so verschob sich das Forschungsinteresse seit Beginn der 70er mit den Erfolgen der KI im Bereich der Verarbeitung natürlicher Sprachen zunehmend zu prozeduralen bzw. prozessualen Modellen, was sich auch in der heftig geführten Diskussion zwischen Grammatikern der Chomskyschen Richtung und KI-Forschern zeigt. Auf der anderen Seite wurde mit den zunehmen den Erfolgen der KI das Interesse an sogenannter symbolischer Verar beitung immer stärker, und der Computer wurde nicht mehr allein als number crunching device eingesetzt. Für den musikwissenschaftliehen Bereich sei auf die Arbeiten hingewiesen, die das Auftreten verschiedener Töne, Intervalle etc. in Musikstücken auszuzählen hatten. Auch die psy chologisierenden Interpretationen lassen sich aus der Affinität von KI und Kognitiver Psycholgie erklären, die zunehmenden Einfluß auf die ethnolo gische Forschung ausübt (Baily 1988). Bei den angegeben Grammatiken ist festzustellen, daß sie keine rekur siven Regeln enthalten und nur endliche Mengen erzeugen. Dies hat zur Folge, daß es Entscheidungsverfahren zur Bestimmung der Zugehörigkeit einer Kette zu einer Menge geben muß, da endliche Mengen im allge meinen entscheidbar sind. Auf die Probleme, die bei dem unterschiedli chen Einsatz der Analyse und Synthese entstehen, konnte an dieser Stelle nicht näher eingegangen werden, da das mir zugängliche Papier (Kippen & Bel 1988), in dem diese Problematik erörtert wurde, eine draft-ver sion ist, in der ausdrücklich darum gebeten wurde, sie nicht zum Zi tieren heranzuziehen. Das Problem läßt sich jedoch an dem im Anhang E angegebenen PROLOG-Programm für einen endlichen Automaten illustrie ren. So akzeptiert dieses Programm zwar jede zulässige Zeicbenkette, aber bei der Generierung ergeben sich Probleme, wenn der Schleifen durchlauf am Automatengraphen nicht begrenzt wird. Wie weiterhin zu sehen war, ist die Entwicklung der Grammatik nicht nur von dem zur Verfügung stehenden Formalismus abhängig, sondern besonders von der Mitteilungfähigkeit und Zuverlässigkeit des Informanten. Dieses Problem findet sich im KI Bereich bei der Entwicklung von Expertensystemen un ter dem Schlagwort des Wissenserwerbs (knowledge acquisition) neuer dings diskutiert. Es handelt sich um die Erlangung des für die Entwick lung eines Expertensystems notwendigen Expertenwissens und dessen for-
250 male Aufbereitung, da das Wissen des Experten in vielen Fällen nicht explizit vorhanden ist und erschlossen werden muß. Oft läßt sich auch eine Dis krepanz zwischen den Äußerungen des Experten darüber, wie er ein Pro blem zu lösen glaubt und seinem tatsächlichen Vorgehen feststellen. Auch im Zusammenhang mit der Kognitiven Musikwissenschaft1 wird dieses Problem derzeit diskutiert. Die Arbeiten von James Kippen und Bernard Bel sind der kognitionswissenschaftlichen Forschuni zuzurechnen. Weiterhin läßt sich festhalten, daß bei der Erforschung der rhythmi schen Struktur der tabla-Musik eine hierarchische Gliederung angenom men wurde, die wohl überhaupt bei zeitlichen Vorgängen anzunehmen ist. Ein Ansatz, für den die hierarchische Struktur musikalischer Phänomene das Grundthema bildet und sich die Ideen einer Grammatik der Musik mit Ideen der Kognitiven Psychologie mischen und die musiktheoretische Forschung explizit in die Forschungstradition der Kognitionswissenschaft stellt, ist die generative Musiktheorie von Lerdahl & Jackendoff (1983, 1984 ), welche zwar einen Großteil ihres untersuchten Materials aus der europäischen Musiktradition bezieht, aber auch außereuropäische Musik berücksichtigt. Obwohl es sich bei dieser Theorie um einen linguistisch generativen Grammatikansatz3 innerhalb der neueren musiktheoretischen Forschungen handelt, wurde eine Implementierung einiger Konzepte dieser Theorie in LISP am IRCAM vorgenommen, um ein kompositionsunterstüt zendes System zu entwickeln (Lerdahl & Potard 1986 ). Bevor ich in meiner Untersuchung fortfahre, sollen zunächst die bishe rigen Ergebnisse zusammengeiaßt werden. In den vorangegangenen Kapi teln wurden verschiedene grammatische Konstrukte zur Repräsentation musikalischer Strukturen betrachtet: generative Grammatiken, Lindenmay ersysteme, Graphgrammatiken, pattern grammars und Petri-Netze. Diese formalen Konstrukte wurden zunächst zur Explikation musikwis senschaftlicher Begriffe wie Melodievariation, Kadenz, qä'ida etc. heran gezogen. Gleichzeitig galten sie in den meisten Fällen als Hypothesen über mentale Repräsentationen und der auf ihnen arbeitenden Prozesse. 1) Eine ausführliche Diskussion zwischen Otto E. Laske (New England Computer Arts Accociation; NEWCOMP), Eliot Handelman (Princeton University), Eleanor Evans, Ste· phen Smoliar sowie Robert Rowe (Massachussetts Institute of Technologie; MIT-Media Lab; Music and Cognition Group) um den Status der Kognitiven Musikwissenschaft, die auch als Systematische Musikwissenschaft verstanden wird, und das Problem des knowledge acquisition findet sich seit Ende 1989 in dem Music-Research-Digest. Zu den Ideen Otto E. Laskes vgl. Seifert 1986, 156 ff. 2) Eine ergänzende ausführliche Argumentation findet sich in Seifert 1990, die wieder um von Bernard Vecchione 1990 kritisch diskutiert wird (vgl. außerdem ergänzend Le man 1990
u.
Camurri 1990).
3) Eine detaillierte Besprechung dieser Theorie findet sich in Seifert 1986, 165 ff.; vgl.
auch die kurze Darstellung dieser Theorie in Kap. 2. 1. 2, S. 36 ff. Es soll daher an dieser Stelle nicht weiter auf sie eingegangen werden.
251 Zunehmend trat diese prozedurale Auffassung der Beschreibung musikali scher Strukturen bzw. deren mentaler Repräsentationen in den Vorder grund, die verstärkt mit einer Überprüfung der angenommenen Hypothe sen durch Computersimulationen einherging. Es zeigte sich, daß die Grammatiken eher für philosophisch-theoretische Untersuchungen geeignet sind, die dem Bereich der Kompetenz zuzuordnen sind. Für die Modeliie rung psychologischer Prozesse - der Performanz - scheint, die sich abzeichnende Hinwendung zur Forschungsmethodologie der KI besser geeignet zu sein. Es kann allerdings behauptet werden, daß die Idee der Grammatik als mentale Repräsentation musikalischer Strukturen in den 70er Jahren dominierte, durch die verschiedendsten Formalismen realisiert wurde und in der Monographie von Fred Lerdahl und Ray Jackendoff (1983) kulminierte. Neben den in den vorangegangenen Kapiteln und mei ner Magisterarbeit analysierten Arbeiten sind noch andere Forschungen1 zu nennen, die an dieser Stelle nicht mehr besprochen werden sollen, da seit Mitte der 80er Jahre die Forschungen der Künstlichen Intelligenz, die ebenfalls für die Kognitionswissenschaft zentral sind, verstärkt Einfluß auf die Theoriebildung innerhalb der kognitiven Musikforschung gewinnen� Diese Entwicklung ist vor dem Hintergrund der Teilerfolge zu sehen, welche die Forschungen der Künstlichen Intelligenz seit 1967 u. a. zuneh mend in dem Forschungszweig der Sprachverarbeitung erzielte. Besonders bekannt geworden sein dürfte Terry Winograds SHRDLU. Daß sich der Einfluß dieser Forschungen auf die musiktheoretische Forschung seit Mitte der 80er Jahre verstärkt , zeigt sich u. a. in den Schriften von Curtis Roads2 sowie den vermehrt stattfindenden Tagungen und Kongressen zu dem Thema "Musik und KI".3 Das durch die Idee der Grammatik ausgelöste und durch die KI fort gesetzte und verstärkte Interesse an der Untersuchung mentaler Reprä sentationen geht einher mit einem zunehmenden Interesse an dem Pro blemfeld "Musik und Kognition"4 von musikpsychologischer Seite. Model Iierungen von Wahrnehmungsprozessen mit von der KI bereitgestellten Methoden bilden das Bindeglied zwischen KI, Musiktheorie und Musikpsy chologie. All diese unterschiedlichen Tendenzen konvergieren zu einem kognitionswissenschaftlichen musiktheoretischen Forschungsprogramm in der Kognitiven Musikwissenschaft. Zentral für symbolische ModellierunI) vgl die Übersichten in Baroni 1983 und Roads 198Sa sowie den Kongressband Baroni & .
Callegari 1984; Chen 1983 u. Spitzer 1989 sind neuere musikologische Anwendungen des Grammatikkonzeptes. Auch dürfte ich das Konzept der Grammatik in seinen verschie denen Ausprägungen erschöpfend dargestellt und diskutiert haben. Vgl. auch Seifert 1986. 2) In seinem Artikel (Roads 198Sa) zeigt sich die enge Beziehung zwischen Grammatik und den Konstrukten der Kl, während er in seinem Aufsatz (Roads 198Sb) die Bedeutung der KI für die Musikforschung hervorhebt. 3) e. g. Laske 1989 u. Desain & Honing 1989. 4) McAdams & Deliege 1989; Deliege 1985; McAdams 1987; Dowling & Harwood 1986.
252 gen, aber genau so wichtig für den Bereich der Computermusik, ist - wie sich zeigen wird - die Kenntnis der Programmiersprache LISP.1 Wenn auch die Idee der Grammatik derzeit durch die Kl-Anwendungen verdrängt wird, so kann jedoch nicht davon gesprochen werden, daß sie veraltet sei oder es keine Versuche mehr gebe, diese Idee für die Be schreibung musikalischer Sachverhalte zu nutzen� Es kann daher von zwei Tendenzen in der kognitiven Musikforschung gesprochen werden, die sich gegenseitig durchdringen: Auf der einen Seite sind die "Grammatiker" anzutreffen, auf der anderen ist die Kl. In der von der KI beeinflußten Musikforschung läßt sich - wie ich zeigen werde - eine weitere Spaltung aufzeigen: Es stehen hier die "Konnektionisten" den "Symbolisten" - teils konträr, teils komplementär - gegenüber. Wäh rend die "Symbolisten" sich an der Idee des Physical-Symbol-Systems orientieren und eine funktionalistische Forschungsstrategie betreiben, erweitern und modifizieren die "Konnektionisten" das von McCulloch und Pitts entwickelte Modell des neuralen Netzwerkes, um Modeliierungen durchzufl.ihren, die u. a. an der Funktionsweise des Gehirns orientiert sind.3 Die nächsten Kapitel werden der Darstellung verschiedener Ansätze zur Modeliierung von musikalischen Sachverhalten dienen, die von den sym bolischen Ansätzen der Kl ausgehend zur Kognitiven Musikpsychologie führen werden, um dann von dort wieder zu den subsymbolischen kon nektionistischen Modellierungen der Kl zu gelangen, die derzeit ebenfalls einen großen Einfluß auf die Forschungen der Kognitiven Psychologie haben� Ich werde die weiteren Ausführungen mit einer der frühesten Arbeiten - einem Klassiker - beginnen, die dem symbolischen Ansatz zuzurechnen ist: Terry Winograds (1968) Arbeit zur Musikanalyse.
1) e. g. Rahn 1990 u. Desain 1990. 2) e. g. Bel o. J., 1991a; Chemillier 1990; Spitzer 1989. Zusammenfassende
Überblicke
zu
den Forschungen i m Bereich Grammatik und Musik geben Hughes 1991 sowie Sundberg & Lindbiom 1991. 3) man vgl. z. B. die Debatte in Graubard 1988. Für die Musikforschung sei auf die Ar beiten von Camurri 1990; lischka 1990, 1991a, 1991b und Leman 1989a, 1989c, 1990 ver wiesen. 4) vgl. Schneider 1987.
253 3. 2.
3 . 2. 1 .
Künstliche Intelligenz, Kognitive Musikpsychologie und Musiktheorie Prozedurale Musikanalyse, LISP, Constraints und Jazz
Im vorangehenden Abschnitt über Grammatiken wurde festgestellt, daß die Ebene der Argumentation a) auf die Explikation musiktheoretischer Konzepte gerichtet ist, indem deren Logizität innerhalb eines formalen System betrachtet wird. b) Hiervon zu trennen ist die psychologische Interpretation dieser formalen Systeme, die in enger Beziehung zu c) philosophischen Fragestellungen steht. Schnittstelle bildet häufig Chomskys Konzept der Kompetenz mit der Annahme, daß der Mensch effektive Regelsysteme bzw. äquivalente Sy steme als Repräsentationen seines Wissens über einen Gegenstandsbereich besitzt. Ähnlich ist die Situation auch in der vom Computer unterstützten Forschung, speziell im Bereich der Kl. Auch hier sind die Arbeiten da rauf ausgerichtet a) eine Explikation musiktheoretischer Konzepte zu liefern, al) dies jedoch meist, um damit im Rahmen der Computermusik zu arbeiten. b) Ein anderer Ansatz vertritt den Standpunkt, daß die psychologische Untersuchung des musikalischen Wahrnehmungsprozesses durch Compu tersimulation unterstützt werden kann und die im Rahmen der KI entwickelten Konzepte psychologische Relevanz haben. Hierbei wird - ob bewußt oder nicht - die neomechanistische Annahme vorausgesetzt, daß der menschliche Geist eine Menge rekursiver Regeln sei, bzw. die äquivalente Annahme des Menschen als einem Physical Symbol-System (PSS). Diese Untersuchungen streben im Gegensatz zu den mehr philosophischen Erörterungen im Rahmen der Kompetenz eine Klärung der verschiedensten Phänomene der menschlichen Performanz an. Kognitive Psychologie und KI arbeiten hierfür eng zusammen. Kann im allgemeinen der Einsatz des Computers im Bereich der Com putermusik bis in das Jahr 1956 (Hiller 1956) zurückverfolgt werden und zählte schon 1963 Marvin Minsky in seiner Bibliographie zur KI die Computermusik zum Anwendungsfeld der Kl-Forschung, so soll hier von den Arbeiten ausgegangen w,erden, die aus dem Bereich der KI stammen und als frühe Arbeiten der Kognitionswissenschaft verstanden werden müssen, in deren Tradition neuere musiktheoretische Forschungsarbeiten innerhalb der Kognitiven Musikwissenschaft stehen. Zu diesen, um nur die wichtigsten zu nennen, sind meines Erachtens die Arbeiten von Herbert A. Sirnon (1968, Sirnon & Sumner 1968), einem der Hauptvertreter der Physical-Symbol-System These, Terry Winograd (1968),
254 Christopher Longuet-Higgins und Mark J. Steedman (1971 ), Stephen Smoliar (1980), Rothgeb (1968, 1980), Otto E. Laske (1977, 1986, 1987, 1988, 1990) und Patrick Greussay (1972, 1973, 1985, 1988), sowie weiter hin die Arbeiten von Ulrich (1977) und Mira Balaban (1981) zu zählen. Diese Arbeiten können als Vorstudien zu den am Ende der 80er Jahre verstärkt hervortretenden Forschungen im Bereich zwischen Musiktheorie, Künstlicher Intelligenz, Kognitiver Psychologie und Linguistik betrachtet werden, die zu einem einheitlichen Forschungsansatz in der Kognitions wissenschaft konvergieren. So ist z. B. in neueren Monographien zweier Haupvertreter der Kognitionswissenschaft innerhalb der musiktheoretischen Forschung, der von Longuet-Higgins (1987), welcher KI- und Musikfor schung verbindet, und der von Ray Jackendoff (1987), welcher an der von linguistischen Ideen inspirierten generativen Musiktheorie mitarbeitete, die Hinwendung zur Kognitionswissenschaft zu erkennen. Die verstärkte Hinwendung zur KI -Forschung ist in Zusammenhang mit den Erfolgen zu sehen, die Anfang der 70er Jahre im Rahmen der Sprachverarbeitung sichtbar wurden. Die bekannteste Arbeit ist das SHRDLU-System, welches Terry Winograd im Rahmen seiner Disserta tion (1971, vgl. seine Publikation 1972) entwickelte (vgl. Sampson 1976, 198). Im Zusammenhang mit diesem System wurde die Programmiersprache MicroPLANNER entwickelt, die sich allerdings nicht durchsetzen konnte (Stoyan 1988, 290). Im Vergleich mit PROLOG treten ihre Nachteile hervor. Es kann an dieser Stelle nur die für die musiktheoretische Forschung bedeutendste Arbeit von Terry Winograd (1968) angesprochen werden: Ein Programm zur musikalischen Analyse, das als Vorstudie zu seinem be kannten Sprachverarbeitungssystem SHRDLU entstand. Diese Arbeit Winograds (Winograd 1968) ist an der Schnittstelle von Musik, Linguistik und Künstlicher Intelligenz angesiedelt. Zwei Grundge danken sind für diese Studie besonders hervorzuheben: a) Die Beschreibung der musikalischen Syntax erfolgt durch die von M. A. K. Halliday entwickelte sog. Systemische Grammatik (Sampson 1976, 198 ff.). Damit einher geht die Ablehnung der Phrasenstrukturgrammatiken und deren um Transformationen erweiterterte Formen als Beschreibungs mittel musikalischer Strukturen (Winograd 1968, 6-9). b) Es gab eine Implementierung der Grammatik in LISP, um Analysen mittels "semantisch" gesteuertem Parsing (Winograd 1968, 6 u. 43) durchzuführen. Das Ziel Winograds ist die harmonische Analyse der tonalen Struktur verschiedener Kompositionen. Es wird hierfür - mit ähnlicher Zielsetzung wie bei Pylkkö (1988; vgl. Kap. 3 . 1 . 1 , S. 174 ff. ) - eine Grammatik der tonal harmony aufgestellt, deren formaler Rahmen durch Hallidays systemische Grammatik bereitgestellt wird. Der Vorteil dieser Form von Grammatik liegt in der Verarbeitung der Erkenntnis, that the form of a sentence may be the result of several systems operafing simultaneously (Winograd 1968, 10 ).
255 Gerade die Interaktion verschiedener musikalischer Systeme ist, wie Fred Lerdahl und Ray Jackendoff (1983) herausgearbeitet haben, für mu sikalische Strukturen charakteristisch. Ihre Allgemeinheit erhält die systemische Grammatik dadurch, daß die Struktur der Grammatik abgekoppelt wi rd von der Struktur der von ihr erzeugten Sätze. So wird bei der systemischen Grammatik davon ausge gangen, daß sie in abstrakter Form mit den wesentlichen Merkmalen der zu charakterisierenden Strukturen arbeitet, ohne die Form der Realisie rungen zu betrachten. In diesem Sinne gliedert sich die systemische Grammatik in zwei Bereiche: a) ein System zur Beschreibung von Abhängigkeitsgefügen; b) Realisierungsregeln, welche Form und Konstituenten der durch die Regeln beschriebenen Abhängigkeiten näher beschreiben, wobei die Konstituenten wiederum den Eingang zu einem weiteren Sy stem-Netzwerk bilden können. Um die Abhängigkeitsbeziehungen zu beschreiben wurde eine Symbolik entwickelt (Winograd 1968,45 ff.), von der hier einige Symbole mit Hinblick auf den darzustellenden Teilbereich der systemischen Grammatik harmonischer Strukturen näher erläutert werden sollen: Das Auftreten einer Einheit A kann abhängig sein vom Auftreten der Einheit B. Die graphische Darstellung erhält folgende Form und ist zu lesen als A ist bedingt durch (ist
--· --
-------
abhängig von) B:
Es besteht auch die Möglichkeit der notwendigen Auswahl. Wenn A auftritt und zwischen B, C oder D ausgewählt werden muß, so ergibt sich folgende Darstellung , die als A ist bedingt entweder durch B oder
C
oder
D zu lesen ist:
Soll nach der Wahl von A eine gleichzeitige Folge von Auswahl möglichkeiten bestehen, dann er gibt sich A ist gleichzeitig be dingt durch entweder B und entweder D oder E:
oder
C
Es muß also nach Wahl von A sowohl aus B, C und D, E ausgewählt werden.
256 Die Realisationsregeln (Winograd 1968, 47), von denen ich emtge ange be, haben die Aufgabe der näheren Bestimmung von Teilstrukturen der durch die Regeln der eigentlichen systemischen Grammatik beschriebenen Systeme. Ihre Interaktionen haben folgende Bedeutung: +A bedeutet, daß eine Konstituente mit der Funktion A zur Struktur hinzugef ügt wird. AoB ist die Konkatenation (Verkettung) von A und B: Zuerst A dann B, oder A vor B etc. As gibt eine Einschränkung von A durch B an. Werden Subskripte düfch Kommata getrennt, handelt es sich um mehrere Einschränkungen, die geltend gemacht werden.
Eine systemische Grammatik kann verstanden werden als ein System bestehend aus Netzwerken von Teilsystemen zur Bestimmung der Abhän gigkeiten von interagierenden charakteristischen Merkmalen eines Gegen standsbereiches. Um die Prinzipien der harmonischen Struktur zu be schreiben, unterscheidet Winograd fünf Klassen, die durch jeweils fünf Netzwerke beschrieben werden: Komposition, Tonalität, Akkord-Gruppe, Akkord und Note. Wegen der Komplexität dieses Systems gehe ich im folgenden nur näher auf das Kompositions-Netzwerk und das Noten-Netzwerk ein, für die anderen Netzwerke muß auf die Originalarbeit verwiesen werden. Eine Komposition wird als Realisierung einer durch Konkatenationen von Tonalitäten entstandenen Struktur begriffen, die durch Tonart und Grund ton bedingt ist. In der von Terry Winograd (1968, 1 4 ) angegebenen Nota tionsweise wird dies wie folgt dargestellt:
composition
Realiz.ations:
(
Composition :: T- (T) -
�
major minor
root
... - (T)
mode, root :: These features are realized through the •K• system
Constituents:
T :: TonalitYsimple , T
Wie zu sehen ist, wird eine Tonart entweder durch Dur oder Moll bedingt. "•K•" gibt die relative Tonart an (Winograd 1968, 22), deren Bestimmung durch die anderen Netzwerke geschieht. Hiermit wird der funktionalen Bestimmung eines Akkordes innerhalb einer hierarchischen Tonalitätstruktur Rechnung getragen. So kann bekanntlich der Akkord C in B-Dur als V (Dominante) von der neuen Tonika I F-Dur, die aber in B-Dur V ist, verstanden werden.
257 Das Tonalitäts-Netzwerk ist bedingt durch einen .I.Y.Q, einen relativen Grundton, eine Tonart und den Grundton. Zu berücksichtigen ist jedoch, daß Winograd (1968, 48) den Begriff der Tonalität in doppelter Bedeu tung verwendet, und zwar zum einen im Sinne von "ein Stück zeigt die Tonalität C-Dur" zum anderen bezieht er sich auf eine Folge von Akkor den, die sich einfach auf die Tonalität C-Our beziehen lassen. Er spricht dann auch von einer " Tonalitiit mit Grundton C und Tonart Dur". Das Netzwerk für die Akkordgruppe wird näher bestimmt durch ihren bQ. und den relativen Grundton. Unter letzterem werden Folgen von Umkehrungen eines Akkordes, nicht im Rahmen der Kadenzidee bestimm bare Akkordfolgen oder ein Akkord verstanden. Ein Akkord-Netzwerk ist bedingt durch den Grundton. die Linearität und die Art. Der Art nach können z. B. nichtharmonische von harmoni schen Tönen unterschieden werden, unter diesen wiederum Dreiklänge von Vierklängen und ihre entsprechenden Umkehrung betrachtet werden etc. Mit dem Linearitätssystem sollen im wesentlichen solche Aspekte wie Vorhalte, Durchgangsnoten usw. behandelt werden. Der Grundton dient dem Akkordaufbau und der Benennung des Akkordes. Das Noten-Netzwerk ist abhängig von der Diatonik, der Chromatik und der Oktave. Eine Note wird durch den Namen, ihre Oktavlage und ihre "chromatischen" Veränderungen bestimmt. Die Beschreibung durch die Grammatik soll für die Note angegeben werden!
Rcatizations: Note
:: name
.
dia.tonic :: Specifies
note
{
0
modificat ion namo:
•
c,
1
. ootavo •
d,
....
6
•
h
ohromatic :: Operatos wlth diatonic to speeify
octave
•1
namo, between chromatic
chromatic
E
� 6
•2 0
-1
•
• •
doublesharp, natural, flat, -2
•
•
doublo
and f(diatonic). sharp flat
oc·tave = Specifies octave of note
Winograd codiert die normale Darstellung der einzelnen Tonhöhenereig nisse der Notennamen durch eine Zahlendarstellung. Die normale diatoni sche Durskala auf dem Ton c bildet den Ausgangspunkt der Codierung: c = 0, d = l , e = 2, .. , a = S, h = 6 .
I) nach Winograd 1968, 18.
258 Die chromatische Skala dient der weiteren Zuordung von Notennamen und Zahlen, wobei eine Zuordnung von 0, 1 , ... , 11 erfolgt. Die folgende Tabelle gibt die Beziehung der Zahlen der Chromatik zu den für die Diatonik gebräuchlichen Notennamen an und entspricht in wesentlichen Punkten der von Terry Winograd (1968, 21) angegebenen Zuordnung: Notenname: Diatonik: !(Chromatik): Chromatik:
c 0 0 0 I 2
d I 2 c * d
e 2 4 3 4 5
f 3 5 * e f
g 4 7 6 7 8
a 5 9 * g •
h 6 11 9 10 11
a • h
Der Joker "•" wird, abhängig vom Zusammenhang, als Bezeichnung für die Erhöhung oder Herabsetzung eines Tones der Diatonik aufgefaßt. Dies geschieht dadurch, daß die Chromatik im Zusammenhang mit der Diatonik operiert, um einen Notennamen zu bestimmen. Es werden deshalb zwei Zahlen benötigt, um einen Notennamen darzustellen: So gibt z. B. die 4 Terry Winograd (1968, 32) kodiert die "in des Punktepaares (4 . 8) terne" Darstellung eines Tones in LISP durch Punktepaare (dotted pairs) , in bezug auf die Diatonik den bekannten Tonnamen "g" an. Ob eine Alterierung vorgenommen wurde, wird aus der zweiten Zahl ersichtlich, die sich auf die Chromatik bezieht und in diesem Fall "gis" bezeichnet. Wird das Punktepaar (5 . 8) genommen, so ergibt sich "as" als Bezeich 9) ergibt den Namen "a". Um die Ok nung des betreffenden Tones; (5 tavlage eines Tones zu kennzeichnen, werden weitere Zahlen benutzt. In der LISP-Repräsentation wird ein Punktepaar gebildet, das an erster Stelle die die Oktave kennzeichnende Zahl enthält und an zweiter Stelle das den Tonnamen kennzeichnende Punktepaar.1 Nehmen wir folgende Kodierung der Oktavumfänge2 an: -
-
.
0 1 2
3 4 5 6
Große Oktave Kleine Oktave Eingestrichene Oktave Zweigestrichene Oktave Dreigestrichene Oktave Dreigestrichene Oktave Fünfgestrichene Oktave
c c
Cl c2 c3 c4 es
Winograd scheint diese Kodierung anzunehmen. Sollte diese Annahme 1} Zur Notation der dotted pairs in LlSP vgl. Kap. 2. 2. 4. 2. 3. 4, besonders S. 151 ff. 2} vgl, auch Kap. 3. I. 2, S. 195.
259 richtig sein, ist allerdings das H1 der Kontraoktave, das in Schuberts Op. 33 No. 7 (s. auf der übernächsten S. 261 in den Takten 3, 4, 9, 10 der Auftakt wurde nicht mitgezählt) auftritt, nicht mehr kodierbar. So wird das F der Kleinen Oktave aus Takt 1 und Takt 2 in den Listenele menten 4 und 6 an erster Stelle ohne Auslassung "0" angegeben. Ebenso befindet sich aber auch die Kodierung von H1 aus Takt 3 , 4 an der er sten Stelle der Listenelemente 9, 11 des kodierten Werkes. Nimmt man an, daß es sich um die versehentlich durchgeführte Eingabe von h han delt, so löst sich das Problem. Dies wird bestätigt durch die Kodierung der Takte 10, 11 durch die Listen 22, 23 der Werkliste, in denen ein "h" fehlt. Es finden sich statt der laut Notation zu erwartenden drei "h"'s nur zwei. Nur die Annahme, daß Hl nicht kodiert wurde, ermöglicht eine konsistente Kodierung nach den anderen, von Winograd angegebenen Prinzipien. Dieses kleine Problem läßt sich allerdings leicht beheben. Die von mir angenommene Interpreta tion der Zahlen für die Oktavrepräsentation ergibt z. B. für den Ton a1 in LISP die Darstellung durch das Punktepaar (2 . (5 . 9)), und für den Ton ces (1 . (0 . 11)). Allgemein läßt sich die in der Grammatik angegebene Charakterisierung einer Note in LISP durch folgenden Aufbau beschreiben: -
(Note) ::= ((Oktave) . «Diatonik) . (Chromatik)))
Terry Winograd (1968, 31) wählte LISP als Sprache zur Implementie rung der Grammatik tonaler Strukturen, da mit komplexen Datenstrukturen1 wie Listen, Bäumen etc. gearbeitet werden kann, welche es ermöglichen, den rekursiven, hierarchischen Aufbau der harmonischen Struktur darzustellen. Da für die Bestimmung eines Akkordes seine Funktion innerhalb eines Kontextes und nicht seine Struktur von wesentlicher Bedeutung ist, muß
1) Patrick Greussay (1973) untersuchte in seiner Dissertation die für die Erforschung musikalischer Strukturen benutzten Datenstrukturen. Er stellte fest, daß es sich bei den am häufigsten eingesetzten Datenstrukturen um die Typen array (Matrix), string
(Zeichenkette) und Jist (Liste) handelt. Darüberhinaus stellte er fest, daß die Liste für
musikalische Untersuchungen die flexibelste und bestgeeignete !Datenstruktur ist, wenn es sich um Manipulationen an symbolischen Darstellungen von Musikwerken handelt. Vgl. hierzu ebenfalls neuerdings Desain 1990 u. Rahn 1990.
260
bei der Analyse - dem Parsing - von semantischen Heuristiken Gebrauch gemacht werden, um den Analysevorgang zu beschleunigen und aus den möglichen Analysen die "beste" auszuwählen, da die Möglichkeit konkur rierender Lesarten eines Stückes besteht. Winograd (1968, 23) illustriert dies an der Akkordfolge:
Wird C-Our als primäre Tonalität angenommen, so sind trotzdem noch mehrere Interpretationen möglich. Einerseits als Folge VI V I in bezug auf C-Our, aber auch als II V I in C-Our, indem eine Modulation oder Ausweichung - Winograd spricht von sekundärer Tonalität - nach G-Dur angenommen wird. Weiterhin ist eine Interpretation als Folge I Durch gang 111 möglich, wenn als sekundäre Tonalität a-Moll angenommen und der zweite Akkord ais Durchgangsakkord verstanden wird. Es sind noch verschiedene andere Interpretationen möglich. Um eine brauchbare Inter pretation zu erhalten, muß der Kontext der gesamten Komposition ver folgt werden, denn auch wenn man das Fortschreiten VI V I als Inter pretation akzeptierte, so kann es sein, daß die angenommene Tonalität C-Dur im Kontext der gesamten Komposition eine sekundäre Tonalität ist. Um eine Auswahl aus den möglichen Interpretationen der Akkordfort schreitungen einer Komposition zu erhalten, nimmt Winograd folgende drei Grundprinzipien an, die als semantische Heuristiken den Analysevor gang leiten, um verschiedenen Analysen einen Plausibilitätswert zuzuord nen. Bei diesen drei Grundprinzipien handelt es sich um (1) die Aufein anderfolge in der Fortschreitung, (2) die Klarheit der Funktion und (3) die Komplextität des Parsing. Im Fall der Aufeinanderfolge in der Fortschreitung ist z. B., wenn zwischen den Interpretationen V--" V --" I und VI --" Durchgang --" I ge wählt werden soll, die erste vorzuziehen, wenn wie üblich die authenti sche Schlußwendung V --" I als grundlegendes Fortschreitungsprinzip ange nommen wird. Die Klarheit der Funktion eines Akkordes bezieht sich auf die Interpre tation seiner Position innerhalb der Tonalitätshierarchie. Sie sollte, wenn möglich, auf der niedrigsten möglichen Ebene innerhalb der Hierarchie bestimmt werden. So ist die Interpretation des C-Our-Akkordes als IV von V von C-Dur nur unter bestimmten Bedingungen anzunehmen. Im einfachsten Fall wäre er als I der Tonalität C-Our zu verstehen. Als Komplexitätsmaßstab iür das Parsing nimmt Terry Winograd die Schach-
261 telung der Tonalitäten der Analyse eines Werkes an. Bei zwei konkurrie renden Interpretationen ist diejenige vorzuziehen, welche eine niedrigere Schachtelungstiefe aufweist. Nachdem die Grundideen von Terry Winograds Grammatik vorgestellt wurden, soll ein Beispiel folgen, aus dem ersichtlich wird, wie die Eingabe in das LISP-Programm erfolgte, die Ausgabe nach der Analyse aussah und wel che Probleme auftraten. Als Beispiel soll Schuberts op. 33 No. 7 dienen.
Oie Werke wurden in LISP als eine Liste von Listen dargestellt, wobei die erste Liste den Komponisten und Titel des Werkes angibt. Die zweite Liste enthält die Vorzeichen des Stückes. Das erste Element - "fl" für flat oder "sh" für sharp - gibt an, daß die folgenden Elemente dieser Liste, die Namen der zu verändernden Töne, um einen Halbtonschritt zu erhöhen bzw. zu erniedrigen sind. Die weiteren Listen geben die einzel nen Akkorde des Stückes an, indem sie die Tonnamen des betreffenden Akkordes vom tiefsten zum höchsten zu bezeichnenden Ton als Elemente enthalten. Die Oktavlage der in diesen Listen auftretenden Tonnamen wird - wenn nötig - durch ein vorangestelltes "0" genauer bestimmt. Hierbei wird davon ausgegangen, daß die folgenden Töne sich in der Großen Oktave befinden, wenn zu Beginn der Liste kein "0" auftritt. Winograd ft.ihrt dies zwar nicht explizit an, es ist aber aus der Darstel lung der von ihm (Winograd 1968, 35) angegebenen Werke zu erschlies sen. Ein "0" gibt das Überspringen einer Oktave an, z. B. wird die Große Oktave ausgelassen und die Töne befinden sich in der Kleinen Oktave. Mehrere aufeinanderfolgende "O"'s geben dementsprechend Aus lassungen um die Anzahl der auftretenden "O"'s an. Die angegebene Darstellungsform soll noch einmal am Beispiel eines Werkes von Schubert verdeutlicht werden:
262
( (Schubert op 33 no 7) (fl h e) (0 0 f h d) (f 0 f h d) (. .. )
:11
(0 0 (a.fl) h f) ( .. ) .
11: ·t
:11
Komponist und Werkbezeichnung werden in der ersten Liste angege ben. Die Vorzeichen des Stückes, in diesem Fall b und es, werden in der zweiten Liste, durch Tiefalterierung von h und e, indiziert durch "fl", angeführt. Es folgt der Akkord des Auftaktes und der erste Akkord des ersten Taktes. Zu sehen ist in dieser Liste der angezeigte Sprung um zwei Oktaven von der Großen Oktave in die Eingestrichene Oktave. Es werden zwei Oktaven - die Große und die Kleine Oktave - ausgelassen. Die in der ersten Liste angegebenen Namen "f", "h" und "d" bezeichnen also die Töne fl , h1 und d2• Die Töne des zweiten Akkordes, welche durch die Buchstaben der folgenden Liste bezeichnet werden, sind F, f� h 1 und d2 • In der nächsten angegebenen Liste ist die Darstellung des ersten Akkordes des zweiten Teiles des Schubertschen Tanzes angegeben. In dieser Liste ist eine weitere Liste - genauer ein weiteres "dotted pair" (a fl) - zu erkennen, mit der ein um einen Halbtonschritt alte riertes a1 also ein as \ bezeichnet wird. Insgesamt ergibt sich als Ein gabe des gesamten Werkes, welche das Argument der Funktion "Explain ( input)" bildet, folgende Darstellung - (die Bezeichnung des Tones h durch "h" ist wie in Amerika üblich durch "b" ersetzt; Winograd 1968, 35): .
EXPLAIN(( (SCHUBERT OP 33 NO 7) (FL B E) (0 0 F B D) (F 0 F B D) (0 F E F A C) (F 0 F A C) (0 F E F B D) (0 F E F C E) (B 0 F D F) 0 F D F B D) (B 0 F D F) (0 F D F B D) (F 0 F B D) (0 F E F A C) (F 0 F A C) (0 F E F G B) (0 F E F A C) (B 0 F B D) (0 F B D F B) (B 0 D F B) (0 0 (A.FL) B D) (B 0 (A.FL) B F) (0 B F (A.FL) B D) (B 0 (A.FL) B F) (0 B F (A.FL)B D) (E E 0 (A.FL) B F) (E B E G B E) (0 C G C G E) (0 D G (B.N) F G D) (0 E G C E G C) (F 0 D F C) (0 F B D F B) (F 0 D F) (0 F B D F B) (0 F B D F C) (F 0 E F D) (0 F A E F C) (B F B D F B)) )
263 Das Programm lieferte nach Durchführung der Analyse Strukturbeschreibung (Winograd 196 8, 39 ):
die
folgende
(134 BUILT 82 KEPT) ( (SCHUBERT OP 33 NO 7) (I (64 64) (I)) (V (7) (I)) (V (53 PASSING PASSING) (I)) (I (53 64 53 64 64) {I)) (V (7) (I)) (V (53 AUX) (I)) (V (7) (I)) (I (53 64 53) (I)) (V (42 CONT2 7 CONTI 7 ANTIC) (IV I)) (IV (53) (I)) (II (53) (I)) (V (43) (II I)) (II (6) (I)) (SUSP (65) (I)) (I (64) (I)) (111 (6) (I)) (I (64 NIL PASSING) (I)) (V (7) (I)) (I (53) (I)) ) (TIME 160) bzw. (Winograd 1968, 40):
f
I� .,
:
: :
I�
< j
I
Schubert: Deutsche Tänze, Op. 33, No. 7
<
V? V p p
I
<
I
:e/� Ii it-V�:tI-#-
�
IV ( Vt V1
� V1
�
I
I
VAux.V7 I I� I I
I
i•· .........
•+ 'P ... ..
...
..
... ...
..
I
: V ,....
I
:
Wesentlich an dieser Darstellung ist die indirekte Bezugnahme auf andere Tonarten. So wird die zweite Umkehrung des Septakkordes - die Quinte liegt im Bass - des Übergangs nach c-Moll in folgender Weise dargestellt: (V (43) (li 1)). Die II bildet die "sekundäre Tonart'; auf die sich die V bezieht. Da I B-Dur ist, handelt es sich bei II als neuem Bezugspunkt I um c-Moll. Die V bezogen auf II als neuer I ist dann in diesem Fall der G-Dur-Akkord mit kleiner Septe (vgl. Winograd 1968, 19 u . 33). Terry Winograd (1968, 37 u. 42) diskutiert einige Ungenauigkeiten der Analysen und ihre Ursachen, von denen hier nur einige angesprochen werden sollen: Die Eingabe für das Programm besteht aus einer Folge von Akkorden. Folglich muß der Notentext entsprechend aufbereitet werden. Dies bedeutet, da keine Kriterien angegeben wurden, daß die Aufbereitung von den Intuitionen der eingebenden Person abhängt. Dies führte zu den Akkordwiederholungen I64 im ersten Teil des Stückes, die besser als Teile der umliegenden Akkorde zu lesen wären. Ein anderes
264 Problem ergab sich aus der in der Grammatik gemachten Annahme, daß unvollständige Akkorde immer die Terz enthalten und so z. B. der Ak kord in Takt 3 nicht als Septakkord V7 f-(a)-c-es der Grundtonart B-Dur erkannt wurde, sondern als Durchgang dem von Winograd (1968, 13 u. 1 7 sowie 2 1 ) als Linearitätssystem bezeichneten System zugerechnet wurde. Das von Winograd entwickelte System war zur harmonischen Analyse einfach strukturierter, möglichst homophon gesetzter Werke ausgearbeitet worden, ohne andere Parameter zu berücksichtigen. Hier macht sich besonders die Abtrennung des rhythmisch-metrischen Aspektes negativ bemerkbar, so daß eine Behandlung rhythmisch komplexerer Werke erforderte, daß die Grammatik (Winograd 1968, 42) would have to be greatly modified. Terry Winograd (1968, 43) vermutet, daß die Probleme, die sich flir die Entwicklung eines Parsers für musikalische Strukturen ergeben, grös ser sein könnten als für Parser natürlicher Sprachen: A complete parsing system for music would be ex;tremely complex:, and might even be more difficult than a system for natural language, since the semanties (and even syntax:) of music is ex:tremely elusive once we leave simple areas such as harmonic structure. However it is important to realize that the applications of linguistic principles to music can be of great value without attempting to achieve this goal. The formalization of its syntax: into an ex:plicit gramma.r (even a partial grammar) can give insight into the way in which the resources of music interact and combine in structures.
Als Terry Winograds Ziel kann die Explikation eines Teiles der harmo nischen Theorie der klassischen Musiktheorie - speziell in der von Allen Forte (1962) dargelegten Form - verstanden werden. Insofern sind natür lich keine neuen musiktheoretischen Einsichten zu erwarten. Vielmehr liegt das Verdienst in der Herausarbeitung des prozeduralen Charakters der musikalischen Analyse, und, noch wesentlicher, in der Berücksichti gung "semantischer" Aspekte der harmonischen Struktur eines Werkes, die das Parsing steuern� Es muß an dieser Stelle allerdings darauf auf merksam gemacht werden, daß der hier gebrauchte Semantikbegriff nicht mit dem in der musikwissenschaftliehen Forschung gebräuchlichen iden tisch ist, in dem Probleme der musikfremden Bedeutung - der Referenz - und das Auftreten und Verschwinden der Denotation durch musikalische Strukturen in der Semiosis von Interesse sind, wie sie z. B. Vladimir Karbusicky (1986, 1988) mit strukturalistisch-semiotischen Methoden nä her untersucht. Auch impliziert der von Winograd vage gebrauchte Se mantikbegriff nicht eine Interpretation wie die der sogenannten Formali sten in der Musik, die den Standpunkt vertreten, daß die Funktionalität der Akkorde die Semantik von Musik sei. Die technische Frage, die sich ähnlich wie bei der Sprachanalyse auch I) vgl. z. B. Charniak & MeDermoll (1985, 169-174) zu dem Verhältnis von Syntax und Semantik für das Parsing der natürlichen Sprache.
265 f\.ir die musikalische Analyse stellt, lautet, wieweit syntaktische und seman tische Aspekte Einfluß auf die Analyse haben. Läßt sich eine syntaktische Analyse zugunsten einer semantischen Analyse weitgehends ausklammern? Wie interagieren die beiden Analyseaspekte, wenn sie parallel, wie z. B. im blackboard-Model1,1 benutzt werden? Für die musikwissenschaftliche Forschung stellt sich, anders als in der Sprachwissenschaft, das Problem der Identifizierung der "syntaktisch-se mantischen" Entitäten. In der Sprachforschung kann z. B. intuitiv etwas über die verschiedenen Bedeutungen eines Verbs ausgesagt werden, so daß die Semantik identifizierbar ist. Wie aber ist es in der Musik?2 Weiterhin bleibt zu fragen, inwieweit schon bei der harmonischen Analyse eine Interaktion mit dem rhythmisch-metrischen System erfolgt. So geht gerade die neuerdings entwickelte generative Musiktheorie (Ler dahl & Jackendoff 1983) von der rhythmisch-metrischen Analyse als grundlegend für die weitere Analyse aus und macht darüberhinaus auf die Interaktion der verschiedenen Teilsysteme aufmerksam. Auf Implementie rungsversuche dieses theoretischen Ansatzes durch Jones, Miller und Scarborough (1988) im Rahmen des blackboard-Modells werde ich in dem Kapitel 3. 2. 7, S. 332 ff. näher eingehen. Winograds Arbeit kann als klassisch für die komputationelle Analyse musikalischer Strukturen mit Methoden und Ideen wie dem Einsatz der Sprache LISP und dem "semantisch" geleiteten Parsing aus dem For schungsbereich der Künstlichen Intelligenz angesehen werden. Ging er in seiner Arbeit (Winograd 1968) nicht explizit darauf ein, inwieweit das Verständnis von berechenbaren Vorgängen in Beziehung zum Verständnis der Kognition steht, und umgekehrt der Versuch des Verstehens kognitiver Vorgänge Einfluß auf die Entwicklung von Compu tern ausübt, so nimmt er in einem neuen Buch, das er zusammen mit Flores schrieb, hierzu Stellung.3 Das Verständnis, das jedoch von ihren Gründungsvätern Marvin Minsky, Allen Newell, John McCarthy und einigen anderen Forschern wie Arthur W. Burks, Herbert A. Simon, u. a. mit dem Entstehen dieses Wissen schaftszweiges verbunden war, daß nämlich die Künstliche Intelligenz als Instrument der wissenschaftlichen Erforschung des menschlichen Geistes 1) vgl. Kapitel 3. 2. 7., S. 332 ff. 2) Es handelt sich hierbei um die Fragestellung nach der Segmentierung von akusti schen Ereignissen zu abgrenzbaren Einheiten bzw. deren exakter Charakterisierung des zugrundeliegenden Prozesses (vgl. die verschiedenen konvergierenden neueren Forschun gen aus Kognitiver Psychologie, Psychoal<.ustik, Künstlicher Intelligenz und generativer Musiktheorie: e. g. Chew et al. 1982; Baker 1989a, 1989b; CamiUeri 1990; Deliege 1985, 1987; Kaden 1978; Lerdahl & Jackendoff 1983; Levy 1976; McAdams 1984; McAdams & Bregman 1979; Wright & Bregman 1987; Perone 1985). 3) Winograd und Flores 1989 formulierten ihre Kritik mit Bezug auf die europäische hermeneutische Denktradition, speziell die Existentialontologie Martin Heideggers.
266 dient, trat erst in den 70er Jahren verstärkt ins allgemeine Bewußtsein innerhalb der Forschung und kulminierte in der Konzeption der Kogniti onswissenschaft 1 und der Physical-Symbol-System-These. Bis zum Ende der 70er Jahre findet man in der von der KI kom putationell gestützen Musikforschung nur selten den Bezug auf kognitive Phänomene. Die Arbeiten von Otto Laske (1977) und der Edinburgher Forscher Steedman und Longuet-Higgins (e. g. Steedman 1973; Longuet Higgins & Steedman 1971) bilden die Ausnahme. Zu Anfang der 80er Jah re wurde explizit von KI-Untersuchungen zur Musik gesprochen (e. g. Meehan 1980; Levitt 1981; Roads 1985). Der Bezug auf die Kognitions wissenschaft2 ist neu. Im Vordergrund stand zu Beginn die Idee der Explikation und exakte ren Fassung bisheriger musiktheoretischer Konzepte. Bevor ich genauer darauf eingehe, sollen die Ergebnisse weiterer Arbeiten skizziert werden. Meehan (1980) schlägt vor, fl.ir musiktheoretische Untersuchungen die conceptual dependency theory von Schank heranzuziehen. Leider vertieft er diesen Vorschlag nicht. Ulrich (1977) und Levitt (1981) beschäftigen sich mit der Anwendung von Ideen aus dem Bereich der Künstlichen Intelligenz im Rahmen der Untersuchung von Jazz-Musik. Ulrich (1977) legt bei seiner Computerstudie zur Jazzmusik, ähnlich wie Mark Steedman3 (1984), als theoretischen Rahmen die von Coker (1985) dargestellte Theorie zugrunde. Sein Ziel ist die Generierung von improvi sierten Melodien zu einer mit Akkordtönen unterlegten Melodie, dem Thema. Das zentrale Problem besteht darin, daß die neuen Melodien zu den Akkordfolgen passen müssen. Um dies zu erreichen, ist zuerst eine Analyse der harmonischen Struktur nötig. So müssen die Akkorde, ihre Funktionen, und die entspechenden Tonalitätszentren bestimmt werden. Danach werden zu den ensprechenden Akkorden bzw. Akkordfolgen passende Skalen ermittelt, die das Material für die melodische Improvisation bereit stellen. Diese Skalen werden benutzt, um das abstrakte melodische Material in Folgen von Tönen zu transformieren, die zu den Akkordfolgen des ent sprechenden Stückes passen. Ulrich (1977, 870 u. 871) versteht unter dem abstrakten Material das von ihm eingeführte Konzept des abstrakten Motivs, das eines ist, bei dem von rhythmischer Struktur und harmoni schem Bezug abgesehen wird. Diese abstrakten Motive gilt es in Folgen 1) In Bobrow & Collins 1975 wird dieser Terminus (Cognitive Science) zum ersten Mal in systematischer Bedeutung benutzt, obwohl er schon 1973 von Longuet-Higgins in seinem "Comments on the Lighthili Report" (wieder abgedruckt in Longuet-Higgins 1987, 44-46; dort 46) benutzt wurde.
2) Die Bedeutung der Kognitionswissenschaft für die musikwissenschaftliche Forschung wird diskutiert in: Agmon 1990; Camilleri 1986; Lischka 1987; McAdams & Deliege 1989: Seifert 1986, 1990; Vecchione 1990. 3) vgl. die Darstellung in Kap. 3. 1. 1., S. 174 ff.
267 von Tönen zu transformieren, die zu den Akkordfolgen des entsprechen den Stückes passen. Die rhythmische Struktur der Melodie muß von Hand hinzugefügt werden. Anders als Winograd verzichtet er bei der Repräsentation der einzuge benden Akkorde auf die absolute Tonhöhe der einzelnen Akkordtöne und gibt nur einmal den Namen der oktaväquivalenten Töne an, und zwar beim tiefsten Ton beginnend nacheinander bis zum höchsten. Aber er nimmt die Dauer eines Akkordes mit in die Repräsentation auf, indem er davon ausgeht, daß ein Akkord mindestens eine Viertelnote lang klingt und es nur ganze Vielfache dieser Dauer geben kann. Ein Akkord wird wieder in Form einer Liste repräsentiert. An Ulrich anknüpfend entwickelt Levitt (1981, 1983) ein System, wel ches ebenfalls zu einer vorgegebenen Melodie mit unterlegten Harmonien melodische Improvisationen durchführt. Levitt (19 81, 18) versteht die Melodie und die Harmonien eines vorgegebenen Stückes als Einschrän kungen (constraints), welche den Variationen der ursprünglichen Melodie einen gewissen strukturellen Rahmen auferlegen. Die Idee der constraints spielte Ende der 70er Jahre in der Entwick lung von neuen Programmierkonzepten und -sprachen eine bedeutende Rolle am MIT.1 Die Grundidee des Constraints-Konzeptes2 läßt sich leicht verstehen, wenn man an Gleichungen wie x + y z denkt, wobei die Variablen für natürliche Zahlen stehen. Betrachtet man den Additions operator als Constraintbox, so können bestimmte Endwerte geliefert wer den, wenn einige Werte gegeben sind. So kann z. B. bei 2 + 3 = z der Wert von z bestimmt werden, oder 2 + y = S erlaubt die Bestimmung des Wertes von y. Die Zahlen schränken also den Bereich der möglichen Werte ein und erlauben eine Bestimmung derselben (Winston & Horn 1989, 336). =
2 5
? ?
1) Am Media-Lab des MIT (Massachusetts Institute of Technology), einem aus aus 11 Forschungsabteilungen (s. Brand 1990, 32-33) bestehenden Institutes, bildet die Idee der auf constraints basierenden Computersprachen einen zentralen Forschungschwerpunkt. Auch die von Tod Machover und Berry Vercoe geleitete und mit 150 000 Dollar jähr lich geförderte Abteilung Computermusik benutzt die Idee der constraints zur Untersu chung musikalischer Strukturen und Wahrnehmungsprozesse (Brand 1990, 140-142). Die Einbeziehung der Constraintidee für die Entwicklung eines kompositionsunterstützenden Systems wird ebenfalls am I.R.C.AM. (Institut de Recherche et Coordination Acousti que-Musique) verfolgt (vgl. Courtot 1990). 2) Ich folge hier der Darstellung bei Winston & Horn 1989, 334 son & Sussman 1989 und Winston 1984.
u.
335; vgl. auch Abel
268 Die Idee der constraints wurde außer von Levitt - so Roads (1984, 30) auch von Steels (1979) auf musikalische Konzepte angewandt. Um diese Übertragung zu verstehen, sei kurz auf die Definition der Notenstruktur von Levitt eingegangen. Eine Note wird nach Levitt 1 unter anderem durch ihre Tonhöhe (pitch) und die harmonischen Einschränkungen be stimmt. Während, wenn die Tonhöhe bekannt ist, keine weitere Informa tion mehr benötigt wird, um die Note zu bestimmen, wird durch eine harmonische Einschränkung jeweils nur eine teilweise Bestimmung der Note erreicht. So schränkt z. B. die Information darüber, daß die Note zu einem C-Our-Akkord erklingt und zu dem Akkord gehört, ihre Bestimmung auf die Noten c, e, g, h ein. Ist darüber hinaus bekannt, daß sie in harmonischer Distanz (vgl. Levitt 1981, 10) den Wert 4, die große Terz, zum Grundton des Akkordes aufweist, so ist sie genau bestimmt: es ist die Note e. Curtis Roads (198Sa, 178) liefert eine ähnliche Charakterisierung der von Levitt auf die Musik angewandten Constraint-Idee: Note
A
Konsonant?
Konsonant?
Levitt (1981, 17) greift zwar die programmiertechnische Idee der con straints auf, benutzt jedoch keine Constraintsprache, sondern implemen tierte sein System in LISP auf einer LISP-Maschine (Levitt 1981, 34 u. 44). Levitt (1981, 41 u. 15) hebt die Bedeutung der Berücksichtigung psy chologischer Aspekte des Musikwahrnehmens bei der Entwicklung musik theoretischer Systeme hervor und grenzt seinen Ansatz gegen grammati sche Forschungen aib: The prevalence of repeated patterns in music,
applied recursively and combined with other abstraction mechanism, has led to various "grammatical" formulations of musical structure. . . . In our 1) Levitt 1981, 36. Die weiteren Ausführungen habe ich stark vereinfacht 1981, 34·36.
nach
Levitt
269 formulation, "grammars" and rules play a secondary role, in a frame work of expectations ... , grammatical approaches which operate outside of psychological theories, and Zack notions of "nearness'', usually make it difficult to decide which of several "well-formed" options is most appro priate or most suitable. Interessant ist der Vergleich mit den Ergebnissen Winograds (1968): Winograd nahm eine globale tonale hierarchische Struktur fUr die Untersu chung "klassischer" Musik an, die er durch die Grammatik zu erfassen suchte. So ist die allgemeine Information über die Tonalität zu Beginn vorgegeben. Levitt (1981, 40) stimmt Ulrich zu, wenn dieser feststellt, daß die lo kale harmonische Struktur eine stärkere Analyse von Jazz-Stücken ermög licht, als ein globale harmonische Struktur. Ulrich schreibt (1977, 872):
In the long run the question of wether grammatical approaches are superior to non-grammatical ones may depend on how much harmonic structure can be derived from local properfies of the music. lf global properfies are essential to harmonic analysis, then a grammar may provide a useful means of representing the global organization. However in the case of jazz music, a musician can usually identify the key on the basis of two or three consecutive chords. lf this statement can be verified experimentally then there is strong reason to believe that jazz encodes so much harmony in the local structure of the music that global considerations can be ignored. In den Arbeiten von Ulrich (1977) und Levitt (1981) spiegelt sich auf programmiertechnischer Ebene - hiermit meine ich die Konzeption des Problembereichs adäquater Datenstrukturen und Algorithmen - der theo retische Ansatz in der Jazz-Harmonielehre wider. In ihr spielt ·das Kon zept der Haupttonart eine untergeordnete, wenn nicht sogar gar keine Rolle, so daß eng mit ihm verbundene Konzepte wie z. B. das der Modu lation ebenfalls diskussionsbedürftig werden. Axel Jungbluth (1981, 37) spricht dann auch lieber von Tonzentren und hebt ihre Bedeutung für die Analyse hervor: Die Feststellung der Tonart geschieht nur der Vollstän
digkeit halber; denn die Kenntnis der Tonart ist meistens ohne Bedeutung für das Gelingen einer Analyse. Jazzstücke modulieren mehr oder weniger stark, so daß die Tonarten ohnehin wechseln. Zunächst ist also wichtig, die Tonzentren der verschiedenen Tonarten (Tonalitiiten) ausfindig zu machen. In ähnlicher Weise spricht Ulrich (1977, 865) dann auch von der Not wendigkeit, zuerst die Tonalitätszentren zu identifizieren und legt gleich zeitig seinen Ansatz in nuce dar: To identify functional structure, we
first identify key centers. Within these key centers, chords can be named and assigned functional roles. Having named chords and identified key center we are able to compute scales which are compatible with the harmonic background. Es wäre natürlich interessant zu untersuchen, inwieweit die Konzepte der klassischen Musiktheorie in Verbindung mit der Jazz-Theorie stehen
270 und ob eine Vereinheitlichung mit Einführung neuer Konzepte sich als gleichstarkes Analyseinstrument erwiese, oder aber ob tatsächlich eine konzeptuelle Trennung, bedingt durch unterschiedliche Musikformen, notwendig ist. Weiterhin wäre nach der psychologischen Relevanz dieser Konzepte zu fragen. Zur Beantwortung solcher Fragestellungen können im Rahmen der Künstlichen Intelligenz entwickelte komputationelle Analysemethoden als überprüfbare Verfahren der musiktheoretischen Konzepte, ihrer Wechsel beziehungen und der dieser Theorie unterliegenden Intuitionen betrachtet werden, wie aus der von mir aufgezeigten engen Verwandtschaft des konzeptuellen Ansatzes Terry Winograds zur klassischen Musiktheorie im programmiertechnischen Bereich und ebenfalls der engen Beziehung zwi schen jazztheoretisch orientiertem Vorgehen zum Programmentwurf bei Ulrich und Levitt ersichtlich wird. Daß eine Überprüfung musiktheoreti scher Konzepte auf ihre Explizitheit notwendig ist, indiziert die Erfahrung Longuet-Higgins' bei der Benutzung von in Lehrbüchern dargelegten kontrapunktischen Regeln als Leitfaden für die Erstellung eines Pro gramms zur Erzeugung kontrapunktisch gesetzter Stimmen zu einer vorgegebenen Stimme� über welche Levitt (1981, 41) berichtet: Such ru les have themselves been subject of symbolic automation, with interesting results. Longuet-Higgins's effort to produce typical solutions to textbook counterpoint problems is a case in point. Of course, if the textbooks tru ly provided an unambiguous procedure for generafing interesting coun terpoint from a theme, the problern would be straightforward. They do not. Longuet-Higgins discovered that his best efforts to translate the given harmony rules produced dull, awkward counterpoint; but writing a program and listening to the results, he was able to invent new rules that improved the results considerably. Neben dem Forschungsziel des Überprüfens explizit angegebener Regeln in musiktheoretischen Werken und deren psychologischer Relevanz, sowie die hierfür notwendige Entwicklung bzw. Benutzung eines angemessenen Formalismus zur Darstellung des untersuchten Wissensgebietes zeigt sich ein weiteres Problem, das in der Forschung zur Künstlichen Intelligenz eine Rolle spielt und auch in der von ihr beeinflußten musikwissenschaft liehen Forschung diskutiert wird (vgl. z. B. Kippen & Bel 1988): das Problem des Wissenserwerbs . Es handelt sich hierbei um die Fragestel lung nach dem Transfer des Wissens von Informanten in explizite Form, so daß ein Expertensystem entwickelt werden kann. Es gilt verschiedene Problembereiche zu beachten, die denen der Anwendung der introspekti ven Methode in der Psychologie (vgl. Bischof 1966) ähnlich sind, so daß Verfahren wie die Protokollanalyse, welches bekanntlich schon von der
I) Ein ähnlicher Ansatz findet sich in Widmer o. J.
271 Würzburger Schule um Külpe im Bereich der Denkpsychologie eingesetzt und von Newell und Simon1 (1972) für den Forschungsbereich der Kog nitiven Psychologie aufgegriffen wurde, nur einen Teilbereich des zur Her stellung von Expertensystemen notwendigen Wissens erschließen. Denn: was für Regeln glaubt der Proband beim Problemlösen zu beachten und wie arbei tet er wirklich? Welches nicht in den Regeln dargelegte Wissen des Bereichs oder anderer Bereiche zieht er zur Lösung seiner Problemstellung heran?2 Im Bereich der Kognitiven Musikpsychologie macht Sloboda (1985, 103) auf die Protokollmethode aufmerksam und gibt eine Darstellung ihrer Anwendung am Beispiel der Arbeit Reitmans (1965), der diese Methode nutzte, um Kenntnisse über das für eine Fugenkomposition notwendige Wissen zu erhalten. Reitman stellte einem Komponisten die Aufgabe, eine Fuge zu komponieren und die einzelnen Schritte und Ideen während des Kompositionsprozesses darzulegen - sozusagen laut zu denken. Weiterhin versuchte er (Reitman 1961 ), anband der ermittelten Informationen ein "Kompositionsystem" zu implementieren. Auch hier ergaben sich ähnliche wie die eben angeführten Probleme, die eng mit der unspezifischen Ver balisierung des Vorgehens des Probanden und der Interpretation des Protokolls zusammenhingen (vgl. Sloboda 1985, 123-125). Auf diese und ähnliche Problemstellungen soll hier allerdings nicht wei ter eingegangen werden, da für diese Arbeit die verschiedenen Ideen zur formalen Repräsentation musikalischer Strukturen in der wissenschaftsge schichtlichen Entwicklung im Vordergrund stehen. Es dürfte jedoch die Relevanz dieser Problemstellung, d. h. der Wissensaquisition, für musik wissenschaftliche bzw. musiktheoretische Forschung deutlich geworden sein. Weitere Arbeiten, die ebenfalls dem KI-Bereich zuzurechnen sind und vorwiegend eine Explikation musiktheoretischer Konzepte mit Methoden der KI, d. h. in diesen Fällen ein in einer Programmiersprache, zu dieser Zeit meist in LISP, niedergelegtes Analyseverfahren anstreben, sind die von dem Franzosen Patrick Greussay (1972, 1973 ) und W. S. Smoliar (1971, 1980) angestellten Untersuchungen. Ulrich (1977, 872; Winograd 1968, 5) kennzeichnet den musiktheo retischen Bereich von Winograds Programm wie folgt: His program (Winograds; U. S. ) embodies a simplified version of Forte's harmonic theory. Als ein Ziel solcher Ansätze kann die wissenschaftliche Überprüfung einer Musiktheorie genannt werden (Roads 1985, 175; Rahn 1980b). Die Arbeiten von Stephen Smoliar (1976a, 1976b, 1980) haben zum Ziel, der Schenkersehen Theorie eine formale Explikation zu geben und sollen gleichzeitig ein effektives Modell der Musikwahrnehmung darstellen. Seine Forschungen sollen im nächsten Kapitel ausführlicher dargestellt werden. I) Eine kurze, aber prägnante Darstellung dieser von Newell und Sirnon angewandten
Methode findet sich in Weizenbaum 19802, 230·232. 2) Ähnliche Problemstellungen finden sich in der Musikethnologie ; vgl. hierzu Kapitel 3. I. 6., s. 234 ff.
272 3. 2. 2.
Schenkersehe Analyse mit LISP
Stephen W. Smoliar begann mit seinen Forschungen, die vorwiegend im Bereich der Computer-Musik und Musikanalyse anzusiedeln sind, Ende der 60er Jahre und setzt sie bis in die 90er Jahre fort. In seiner Rezension (Smoliar 1986) zu den Akten des Kongresses Mu sical Grammars and Computer Analysis, Modena 1982 (Baroni & Calle gari 1984) kritisierte er m. E. nach zutreffend einen großen Teil der Ansätze dieses Gebietes. Im folgenden Abschnitt sollen seine Ideen zur Explikation einiger Konzepte der Schenkersehen Theorie vorgestellt werden. Stephen W. Smoliar erhofft eine Klärung dieser Konzepte mittels einer Computerimplementation in LISP. Bevor ich jedoch näher hierauf eingehe, möchte ich einen kurzen Überblick über sein Schaffen geben.1 Seine Forschungen lassen sich in zwei große Phasen einteilen. In der ersten Phase 196 7-1976 beschäftigte er sich mit der Entwicklung eines softwaresimulierten musikalischen Prozessorsystems2 - im Sinne einer virtuellen Maschine -, das zur Entwicklung eines speziellen Musikcompu ters führen sollte, der allerdings - u. a. wohl aus Kostengründen - bis 1976 nicht realisiert wurde� Smoliar arbeitete hier auf der Ebene der Assemblersprachen und entwickelte sein EUTERPE-System (vgl. Smoliar 1972, 1007), das in verschiedenen Versionen existiert. Die erste Version von Euterpe war eine Extension der Asssemblersprache für den PDP-6Rechner und entstand unter Berücksichtigung von Vorschlägen Marvin Minskys (Smoliar 1972, 1007). EUTERPE2 lief auf einer PDP-15 (Smoli ar 1973b, 127), während es sich bei EUTERPE-8 um eine "Erweiterung" eines konventionellen PDP-8 Prozessors handelte (Smoliar 1976, 105). Das EUTERPE-System erlaubt eine Stimmung von 72 Noten in der Oktave und Alterationen eines Tones um einen Halb-, Viertel-, Sechstel- oder Zwölfteltonschritt nach oben oder unten (Smoliar 1972, 1007 u. 1008). Die zentrale Idee, welche auch von den Genueser Forschern4 aufge nommen und weiterentwickelt wurde, ist die des musikalischen Prozesses. Ausgegangen wird von der traditionellen europäischen Fünf!inien-Notation. Einzelne Stimmen werden als selbständige Prozesse begriffen, die parallel zueinander verlaufen. Eine musikalische Stelle aus einem Klavierwerk, t)Smoliar 1967, 1971a, l971b, 1974a, 1976a konnte ich leider nicht einsehen. Ihr Inhalt dUrfte jedoch im Kern mit den mir zugänglichen Publikationen identisch sein. FUr die Arbeiten 1967, 1971a, 1971b sei auf 1973a, 1973b hingewiesen. Ich fUhre sie allerdings an, um eine möglichst vollständige Literaturliste anzugeben und den Entwicklungsprozess der Forschungen Smoliars zeitlich vollständig zu dokumentieren. Die Informationen sind dementsprechend der folgenden angegebenen Literatur entnommen: 1972, 1973a, 1973b, 1974b, 1976b, 1978, 1979, 1980, 1986, 1990a, 1990b. 2) Smoliar 1973b, 127. 3) Smoliar 1976, 105. 4) s. Kap. 3. 1. 5, S. 217 u. 230.
273 welche in der gängigen Klaviernotation folgende Form aufweist, ----
� ·
wird in vier selbstständig zu beschreibende Prozesse aufgeteilt, die sich in der normalen Notation in der folgenden Weise darstellen lassen:
"
"
:
....
� ....
�
�
...
Bei der grundlegenden Datenstruktur des EUTERPE-Programmes han delt es sich um die Repräsentation einer normalen musikalischen Partitur. Als Arbeitsgrundlage dient Smoliar (1972, 1003; 1973b, 127) die folgende Definition der Partitur: A � is an ordered configuration of symbols called notes which, when evaluated with respect to ex.terior parameters of pitch and duration, represent an ordered sequence of sounds. Fur thermore, simultaneaus occurences of these sounds may be decomposed into the Superposition of voices, each of which has no simultaneaus occurence of sound. Er merkt außerdem noch an, daß: This definition may appear a bit strained, but that is because it has been formulated with a particu/ar programming language in mind. Es ist hier sehr deutlich zu sehen, wie musikalische Beschreibung und Datenabstraktion in bezug auf eine Programmiersprache zusammenwirken. Ein Programm wird als die strukturelle Beschreibung eines musikali schen Prozesses betrachtet. Smoliar (1976, 106) spricht daher auch von einem Metaprozess: ... , my major concern is not so much with the music processes (i. e. the behavior of music processors) as it is with metaprocesses which
274
describe musicprocesses. Such metaprocesses shatl be called music pro grams, examples of which are the EUTERPE and Music V languages. Ein musikalischer Prozess, der durch ein Programm beschrieben wird, kann insgesamt als Folge von Unterprogrammaufrufen verstanden werden, die natürlich ebenfalls wieder Unterprogramme aufrufen können. Ein Mu sikwerk wird also nicht einfach als eine Folge von Tönen begriffen. Diese Idee kann man sich leicht an einer einfachen Melodie wie "Bruder Jakob" (Smoliar 1972, 1006) vergegenwärtigen:
I@:1 J
Y3AJ
J
IJ
J
J
1 IJ1iJJ 1 I 1 � 1 l 1 � 1 =II
In Stephen W. Smoliars (1972, 1008) programmiersprachlicher strukturel ler Beschreibung! des Stückes "Bruder Jakob" wird die Folge der Töne c, d, e, c, etc. in größere Einheiten segmentiert: Der erste Takt wird z. B. zu einer Einheit zusammengefaßt, die dann wiederholt wird; ebenso der dritte, fl.infte und siebente Takt. Smoliar (1973a, 121) sieht vier bedeuten de Anwendungsfelder in denen die formale Modeliierung musikalischer Prozesse innerhalb der Musikforschung von Bedeutung ist: I. The computer as a composer's assistant. JJ. Programming linguistics as a foundation for style analysis. JJJ.Computerprogramming as a medium for teaching composition. IV. Artificial intelligence studies in computer composition. Der zweite Punkt scheint mir von besonderer Bedeutung zu sein, da er, in Zusammhang mit dem vierten Punkt der Anwendung von Methoden der Künstlichen Intelligenz, die Basis für eine prozedurale Theorie musikali scher Strukturen und Prozesse bildet. Smoliar (1973a, 123) stellt den prozeduralen Aspekt einer Musiktheorie ausdrücklich in die Nähe der von Winograd unternommenen prozeduralen Ansätze zur Erforschung der natürlichen Sprache. Er wendet sich hiermit indirekt gegen die Arbeiten der generativen Grammatiker Chomskyscher Provenienz und stellt seine Forschungen in den Bereich der Künstlichen Intelligenz� Die Notwendigkeit der For mulierung formaler Modelle in der Musikforschung macht Smoliar ein sichtig, indem er traditionelle Analysen diskutiert, zu denen er auch 1) Smoliars Strukturierung des Liedes in Subprogramme ist auf S. 275 wiedergegeben und wurde von mir in einem lauffähigen Programm implementiert dessen Code in Anhang E angegeben wurde . 2) In den 70er Jahren gab es in der Zeitschrift "Cognition" eine heftige Diskussion zwischen Anhängern der generativen Grammatik und den Vertretern der KI über die Anwendung ihrer Forschungsmethoden und Forschung (e. g. Schank & Wilensky 1977).
-ziele
in
der
sprachwissenschaftlichen
275 Strukturelle Beschreibung von "Bruder Jakob" als Programm (nach S. W. Smoliar 1972, 1008)
BEGIN
BE GIN
� c Viertel
w END
j
+--
I /"/ , __.-
J J1
J J
----7 END
I
BEGIN � g Achtel � a Rehtel ----7 g Achtel f Achtel � e Vierte l �
t
.
V I ertel ----? END
' BEGIH � c Viertel � G Viertel ----7 t Halbe -� END
!_____-/
END
11 IJ
·
1
d Viertel � e Viertel ----? t Viertel]
/ BEGIN � e Viertel ----7 f Viertel ----? g, Halbe
1 •
----7
276 György Ligetis (Ligeti 1958) Analyse des kompositionellen Prozesses an hand eines Boulezschen Werkes anführt. Sein Urteil (Smoliar 1972, 1005) lautet: Ligetts analysis, ... , reads like a cookbook, saying nothing about the
final product. As such, one can only question the "musicality" of the analysis. Jt may be likened to the scientific pasttime of "number-crunching": the gathering and processing of data with little, if any, concern for results. Ab 1976 wendet sich sein Interesse mehr der musikalischen Perzeption
und der Implementierung einer Beschreibung derselben in einer höheren, problemorientierten Programmiersprache zu. Kernidee ist noch immer der Parallelismus musikalischer Prozesse und eine Erstellung effektiver, d.h. algorithmischer, musiktheoretischer Modelle, in denen sich die musikali sche Perzeption reflektiert findet. Smoliar (1976, 113) formuliert dies in folgenden Worten: Such a higher-level language must, by its nature,
encompass some sort of a model of musical perception, since recon struction can only arise from the listener's perceptual activities. In fact, in the most generat sense, atl music theory may be regarded in terms of the problern Qj_ (ormulating effective models of musical perception.
Dieser Problemstellung, der Erstellung eines effektiven Modelles musi kalischer Wahrnehmung, nähert sich Smoliar1 indirekt, indem er eine Ex plikation einiger Konzepte der Schenkersehen Musiktheorie im Rahmen eines in LISP geschriebenen Analyse-Programmes vornimmt. Dies wird u.a. daraus ersichtlich, daß die 1976 erschienene Arbeit (Franke!, Rosen schein & Smoliar 1976) zuerst mit dem Titel The Modeling of Musical Perception - a Digital Computer via Schenkerian Theory angekündigt wurde (Smoliar 1 976, 130). Noch 1978 merken Franke!, Rosenschein und Smoliar an, daß zwar relativ viele Arbeiten aus dem Bereich der numerisch angewandten Me thoden des Computereinsatzes in der Musikforschung existierten, welche sich auf das Auszählen von Tönen beschränkten, aber symbolverarbeitende Ansätze, die sich mit musikalischen Strukturen beschäftigten, rar seien. Ihre Sichtweise musiktheoretischer Forschung legen sie (Franke! , Ro senschein & Smoliar 1978, 121) daher wie folgt dar: We regard musicat
theory as the study of musical structures: the principles under which such structures may be generated, and the means by which musical compositions may be parsed so that their underlying structures may be inferred. Consequently, we feel that it should be possibte to implement any "usefut" theory of music in terms of some rigorously defined cot lection of symbol manipulation algorithms. Furthermore, we feel that such a cotlection of algorithms may be serve as a model of the theory ... , to the extent that music theoretic questions may be resolved by translating them into questions about their corresponding algorithms and
1) Diese Ideen sind im besonderen in den Schriften Franke!, Rosenschein & Smoliar 1978, Franke!, Rosenschein & Smoliar 1976, Smoliar 1979 und Smoliar 1980 ausgearbeitet.
277
answering the questions in the computational domain. Die Schenkersehe Theorie bildet die zu rekonstruierende Theorie ftir Smoliar. Er bezieht sich auf die folgenden grundlegenden Annahmen Heinrich Schenkers,1 nach dessen Arbeit (Schenker 1956, 25-38) ein musikali sches Werk aus drei Schichten besteht: Hintergrund, Vordergrund und Mittel grund. Henrich Schenker ( 1956, 26) schreibt: Daß auch das Musik
Kunstwerk einen Hinter- , Mittelgrund und Vordergrund als unerläßliche Voraussetzung eines organischen Vordergrundes hat, war bis heute un bekannt; erst dieses Werk (Der freie Satz; U. S.) führt den Begriff ein.
Die Idee der Schichteneinteilung entnimmt Schenker seiner, u. a. an Hege! angelehnten, metaphysischen Vorstellung eines allgemeinen Ent wicklungsprozesses, in dem es einen Ursprung, eine Entwicklung und eine Gegenwart gibt. Als besondere Prinzipien dieses allgemeinen Entwicklungs prinzips finden sich der Ursprung als Ursatz, dessen Oberstimme er Urlinie und dessen kontrapunktierende Unterstimme er Baßbrechung nennt, als Grundstruktur des Hintergrundes; die weitere Ausarbeitung des Hin tergrundes bzw. des Ursatzes - die Entwicklung des Ursatzes - erfolgt über verschiedene Ebenen des Mittelgrundes, durch Stimmführungs-,
Verwandlungsschichten, Prolongationen, Auswicklung und ähnliche Zustände hin zum Vordergrund - der Gegenwart - eines Werkes. Diesen Zusammenhang beschreibt Heinrich Schenker (1956, 28): Wie immer sich ein Vordergrund zuletzt entfalte, immer ist es der Ursatz des Hinter grundes, der Mittelgrund der Verwandlungsschichten, die ihm Gewänr naturorganischen Lebens bieten. Als letztendliche Basis des Ursatzes, dessen künstlerische Ausgestaltung zum Kunstwerk führt, dient Heinrich Schenker (1925, 7) der aus den Obertönen eines Gruntones bestehende Durdreiklang. Hierdurch soll eine Vermittlung von Kunst und Natur erfolgen, so daß Kunstwerke als orga nische Zusammenhänge verstanden werden: Die Naturidee des Dreiklan
ges, die Kunstidee der Auskomponierung dieses Klanges, die Vollendung in der Überführung eines Klanges in viele mittels der Stimmführungs prolongationen, die Formgebung als Ablauf der Urlinie, alles das macht ein Meisterwerk aus. Für Heinrich Schenker ist eine musikalische Analyse das mittels Re duktionsverfahren durchgeilihrte Aufzeigen dieser Entwicklung, wobei der "organische Zusammenhang" der verschiedenen Schichten einen Maßstab der Qualität eines Werkes bildet. Noch 196 7 stellte der Musikwissenschaftler Elmar Seidel (196 7, 1011) allerdings die wissenschaftliche Begründung der von Schenker für das Reduktionsverfahren entwickelten Mechanismen in Frage: Allerdings fehlt
der von Schenker angewendeten Reduktionstechnik die wissenschaftlich exakte Begründung.
I) Eine sehr kurze aber prägnante Darstellung der Schenkersehen Theorie gibt Allen Forte 1959.
278 Gerade den bei der Reduktion angewandten Verfahren will Stephen W. Smoliar durch Reformulierung in einer algorithmischen Sprache bzw. einer Programmiersprache eine wissenschaftliche Begründung geben, die auch für ein am "Exaktheitsgrad" der Naturwissenschaft, Mathematik, Logik und Informatik geschultes Denken wissenschaftlich akzeptierbar ist. Es soll durch Anwendung dieser Mechanismen gezeigt werden, wie, von dem Naturakkord ausgehend, über die Veränderung des Ursatzes des Hinter grundes, durch Entfaltung der verschiedenen Schichten des Mittelgrundes, der Vordergrund eines musikalischen Werkes, dargestellt in der normalen Notation, entsteht. Smoliar geht primär von dem Schenkersehen Konzept des Ursatzes (proto-structure) mit Urlinie und Baßbrechung, das den Kern jeder tona len Komposition bildet, aus. Der Ursatz bildet eine akkordbasierte Erwei terung der Obertöne eines Grundtones . Ein Musikwerk ist nichts weiter als eine Auskomponierung des Ursatzes, und die Analyse eines Werkes besteht in der schrittweisen Zurückführung des Werkes auf den Ursatz. Der Ursatz tritt in drei Ausprägungen auf:
if
3 II -&-
2
: V
I .. -&-
5 0 -&-
4 9
3 II
2
: V
f Ii -&-
8
-&-
I
-&-
7
..!1.
6
5
4
3
2
-&-
0
9
II
:
1 Ii -&-
II
V
Nach Franke!, Rosenschein & Smoliar (1978, 122) supponiert die Schen kersehe Theorie eine hierarchische Organisation der musikalischen Struk turen. Da Baumstrukturen besonders zur Repräsentation hierarchischer Strukturen geeignet sind, kann die Kernidee der Schenkersehen Theorie im Bereich einer komputationellen Theorie als eine Folge von Baumtrans formationen modelliert werden. Zur Darstellung der Bäume und den auf ihnen operierenden Algorithmen erweist sich die Programmiersprache LISP aufgrund ihrer Listenstruktur als prädestiniert. Ausgegangen wird bei der Repräsentation musikalischer Strukturen in LISP von den Noten namen, die als Repräsentanten der Äquivalenzklassen der oktaviden tischen Tönen verstanden werden. Um eine solche zu beschreiben, wird auf eine Darstellungsform von Hoare1 (1972) zur Beschreibung von Da tenstrukturen zurückgegriffen. Eine Tonhöhenklasse (pitch class) wird rekursiv definiert2 als:
1) In neuerer Form wird die Problematik der Daten- und Pro2edurabstraktion mit Bezug auf LISP von Abelson & Sussman 1989 behandelt. 2) Die Definition erfolgt in Anlehnung an Franke!, Rosenschein & Smoliar !987, 124; Smoliar 1980, 43 gibt den � chromatic mit vertauschten Positionen an.
279 lJ!E!!. pitch class = (diatonic, chromatic);
ordered 1J!Ef!. diatonic = (C, D, E, F, G, A, H);
1J!E!!. chromatic = (pitch: pitch class; accidental: (u, %) ) ; Eine pitch class ist also entweder diatonic oder chromatic. Ist sie diatonic, so kann einer der sieben Buchstaben unter "ordered 1J!Ef!. diato nic" auswählen. Ist die pitch class jedoch chromatic, so kann wieder mit der Bestimmung der pitch class begonnen werden, gefolgt von einem der
beiden Vorzeichen u oder %, wobei "%" = b für die normale Erniedrigung um einen Halbtonschritt steht. Eine pitch class kann also folgende Formen aufweisen: D , C u, C u u, E % u, etc. Um die Tonhöhe der zu repräsentierenden Töne zu berück sichtigen, wird das Konzept der Note eingeführt, bei dem das Register des betreffenden Tones durch eine ganze Zahl (integer) repräsentiert wird. Das Register der Töne in der eingestrichenen Oktave wird durch die Null repräsentiert, das nächsthöhere Register durch Addition um Eins und das nächstniedrigere durch Subtraktion um Eins usw. Eine Note wird dann definiert alsl: lJ!E!!. note = (pc: pitch class; register: integer) Wie zu erkennen ist, wird eine Note unter Rückgriff auf die pitch class-Definition charakterisiert. Das eingestrichene c z. B. ergibt sich dann als C 0. In LISP wird eine diatonische Note als Liste mit zwei Elementen charakterisiert z. B. (C 0) für das eingestrichene c. Ein chromatisch erhöhter bzw. herabgesetzter Ton wird ebenfalls durch eine zweielementige Liste dargestellt z. B. (C =) für cis. Wenn die Oktavlage bei einem chromatisch veränderten Ton angegeben wird, ergibt sich im einfachsten Fall wiederum eine zweielementige Liste, die diesmal jedoch als erstes Element eine Liste enthält. Für das eingestrichene cis ergibt sich die Liste ((C u) 0). Auf diesen Darstellungen lassen sich einfache Operationen durchführen, wie z. B. die Alterierung um einen Halbton schritt nach oben oder unten, die algorithmisch in LISP formuliert werden können: (defun sharp (firstfromnote) (cond ((atom firstfromnote) (Iist firstfromnote. 'u)) ((eq (cadr firstfromnote) '%) (car firstfromnote)) (t (Iist firstfromnote 'u)) )) Ich gehe nun kurz etwas genauer auf die Arbeitsweise dieser Funktion ein, da sich an diesem elementaren Beispiel sehr gut Formulierung und Ablauf eines Algorithmus auf einer in LISP formulierten Datenstruktur zeigen läßt. Unter Datenstrukturen können allgemein Repräsentationen von 1) Franke!, Rosenschein & Smoliar 1978, 124.
280 Objekten verstanden werden, auf denen Algorithmen arbeiten. Die gebun dene Variable ilir das Argument der Funktion wurde durch Kursivschrift gekennzeichnet. Die obige Funktion mit dem Namen "sharp" erhält als Argument das erste Element der LISP-Repräsentation einer Note - also (car note)� Es kommen hierfür zwei Fälle in Frage. Handelt es sich um C, ein Atom. eine diatonische Note, z. B. (C 0), so ist der (car '(C 0)) Ist es aber eine chromatische Note, so wird eine Liste Argument der Funktion sharp, z. B. ((C %) 0), so ist natürlich (car '((C %) 0)) (C %). Ein Aufruf dieser Funktion könnte nun folgendermaßen lauten: =
=
»(sharp '(C %)) oder »(sharp 'C) Im ersten Fall des Aufrufs der Funktion trifft die zweite Bedingung des (car (cdr '(C %))) = (car '(%)) = % und die Funktion eq liefert den Funktionswert 'wahr', wodurch die Bedingung erilillt ist, so daß als Funktionswert (car '(C %)) = C erhalten wird. Im zweiten Fall trifft die erste Bedingung von cond zu, da C ein Atom ist und somit (list 'C 'u) als Funktionswert die Liste (C u) liefert. Ein dritter Fall ist noch zu betrachten, bei dem als Argument der Funktion sharp (C u) möglich ist. In diesem Fall trifft die letzte Bedingung des Konditionals der Funktion sharp zu, und man erhält
LISP-Konditionals cond zu, denn (cadr '(C %))
=
(list '(C u) 'u) = ((C u) u). Da Smoliar (1980) eine leicht modifizierte Repräsentation eines Tones wählt, indem er die Vorzeichen vorstellt und nicht, wie angegeben, (s. Franke!, Rosenschein & Smoliar 1978, 124 u. 1 25 ) nachstellt, sei sie und die auf ihr arbeitende Funktion sharpl ebenfalls kurz angeführt, da hieran die Abhängigkeit von Datenstruktur und Algorithmus deutlich wird. Für das einge strichene cisis steht statt (((C u ) u) 0) die Listenrepräsentation ((u (u C)) 0). Im folgenden werde ich nicht besonders auf die verschiedenen Tonre präsentationen hinweisen, da sie sich aus dem Kontext ergeben. Die entsprechende Funktion sharpl lautet und arbeitet ähnlich wie sharp: (defun sharpl (firstfromnote) (cond ((atom firstfromnote ) (Iist 'u firstfromnote)) ((eq (car firstfromnote) '%) (cadr firstfromnote)) (t (Iist 'u firstfromnote) )) 1) Die Funktion car liefert immer das erste Element einer Liste, das selbst eine Liste sein kann; die Funktion cdr die Restliste. In LISP gibt es als grundlegende Datenstruk turen nur Listen und Atome, letztere sind im Gegensatz zu Listen nicht mehr weiter zerlegbar. Näheres zu den Kernfunktionen car, cdr, eq, atom, cons von LISP und den elementaren Datenstrukturen Liste und Atom s. Kap. 2. 2. 4. 3. 4, S. 149 ff.
281 Auf ähnliche Weise arbeiten die ebenfalls von Franke!, Rosenschein & Smoliar (1978, 125) angegebenen Funktionen flat und ot: (defun flat (firstfromnote) ; Kommentar: Die Funktion flat erniedrigt einen "Ton" um einen ; Halbtonschritt (cond ((atom firstfromnote) (!ist firstfromnote '%)) ((eq (cadr firs tfromno te) '11) (car firstfromnote)) (t (Iist firstfromnote '%)) ) ) (defun ot (note integer) ; Kommentar: Die Funktion ot transponiert den jeweiligen "Ton" um die durch die Ganze Zahl integer repräsentierten Oktaven durch normale Addition add (Iist (car note) (add (cadr note) integer)) ) Die Funktion flat muß ähnlich wie sharp abgewandelt werden, wenn die andere Repräsentation des Tones (Smoliar 1980, 43) benutzt wird - dies sei dem Leser überlassen. Die Funktion ot kann erhalten bleiben, da sie auf dem zweiten Element der Tonrepräsentation arbeitet. Nach dieser Erläuterung der elementaren Darstellung der Töne in LISP und dreier auf ihr arbeitender Operationen (Funktio·nen, Algorithmen, Prozeduren) soll jetzt auf die grundlegende Datenstuktu r von Stephen W. Smoliars (1980; Franke!, Rosenschein & Smoliar 1978) Ansatzes eingegan gen werden. Es handelt sich um das musikalische Ereignis (Smoliar 1980, 43; Fran ke!, Rosenschein & Smoliar 1 978, 125 sprechen von Jevel) und läßt sich durch eine Baumstruktur darstellen. Ein musikalisches Ereignis besteht a) aus einer einzelnen Note (vgl. � note), b) einer Sequenz (SEQ) musikalischer Ereignisse, die durch eine Ordnungsfolge charakterisiert wird, c) der Simultanität (SIM) musikalischer Ereignisse, die gleichzeitig beginnen. Auch hier ist wieder die rekursive Definition des Konzeptes "musikali sches Ereignis" zu beachten. Die Form des folgend angegebenen Ursatzes findet sich auch in Schenker (1956, Bd. 2, 1 ):
Für den Ursatz
l@f��-&-�11��=��-&�11��� 3
2
1
ergibt sich die folgende Darstellung
282 in Form eines Dendrogrammes:
Si111
Die beschriftete Darstellung entfällt, wenn die notwendige Information über Simultanität und Sequentialität der Struktur durch die Strichform der graphischen Repräsentation des Baumes ausgedrückt wird. Unterbro chene Linien treten für gleichzeitig beginnende musikalische Ereignisse auf und durchzogene Linien stehen für sequentielle Ereignisse. Der Baum nimmt folgende Gestalt an:
CC _.L_ (6 �CC B) 0)
...
�
.,. ..- .,..
ß)
'--,,� �CD � I) cc l)
Da der Ton dl als Durchgangston interpretiert wird und eine unterge ordnete Funktion innerhalb der Struktur einnimmt, erhält er ebenfalls eine strukturell untergeordnete Position in dem Baumdiagramm, während die anderen Töne auf strukturell gleicher Ebene stehen. Als Listendarstellung in LISP findet sich:
((C 0) (G 0) (C 0) SEQ) ((E 1 ) ((D 1) SEQ) (C 1 ) SEQ) SIM) Für Smoliar lassen sich die aus der Urlinie entwickelten musikalischen Kompositionen als Folge von Operationen auf Baumstrukturen begreifen. Diese Operationen werden als Algorithmen durch LISP-Funktionen (Pro zeduren) realisiert. Die Funktionen werden in solche höherer Ebene (high-level-functions), niedriger Ebene (low-Jevel-functions) und Restruk turierungsfunktionen unterteilt (Smoliar 1980, 49; Franke!, Rosenschein & Smoliar 1978, 129). Die High-level-Funktionen arbeiten auf dem ganzen
283 Baum, die Low-level-Funktionen auf Unterbäumen, und die Restrukturie rungsfunktionen ändern die allgemeine Form eines Baumes . Es kann an dieser Stelle nicht da� gesamte System der Funktionen angegeben werden, aber es sollen einige genannt und ihre Arbeitsweise charakterisiert werden. Eine High-level-Funktion ist NATURE, die als Argument eine der ganzen Zahlen 3, S oder 8 erhält. Sie erzeugt dann aufgrund der zuvor angegebenen Skala und des Registe"rs der Skala einen Akkord, der aus den durakkordeigenen Obertönen des betreffenden Grundtones der Skala besteht. Die ganzen Zahlen geben an, ob die Terz (3), die Quinte (5) oder die Oktave (8) den höchsten Ton des Akkordes bildet. Ein Aufruf von NATURE wie »(nature 3) führt, wenn zuvor durch die Funktion SCALE und REGISTER die Skala C-Dur (0) in dem entsprechenden Register (- 1 ) aufgebaut wurde, zu der Baumstruktur des Akkordes: /
/
•
-
-
-
·
-
�
.",... - -
� �: ' ...._
-
...
'
".., cc -n
'
'
CC Ol
(6 Ol
CC Il CE Il
In LISP liefert sie natürlich den Funktionswert:
((C - 1 ) (C 0 ) ( G 0 ) (C 1 ) ( E 1 ) SIM )
Auf dieser Struktur operiert dann die High-level-Funktion URSATZ, d. h., sie transformiert den entstandenen Baum in ein den Ursatz repräsen tierendes Dendrogramm:
CC Ol
.:::
�(6 0) _,..-"'"'�··CC Ol
'',,_"./ � il �CD CC I l
Der Aufruf der Funktion Ursatz mit »(ursatz) liefert den schon erwähnten Funktionswert:
284 ((C 0 ) (G 0) (C 0) SEQ) ((E 1 ) ((D 1) SEQ) (C 1 ) SEQ) SIM) In dieser Weise kann dann mit Funktionsanwendungen fortgefahren und aus dem Ursatz die untersuchte Komposition oder die entsprechende Schicht des Werkes abgeleitet werden, d. h., es kann von dem Hinter grund über den Mittelgrund zum Vordergrund fortgeschritten werden. Für eine ausführliche Rekonstruktion des Schenkersehen Analyseverfah rens anband zweier Werke Mozarts mit den in LISP formulierten Opera tionen muß auf die Arbeiten von Smoliar1 verwiesen werden. Es soll hier die Grundidee des Analyseverfahrens am Beispiel der Mezartsehen Kla viersonate KV. 331 vorgestellt werden� Mit den High-level-Funktionen kann die von Schenker als Hintergrund einer Komposition bezeichnete Struktur erzeugt werden. Zur Anwendung kommen die Funktionen NATURE, URSATZ und BINARY oder TERNARY. Die Hintergrundstruktur für die Mezartsehe Klaviersonate KV. 331 ent steht in folgenden Phasen:3
NATURE:
4
j
J .I t
i
1
��
BINARY und TERNARY operieren auf der von der Funktion URSATZ erzeugten Baumstruktur. BINARY generiert eine binäre Struktur, während die Funktionsanwendung von TERNARY zu einer ternären Struktur führt (vgl. Smoliar 1980, 49 u. SO). I) In Smoliar (1980, 55-59} werden die ersten zehn Takte von Mozarts Klaviersonate KV. 283 ausführlich analysiert. In Franke!, Rosenschein & Smoliar (1978, 129·131 und 133·135) finden sich partielle Analysen von Mozarts Klaviersonate KV. 283 und Mozarts Klaviersonate KV. 331. 2) Man vgl. diese Analyse auch mit Schenkers Darstellung im Anhang seines Buches "Der Freie Satz" 1956: S. .34, Beisp. 72 Nr. 3: S. 43, Beisp. 87 Nr. 5: S. 93, Beisp. 132 Nr. 6: S. 101, Beisp. 101: S. 119 Beisp. 157. 3) Ich folge hierfür Franke!, Rosenschein & Smoliar 1978, 133 u. 134. Die Druckfehler des Originals wurden von mir korrigiert.
285
Verschiedene weitere Funktionenanwendungen wie z. B. von AUSKOMP, PT, DIM, ILA, OT etc. führen zu einer Anreicherung des Tonmaterials des Mittelgrundes, von denen einige erwähnt werden sollen. Durch Einfü gung von Terzen durch die Funktion PAR (Smoliar 1980, 52) wird der Übergang zum Mittelgrund durchgeführt. Weiterhin wird durch ILA (in sert Jower auxiliary; Smoliar 1978, 127), die "unvollständige Hilfstöne" einfügt, d als unvollständiger tiefer Hilfston zu e eingefligt.
ltst
� �
J
�
J
��
.I
r
Weiterhin wird durch die Funktion DIM, die auf Sequenzen operiert und einen zusätzlichen Parameter, bestehend aus einer natürlichen Zahl, in diesem Fall 3, erhält, aus der Folge der vier Terzen eine Folge von sechs Terzen gemacht, indem das erste Element der Eingabeliste, in diesem Fall ((C *�) 1), durch die ersten n Elemente der Eingabe, in die sem Fall die ersten 3 Elemente, d. h. durch
(((C =) 1 ) (E 1 ) SIM) ((D 1) (B 0) SIM) (((C =) 1) (A 0) SIM) ersetzt wird. Als Funktionsaufruf von DIM für die Folge der Terzen flir die erste Hälfte der bisher erzeugten Struktur des Mittelgrundes ergibt sich (die zu ersetzenden und ersetzten Elemente wurden durch kursive Schrift hervorgehoben): " (DIM '
(
((C #) 1) (E 1) SIM)
((D 1 ) (B 0) SIM) ((C *�) 1) (A 0) SIM) ((B 0) ((G *�) 0) SIM) SEQ)
3)
286 Als Funktionswert liefert die Funktionsanwendung:
((C #) 1) (E 1) SIM)
((D 1) (B 0) SIM)
((C #) 1) (A 0) SIM) ((D 1 ) (B 0) SIM) ((C =) 1 ) (A 0) SIM)
((B 0) ((G = ) 0) SIM)
Diese Transformation dargestellt:1
wird
mittels
SEQ) einer
Baumstruktur
, . m '*l n
I
' . ([ l)
( DIH
.. . (8 0) , ' (D l)
.. . (A 8)
/
,
... �
3)
' , ( (C I*) Il
1
,.
wie
folgt
( (C I*) Il (E Il
"' (8 0)
'
, (D Il
- - (A 0)
- . ( (6 I*) 0) ' ' (8 8)
((C tt) n ' Nach zweimaliger Struktur erhalten:
Anwendung wird
( (6 I*) ß)
.... (8 0) der Mittelgrund
mit
folgender
Nun kann nach mehrfacher Anwendung der Funktion AUSKOMP, die aus 1) Frankel, Rosenschein & Smoliar 1978, 128.
287 gleichzeitig erklingenden Tönen eine aufsteigende Folge von Tönen macht, aus der Struktur mit gleichzeitig erklingenden Terzen eine Struktur mit aufeinanderfolgenden Terzen gemacht werden:
Die dritte der aufeinanderfolgenden Terzen wird mittels PT mit einem Durchgangston angefüllt. Die Baumstruktur zeigt den bisherigen Aufbau des Mittelgrundes (die um einen Durchgangston erweiterten Terzen habe ich durch einen Stern gekennzeichnet). CA
,/ .....
./ .....
./
'
CE
D
CD
I)
0) Il
,. c cc
0)
l)
C8 0)
......
CA
'
C E Ol
CA 0)
�·· ....
C CC #)
kCD
cA-n
I
-D
#)
,.. c (6 #)
' (8 0)
J)
0)
C C C #l
C8
#) #)
I)
*'
I)
C CC #l
CE CD
0)
C8 0)
I)
J)
0) I)
(8 0) I)
*'
0)
Etwas unübersichtlicher stellt sich die gleiche Information nach der zweimaligen Anwendung von PT als Listenstruktur dar - die eingefügten Durchgangstöne h1 wurden kursiv dargestellt.
288 Die Baumstruktur in Listendarstellung:
( ((C a) 1 ) (E 1 ) SEQ)
((B 0) (D 1 ) SEQ) ((A 0) ((B 0) SEQ) ((C a) 1 ) SEQ) ( (B 0) (D 1 ) SIM) ((A 0) ((C a) 1) SIM) ((G a) 0) (B 0 ) SIM)
(A
-
SEQ)
1 ) ((D 0) SEQ) (E 0) SEQ) SIM)
( ((C a) 1) (E 1) SEQ)
((B 0) (D 1) SEQ) ((A 0) ((B 0) SEQ) ((C a) 1 ) SEQ) ((B 0) (D 1) SIM) ((A 0) ((C a) 1) SIM) ((G a) 0) (B 0) SIM) (A 0) SEQ)
(A
-
1) ((D 0) SEQ) (E 0 ) SEQ) SIM) SEQ)
Die erhaltene Struktur entspricht der oberen Notendarstellung dieser Stelle, die allerdings je Abschnitt um ein h1 erweitert wurde. Die ein gefügten Töne h1 wurden in dem folgenden Notenbeispiel kenntlich gemacht. In ähnlicher Weise wird weiter verfahren, nachdem e und d eine Okta ve tiefer transponiert wurden.
289
"
F L_ -_ -
T TL
�
- -__ __ __ _ _
� '--�'
J
__ _ _ _ _ _ -__ _ . . __
Die dritte mittlere Stimme wird durch mehrmaliges Hinzufügen des Tones e1 erhalten:
-� 1
"
...-,--:---- I
��
1\
I
I
I
I
I
/� ) .....
,
I
I
Weitere Funktionsanwendungen fUhren über die Struktur
I
I
"
�I
1\
---.. I
I
1
.....
,
zum Vordergrund der ersten 8 Takte von Mozarts Klaviersonate KV. 331,
290
I
u
, .;!
..
A ...tt_ u
Anddnt� gr�zr�so
?1 1 J 1 1 JJ 1 J 1 J 1 1> J -
"-=--!
"-=--!
1�JJ 1
1 Jl 1 J 1
1\
I
s!
'P
y
?
s!
:1;1 �'
r:==:! l I
.....
+
die hier auch in vollständiger Baumstrukur angegeben werden soll:1
��IB ·I I �
IE 01 IE 01 IE 01 E OI IE 01 IE 01 UC 1101 UC 1101 IIC II ·II ...-.E ::-- 1• -11 ((G #I ·II IB ·II 1 ((F "\8-i/ .......-:�-( (GII·II lA ·II 10 -II IE - I I I E -21 lA ·II _. :;_ .,. uc II,011 I) ((C 11 I I IE II IE II 1 8 01 �E--tcc "I 11 (8 01 10 II 10 II IAOI 18 01 ((C II I I ��IB Ol 01 �--::lb' ��� "�(A 01 IE 01 � ...., --<1Eot ((C #1·11 --IIG#I 01 - -:::1� g: �-I(C ,j 01 --(A 01 _ _
�
I) Franke!, Rosenschein & Smoliar 1978, 137.
�
"
II
291 Die ersten vier Takte sind links zu sehen. Ganz oben stehend die Baßtöne A B A mit der gleichzeitig einsetzenden Folge der Töne el der Mittelstimme. Der weitere Teil des oberen Sub-Baumes ist eine Darstel lung der im Baßschlüssel notierten Töne, während der graphisch in der Abbildung unten liegende Sub-Baum die Melodiestimme der ersten vier Takte repräsentiert. In ähnlicher Weise finden sich die folgenden vier Takte in dem rechts liegenden Baum dargestellt. Es fällt auf, daß bei diesem Analyseverfahren, anders als z. B. bei Winograd (vgl. Kap. 3. 2. 1, S. 253 ff. ), von dem Analyseziel ausgehend das untersuchte Werk "erzeugt" wird und die Analyse eines Werkes seine grundlegenden strukturellen Beziehungen als Ergebnis ergibt. Auch liegt die "Intelligenz" für die Anwendung des nächsten Analyseschrittes nicht bei dem System, sondern bei dem Benutzer des Systems. Es handelt sich also um kein automatisches Analysesystem. Smoliar (1980, 48; Franke!, Rosenschein & Smoliar 1978, 133) spricht folglich von einem analyseun terstützenden System. Die Entwicklung eines Analysesystems, das als Eingabe einen Notentext erhält und die strukturellen Veränderungen der zugrundeliegenden Schichten als Ausgabe liefert, halten Franke!, Rosen schein & Smoliar (1978, 133) für problematisch, da sie vermuten, daß es nicht nur eine einzige mögliche zugrundeliegende Struktur gibt. Diese Vermutung wird bestätigt durch die Arbeit Narmours (1983/84 ), der mehrere von der Schenkersehen Theorie ausgehende unterschiedliche Analysen der Klaviersonate KV. 331 Mozarts anführt und diskutiert. Das System von Smoliar, Franke! und Rosenschein dient im Kern als Verifikationsansatz der Schenkersehen Theorie, indem es Datenstrukturen und Operationen im Rahmen einer Programmiersprache formuliert, die es ermöglicht, durch Ausführung vorher durchgeführter Analysen die Konsi-= stenz dieser Analysen und Konzepte zu überprüfen. Der in der Cognitive Science gestellten Forderung (Johnson-Laird 1981, 1983) nach einer Theo riebildung im Rahmen der partiell rekursiven Funktionen bzw. der Turing maschinen oder äquivalenter Systeme wird somit Rechnung getragen. Ein Problem ist in diesem Zusammenhang jedoch erwähnenswert. So kann, wenn ein P rogramm empirisch getestet wurde und sich keine Fehler einstellten, sehr häufig davon ausgegangen werden, daß dieses Programm die gewünschte Spezifikation erfüllt, d. h. die intendierte Funktion be rechnet und es sich somit um eine explizite Beschreibung und Erklärung eines Problembereiches handelt, dessen Prozessualität ebenso erfaßt wur de. Soweit wäre natürlich ein gewisser Fortschritt in bezug auf die Klarheit und Überprüfbarkeit der Formulierung innerhalb der Theorienbil dung getan, ebenfalls wäre die intersubjektive Überprüfbarkeit verbessert. Dies ist m. E. besonders in einem Gebiet wie der Musiktheorie not wendig, da sehr häufig eine wissenschaftliche Explikation und Theorien bildung unter Hinweis auf das in einem Werk ausgedrückte Numinose des Schaffensprozesses des künstlerischen Genies vorzeitig unterbunden wird,
292 so daß die Analyse eines Werkes nur durch einen ebenso opaken wie intuitiv-kongenialen künstlerischen Prozess erfolgen kann, deren Resultat, wenn überhaupt, nur durch Begriffsdichtung mitteilbar ist. Allerdings muß auf ein bei komputationellen Ansätzen, die ein Wechsel spiel von Begriffsentwicklung, Implementierung und experimenteller Über prüfung beinhalten, häufig nicht erwähntes Problem aufmerksam gemacht werden: Zwar fordert die Implementierung eines Problems eine explizite Formulierung der Datenstrukturen und der auf ihnen operierenden Algo rithmen, aber eine experimentelle Überprüfung des Programms daraufhin, ob es im allgemeinen bei jedem zulässigen Eingabewert auch die ge wünschte intendierte Funktion berechnet, ist auf diesem Wege nicht mög lich. Trotz des bisher korrekten Verhaltens eines Programmes auf zuläs sige Eingaben kann nicht ausgeschlossen werden, daß irgendwann einmal bei einem bisher nicht eingegebenen zulässigen Eingabedatum das Pro gramm einen anderen als den intendierten Ausgabewert liefert. Oie Sicherheit, daß solch ein Verhalten - abgesehen von Hardwarefeh lern - nicht auftritt, kann nur durch einen mathematischen Beweis erfol gen. Es handelt sich um das schwierige Feld der Programmverifikation, das in enger Beziehung zu der Erforschung der Semantik von Program miersprachen steht (vgl. Alagic & Arbib 1978). Auf beiden Gebieten wird zur Zeit intensiv geforscht und es bleibt abzuwarten, inwieweit automati sche Programmverifikationssysteme eine nützliche Hilfe werden geben können. Wenn auch diese Problematik für die praktische Anwendung nicht so relevant ist, muß sie jedoch bei der theoretischen Erörterung von Anfor derungen an die Theorienbildung berücksichtigt werden. Für praktische Untersuchungen stellt sich jedoch die Frage, inwieweit rhythmische Aspekte in einer Analyse gleichzeitig zu erfolgen haben oder aber getrennt werden können. Franke!, Rosenschein & Smoliar (1978, 132) verweisen darauf, daß es notwendig sein könnte, die Tonhöhenklassen analyse mit einer rhythmischen Analyse als kooperierende Prozesse zu implementieren. Als mögliche Realisierungsform eines solchen Systems verweisen sie auf das blackboard-Modell von Erman und Lesser (1980), auf welches denn auch Jones, Miller & Scarborough (1988) in ihrer Im plementierung der generativen Musiktheorie Lerdahls und Jackendoffs (1983) zurückgreifen (näheres vgl. Kap. 3. 2. 7, S. 332 ff.). Musikpsychologische Fragen wurden insofern nur indirekt einbezogen, als Franke!, Rosenschein und Smoliar (1978) davon ausgehen, daß durch die Terme der Schenkersehen Theorie psychologisch relevante Strukturen der musikalischen Wahrnehmung erfaßt werden. Hiermit unterstellen sie natürlich, daß es sich bei Wahrnehmungsprozessen um rekursive Prozes se handelt, die adäq!-lat durch algprithmische Prozesse expliziert werden. Die Schenkersehe Theorie kann in ihrer komputationellen Form allerdings nur einen Rahmen für die Beschreibung der musikalischen Wahrnehmung
293 bilden, der ergänzt werden muß durch ein "Weltmodell", in welchem das notwendige Weltwissen bereitgestellt wird. Frankel, Rosenschein und Smoliar (1978, 134) machen hierzu folgende Anmerkung: Schenker's theo
ry of music provides a framewerk by which we may model musical perception, and it is questionable whether a program which produces Schenkerian analyses may be designed without a peripheral "world mo del" of musical perception. Wenn auch die Modellierung musikalischer Wahrnehmung nur indirekt via Schenkerscher Theorie ansatzweise erreicht wurde, so konnte an den Arbeiten Smoliars sehr gut gezeigt werden, wie bei der Modellbildung eines Gegenstandsbereiches mittels Computer vorgegangen wird. Smoliar (Music-Research-Digest, Donnerstag, 25. Januar 1990) faßt die entschei denden Schritte zusammen: 1. Abstraction: identifying those objects you
are interested in and the particular properties you wish to examine and ultimately make prediction about. 2. Representation: identifying those primitive symbols and rules of structuring which you will use to corre spond to those objects and their properties. 3. Manipulation: identifying the operators by which you can create new symbol structures from existing ones. Smoliar hebt diese Arbeitsweise hervor, da seiner Meinung nach häufig von einer bestimmten Programmiersprache für die Modeliierung ausge gangen wird und man sich dann bei der Modellierung mehr von den vorhandenen Datenstrukturen und Operationen leiten läßt als von dem zu modellierenden Gegenstandsbereich. Stephen W. Smoliar (Music-Re sarch-Digest, Donnerstag, 25. Januar 1990) merkt hierzu an: Beginning one's argument by choosing a programming language (ANY programming
language) is to make a commitment to matters of manipulation before you have established that you have a representation which is consistent with your abstraction. Ultimately, the objects you select will have more to do with your choice of programming language than with your appreciation of the knowledge you wish to model. Auch wenn Smoliar grundsätzlich darin zuzustimme·n ist, daß die Wahl der Programmiersprache eine untergeordnete Rolle spielen sollte, muß andererseits angemerkt werden, daß man bei der Modellierung eines Gegenstandsbereiches natürlich die Kenntnisse über die Grenzen und Möglichkeiten des zu benutzenden Werkzeuges benötigt. Dies ist beson ders von Bedeutung, wenn man, wie Stephen W. Smoliar (1990c; vgl. He witt 1991) anknüpfend an seine frühen Untersuchungen (Smoliar 1967), die komputationelle Forschung zur Musikwahrnehmung in den Bereich der Distribuierten Künstlichen Intelligenz (DAI; distributed artificial intelli gence) stellt, in der Probleme der Beschreibung paralleler Informations verarbeitung und offener Systeme eine zentrale Rolle spielen. Weiterhin scheint mir die von Abelson und Sussman (1989, 1 ff.) vertretene Sicht weise von Programmiersprachen und Informatik (computer science) gerade
294 fUr den Bereich der Modeliierung komplexer Phänomene von größter Bedeutung, in der dem komputationellen Prozess Priorität eingeräumt wird und Programmiersprachen als Beschreibungsmittel solcher Prozesse sowie als Ausdrucksmittel für Ideen dienen. Abelson und Sussmann (1989, XV) wollen daher die Idee verbreiten: . . that a computer language is not just a way of getting a computer to perform Operations but rather that it is a novel medium for expressing ideas about methodology. Thus, programs must be written for people to read, and only incidentally for machines to execute. Diese Sichtweise führt sie (Abelson & Sussman 1989, XVI) auch zu einem anderen Verständnis von Informatik: Underlying our approach to this subject is our conviction that "computer science" is not a science and that its significance has little to do with Computers. The computer revolution is a revolution in the way we think and in the way we ex press what we think. The essence of this change is the emergence of what might be best called procedural epistemology - the study of the structure of knowledge from an imperative point of view, as opposed to the more declarative point of view taken by classical mathematical sub jects. Mathematics provides a framework for dealing precisely with notions of "what is". Computation provides a framework for dealing precisely with notions of "how to". Wenn wir einmal von der am MIT verbreiteten Idiosynkrasie gegen deklarative Darstellungsformen absehen1, so kann m. E. zurecht behaup tet werden, daß die sogenannte "Computerrevolution" nicht so sehr an der physikalischen Realisierung des Rechners festzumachen ist, als viel mehr in der Bereitstellung konzeptueller Werkzeuge. Für die philosophi sche Diskussion sind z. B . die Konzepte der Automatentheorie, Logik etc. zu nennen und für die praktische Modellierungsarbeit die Programmier sprachen. Bevor ich weiter auf die Modeliierung musikalischer Wahrnehmungspro zesse eingehe, wie sie in der Kognitiven Musikpsychologie von Herbert Bruhn durchgeführt wurde, möchte ich mich mit Ansätzen beschäftigen, die eine Programmiersprache verwenden, welche neuerdings auch in der musikwissenschaftliehen Forschung verstärkt in Erscheinung tritt und den deklarativen Aspekt der Programmierung betont: PROLOG. Hierbei wird der Unterschied von deklarativer und prozeduraler Programmierung bzw. Wissensdarstellung angesprochen, der in den 70er Jahren heftige Debatten in der Kl auslöste. .
I) vgl. Stoyan 1988 über die Auswirkungen dieser Einstellung für die Entwicklung von Programmiersprachen und die Ablehnung von PROLOG.
295 3. 2. 3.
Prozedural versus deklarativ: Semantische Netze und PROLOG in der Musikforschung
In der Musikforschung zeigen sich verstärkt Bemühungen, die Program miersprache PROLOG in verschiedenen Gebieten einzusetzen, wobei bis her die Theorie der dodekaphonischen Musik, wie sie in Amerika entwik kelt wurde, besondere Berücksichtigung findet. Es wurde aber nicht nur auf den Bereich der dodekaphonischen Musik und die mit ihr verbundene Theorienbildung Bezug genommen; genannt sei an dieser Stelle nur die Arbeit von Gerhard Widmer1 vom Institut für Medizinische Informatik und Artificial Intelligence der Universität Wien, der die Benutzung von PROLOG als Implementierungssprache eines Sy stems beschreibt, das in der Lage ist, zu einer vorgegebenen Stimme, dem cantus firmus, in einer bestimmten Tonart eine zweite Stimme, unter Berücksichtigung von Einschränkungen, die sich aufgrund eines Stiles ergeben, hinzuzufügen bzw. die hierfür notwendigen !Regeln zu erlernen. Auch in dieser Arbeit läßt sich der Trend feststellen, die in einer Pro grammiersprache formulierten Konzepte musikalischer Strukturen gleich zeitig als Modelle der am Perzeptionsprozess beteiligten Strukturen zu deuten. Gerhardt Widmer schreibt (o. J., o. S.), daß attempts to model
some basic features of musical perception with a system that uses this model as a basis for learning may lead to interesting insights into the structure of tonal music; such attempts may provide us with some indi cations as to the logical connection between abstract perceptional effects and specific systems of rules which define a particular musical style.
Auf die dodekaphonische Musik beziehen sich u.a. die Forschungen von Mira Balaban (1985, 1986) im Rahmen der Kognitiven Musikwissenschaft (Laske 1987, 169 ff.) sowie John Roeder (1988). Zeichneten sich die formalen amerikanischen Ansätze dadurch aus, daß sie die psychologische Relevanz ihrer grundlegenden Konzepte fUr unwesentlich, wenn nicht gar für überflüssig hielten,2 so wird bei den neueren Ansätzen von Mira Balaban und John Roeder auch der Aspekt der "kognitiven Segmentierung" betont, welcher durch die von ihnen entwickelten Analysekonzepte einer formalen Musiktheorie erfaßt wird. Mira Balaban, die sich in ihren Arbeiten bisher 1) Vgl. den preprint o. J. des 1988 auf dem in St. Augustin von der GMD (Gesell schaft für Mathematik und Datenverarbeitung) unter der Leitung von Christoph Lischka
veranstalteten 1. Workshop on Al and Music gehaltenen Vortrages. Eine weitere Arbeit, die sich mit der logischen Programmierung beschäftigt, um die Harmonisierung von Bach-Chorälen formal zu beschreiben ist die von Kemal Ebcioglu 1986, 1988. 2) Eine Diskussion dieses Punktes sowie eine Darstellung der Babbittschen Theorie zur Zwölftonmusik und weiterer formaler theoretischer Ansätze findet sich in meiner Magisterarbeit (Seifert 1986, 53-61) sowie in Schneider & Seifer1 1986, Seifert 1990 im Druck; für ein einführendes Standardwerk zur atonalen Musiktheorie soll auf Rahn 1980a verwiesen werden.
296 mit der dodekaphonischen Musik beschäftigte, aber eine Extension ihres Ansatzes (Balaban 1986, 261; 1989) u. a. auf die Theorie von Lerdahl und Jackendoff (1983) anstrebt, will mit dem von ihr entwickelten System CSM (Computer Study of Music), dessen ultimate goal ... is to lay a "cornerstone" for a generat formal study of WTM (Western Tonal Music; U. S. ), einen allgemeinen Rahmen für den Forschungsbereich computerun terstützter musiktheoretischer Forschung bereitstellen. Sie (Balaban 1986, 241) charakterisiert die Situation in diesem Bereich wie folgt: The com
puter study of music began in the late 50's and concentrated mainly on the analysis/synthesis of Western Tonal Music (WTM). The dominant approaches were at first probabilistic, later grammatical. Yet thirty years of work have not initiated any general research on the computer model ling of WTM theory. Moreover, existing works do not provide any stable base for further research. Specific works with a weak computational ba sis and unclear theoretical content cannot combined to handle problems of Zarger scope. We think that Artificial Intelligence (AI), backed by its computational methodo/ogy for handling non-formal knowledge, might succed where other approaches failed. That is, AI might help in building a basis for a general and formal music theory. Mira Balaban charakterisiert m. E. nach treffend die Entwicklung des Computereinsatzes im Feld der Musikforschung. Bestand in den 60er Jahren eine enge Beziehung zwischen Computermusik, Informationstheorie und statistischen Verfahren, die Anfang der 70er Jahre durch lingui stisch-grammatikalische Untersuchungen abgelöst wurden, so sind die 80er Jahre gekennzeichnet durch den Übergang zu Methoden, die in der Kr Forschung entwickelt wurden und in den 90er Jahren, in Verbindung mit der Kognitionswissenschaft, stärker in das allgemeine Bewußtsein dringen werden. Allerdings ist Mira Balaban nicht zuzustimmen, wenn sie davon spricht, daß andere bisher durchgeftihrte Untersuchungen aufgrund der "schwachen komputationellen Grundlage und des unklaren theoretischen Gehaltes" nicht zusammengefügt werden können, um komplexere Probleme anzuge hen. So zeichnet sich ein großer Teil der bisher von mir angesprochenen Arbeiten - wie z. B. die von Winograd, Smoliar, u. a. - durch eine "starke komputationelle Grundlage und einen klaren theoretischen Gehalt" aus. Allerdings stimmt es, daß bisher kein einheitliches Instrumentarium zur "formalen" komputationellen Untersuchung musikalischer Strukturen ent wickelt wurde und metatheoretische Untersuchungen der benutzten For malismen selten sind. Ob die speziell in der KI entwickelten Methoden in dieser Hinsicht mehr leisten, bleibt zu bezweifeln. So gibt es auch in der Sprachverarbeitung verschiedene Formalismen, deren metatheoretische Untersuchung sich noch in den Anfängen befindet� Weiterhin bereitet 1) Eine erste Arbeit die solche Probleme u. a. im Rahmen der Komplexitätstheorie ausführlich diskutiert, ist z. B. Barton. Berwicl< & Ristad 1987.
297 gerade die Ausarbeitung einer allgemeinen Theorie der Wissensrepräsen tation, einem zentralen Gebiet der KI, große Schwierigkeiten� Mira Balaban benutzte in ihrer Dissertation Toward a Computerized Analytical Research of Tonal Music (1981) u. a. semantische Netzwerke zur Beschreibung musikalischer Strukturen (Roads 19 85a, 176 ) Bei se mantischen Netzwerken - auch assoziative Netzwerke bzw. Netze genannt (Charniak & McDermott 1985, 22 ff.) - werden Terme durch Knoten und Relationen durch beschriftete gerichtete Kanten dargestellt (vgl. Kobsa 1984, 54). Sie dienen in in der Kognitiven Psychologie zur Modellierung von Gedächtnisprozessen2 und sind neben den Produktionssystemen3 zen tral für den neuen Forschungsbereich der Wissenspsychologie� Sowohl Kobsa (1984, 55) als auch Johnson-Laird, Chaffin und Herrmann (1984, 302) machen darauf aufmerksam, daß trotz der Vielzahl der verschiedenen semantischen Netzwerke keine genaue Definition dieses Konzeptes be steht. Jedoch weist Kobsa (1984, 55) auf drei Typen von Kanten hin, die in fast allen semantischen Netzen vorkommen: .
a) Die Generalisierung (IS-A) - Die durch das untergeordnete Kon zept beschriebene Klasse von Individuen ist in dem subsummierenden Konzept vollkommen enthalten. Beispiel: Vogel IS-A -?Tier b) Die Individualisierung (INSTANCE-OF, MEMBER-OF) - Es wird das Objekt (token) mit seiner Objektklasse (type) verbunden. Beispiel: Tcheepie INSTANCE-OF -?Vogel 1) vgl. die verschiedenen Beiträge in der Zeitschrift Informationstechnik 1989/4 zum Schwerpunktthema "Wissensrepräsentation" und West, Howell & Cross 1991. 2) Zur Wissensrepräsentation mit semantischen Netzwerken vgl. Wender 1988. Krause & Wysotzki 1984 erörtern die psychologische Relevanz der vorwiegend in der Kl ent wickelten Wissensrepräsentationsformalismen. Eine Darstellung der verschiedenen Formalismen zur Modeliierung von Gedächtnis und Gedächtnisprozessen geben Rumel hart & Norman 1988. Überblicke zu verschiedenen Repräsentationformalismen zur Darstellung der kognitiven Verarbeitung und Repräsentation musikalischer Strukturen in der Kognitiven Musikpsychologie geben Nauck-Börner 1985 und Stoffer 1985b. 3)Produktionssysteme wurden von Newell 1973 in die Kognitive Psychologie eingeführt und werden ebenfalls in der KI benutzt. In der Kognitiven Musikpsychologie werden sie
von Sloboda 1985 angewandt (vgl. die Kap. 3. 2. 6, S. 328 ff.). Weiterhin werden sie zur Modeliierung der generativen Musiktheorie (Lerdahl & Jackendoff 1983) von Jones, Mil ler & Scarborough 1988 benutzt (s. die Darstellung und Diskussion in Kap. 3. 2. 7, S. 332 ff.). 4) Über den neuen Forschungszweig der Wissenspsycholo gie vgl. Mandl & Spada 1988, 1. Zur Beziehung von Kl und Kognitiver Psychologie vgl. auch Kobsa 1984. Eine der bekanntesten Arbeiten der Kognitiven Psychologie, in der semantische Netzwerke be nutzt werden, dürfte Language, Memory and Thought von J. R. Anderson 1976 sein, in der er sein ACT-System vorstellt (vgl. auch Barr & Feigenbaum 1981, Kap. XI). Eine Kritik der semantischen Netzwerke als Basis psychologischer Theorien Johnson-Laird, Chaffin & Herrmann 1984.
lieferten
298 c) Aggregierung (PART-OF, HAS-AS-PART) - Ein Objekt wird mit seinen Attributen (Teile, Eigenschaften, Funktionen) verbunden. Bei spiel: Flügel PART-OF�Vogel Als Beispiel soll hier ein Netz von Roads (19 8Sa, 185) dienen, der die Beschreibung einer musikalischen Phrase a-b-cLd1-e 1 durch ein semanti sches Netz wie folgt angibt:
Klar zu erkennen sind neben den Relationen next-event, last-event, next-scale-degree die Generalisierung is-a und die Aggregierung part-of.1 Hatte Mira Balaban zuvor mit LISP gearbeitet, so benutzt sie in neue ren Arbeiten (Balaban 1985, 1986, 260 ff.) PROLOG zur Implementierung ihres theoretischen Ansatzes. Bei der Diskussion um Formalismen zur Wissensrepräsentation in den 70er Jahren spielte, wie bei der Entwicklung von Programmiersprachen, die Frage nach der prozeduralen versus der deklarativen Repräsentation eine zentrale Rolle in der Entwicklung der Ideen der KI� Gab es in den 70er Jahren heftige Diskussionen zwischen den Deklarativisten und Pro zeduralisten, so ist man heute übereingekommen, beide Formen neben einander zu verwenden (Kobsa 1984; Freksa 1989). Neuerdings wird auch in der musiktheoretischen Forschung explizit von deklarativen Modellen gesprochen, die "besser" seien als prozedurale (Reeder 1988, 21), for a
significant body of twentieth-century music, a declarative system models 1) Die Relationen sind wie folgt zu lesen: next·event: b ist das nächste auf a folgende
Ereignis; last event: a ist das b vorangegangene Ereignis; next·scale·degree: b ist der nächste in der Skala folgende Ton auf a; is-a-note: a ist eine Note; part-of-phrase: a ist Teil der Phrase a·h·cl.dl-e1. 2) vgl. z. B. Winograd 1975, 185 ff.; zusammenfassend Barr & Feigenbaum 1985, 172 ff.
299
the structure of analytical understanding better than do existing proce dural programs, ... Aus diesem Grunde, und weil die Unterscheidung von prozeduraler und deklarativer Wissensrepräsentation bzw. Programmierung zentral ist für die Ideenentwicklung der KI, soll die folgende Skizzierung der logischen Programierung mit PROLOG einerseits dazu dienen, die Unterscheidung von prozeduraler und deklarativer Wissensdarstellung zu erhellen, die in den 70er Jahren eine große Kontroverse in der KI-Forschung und Cogni tive Science auslöste (Freksa 1989, 136 u. 137); sie soll andererseits ei nen Einblick in die Jow-level-representation der Töne bei Mira Balaban (1986, 247; 1985) geben. Die Deklarativisten1 sind der Meinung, daß die Beschreibung von Beziehungen zwischen Elementen eines Gegenstandsbe reiches, das " What" wesentlich ist, während die Prozeduralisten glauben, daß das "How to", das handlungsorientierte Wissen, dem Menschen leich ter zugänglich sei. Für den Bereich der Programmierung mit PROLOG faßt Stoyan (1988, 298) dies wie folgt zusammen: Von großer Bedeutung ist jedoch die Umstel
lung in der Programmierung, denn die Ablaufplanung tritt deutlich zu rück hinter den Aspekten der begrifflichen Ordnung. Eine grobe Unterteilung von Wissensrepräsentation und Programmier sprache in deklarative und prozedurale ergibt folgende Matrix:
deklarativ prozedural
Wissensrepräsentation semantisches Netzwerk Produktionssysteme
Programmiersprache PROLOG LISP
Es muß an dieser Stelle darauf hingewiesen werden, daß diese Eintei lung "Extrempositionen" charakterisiert. Terry Winograd (1975, 1 8 5 ) schrieb in bezug auf die Unterscheidung: From a strictly formal view there is no
distinction between the positions.
Christopher Habe! (1986, 41) merkt zu der Unterscheidung von prozedu raler und deklarativer Wissensrepräsentation an: In der - hier verein
facht dargestellten - Sichtweise der Kl entspricht die obengenannte Dichotomie (deklarativ/prozedural; U. S. ) dem Gegensatzpaar: 'Wissen in Form von Daten' vs. 'Wissen in Form von Programmen'. Die Vor- bzw. Nachteile der beiden Repräsentationsformen erläutert Christopher Habe! (1986, 41) wie folgt: Deklarative Repräsentationen haben
den Vorteil der Flexibilität und der Ökonomie (bzgl. des Aufbaus der Wissensrepräsentationen). Da keine expliziten Kontrollstrukturen vorge geben werden, sondern übergeordnete Informationsverarbeitungsprozesse den Zugriff auf die unterschiedlichen Wissenskomponenten steuern, müssen bei der Repriisentation des einsetzbaren Wissens keine Entschei1) vgl. Stoyan 1989, 193 zu den Vorteilen der deklarativen Programmierung.
300 dungen über den Prozessablauf getroffen werden. Wird im Extremfall alles Wissen in Form von Daten repräsentiert, führt dies leicht zur relevanten Ineffizienz bei der Verarbeitung. Die Suche nach Wissenseinheiten und die Entscheidung über die nächsten Prozeßschritte müssen bei jedem Prozessablauf durchgeführt werden. In diesen Punkten sind die Vorteile der prozeduralen Wissensrepräsentation gegeben. Zum einen sind die Kontrollstrukturen in Prozeduren explizit vorgegeben, zum anderen kann prozedural in einfacher Weise ein Verweis auf als relevant vermutete Wissenseinheiten repräsentiert werden. Er weist aber, ebenso wie Winograd, darauf hin, daß es sich um "ex treme" Interpretationen handelt, und ein in LISP geschriebener Algorith mus - das Programm selbst - als Datum aufgefaßt werden kann und PROLOG-Programme sowohl eine prozedurale als auch logisch-deklarative Sichtweise ermöglichen! Abelson und Sussmann (1989, 1 1 ) geben eine typische prozedurale Les art einer Lispfunktion: (define (square
J,
J,
x)
J,
( *
J,
X
J,
X ))
J,
To square something, multiply it by itself Die logische Programmierung wird von Mira Balaban (1985, 7) folgen dermaßen beschrieben: This logic programming technique consists of for mulating a set of rules and facts (collectively called clauses), each of which is a simple statement of some truth that one wishes to record in a knowledge base. A statement has the form B :- A1, , An· in which B is the conclusion and the A1 's are conditions all of which (the statement is saying} must be true in order that the conclusion be true. If the Iist of conditions is empty, the clause is called a fact, otherwise it is a rufe. These are the basis of the language Prolog (the name prolog stands for J2!.0gramming in ]2gjc). Wie ist jetzt eine PROLOG-Klausel zu lesen? Bratko (1986, 41) gibt rtir die Klausel "P : - Q, R" folgende deklarative Lesarten an: P is true if Q and R are true. From Q and R follows P. Es sind aber auch prozedurale Lesarten möglich (Bratko 1986, 41): To solve problern P, first solve the subproblern Q and then the subproblern R. To satisfy P, first satisfy Q and then R. Wie zu erkennen, wird bei der prozeduralen Lesart von der Reihenfol ge der zu lösenden Aufgabe gesprochen, während in der deklarativen Lesart nur auf die Wahrheit der Bedingungen Bezug genommen wird. Um die Art der Programmierung in PROLOG, wie sie von Balaban skizziert .••
1) Ich werde weiter unten ein Beispiel hierfür geben.
301 wurde, zu illustrieren , soll jetzt eine Datenbasis von elementaren mu sikalischen Fakten gegeben werden und eine Klausel, die aus den angege benen Notennamen und einer entsprechenden Alteration den entsprechen den Zahlwert der alterierten, durch den Namen bezeichneten Note be stimmt. Das Programm 1 nimmt folgende Form an: Die Datenbasis enthält die Fakten: diatonic(c, diatonic(d, diatonic(e, diatonic(f, diatonic(g, diatonic(a, diatonic(h,
0). 2). 4 ).
S). 7). 9).
11).
alteration(n, 2). alteration(u, 1 ). alteration(n, 0). alteration(b, -1 ). alteration(bb,-2).
Weiterhin enthält sie die Regel: pitch-translate( ( Pitchname, Alterationszeichen), Pitchvalue) diatonic (Pitchname, Diatonicpitchvalue ), alteration(Aiterationszeichen, Alterationvalue), Pitchvalue is Diatonicpitchvalue + Alterationvalue. Die Regel ist zu lesen: Aus diatonic(Pitchname Diatonicpitchvalue) und Alterationvalue) sowie der Gleichheit der Summe von Diatonicpitchvalue und Alterationvalue mit Pitchvalue . folgt das Ergebnis von pitch-translate(( Pitchname, Alterationszeichen ) , Pitch value). Ein Dialog mit dem PROLOG-System sieht folgendermaßen aus: ,
alteration(Alterationszeichen,
?-pitch_translate([c, bbl, Zahlwertl . Zah htert = -2 yes ?-1
Das System zeigt durch das Zeichen "?-" an, daß es auf eine Eingabe wartet. Der Benutzer gibt als Anfrage an das System den Regelkopf der Regel pitch-translate ein. Er stellt sozusagen die Frage: Welches ist der Zahlwert um den der Ton c erniedrigt wird, wenn er durch das Alterati onszeichen "bb" verändert werden soll. Das System versucht nun durch einen bestimmten Mechanismus nachzuweisen, daß diese Regel erfüllbar ist und mit welchen Werten. Als Ergebnis liefert es einen oder mehrere 1) Das Programm alteriert einen gegebenen Ton der diatonischen Skala um eine große oder kleine Sekunde.
302 Werte, in diesem Fall -2, die diese "Aussage" zu einer erfüllbaren Aussage machen und "antwortet" bei Erfolg mit yes. Wie wird der Wert erhalten? tall<1>: tall(2): exit(2): tall(2): exit(2): tall(2): exit<2l: exit(1l:
p itth-translateC[t,bbl, ZahlHert) diatonit(t,Diatonitpitthvalue) diatonit(t,B) alteration(bb,Alterationvalue) alteration(bb,-2) ZahlHert is 9+(-2) -2 is ß+(-2) pitth-translate([t,bbl,-2)
Zuerst (call 2) versucht das System nachzuweisen, daß diatonic(c, Diatonicpitchvalue) erfüllbar ist, indem die Datenbasis nach einem Wert für Diatonicpitchvalue durchsucht wird, mit dem diatonic(c, Diatonicpitchvalue) wahr wird. In der Datenbasis führt diatonic(c, 0 ) mit Diatonicpitchvalue = 0 zum Erfolg (exit 2). Als nächstes (call 2) wird der Wert der Variablen Alterationvalue gesucht, der den Ausdruck alteration( bb, Alterationvalue) wahr macht. Es handelt sich um Alterationvalue = -2, und alteration(bb, -2) gilt als wahr. Im weiteren Schritt wird der Wert errechnet, der den Ausdruck "Zahlwert is 0 + -2" wahr macht. Dies geschieht durch Zahlwert = -2, und "-2 is 0 + -2" ist ebenfalls wahr. Aus der Wahrheit von diatonic(c, 0 ) und alteration(bb, -2} und - 2 i s 0 + - 2 folgt also pitch-translate(( c, bb) , -2). Und eine Antwort auf diese Frage lautet "Pitchvalue = -2". In LISP1 läßt sich dieses Verhalten durch folgende Datenbasis und Funktion definieren: Durch mehrmalige Anwendung von (putprop <<noten name» «Zahlwert» «eigenschaft») erhält jeder Notenname einen mit der Eigenschaft diatonic verbundenen Zahlwert. Zum Beispiel »(putprop 'c 0 'diatonic) liefert als "interne" Struktur (diatonic 0}. Die Funktion get mit (get <<notenname» «eigenschaft»} liefert den entsprechenden Zahlwert. So berechnet »(get 'c 'diatonic) den entsprechenden Wert 0. In ähnlicher Weise werden mit (putprop «alterationszeichen>> «Wert>> «eigenschaft») die "Fakten" für die "Eigenschaft" Alteration aufgebaut. Die Funktion, die das gleiche Verhalten aufweist wie pitch-translate von PROLOG, kann folgendermaßen programmiert werden: (defun lisp-pitch-translate (notenname alterationszeichen} (get notenname 'diatonic) (+ (get alterationszeichen 'alteration))} Sie läßt sich wie folgt lesen: Um durch lisp-pitch-translate bei gegebenen Notennamen und Alterati-
1) Zur genaueren Erläuterung der Arbeitsweise von LISP s. Kap. 2. 2. 4. 2, S. 149 ff. so wie den Anhang E, S. 400 ff.
303 onszeichen den Zahlwert zu erhalten, hole den Zahlwert des diatonischen Notennamens und den Zahlwert des alterierenden Alterationszeichens und addiere beide Werte. Über den eben illustrierten Unterschied von prozeduraler und deklarati ver Interpretation und Programmierung hinaus weist PROLOG noch einen interessanten Unterschied im Vergleich zu LISP auf. Wollte man in LISP einen Algorithmus formulieren, um zu einem gegebenen Zahlwert die entsprechenden Paare von Notennamen und Alterationszeichen zu erhalten, so müßte eine neue Funktion geschrieben werden; in PROLOG leistet die zuvor definierte Regel pitch-translate dies ebenfalls. Will man z. B. die zum Zahlwert 8 gehörigen Paare von Notenname und Alterationszeichen erhalten, muß sie nur in folgender Weise eingesetzt werden:
?- pitch-translate((Notenname, Alterationszeichen) , 8). Das System versucht nun in der beschriebenen Weise, die Wahrheit der "Anfrage" zu beweisen. Sie liefert folgendes Resultat: Notenname g Alterationszeichen = IS Notenname a b Alterationszeichen no =
=
Durch "no" wird angezeigt, daß außer den beiden angeführten Fällen keine weiteren Paare NotennameIAlterationszeichen die "Aussageform" pitch-transform( ( Notenname, Alterationszeichen ) , 8) erfüllen. War schon zu bemerken, daß sich durch Wissensrepräsentationsforma lismen wie semantische Netzwerke und Produktionssysteme der Einfluß der KI-Forschung auf die Kognitive Psychologie intensiviert hat, indem diese Formalismen als Mittel zur Modellierung von Gedächtnismodellen dienen, und andererseits die Diskussion über prozedural-deklarative Aspekte von Programmierung und Wissensrepräsentation psychologische Betrachtungen förderte, so finden sich noch weitere Konzepte der KI in der Kognitiven Psychologie bzw. der Kognitiven Psychologie in der Kl, die eine enge Beziehung dieser Forschungsrichtungen anzeigen. Daß es sich bei den semantischen Netzwerken nicht nur um Formalismen zur Darstellung sprachlichen Wissens handelt, sondern jene auch epistemologi sche Fragestellungen nach sich ziehen, belegt die Arbeit von Brachman (1979). Naturgemäß besteht, da viele Arbeiten sich mit dem Sprachver stehen beschäftigen, eine enge Beziehung zur Linguistik! Die in der KI 1) vgl. z. B. das Buch Sprache in Mensch und Computer von Schnelle & Rickheit (Eds.) 1988, in dem die Verbindung von psychologischer, linguistischer und von der KI beein· flußten Argumentation offenkundig ersichtlich ist.
304
benutzten Produktionssysteme wurden explizit zur Molleliierung kognitiver Prozesse entwickelt! Die Idee der frames (Rahmen) und scripts (Drehbü cher) zur Wissensrepräsentation in der KI ist durch die Gedächtnisforschun gen des Psychologen Bartlett motiviert worden, welche in der Idee des Schemas kulminierte, um Gedächtnisstrukturen zu beschreiben? Auch den für das Parsing wichtigen augmented transition networks3 (erweiterte Transitionsnetzwerke) wurden psychologische Interpretationen ftir die mentale Sprachverarbeitung zugesprochen (vgl. Kaplan 1972; vgl. auch Jackendoff 1991 für die Musikwahrnehmung). Es liegt natürlich nahe, ih nen, wenn solche Formalismen zur Analyse musikalischer Strukturen und beim Aufbau musikalischer Expertensysteme4 eingesetzt werden, ebenfalls eine musikpsychologische Interpretation zu unterlegen, indem man sie als Modelle der kognitiven Verarbeitung musikalischer Strukturen interpre tiert. Die bisher angesprochenen Formalismen zur prozeduralen und de klarativen Wissensrepräsentation werden auch als propositionale Wissens darstellungen bezeichnet und der analogen Wissensrepräsentation gegenü bergestellt (Freksa 1989; Habel 1986, 40). In der Kognitiven Psychologie und KI gab es neben der prozedural/deklarativ Kontroverse auch eine propositionallanalog Diskussion. Auch in der Musikpsychologie finden sich Vorschläge, propositionale Wissensdarstellungen5 zu verwenden. Ich werde in dieser Arbeit u. a. auf die von John Sloboda (1985) und Herbert Bruhn (1988) vorgenommenen Modeliierungen eingehen, da sie mir besonders geeignet scheinen, die Anwendung der in der KI benutzten Formalismen innerhalb der kognitiven musikpsychologischen Forschung zu verfolgen. Zunächst soll auf die von Bruhn (19 8 8 ) entwickelten propositionalen Schemata eingegangen werden. Der Musiker, Dirigent und Musikpsycholo ge Herbert Bruhn (1988) schlägt ein propositionales Modell der musikali schen Wissensrepräsentation vor, welches im nächsten Kapitel ausführli cher dargestellt und diskutiert wird.
1) Newell & Sirnon 1972, Newell 1973; Young 1979 gibt einen sehr guten Überblick über die Produktionssysteme. In der Kognitiven Musikpsychologie Sloboda 1985, 215 ff. 2) Ober die psychologische Bedeutung der scripts berichtet z. B. Robert Abelson 1981 . 3) Oie augmented transition networks (ATNs) sind erweiterte recursive transition networks, welche wiederum erweiterte endlichen Automaten sind. Eine prägnante Darstellung der Beziehung zwischen nichtdeterministischen endlichen Automaten, recursive transition networks und ATNs sowie deren unterschiedliche Komplexititäts· grades geben Moll, Arbib & Kfoury 1988, 167 ff. 4) Eine Anwendung der A TNs zur Beschreibung musikalischer Strukturen findet sich in den Arbeiten von Oavid Cope 1987, 1989, 199la, 1991b. Auch Winograd 1968 benutzte ATNs. 5) Sloboda 1985 erörtert Produktionssysteme zur Modeliierung musikalischen Lernens (vgl. auch Kap. 3. 2. 6, S. 328 ff.), und Thomas Stoffer 1985 und Christa Nauck·Börner 1988 betrachten das Schemakonzept für die Beschreibung von musikalischen Strukturen bzw. der mit ihnen verbundenen Gedächtnisstrukturen.
305 3. 2. 4.
Propositionale Wissensdarstellung und das Schemakonzept in der Kognitiven Musikpsychologie
Um das in der Diskussion um die analoge und propositionale Wissenre präsentation - die sogenannte Imagery-Debatte (vgl. auch Block 1981d) benutzte Konzept "analog" nicht mit der Unterscheidung analog/digital zu verwechseln, bevorzugt Freksa (1989, 137) den Ausdruck "analogisch". Ei ne Darstellung dieser Debatte und der Argumente der Proponenten gibt Anderson (1978). Die zentrale Frage der Debatte lautet (Habel 1986, 40):
Ist es gerechtfertigt, von einem einzigen Repräsentationsformat, dem deskriptionalen, propositionalen, auszugehen, oder muß darüberhinaus ein weiteres analoges, bildhaftes Repriisentationsformat angenommen werden?
Während in der Kl und besonders der Kognitiven Psychologie hinläng lich Einigkeit darüber zu bestehen scheint, was unter einer Proposition bzw. propositionalen Repräsentation zu verstehen ist, ist nicht besonders klar, was unter einer analogischen Repräsentation zu verstehen ist (An derson 1978, 251 ff.). Eine Proposition wird durch folgende drei Merkma le (Anderson 1978, 250; vgl. auch Gale 1967) charakterisiert: a) Sie ist abstrakt. b) Sie hat einen Wahrheitswert. c) Sie hat Bildungsregeln. Weiterhin kann sie bestimmt werden als invariantes Konzept, das bei Paraphrasierungen gleich bleibt. Wie kann man sich die Idee der Proposi tion klarmachen? Wesentlich ist festzuhalten, daß eine Proposition in einem Aussagesatz ausgedrückt werden kann. Ein Beispiel möge dies verdeutlichen. Die Sätze "Gittfried schlägt Wolfgang", "Wolfgang wurde von Gittfried geschlagen" und "Gittfried bat Wofgang" "Wolfgang est battu par Gittfried" drücken dieselbe Proposition aus, nämlich die Idee bzw. den Sachverhalt, daß ein Agens, welches durch den Namen "Gittfried" bezeichnet wird, in einer bestimmten Weise zu einem Objekt - durch den Eigennamen "Wolfgang" identifizierbar - in Beziehung steht, was in diesem Fall durch das Wort "schlagen" bzw. französisch "battre" zum Ausdruck gebracht wird. Eine Proposition kann demnach als die Aussage eines Aussagesatzes verstanden werden. Es muß allerdings erwähnt werden, daß in der analy tischen sprachphilosophischen Literatur der genaue Status einer Propostion bis heute nicht geklärt werden konnte. Jedoch ist klar, daß der darzu stellende Sachverhalt beschreibend erfaßt wird, während bei der analogi schen Repräsentation eine starke Ähnlichkeitsbeziehung zwischen Sach verhalt und seinem Abbild besteht. Es wird daher auch häufig von bild hafter Darstellung gesprochen (Anderson 197 8, 252; Freksa 1989, 135 ). Anderson (1978, 252) merkt hierzu an: lt seems that the picture metaphor
306
is the only available model of imagery. ... the picture metaphor is the imagery theory. Freksa (1989, 35) spricht folglich auch von der Auseinandersetzung zwischen den Piktorialisten und Propositionalisten und gibt folgende Er läuterung des Konzeptes ''bildhaft": 'Bildhaff bedeutet in diesem Zusam menhang (d. h . der Frage, ob mentales Wissen propositional oder bildhaft repräsentiert sei; U. S.}, daß geometrische Eigenschaften des vorge stellten Objektes in der mentalen Darstellung erhalten bleiben. Ein Beispiel für eine Darstellung, in der alte riiumlichen Beziehungen erhal ten bleiben ist eine Photographie eines zweidimensionalen Objektes, die senkrecht zu der Objektebene aufgenommen wurde. Eine Photographie aus einem anderen Aufnahmewinkel oder eine Photographie einer drei dimensionalen Szene erhiilt nur einige der räumlichen Beziehungen. Als propositionale Repräsentationsformalismen können prinzipiell alle Logik-Repräsentationen verstanden werden (Freksa 1989, 139). Chri stopher Habel (1986, 48) zählt, diesen Aspekt berücksichtigend, hierzu semantische Netze, frames und scripts, die als notationelle Varianten der Prädikatenlogik bzw. bestimmter Erweiterungen derselben angesehen werden können. Anderson (1978, 250 u. 251) erwähnt vom psychologischen Forschungsstandpunkt aus u. a. die semantischen Netze (associative net works) sowie Roger Schanks conceptual-dependency-Formalismus (Schank 1972). Unter dem Aspekt der Diskussion um eine propositionale oder analegisehe Repräsentation sind die bisher von mir besprochenen Forma lismen als propositionale Darstellungsformen des am musikalischen Wahr nehmungsprozess beteiligten musikalischen Wissens zu verstehen. Es stellt sich die Frage, ob unter der bildhaften Interpretation des men tal imagery, die m. E. die einzige konkrete Interpretation ist, auch sinnvoll die Frage des musical imagery stellen läßt, und wenn ja, welche Repräsentationsformalismen die Vertreter des musical imagery angeben. So versucht John Sloboda (1985, 20) vor dem Hintergrund der in der Kognitiven Psychologie ausgetragenen imagery-Debatte eine ähnliche Fra gestellung für den Bereich der Kognitiven Musikpsychologie zu formulie ren: .. . , if language expresses propositions, does this imply that human thought is propositional? lf so, what rote does imagery play in thought ... ? Rather than pursue these issues, our purpose here is to see what a similar (Hevorhebung; U. S.) argument might Iook like for music. Es ist m. E. nicht klar, was unter musical imagery zu verstehen ist, wenn mit imagery eine bildliehe Darstellungsform gemeint ist. Was wäre das Bild einer Tonfolge, eines Akkordes etc.? Nicht gemeint sein können Assoziationen, die bei dem Hören eines musikalischen Phänomens auftreten, so wie z. B. die fallende kleine Terz (Kuckucksterz), die im europäischen Kulturbereich häufig als Kuckucksruf verstanden wird. Aber auch das Voraushören eines Tones bzw. Akkordes kann nicht
307 gemeint sein, es sein denn, wenn man aufgrund einer erklingenden Ak kordfolge nach dem letzten Akkord den noch nicht erklungenen nächsten, den erwarteten Akkord meint und in diesem Sinne von einem vorgestell ten, imaginierten nicht gerade erklingenden Akkord - ausgeht. I n die sem Fall ist m. E. die Anwendung des Erwartungskonzeptes zutreffender als die des musical imagery. Auch die Vorstellung einer Melodie - sozusagen die innere Wahrneh mung ohne daß eine äußere Reizquelle, eine gespielte Melodie vorliegt - , berechtigt m. M. nach nicht dazu, von einem musical imagery zu spre chen. Sobald diese Vorstellung - d. h. die vorgestellt·e Melodie - jedoch verbalisiert wird, kann davon ausgegangen werden, daß eine propositionale Repräsentation möglich ist. Es ist daher nicht verwunderlich, daß bisher noch keine Formalismen ftir das Phänomen musical imagery angegeben wurden. Schon Carl Stumpf war nicht klar, wie der Begriff der "Ge hörsvorstellung" sinnvoll auf den Bereich der Musikwerke übertragen wer den kann. Er (Stumpf 1888, 543) merkt in seiner Re:zension von Wundts Physiologischer Psychologie an: Von den Gehörsempfindungen unter -
scheidet Wundt nun im 2. Band die Gehörsvorstellungen , wobei e r unter Vorstellung "das in unserem Bewußtsein erzeugte Bild eines Gegenstan des oder eines Vorganges der Außenwelt" versteht. Es will mir nicht ge lingen, diese Definition gerade auf Gehörsvorstellungen, auf Intervalle, Akkorde, u.s.f. (denn diese werden hier behandelt) anzuwenden. Um die hier vertretene Position deutlich zu machen, sei darauf hinge wiesen, daß weder die Existenz der eben beschriebenen Phänomene bestritten noch ihre Untersuchung abgelehnt wird. Nur scheint es so zu sein, daß die Übertragung der mental imagery- Problematik, die ihren spezifischen Gehalt in der bildliehen Repräsentation findet, im musikali schen Bereich nicht sinnvoll ist. Propositionale Repräsentationsfor men scheinen mir nach dem bisherigen Stand der Forschung die einzig prakti kablen Formalismen zu sein, die für die Darstellung musikalischer Bezie hungen bzw. ihrer mentalen Repräsentationen in Frage kommen. Wenn auch inzwischen, ähnlich wie in der prozeduralldeklarativ Debatte in der Kognitiven Psychologie, zu einer Annäherung der Stand punkte von analogischen und propositionalen Repräsentationsmechanismen übergegangen wurde so soll noch auf ein philosophisches Problem hinge wiesen werden, das sich bei Annahme einer analogischen Repräsentation mentalen Wissens ergibt; das Problem eines unendlichen Regresses. Frek sa (1989, 135) beschreibt ihn mit folgenden Worten: ...: wenn die Dar ,
stellung eines Gebildes wiederum ein Bild ist, so benötigt man einen Betrachter; dieser wiederum erzeugt eine bildliehe Darstellung usw. Das Repräsentationsproblem wird damit nicht gelöst, sondern lediglich verschoben. So ist es dann auch nicht verwunderlich, wenn der größte Teil der Arbeiten der Kognitiven Musikpsychologie1 , die um die Angabe eines
1) vgl. Sloboda 1985, 215 ff; Nauck-Börner 1988; Stoffer 1985.
308 Repräsentationsformalismus bemüht sind, propositionale Darstellungen seien diese deklarativer oder prozeduraler Art - benutzen. So wählt auch Herbert Bruhn (1988) in seiner Harmonielehre als Grammatik der Musik als "ganzheitlichen" Repräsentationsformalismus realer und potentielle r funktionsharmonischer Sachverhalte eine propositi onale Darstellungform, die er in ein allgemeines Modell der menschlichen Informationsverarbeitung einbettet und empirisch überprüft. Ausgangspunkt des theoretischen Ansatzes von Herbert Bruhn bildet die seit den flinfziger Jahren herausgebildete und für die Kognitive Psycholo gie grundlegende Annahme des Menschen als einem informationsverarbei tenden System. Herbert Bruhn (1988, 33) nimmt eine Folge von vier Be schreibungsstufen mit drei Verarbeitungsstufen innerhalb des informati onsverarbeitenden Systems an: a) den physikalischen Reiz; b) die Transformation des physikalischen Reizes in neuronale Signale in den Rezeptoren; c) die neuronale Leitung und Vorverarbeitung der Signale d) die Repräsentation von realen und potentiellen Sachverhalten Die drei Verarbeitungsstufen (Bruhn 1988, 57 u. 58) bilden die Berei che b), c) und d) und sind unter Hinweis auf den derzeitigen Stand der neurophysiologischen Forschung angeführt.1 Hieraus jedoch zu schließen, daß es sich bei dem von Bruhn vorge schlagenen Repräsentationsformalismus um ein Modell mit neurophysiolo gischem Erklärungswert handelt, wäre verfehlt. Da Herbert Bruhn (19 88, 6 7) sich bei der Lokalisierung seines Re präsentationsmechanismus im wesentlichen auf die interagierenden Pro zesse innerhalb des Cortex - auf das psychophysische Niveau2 - bezieht, so muß wie bei den anderen propositionalen Darstellungsmechanismen, wie z. B. semantischen Netzen, ebenfalls von einem psychologischen Modell ge sprochen werden, denn es werden keine speziellen Funktionsabläufe3 neu1) Allgemeine Einführungen in die verschiedenen Etappen der neuronalen Informations verarbeitung finden sich in e. g. Arbib 1989, 3-84; Crick & Asanuma 1986, 333-371; Stevens 1986, 3-14; Nauta & Feirtag 1986, 89-98; Geschwind 1986, 113-120; Popper & Eccles 1982, Teil 2: Creutzfeld 1983. Die speziell auf das Hören bzw. auf Musik bezogene Informationverarbeitung des Nervensystems behandeln Roederer 1987; Ecke! 1982, 55-84; Petschke 1979, 70-84; Wehner 1980, 123-140; Sidtis 1984, 91-114. Eine Darstellung des Informationsübertragungsweges vom "Ohr" bis zu den Projektionszen tren des Cortex gebe ich in Kap. 2. 2. 2. 1. 2, S. 47 ff. 2) Vgl. Bischof 1966, 27 ff. zu diesem von dem Gestaltpsychologen Wolfgang Metzger im deutschen Sprachraum benutzten Terminus; vgl. auch S. 52, Anm. 1. 3) Eine Einteilung der neurophysiologischen "Gehirnmodelle" gibt Arbib 1975. Er (Arbib
1975, 283 ff.) unterscheidet acht Ebenen der neuronalen Modellierung: a) die Form Funktionsbeziehung eines Neurons; b) die Modeliierung der lateralen Inhibition; c) die
309 rologischer Prozesse modelliert. Im weiteren Verlauf seiner Untersuchun gen spielen neurophysiologische Erörterungen dann auch keine weitere Rolle. Zentraler ist flir seine Theorie die Klärung des in der Kognitiven Psychologie benutzten Schema-Konzeptes zur Repräsentation musikali scher Sachverhalte. Zu Recht kritisiert er (Bruhn 1988, 35 ff.) die nicht um begrifflich sachliche Klärung bemühten Anwendungen des äquivoken Schema-Konzeptes und versucht, dem Schemakonzept eine für seine Theorie brauchbare Definition zu geben. Er beschreitet m. E. nach den einzig richtigen Weg, indem er eine formale Definition dieser allgemei nen, in den unterschiedlichsten Bereichen genutzten, Idee anstrebt. Das Konzept des Schemas und der Proposition werden von Herbert Bruhn zu einander in Beziehung gesetzt und auf die Musik angewandt. Herbert Bruhn (1988, 35): Auch in der Musik lassen sich Schemata als Be
schreibungskonstrukte einsetzen. Geigensonaten, Oratorien wie auch andere Musikstücke stellen Wahrnehmungsdaten dar, die hierarchisch organisiert und strukturiert sind: sie bilden ein Schema. So sollen, nach Bruhn (1988, 35) Musikstücke ... mittels Schemata und Propositionen beschrieben werden. Bruhn (1988, 38) definiert das Schema als Bezeichnung für den strukturierten Zusammenhang von Sachverhal ten, die im menschlichen Informationsverarbeitungssystem reprä'sentiert sind. Des weiteren gibt er eine Klärung der Konzepte "Repräsentation von Sachverhalten" und "strukturierter Zusammenhang". Unter der "Repräsen tation von Sachverhalten" will Bruhn die bisher nicht näher bekannte, vom Nervensystem durchgeführte Informationsspeicherung über Sachver halte verstanden wissen. Er (Bruhn 1988, 38) spricht davon, daß die In formationen über Sachverhalte in Schemata reprä'sentiert werden. Herbert Bruhn (1988, 38) gibt folgendes Schaubild, um die Verarbeitung der phy sikalischen Reize bis zur Repräsentation der mit ihnen verbundenen In formation zu illustrieren. Modeliierung kleinerer Neuronenverbände, die eine bestimmte Funktion ausführen; d) die statistische Modeliierung der Funktionsweise, die motiviert wird durch die hohe Anzahl der Variablen, wenn Messungen an den Synapsen als Veränderliche betrachtet werden; e) die Modeliierungen des Lernverhaltens von Neuronenverbänden mittels adaptiver neuronaler Netzwerke; f) holograhpische Modellierung·en des neuronalen Ver haltens; g) Regelungs- und Kontrolltheorie zur Modeliierung der Arbeitsweise "über schaubarer einfacher" Hirnteile wie z. B. des Kleinhirns (Cerebellum); h) die kognitive Modellierung, in der. von psychologischen Verhaltensbeschreibungen ausgehend, ange strebt wird, diese mit Befunden über neuronale Arbeitsweisen und deren Lokalisierung in Beziehung zu setzen. Kl-Modelle psychologischer Prozesse spielen hierbei eine wesent liche Rolle. Zum Unterschied kognitive - neuronale Modellierung vgl. auch S. 52, Anm. 2. Doran (1971, 207-220) gibt ebenfalls eine Überblick über funktionale Modelle be stimmter Gehirnregionen. Auch er weist auf die psychologisch orientierten "Gehirnmo delle" hin. Eines der klassischen Modelle dieser Art ist Donald 0. Hebbs Theorie der cell assernblies und phase sequences zur Erklärung von Lernprozessen (Doran 1971, 217). Aber auch semantische Netze gehören in diese Klasse von Modellen (Doran 1971, 218).
310 Stadien
der
menschlichen Informationsverarbeitung
Abb. nach Bruhn 1988, 38
Unter potentiellen Sachverhalten werden vorgestellte Sachverhalte verstanden: wie z. B. die vorgestellte Melodie, die nicht real erklingt, während real perzipierte Sachverhalte einen physikalischen Reiz voraus setzen. Das Konzept der "Proposition" wird von Bruhn eingeführt, um Beziehungen zwischen Sachverhalten und Repräsentationen von Sachver halten (Schemata) auszudrücken. Eine Proposition wird von Herbert Bruhn , An und (1988, 40) als ein Ausdruck aufgefaßt, der aus n Argumenten A1, einem Relationsbegriff R, d. h. R (A1 , , An) besteht. Als Argumente der Pro positionen werden Sachverhalte und Schemata angenommen (Bruhn 1988, 41 ). Wie aus obiger Darstellung ersichtlich, bleibt allerdings unklar, ob für Bruhn diese Propositionen Sachverhalte sind, oder ob sie nur Beziehungen zwischen Sachverhalten bzw. deren Repräsentationen - den Schemata -, oder aber beides darstellen sollen. So schreibt er einerseits, daß Sche mata ebenso wie Sachverhalte Argumente von Propositionen seien, welche die Relationen der anstehenden Argumente zum Ausdruck bringen (Bruhn 1988, 41): Die Argumente der Propositionen sind jetzt nicht mehr nur reale oder potentiale Sachverhalte, sondern auch Schemata , die Infor mationen über eben diese Sachverhalte repriisentieren. Andererseits sind Schemata - so Herbert Bruhn (1988, 4 3 ) - Reprä sentationen eines zusammenhängenden Bereichs von realen oder poten tiellen Sachverhalte n: . .. Die Sachverhalte und ihre strukturellen Zusam menhiinge werden durch das psychologische Konstrukt Schema organi siert und reprä"sentiert. Es stellt sich die Frage, ob Schemata Propositionen oder Propositionen Schemata sind, ob Sachverhalte durch Propositionen oder durch Schemata oder Schemata durch Propositionen dargestellt werden. Ich gebe die ausführliche Begriffsbestimmung von Herbert Bruhn (1988, 40 ), um über diese Fragestellung Klarheit zu gewinnen: Die realen und potentiellen Sachverhalte sind also nicht nur Tupel von n Elementen, sondern durch definierbare Relationen miteinander verbunden. Ebenso sind die Reprä sentation der Sachverhalte, also das Wissen von der Welt, nicht An sammlungen von getrennten Schemata, sondern ein vernetztes System. Um die Relationen zwischen Sachverhalten und zwischen den Repräsen tationen von Sachverhalten ausdrücken zu können, soll auf den Begriff der Proposition zurückgegriffen werden. •.•
..•
311 Es sollen nach dieser näheren Bestimmung des Propositionskonzeptes durch Bruhn Propositionen zum einen zur Darstellung . der bestimmbaren Beziehungen zwischen Sachverhalten dienen und zum anderen zur Dar stellung der Beziehungen zwischen Schemata, d. h. den Repräsentationen von Sachverhalten. Allerdings schreibt Herbert Bruhn (1988, 46) ein paar Seiten später: Kleinste Informationseinheiten stehen in propositionaler Beziehung zueinander. Größere Einheiten verbinden sich zu Netzen von Propositionen. Diese Netze stellen in anderen Verarbeitungszusammen hiingen Schemata dar, die sich wieder in propositionalen Beziehungen
zueinander befinden. Wenn Bruhn davon spricht, daß Einheiten in propositionaler Beziehung zueinander stehen, so ist gemeint, daß die Beziehungen dieser Einheiten zueinander durch Propositionen ausgedrückt werden können. Der weitere Inhalt des Zitats läßt sich folgendermaßen zusammenfassen: Propositionen können wiederum als Argumente von Propositionen dienen, die in anderen Verarbeitungszusammenhängen Schemata darstellen, die wiederum als Propositionen beschreibbar sind. Es wird leider nicht weiter ausgeführt, was Bruhn unte.c. in anderen Verarbeitungszusammenhängen verstanden wissen will, aber es ist zu schließen, das Schemata Netze, d. h . Bezie hungen zwischen Propositionen darstellen. Allerdings verwirrt den Leser ein Beispiel, das Herbert Bruhn (1988, 45) gibt. Schon die hierarchische Ordnung zwischen Schemata wie z. B. die Subordination unter Oberbegriffe ist als Proposition darstellbar:
ist ein (Elefant, Säugetier) Oie Proposition hat die Argumente "Elefant" und "Säugetier" , die Relation zwischen diesen Argumenten besteht aus dem Ausdruck "ist ein". Nach der zu Beginn gegebenen Definition der Proposition sind ihre Argu mente Sachverhalte oder Schemata. So wären die Worte "Elefant" und "Säugetier" als Sachverhalte oder Schemata zu interpretieren. Wenn sie jedoch als letztere interpretiert werden, stellt sich die Frage, wie z. B. das Schema "Elefant" als Relation zwischen Propositionen darstellbar ist. Bruhn hat in seiner Definiton der Proposition allerdings nur Schemata und Sachverhalte zugelassen, wobei Schemata als Informationen über Sachver halte verstanden werden. Es bleibt insgesamt unklar, wie die Beziehung zwischen Propositionen, Schemata und Sachverhalten beschaffen ist und was unter diesen Konzepten verstanden werden soll. Allerdings benutzt Herbert Bruhn die Konzepte Schema und Propositi on, um ein Modell von Musikstücken zu erstellen, die er als reale und potentiale Sachverhalte begreift. Diese musikalischen Sachverhalte lassen sich durch die fünf Parameter Rhythmus, Klang, Tonhöhe, Mehrstimmigkeit und Form (Bruhn 1988, 75) beschreiben. Herbert Bruhn (1988, 76) widmet sich des weiteren der Untersuchung der Beziehungen in der Mehrstimmigkeit und der
312
Harmoniefortschreitungen, um das Konzept der Tonalität und Tonalitäts beziehungen innerhalb eines Werkes zu erforschen, und entwickelt eine präzise ... formalisierte Schreibweise für die Darstellung dieser Sachver halte sowie ihrer psychologischen Repräsentation, den Schemata. Er strebt an, Tonalität als propositionales Schema zu erfassen, dessen Be schreibung durch Propositionen erfolgt. Die Argumente dieser Propositionen sollen Akkorde sein, die durch "T", "D", "S", "t" und einige andere Zeichen bezeichnet werden (vgl. Bruhn 1988, 82-83). Er scheint diese Zeichen jedoch auch als Variablen zu interpretieren, die je nach vorausgesetzter Tonart ihren Wert ändern. So hat z. B. das Zeichen "D" in bezug auf die Tonart C-Dur als Wert den G-Dur-Akkord, dagegen in bezug auf die Tonart F-Dur den �kkprq_ C..: Die d}lrch die Proposition beschriebenen Relationen werden durch T, S, D, V und P kenntlich gemacht und unterschieden. Es ergibt sich also folgende Darstellung für eine Proposition: S (S, T). Zur näheren Erläuterung sei die Tonika-Beziehung T, die nach Herbert Bruhn (1988, 88) eine Identitätsrelation ist und als "ist Tonika zu" gele sen wird, herangezogen. Herbert Bruhn (1988, 83) gibt flir die Tonika Beziehung folgende Menge von Akkorden, die als Argumente möglich sind: �
1: : T
T,
·: :· : II �
i7 } .
T .
t'
T
Es lassen sich z. B. die folgenden Kombinationen ftir die TonikaRelation angeben: 1(T, T}, T(t, T), T( T), T(T7, T). Sie wären nach Bruhn zu lesen als "T ist Tonika zu T", "t ist Tonika zu T", etc. Oder in bezug auf die Tonart C-Dur "Der C- Dur-Akkord ist Tonika zu dem C-Dur-Akkord", "Der c-Moll-Akkord ist Tonika zu dem C-Dur-Akkord", etc. Da Bruhn bei der Tonika-Beziehung ausdrücklich von einer Identitätsrelation spricht, müssen bei einer extensionalen Deu tung derselben neben der Reflexivität auch Symmetrie und Transitivität gelten. Im Falle der Symmetrie muß dann g�lten T (T, t)1 T (T, T7}, etc., und für die Transitivität muß z. B., wenn ( T(t, T) und T(T, T7) }, auch T (t, T7 ) gelten. Ob Bruhn diese extensionale Deutung der Tonika-Bezie hung im Sinn hat, wenn er von einer Identitätsrelation redet, ist nicht ganz klar. Es sollte jedoch, da er sich darum bemüht, eine präzise, formale Beschreibung musikalischer Sachverhalte zu erstellen und keine anderweitige Interpretation der Identitätsrelation angibt, zu vermuten sein, daß diese Interpretation intendiert ist. Es ergibt sich jedoch ein Problem, wenn in der graphischen Darstel•
�
�
�
�
A
.
313 lung des propositionalen Schemas von C-Our, wie Bruhn (1988, 85) sie angibt, aufgrund der Symmetrieeigenschaft der Tonika-Relation T T (c-Moll, C-Our) durch T (C-Dur, c-Moll) ersetzt wird. Wie auch immer man dieses Schema interpretiert, von einem C-Our Schema würde man nicht mehr sprechen, denn die Relationen S (F-Dur, c-Moll) und D (G-Dur, c-Moll) deuten mehr auf die Tonalität c-Moll denn auf die Tonalität C-Our. Es könnte eingewandt werden, daß diese Ersetzung eben ein anderes Tonalitätsschema definiere und nur das angege bene Schema für das Tonalitätsschema C-Our stünde. Aber dies widerspräche dem Ersetzungsprinzip, das eng mit der Identitätsrelation verbunden ist. Es ändert sich bekanntlich auch das Ergebnis von mathematischen Operationen nicht, wenn zuvor als identisch (gleich) e-rkannte Terme wie z. B. "2" und "1 + 1" mit "2 1 + 1", gegeneinander ersetzt werden kön nen wie z. B. in "3 + 2 = 5 = 3 + (1 + 1)". Darüber hinaus zeigen sich an diesem Beispiel noch zwei weitere Probleme, von denen eines ein technisches ist: es wurde nicht geklärt, wie eine Verkettung der Relationen zu erfolgen hat und wie eine Trans formation von der verbalen Darstellung der Propositionen zur graphischen erfolgt. Sollen die einzelnen Paare des graphisch darzustellenden Schemas einfach verkettet werden, wie es die "Makroproposition" eines Sonatensatzes vermuten ließe (Bruhn 1988, 86)? Dies könnte der bekannten Definition der Komposition von Relationen entsprechen, die folgende Form hat: A, B und C seien Mengen und R1 !;;; A x B und R2 � B x C zwei Relationen. Die Komposition R1 o R2 von R1, R2 erfüllt dann folgende Bedingung: =
Rl
o R2
:= { (a,c)
I
Es gibt ein b ( B mit aR1b und bR2c }
Abb. nach Bruhn 1988, 86
Die Darstellung der einzelnen Relationen ergibt folge·nde Form:
D (2.Thema,
l .Thema ), T( l .A Thema__, Reprise \ S(Durchiführung, Reprise). Eine Verkettung von D und T ergäbe X (2. Thema, Reprise).
314 Dies wäre eine weitere "Relation", die zu den bisherigen drei "Relatio nen" hinzugefügt wird, aber die zeitliche Entwicklung der harmonischen Struktur oder des formalen Aufbaus einer Sonatensatzform ergibt sich nicht aus der Menge der "Relationen". Die Sonatensatzform besteht aus der Exposition mit der Aufstellung des 1 . und 2. Themas, gefolgt von der Durchführung, der Reprise und der Coda, einer Struktur, die sich bei dem angegebenen Beispiel nicht aus der Verkettung ergeben würde. Wenn wir also die Verkettungsrelation anwenden, gibt es keine sinnvolle Interpretation der Beziehung der drei Tonalitätsrelationen. Sie stehen unvermittelt nebeneinander und beschrei ben nicht das Stück bzw. die Sonatensatzform. Auch ergäbe sich nach der Definiton der Verkettungsrelation kein zusammenhängendes Gebilde, sondern wieder einzelne Relationen. Wie steht es aber mit der Einsetzung von Propositionen in Propositio nen, wie sie sieb aufgrund der von Herbert Bruhn (1988, 88 u. 93) an gegebenen Beispiele vermuten läßt? Die "Makroproposition" des Sonatensat zes müßte die folgende Form annehmen: T(D(2.Thema, I . Thema),
S(Durchführung,
Reprise)).
Aber hieße dies nicht, daß die Dominantrelation zu der Subdominantre lation in Tonikabeziehung stünde? Dies kann nicht gemeint sein! Zum anderen gibt es neben den Problemen der technischen Darstellung auch ein inhaltlich-methodologisches Problem, das sich an der Bestimmung der zugrundeliegenden Tonalität aufweisen läßt. Einerseits will der Autor die Tonalität eines Schemas durch die Kombinatorik der einzelnen Propositio nen bestimmen, andererseits muß er eine Tonalität voraussetzen, um die Propositionen sinnvoll zu interpretieren. Diese� Problem zeigt sich klar in der Bestimmung der Subdominant-Beziehung S und der Dominant-Bezie hung D, die auch als konditionale Relationen (Bruhn 1988, 84) bezeichnet werden. Bruhn (1988, 84; Hervorhebungen; U. S.) schreibt: Die Beziehung z. B. zwischen dem Subdominant- und dem Tonikaakkord ist bedingt durch die Existenz des tonalen Zentrums. Das heißt, es muß erst ein tonales Zentrum definiert sein, bevor eine Relation S oder ß wirksam werden kann. An anderer Stelle heißt es dagegen (Bruhn 1988, 106; Hervorhebungen; U. S.): Bestimmte Propositionen (S und D) legen in westlich- europäi scher Musik das Schema der Tonalität fest. aufgrund dessen Wahrneh mungserwartungen bezüglich der folgenden Akkorde gebildet werden. Weiterhin führt Herbert Bruhn als neues Konzept der Erklärung der harmonischen Entwicklung innerhalb eines Musikwerkes die Rekursion ein. Er entlehnt dieses Konzept der Informatik bzw. der Mathematik und Logik. Mit diesem Konzept soll die rückbezogene harmonische Umdeutung von Akkorden erklärt werden. Bruhn (1988, 96) erläutert das Konzept der Rekursion wie folgt: Dieser späte Rückbezug auf bereits Gewesenes liißt
315
sich mit dem informationstheoretischen Begriff der Rekursion erklären. Bei Rekursionen handelt es sich abstrakt gesehen um eine Funktion oder Prozedur, die sich selbst aufruft. Innerhalb der Prozedur befindet sich eine undefinierte Aussage, die nur wieder durch Aufruf derselben Prozedur gelöst werden kann. Rekursive Prozeduren können zu einer endlosen Schleife im Programm führen, wenn der erneute Durchlauf unter denselben Bedingungen erfolgt. Das ist dann nicht der Fall, wenn die vorliegenden Daten aufgrund des ersten unvollständigen Prozedur laufs anders interpretiert werden müssen. Das Prinzip der rekursiven Definition1 sei noch einmal kurz an einer einfachen Funktion in LISP erläutert. Diese Funktion gibt die Anzahl der in einer Liste enthaltenen Elemente zurück. (defun LAENGE (Liste) (cond ((nullp Liste) 0) ( t
(+ 1
(LAENGE (rest Liste)))) ))
; Ist die Liste leer? Ja - Ergibt 0 ; Die Liste ist nicht leer. Also addiere 1 z:u dem Rest der Liste.
Wie zu erkennen ist, erscheint der Funktionsname "LAENGE" im Funktionskörper der Funktionsdefinition. Herbert Bruhn (1988, 96) be zeichnet solch eine Stelle als eine undefinierte Aussage, die nur wieder
durch Aufruf derselben Prozedur gelöst werden kann. Ich zeige zur Erläuterung die Abarbeitung des Funktionsaufrufes: Ein
erster
Aufruf
undefinierte Aussage:
liefert
die
Der zweite Aufruf ergibt: Der dritte Aufruf der Funktion führt ZU:
(LAENGE '(a b))
(+ I ( LAENGE ( b ))) (+ 1 (+
1
(LAENGE ( ) )))
(+ 1 (+ 1 0) ) (+ 1 1 ) 2
Inwieweit dieses Konzept der "Rekursion" zur Erklärung musikalischer I) Eine ausführliche Erörterung des Konzeptes Rekursion sowie dessen Explikation durch das Konzept der partiell-rekursiven Funktion findet sich in Kap. 2. 2. 4. 3. 3, S. 141 ff. u. bes. S. 143. In diesem Kapitel wird ebenfalls die Beziehung zwischen den par tiell rekursiven Funktionen und LISP-Programmen erörtert.
316 Strukturen beiträgt, kann der Autor allerdings nicht einsichtig machen, zumal er (Bruhn 1988, 96; 102; 106) an anderen Stellen von rückbezügli cher Umdefinition spricht. Wie aus dem Beispiel der Funktion LAENGE ersichtlich, wurde keine rückbezügliche Umdefinition der Funktionsdekla ration von LAENGE vorgenommen. Dies heißt, daß z. B. in einer Ak kordfolge wie D-G-C nach einer ersten Interpretation des D-Dur als Doppeldominate und G als Dominante aufgrund weiterer folgender Akkorde eine Umdeutung von D als Dominante, G als Tonika und C als Subdo minante notwendig wird. Eine Ähnlichkeit dieser rückbezüglichen Umdefi nition innerhalb eines harmonischen Ablaufes mit dem angegebenen Kon zept der Rekursion scheint mir in dieser Form nicht vorzuliegen. Da Bruhn die Rekursion als Erklärungsmodell tonaler harmonischer Ent wicklung betrachtet, ist es umso verwunderlicher, daß er das stack/he ap-Mode/J Hofstadters - den Keller oder Stapel (stack) - zur Erklärung von Tonalitätveränderungen ablehnt, obwohl dieses Modell die Verbindung zur technischen Realisierung der Rekursion ermöglicht. Bruhn (198 8, 78) gibt Hofstadters Idee folgendermaßen wieder: Die Entfernung vom tona
len Zentrum innerhalb eines Musikstücks hat Hofstadter (1985, S. 140 f.} mit den stack/ heap-Modell des Computers verglichen: Jedesmal, wenn nach einer Modulation eine neue Tonart erreicht wird, registriert das menschliche Gehirn die Verä'nderung, indem es eine neue Tonart auf den Stack legt.
Seine Kritik trifft dann allerdings nicht den Kern von Hofstadters Idee, zumal er (Bruhn 1988, 106) selbst auf die bei der Programmierung be nutzte Rekursion als zentrales Prinzip harmonischer Entwicklung verweist, wenn er (Bruhn 1988, 87) feststellt: Das stack/heap-Model/, das auch
Hofstadter (1985) benutzt, verdeutlicht sequentielle Informationsverarbei tung und kann ebenso wie assoziationistische Theorien die Wahrnehmung nicht erklären. Aus dem bisher Erörterten ergibt sich, daß die zentralen Konzepte "Schema", "Proposition", "Sachverhalt" und "Rekursion", auf die Herbert Bruhn (vgl. 1988 74; 106) seine Theorie der musikalischen Wahrnehmung gründen will, terminologisch zu unbestimmt sind, so daß noch weitere be griffliche Arbeit notwendig ist, bevor eine experimentelle Überprüfung, wie er (vgl. Bruhn 1988, 108) sie allerdings durchführte, zur Stützung seiner These herangezogen werden könnte. Auf die von Herbert Bruhn entwickelte propositionale Schematheorie der menschlichen Musikwahr nehmung läßt sich daher insgesamt eine Bewertung Petermanns (1931, 37) anwenden, die damals als Kritik an Wolfgang Köhlers Gestalttheorie formuliert wurde: Beurteilt man kritisch die Möglichkeit dieses Systems,
so muß man bei aller Anerkennung für die Kühnheit und Rücksichtslo sigkeit der Gedankenführung, bei aller Anerkennung für die Uner schrockenheit in deY denkerischen Leistung doch dem Gebäude im Gan zen seine Zustimmung versagen.
31 7 In der Kognitiven Psychologie ist das Schemakonzept von zentraler Bedeutung und auch in der Kognitiven Musikpsychologie1 wird ihm eine besondere Relevanz zugesprochen, allerdings fehlt derzeit eine klare Bestimmung dieses Konzeptes, so daß eher von der heuristischen Idee des Schemas gesprochen werden sollte. Die Idee des Schemas und des ge speicherten Programmes findet sich nicht nur bei der Erforschung von Wahrnehmungsprozessen, sondern wird auch für die Untersuchung der Bewe gungssteuerung im Instrumentalspiel herangezogen. Der Begriff des Sche mas wird in diesem Zusammenhang oft mit dem des PLANES2 identifiziert (Pressing 1988, 133). In enger Beziehung zu der Erforschung der Be wegungssteuerung steht die Untersuchung rhythmischer Strukturen, die im folgenden Kapitel diskutiert wird.
1) Neben Bruhn 1988, Stoffer 1985, Nauck-Börner 1988 und Pressing 1988 s. auch Kessler, Hansen & Shephard, 1984. 2) Die Bedeutung des PLANES in der Interpretation der TOTE-Einheiten für die Kogni tive Psychologie und deren Äquivalenz mit dem Konzept des "endlichen Automaten" wird in Kap. 2. 2. 4. 2, S. 118 ff. u. bes. 123 ff. herausgearbeitet.
318
3. 2. s.
Die Beschreibung von Bewegungsverhalten und rhythmischen Strukturen
Die Forschungen im Bereich der die Motorik auslösenden und steuern den Mechanismen beim Instrumentalspiel erlangte durch den Einzug des Computers in die psychologischen Forschungslaboratorien ebenfalls einen starken Aufschwung. Noch 1980, ein paar Jahre nach der Mikrokomputer revolution zu Beginn der 70er Jahre, schrieb Shaffer (1980, 446): until
Iabaratory computers and suitable tranducers became available it was difficult to obtain data on performance in a reasonable assimilable form, and we are still learning how to exploit the new technologies. In enger Beziehung zur Erforschung von Bewegungsabläufen steht die Untersuchung rhythmischer Strukturen (Martin 1972, 487): Rhythm, which
means temporal patterning, is a concept based on motor functioning. Es ist daher nicht verwunderlich, daß viele neuere Arbeiten in der Kognitiven Psychologie zur Rhythmusforschung Ideen und Beschreibungs mittel aus dem Bereich der neurophysiologisch orientierten Bewegungsfor schung aufgreifen, wenn sie über eine reine Datenerhebung hinaus eine allgemeine Erklärung der experimentelf gewonnenen Fakten anstreben. Als eine der frühesten Arbeiten in diesem Bereich kann die von Michon (1974) gelten. Michon wendet die von Martin (1972, 490) angegebene Akzentregel zur Beschreibung der hierarchischen Struktur von sequentiell erfolgenden Ereignissen zur Darstellung der Akzentuierung innerhalb des rhythmischen Ablaufs von Eric Saties Vexations an (vgl. die Noten auf S. 319). Michon (1974, 420) gibt daher die folgende Analyse, die aufgrund der Anwendung der Martinschen Akzentregel erfolgt ist, um den Akzentuie rungsgrad der einzelnen Zeitpunkte der erklingenden Noten zu beschrei ben: For our purpose the application of the accent rule is required. It
consists of generafing a binary tree and assigning values to the notes in the sequence in accordance with the values of the branches in the tree; ...
j n J J IITJJ J J J J J J 1
7 15 4
10
J 14
' 17 6
12
2
13
8
16 5
'--" 11
18
Michon unterstellt ein gleichmäßiges Pulsieren in Achteln als grundle gende Einheit zur Bestimmung der Zeitpunkte und nimmt eine binäre
319 Vexations Eric Satie
j
I
{
f'r.)( �aH! \k ')(o..ti �
.:.
.c 1c....u 9�. .. s dt �;".!;. <e ,( S?rc. ho.. cl• � r<'('<"r o.� ("<41All? u. d,..... (, r·· sr.:..�l So�oll!, P:.�L. l& •4--"-L
�"''
-='-'""-'·""".i-:�:7;· ·.. -·i::.:·�·i:·=··�· :�-'::: ·::. ...
.. .
.
.
..
.
.
-
-- ��----- -:�!��
f
. -· · �=
=
Abb.
aus Michon
:::
.;.a.f
i-tt
:_..:..�::.:- -.-� .
-
1974, 19
Die Struktur der Vexations besteht aus zwei Variationen vor oder hinter denen fakultativ das Thema eingefügt werden kann: {(Thema) - Variation I - (Thema) - Variation li - (Thema)} Diese Struktur des Werkes soll achthundertvierzigmal wiederholt werden.
320 Einteilung in bezug auf das Akzentuierungsverhältnis vor. Die erste Ein heit von Zeitpunkten bzw. der erste Zeitpunkt wird als stärker akzentu iert im Vergleich zu der zweiten Einheit bzw. zum folgenden Zeitpunkt angesehen. Die Akzentuierungsstärke wird durch Zahlen dargestellt. Die Zahlen in dem Baumdiagramm geben die Akzentuierungsstärke des be treffenden Zeitpunktes an. Je kleiner eine Zahl ist, als desto stärker ist ihre Akzentuierung im Vergleich zu den anderen zu betrachten. Um das Zustandekommen der einzelnen Zahlwerte nach der Martinschen Akzent regel zu verstehen, sei kurz auf diese eingegangen. Aufgabe der Akzentregel ist es, die Beziehung der relativen Akzent ebenen der Elemente einer Sequenz auszudrücken (Martin 1972, 490). Es wird ein binärer Baum zur Beschreibung der in Frage stehenden Sequenz benutzt. Dem linken den Ast eines ele mentaren Baumes wird eine 0 zu 1 z geordnet, dem rechten eine 1 : • •
A
Dies geschieht ebenfalls mit den Subbäumen eines komplexen Bau mes:
1 •
3 •
z •
4 •
Soll jetzt der Akzentuierungswert eines Elementes einer Sequenz er mittelt werden, so wird der Weg von der Wurzel zum Element verfolgt und dadurch identifiziert, daß die einzelnen Beschriftungen der Äste von rechts nach links aufgeschrieben werden. Die aus Nullen und Einsen bestehende Folge wird als Binärzahl interpretiert und mit Eins addiert. Betrachten wir als Beispiel den Anfang des Liedes "Old MacDonald":
'h' HI H J Dld
Hat-Don-
ald
had
a farl'l
'I
Der Betonungswert, der dem Tonereignis an der Stelle mit dem Wort "bad" unterliegt, errechnet sich wie folgt; dabei gibt binpath die binäre Codierung des Zugriffspfades des betreffenden Elementes der Sequenz an und Dez übersetzt in die binäre Zahldarstellung in die dezimale Zahldar-
321 stellung, so daß auf beide Zahlen die normale Addition angewandt werden kann:
Akzentuierungswert (had) ( + I (Dez (binpath had))) = ( + 1 (Dez 001 ))) ) (+ I I ) = 2
1 •
•
3 •
7
2 •
6 •
4 •
8 •
Ebenso errechnen sich alle anderen Werte, wie z. B. der Akzen tuierungswert von "-ald-". So ist der Pfad von der Wurzel zu "-ald-" durch 110 = 6 gegeben. Zu diesem Wert wird dann noch I addiert und es wird 7 erhalten. In der Analyse der Vexations nach der Regel von Martin scheint mir ein kleiner Fehler vorzuliegen (vgl. Abb. S. 318). Zwar ist die Bestimmung der Akzentwerte 1, 2, 3 und 6 mit der Martinschen Re gel durchführbar, aber für die Werte 4 , 7, 10, 1 5 - um nur einen Teil zu nennen - nicht mehr möglich. So ergibt sich für das mit dem Akzentwert 4 kennlieh gemachte Ereignis nach der Martinschen Regel die Binärzahl 00100 = 4 als Dezimalzahl, welches mit I addiert 5 ergibt. Ebenso ergibt sich am Akzentwert 7 eigentlich (01000 = 8 ) + 1 = 9 ; nicht 10 sondern (01100 = 12) + I 13; beim Akzentwert 1 3 stattdessen (10001 = 1 7 ) + 1 = 18 etc. Es ist zu sehen, daß die Martinsche Regel wohl nicht in dem von ihm (Martin 1972, 490 u. 491) explizierten Sinne verwendet wurde, was natürlich nicht gegen die angegebene hierarchische Struktur spricht. Leider legt Michon sein Verständnis der Anwendung der Martinschen Regel nicht näher dar. Stattdessen hebt er die Bedeutung der Idee der Regel für psychologische Untersuchungen hervor und identifiziert das Konzept der Regel mit dem des Programmes, um sich dann der expe rimentellen Überprüfung und Absicherung seiner Vorstellungen über Re geln und Programme zuzuwenden: The elegant simplicity of this rule ... (der Akzentregel; U. S.) does not preclude its application to a variety of =
sequential patterns. Jt shows how stress in music, language and other serial behavior need not be treated as a concatenation of accent under some sort of S-R rule, but seem to be under the control of a unitary rule, or in other words: a program. Listening to or Iook at such behavi or to understand it consists in /arge part in 'parsing' the sequence of observed events, and ultimately uneavering the program. Da er ein kritisch arbeitender Experimentalpsychologe ist, der nicht über den psychologischen Status von Regeln sowie der Regelanwendung wie z. B. der von Martins urteilen kann, bevor "genügend" experimen talpsychologisch gewonnene empirische Daten über solch eine "einfache
322 elegante" Regel zur Verfügung stehen, beginnt er dann auch schleunigst mit der Datenerhebung: Structural rules such as those of Martin may or may not - have a psychological reality which may be determined by
experiment. To day jew such experiments have been carried out, ...
Seine Konklusion ist, daß sich ein neues großes Forschungsfeld für die psy chologische Untersuchung rhythmischer Muster eröffnet (Michon 1972, 420):
This opens up a jascinating field of study in which the mechanism for coding of rhythmic patterns are explored.
Dieser Forschungszweig der Kognitiven Musiktheorie tritt verstärkt in den 80er Jahren mit einer großen Anzahl experimenteller Untersuchungen in Erscheinung. Die Phase der Datenerhebung im Bereich der Erforschung des Bewegungsverhaltens bei der Musikausübung sowie der Untersuchung rhythmischer Vorgänge, die Ende der 70er Jahre vornehmlich im amerika nisch-englischen Sprachraum mit den Arbeiten von Shaffer (1976, 1980, 1981), Sloboda (1982), C1arke (1982) begann, scheint weiterhin anzuhalten� denn eine Zusammenfassung der aus den verschiedenen Untersuchungen erhal tenen Daten zu einer einheitlichen theoretischen Erklärung steht noch aus. Dies ist um so verwunderlicher, als Shaffer (1980, 445) die Unter suchungen zur Musikausübung einem allgemeinen theoretischen Rahmen zuordnete, der von der Künstlichen Intelligenzforschung beeinfußt ist: der Erforschung des Bewegungsverhaltens beim Sprechen, Maschineschreiben, Schreiben, Malen und Tanzen. Hervorzuheben innerhalb dieser Forschung ist die Hinwendung zur Beto nung des kognitiven Aspektes bei der Erforschung von Steuerung und bedingenden Strukturen solcher Bewegungsabläufe. Shaffer (1980, 444) macht auf die Bedeutung des Kognitiven zur näheren Bestimmung der Idee des Bewegungsprogrammes (motor programming) für die Erforschung von Bewegungsvorgängen aufmerksam: . . . there is a better prospect that
cognitive theory can be utilized to describe ... performance. Erklärt werden sollen die den Bewegungen unterliegenden, unbewußt ablaufenden erlernt·en Bewegungsprogramme. Für den theoretischen Rah men, in den Shaffer (1980) seine Untersuchungen der Vorgänge des Klavierspiels stellt, ebenso Sloboda (1982), wird die Idee des Plans von Miller, Galanter und Pribram (1960/1970) aufgegriffen. Ein Plan2 soll ei ne Menge von Zielen geben und eine allgemeine Struktur der auszufüh renden Aufgabe liefern. Seine (Shaffer 1980, 445) allgemeine Definition des Plankonzeptes lautet wie folgt: A plan is an abstract homomorphism
of the performance, representing its essential structure. lt does not re present alt details of performance but allows these to be generated or accessed as they are needed in the execution. Es ist nicht ganz klar, was Shaffer unter einem abstrakten Homomor phismus und somit natürlich einem Plan verstanden wissen will. Vielleicht I) vgl. Clarke 1985, 1987, 1988; Shaffer, Clarke & Todd 1985; Povel 1985. 2) Die Idee des PLANES wird von mir ausführlicher in Kap. 2. 2. 4. 2, S. 118 ff. behandelt.
323 will er mit dem Adjektiv "abstrakt" anzeigen, daß es s.ich um eine mathe matische Abbildung handeln soll, da mathematische Konzepte im allge meinen als abstrakte Konzepte verstanden werden. Auch ist mir nicht klar, was ein "konkreter Homomorphismus" in einer Definition sein könn te. Angenommen, er meint das aus der Mathematik bekannte Konzept des Homomorphismus bzw. des Morphismus oder der homomorphen Abbildung (vgl. Hall Partee 1978, 104) als einer "verknüpfungstreuen" Abbildung von einer Algebra A in eine Algebra B, so fällt auf, daß in der Definition weder die den einzelnen Algebren zugrundeliegenden Mengen genannt werden, noch die auf die Elemente der Mengen anzuwendenden Operatio nen (Funktionen, Verknüpfungen). Ein Homomorphismus im mathemati schen Sinn kann also auch nicht gemeint sein. Es bleibt folglich unklar, was ein Plan sein soll, so daß es berechtigt scheint, die von Miller, Galanter und Pribram (1970 /1960) eingeführten Hierarchien von TOTE-Einheiten (test-operate-test-exit) zur Beschrei bung und Erklärung von Verhalten als Konkretisierung des Planes zu verstehen. Dies scheint Shaffer wohl vorzuschweben, wenn er von Plänen spricht, denn er (Shaffer 1981, 445) weist auf die hierarchische Organisa tion von Plänen und der Idee des Programmes in der Künstlichen Intelli genz hin: This idea of using a hierarchy of abstract representations to
construct performance from intention is an analogaus to recent proposals in artificial intelligence for programs that solve problems. Pressing (1988, 133), der sich mit Modeliierung von musikalischen Improvisationsvorgängen beschäftigt, geht sogar soweit, die Idee des Schemas als einem verallgemeinertem Bewegungsprogramm, wie es z. B. von Schmitt (1975, 1976) entwickelt wurde, mit der Idee des Planes zu identifizieren und in die Nähe der aus der KI bekannten Begriffe Rahmen (frame) und Drehbuch (script) zu stellen: Similar to schemata is the no
tion of action plan. . .. Also related are adjustable control or description structures for artificial intelligence as (rames and scripts ... Wie zu sehen war, wird die Idee der Pläne, d. h. der TOTE- Hierar chien, von Shaffer (1981) als theoretischer Rahmen für die Erforschung bzw. die Erklärung von Bewegungsabläufen des Instrumentalspiels vorge schlagen und in bezug auf die Erstellung von Improvisationsmodellen diskutiert. Allerdings muß festgestellt werden, daß es bisher nicht zu weiter ausgearbeiteten Repräsentationsformalismen speziell für Abläufe des Instrumentalspiels gekommen ist, wie es sie z. B. in der Erforschung und Modeliierung des durch die Sehwahrnehmung gesteuerten Bewegungs verhaltens bei Fröschen gibt� Hierin sehe ich ein Problem, das gerade einen großen Teil der ameri1) Am weitesten fortgeschritten sind die Forschungen zur Modeliierung von Bewe gungsverhalten der Gruppe um Michael A. Arbib (Vgl. Arbib 1980, 1981 u. 1987). Die Arbeiten führten zu der Modeliierung des Verhaltens durch einen komputationellen Frosch, den rana computatJ"ix.
324 kanisch-englischen Forschungen innerhalb der Kognitiven Musikpsychologie betrifft. So wird ein Begriffsapparat, der innerhalb der Künstlichen Intel ligenz und Neurophysiologie entwickelt wurde, als theoretischer Rahmen übernommen, ohne diesen für den zu untersuchenden Bereich formal auszuarbeiten, d. h. zumindest wie in der KI eine teilweise Realisierung in Form eines lauffähigen Systems anzustreben und experimentell zu testen. Statt dessen werden sehr viele experimentelle Untersuchungen durchgeflihrt, ohne daß näher spezifiziert wird, in welchem allgemeine ren Rahmen diese Experimente erfolgen. Häufig wird so ein Berg von Daten produziert, ohne daß zu sehen wäre, welches weitere Ziel mit diesen Untersuchungen verbunden ist. Gegen dieses Vorgehen wäre nichts weiter einzuwenden, wenn der ernsthafte Versuch unternommen würde, die unterschiedlichen Daten der verschiedeneneo Experimente in einem allRemeinen theoretischen Ansatz einer Klärung zuzuführen� Trotzdem eröffnet sich hier m. E. ein interessantes Arbeitsfeld an der Schnittstelle von Musiktheorie, Psychologie, Künstlicher Intelligenz und Neurophysiologie, in dem noch viel zu erforschen sein wird und dessen Ergebnisse sicherlich praktische Relevanz in der Instrumentalausbildung haben werden. Aber nicht nur im Bereich der Musikausftihrung, sondern auch in der musikethnologischen Forschung soll die Idee der TOTE- Hierarchien, über den Umweg der neurophysiologischen Forschung, einen an naturwissen orientierten Begründungszusammenhang schaftlichen Exaktheitsidealen gewähren. In seiner musikethnologischen Studie führt Brand! (1985, 1 1 ; 27) aus: This image of the mind - as we learn from neurophysiology (.. .) - is a holonomic one, built up by TOTE mechanism (. . .) matehing outsi
de inputs with inside feelings or values which control even sensual ac ceptors. ... The chain of transmission is not an online function from perception to memory storage to action, but can be thought in terms of TOTE-Mechanism. Durch diesen Rekurs auf die TOTE-Mechanismen glaubt Brand! eine genauere Erklärung des action-perception-cycle erreicht zu haben, der nicht wie bisher in naiver Weise als eine einfache online function verstanden werden kann� Ob die neomechanistische Position, die Rudolpb Brandl hier - sicherlich unbewußt - vertritt, nach Kenntnis des genauen Status der TOTE-Mechanismen weiterhin von ihm vertreten wird, dürfte zu bezweifeln sein� I) Zum Vergleich sei auf die Arbeit von Arbib (1987) zum Bewegungsverhalten und die
daran anschließenden Diskussionbeiträge hingewiesen. 2) Es ist nicht ganz klar, was Rudolph Brand! unter einer on line function verstanden wissen will. Höchstwa!hrscheinlich ist ein einfacher Reaktionsablauf gemeint, der von der Wahrnehmung durch vermittelnden Einfluß des Gedächtnisses zu einer dadurch ausge lösten Handlung führt. 3) Eine Diskussion de:r Beziehungen des Automatenkonzeptes zu den TOTE-Hierarchien
325 Es werden nämlich Pläne, d. h. TOTE-Hierarchien, in der Sichtweise des Menschen als einem informationsverarbeitenden System, als Compu ter-Programme verstanden, worauf Newell und Sirnon (1963, 424) hinwie sen: It is also a centrat theme C. .the extensive use of hierarchical pro
grams; U. S) of the treatment of information processing theories by Miller, Galanter, and Pribram (1960). The authors use the term "plan" to refer to what are. here called "programs".
Offensichtlicher und überzeugender wird die Beziehung zum Neomecha nismus, wenn man weiß, daß Noam Chomsky (1963, 486-488) nachwies, daß die TOTE-Hierarchien formal dem Konzept des endlichen Automaten äquivalent sind. Die Grundidee ist eine Transformation der Flußdia grammdarstellung einer TOTE-Hierarchie in die eines Graphen, der dann als Zustandsgraph eines Automaten interpretiert werden kann. Dies er scheint im Nachhinein nicht verwunderlich, wenn man weiß, daß Progamm ablaufpläne (Flußdiagramme) als Graphen dargestellt werden können1 und das "test" einer Test-Operate-Test-Exit-Einheit (TOTE) als Konditi nal einer Programmiersprache verstanden werden kann. Zusamenfassend läßt sich feststellen, daß die Idee des Programmes (Planes, TOTE-Hierarchie) in der Neurophysiologie zur Erklärung von Bewegungsabläufen dient und ihre nähere Erklärung durch das Konzept des Programmes in der Informatik findet, indem ein Programm als for male Beschreibung eines Prozesses verstanden wird, der eine Folge von Ausgabewerten in Abhängigkeit von Eingabewerten und internen Parame tern erzeugt (vgl. Arbib et. al 1981, 1452). Arbib 3 gibt ein einfaches Beispiel, um diese Idee zu erläutern. Man stelle sich eine Person (oder Tier, Roboter) in einem Raum vor, die diesen durch die einzige Tür verlassen will. Sie muß also zuerst die Tür erreichen. Abhängig von ihrer Position relativ zur Tür muß sie eine unterschiedliche Anzahl von Schrit ten ausführen. Durch eine notationeHe Variante des TOTE läßt sie sich wie folgt darstellen: do gehe einen Schritt until die Tür erreicht ist. Wesentlich an dieser Beschreibung ist, daß eine Verhaltenklasse (die unterschiedliche Anzahl von Schritten, um eine Tür zu erreichen ) durch eine kompakte Form beschrieben und gesteuert wird, die auf eine Hand lung (operate: gehe einen Schritt) zurückgeführt wird, welche wiederholt wird (until, test: Tür erreicht?), bis das Ziel erreicht ist. Arbib (1981, 1452) schreibt hierzu: lf we regard such a program as a model of human
behavior, we turn our attention from the release of patterns with fixed numbers of steps of action to the studies of ways i n which perceptual mechanisms testing il. door reached? gate motor mechanisms. Die Schwierigkeit besteht natürlich in der Spezifizierung der einzelnen und die neurophysiologische und psychologische Interpretation dieser Konzepte findet sich in Kap. 2. 2. 3, S. 66 ff. und Kap. 2. 2. 4. 2, S. 118 ff. 2) vgl. Arbib , Kfoury & Moll 1981, 185. 3) s. Arbib 1981, 1452 und etwas erweitert in Arbib 1984, 18-26.
326 Tests und die dem ausgelösten motorischen Verhalten unterliegenden elemen taren Mechanismen. Was aber zu erkennen ist, ist eine Verbindung von Wahrnehmungsvorgängen bzw. deren Beschreibungen (Tests ) mit Bewe gungsabläufen (Motorik), bzw. ebenfalls deren Beschreibungen. Daß gerade die Erforschung der wahrnehmungsgesteuerten Bewegungen von großem Interesse für die Instrumentalausbildung sein kann, um z. B. das Erlernen eines Instrumentes effektiver zu gestalten, sei nur ange merkt. Die Kritik, daß in dieser Hinsicht in der Forschung erst ein paar tastende Schritte unternommen wurden, kann wohl nicht als Einwand gelten. Ich lasse in diesem Zusammenhang nochmals Sloboda (1985, 89) zu Wort kommen, der sich auf Shaffer bezieht: ... performance is the
result of an interaction between a mental plan which specifies features of the intended output and a flexible programmig system 'which has learned through experience to compute the patterns of muscle contracti on that will achieve the goa( (of producing the specific output) over a broad range of starfing conditions' (Shaffer 1981b, p. 331). This aspect accounts for many aspects of musical performance.
Es muß angemerkt werden, daß Sloboda das Konzept Plan in seinem umgangssprachlichen Sinn versteht und es dem Konzept des erlernten auto matischen Bewegungsablaufes gegenüberstellt. Eine - wie ich meine gezeigt zu haben - nicht sehr glückliche Interpretation, wenn die Inter pretation der Konzepte PLAN, TOTE-Einheiten, Programm etc. in der neurophysiologischen Forschung zum Bewegungsverhalten, der Informatik und der Psychologie betrachtet sowie deren formale Äquivalenz berück sichtigt wird und die Beziehung zwischen Wahrnehmung und Motorik mehr verdunkelt als erhellt. Es sei noch eine Textstelle zitiert, um zu zeigen, daß die hier ange führten Begriffe Plan und Programm zur Erläuterung instrumentalpädago gischer Probleme schon zur Diskussion stehen. Sloboda (1985, 89): The
dissociation between plan and program also allows us to understand something which many teachers identify in their (otherwise musical} pupils as a 'failure to Iisten to themse(ves'.
Sloboda spricht hier das häufig im Instrumentalunterricht zu beobach tende Phänomen an, daß ein Schüler glaubt, ein gestelltes musikalisches Problem adäquat gelöst, d. h. vorgespielt, zu haben. Der Schüler ist der Meinung, er habe so vorgespielt, wie er es intendiert hatte, was jedoch nicht der Fall ist. Ich möchte hier jedoch nicht weiter auf die Argumentation von Slo boda eingehen und stattdessen überleiten zu einem weiteren Forma lismus, der in der Kognitiven Psychologie entwickelt wurde und in der Künstlichen Intelligenz häufig in wissensbasierten Systemen eingesetzt wird. Es handelt sich um die Produktionssysteme, die auch in der Kogni tiven Musikpsychologie - so Sloboda (1985, 215 ff.) - zur Modeliierung von Lernvorgängen mit Erfolg herangezogen werden können. Er (Sloboda
327 1985, 215) schreibt: Psychology provides many, sometimes apparently conflicting, interpretative frameworks for understanding learning. I would like to organize this section by introducing just one detailed theoretical proposal, and showing, in discursive fashion, how it can be used to support broad generalizations about the business of learning and tea ching. The theory is Production System Theory ... The basic attraction of Production System Theory is that it is possible to construct machines (embodied in computer programs) that operate according to the postulates of the theory. Some typical aspects of human thought and behaviour can be mimicked by such a machine. . .. It is most important to bear in mind that production systems are not in themselves part of the human mind. Rather, they are formal analogies for mental processes. However, to simplify my task, I will talk as if production systems are part of the mind. Die Anwendung von Produktionsregeln in der Kognitiven Musikpsycholo gie bildet das Thema des folgenden Kapitels.
328 3. 2. 6.
Produktionsregeln und die Erklärung von Lernprozessen
Wir hatten in den beiden vorhergehenden Kapiteln gesehen, daß Ideen wie die des Programmes und des Stapels sowie Diskussionen um deklara tive und prozedurale Wissensdarstellung aus dem Bereich der Informatik in der Kognitiven Psychologie wiederzutreffen sind. Um die Idee der Produk tionsregeln zu illustrieren, beschreibt John Sloboda das Erlernen von Bewegungsverhalten (skill acquisition; Erwerb von Fähigkeiten) im Instru mentalunterricht. Als Beispiel greift er die Erklärung des Erlernens der Bewegungsfolge beim Spielen des Tones c auf der Klarinette durch Pro duktionsregeln auf. Die Beschreibung des Lernens durch Produktions regeln wird in einen weiteren theoretischen Rahmen eingebettet. Elemen tare Gewohnheiten (habits), die erlernt wurden, sind Bestandteil komple xer Verhaltensfolgen, die des weiteren automatisch, unbewußt ablaufen. John Sloboda (1985, 218): What appears as single steps in thought to our
conscious awareness, are actually composed of many subconscious but logically primitive steps, which we have run through so many Iimes that they have become completely automated.
Gedacht werden kann hier z. B. an das Gehen, das der Mensch zwar erst erlernen muß, sich des Erlernens dieses Vorganges im Erwachsenen alter aber meist nicht mehr bewußt ist. Weiterhin beinhaltet das Erler nen von Bewegungsverhalten (skill aquisition) den Übergang von faktischem Wissen, dem knowing that, zum prozeduralen Wissen, dem knowing hov?. Ähnlich wie bei der Idee der TOTE-Hierarchien spielt die Kontrolle des Wissens durch die zu erreichenden Ziele eine Rolle beim Übergang von faktischem (deklarativen) zu prozeduralem Wissen (Sloboda 1985, 216 u. 218). Beim Erlernen von Bewegungsverhalten unterscheidet Sloboda (1985, 216) drei Phasen: den kognitiven Abschnitt (cognitive stage), den assozi ativen Abschnitt (associative stage) und den autonomen Abschnitt (auto nomous stage). Der kognitive Abschnitt zeichnet sich durch verbale Ver mittlung des zu erlernenden Verhaltens und nur annähernde Ausführung des angestrebten Verhaltens aus. In der assoziativen Phase findet eine angemessenere Ausführung der zu lösenden Aufgabe statt und die verbale Vermittlung tritt zurück. Die Verbesserung des automatisierten Ver haltens findet in der autonomen Phase statt. Der Übergang von der kognitiven zur assoziativen Phase kann verstan den werden als ein Übergang von deklarativem zu prozeduralem Wissen. Deklaratives Wissen findet nach Sloboda (1985, 218) seinen Ausdruck in der folgenden Darstellung des für das Spielen des Tones c auf der Klari nette notwendigen Wissens: The clarinet fingering for the middle C is
the left-hand fingers covering the top three holes.
Prozedurales Wissen wird durch sogenannte Produktionsregeln - so Sloboda (1985, 218) - ausgedrückt, welche die allgemeine Form: IF conl) Sloboda 1985, 216.
329
dition(s) THEN action(s) haben: Sind die Bedingungen des Antezedens des Konditionals erfüllt, sind die angegebenen Aktionen auszuführen. Das proze durale Gegenstück zur Beschreibung des deklarativen Wissens, welches ftir das Spielen eines c's auf der Klarinette notwendig ist, wird innerhalb der Theorie der Produktionssysteme mit folgenden Regeln Pl, ... , PS angege ben (Sloboda 198S, 219):
Pl.
IF the goal is to play middle C and the fingers are not in the configuration of having the lefthand fingers covering the top three holes (configu ration LJ) THEN the sub-goal is to achieve configuration LJ P2. IF the goal is to achieve configuration LJ and no configuration is presently in force THEN place the fingers in configuration LJ and the goal is achieved PJ. IF the goal is to achieve configuration LJ and a configuration other than LJ is presently in force THEN the sub-goal is to achieve the state of having no configuration in force P4. IF the goal is to achieve the state of having no configuration presently in force and some configuration is presently in force THEN remove all fingers from the keys and
the goa! is achieved
PS. IF the goal is to play middle C
and the fingers are in configuration LJ THEN blow and the goal is achieved. An diesem Beispiel wird weiterhin gezeigt, daß das Erreichen eines Zieles sich als Hierarchie von Teilzielen beschreiben läßt. Hier besteht das Hauptziel darin, den Ton c auf der Klarinette zum Erklingen zu bringen, die Regeln PI und PS bringen dies zum Ausdruck. Es werden zwei Zusatzbedingungen unterschieden. Während im Fall der fünften Regel die notwendige Griffposition bereits eingenommen ist, befinden sich im Fall der Regel PI die Finger in einer anderen als der notwendigen Positi on. Es ist ein Teilziel zu lösen, indem die Griffposition für den Ton c eingenommen wird (Regeln P2, P3). Hierbei ist jedoch im Fall der Regel P3 ein weiteres Teilziel zu lösen, denn die Fingerposition L3 soll nicht direkt, durch ein - wenn möglich - eventuelles Liegenlassen einiger Fin ger von einem Griff zum nächsten führen, sondern über eine Zwischen position, in der keine Griffposition eingenommen wird, erreicht werden. Bei der Lösung der Teilziele ist es von Bedeutung, daß die in der Hierar-
330 chie höher stehenden Ziele "erinnert" werden. Dieses leisten unter ande rem die Produktionssysteme (Sloboda 1985, 220): lt can be seen that a
crucial aspect of a Production System is some means of remembering higher goals while sub-goals are being pursued. Für eine musikalische Aufflihrung bedarf es allerdings einer effizienten Struktur für die "Erinnerung" der einzelnen Ziele. Sloboda (1985, 220 u. 221) nimmt flir die Erklärung dieser Struktur eine Anlehnung an die Ter minologie der Informatik vor und spricht von einem Stapel von Zielen (goal
stack): What efficient performance requires is some form of goal stack.
Die Ziele werden ihrer Hierarchie entsprechend nacheinander auf den Stapel gelegt, die am höchsten stehenden zuerst, gefolgt von denen, die sich weiter unten befinden. In der Informatik nennt man die Datenstruk tur, die Sloboda im Sinn hat, einen Stapel (bzw. Keller). Die Operation des Auf-den- Stapel-Iegens wird push genannt; die des Herunternehmens pop.1 Die Abarbeitung des Stapels kann nach dem UFO- Prinzip (last jn [irst .QUt) nur mit dem sich jeweils an oberster Stelle befindenden Ziel erfolgen. Ob die von Sloboda (1985, 221) dargestellte Struktur genau diesem Modell entspricht und in der vorgestellten Form arbeitsfähig ist, sei dahingestellt. Es geht an dieser Stelle nur darum aufzuzeigen, wie sehr Ideen und Modelle der Informatik Einfluß auf die Theoriebildung in der Kognitiven Musikpsychologie haben. Wo befindet sich nun der Ort, an dem geprüft wird, ob die Bedingun gen erfüllt sind oder nicht? Sloboda verweist auf die Terminologie der "Produktions-System-Theoretiker", die von dem working memory (Ar beitsspeicher) reden und spricht in Analogie in psychologischer Terminologie davon, daß: A close lay approximation to this term would be "consciousness". Liest man seine Arbeit weiter, ist auf der nächsten Seite nicht mehr klar, ob eine psychologische oder eine technologische Aussage gemeint ist, wenn er (Sloboda 1985, 222) schreibt: The conditions of production
rules are, therefore, contents of working memory. Es wäre eigentlich zu vermuten, daß von einem technologischen System geredet wird, aber der Kontext deutet mehr auf eine Aussage hin, die auf einen pschologischen Sachverhalt zielt. Da die Kognitive Psychologie bekanntlich als Gegenpol zum Behaviorismus anzusehen ist (Neisser 1967), wird auch darauf hingewiesen, daß die Produktionsregeln nicht mit dem Reiz-Reaktions-Schema des Behaviorismus in Verbindung zu bringen sind (Sloboda 1985, 222): Thus, although production rules have several simi
larities to the 'stimulus-response' link beloved of learning theorists in the behaviourist tradition, they are more sophisticated and versatile in many ways. They directly incorporate inner mental states and goals rather than trying to explain them away. Mit den Produktionsregeln wird außerdem die autonome Phase des LerI) Die Datenstruktur Keller mit den Operationen push und pop wird
von Hofstadter
1985, 138 ff. zur Erklärung der Wahrnehmung musikalischer Prozesse herangezogen.
331 nens erklärt, wobei es sich um das Zusammenfassen von mehreren Regeln zu einer komplexen Regel handelt. Sloboda (1985, 227) verdeutlich dies am Beispiel des Arpeggios. Zu Beginn des Lernvorganges gibt es für je den zu spielenden Ton eine Regel, nach einer gewissen Zeit hat sich eine Regel ausgebildet, die dann als Aktionsteil "spiele Tonl dann Ton2 dann ... dann TonN" enthält. Die Produktionsregeln können somit als Klärung des traditionellen Konzeptes des "automatisierten Ausführungsmusters" angesehen werden. Sollte bisher der Eindruck entstanden sein, daß mittels der Produktionsregeln nur motorische Vorgänge beschrieben werden kön nen, so weist Sloboda darauf hin, daß auch Wahrnehmungsprozesse durch Produktionsregeln beschreibbar sind. Es muß also unterschieden werden zwi schen perzeptuellen und motorischen Produktionsregeln. Sloboda (1985, 227) äußert sich dementsprechend: In performance from a score, a perfor mance production rule . . . would need a corresponding perceptual pro duction rule which could recognize a
C
major arpeggio as being present
on the page. Early instrumental learning is often hard because one is learning the perceptual and motor 'halves' of the skill at the same.
Wenn auch die Produktionsregeln von Sloboda als adäquates Beschrei bungmittel perzeptual-motorischer Lernvorgänge angesehen werden und er (Sioboda 1985, 215) hervorhebt, daß die Anziehungskraft der Theorie der Produktionssysteme darin besteht, daß sie es ermöglichen menschliches Denken und Verhalten mittels einer Maschine zu simulieren, so muß er jedoch zugestehen, daß sich gerade die Modellierung komplexen musikali schen Verhaltens mittels Produktionsregeln als schwierig erweist. Sloboda
(1985, 228):
The task of writing a production system for a
non-trivial
aspect of musical skill has not yet been undertaken.; nor yet has the even more crucial task of modelling some aspect of musical learning in
detail. It is not clear, at this stage, wether the theoretical notions avail
able are fully up to the job of music learning, and I do not wish to pretend otherwise. It does, however, seem to me that theoretical framework currently available which
there is no other
allows such
a detailed
formalization of cognitive processes but at the same time supports many generat but more vague conceptualizations and observations about learning.
Da sein Buch 1985 erschien und die Trendwende in der Kognitiven Psychologie (Schneider 19 87) noch nicht eingetreten war, spricht Sloboda vorwiegend von den Produktionsregeln. Heute - 1993 - wären als Lern modelle die neuralen Netzwerke des Konnektionismus zu nennen. Wurden bisher in der Kognitiven Musikpsychologie meines Wissens kei ne Versuche unternommen, ein Produktionssystem zu implementieren, so finden sich erste ernsthafte Versuche, musiktheoretische Konstrukte und Wahrnehmungsbeschreibung von Musik mittels Produktionsregeln zu im plementieren, in den Arbeiten der Forschergruppe Jones, Miller und Scarborough (1988, 1989, 1990). Gleichzeitig experimentieren sie mit Modellen des Konnektionismus.
332 3. 2. 7.
Produktionsregeln, blackboard-Modell und die generative Musiktheorie
Das blackboard-Modell, das von Scarborough, Miller und Jones (1988) benutzt wird, soll an dieser Stelle behandelt werden? Es sei hier noch einmal darauf hingewiesen, daß einige Ideen, die erfolgreich in der KI verwendet wurden, nicht notwendigerweise in dem gleichen Maße erfolgreich für die Modellierung musikalischer Wahrneh mungsprozesse eingesetzt werden können. Allerdings können diese Ideen mögliche Wege indizieren und aufgetretene Probleme bei ihrer Realisie rung Hinweise auf die Brauchbarkeit dieser Architekturen für den spe ziellen Fall der Musikwahrnehmung liefern. Das blackboard-Modell wurde in dem Sprachverarbeitungssystem2 HEARSEY-II benutzt, das auf dem "Hypothesenbildungs-und-Test-Para digma" basiert. Das Erreichen einer Lösung - z. B. die syntaktisch-se mantische Interpretation einer akustischen Eingabe - wird aufgefaßt als iterativer Prozess des Entwerfens von Hypothesen über einen Aspekt des zur Lösung anstehenden Problems und Testens dieser Hypothesen. Jede·r Schritt des Lösungsprozesses basiert auf dem vorhandenen Wissens des Systems in Verbindung mit den generierten Hypothesen. Die beste konsi stente Hypothese wird als Lösung des anstehenden Problems betrachtet und beendet den "Hypothesenbildungs-und-Test-Prozess". Den Kern eines HEARSEY-Systems, das als Klasse von Modellen bzw. Modellierungs-Methode verstanden werden kann, besteht aus einer dyna mischen globalen Datenstruktur, die in verschiedene Ebenen (level) einge teilt wird, das blackboard. Die knowledge sources (KS), welche Pro zesse darstellen, bilden eine weitere wichtige Struktur des Kerns und generieren auf einer Ebene Hypothesen, auf einer anderen wird auf Hypothesen gearbeitet. Jeder Prozess ist den sogenannten Produktionsre geln ähnlich. Zu jedem Zeitpunkt sind auf allen Ebenen des Systems verschiedene Hypothesen aktiv. Die Hypothesen einer Ebene sind mit den Hypothesen einer anderen Ebene, welche sie stützen, verbunden; jeder Hypothese wird ein "Vertrauenswert" zugeordnet. Die Arbeitsweise des Systems ist also nicht nur von den Daten abhängig - in so einem Fall wird von data-driven oder bottom-up processing gesprochen -, sondern auch von den Hypothesen, man spricht dann vom hypothesis-driven oder
top-down processing.
1) Ich folge des weiteren der Darstellung in Arbib (1989: 176-181) und Arbib, Conklin & Hill (1987: 37-42). Eine detaitierte Erörterung der verschiedenen Systeme, denen das blackboard-model zugrundeliegt, gibt Nii 1986a, 1986b. 2) In der amerikanischen Literatur wird von speech understanding gesprochen. Ich benutze in diesem Abschnitt Sprachverarbeitung und Sprecherkennung als äquivalente Konzepte.
333 Level k
CJ Progra,., Aodules � Databases
--?>
--7
Data flDN
Contra! flo" Zeichnung nach Arbib 1989, 179
Eine kurze Darstellung d�r Arbeitsweise eines Sprecherkennungssystems soll das Gesagte verdeutlichen. I m Fall der Sprachverarbeitung erhält das System auf der Parameter-Ebene eine d!gitalisierte akustische Eingabe, welche von einer knowlegde source zu Hypothesen über die phonemische Interpretation auf der Phonem-Ebene führt. Eine lexikalische knowledge source bildet anhand der Phonem-Hypothesen Hypothesen auf der Wort Ebene, indem Wörter gesucht werden, die mit den Phonem-Hypothesen konsistent sind. Diese führen wiederum zu Hypothesen auf der Phrasene bene (phrasal Jevel), die durch knowledge sources, welche semantische und syntaktische Einschränkungen wiederspiegeln, erzeugt werden.
PHRASAL
LEXICAL
Sll{fACf
PHDNEHIC
Zeichnung nach Arbib 1989, 177
334
i
Durch das HEARSEY-Modell ist nach Arbib (1989, 176 u. 180) die Idee der cooperative computation, wie sie bei der neuronalen Verarbeitung zu erwarten ist, in die KI-Forschung eingeführt worden. Bei der Idee der cooperative computation wird davon ausgegangen, daß verschiedene Entitäten wechselseitig miteinander "kommunizieren", um die angemessen ste Lösung eines Problems zu erhalten und es keine allgemeine Kontroll einheit gibt, die entscheidet, welches die richtige Lösung ist (Arbib 1989: 172). Die Idee des HEARSEY-Modells wurde auch im Bereich der com puter vision eingesetzt. Auch wenn in der HEARSEY-Architektur das interaktive Agieren verschiedener Einheiten angestrebt wurde, hat man doch das Programm auf einem sequentiell arbeitenden Computer imple mentiert. Dies hatte zur Folge, daß die nächste zu bearbeitende Hypothese und die hierfür zuständige nächstanzuwendende knowledge source von einem scheduler (Stundenplaner) bestimmt wird. Nicht nur Jones, Miller und Scar borough (1988; Scarborough, Jones &Miller1988) benutzen die Idee des black board wie sie in dem HEARSEY- Modell realisiert wurde, auch Otto E. Laske (1989) weist auf Bedeutung dieser Idee für eine Kompositionstheorie hin. Es soll des weiteren jedoch auf die Arbeit von Jones, Miller und Scar borough eingegangen werden, da sie eine Implementierung einiger Ideen der generativen Musiktheorie (Lerdahl & Jackendorf 1983) vornehmen. Das Programm wurde in PASCAL geschrieben und besteht aus ungefähr 10 000 Zeilen Code. Aufgrund der Größe des Projektes wurde eine mo dulare Organisation vorgenommen, wie sie aus der Programmierung mit Modula-2 bekannt ist. Es wurde diskutiert, warum die Repräsentation ei nes musikalischen Ablaufs durch Matrizen (arrays; Felder) nicht adäquat erscheint und eine Implementierung durch verkettete Listen geeigneter ist, weil u. a. zuviel Speicherplatz zur Darstellung benötigt wird, wenn z. B. jedes zeitliche Ereignis als Element der Matrize gespeichert würde. Dies wird ersichtlich, wenn man sich vorstellt, daß zu Beginn eines Stückes ein achtstimmiger Akkord für die Dauer von zwei Zeiteinheiten zu repräsentieren ist, und die anderen vierzehn Zeiteinheiten nur ein zeitliches Ereignis - eine Stimme - darstellen . • • • • • • • •• • •
• •
• •
• • •
• •
• • • •
·�
• • 18
• • • • 1
2:
3
4
5
'
7
•
,
18
11
Zeitpunkte
lt
13
14
15
�
Abb. nach Jones et al. 1988, 257
1'
335 Hierfür würde, wie aus dem Diagramm auf Seite 334 zu erkennen ist, ei ne 10 x 16 Matrix benötigt, wobei von 160 Stellen 130 nicht zu belegen wären. Wird dieser Musikteil mehrmals wiederholt, so ergibt sich ein enorm hoher Speicherplatzbedarf. Aus diesem Grund wurde eine Listenimplementierung des Matrixkon zeptes vorgenommen, welche im Gegensatz zur Matrix eine flexible Größen gestaltung ermöglicht. Jede R�he dieser durch die verkettete Listenstruktur dargestellten Matrix dient zur Darstellung einer Stimme bzw. dem von einem Instru ment erzeugten Tonhöhenereignis, so daß die Spalte alle gleichzeitig erklingenden Tonhöhenereignisse erfaßt. Er-eignisse
Zeit
1
"' ... .. ... ... ...
·�
2 3 4 5 6
Abb. nach Jones et al. 1988, 257
7
6
Dies bestätigt nochmals die Untersuchungsergebnisse von Patrick Greussay (1973), der Matrizen (arrays, Felder), Zeichenketten (strings) und Listen (iists) für die bestgeeigneten Datenstrukturen hielt und nach drücklich auf die Bedeutung des Listenkonzeptes für die Implementierung musikalischer Strukturen hinwies. Die in der generativen Musiktheorie angegebenen Regeln können nicht direkt als Regeln dafür aufgefaßt werden, wie ein Stück zu analysieren ist, sondern eher als solche, die der Analyse Einschränkungen auferlegen. Jones, Miller und Scarborough (1988, 256) wählten eine auf der Idee der Produkionssysteme basierende regelorientierte Implementierung in Zusam menhang mit einer am blackboard-Modell orientierten Architektur. Dies hatte mehrere Gründe: Zum einen ist die generative Musiktheorie auch als Regelsystem formuliert und einige einfachere Regeln lassen sich fast direkt für die IF-THEN-Formulierung der Produktionsregeln übernehmen. Es wird als Beispiel die grouping preference rule 3d (Jones, Miller & Scarborough 1988: 258) gegeben :
336 and: n2 and n3 differ in duration, n1 and n2 have equal durations, and: and: n2 and n4 have equal durations, THEN there is evidence of a grouping boundary between n2 and n3 Außerdem wurden die Produktionssysteme auch zur psychologischen Modellbildung eingesetzt, sind erfolgreich im Bereich der Expertensyste me benutzt worden und unterstützen die Bildung modularer Systeme. Die blackboard-Architektur kennt, wie schon dargestellt wurde, drei wesent liche Komponenten: a) die globale Datenstruktur des blackboards (der Tafel), b) die knowledge sources, in denen das Wissen um einzelne Aspekte des zu lösenden Problem verkörpert wird, c) eine Kontrollstruktur, welche die Anwendung und Reihenfolge der anzuwendenden knowledge sources überwacht. Jede der implementierten Regeln der generativen Musiktheorie wurde, wenn möglich, als separate kno wledge source in Form einer Produkti onsregel dargestellt. Dabei wurde eine knowledge source als Modul betrachtet, das ein pattern matehing Verfahren beinhaltet, um das im Antezedens der IF-THEN-Regel näher spezifizierte Muster mit den im blackboard ent haltenen zu vergleichen, und, falls zutreffend, mittels des Konsequens entsprechende Veränderungen im blackboard vorzunehmen. Die blackboard-Struktur wurde dahingehend vereinfacht, daß alle für die Simulation benötigten Aspekte integriert dargestellt werden: die Partitur, die metrische Struktur, die Gruppierungsstruktur und die tonale Analyse. Den Kern des blackboard bildet die von Jones, Miller & Scarborough (1988: 258) notochord genannte Datenstruktur. Es handelt sich um eine doppelt verkettete Liste von Knoten, die den in der Partitur repräsentierten aufeinanderfolgenden Ereignissen entspricht. Jeder dieser als event node bezeichneten Knoten enthält nur Information vom Zeitpunkt des Anfanges des vorhergehenden Ereignisses bis zum Beginn des stattfindenden Ereig nisses. Weiterhin enthält der event node Zeiger (pointer) zu Knoten, welche Information über die entsprechende Note - wie z. B. Tonhöhe, Tondauer, Lautstärke, Artikulation etc. -, sowie über Gruppierungen und metrische Repräsentationen enthalten. Der Knoten, der Informationen über die einzelne Note enthält, wird note node genannt. Er besteht aus einem Verbund (record; Datensatz) mit den entsprechenden Informationen sowie Zeigern zu weiteren Noten und dem notochord. Der erste Ton des Stückes "Row, row, row your boat" könnte im note node wie der untenstehenden Zeichnung zu entneh men dargestellt werden. Da es sich um eine einstimmige Melodie handelt, gibt es keinen weiteren Knoten, der Informationen über die zweite Stimme enthält.
337 Ereignisknoten 1
T
S't n
vorher
gehende Note dieser iM e
StiPIMe Tonhöhe
=
Dauer = L a utst l rke =
Cnill
Sopran i n d er
c
3.
Oktave
näc.hst:e
pun ktier te Vierte l M o l t o forte
A rtiku l ati o n = n or"al offset: von der vorhergehenden
Hote
Hote = 0
1
nächste SthtMe Cntll
Abb. nach Jones, Mi!ler & Scarborough 1988, 260
Von den sieben von Lerdahl und Jackendoff (1983) angegebenen grouping preference rules enthält die knowledge source die Regeln 2 und 3, die insgesamt aus neun Subregeln bestehen. Aufgrund der Subregeln (durch subrule routines) werden die Gruppierungsgrenzen zwischen benachbarten Noten bestimmt und ein Gruppierungsknoten erzeugt, wenn eine Regel erfolgreich angewandt werden konnte. Dieser Knoten wird dann der Liste hinzugefügt, welche diejenigen Gruppierungen enthält, welche aufgrund der betreffenden Regel erzeugt wurden. Es gibt also für jede der Gruppie rungsregeln eine Liste mit den von ihnen bezeichneten Grenzen. Auf dieser aus der Anwendung der Gruppierungsregeln entstandenen Daten struktur operieren Regeln höherer Ordnung, die die adäquate Gruppie rungshierarchie auswählen. Da die entsprechenden Gruppierungslisten untereinander mit dem event node verbunden sind, stellt die Anzahl der in bezug auf einen event node verketteten "Regelknoten" ein Indiz für die Stärke der Gruppierungsgrenze dar. So kann, da sich bei dem event node 12 drei Regelanwendungen finden lassen - grouping preference rule 3a-pitch, Je-artikulation, 2a-slur/rest -, geschlossen werden, daß das Stück seine stärk ste Untergliederung (Phrasierung) erfährt. Eine Anwendung der Regeln ergibt folgende strukturelle Zuordnung zu der Melodie "Row, row, row your boat":
I�BJ.J.IJ;J1I�1It tt�� ����� JJJl�.l . :._:____:__--
Abb. aus Jones, Miller & Scarborough 1988,
. . 260
338 Die Gruppierungsregeln, wie von Fred Lerdahl und Ray Jackendoff for muliert, stellen schon fast Parsing-Algorithmen dar, die ohne zusätzliche Arbeit implementiert werden konnten. Für die metrische Analyse war dies nicht der Fall, so daß Jenes, Miller und Scarborough sich an der grid-theory von Povel und Essens (1985) orientierten, welche in wesentlichen Aspekten mit den von Lerdahl und Jackendoff (1983) bestimmten Einschränkungen übereinstimmt, aber auch noch modifiziert werden mußte. Da von Lerdahl und Jackendorf kein Verfahren fUr die Tonalitätsanalyse angegeben wird, wurde auf den H. A. Sirnon (1968) entwickelten Algo rithmus zurückgegriffen.1 So besteht die Melodie aus 27 erklingenden Tönen, wobei von den 12 Tönen der chromatischen Skala nur fünf er scheinen: C (10 mal), D(3 mal), E (7 mal), F (2 mal), G (5 mal). Sum miert man die für den Akkord C-Dur notwendigen Töne Grundton, Terz und Quinte, so ergibt sich eine Zahl von 22 aufgetretenen Tönen, welches den Schluß sicher erscheinen läßt, daß die Melodie in der Tonart C-Dur steht.
ltfi1. 1. 11 J' J 1I J J' J J·IU1Ir rr J JJI Row�
row.
row y our
boa�.
g en� - 1 � d own �ho
���e�M - - . M e r r i l � ,
Merr i l �
lt JJJ 1111 J J· J Jdl. :II Merrily.
nerr i l y .
L ife
l� but a drean.
-------
Jede Tonköhenklasse der chromatischen Skala wird durch einen pitch node dargestellt. Diese pitch nodes sind mit chord nodes verbunden, welche wiederum mit key nodes verbunden sind. Das Verfahren wurde in einer knowledge source implementiert. Da die Implementierung auf einem Von-Neumann-Rechnerl vorgenommen wurde, wird ein scheduler benö tigt, der den jeweiligen Stand der Arbeitsphase überwacht und die An wendung der know!edge sources regelt. Zu jedem Zeitpunkt der Arbeits phase ist nur ein Teil der blackboard-Struktur bekannt. Diese Teilstruk tur soll das Kurzzeitgedächtnis des Hörers repräsentieren. Es sind über das "Fenster" jeweils 6 bis 10 Noten der Notensequenz für den Analyse prozess zugänglich. Der Aufbau des Systems findet sich in folgender Skizze: 1) Der Algorithmus wird in Kapitel 3. 3, S. 341 ff. erläutert. ln der generativen Musik· theorie wird von Stabilitätsbedingungen gesprochen; vgl. S. 36 ff. Algorithmen zur Ton artbestimmung werden in Krumhansl 1990 u. Zannos 1991 ausführlich diskutiert. 2) Die Organisation und Arbeitsweise eines Von-Neumann-Rechners findet sich in Kapi tel 2. 2. S. 1, S. !59 ff. erläutert.
339 Die generelle Architektur und Kontrollstruktur für die Simulation KS
blackboard ----7 Zeit
=
knowledge source
dndoN 1
J.l .l
·---
8 e
·----
inactiYe knoNiedge sources Abb. nach Jenes, Miller & Scarborough 1988, 260
Das Vorgehen von Jones, Miller und Scarborough zeigt sehr deutlich, wie die Verbindung von musiktheoretischer Forschung, psychologischer Forschung und Computereinsatz erfolgen könnte. Besonders hervorzuheben ist die Idee des Einsatzes eines blackboard-Modells, das, wie Arbib be tont, die Idee der cooperative computation in die Künstliche Intelligenz forschung einführte. Gerade parallele Verarbeitung scheint notwendig zu sein, um komplexe Phänomene wie Sehwahrnehmung, Sprachverstehen und Musikwahrnehmung zu untersuchen. Diese Architektur erlaubt es, diese Idee auf einem traditionellen Von-Neumann-Rechner zu erforschen und scheint auch ein möglicher Weg zur Modeliierung der Musikwahrnehmung zu sein. Leider wurde die Kernidee der verschiedenen Ebenen der black board-Architektur drastisch reduziert, was allerdings aus explorativen Grün den legitim ist, nur müssen weitere Forschungen folgen. Auch zeigt sich, wie explorativ komplementär mit beiden Ideen - dem Physical-Symbol-System und dem Konnektionismus - gearbeitet werden kann. Durch die vier Kritikpunkte, die Jones, Miller und Scarborough gegen den vorzeitigen Einsatz konnektionistischer Modelle anfUhren, wird ihre derzeit vorwie gend symbolische Vergehensweise ausreichend legitimiert. Diese lauten: a) powerful computational resources are required, die jedoch von konnektionistischen Modellen nicht zur Verfügung gestellt werden; b) eine modulare Entwicklung wird erschwert; c) bisher sind viele Eigenschaften dieser Modelle noch unerforscht; d) die generative Musiktheorie ist in vielen Punkten nicht klar ge nug spezifiziert.
340
Gerade der letzte Punkt, der natürlich nicht gegen den Einsatz kon nektionistischer Modelle per se spricht, gibt einen weiteren Hinweis darauf, daß die musiktheoretische Forschung vom symbolischen Level aus anzuge hen ist, denn, so (Jones, Miller & Scarborough 1988: 256): To attempt to implement a complex and incompletely specified rule-based theory (GITM) in terms of a complex, interactive, nonsymbolic neural network is to risk chaos. Thus, our first goal is to see wether the theory can adequately implemented at the symbolic Ievel at which it is cast. However, ... , some parts of the simulation are easily cast into a connectionist framework.
Gleichwohl verwendeten sie experimentierend ein konnektionistisches Modell für die Implementierung ihres Algorithmus zur Erkennung der Dur-Tonarten. Da man sich in den letzten Jahren gerade in der Kogniti ven Psychologie verstärkt dieser Modellbildung zuwandte, sollen in den nächsten Abschnitten die für konnektionistische Modelle leitenden Ideen in elementarer Weise eingeflihrt werden, um daran anschließend das kon nektionistische neurale Netzwerk zur Dur-Tonarterkennung von Scarborough, Miller und Jones (1989) zu erörtern.
341 3. 3. 3. 3. 1 .
Neurale Netzwerke in der Kognitiven Musikpsychologie Der Konnektionismus
Immer mehr Forscher im Bereich der Kl und Kognitiven Psychologie setzen sich mit konnektionistischen Vorstellungen auseinander, die sie entweder als komplementär verstehen oder hierin, gegenüber dem Vorge hen der "klassischen" KI innerhalb des "Physical-Symbol-System-Paradig mas", gar einen "realistischeren" Ansatz der Modeliierung kognitiver Pro zesse sehen. Auch in der kognitiven musikpsychologischen Forschung1 und der Cognitive Musicology2 zeichnet sich ein solcher Wechsel ab. Daß es sich hierbei nicht um vereinzelte Arbeiten, sondern um eine allgemeine Tendenz handelt, läßt sich an der steigenden Zahl der vorgestell ten konnektionistischen Modelle auf Kongressen und Workshops ausmachen? In der musiktheoretischen Forschung wird ebenfalls von Ray Jackendoff auf die konnektionistischen Modelle Bezug genommen. Jackendoff (198 7, 148), der Mitbegründer der generativen Musiktheorie� setzt das für die se zentrale Konzept der Präferenzregel (preference rule) in Beziehung zu konnektionistischen Vorstellungen: Minsky and Papert ... develop a ma thematical theory of "perceptrons", computing devices with properfies similar to preference rule systems. (More recent "connectionis(' approa ches to artificial intelligence, . . . , have a similar flavor).
Daß Jackendoff eine intime Verbindung von konnektionistischen Modell bildungen und den Präferenzregeln annimmt, wird noch deutlicher, wenn er auf die von Minsky und Papert aufgewiesenen Grenzen der Percep tronmodelle eingeht, die von mehrschichtigen Modellen überwunden wer den sollen. Er bezieht sich auf die Unzulänglichkeiten der Perzeptronmo delle, wenn er (Jackendoff 1987, 148) schreibt: lf this were true, the outlook for preference rule systems would be rather dismal.
Da diese eine bestimmte Klasse innerhalb der Familie der neuronalen Netzwerke darstellen und andere Modellklassen diese Unzulänglichkeiten 1) Es sind hier die Arbeiten von Bharucha 1987a, 1987b, 1991; Todd 1987; Bharucha & Todd 1989, Bharucha & Olney 1989; Scarborough, Miller & Jones 1989, Gierdingen 1990 zu nennen. In der Computermusik z. B. Baggi 1991a, 1991b. Kohonen 1989; Camurri 1991c. 2) Christoph Lischka 1987, 1990 und Mare Leman 1989a, 1989b, 1989c, 1990a, 1990b, 1991 sind die Hauptvertreter des konnektionistischen Ansatzes innerhalb der Kognitiven Musik· Wissenschaft (Laske 1987). Lischka 199lb wendet sich dem Paradigma des artificial Iife zu. 3) Einen Überblick über die Vorträge des Workshop on Al and Music in St. Augustin 1988 geben Desain & Honing 1989; Otto E. Laske 1989 berichtet über die Konferenz Al and Music in Detroit 1988.; Das Computer Music Journal 1989, 13/3 widmet dem Konnektionismus zwei Ausgaben. Vgl. auch den Sammelband Todd & Loy 1991; 4) In Lerdahl & Jackendoff 1983 findet sich die vollständig ausgearbeitete Theorie; Jackendoff 1987 gibt eine prägnante, kurze Darstellung. Ein Überblick über das Regel system dieser Theorie geben Lerdahl & Potard 1986. In Seifert 1'986 wird die generati ve tonale Musiktheorie und ihre Entstehung von 1977 bis 1983 ausführlicher behandelt.
342 überwinden, scheint es gestattet, diese Aussage auf die Familie der konnektionistischen Modelle zu erweitern, wobei allerdings - wie weiter unten angesprochen werden wird - eine vollkommen klare Bestimmung dieser Familie noch nicht besteht. Schon die von Ray Jackendoff vermu tete Beziehung konnektionistischen Denkens zu einem zentralen Aspekt der generativen Musiktheorie - den Präferenzregeln - zeigt die Notwendigkeit, diese Modellierungen in bezug auf musikalische Sachverhalte zu betrachten. Bevor ich jedoch exemplarisch auf die Arbeit von Miller, Scarborough und Jones (1989 ) eingehe, sollen zuerst Aufbau und Arbeitsweise eines konnektionistischen Netzwerkes an einem einfachen Beispiel erörtert werden. Seit Mitte der 80er Jahre wird an dem Physical-Symbol-System Paradigma Kritik geübt und ihm der konnektionistische Ansatz gegenüber gestellt. Was diesen Ansatz in den Augen seiner Anhänger aus methodo logischer Sicht gerade auszeichnet, nämlich die Trennung der Untersu chung mentaler Phänomene von der des Nervensystems, wird von seinen Gegnern als problematisch beurteilt� Der Konnektionismus findet seine Vorläufer in der Arbeit von McCulloch und Pitts2 (1965/1943) und vor allem in den Arbeiten von Frank Rosenblatt, dessen zentraler Aufsatz (Rosen blatt 1958) zur gleichen Zeit in der Zeitschrift "Psychological Review" erschien wie der der Symbolisten Newell und Sirnon (1958). Der Kon nektionismus ist also ebensowenig als neue Entwicklung anzusehen wie der "Symbolismus", sondern beide sind als Konsequenzen der wissen schaftlichen Forschungsprojekte der 40er und 50er Jahre aufzufassen. Es wird allerdings, wenn auf die neueren Arbeiten Bezug genommen wird, von Neokonnektionismus gesprochen. Der Neokonnektionismus (Kemke 1988), der auch unter den Bezeich nungen parallel distributed processing,l neural networks ,4 neural computer5 auftritt, erfreut sich seit Beginn der 80er Jahre in den Bereichen der KI, theoretischen Neurologie und Kognitiven Psychologie zunehmenden Inte resses und wird derzeit heftig disku1iert� Im Rahmen des Physical-Symbol-System-Paradigma wird das Wissen 1) Graubard 1988 ist ein Diskussionsband um die Grundlagen der Kl, in dem u. a. aus verschiedenen Perspektiven die Vor- und Nachteile des Konnektionismus diskutiert werden. 2) Die Modeliierung von McCulloch & Pitts wird in Kap. 2. 2. 3. 1, S. 66 ff. dargestellt und ausführlich diskutiert. 3) Dieser Ausdruck findet besonders bei Rumelhart & McClelland et. al 1986; McClel land & Rumelhart et al. 1986 Verwendung. 4) Besonders erwähnenswert ist in diesem Zusammenhang die seit 1988 erscheinende Zeitschrift gleichnamigen Titels. 5) Man vgl. hierzu die verschiedenen Aufsätze in Eckmiller & Malsburg 1988. 6) Eine zentrale Kritik unternahmen Fodor & Pylyshyn 1988. Smolensky 1987, ein Anhänger des Konnektionismus, bezeichnet den konnektionistischen Forschungsansatz auch als "subsymbolisch". Einen wesentlichen Einfluß auf seine Verbreitung in der Kognitiven Psychologie übten die Bände von Rumelhart & McClelland et al. (1986),
343 lokal und symbolisch repräsentiert. Die Verarbeitung erfolgt im wesentlichen sequentiell. Die Herausbildung der Grundideen dieses Paradigmas ist in enger Beziehung mit der Entwicklung symbolverarbeitender Sprachen wie IPL (jnfor mation J2.rocessing language) und LISP (iist J2rocessing) zu sehen.1 Im Konnektionismus, de r seine Impulse zur Architektur des Systems aus der neurophysiologischen Forschung (vgl. Palm 1988) erhält - es wird daher auch von einem neural inspired modelling bzw. modeJJing in the style of the brain gesprochen - , wird d as Wissen als subsymbolisch (Smolensky 198 7), nichtlokal, d. h. distribuiert, repräsentiert betrachtet und von elementaren Einheiten parallel verarbeitet. 3. 3. 2
Die Struktur eines neuralen konnektionistischen Netzwerkes
Die neuralen konnektionistischen Netzwerke können als eine Generalisie rung und Verfeinerung der Modeliierung von McCullo ch und Pitts (1943/1965; vgl. 2.2.3.1, S. 66 ff.) angesehen werden. Das Grundelement eines neuronalen Netzwerkes bildet daher das formale Neuron, welches in der konnektio nistischen Literatur neutralerweise auch Einheit (unit; node) genannt wird. Eine Einheit ei wird graphisch durch einen Kreis - den Knoten eines Graphen - repräsentiert. Das Verbalten der Einheit ei wird durch einen Aktivierungswert ai und durch einen Ausgabewert oi näher spezifiziert. Der Ausgabewert oi kann über eine sich möglicherweise verzweigende Ausgangsleitung - dargestellt durch die Kanten des Graphen - an weitere Einheiten ej weitergegeben werden und somit als Input flir Einheiten fungieren. Eine Einheit ei kann eine endliche Anzahl von Inputleitungen haben, der Gesamteingabewert in ein Neuron errechnet sich aus den einzelnen Eingabewerten der jeweiligen Inputleitungen und wird mit neti bezeichnet.
bZN,
a
b
McCielland & Rumelhart et al (1986) aus. Eine Analyse der IBeziehung Konnektionis mus und Kognitive Psychologie führten Strohschneider & Schaub 1988, Schneider 1987 und Stoffer 1990 durch. I) Jn Kap. 2. 2. 4.3. 4, S. 149 ff. wird die Progammiersprache LISP ausführlicher darge stellt. Die Beziehung zu der Idee des "Physical-Symboi-System" wird in Kap. 2. 2. 5. 2, S. 162 ff. ausgearbeitet.
344 Um die Verbindungsstärke, die zwischen den mit der Einheit ei verbun denen Einheiten ei besteht, auszudrücken, wird den einzelnen Verbindun gen eine Gewichtung wii - zu lesen als: ei wird von ei aktiviert bzw. ei aktiviert ei - hinzugefügt.
Ein Netzwerk besteht aus einer endlichen Menge von Einheiten, die untereinander verbunden sind, und kann durch einen gerichteten Graphen dargesteHt werden. Es kann als eine Struktur NETZ = (ENT, NET) aufgefaßt werden, die aus einer endlichen Menge ENT = {e1, ... , ei, ... , e0} von Einheiten, so wie einer Teilmenge NET s; ENT X ENT besteht. Die geordneten Paare (ei , ei) aus NET werden dabei interpretiert als: Einheit ei wirkt auf Einheit ei. Durch eine Funktion g: NET -+ R I wird jeder Kante des ge ordneten Paares (ei, ei) aus NET ein Gewichtungswert wii zugeordnet. Positive Gewichtungen werden als verstärkt stimulierend, negative als inhibierend (hemmend) betrachtet. Erlangt die Verbindung den Wert Null, so wird sie als unterbrochen interpretiert. 3. 3. 2. 1. Die Modellierumg vom Lernen mittels konnektionistischer Netze
Durch die Veränderung der Gewichtungswerte wird das Lernen des Netzes ausgedrückt, das sich in der Verstärkung oder Schwächung der Verbindung niederschlägt. Die Veränderung der einzelnen Gewichtungen erfolgt aufgrund von Lernregelo. Eine der bekanntesten Lernregeln ist die Delta- oder Widrow-Hoff- Lernregel (vgl. Rumelhart 1988, 53; Sharkey 1988):
Das Netzwerk hat hierbei einen "Trainer", der den von der Einheit ei zu erlernenden Wert ti vorgibt. In diesem Fall wird auch von überwachtem Lernen (supervised Jearning) gesprochen; S gibt die Lernrate an. Der Anstieg des Lernens ist proportional zu der Differenz aus dem ge wünschten Aktivierungwert ti und dem aktuell erreichten Aktivierungwert ai. 3. 3. 2. 2 Das funktionale Verhalten einer Einheit und des Netzes
Das funktionale Verhalten einer einzelnen Einheit wird durch die Akti vierungsfunktion F, die Ausgabefunktion f und die Eingabe net, welche durch die Propagierungsfunktion net berechnet wird, näher bestimmt. Je-
345 der Einheit ei aus ENT wird aus der Menge der Aktivierungswerte A ein Aktivierungswert ai zugeordnet. Die Veränderung der Aktivierungswerte ai wird durch eine Funktion F bestimmt, die vom vorhergehenden Aktivie rungswert ai, der Einheit ei sowie der Eingabe neti abhängt: F(ai(t-1), neti(t 1 ) ) = ai (t) In vielen Fällen hat F nur den Eingabewert neti als Argument: F(neti (t)) = ai(t+l) Der Input neti einer Einheit ei wird im allgemeinen als die Summe aus den eintretenden gewichteten Ausgaben Oj der mit der Einheit ei verbundenen Einheiten ej aufgefaßt: � wij * oj neti Die Ausgabe oi einer Einheit ei w1rd durch die Ausgabefunktion f näher bestimmt, die als Argument den Aktivierungswert ai erhält: f(ai) oi. Die Arbeitszyklen des Netzes NET werden normalerweise als synchron (getaktet) vorgestellt, so daß zu den einzelnen Zeitpunkten t - d. h . , t = 0, I, 2, ... - die Einheiten parallel, d. h. gleichzeitig operieren. -
=
=
3. 3 . 2. 3
Die Schichten eines formalen neuralen Netzes
Innerhalb eines Netzes können Einheiten zu verschiedenen Schichten zusammengefaßt werden - häufig wird auch eine spezifische Verbindung von Einheiten als Schicht bezeichnet. Es werden im wesentlichen drei verschiedene Charakterisierungen vorgenommen. Die erste Schicht besteht aus Einheiten, die Eingaben der Umgebung erhalten, und wird als Input schicht bezeichnet. Eine weitere Schicht bilden diejenigen Einheiten, welche mit der Umgebung über ihre Ausgabe in Beziehung stehen. Diese wird als Ausgabeschicht bezeichnet. Alle anderen Einheiten, die nicht nur mit weiteren Einheiten verbunden sind und nicht direkt mit der Umgebung in Beziehung stehen, werden als "verborgene" interne Einheiten (hidden units) bezeichnet und können zu weiteren Schichten zusammengefaßt werden. !
I' ! ".··
Ausgabeschicht
' hidden units• EI ngabesch ic.ht
346 3.3.2.4 Netztypen mit Bezug auf die Richtung des Informationsflusses Betrachtet man den gerichteteten Informationsfluß von einer Schicht zu anderen Schichten, so können anhand dieses Kriteriums drei Arten unterschie den werden. Es gibt nur einen Informationsfluß von der Eingabeschicht über verborgene Schichten zur Ausgabeschicht. In diesem Fall spricht man von bottom-up - oder feedforward -Netzen. Bei top-down Netzen handelt es sich um die entgegengesetzte Informationsflußrichtung. Wenn beide Flußrichtungen vorkommen, spricht man von interaktiven Netzen.
Infor,.ationsfluss i" Hetz: � bottoft up
Inforftationsfluss i" Hetz: � top doHn
Infor..ationsfluss ifo1 Hetz: � interaktlY
Bei den parallel synchron arbeitenden Netzen können verschiedene Modell klassen unterschieden werden. Rumelhart et al. (1988, 61 ff.; vgl. Ander son et al. 1977) führen einige repräsentative an: einfache lineare Modelle, Mo delle mit linearen Schwellenwertelementen, brain state in the box-Modelle. Einfache lineare Modelle bestehen meist aus der Schicht der Eingabe einheiten und der Schicht der Ausgabeeinheiten. Die hidden units werden nicht benötigt. Netze dieser Modellklasse mit hidden units können von Netzen ersetzt werden, die das gleiche leisten, aber nur aus Eingabe und Ausgabeeinheiten bestehen (Rumelhart et al. 1988, 62). Die Ausgabe funktion f ist die Identitätsfunktion id, so daß der Ausgabewert o gleich dem Aktivitätswert a ist. Lineare Modelle können die logische Funktion xor nicht berechnen (Cowan & Sharp 1988), dies leisten jedoch die Modelle mit Schwellenwertelementen und verborgenen Einheiten. 3. 3. 2. S
Die Funktionsweise eines neuralen Netzwerkes an dem klassischen Beispiel der xor-Funktion
Um die Verhaltensweise eines Netzwerkes zu illustrieren, soll als Beispiel ein einfaches Modell mit Schwellenwerten angeflihrt werden, das "mehr" leisten kann als die einfachen linearen Modelle (vgl. Cowan & Sharp 1988 ). Es soll einen Eindruck davon geben, wie ein spezielles
347 Netzwerk arbeitet, dargestellt wird und was es leistet, d. h. wie es lernt und auf welche Art und Weise es eine Funktion berechnet. Danach wird, um ein Gefühl für den Unterschied zwischen dem konnektionistischen und dem symbolischen Vorgehen zu vermitteln, dieselbe Funktion in LISP definiert. Bei der durch das Netzwerk bzw. das LISP-Programm zu realisierenden Funktion handelt es sich um die Bootesche Funktion xor, von der ich schon zeigte, daß sie nicht von einem einzigen formalen McCulloch-Pitts-Neu ron realisiert werden kann (vgl. Kapitel 2. 2. 3 . 1 , S. 66 ff.). Sie ist das Stan dardbeispiel in der konnektionistischen Literatur, an dem die Vorteile der neueren konnektionistischen Modelle erörtert werden: Die Funktion xor ist geschichtlich insofern interessant, als sie weder von einem einschich tigen perceptron mit Schwellenwertelementen noch von Adaline (adaptive linear network) berechnet werden kann.2 Dies liegt daran, daß kein ein zelnes Schwellenwertelement in der Lage ist, diese Funktion zu berechnen 3 und eine aus elementaren Einheiten zusammengesetzte äqui valente Funktion wie (x and not y} or (y and not x) notwendig ist, um sie darzustellen. In meinem Beispiel liefert die erste Verknüpfungsschicht die Funktionen (x and not y) und (y and not x), während die zweite Verknüpfungsebene die or- Funktion wiedergibt. Das Netzwerk soll die zweistellige Bootesche Funktion xor berechnen. Diese Funktion kann als Interpretation des natürlichsprachlichen aus schließenden "entweder-oder" aufgefaßt werden, das nur dann den Wahr heitswert wahr erhält, wenn genau einer der Teilsätze wahr und der andere falsch ist. Die Funktion xor zeigt folgendes Verhalten (wahr = 1; falsch = 0): xor(O, 0) xor(O, 1)
0, xor(1, 0) 1, 1 , xor(1, 1 ) = 0.
Dieses Verhalten kann wiederum wie üblich in Form einer Tabelle dargestellt werden, in der die ersten beiden Spalten die Belegung der Argumentvariablen angeben und die darauffolgende Spalte den zugehörigen Wert der Funktion. Ich gebe in dieser Tabelle ebenfalls den Wert für die äquivalente Form (x and not y} or (y and not x) an, da eigentlich sie in dem Netzwerk realisiert wird:
1) vgl. Papert 1988 und Rumelhart, Hinton & Williams 1988 318-322 u. 330- 334. Auch in der Literatur zur Kognitiven Musikpsychologie fand die Erörterung der mit der xor Funktion verbundenen Problematik Eingang: e. g. Bharucha & Olney 1989, 353-354. 2) Eine historische Darstellung mit Klassifizierung der verschiedenen Modelle von Netzwerken geben Cowan & Sharp 1988, 92. 3) In Kapitel 2. 2. 3. 1. 6, S. 78 ff. befindet sich der Beweis und eine äquivalente logi sche Funktion. Vgl. auch Arbib 1981, 127.
348 X
0 1 0
y
0 0
xor
0 1 1 0
(x and not y} or (y and not x) 0 1 0 0 1 1 1 1 0 0 1 0 0 1
0
0
0
Die den Argumenten entsprechenden Funktionswerte wurden in kursiver Fettschrift kenntlich gemacht, um die formale Äquivalenz hervorzuheben. Wie sieht jetzt ein konnektionistisches Netzwerk aus, daß die xor-Funkti on realisiert und wie ist sein funktionales Verhalten zu beschreiben? Das Netz1 besteht aus S Einheiten e 1, , es, die die Menge ENT bilden und drei Schichten, ..•
a) der Schicht der Eingabeeinheiten mit e1 und e2 ; b) der Schicht der verborgenen Einheiten bestehend aus e3 und e4; c) der Schicht der Ausgabeeinheiten, die in diesem Fall nur aus der Einheit es besteht. Die einzelnen Einheiten e1 sind entweder aktiv oder inaktiv. Die Akti vierungsmenge A kann in diesem Fall als aus den Elementen 1 aktiv und 0 = inaktiv bestehend aufgefaßt werden, d. h. als Bootesche Menge BOOL. Die Struktur des Netzes kann durch die Menge NET = {(e , e3), 1 (e1, e4), (e2, e3), (e2 , e4), (e3, es), (e4, es )} der geordneten Paare (ej , e1) beschrieben werden, die die Interpretation "ej leitet Information nach e1" erhalten. Die Eingabemenge IN des konnektionistischen Netzes besteht aus den Elementen der Menge BOOL X BOOL = {(0, 0), (1, 0), (0, 1), (1, 1)}. welche die Argumente der Funktion xor darstellen. Die Ausgabemenge OUT ist mit der Menge BOOL identisch. Es muß jetzt noch das funktio nale Verhalten des Netzes bzw. der Einheiten mittels der Aktivierungs funktion F und der Ausgabefunktion f bestimmt werden. Die Aktivierung ai einer Einheit e1 wird in diesem Fall als Funktion F von net1, der eingehenden Impulse, aufgefaßt: a1= F(net1). Sie liefert, wie schon gesagt, nur die Werte 1 oder 0. Um net1 zu bestimmen, müssen zuvor die Adaptionsparameter - die Gewichtungen wij - bestimmt werden. Der Einfachheit halber sollen diese nur Werte aus der Menge {1, -1} annehmen können. Bei dem Wert wij = 1 wäre an ei ne exzitatorische Verbindung zu denken, während bei wij = -1 eine inhi bitorische Verbindung vorzustellen ist. Als Aktivierungsfunktion F wird eine Schwellenwertfunktion genommen mit: =
1 , falls neti 1) vgl. die Graphik auf S. 350.
= �wij • oj J
>
0
0, sonst d. h. neti = � wij • oj J
s
0
349
Eine Einheit ei wird aktiv (ai = 1 ), wenn die Summe ihrer gewichteten Eingaben (neti = L:wij * oj ) größer als ein bestimmter Schwellenwert s ist, in diesem Fall l s = 0. Ist sie niedriger als der Schwellenwert, so ist Einheit ei inaktiv (ai = 0). Die Aktivität einer Einheit ist daher nur vom Überschreiten des Schwellenwertes abhängig. Das Argument neti der Aktivierungsfunktion F kann in diesem Beispiel nur die Werte 1, 0 und -1 annehmen. Als Ausgabefunktion f für jede Einheit wird die Identitätsfunktion id gewählt, welche als Wert immer ihr Argument gibt, so daß sich oi = ai ergibt. Mit Zeitbezug ergibt sich fi(�(t)) = oi(t) Die Ausgabe oi einer Einheit ei ist also gleich ihrem Zustandswert ai. Ich fasse zusammen: Die Einheiten bilden die Menge ENT= { e1, e2, e3 , e4, es} ; {(e1 , e3), (e1 , e 4), (e2, e3), (e2 , e4), NET die Netzstruktur ist (e3 , es)' (e4, es )}; die Netzeingabemenge IN = {(1, 1), (1, 0), (0, 1), (0, O)}; die Netzausgabemenge OUT = BOOL = 0 = { 0, 1 } ; die Aktivierungsmenge A = BOOL = { 0, 1 } ; die Eingabemenge = I { 1, -1, 0 }; die Gewichtungen wij sind aus der Menge { - 1, +1 }; neti wird bestimmt durch die Propagierunsfunktion net �wij * Oj , mit Oj € 0 Ünd 1 s: j die Aktivierungsfunktion F: Der Wert ai der Aktivierungsfunktion F(neti) = Dies ergibt speziell die Aktivierungs funktion F: {-1, 0, 1 } � BOOL mit:
Die Ausgabefunktion f = id ist f: A �BOOL, mit:
{ 0, falls neti= T wij * sonst 1,
neti -1
0
s:
n;
oi > 0
F(neti) = ai 0 0
f(ai) = oi 0
Um die Berechnungen kompakt beschreiben zu können, werden die einzelnen Werte zu einem bestimmten Zeitpunkt in Matrizen bzw. Vekto ren zusammengefaßt, um dann mit Hilfe der Matrizenrechnung die notwen digen Rechenschritte durchzuführen. So können z. B. die Booteschen Eingabewerte x, y in das Netz zu einem bestimmten Zeitpunkt zu dem Vektor i zusammengefaßt werden; ebenso
350 die Aktivierungen ai einer Schicht zu einem Vektor a , die Ausgaben oi der Einheiten einer Schicht zu dem Vektor o und die Eingaben neti in eine Schicht von Einheiten ei können mit einem Vektor net bezeichnet werden. Auch die einzelnen Verknüpfungen der Einheiten sind durch Matrizen M anzugeben. Ein konnektionistisches Netz, das die Boolesche Funktion xor reali siert, weist folgende Form auf:
ol al net l H2 o2 a2 net2 Hl ol a! i
In dem Beispiel kann der Eingabevektor werten BOOL folgende Werte annehmen: .
oder
oder
GJ
{:] oder
mit d•n Eingab•-
[:J
Nachdem F auf die Werte der entsprechenden Einheiten angewandt wurde, ergibt sich der neue Aktivierungsvektor al ftir die Einheiten der Eingabeschicht. Der Aktivierungsvektor al entspricht in diesem Fall dem Eingabevektor i. Nachdem die Funktionskomposition fi * Fi für jede Einheit ei angewandt wurde - d. h. f wird auf die einzelnen Werte des Aktivie rungsvektors al angewandt, ergibt sich der Ausgabevektor ot, d. h. ol kann folgende Werte annehmen: ot =
[:]
oder
[�] '" [:] ''" [:] '
351 Wenn die Verknüpfungsmatrix Mt der ersten Schicht mit den Verknüp fungsgewichtungen wij - d.h., die Einheit ej wirkt aktivierend auf Einheit ei bzw. ei wird von ei erregt - erstellt wird, ergibt sich folgendes Bild (mit i = Zeile, j = Spalte): e1 e wij 2 Mt = e3 +1 -1 +1 e4 -1 Nun wird die Gewichtungsmatrix Mt mit dem Ausgabevektor ot der ersten Ebene der Einheiten multipliziert und ergibt den Eingabevektor net2 für die zweite Ebene von Einheiten. Nachdem die Funktionen f und F auf die einzelnen Elemente des Eingabevektors net2 angewandt wurden, erhält man nach Anwendung von Fi auf den Wert der entsprechenden Einheit ei den neuen Aktivierungsvektor a2 und nach Anwendung von f den mit a2 identischen Ausgabevektor o2 :
Mt
*
f � b +.J
•
Mt
*
ot
net2
l
(+1 • 1) + H =
Mt
*
•
1)
(-1
*
1) + (+1 * 1 )
( +1
*
1) + (-1 * 0)
=
(-1 * 1 ) + (+1
Mt
•
GJ
=
*
0)
(+1 • 0) + (-1 * 1 ) (-1 • 0) + (+1 (+1 • 0)
+
(-1
= ( -1
*
0) + ( +1
*
• *
o2 = a2
. [:] [;]
1)
0) 0)
Nach der Ausführung von f * F auf die Elemente des Ausgabevektors
o2, welcher zuvor mit der Gewichtungsmatrix M2 multipliziert wurde, um den neuen Eingabevektor net3 für die höhere nächste Ebene zu erhalten, ergibt sich der Ausgabevektor o3. Die Matrix M2 wird mit o2 multipliziert um den Wert des Netz vektors net3 zu erhalten, welcher die Argumente für die Aktivierungs funktion F liefert, so daß der Aktivierungsvektor a3 berechnet werden
352 kann. Dieser wiederum liefert die einzelnen Argumente für die Ausgabe funktion f, so daß die Werte des Ausgabevektors o3 berechnet werden können.
M2
es
=
M2
•
M2
*
M2
•
M2
•
+1 >
< +1
net3
o2
[:] CJ
a3 = o3
(+1 • 1 ) + (+1 • 0 )
=
< 1 >
(+1 * 0) + (+1 * 1 )
=
< 1 >
= < 0 >
= (+1 * 0) + (+1 * 0 )
Ich fasse die wesentlichen Etappen zusammen: Es ist zu erkennen, daß die Eingabeeinheiten e1 und e2 jeweils eine Ausgabe mit o1 = o2 = 1 liefern, wenn sie eine 1 als Eingabe erhalten. Ebenso liefern sie o1 = o2 = 0, wenn sie eine 0 als Eingabe haben. Die mittleren, verborgenen Einheiten e3, e4 weisen folgendes Verhalten in Abhängigkeit von den Ausgaben der Einheiten e 1 und e2 sowie der ent sprechenden Gewichtungen wij auf: Aktivität Ausgabe neti = I: Wjj * 0 der Einheit der Einheit Einheit e3 J F(neti) f(ai) (w3 1 * 01
+ w32 * o2)
((+ 1) ((+1) ((+1) ((+ 1 )
+ (-1) * 1 + (- 1 ) • 0 + (- 1 ) • 1 + ( -1) * 0
* 1 * 1 • 0 * 0
) ) ) )
= = =
net3
aJ
03
0
0 1 0 0
0 1 0 0
-1 0
Die Einheit e3 wird nur aktiv, wenn die Einheit e1 als Eingabe x = 1 erhielt und e2 mit y = 0 belegt war. In den anderen Fällen, d. h. bei Eingabe von (1, 1), (0, 1) und (0, 0), bleibt sie inaktiv und kann e5 nicht erregen. Wir haben die Realisierung von (x and not y).
353 Einheit e4
•
(w4t • 01
+
w42
((-1) . ((-1) . ((-1) . ((-1 ) .
+ + + +
(+1) • 1 (+1) • 0 ( +1) * I ( +1) • 0
1 1 0 0
o2)
net4
a4
04
=
0
=
-1 1
0 0
0 0
= =
0
1
1
0
0
Die Einheit e4 wird nur aktiv, wenn e1 mit x = 0 versehen und sie selbst mit y 1 aktiviert war. Ansonsten kann auch sie es nicht aktivie ren, da sie bei den Eingaben (1, 1 ), (1, 0) und (0, 0) nicht aktiviert wur de. Es handelt sich um die Realisierung von (y and not x). =
Einheit es
(wsJ
*
((+1) . ((+1) * ((+1) . ((+1 ) .
03
+
0 0
1
+ + +
0
+
Ws4 * o.)
( +1) '* 0 (+1) • 1 (+1) * 0 (+1 ) '* 0
=
nets
as
Os
0
0
0
I 0
1
1 1
0
0
=
Es ist zu sehen, daß die Einheit e5 nur aktiviert wird, wenn e3 oder e4 aktiviert wurde. Die Einheit es gibt also nur eine Ausgabe Os = 1, wenn die Eingabe in das Gesamtnetz (1, 0) - d. h. e 3 aktiviert wurde - oder (0, 1) war, d. h. e4 aktiviert wurde. Sonst - bei (1, 1) und (0, 0) - wer den e3 , e4 nicht aktiviert und es kann daher auch es nur als Ausgabe Os = 0 liefern. An den Einheiten e3 und e4 wird aber der Wert von (x and not y) bzw. (y and not x) realisiert. Insgesamt erhält das Netz an der Einheit e5 als Ausgabe o5 den Wert von (x and not y) oder (y and not x). Wie aus der Tabelle ersichtlich wurde, ist dies die xor-Funktion, und das konnek tionistische "neurale" Netz realisiert - berechnet - somit die gewünschte Bootesche Funktion. 3. 3. 2. 6 Die Funktion xor in der symbolverarbeitenden Sprache LISP
Als nächstes soll die Funktion xor in LISP1 realisiert werden. In LISP werden die Wahrheitswerte - die Menge BOOL - wahr = 1 und falsch 0 0 repräsentiert. Aus Gründen der durch die Atome T = 1 und NIL Textualität ordne ich ihnen mittels der LISP-Funktion SETQ die Namen "wahr" und "falsch" zu. Der Name "sonst" steht ebenfalls für den Wahr heitswert T. Um nicht auf andere Wahrheitsfunktionen des Systems zurückzugreifen, wurde xor nur mit den elementaren LISP-Konstrukten definiert. =
=
I)
Näheres
zu LISP
findet sich in Kap.
2. 2. 4. 3. 4, S. 149
ff.
354 (DEFUN XOR ( WAHRHEITSWERT1 WAHRHEITSWERT2) (COND ((EQ WAHRHEITSWERT1 WAHR) (COND ((EQ WAHRHEITSWERT2 WAHR) FALSCH) (SONST WAHR))) ((EQ WAHRHEITSWERT2 WAHR) WAHR) (SONST FALSCH))) Durch DEFUN erhält die Funktion den Namen "xor". " Wahrheitswertl" und " Wahrheitswert2" sind die Namen der Variablen für die Argumente der Funktion xor. Argumente der Funktion sollen nur die Wahrheitswerte wahr und falsch sein. Ein verallgemeinerter Bedingungsausdruck ist durch "COND" repräsentiert, der in folgender Weise zu lesen ist: Wenn <> erfüllt, d. h. nicht NIL ist, dann führe den folgen den Ausdruck »Ausdruck-1» aus und gib dessen Wert zurück. Ist sie nicht erfUllt, dann prüfe die nächste Bedingung, >>Bedingung-2». Ist keine Bedingung erflillt, so werte den auf SONST folgenden Ausdruck >>Aus druck-n+l> > aus und gib dessen Wert zurück. Die allgemeine Struktur von COND ist also: (COND (wenn »Bedingung!>>, dann werte >>Ausdruck-!> > aus) (wenn >>Bedingung2», dann werte »Ausdruck-2» aus) (wenn , dann werte aus)
(wenn >>Bedingung-n>>, dann werte >>Ausdruck-n>> aus) (sonst werte >>Ausdruck-n+l» aus) Mit EQ werden Atome, die Werte von Namen verglichen. Ist der Wert von A gleich dem Wert von B? Die Funktionsdefinition von XOR liest sich nun wie folgt: 1 ) Wenn die Variable Wahrheitswertl den Wert wahr hat, dann ma che folgendes: Prüfe, ob die Variable Wahrheitswert2 ebenfalls den Wahrheitswert wahr erhalten hatte. Ist dies der Fall, dann gib den Wert von "falsch" zurück. Hat Wahrheitswert2 aber den Wert des Namens "falsch", gehe zu "sonst" und gib den Wert des Namens "wahr" zurück. 2) Es ist der Fall, daß Wahrheitswertl den Wert von "falsch" hat. Es ist nun zu prüfen, ob Wahrheitswert2 den Wert von "wahr" hat. 3) Haben sowohl Wahrheitswertl als auch Wahrheitswert2 den Wert von "falsch", dann gib den Wert von "falsch" zurück. Wie zu erkennen ist, läßt sich im Gegensatz zur konnektionistischen Realisierung der xor-Funktion aus der Funktionsdefinition in LISP mit etwas Übung das Verhalten der Funktion direkt ablesen und relativ
355
schnell bestimmen. In solch einem Fall spricht man auch davon, daß die ent sprechende Information explizit vorliegt, während sie in konnektionistischen Modellen implizit vorhanden ist. Es sind daher für die Lösung eines Problems innerhalb des symbolverarbeitenden Ansatzes ein genaues Verständnis und die explizite Formulierbarkeit des zu behandelnden Problembereiches notwendig. Da das Wissen in konnektionistischen Modellen im wesentlichen durch die Verknüpfungsstruktur und die Adaptionsparameter - die Gewichtungen - implizit auf "subsymbolischer" Ebene distribuiert repräsentiert ist, entzieht es sich einer expliziten Formulierbarkeit und erschwert den Entwurf komplexer konnektionistischer Systeme für den Wissensingenieur. Dieser ist auf die "Lernfähigkeit" und "Selbstorganisation" des Systems angewiesen. Kemke (1988, 14 7) vermerkt hierzu: Da das Wissen in einer dem Menschen schwer verständlichen Form im gesamten Netzwerk verteilt ist, kann das Verhalten des Systems mit heutigen Methoden nicht durch eine Analyse seiner Struktur bestimmt werden. Die einzige Mög lichkeit, Aussagen über seine Leistungsfähigkeit zu gewinnen, sind Tests.
3. 3. 2. 7
Lernen in konnektionistischen Netzwerken - Ein Beispiel
Was soll der Vorteil der konnektionistischen Modelle gegenüber den "symbolischen Implementierungen" sein, wenn für beide Ansätze gilt, daß sie aufgrund der Church-These prinzipiell nicht aus dem Bereich des Algorithmisch-Berechenbaren hinausfUhren? Als zentrales Argument wird die besondere "Lernfähigkeit" der konnektionistischen Modelle hervorge hoben. Wie kann ein solches Netzwerk lernen? Nehmen wir an, daß die Verknüpfungen wie gegeben vorliegen, jedoch unbekannt ist, welche Werte die einzelnen Gewichtungen wij annehmen müssen, dagegen bekannt ist, welchen Ausgabewert die einzelnen Einhei ten haben sollen, um das gewünschte funktionale Verhalten zu erzeugen. Man spricht in diesem Fall von supervised leamin,g im Gegensatz zum unsupervised Jearning. Die einzelnen Gewichtungen werden zufällig mit den Zahlen -1 oder + 1 belegt. Um jetzt durch Training das Netz die ge wünschte Funktion erlernen zu lassen, könnte die Widrow-Hoff-Regel (s. S. 344 u. vgl. Rumelhart et al. 1988, 53 u. 65) benutzt werden� 1) Das Beispiel erhebt keinen Anspruch auf allgemeine Gültigkeit, denn es wurde stark vereinfacht. Es soll die generelle Idee des Lernens eines Net:zwerkes mithilfe einer Lernregel nur illustrieren, so daß weiterhin die Komplexität der Berechnung, d. h. die Anzahl der Zyklen, einfach gehalten werden muß. Cowan & Sharp (1988, 104) erwähnen, daß schon ein einfaches Netzwerk mit back·propagation 558 Zyklen benötigte, um die gewünschte Leistung zu erbringen. Es wird hier auch nicht auf Voraussetzungen wie Orthogonaltität und Vektorlänge für das "äußere Produktlernen" einfacher linearer Netz werke eingegangen sowie die Bedeutung der Einführung des Lernparameters & oder an derer Mechanismen zu deren Überwindung. Für diese ganze Problematik s. Sharkey 1988; Jordan 1988 u. Rumelhart, Hinton & Williams 1988.
356 Der Ausgabewert oi ist gleich dem Aktivierungswert ai, da es sich bei der Ausgabefunktion um die Identitätsfunktion id handelt. Sie nimmt somit die Form 6wij= S •(ti - ai) • ai an. Der Wert S könnte mit 2 besetzt werden. Die Regel besagt in diesem speziel len Fall, daß nur dann, wenn aj = 1 = Oj ist, eine Veränderung der Gewichtung wij erfolgt. Nehmen wir an (s. Abb. S. 350), die Gewichtungen seien wie folgt verteilt: w41 = w31 = w32 = w42 = w53 = w54 = -1, d. h. alle werden mit -1 besetzt. Soll unser Netz trainiert werden, so müssen wir uns zu Beginn nicht mit der Eingabe (0, 0) und (1, I ) befassen, da die Einheiten e3, e4 das gewünschte Ergebnis liefern würden. Zwar würde sich bei der Eingabe von (1, I ) die hemmende Gewichtung vergrößern, doch das soll in diesem Beispiel nicht interessieren, da es um die Vorstellung des Lernmechanismus geht. Geben wir (1, 0) ein mit t = 1 für die Einheit e3 . Dann erhalten wir wij = 2(1 - 0)1 = 2 für o1 = a1 = 1 und der Schwel lenwert w31 ändert sich in +1. Bei einer weiteren Eingabe von (1, 0) findet keine weitere Veränderung statt, da der Lernwert t = a3 ist. Der Schwellenwert w32 muß nicht näher betrachtet werden, da bei Eingabe von 0 keine Veränderung zu erwarten ist. Bei der Eingabe (0, 1 ) muß aus demselben Grund der Schwellenwert w41 nicht betrachtet werden. Für die Verbindung von e2 nach e4 ergibt sich bei einem erwünschten Lernwert t = 1 eine Veränderung der Gewichtung w42 auf +1. Und eine weitere Ein gabe von (0, 1 ) liefert den Nachweis daftir, daß e4 das gewünschte Ver halten aufweist. Allerdings zeigt es noch immer nicht das geforderte Verhalten, sie gibt sowohl bei o3 = 1 als auch o4 = 1 immer 0 aus. Durch Anwendung der Lernregel können aber auf die gleiche Art und Weise die Schwellenwerte der beiden Verbindungen (e5, e3) (es , e4) auf +1 verändert werden, um so die gewünschte Ausgabe zu erhalten. Es hätten als Schwellenwerte auch andere reelle Zahlen zugelassen und eine andere Lernrate benutzt werden können. Das Netz hätte immer das gewünschte Verhalten gezeigt, sobald die Gewichtungen mit positiven und negativen reellen Zahlen richtig auf die Verbindungen verteilt worden wären, so daß man die Verbindungen mit positiven Gewichtungen durch ein "+" und die mit negativen Zahlen charakterisierten durch ein " - " kennzeichnen könnte. Was ist aus diesem Beispiel zu ersehen? Zum ei nen ist deutlich erkennbar, wie das Gesamtverhalten des Netzes von den Verbindungen mit den Schwellenwerten bestimmt wird. Zum anderen ist zu sehen, daß Lernen abhängig ist von der Wahl der Lernrate und der Kenntnis der gewünschten Ausgabewerte. Diese Kenntnis ist besonders bei den hidden units schwierig. Des weiteren muß man sicher sein, daß der benutzte Lernalgorithmus zum Ziel führt. Die Forschung im Bereich des Konnnektionismus ist daher auf die Entwicklung von Lernalgorithmen und den Nachweis ausgerichtet, daß diese Algorithmen bei bestimmten Klassen von Modellen zum Lernerfolg ftihren. Ich fasse die kennzeichnenden Merkmale der konnektionistischen Mo-
357
delle, soweit es für das Verständnis des bisher Gesagten wesentlich ist, noch einmal zusammen. Eine genaue Charakterisierung dieser Modelle, die von dem größten Teil der Forscher akzeptiert würde, ist auch in der Fachliteratur nicht anzutreffen; es gibt derzeit noch keine übereinstim mende genaue Definition der Familie der konnektionistischen Modelle (Kemke 1988, 144). Es lassen sich allerdings einige Gemeinsamkeiten ausmachen (Kemke 1988, 144 ff.; Rumelhart et al. 1986 4 5 ff.): Ein konnektionistisches Modell kann als Struktur verstanden werden, die aus Einheiten (units, nodes, Prozessoren) besteht, welche als miteinander verbundene mathematische Automaten aufgefaßt werden. Eine solche Struktur ist durch einen gerichteten Graphen darstellbar. Hierbei werden die Knoten des Graphen als Einheiten und die Kanten als Verbindungen interpretiert. Die Idee des aus Neuronen bestehenden Gehirns, die über Axone an den Synapsen verbunden sind, stand hier Pate. Solch ein kon nektionistisches Netzwerk besteht bei mittlerer Größe aus 10-100 Einheiten. Sie können jedoch auch aus 1on (nZ= 4 ) Einheiten bestehen. Diese Einheiten müssen einfach sein, dürfen keine komplexen Berechnun gen durchführen und sollten ungefähr die gleiche Leistungsfähigkeit auf weisen. Durch diese Bedingungen werden die in der klassischen KI be kannten Aktor- und objekt-orientierten Systeme ausgeschlossen1 • Die Einheiten weisen einen veränderbaren Aktivierungszustand a aus der Menge der Aktivierungzustände auf. Die gerichteten Kanten (Verbindun gen) werden gewichtet, geben die Verbindungsstärke der einzelnen Ein heiten zueinander an und sind ebenfalls veränderbar. Positive Werte werden als aktivierend, negative Werte als inhibierend interpretiert. Ähnlich wie in der Neurophysiologie nimmt man an, daß sich bei einem Lernprozess die Verbindungsstärke (Gewichtung) vergrößert. Dieses Verhalten wird allgemein durch die Hebbsche Regel (Hebb 1975, 80; 1949, 62; Palm 1988) ausgedrückt, die in modifizierter Form von Bedeu tung für die konnektionistischen Modell ist: When an a:x:on of cell A is near enough to e:x:cite a cell B and repeatedly takes part in firing it, some growth process or metabolic change takes place in one or both cells such that A's efficiency, as one of the cells firing B, is increased.
Die Aktivierungsänderung einer Einheit ei durch eine Einheit <] wird als abhängig von der Aktivierung der Einheit ei und der Verbindungsstärke (der Gewichtung wij) betrachtet. Die Wissensrepräsentation fmdet also ihren Ausdruck in der Verbindungsstruktur des Netzwerkes, d. h., es ist von Bedeutung, welche 'Einheiten miteinander verknüpft sind, in welche Richtung der Informationsfluß geht und wie stark die einzelnen Einheiten miteinander verbunden sind. Wenn ganze Teilstrukturen bzw. Aktivitätsmuster die Repräsentation durchfUhren, spricht man von verteilter, distribuierter I) Es handelt sich um parallel-distribuierte Systeme der Distribuierten Künstlichen In·
telligenz (distributed artificial intelligence, DA/) zu denen auch die Produktionssysteme und blackboard·Atchitekturen gezählt werden; vgl. Gasser 1991; Hewitt 1991.
3S8
Repräsentation (distributed representation). Entsprechen konzeptuelle Ob jekte direkt einzelnen Einheiten ( one unit one concept), so wird von lo kaler Repräsentation (Jocal representation) gesprochen. Man unterschei det noch Eingabe- und Ausgabeeinheiten sowie verborgene (interne, hid den) Einheiten. Die Ein- und Ausgabeeinheiten stehen, wie schon erwähnt, in direktem Kontakt zu der "Umwelt" und bilden somit die Schnittstelle (interface) des Systems. Die verborgenen (internen, hidden) Einheiten erhalten nur über die Ein und Ausgabeeinheiten Kontakt zur Umwelt. Wenn der Informationsfluß nur von den unteren Schichten zu den oberen Schichten fließt, spricht man von bottom-up oder feedforward Netzwerken. Beeinflussen höhere Ebe nen das Verhalten der unter ihnen liegenden Schichten, wird von top down Struktur gesprochen. Bei beiden Möglichkeiten werden diese Netzwerke interaktiv genannt. Insgesamt erweisen sich folgende Aspekte (Kemke 1988, 147; Rumelhart 1986, 46) als ftir konnektionistische Modelle charakteristisch, die dann ih re spezielle Beschreibung und mathematische Behandlung erfahren: a) Strukturelle Merkmale: - eine Menge von Verarbeitungselementen (processing units): die Einheiten ei - die Struktur des Netzwerkes, welche bedingt ist durch die Verknüpfungsanordnung der Einheiten; dargestellt durch einen gerichteten Graphen b) Die Spezifikation der Verarbeitungselemente: - durch den Aktivierungsgrad ai jeder Einheit ei aus einer Menge von Aktivierungszuständen A - durch die Eingabemenge I (nput; i ne� ( I) und die Ausgabemenge 0 (output; Oj ( 0 ) der Einheiten ei .91 Das funktional bestimmte Verhalten: - eine Ausgabefunktion fi für jede Einheit ei, die abhängig ist vom Akti vierungsgrad ai der Einheit ei: fi(ai) = oi - eine Übertragungsfunktion ne l.j (propagation rufe): die Berechnung der aktuellen Eingabe der internen Einheiten, welche häufig die Summe des Produktes der Ausgaben oj der der Einheit ei vorgeschalteten Einheiten ej mit deren entsprechender Verbindungsgewichtung wij ist: neti = I:wij * Oj - eine Aktivierungsfunktion Fi für jede Einheit ei, welche den neuen Aktivierungsgrad der Einheit ei in Abhängigkeit von ihrem Aktivie rungsgrad ai und der übertragenen Aktivierung, dem Wert der Funktion neti: Fi (ai(t-1), neti) ai(t). In einigen Fällen wird z. B. auf die Ab hängigkeit vom Aktivierungsgrad verzichtet. Fi ist dann nur von dem Wert der Übertragungsfunktion abhängig: Fi (neti) = ai d) Die verschiedensten Lernregeln, deren Grundidee durch die Hebbsche Regel ausgedrückt ist =
359 3.3.3
Ein konnektionistisches Netzwerk zur Erkennung der Dur-Tonarten
Auch in der musikpsychologischen Forschung (e. g. Bharucha 1987 a, 1987b) und als unterstützendes Hilfsmittel bei der Kompos.ition (Dolson 1989) verspricht man sich von konnektionistischen Modellen einige neue Er kenntnisse bzw. interessante Anwendungsmöglichkeiten. Um einen Eindruck vom Einsatz konnektionistischer Modelle in der Musikforschung zu gewinnen, soll hier exemplarisch auf die Arbeit von Scarborough, Miller und Jones (1989) eingegangen werden. Scarborough, Miller und Jones 1 wollen ein psychologisches Modell des Musikhörens anband der Theorie von Lerdahl und Jackendoff (198.3) erstellen, das in Form eines Expertensystems in Pascal bzw. Modula-2 implementiert und überprüft wurde. Die "formale" generative Musiktheorie von Lerdahl und Jackendoff (1983) hat für sie heuristischen Wert. Es wurde versucht, ei nen Teil der psychologisch interessanten Präferenzregeln zu implementieren. Ein Teilproblem ihrer (Scarborough, Miller & Jones 1988) Implemen tierung, das der Tonarterkennung, wurde auch in einem konnektionisti schen Netzwerk behandelt. Für Scarborough, Miller und Jones (1989) ist das Problem - ähnlich wie in dem komplexeren Modell von Bharucha2 ein Modell zu erstellen, das in der Lage ist, innerhalb der tonalen euro päischen Musik anhand von identifizierten Tonklassen die Tonart zu bestimmen. Diese Modeliierung ist nicht notwendigerweise an die Model Iierung innerhalb des konnektionistischen Ansatzes gebunden. Der von Scarborough, Miller und Jones (1989) benutzte Algorithmus zur Tonarter kennung wurde zuerst im symbolischen Paradigma von dem Nobelpreisträger H. A. Sirnon (1968) entwickelt. Das von H. A. Sirnon entwickelte LISTENER Programm3 sollte aus einer gegebenen Melodie die Tonart des Stückes extra hieren. Die grundlegende Idee für den Algorithmus bestand darin, das Vorkom men jeder Note aus dem chromatischen System C - CIS/DES - D - DIS/ES F - FIS/GES - G - GIS/AS -A AIS/ B - H - C zu zählen. Dann wurde die Anzahl der Töne eines Tonika-Akkordes - z. B. D - FIS - A gezählt. Der Ak kord mit der höchsten Gesamtzahl an Tönen wurde zur Bestimmung der Ton art benutzt. Dieses Programm wurde mit jeweils einem Werk von Mozart, Brahms, Beethoven und Schumann getestet. Allein bei dem Werk von Brahms, das nacha-moll moduliert, aber in e-moll steht - und diese Modulation ist ein sehr schlichter Vorgang -, wurde die Tonart mit a-moll falsch bestimmt. In den anderen Fällen arbeitete das Programm erfolgreich.. -
-
1) Ihr Forschungsvorhaben wird in Kap 3. 2. 7, S. 332 ff. diskutiert, vgl. auch: Jones, Miller & Scarborough 1988, 1990; Jones, Scarborough & Miller 1990; ; Miller, Scarborough & Jones 1988, 1989; Scarborough, Jones & Miller 1988, 1989; Scarborough, Miller & Jones 1989, 1990. Nach persönlicher Mitteilung von Frau Jones war die Benutzung von Pascal bzw. Modula nicht theoretisch motiviert. 2) s. Bharucha 1987; Bharucha & Olney 1989. 3) vgl. auch Jones, Miller & Scarborough 1988, 261; Scarborough, Miller & Jones 1989, 49.
360 Tonart knoten CDurl
Akkord knoten
Tonhiihen klassen knoten Sthitht der Eingabenoten Abb. nach Scarborough, Miller
&
Jones 1989,
SO
In der Eingabeschicht ihres neuronalen linearen feedforward (bottom-up) Netzes (s. S. 346; Scarborough, Miller & Jenes 1989, 49 ff.), welches Tonarten erkennen soll, repräsentiert jeder Knoten eine Tonhöhenklasse des chro matischen Systems. Genau drei Knoten - der Grundton, die Terz und die Quinte - der Eingabeschicht sind mit genau einem Knoten der mittleren Schicht verbunden, in der jeder Knoten einen Akkord repräsentiert. In der letzten Schicht, in der die Knoten eine Tonart repräsentieren, erhält wiederum jeder Knoten drei Eingaben von jeweils drei Knoten der Ak kord-Schicht. Die drei Knoten der Akkord-Schicht, welche mit einem Knoten der letzten Schicht verbunden sind, interpretiert man als Tonika, Subdominante und Dominate. Die Aktivierung eines oder mehrer Tonhö henklassenknoten aktiviert die entsprechenden Akkordknoten, welche wiederum die jeweiligen Tonartknoten aktivieren. Zu jedem Zeitpunkt wird der Knoten mit dem höchsten Aktivierungswert als die Tonart bestimmend betrachtet. Es können also Modulationen berücksichtigt werden, denn erst dann, wenn die letzte Eingabe erfolgt ist, bestimmt der am stärksten aktivierte Tonartknoten die eigentliche Tonart. Der Grad der Aktivierung eines Knoten der nächsthöheren Schicht wird von den Gewichtungen der einzelnen Verbindungen bestimmt. So ist es z. B. sicherlich sinnvoll anzunehmen, daß der Tonhöhenknoten c den Akkordknoten C, für den er Grundton ist, stärker aktiviert als den Akkordknoten F oder As/GIS, in denen er mit dem Grundton die Quinte bzw. die große Terz bilden wür de. Dieses von Scarborough, Miller & Jenes (1989) entwickelte neurale Netzwerk weist folgende Eigenheiten auf:
361
a) zu jedem Zeitpunkt innerhalb des Stückes ist die Tonart bestimmt b) die Dauer der einzelnen Notenwerte geht mit in die Berechnung ein, eine Viertelnote hat mehr Einfluß als eine Achtelnote etc. c) durch einen Verfallsparameter (decay parameter S ) wird der ab klingende Einfluß der vorher aktivierten Tonknoten und Akkordkno ten erhalten. Das Gesamtverhalten des Netzes ist im wesentlichen von den Ge wichtungen und dem Verfallsparameter abhängig. Die Outputfunktion f ist, wie bei Rumelhart et al. (1986) für lineare Netze, die Identitätsfunktion id ; es ergibt sich mit der Aktivierungsfunktion F folgende Ausgabe:1 oi(t+l) = f(ai) = id(ai) = ai = F(neti') = neti(t+l) + Sneti (t)) = Ewij • Oj(t+l) + S Ewij • Oj (t) bzw. kurz oi(t+l) = Ewij • (oi (t+l) + Soi(t)) Die Bestimmung der Gewichtungen wij stellt das eigentliche Problem beim Lernen in konnektionistischen Netzwerken dar. Scarborough, Miller und Jones (1989) behaupten, daß es im Prinzip mit der Widrow-Hoff-Re gel möglich wäre, das Netzwerk so zu trainieren, daß es die brauchbaren Gewichtungen erzeugt. Es ist jedoch, da es sich hierbei um überwachtes Lernen handelt, methodisch betrachtet so, daß die vorherrschende Tonart pro Eingabe bekannt sein müßte - was eigentlich erst zu erforschen ist. Da dies nicht der Fall ist, vertrauten Scarborough, Miller und Jones auf ihre Intuitionen. Das System soll in der Lage sein, die Tonarten vieler Stücke korrekt zu identifizieren. Leider wurde nicht angegeben, um was für Stücke es sich handelt. Es ist allerdings zu vermuten, daß hauptsäch lich volksliedartige Stücke mit einfacher harmonischer Struktur getestet wurden. Sie führen das Stück "Auld Laung Syne" als Beispiel an, das in F-Dur steht, mit dem Ton c beginnt und vom System sofort mit der richtigen Tonart F-Dur identifiziert wurde. Dies dürfte für Personen unwahrscheinlich sein. Scarborough, Miller und Jones räumen ein, daß ihr Modell keine angemessene Form der Modeliierung menschlicher Tonart wahrnehmung ist. Hierzu ist anzumerken, daß ihr eigentliches Anliegen die Formalisierung und Ü berprüfung der generativen Musiktheorie ist und sie mit den konnektionistischen Modellen nur experimentieren, um die Leistungsfähigkeit dieser Modelle hinsichtlich ihres Forschungsvorhabens zu untersuchen.1 Es handelt sich also mehr um ein technisches Problem. Auf zwei weitere Probleme ihres Modells machen sie noch aufmerksam: Einerseits ist es formal nicht notwendig, daß in einem linearen Netzwerk I) Die Regel wurde leicht modifiziert nach Scarborough, Miller & Jones 1989, 51. 2) Ihre Argumente gegen einen frühzeitigen Einsatz konnektionistischer Netzwerke in der Modeliierung komplexer Bereiche wie der Musikwahrnehmung habe ich in Kap. 3. 2. 7, S. 332 ff. angesprochen.
362
eine mittlere Schicht existiert (vgl. Rumelhart et al. 1988, 62), anderer seits ist ihr System nicht in der Lage zu erklären, warum transponierte Melodien von Menschen als gestaltgleich wahrgenommen werden. Im Zusammenhang mit dem ersten Problem stellt sich dann bei der Repräsentation die Frage, ob ein Modell, das Einheiten besitzt, die rein rechnerisch nicht benötigt werden, sinnvolle Aussagen über angenommene Repräsentationen erlaubt, oder umgekehrt, ob es sich nicht um Indizien für überflüssige theoretische Annahmen handelt, so z. B., daß für die Bestimmung der Tonalität nicht der Umweg über Akkorde bzw. Akkord funktionen gegangen werden muß. Das zweite Problem verschiebt die "technische" auf eine erkenntnistheo retisch-psychologische Problemstellung: die Frage nach der Relevanz gestalttheoretischer Ansätze für die Erklärung von Wahrnehmungsvorgängen.
363 4.
SCHLUSSBETRACHTUNG UND FORSCHUNGSPERSPEKTIVEN
4.
Rückblick: Zusammenfassung der Arbeitsergebnisse
Es konnte festgehalten werden, daß das Vordringen der lnformations technologien wie in allen anderen Bereichen auch in den mit Musik befaßten Feldern festzustellen ist. Leider fehlt bisher eine klare Abgren zung der Forschungsgebiete, was sowohl die systematische Forschung erschwert als auch in Hinblick auf die Lehre notwendig ist, so daß als erstes eine Einteilung der verschiedenen Forschungszweige vorgeschlagen wurde. Dabei wurde von der sich abzeichnenden Tendenz einer engeren Zusammenarbeit von Technologie, Kunst und Wissenschaft ausgegangen. Für das Gebiet der Musik ließen sich musikalische Informatik, Compu termusik und musiktheoretische Forschung innerhalb des kognitionswis senschaftlichen Forschungsprogrammes - auch als Kognitive Musikwissen schaft bezeichnet - unterscheiden. Das technologische Feld der musikalischen Informatik wurde als Diszi plin der Informatik zugeordnet. Aufgabenfelder, die im Vordergrund ste hen, sind die Entwicklung kompositionsunterstützender Systeme, Mu sikprozessoren, Musikprogrammiersprachen, Schnittstellen etc. Das praktisch-ästhetische Gebiet der Computermusik wurde den Mu sikhochschulen zugeordnet. Eine Unterteilung dieses Feldes in drei große Bereiche wurde vorgenommen: a) der Computer als Musikinstrument, d. h. als Klangerzeuger b) der Computer als Hilfsmittel bei der Komposition, wobei zwei Anwendungsfelder unterschieden werden konnten: das der automati schen Komposition und die Anwendung der computerunterstützten Komposition (CAC; computer aided composition) c) der Bereich der Vermittlung musikalischer Grundkenntnisse mit tels Computer, der computergestützte Unterricht (computer assisted instruction).
Die Kognitive Musikwissenschaft kann als Realisierung der Idee einer Systematischen Musiktheorie innerhalb des Forschungsparadigmas der Kognitionswissenschaft angesehen werden. Um diese These zu begründen und einsichtig zu machen, mußte zunächst einerseits der Terminus "Sy stematische Musiktheorie" aus musikwissenschaftlicher Sicht beleuchtet und andererseits die methodologisch-philosophischen Annahmen des kog nitionswissenschaftlichen Forschungsprogrammes herausgearbeitet werden. Durch wissenschaftshistorische Betrachtungsweise des Terminus "Syste matische Musiktheorie" konnte gezeigt werden, daß der Musikwissen schaftler Walter Wiora diesen Terminus 1951 prägte und in ihm einen dritten Weg zwischen "dogmatischer" Musiktheorie und Relativismus bzw.
364
Historismus sah. Obwohl er die Idee einer Systematischen Musiktheorie, verstanden als Grundlagenforschung, über 30 Jahre propagierte, kam eine einheitliche Forschungsdiszplin nicht zustande; es blieb bei der program matischen Idee. Unabhängig von Walter Wiora gab es jedoch verschiedene punktuelle Ansätze, die dem Gebiet der Systematischen Musiktheorie zuzuordnen sind und aus der musiktheoretischen und musikpsychologischen Forschung stammen. Verschiedene Arbeiten wurden vorgestellt, wobei exemplarisch die Forschungen Rudolf Willes zu einer extensionalen Standardsprache der Musiktheorie herangezogen wurden. Angesprochen wurde für die Melodieforschung das Konzept der auditory stream segregation, entwik kelt von McAdams und Bregman. Im Feld der empirischen Rhythmusfor schung wurde auf die Arbeiten von Beogtsson und Grabrielsson verwiesen und für die Untersuchung tonaler Strukturen außereuropäischer Musiken auf die von Carol Krumhansl und Roger Shephard entwickelte probe tone-Methode. Es zeigte sich, daß trotz unterschiedlicher punktueller Forschungsan sätze ein Konvergieren von Musiktheorie und Musikpsychologie festzustel len ist, das seinen stärksten Niederschlag einerseits, aus musiktheoreti scher Sicht, in den Forschungen zur generativ tonalen Musiktheorie und andererseits, aus psychologischer Sicht, im Entstehen der Kognitiven Musikpsychologie findet. Zwei Vertreter der generativ tonalen Musiktheorie, der Musiktheoreti ker und Komponist Fred Lerdahl sowie der Musiker und Linguist Ray Jackendoff, stellten musiktheoretische Forschung in den Bereich der Kog nitionswissenschaft und definierten als Ziel die Untersuchung der mentalen Repräsentationen musikalischer Strukturen und deren Verarbeitung. Ebenso wird die auf Otto E. Laske zurückgehende "Kognitive Musikwissenschaft" der Kognitionswissenschaft zugeordnet. Es ist daher möglich, von dem Konvergieren verschiedener Forschungsansätze zur Systematischen Musik theorie innerhalb des kognitionswissenschaftlichen Forschungsprogrammes zu sprechen. Um die Grundideen dieses Programmes einsichtig zu machen und die philosophische Grundposition herauszuarbeiten, wurden verschiede ne für die Kognitionswissenschaft zentrale Konzepte in ideengeschichtli cher Entwicklung und deren Beziehungen vorgestellt. Es wurde einsichtig gemacht, was es heißt, "Kognition sei Errechnung (computation)", d. h. das Wahrnehmen und Erkennen eines Objektes wie z. B. eines Musikwer kes wird als Errechnung betrachtet. In ähnlichen Formulierungen, denen diese Annahme zugrundeliegt, wird davon gesprochen, daß "der Mensch ein informationsverarbeitendes Sy stem" sei; insbesondere wird postuliert, mittels "Computersimulation kog nitive Prozesse und deren mentale Repräsentation" zu erforschen und eine "komputationelle Theorie des menschlichen Geistes" zu entwerfen: dies sei derzeit die einzige präzise Theorie mentaler Phänomene.
365 Insgesamt konnte gezeigt werden, wie es, ausgehend von der Modeliie rung neurophysiologischer Befunde, zur Idee des Physical-Symbol-Sy stems kam, das bis in die 80er Jahre das vorherrschende Paradigma der Kognitionswissenschaft blieb. Hierzu war es nötig, die Interdependenzen einiger in Neurophysiologie, Psychologie, Linguistik, Metamathematik und Informatik für die Kognitionswissenschaft entwickelter Konzepte heraus zuarbeiten. So wurde gezeigt, daß formale Nervennetze mit M.cCulloch-Pitts-Neu ronen die gleiche Leistungsfähigkeit wie logische Netze (sequentielle Schalt werke) haben und sich diese Modelle dem abstrakteren Konzept des "endli chen Automaten mit Ausgabe" als äquivalent erweisen. Der Zustand des endlichen Automaten erwies sich als Repräsentation der Gesamtaktivität der Axone eines formalen Nervennetzes zu einem bestimmten Zeitpunkt t. Das Konzept des endlichen Automaten wurde weiterhin mit dem der Grammatik (Typ-3) und den regulären Ereignissen (Mengen, Sprachen) in Beziehung gesetzt. Es zeigte sich, daß ein endlicher Automat genau die von Typ-3 Grammatiken erzeugten Sprachen akzeptieren kann, welche wiederum durch reguläre Ausdrücke darstellbar sind. Die Best.immung der Konzepte "Algorithmus", "präzise formulierbar" und "effektiv berechenbare Funktion" führten zu den Begriffen der "Tu ringmaschine" und der "partiell-rekursiven Funktionen" als deren Explika te. Es konnte aufgewiesen werden, daß eine Turingmaschine nichts ande res ist als ein um ein potentiell unendliches Band und einen Schreib-Le se-Bewegungs-Mechanismus erweiterter endlicher Automat. Der endliche Automat ist sozusagen das "formale Gehirn" der Turingmaschine. Die Zustände des endlichen Automaten werden bei der int:rospektiven Analyse Turings als "Geisteszustände" interpretiert. Die Nähe der partiell-rekursiven Funktionen zu der Programmierspra che LISP, die bei der Modeliierung kognitiver Phänomene benutzt wird, wurde herausgearbeitet. Es erwies sich weiterhin, daß alles, was von einem Computer berechnet werden kann, auch von einer Turing-Maschine berechenbar ist und somit auch von einem endlichen Automaten mit potentiell unendlichem Band. Es handelt sich um die Klasse der partiell rekursiven Funktionen. Somit ist deutlich, daß auch das Gehirn, unter Annahme gewisser Idealisierungen, in der Lage ist, diese Klasse von Funktionen zu be rechnen. Dieses Argument war primär in den 40er Jahren von Bedeu tung, da besonders von idealistischer Seite gegen die materialistische Position eingewandt wurde, das Gehirn sei nicht in der Lage, komplexe Funktionen zu berechnen, mithin sei eine Korrelation geistiger Fähigkei ten mit der Funktionsweis� eines Rechenautomaten u.nvereinbar und die Reduktion der "Geistestätigkeit" auf die neurologische des Gehirns, wie sie von materialistischer Seite vertreten wurde, unzulässig. Da sich die Turingmaschine ebenfalls als Explikat des Mechanischen
366
anbot, konnte weiterhin gezeigt werden, daß die kognitionswissenschaftli che Forschung, der eine neomechanistische Tendenz unterliegt, induktiv den Neomechanismus stützt. Im Neomechanismus wird angenommen, daß alles menschliche Denken Errechnung (camputatian) ist. Die Rede von der abstrakten Maschine dürfte in diesem Sinn die ultimative Metapher für den philosophischen Mechanismus sein. Die philosophische Tradition erkenntnistheoretischer Fragestellungen wird in der Kognitionswissenschaft empirisch bearbeitet, so daß auch von philosophischer Seite von � perimenteller Epistemologie1 oder naturalisierter Erkenntnistheorie2 ge sprochen wird. Diese Forschungen sind ontologisch (d. h. psychophysisch) neutral: die angenommenen strukturellen Einheiten und auf ihnen operie rende Algorithmen können einerseits als abstrakte Modeliierungen empi risch gefundener Sachverhalte verstanden und andererseits die empiri schen Sachverhalte platonisch als Realisierung abstrakter Strukturen und Funktionen interpretiert werden. Es zeigte sich weiter, daß die Church-Turing-These : "(CT) Jede im intuitiven Sinne berechenbare Funktion ist Turing-berechenbar<<, und die These von Babbage ··� Alles, was sich präzise beschreiben läßt. ist im Prinzip programmierbar<<, zwei weitere Stützen des Neomechanismus sind. Kognitionswissenschaft arbeitet im Rahmen der Grenzen der Mathe matisierbarkeit bei der Erforschung mentaler Phänomene, solange sich die Church-Turing-These nicht als falsch erweist. Es ist noch anzumerken, daß die These (C) den Aspekt der genauen Beschreibbarkeil in den Vor dergrund stellt, also nicht ausgeschlossen wird, daß das Gehirn nichtbere chenbare Funktionen "errechnen" könnte; nur sind diese, nach den Forde rungen der Wissenschaftlichkeit in der Kognitionswissenschaft, nicht sinnvoll diskutier- und kommunizierbar; sie werden es, solange die These (C) gilt, auch in Zukunft nicht sein. Bei dem Biophysiker und Philoloso phen Henry Atlan (1972, 131) findet sich dieser für die Kognitionswissen schaft zentrale Punkt kompakt formuliert: Warren Sturgis McCulloch et Walter Pitts 1943/1965 ant mantre que taute activite, qu elle sait intra'
1) Die Aufgaben und Ziele der experimentellen Epistemologie wurden von Warren Sturgis McCulloch 1964/1965 formuliert. Cowan und Sharp (1988, 116) bestimmen die experimentelle Epistemologie prägnant als the study of how knowledge is embodied in brains and may be embodied in machines. 2) Für die naturalisierte Epistemologie ist nach Quine (1969/1984, 124) kennzeichnend, daß die Erkenntnistheorie mit der Psychologie und mit der Linguistik verschmilzt. Den Ort der Erkenntnistheorie sieht Quine (1969/1984, 115) nicht mehr in der Philosophie, sondern in der Psychologie: Die Erkenntnistheo1·ie oder etwas Ähnliches erhält ihren Platz innerhalb der Psychologie und somit innerhalb der empirischen Wissenschaften. Sie studiert ein empirisches Phänomen, nämlich ein physisches Subjekt. Die Beziehung der naturalisierten Erkenntnistheorie zu den in dieser Arbeit vorgestell· ten Forschungen der Linguistik, Neurophysiologie, Psychologie, Informatik und Logik arbeitet Schnelle 1988a heraus.
367 spective, camportementale ou physiologique, qui pourrait etre decrite sans ambiguite par un nombre fini de mots, pourrait etre realisee par un reseau.
Da es sich bei den bisherigen Betrachtungen um prinzipielle Erörte rungen grundlegender Konzepte der Kognitionswissenschaft handelte, galt es im nächsten Schritt zu zeigen, daß sich unter den musiktheoretischen und musikpsychologischen Forschungen ebenfalls Untersuchungen finden, die schon innerhalb des kognitionswissenschaftlichen Rahmens arbeiten. Hierfür wurden verschiedene neuere Arbeiten dargestellt und diskutiert. War das Bild der Forschungen in den 70er Jahren durch die Idee einer "Grammatik" als Repräsentation musikalischer Strukturen geprägt, zeigte sich in den 80er Jahren eine Hinwendung zum verstärkten Einsatz der Methoden der KI1 und eine Abkehr von dem Konzept der Grammatik? Als Klassiker dieses kognitionswissenschaftlichen Forschungsprogrammes innerhalb der Musiktheorie können die Arbeiten von Reitman, Winograd, Greussay und Longuet-Higgins zusammen mit Steedman gelten. Kogniti onswissenschaftliche Musikforschungen setzten sich mit den unterschied lichsten musikalischen Phänomenen auseinander: Jazz, indischer tabla Musik, "klassischer" und auch zeitgenössischer Musik. Besonders hervor gehoben seien hier noch einmal die Forschungen von Berhard Bel und Jim Kippen zur nordindischen tabla-Musik und die Entwicklungen von Antonio Camurri zur Beschreibung musikalischer Prozesse sowie die Simulationen zur generativen Musiktheorie von Jacqueline Jenes, Miller und Scarborough, sodann Stephen Smoliars Überprüfung einiger Konzepte der Schenkersehen Musiktheorie, dessen Ansatz auch von der Forschergruppe um Lelio Camilleri3 aufgegriffen wurde. Bei Erörterung der Arbeiten wurden auch die Diskussionen gestreift, die in der Kognitionswissenschaft schon statt fanden und ebenfalls in die Kognitive Musikwissenschaft ausstrahlen. Es handelt sich um die Auseinandersetzungen zwischen dem klassischen Physical-Symbol-System Paradigma und dem neueren Konnektionismus, die zur Zeit noch geführt werden. Außerdem wurden die Debatten um propo sitional-piktorale und deklarativ-prozedurale Darstellungsformen an.gespro chen. In einer Skizze lassen sich die verschiedenen Diskussionen kogniti onswissenschaftlicher Forschungen festhalten:
1) Diese Tendenzen finden u. a. ihren Ausdruck in den Artikeln von Antonio Camurri 1990 und Curtis Roads 1985. 2) Zu den "Grammatiken" vgl. auch Baroni 1983; Baroni & Callegari 1984 u. Seifert 1986, 97 ff., Hughes 1991, Sundberg & Linblom 1991. 3) vgl. Camilleri 1986, 1989, 1990 und insbesondere Camilleri et al. 1987.
368
· . ········· *"-...................... ...... -···.. ..... . ···
Proz•d���� -D•kl•r•�lv Deba��·
�
Propost�t n•l-Pic�ortal D•b•,�•
4.2 Gliederung der Kognitiven Musikwissenschaft und Ausblick auf
weitere Forschungen
Aus den philosophisch-erkenntnistheoretischen Betrachtungen sowie den Tendenzen der bisherigen angewandten Forschungen ergibt sich, daß Systematische Musiktheorie, so wie Waller Wiora sie verstanden wissen wollte, d. h. als Grundlagenforschung und wissenschaftlichen dritten Weg zwischen Dogmatismus und Relativismus, realistische Aussichten hat, innerhalb des kognitionswissenschaftlichen Forschungsprogrammes verwirk licht zu werden. Als Terminus für diese Forschungen bietet sich Kog nitive Musikwissenschaft an. Da ein im wesentlichen einheitliches For schungsprogramm besteht, das theoretische, psychologische und physio logische Forschungen zusammenbringt, kann im weiteren Verlauf das Feld der Kognitiven Musikwissenschaft unterteilt werden in: a) Theoretische Musikologie1 b) Psychomusikologie c) Neuromusikologie Der Zusammenhalt dieser Bereiche wird gewährleistet durch die Forde rung nach Theorienbildung im Rahmen des Berechenbaren und der Com putermodellierung. Es zeigt sich allerdings eine unterschiedliche Gewich tung der Forschungsinteressen: 1) D ie Theoretische bzw. Strukturelle Musikologie bildet den musikwissenschaftliehen Kern der durch die Kognitive Musikologie zu realisierenden und von Waller Wiora er träumten Systematischen Musiktheorie.
369
Die Theoretische Musikologie wird als der Bereich verstanden, in dem Intuitionen zur komputationellen Darstellung gelangen und theoretische Restriktionen diskutiert werden. Sie entspricht der Ebene der Kompetenz bei Chomsky bzw. der komputationellen Ebene David Marrs. Dies ist die eigentliche Domäne der musiktheoretischen Forschung. Musikalische Da ten, als Objektivationen mentaler Vorgänge aufgefaßt, werden untersucht und die ihnen unterliegende Strukturen erforscht. Das Ausgangsmaterial bilden sowohl bisherige musiktheoretische Werke1 (das Denken über Mu sik wird als abstrakter Klassifizierungsvorgang perzeptueller Ereignisse verstanden, der wiederum Einfluß auf den Perzeptionsvorgang nehmen kann) als auch die direkte Wahrnehmung musikalischer Ereignisse. In der Systematischen Musiktheorie stehen die Modeliierung und formale Be schreibung musikalischer Sachverhalte im Vordergrund, in der psychologi sche Momente allerdings Berücksichtigung finden. Dies.e formalen Modelle werden in den mehr psychologisch orientierten Forschungen als Hypothe sen über mentale Reräsentationen musikalischer Strukturen und deren Verarbeitung betrachtet und mittels Computermodeliierung sowie weiter gehender empirischer Untersuchungen auf ihre psychologische Stichhaltig keit überprüft. Die Psychomusikologie2 bildet die Stufe der Implementierung von Algo rithmen. Die lauffähigen Programme dienen der experimentellen Überprü fung des Algorithmus sowie seiner Verbesserung. Die Annahmen dieser Ebene, die eine Beziehung zu psychologisch-theoretischen Sachverhalten aufweisen, sind weiterhin mit experimentalpsychologischen Untersuchungen zu kon f�ontieren. Die "statische" Musiktheorie erhält ihren prozessualen Charakter. Der Begriff Psychomusikologie wurde in bewußter Abgrenzung zur Kognitiven Musikpsychologie gewählt, da sich in dieser die Tendenz abzeichnet, keine Implementierungen vorzunehmen, sondern nur die "Al gorithmen" anzudeuten, ohne die elementarsten Einheiten zu spezifi zieren. Psychomusikologie wird im Sinne einer Synthetischen Psychologie verstanden, die von der Einsicht ausgeht, daß es einfacher ist, ein Modell zu erstellen als eine Analyse durchzuführen. Die beiden Forschungsfelder Systematische Musiktheorie und Psycho musikologie stehen in Wechselwirkung miteinander und fallen mehr oder weniger direkt in den Forschungsbereich des Musikwissenschaftlers, wobei
1) Mit musiktheoretischen Werken sind z. B. die Arbeiten von Zarlino, Mersenne, Schenker, Riemann, Vogel, etc. als auch Werkanalysen gemeint. 2) In der Musikforschung dürfte dieser Begriff auf Otto E. Laske 1975 zurückgehen (vgl. auch Seifert 1986, 156 ff.). Allerdings muß angemerkt werden, daß gerade in der amerikanischen Linguistik sich besonders in Zusammenhang
mit
der
generativen
Transformationsgrammatik schon sehr früh neben der Theoretischen Linguistik die Forschungszweige Psycholinguistik und Neurolinguistik ausbildeten.
370
eine Kooperation mit Psychologen nicht ausgeschlossen, vielmehr wün schenswert ist.l Anders dagegen ist es in der Neuromusikologie? Dieser dritte For schungsbereich fällt, obwohl ebenfalls notwendig, nur noch indirekt in den Arbeitsbereich des Musikwissenschaftlers. Unter Neuromusikologie sub summiere ich die traditionelle Forschung zur Tonpsychologie (bzw. Hör bzw. Gehörpsychologie), die medizinischen Fallstudien und psycho akustiscben Forschungen. Ihr wesentlicher Forschungsbereich kann als der der Vorverarbeitung akustischer Stimuli, der subsymbolischen Verarbei tung, bezeichnet werden. Gemeint sind Untersuchungen an der sensori schen Peripherie sowie die Erforschung der Funktion einzelner Neuro nenverbände oder Neuronen für den Hörvorgang. Es sind daher sensori sche und neuronale Modellierung zu unterscheiden. Die Lokalisation bzw. Struktur wird auch durch Material von Krankheitsbildern ergänzt. We sentlich für die Zusammenarbeit der auf dieser Ebene arbeitenden Neu rophysiologen und Psychologen sowie Mediziner ist letztendlich die Er kenntnis, daß nicht die strukturellen Erkenntnisse im Vordergrund ste hen, sondern die funktionalen, eine Sichtweise, die sich erst neuerdings durchzusetzen beginnt? Eine weitere Annahme, die alle Ebenen verbindet und die Erarbeitung eines gemeinsamen begrifflichen Forschungsrahmens ermöglicht, ist die der algorithmischen Verarbeitung sowohl auf mentaler als auch neuronaler Ebene. Der Ort, an dem sich Psychologie und Neu rologie treffen, wurde nach Wofgang Metzger als psychophysisches Nive au bezeichnet. 4. 2. 1 Zur weiteren Forschungsstrategie der Kognitiven Musikwissenschaft Bevor auf die genauere Strategie für die kognitionswissenschaftliche Musikforschung eingegangen wird, noch ein paar allgemeine Anmerkun gen über das Verhältnis zur traditionellen Musiktheorie einerseits und zur Praxis, d. h. der Lehre andererseits. Beide Problemfelder werden bei Bezug auf die Linguistik deutlicher. Chomsky übernahm im wesentlichen die klassischen Einteilungen der traditionellen Grammatik und entwickelte sein System. Trotzdem würde nie jemand auf die Idee kommen, seine Grammatik für das Erlernen der Syntax einer Sprache einzusetzen. Sie dient wissenschaftlichem Erkennt nisinteresse. Genauso absurd wäre es, von einer Musiktheorie, die sich über perzeptuell bedingte Strukturen von Musik Klarheit verschaffen will, zu fordern, man müsse nach ihren Erkenntnissen komponieren oder lehren
1) s. die Zeitschrift "Psychomusicology". 2) Diese Bezeichnung der medizinisch-neuropsychologischen Musikforschung geht auf Botez, Botez & Aube 1983 zurück . Nils Wallin 1991 spricht von Biomusicology. 3) vgl. Marin 1989 sowie Sundberg. Nord & Carlson 1991 zu neueren Forschungen.
371
können, denn es geht ja gerade erst darum, zu erforschen, welche Me chanismen an der Strukturierung von Wahrnehmungsprozessen und der Konzeptbildung beteiligt sind, die sich zum Teil in der beschriebenen Musikstruktur niederschlagen. Komponieren ist nur durch intensive Auseinandersetzung mit musikali schem Material und nicht durch schulmäßige Regeln möglich, es ist geprägt durch Kultur- und Zeitbezug des Komponisten, denn nur durch die Auseinandersetzung mit dem MateriaP und eventuelle begriffliche Schulung adaptiert das Wahrnehmungsystem des Komponisten die physi kalischen Stimuli und bildet die Klassifizierungen des Stimulusmaterial, aus, welche sein kompositorisches Schaffen prägen. Diese Klassifizierun gen versucht der Musiktheoretiker in der Untersuchung der Kompositio nen zu erschließen. Das eigentliche Ziel der Kognitven Musikforschung aber ist die Er gründung der kognitiven Klassifizierungmechanismen, die akustische Sti muli im Wege der »Apperzeption<<2 erst mental organisiert, ordnet und zu "Bedeutungen" führt; denn es interessiert die perzeptuelle Strukturierung durch den "naiven" Hörer, der, obwohl er sich nicht mit der Musik auseinandersetzt, ebenfalls einen Allgemeinbegriff "Musik" ausbildet und z. B. Musik von Sprache unterscheidet. Daher wird auch in der kognitiven Musikfersehunt zwischen einer listening grammar und einer compositional grammar unterschieden und als Ziel kognitiver Musiforschung die listening grammar bestimmt, die eine Beschreibung dessen darstellt, auf welche Art und Weise ein Hörer be stimmte auditive Stimuli perzipiert; wohingegen eine compositional grammar eine Art Kochbuch ist und dem Hörer vorschreibt, wie er, unabhängig von seinem Wahrnehmungs- und Vorstellungsvermögen, zu hören hätte. Wie ist die Erstellung einer listening grammar zu erreichen? Die bisherigen Forschungen, in Traktaten über Musik dargelegt, sind in Com puterprogramme umzusetzen, zum einen, um die bisher von der KI ange botenen Verfahren, wie z. B. Produktionssysteme, semantische Netze, ATN, frames, conceptual dependency etc. auf ihre Brauchbarkeit inner halb der Musikforschung zu überprüfen, zum anderen, um Voraussetzun gen und Klarheit bisheriger musiktheoretischer Konzeptionen zu überprü fen. Hiermit wird der Forderung von Rudolf Wille und Wilfried Neumaier nach einer Standardsprache der Musiktheorie für die begriffliche Analyse entgegen gekommen, aber darüber hinaus auch eine prozessuale Kompo nente, die m. E. gerade für musikalische Strukturen unerläßlich ist, durch 1) "Material" bezeichnet in diesem Zusammenhang einfach akustische Stimuli, denen ein Mensch ausgesetzt ist. Daß diese Stimuli eine sozio-kulturelle und geschichtliche Prägung aufweisen, steht außer Frage. Dies bedeutet jedoch nicht, daß hieraus eine "Tendenz des Materials" abzuleiten ist. 2) vgl. Brentano 1874; Stumpf 1883, 1890, 1907a und 1907b. 3) Hierzu s. Lerdahl 1988 u. Laske 1990.
372
die Modellierung einbezogen. Trotz dieser verschiedenen Techniken, deren Übernahme in den Bereich der Systematischen Musiktheorie und Psychomusikologie fiel, muß ange merkt werden, daß es sich um importierte Methoden handelt, die frucht bar sein können, es aber nicht automatisch sein müssen. Es ist bedauer lich, daß sich ein größerer Teil der besprochenen Arbeiten kaum mit bisherigen musiktheoretischen Konzepten auseinandersetzt und die Frage der Leistungsfähigkeit nicht im Vergleich zu klären sucht. Es bleibt allerdings die Frage, ob es nicht sinnvoller wäre, vollkommen mit der Tradition zu brechen; wiederholt wurde Riemanns Theorie, die versucht hat, Musik in das Prokrustesbrett der Kadenz innerhalb der harmonischen Tonalität zu zwängen, als zu eingeschränkt kritisiert. Je doch sollten durchaus auch die älteren Theorien v. Oettingens, Riemanns etc. innerhalb dieses neuen Forschungsprogrammes intensiver erforscht werden. Es ergibt sich also für die Systematische Musiktheorie innerhalb der Kognitiven Musikwissenschaft die Forderung, bisherige traditionelle Musiktheorien hinsichtlich ihrer Algorithmizität und psychologischen Relevanz zu überprüfen. In einem ersten Schritt kann mit den in der KI entwickelten Formalismen, wie Produktionssystemen, semantischen Netzen, ATNs, frames, constraints etc., experimentiert werden. Hierbei werden sich sowohl für einige Konzepte der Musiktheorien als auch KI-Formalis men Begrenzungen herauskristallisieren, die sowohl zu einer Veränderung der Formalismen als auch musiktheoretischer Konzepte führen dürften. Ein weiterer Schritt wird sein, sich theoretisch Klarheit über die Äqui valenz formaler Strukturen zu verschaffen und eine Interpretationsfunkti on für syntaktische Strukturen anzugeben, die musiktheoretisch-musika lisch motiviert ist. Dies dürfte neben der Entwicklung von Algorithmen und der Ausarbeitung der musikalischen Intuitionen die zentrale Aufgabe des Systematischen Musiktheoretikers sein. Bei den Modeliierungen wird sich dann die Frage stellen, ob die "Logik der Theorien" oder die "Logik der Perzeption" betrachtet wurde. Zwi schen diesen Bereichen ist nicht klar zu trennen, denn der Status der wissenschaftlichen Konzepte, die bei der Erörterung von Musiktheorien benutzt werden, ist bis heute nicht klar - handelt es sich um Beobach tungsaussagen oder theoretische Konstrukte, die die Logik der Beobach tungsaussagen klären? Höre ich Töne, Intervalle oder Funktionen oder höre ich Töne, erschließe dann erst die Funktionen etc.? Man denke an den "gebildeten" Hörer und den Laien. Gibt es einen speziell zu bevor zugenden musiktheoretischen Ansatz? In der Forschungspraxis wurden bislang verschiedene Systeme auch zu neueren Entwürfen genutzt; so knüpfte z.B. Christoph Lischka an Riemanns Theorie, Stephen Smoliar an Schenkers Theorie und Mark Steedman an Jerry Cokers Jazztheorie an. Sowohl Erkenntnisse zur Funktionstheorie als auch der Stufentheorie sowie andere, z. B. außereuropäische Beschreibungen von Musik, sind zu
373
untersuchen. Die aussichtsreichste Theorie scheint miT derzeit allerdings die von Lerdahl und Jackendoff zu sein, denn obwohl sie an Schenker anknüpfen und das Tonalitätskonzept für die Zurückflihrung auf funktio nale Abhängigkeiten eine untergeordnete Rolle spielt, bieten sich mit dieser Theorie die besten Voraussetzungen! um komplexe Musik inner halb des kognitionswissenschaftlichen Forschungsprogrammes zu untersuchen. Handelte es sich in dieser Arbeit im wesentlichen um Untersuchungen zu schon ausgebildeten Konzepten von Musik, so stellt sich natürlich die Frage nach dem Erlangen musikalischer Fähigkeiten und dem Erlernen musikrelevanter Konzepte? Dies ist in der Hinsicht von Bedeutung, als ja auch der musikalische Laie Musik wahrnimmt, es aber nicht klar ist, ob eine prinzipiell ähnliche Segmentierung wie bei dem "gebildeten" Hörer erfolgt. Die Arbeiten von James Kippen und Bernard Bel (1989, 1990; Bel 199la) beschäftigen sich derzeit schon mit dem Problem. Dabei spielt das Induktionsproblem eine wichtige Rolle. Es handelt sich hi�rbei auch um eine für die Kognitions!} Als ein Mangel dieser Theorie ist allerdings die Vernachlässigung der Harmonik anzusehen (Lerdahl 1991 widmet sich neuerdings diesem Problem). Dieser Mangel wurde ebenfalls bei Computersimulationen erkannt ( vgl. Jones, Miller & Scarborough 1988). Obwohl diese Theorie als Theorie hierarchischer Ereignisse entwickelt wurde, sollte - wenn auch unzureichend - hierarchischen Tonalitätsstrukturen durch Stabili tätsbedingungen Rechnung getragen werden. Der Unterschied zwischen Ereignishierar· chien und tonalen Hierarchien wird von Bharucha (1984, 421; vgl. auch die Diskussion zwischen Bharucha 1984, Deutsch 1984 u. Dowling 1984) wie folgt definiert: An � hierarchv is an organization of the string of musical events that constitutes a piece of music. A tonal hierarchy is an organization of classes of musical events, the most stable of which constitute a tonal schema. Allerdings könnte die zeitweilige Vernach lässigung der m. E. bisher überbetonten harmonischen Forschung sich fruchtbar auswir ken, denn so wird hierbei häufig die Herausbildung von Ereignishierarchien (Segmen· tierungen) vernachlässigt, die in enger Beziehung zu rhythmisch-metrischen P�änomenen zu betrachten ist. Gerade die Interaktion der verschiedenen Strukturen und Mechanis· men wie grouping structure, metricaJ structure, time span reduction und prolongational reduction fand in der Theorie von Lerdahl und Jackendoff besondere Berücksichtigung. Darüber hinaus wurde ihre Theorie unter Einbeziehung relevanter musikpsychologischer Forschungsergebnisse entwickelt, was bei den meisten "Harmoniken" nicht der Fall war. Ihre Formulierung in Form eines Regelsystems mit psychologischen Implikationen machte sie zu einem bevorzugten Ausgangspunkt von Computersimulationen (e. g. Baker 1989a, Baker 1989b, Scarborough, Jones & Miller 1989: Miller, Scarborough & Jones 1989; Jones, Scarborough & Miller 1990). Allerdings muß eine Musiktheorie, welche den Perzeptionsprozess berücksichtigt, einen prozessualen Charakter aufweisen (vgl. Clarke 1986, 16). Dieser Anspruch kann m. E. aber nur im Rahmen der Kognitiven Musikwis senschaft erfüllt werden, da sie Computersimulationen durchführt. Jedoch besteht derzeit leider eine Tendenz bei den Simulationen zur generativen Mu siktheorie, sich auf die grouping structure und metrical structure zu beschränken und die Interaktion mit den anderen Systemen zu vernachlässigen. 2) hierzu in den letzten Jahren vermehrt Beiträge in: Music Perception, Psychology of Music, British Journal of Music Education, etc.
374 forschung zentrale Frage. Aufgrund der bisherigen Untersuchungen zeichnen sich folgende Berei che als wesentliche Schwerpunkte der weiteren kognitiven Musikfor schung ab: - die formale Beschreibung zeitlich interagierender Prozesse, Abläufe und Ereignisse dürfte eines der zentralen Probleme innerhalb ei ner Systematischen Musiktheorie sein; - das Problem der Segmentierung, das in enger Beziehung zum Indukti onsprozess (z. B. des kategorialen Lernens) steht, in dem die Frage nach den Prinzipien und Mechanismen, die die Herausbildung elementarer musikali scher Einheiten bedingen, erforscht werden; - die Idee des Parallelismus, in der die musikalischen Systeme Rhythmik, Harmonik, Melodik interagie ren. Ob die Behandlung des Parallelismus allein im Rahmen des Konnek tionismus einer Lösung zugeführt werden kann, bleibt zu bezweifeln. So gibt es in der Informatik seit Beginn der achtziger Jahre verschiedene Vorschläge, sich der Idee des Parallelismus mit Non-Von-Neumann-Architek turen 1 zu nähern. Eher dürfte die Popularität des Konnektionismus 2 zum Teil aus dem allgemeinen Interesse an parallelen Architekturen entstanden sein. - Die Verbindung objektorientierten Programmierens mit der Idee der constraints dürfte ein weiterer Bereich sein, der verstärkt untersucht werden wird. - Eine Verbindung von objektorientierter Programmierung und parallelen distribuierten Systemen deutet sich in der Distribuierten Künstlichen Intelligenz (DAI) an. In der sicherlich die blackboard-Architektur, Pro duktionsregeln und die genetischen Algorithmen eine zentrale Rolle ein nehmen werden. Mit der Theorie der port automata innerhalb der Auto matentheorie gibt es gerade ftir die blackboard-Architektur eine - Ideen der actor semantic ausarbeitende - formale mathematisch handhabbare Semantik. Kognitive Modeliierungen mit diesen Konzepten der DA! dürf ten weitere Aufschlüsse über den perzeptiven Prozessen unterliegenden Mechanismen ergeben und gleichzeitig eine Beziehung zur neuronalen Architektur und den neuronalen Prozessen - insbesondere über das neu rologische Modulkonzept - ermöglichen. Auch die von Helmut Schnelle (1988b) entwickelte Netzlinguistik könnte einen aussichtsreichen Forschungs rahmen bilden, um die Prozessualität musikalischer Strukturen zu untersuchen. 1) Arthur W. Burks 1986 gibt eine nähere Bestimmung des Konzeptes "Non-Von-Neu mann-Architektur". Man vgl. auch Greussay 1988. 2) Sowohl das Physicai-Symbol-System-Paradigma wie auch der Konnektionismus ent standen in den 50er Jahren (vgl. Newell & Shaw & Sirnon 1958; Rosenblatt 1958; Newell & Sirnon 1963 besprechen noch beide Forschungsrichtungen). Es handelt sich bei dem Konnek· tionismus folglich nicht um ein, wie häufig dargestellt, neues Paradigma kognitionswissen schaftlicher Forschungen. Skeptiker mögen in der Abwendung der kognitionswissen schaftlichen Forschung vom Physicai-Symboi-System·Paradigma und der Hinwendung zu dem "neuen" Paradigma erste Anzeichen für ein Scheitern des kognitionswissen schaftlichen Forschungsprogrammes sehen, jedoch bleibt abzuwarten, inwieweit die ge rade erst begonnenen Forschungen der Kognitionswissenschaft zu Erfolgen führen werden.
375 4 . 2. 2
Zur Neuromusikelegie
Im Bereich der neurophysiologischen Forschung wird neuerdings von synthetischer Modellierung höherer Hirntätigkeit gesprochen und auch in bezug auf die Musikforschung die Notwendigkeit einer dynamischen Mo dellierung gesehen, die von einfachen Lokalisierungsvorstellungen Abstand nimmt (Marin 1989). Schon Carl Stumpf machte darauf aufmerksam, daß, sobald nicht die Erscheinungen (z. B. Empfindungen, Vorstellungen etc.) den Forschungsgegenstand der Psychologie bilden, sondern die Funktionen (Akte, Erlebnisse, Zustände) wie das Vorstellen, das Hören etc., die Lokalisierung der Funktionen im Gegensatz zu Lokalisierungen der Er scheinungen steht. Seine Ausführungen muten sehr modern an. Stumpf (1907, 39) schreibt: So macht es natürlich für die Frage nach der Loka lisation der psychischen Funktionen im Gehirn einen großen Unter schied, ob man das Psychische restlos in Erscheinungen und ihren Verknüpfungen aufgehen läßt, oder ob die Funktionen mit alt ihren "Gebilden" dds eigentliche Wesen des Psychischen ausmachen. Für die Anhänger der Funktionstheorie entsteht hier die Frage, ob nicht die Funktionen in ganz anderem Sinne lokalisiert sind wie die Erscheinun gen, und ob nicht alles, was bisher über spezielle Lokalisationsherde im Gehirn nachgewiesen ist, auf Lokalisation der Erscheinungen und ihrer Assoziationen hinausläuft.
Man denke hier speziell an die Lokalisation der verschiedenen Tonhö hen im auditarischen Cortex (vgl. Braitenberg 1986, 128 u. 129) als Beispiel für die Lokalisation von Erscheinungen und vergleiche im Ge gensatz hierzu die Äußerungen Arbibs und Lavorels,1 welche die Reprä sentation für eine musikalische Phrase - und nicht vereinzelten Tonemp findungen - (die sowohl als Struktur und auch als Prozess aufzu fassen ist), auf das parietale Gebiet erweitern und die Untersuchung funktionaler Aspekte betonen: We argued ·above, that the parietal area plays a great part in the construction of mental representations of ab stract (often structurally ordered) concepts like the grammatical organi zation of a sentence, or of a picture or of a musical phrase.
Auf dieser Ebene der neurologischen musikalischen Informationsverar beitung ist jedoch bislang so gut wie gar nichts bekannt. 4. 2. 3
Kognitive Musikwissenschaft als rein syntaktischer Ansatz
Die Forschungen der Kognitiven Musikwissenschaft bewegen sich derzeit fast ausschließlich auf der syntaktischen Ebene,2 diese ist somit 1) s. Lavorel & Arbib 1981, 11. 2) Interessante Forschungen an der Schnittstelle von Syntax und Semantik wurden von Peter Faltin durchgeführt. Er beschäftigte sich mit der Fragestellung inwieweit syn·
376 abzutrennen von der musikwissenschaftliehen Semantik und der musikäs thetischen Forschung, die beide soziokulturelle Phänomene zu berück sichtigen haben. Im Bereich der Ästhetik, der Soziologie und der Semantik handelt es sich um den Bereich der Werte. Auch dürfte es sich, mit den bisherigen Mitteln der Kognitionswissenschaft, deren Stärke eindeutig auf der syn taktischen Ebene anzusiedeln ist, als schwierig erweisen, individuelle Assoziationen und Ge.fühle zu erfassen, die beim Hören von Musik eben falls eine wesentliche Rolle spielen. So schreiben Michael A. Arbib und Mary Hesse (1986, 40): Again, one can certainly code music in terms of the notes of the score, and a computer programmed with a suitable semantic net could retrieve the name of the song or anything else that might appear in a musical en cyclopedia. But then we Iisten to that music, it may evoke many memo ries that have little to do with the sequence of notes. It may be that the sound of one particular instrument evokes a performance by a gifted player of a completely different work, leading us to remember our life in a distant town of many years ago. Or, it might be that the rhythm evokes a certain memory of moving on the dance floor with someone we have not thought of for a long time. Even though each of these diffe rent aspects could be coded into a semantic network, it is implausible to expect a semantic network to be constructed containing all the knowled ge of any one person rather then a sampling of the type of knowledge that such a person might have. Yet, we cannot divorce the subtlety of the human condition from this richness not only of associations that can be coded at the symbolic level, but also of recollection tying back to our experiences in the real world.
Trotz dieser · Gren:zen dürfte allerdings Kognitive Musikwissenschaft, beschränkt auf die von mir dargestellten Felder, sicherlich einen Kern zeitgenössischer musikwissenschaftlicher Forschung bilden. Es wurde von mir ein aussichtsreich erscheinender möglicher Weg ei ner "Wissenschaft d·es musikalischen Geistes" gezeigt, ohne daß sich "geisteswissenschaftliches Denken" positivistisch-empiristisch zu verneinen hat oder sich positivistisch-historisch an einem Bildungs- und Wissen schaftsideal des beginnenden 19. Jh.s orientiert und sich vor den wissen schaftlich-technologischen Veränderungen buchstäblich in den "Elfenbein turm" zurückzieht. Ich möchte zum Abschluß noch einmal Walter Wiora zu Wort kommen
taktisch-strukturelle Phänomene zu einem "ästhetischen Gehalt" führen. Zu dem Syn taxkonzept vgl. Faltin 1977; 1979, S. 1-12 u. 143 ff.; 1985, 111 ff. und 1990. Es muß allerdings angemerkt werden, daß die kognitionswissenschaftliche Musikforschung in diesem Sektor bisher keine Ergebnisse aufzuweisen hat. Ob sich eine Extension dieser Forschungen auf semantisch-ästhetische Problemfelder durchführen läßt bleibt abzu warten, erscheint aber zum derzeitigen Zeitpunkt zweifelhaft.
377 lassen, dessen Vorstellung von Systematischer Musiktheorie als Komposi tionslehre sicherlich nicht mit dem von mir aufgezeigten möglichen For schungsprogramm einer Systematischen Musiktheorie als Kognitiver Musi kologie, eingeschränkt auf das Konzept einer listening grammar sowie die Untersuchung des Allgemeinbegriffes "Musik" und seiner Genese, überein stimmt. Es ist höchst wahrscheinlich, daß Walter Wiora, wäre ihm der Zweig der wissenschaftlichen Entwicklung bekannt, die in den 30er Jahren begann und zur Kognitionswissenschaft führte, dennoch ein eigenes Kon zept vorgestellt hätte; ein allgemeines Programm musiktheoretischer Forschung, die ihre Arbeit, in der Tradition von Hermann von Helmholtz, Hugo Riemann, Carl Stumpf und Erich von Hornborstel und der gestalt psychologischen Schule - Kurt Koffka, Max Wertheimer, Wolfgang Köhler und Wolfgang Metzger - stehend, mit den an die allgemeine wissen schaftliche Entwicklung im wesentlichen angepaßten Mitteln zu betreiben hätte. So schrieb Walter Wiora (1951, 175) zum Abschluß seiner Rezension von Jacques Handschins Buch Der Toncharakter, in der er den Begriff der "Systematischen Musiktheorie" prägte: Die Lage der Geisteswissenschaf ten nach dem zweiten Weltkrieg ist schwieriger und ihr Schwung ist ge ringer als damals {nach dem ersten Weltkrieg; U. S.). Dennoch scheinen die .Wege in die Zukunft zu führen, die aussichtsreicher sind als jene. Die Entwicklung einer systematischen Musiktheorie ist ein solcher Weg. Und 1948 schrieb Walter Wiora (1948, 191): Die Wurzeln des Geistes zu erforschen, ist den Geisteswissenschaften aufgegeben, wie jenes andere Ziel: den Berg zu erklimmen, von dem sich ein geschichtliches Panorama darbietet wie keinem früheren Zeitalter. Ein großes Erbe und ein mächtiger Strom: der Aufstieg der Geisteswissenschaften wollen durch uns in die Zukunft hinein weitergeführt werden. Doch auch hier stehen wir am Kreuzwege des Werdens und Vergehens. Es ist noch ungewiß, ob unsere und die kommenden Generationen ihrer Aufgabe gewachsen sind. So steht es dahin, inwieweit die Musikwissenschaft die Keime , welche durch Namen wie Hugo Riemann, und Ernst Kurth, Carl Stumpf und Erich von Hornborstel bezeichnet sind, entfalten - oder verkümmern lassen.
Innerhalb des Forschungsprogrammes der Kognitionswissenschaft bietet sich, wie ich gezeigt habe, eine Möglichkeit die Wurzeln des Geistes zu erforschen und systematische musiktheoretische Forsch1Ung in der Kogniti ven Musikologie wissenschaftlich zu entfalten.
379
ANHANG A Synopsis zur geschichtlichen Entwicklung der Cognitive Science 1936 Der Mathematiker Alan Turing entwickelt bei der Bestimmung des
Begriffes "mechanisches Verfahren" anband der Analyse eines menschlichen Rechners das Konzept der Turing-Maschine. Die universelle Turing-Maschine ist ein Mechanismus, der jede beliebi ge Turing-Maschine simulieren kann. Diese Arbeit kann als erste Anwendung automatentheoretischer Konzepte im Rahmen psycholo gischer Untersuchungen betrachtet werden. Auch Emil Post entwik kelt eine ähnliche Idee. Zur gleichen Zeit formuliert der Logiker Alonzo Church eine These, die mit der Turings zusammen als Church-Turing These bezeichnet wird und die lautet: Was in einem intuitiven Sinn als effektiv bere chenbar betrachtet wird, d. h. mittels eines Algorithmus berechen bar ist, wird durch das Konzept der Turing-Maschine oder äquiva lente Begriffe, wie unbeschränkte Ersetzungssysteme, rekursive Funktionen, Semi-Thue-Systeme etc., erfaßt. Zukünftige Präzisier ungen des Begriffs "effektives Verfahren" werden sich als extensi onal äquivalent zu den bisherigen Konzepten erweisen. 1938 Claude Shannon weist die Äquivalenz von Schaltalgebra (Mittel zur Beschreibung elektrischer Schaltungen) und der Aussagenlogik nach. Dies bedeutet, daß die Theoreme der Aussagenlogik bei der Analyse und Synthese von Schaltungen angewandt werden können. 1943 Angeregt durch die Arbeit Turings und andere logische Untersu chungen modellieren der Neurophysiologe Warren Sturgis McCulloch und der Mathematiker Walter Pitts die Funktionsweise von Nerven zellverbänden. Sie nehmen Sherringtons Synapsentheorie sowie Ca jals Neuronentheorie zur Grundlage und prägen die Begriffe des formalen Neurons und des formalen Nervennetzes. Wesentliches Er gebnis ist, daß ein Nervennetz in der Lage ist, alle bekannten aus sagenlogischen Operationen durchzuflihren. Es handelt sich um die erste Arbeit, die automatentheoretische Begriffe auf Probleme der Neurobiologie (Neurophysiologie u. Neuroanatomie) anwendet. Zur gleichen Zeit spricht der Psychologe Kenneth Craik (1943) vom Nervensystem als einer calculating machine. 1945 Johann von Neumann entwickelt unter Bezug auf die Arbeit von Warren Sturgis McCulloch und Walter Pitts (1965/1943) die logi sche Struktur des derzeitigen Computers - die Konzeption des von Neumann-Rechners, der aus Eingabe-/Ausgabeeinheit, einem Steu erwerk, einer arithmetisch-logischen Einheit (Rechenwerk) und der Speichereinheit besteht. Das Wesentliche dieser Konzeption ist, daß
380
1948
1949 1956
1957
1957 1958 1959
1960
sowohl die zu bearbeitenden Daten als auch das die Bearbeitung kontrollierende Programm gespeichert werden. (1951 publiziert) findet das Hixon-Symposium statt, das als Ur sprung der Cognitive Science gilt. Logiker, Techniker, Neurobiolo gen und Psychologen treffen zusammen. Der Hirnforscher K. Lash ley überträgt in seinem berühmten Aufsatz The Problem of Serial Order in Behavior den Begriff des gespeicherten Programms auf die Psychologie. J. v. Neumann spricht über die Theorie der Auto maten und die Untersuchung des Nervensystems. Er schafft die Ba sis flir die logische Theorie selbstreproduzierender Automaten (vgl. H. Gardner 1989). Donald 0. Hebb entwickelt seine Theorie der Neuronenverbände ( cell assemblies), die Ausgangspunkt flir viele Modeliierungen im Bereich der physiologischen Lerntheorie wird. Die von Claude Shannon und John McCarthy herausgegebenen Auto mata-Studies erscheinen. Es ist der erste Sammelband, in dem Pro bleme der Automatentheorie behandelt werden. Der Metamathema tiker Stephen Cole Kleene abstrahiert bei seiner Untersuchung des formalen Nervennetzes von McCulloch/Pitts das Konzept des endli chen Automaten und zeigt die Äquivalenz beider Konzepte. Bei der Konferenz am Dartmouth-College, an der u. a. Marvin Minsky, Allen Newell und Herbert A. Sirnon teilnehmen, wird von John McCarthy, der selbst an der Modeliierung des common-sense reasoning arbeitet, in Abgrenzung von den Automata-Studies der Begriff der "künstlichen Intelligenz" (KI; artificial inteJJigene, Al) geprägt (s. Charniak & MeDermett 1985, 1 1 ). Heinz von Förster gründet das Biological Computer Labaratory an der Universität Illinois für die Untersuchung selbstorganisierender Systeme, eine Richtung, die neuerdings als second order cyberne tics bezeichnet wird. Mitarbeiter waren u.a. der Philosoph Gotthard Günther, der Biologe Humberto Maturana und der Biophysiker Lars Löfgren. Das Institut bestand bis 1976. Noam Chomsky überträgt automatentheoretische Konzepte auf den Bereich linguistischer Forschungen. Er entwickelt die generative Transformationsgrammatik. Newell & Sirnon publizieren im Bereich der Psychologie ihre Arbeit über General Problem Solver, GPS. Frank Rosenblatt stellt sein perceptron vor. Noam Chomsky formuliert die nach ihm benannte Chomsky-Hierar chie der formalen Sprachen, die später in der Informatik Bedeutung erlangt. George A. Miller, Galanter und Pribram übertragen in Plans and the Structure of Behavior Ideen der KI auf den Bereich der Psy chologie. Ihr TOTE ( Test-Operate-Test-Exit) - Mechanismus wird
381 zur Erklärung komplexen psychischen Verhaltens herangezogen. Noam Chomsky weist etwas später die formale Äquivalenz des end lichen Automaten mit dem TOTE-Mechanismus nach. 1961 Marvin Minsky liefert in seinem Artikel Steps towards Artificial In telligence einen ersten Überblick zur Entwicklung der KI. Er favo risiert den sog. Symbolverarbeitungsansatz, den Allen Newell 1980 als Paradigma der Modellierung kognitiver Proze·sse für die Cogniti ve Science formulieren wird. 1962 Der Sammelband Computers and Thought, herausgegeben von Ed ward Feigenbaum, stellt die Forschungen der KI heraus, wobei Arbeiten zu neuralen Netzwerkmodellen ausgeschlossen werden. Al len Newell, Herbert A. Simon, John McCarthy und Marvin Minsky, die Protagonisten der KI-Forschung, legen ihre Standpunkte dar. Minsky betrachtet Musik als praktischen Anwendungszweig der KI. Die KI grenzt sich von der Richtung ab, die sich mit der Erfor schung selbstorganisierender Systeme befaßt. 1963 Das Handbook of Mathematical Psychology wird herausgegeben. 1964 Sirnon Papert analysiert Komplexität und Grenzen bisheriger Model le der Verhaltensweise des Nervensystems sowie deren Bedeutung flir die psychologischen Studien von Jean Piaget. 1965 Noam Chomskys Aspects of the Theory of Syntax erscheinen. Die Standardtheorie der generativen Grammatik wird beschrieben und die Konzepte der Tiefen- und Oberflächenstruktur eingeführt. 1966 Der Franzose Barbaud benutzt den endlichen Automaten zur Kom position. 1967 Marvin Minsky gibt das Buch Semantic Information Processing heraus. Die KI wendet sich verstärkt der Untersuchung natürlicher Sprache zu. Ulric Neisser veröffentlicht sein Werk Cognitive Psychology. 1968 Terry Winograd überträgt Konzepte der KI auf die Analyse musika lischer Strukturen. 1968 John McCarthy und Hayes betrachten die Beziehung der KI zur Philosophie. In Deutschland wird die Informatik als Ingenieurswis senschaft eingefUhrt. 1969 Christopher Longuet-Riggins und Mark Steedman untersuchen musi kalische Wahrnehmungsprozesse mit Methoden der KI. 1970 Die theoretische Linguistik (Helmut Schnelle) bildet sich heraus. 1971 In seiner Arbeit zur Analyse musikalischer Strukturen benutzt Ste phen W. Smoliar das Konzept der Parallelverarbeitung. 1972 Henry Atlan publiziert sein L'organiza tion biologique et Ja theorie de l'information.
1973 Allen Newell entwickelt das Konzept der Produktionsregeln zur Be schreibung psychologischer Vorgänge. Diese Idee findet starke Anwendung in der KI. Michael A. Arbib betrachtet die Beziehung
382
1975
1976
1977
1978
1979
1980
1981
1982
der Automatentheorie zur theoretischen Biologie. Der Mitarbeiter J. v. Neumanns und Peirce-Spezialist Arthur W. Burks formuliert die zentrale These des logischen Mechanismus: A finite deterministic automaton can perform all natural human functions. Christopher Longuet-Higgins prägt in seinem Kommentar anläßlich des Light hili-Berichtes zur Künstlichen Intelligenz den Terminus Cognitive Sciences. Die Alfred P. Sloan Foundation unterstützt die sich konstituierende Cognitive-Science Bewegung. Die Miniaturisierung der Hardware führt zu kostengünstigen Miere-Computern. Daniel Bobrow und Al lan Collins geben Understanding and Representation - Studies in Cognitive Science heraus. Szentagothai und Michael A. Arbib weisen auf die Bedeutung des Modul-Konzeptes für die Neurowissenschaften hin und heben dessen Relevanz für kognitive Modeliierungen hervor. Allen Newell und Herbert A. Sirnon (1976) stellen anläßlich ihrer "Turing Award Lecture" die Physical-Symbol-System-Hypothese (PSSH) vor. Dresher/Hornstein -Debatte in der Linguistik. Die Grammatiker in der Tradition Chomskys debattieren mit den KI-Wissenschaftlern Roger Schank, Terry Winograd über methodelogische Probleme der Cognitive Science. Die Zeitschrift "Cognitive Science" wird gegründet. In einem state of the art-Report wird als gemeinsames Ziel der Forschungen der Cognitive Science angegeben, to discover the representational and computational capacities of the mind and their structural and functional representation in the brain. George Edel man (1978) formuliert seine neural group selection theory. Noam Chomsky und Jean Piaget treffen mit zahlreichen anderen Wissenschaftlern wie Jerry Fodor, Pierre Changeux, Hilary Putnam Norbert Bischof und Seymour Papert zusammen, um über Lernen und angeborene Strukturen zu diskutieren. Die Cognitive-Science Gesellschaft entsteht. Allen Newell hebt die Bedeutung des Konzeptes des "Physical-Sym bol-System" für die Forschung der Cognitive Science hervor. Es handelt sich dabei im wesentlichen um eine universelle Turing-Ma schine. In der psychologischen Forschung tritt der Funktionalismus hervor, der ebenfalls als grundlegendes Erklärungsmodell die Tu ring-Maschine benutzt. Donald A. Norman gibt den zentralen Band Perspectives on Cogniti ve Science heraus. In dem gleichen Jahr wird von Geoffry Hinton und James A. Anderson der Sammelband Parallel Models of Associ tive Memory veröffentlicht, der eine Renaissance des Konnektionis mus - der neural nets - einleitet. Der Neurophysiologe David Marr bringt seine umfassende Arbeit Vi-
383 sion zur
Sehwahrnehmung heraus, in der er sein hierarchisches Konzept des Forschungsprozesses innerhalb der Cognitive Science entwickelt. 1983 Der Komponist und Musiktheoretiker Fred Lerdahl und der Linguist und Chomskyschü l er Ray Jackendoff ordnen in ihrer Monographie A Generative Theory of Tonal Music die musiktheoretische Forschung der Cognitive Science zu. Nicholas Johnson-Laird publiziert sein Buch Mental Models: To wards a Cognitive Science of Language, Inference and Consciousness. 1984 1 . Internationaler Kongress über Brain Theory. Es bilden sich die Bereiche neural engineering und computational neuroscience aus. Zenon W. Pylyshyns Buch Computation and Cognition: Towards a Foundation of Cognitive Science erscheint. 1985 Der Musikpsychologe John Sloboda veröffentlicht The Musical Mind. A Cognitive Psychology of Music. 1986 Renaissance der Nervennetzmodelle im Rahmen des (Neo) -Konnekti onismus, innerhalb dessen auf die Arbeiten von Warren Sturgis McCulloch und Walter Pitts (1943/1965), Donald Hebb (1949) und Frank Rosenblatt (1956) Bezug genommen wird. 1987 Der Musikwissenschaftler und Informatiker Christoph Lischka pro klamiert die Abkehr der musiktheoretischen Forschung innerhalb der Cognitive Science vom PSS-Paradigma und die Hinwendung zu den neueren (konnektionistischen) Nervennetzmodellen. In dem von Michael Imbert et al. erarbeiteten Bericht Cognitive Science in Europe - A Report from the FAST Programme Commis s ion of the European Community wird auf die Notwendigkeit der Förderung der Cognitive Science in Europa hingewiesen. 1986 Marvin Minsky legt seine Gedanken zur Erforschung kognitiver Pro zesse in der Monographie The Society of Minds dar. 1987 In Deutschland werden Lehrstühle für Neuroinformatik eingerichtet. Das BMFT (Bundesministerium für Forschung und Technologie) ini tiiert und fördert das Grundlagenprogramm "Info-rmationsverarbeitung in neuronaler Architektur". 198 8 Helmut Schnelle stellt die sprachwissenschaftliche Forschung in den Rahmen netzlinguistischer Konzepte. Auf dem von Christoph Lischka geleiteten Workshop Kl und Musik der Gesellschaft für Mathematik und Datenverarbeitung in St. Augustin werden Modelle zur Musikwahrnehmung im Rahmen des konnektionistischen Forschungsansatzes vorgestellt. 1988 In Paris findet das J. Symposium on Music and the Cognitive Seiences am IRCAM statt. 1989 In Harnburg finden das 1. und 2. Kognitionskolloquium am Fachbe reich Informatik statt. Michael A. Arbibs The Metaphorical Brain 2: Beyond Neural Net works wird veröffentlicht.
384 1990 In England findet das 2. Symposium über Music and Cognitive Seiences statt. Die Distribuierte Künstliche Intelligenz wird bekannter. Die Zeitschrift "Kognitionswissenschaft" erscheint in Deutschland. In Harnburg wird das Kolleg Kognitionswissenschaft mit Hilfe der Deutschen Forschungsgemeinschaft (DFG) gegründet. Allen Newell faßt seine Forschungen in dem Werk Unilied Theories of Cognition - The William James Lectures zusammen. 1991 In Paris findet das 3. Symposium über Music and Cognitive Seiences am IRCAM statt. Im Oktober wird die European Society for the Cognitive Seiences of Music (ESCOM) in Trento/Italien gegründet. 1992 Im Februar findet der 2. Kongress über "Musikwahrnehmung" in Los Angeles statt. Innerhalb der ECAI-92 (European Conference on Artificial lntelli gence) findet ein Workshop On Artificial Intelligence and Music statt. Die erste Ausgabe der Newsletter der ESCOM erscheint. Das BMFT (Bundesministerium für Forschung und Technologie) för dert seit einiger Zeit verschiedene Projekte zu Forschungsfeldern, die zu den "Technologien des 21. Jh.s" zu führen scheinen: Adaptro nik, Nanotechnologie, Fullerene, photonische und optoelektronische sowie biomimetische Werkstoffe, Biosensorik, molekulare Bioinfor matik, Bakteriorhodopsin sowie Neuroinformatik/Künstliche Intelli genz. 1993 Die 1. International Conference on Cognitive Musicology wird in Jyväskylä/Finnland stattfinden.
385 ANHANG B Elementare Mengenlehre Im folgenden Abschnitt werden die notwendigsten Grundlagen der Men genlehre vorgestellt, wobei der zugrundegelegte Mengenbegriff der soge nannte "naive" ist, welcher auf Cantor zurückgeht. Cantor1 bezeichnete als Menge jede Zusammenfassung M von bestimmten, wohlunterschiede nen Objekten m unserer Anschauung oder unseres Denkens (welche "Elemente" von M genannt werden) zu einem Ganzen.
Nach dieser Definition können als Elemente einer Menge sowohl Äpfel oder Telefone als auch abstrakte Gegenstände wie z. B. Zahlen gelten. Will man eine Menge beschreiben, gibt es zwei Möglichkeiten: bei kleineren Mengen werden die Elemente in geschweiften Klammern aufge zählt: Die Menge { l , 2} hat die beiden Elemente 1 und 2. Gibt man dieser Menge den Namen A und bezeichnet die Elementbeziehung mit "E", so ist 1 E A und 2 E A . Will man ausdrücken, daß ein Objekt x nicht Element einer Menge X ist, schreibt man "x t. X". Die Reihenfolge der Elemente spielt keine Rolle. Sind die Mengen so groß, daß eine Aufzählung ihrer Elemente in ge schweiften Klammern zu unhandlich wäre, formuliert man eine Aussage, die auf alle ihre Elemente zutrifft: "die Menge aller Objekte x, so daß E ( x ) ". "E" steht für eine beliebige Eigenschaft, z.B. "gerade natürli che Zahl unter einhundert". Eine Menge B, welche die genannten Ele mente enthält, wird wie folgt beschrieben: B = { x
I
x ist eine gerade natürliche Zahl unter einhundert }
Obiger Ausdruck ist zu lesen als: Die Menge B besteht aus allen Ele menten x, für die gilt: x ist eine gerade natürliche Zahl unter einhundert. Eine spezielle Menge ist die Menge, die kein Element enthält: die leere Menge { }. Sie wird auch mit
1. Teilmenge
'
"c;;;;"
Zu den beliebigen Objekten, die Mengen als Elemente enthalten kön nen, gehören auch andere Mengen: Haben wir zwei Mengen C und D , dann ist C Teilmenge von D , wenn jedes Element in C auch in D ent1) s. Cantor, Georg: Gesammelte Abhandlungen. Berlin 1932, S. 204
u.
282.
386 halten ist. Ein Beispiel mag dies verdeutlichen: Bezeichnet C die Menge der Studentinnen der Musikwissenschaft an der Universität Harnburg mit Elementen c und D die Menge der Musikwissenschaftstudenten insgesamt an der Universität Harnburg mit d, dann ist C Teilmenge von D. Eine Menge C ist Teilmenge einer Menge D, wenn es kein Objekt gibt, das zwar zu C, nicht jedoch zu D gehört. Die graphische Darstellung durch sog. Venn-Diagramme macht es deutlicher: Definition� Sind X und Y Mengen, so heißt X Teilmenge von Y ( in Zeichen X (::; Y ) , wenn jedes Element von X auch ein Element von Y ist. Y heißt dann auch Obermenge von X . Nach dieser kurzen Vorstellung des Mengenbildungsprinzips, der Ele mentbeziehung und der Teilmengen sollen jetzt Operationen auf Mengen beschrieben werden. 2 . Vereinigung
"v"
Die Vereinigungsmenge zweier Mengen A und B wird definiert als die Menge, deren Elemente zu A oder ("v ") zu B gehören. A v B =
{x lx € A v x € B
}
Die graphische Darstellung, hier am Beispiel von A = 3, 4}, sieht aus w1e folgt:
{1,
{1,
2 } und B =
0 0
Für beliebige Mengen X ist natürlich X v
"f\"
Der Durchschnitt zweier Mengen besteht aus den Elementen, die sowohl in der einen als auch in der anderen Menge enthalten sind. Bleiben wir beim obigen Beispiel, besteht der Durchschnitt von A und B aus den 1) vgl. Link 1979, 49.
387 Elementen, die in A und ( ""'" ) B enthalten sind: A (\ B = { x Am Beispiel: A
(\
B =
l
x €A A X €B }
{1 }
0 0
Der Durchschnitt zweier disjunkter ( d. h. ohne gemeinsame Elemente) Mengen ist leer, genau wie der Durchschnitt einer beliebigen Menge mit der leeren: X (\
"X"
Eingangs wurde festgestellt, daß bei Mengen die Reihenfolge ihrer Ele mente keine Rolle spielt. Anders ist es bei den sog. geordneten Paaren,
388 die bei Bildung des Cartesischen Produkts (auch als Kreuzprodukt be zeichnet) zweier Mengen entstehen, bei denen das erste Glied des Paares aus der Menge A kommen muß und das zweite aus der Menge B: A X B
=
{ (x, y) I x E A
"'
y EB }
Die Anzahl der geordneten Paare berechnet sich aus der Multiplikation der Anzahl der Mengenelemente, die durch ihre Kardinalzahl, formal " l n l ", angegeben wird. Werden die schon eingeführten Mengen A = {1, 2} mit der Kardinalzahl 121 und B = {1, 3, 4} mit 131 genommen, dann ist deren Cartesisches Produkt eine Menge mit 2 * 3, also 6 geordneten Paaren: A X B
=
{ (1, 1),
( 1,
3), (1,
4),
(2, 1 ), (2,
3), (2, 4)}
Man kann sich leicht überzeugen, daß das Kreuzprodukt nicht kommu tativ ist, d. h. es gilt: A X B * B X A . Mengen mit der gleichen Kardinalzahl bezeichnet man als äquivalente B . Haben Mengen die gleichen Elemente und die gleiche Mengen: A Kardinalzahl, ist die Menge A gleich der Menge B: A = B. �
7. Relationen
"R"
Um das Konzept der Relationen vorzustellen, benötigen wir zwei der oben vorgestellten Begriffe - den der Teilmenge und den des Cartesi schen Produkts -, da eine Relation R definiert wird als Teilmenge des Cartesischen Produktes. Definiert man eine Relation, setzt man Elemente einer Menge in beliebige Beziehung, z. B. "kleiner als" zu Elementen ei ner anderen Menge. Jede Zuordnung von Elementen aus einer Menge A zu den Elementen einer Menge B heißt Relation: R = { (a, b) I a steht in Relation zu b "' a E A "' b E B}. Definieren wir auf den bekannten Mengen A und B die Relation "klei ner als" und schauen wir obige Ergebnisse des Cartesischen Produktes an, fallen folgende Paare in diese Relation, deren Erstglied aus A jeweils kleiner ist als das Zweitglied aus B : {( 1, 3), (1, 4), (2, 3), (2, 4)} Es liegt also, wie angeführt, eine Teilmenge des Cartesischen Produkts vor, die sich als Diagrar:nm so darstellt: A
B
389 8. Funktionen "f" Wie in obigem Diagramm zu sehen ist, wird durch die Relation den Elementen der Menge A nicht nur ein Element aus B zugeordnet, sondern mehrere. Eine Relation wird dann zur Funktion, wenn den Elementen des Definitionsbereichs (der Menge A) jeweils nur höchstens ein Element des Wertebereichs (der Menge B ) zugeordnet wird, wobei nicht jedes Ele ment des Wertebereichs einen "Partner" aus dem Argumentbereich haben muß. Es gibt folgende Arten von Funktionen, die hier als Diagramme vorgestellt werden: surjektiv
@=B
~
Eine weitere Form der Funktion ist die sog. partielle Funktion, die nicht jedem Element des Argumentbereichs A einen Wert in B zuordnet: A
B
()=€) Benutzte Symbole { }
< > €
t.
V A.
V
(\ *
=
c I
Mengenklammern Klammern für geordnete Paare Elementbeziehung negierte Elementbeziehung ode r und Vereinigung Durchschnitt ungleich gleich Teilmenge Äquivalenz Differenz leere Menge
390
ANHANG C Schaltbilder
UHD ( AHD) ar�erlkanisc.h
deutsch neu
deutsch alt
w- !1»-
ODER (IIR) x
x2
x.z
y
:
:
u
y
· X· n
Xn
NICHT CHDTl
X
Da in der angefl.ihrten Literatur auch sehr häufig die alten und ameri kanischen Symbole anzutreffen sind, gebe ich für die in der Arbeit be nutzten Schaltsymbole die äquivalenten Formen an. In der Arbeit wurde die neue deutsche Notation benutzt. Die Erklärung der Lesart dieser Symbole erfolgt an den entsprechenden Stellen; vgl. S. 72-73.
391 ANHANG D II... � 10
....,
U) CO
"' ...
"" CO U) U) "' "' ... ...
""
•
U)
I N U)
CO
,.!. -
�
•
"" ...I ""
,.., -
-
... U) -
-
. ... ... .. ..
E CU
......
111
"' "' c
'-"'
-
CU
....
.
II... 0 CU �
-
CU �
....
10 II... CL
'-"'
111
"' "' c
-
«
«
c
-
..
-
.. c: ... 01 .... .... "' .
·-
111 ..
..
..
' � '... ...""' "' ._ c ... ... c J:: ... ... L!>CI) .
""' ...
.
111 II\
"' '""
-
.. ... ""'c ... J:! ... Cl)
J:! ..
... c "' Cl) ""' ... 0 ... "' Cll
-
....1
....1
....1
0.. «
"' "' c:
-
«
""' ... "' 111
.
"'
-
'""
111 1! ",.c
.. II\ "' -
«=
«
_
"" m "" a:
Cl)
...
"' "' c J:!
..
.
I
I
� II... C»
..0 1: ... o..
N 0..
"" 0..
��� -
111 <1>
« ....J
::a cz: -
.
0.. Cl) ....1
..0
111 111
J:!
-
"' "' ... 0 '"" IX ..
..
-
"' c
«
.
.
... "' II\ .. ::> 0 ... Q.
::> 0
... Q.
�
�
.. 01 01 ..
... "' ..
. -
0
Cl) 1:
' ::0:: c: I
"' c: ... .. ... ..
... ... "' "' c 0
Cl) ....1
... ...
"' ...,
.. ... .. 0 ...
... ... 0 (.)
"' ..0 ...."'
.
N N
0.. (/)
-
"' ...,
.><
....1
� Cl) -
......
-
N N
I
111 ... c ... "'
.
� L. cn ..,. - ��� ...J e 0
�
.. ...
..0
E
II\ II\ «
..
L!>
"C "'
... "' 0 c
...
::z
-
.c
... .. ... .
:::::0
... ... ... ::> ...... .
..
... "" ' c ... Q. Q. .. "" .
... "' 111
•
.. ...
... -
..
... ... -
I!
"' ...,
.:i
... ..
0
:!.
I
...
..
1:
... 01 .... "' ... ...... .... -
- o .C "O "' c:
c
«
....
...
c 0
J:! Q.
"' f ""' 01
.. ... "' � ..... ...... .. -
-o J:!"O "' c
... ... ... .. ...... ... ... ... -I "' ....� ... ..., ..., "C
..
I
....
Cl)
-
-
"' ... "' 0..
....1
c.)
,.
"' "' II\
..
.c
.. ..
-
.
«
.c
0.. Cl)
"' "' ::0:: ' .. L. .. "' (.)
..
-
"'
«
« -
..
"' c:
111
II\ "' ... "' "' Q. c c:
-
111
"' "' 111 "' "' ..
... -
111 ::> :n o
I
-
-
...
..
I: -
�
c 0
c:
...Q.
�
-
... "' 111 ::> 0
"' ...
-
.
.0
...
"'
CO
-
N N
' ""' ... ""' 111 ... 111 0 "' "' .. .... "" ""
II\ c:
.
..
"'
c 0
.....
J:!
"' ... .. .. ....1 .... ...... "' ... 0 ....
II\
... -
...
... "' 111 ..
CO
I •
...
...
"" "'
-
-
-
-
c:
-
..
"' c
"' "' "' "' ..0 ... 0
.. "' ... ::> ... ...
.... .. ... c .. ... ... .. ... J:! ..O ... c: .::: � ... .�� .c ... ... ... Cl) ::C CI) ,..,
0.. Cl)
111 ..
-
-
c 0
..
-
0 II... a..
.., ", o c .... o .... z: . "' .. �
"" ""
... .... ...
�
II\
' II\ ... c 0 ..., ' L. .. ... .
z:
Cl)
-
......
J:!
"' "' 0 L.
0
..0 L.
"' ...
Cl)
....1
' "" ....1 ""
L!>
�
.. ... ... ... 0 0: ....c. "' .. ..0 ""'"'... "' "' Cll m -
Diese Tabelle gibt einen Überblick über einige benutzte Programmier sprachen und Problemstellungen innerhalb der Kogn-itiven Musikwissen schaft. Die angegebenen Personennamen erlauben den Bezug auf die Literaturliste, so daß ein eingehenderes Studium ermöglicht wird. Der größte Teil der Personen bzw. deren Forschungen wurde allerdings aus fUhrlieh in diesem Buch diskutiert. Der Zeitraum wurde allein für eine erste Orientierung angegeben, ebenso der untersuchte Stil, der eventuell formulierte theoretische Bezug und die behandelte Problemstellung.
392 ANHANG E Beispielprogramme In diesem Anhang befinden sich drei Programme. Sie dienen einerseits dazu, die drei bekanntesten Programmierstile1 - den imperativen, den funktional-applikativen und den logisch-relationalen Stil - zu illustrieren, andererseits sind die unten vorgeführten Beispiele auf einige Kapitel die ser Arbeit bezogen. Das erste Programm ist in der imperativen Program miersprache C geschrieben? Es handelt sich um eine Sprache, die zum einen maschinennahe Konstrukte enthält und zum anderen die in vielen imperativen problemorientierten Sprachen gebräuchlichen "höheren" Struk turen, wie Verbunde (records, Datensätze), arrays und Zeiger (pointer). Die Abarbeitung der Anweisungen erfolgt sequentiell und wird durch ";" angezeigt. An weiteren Kontrollstrukturen gibt es die Zählschleife for und die bedingte while-Schleife, welche Iterationen von Programmabschnitten ermöglichen. Eine übersichtliche Gliederung des Programmes kann durch Blöcke, Funktionen und Prozeduren erreicht werden. In dem C-Programm ist die von Smoliar (vgl. Kap. 3. 2. 2, S. 275) beschriebene Strukturie rung des Liedes "Bruder Jakob" implementiert. Das Stück kann durch einen Atari mit Synthesizer über MIDI (musical jnstruments .sf.igital jnter face) realisiert werden. Es wird, wie durch die erste tor-Schleife indi ziert, mit einer Wiederholung gespielt. Die von Smoliar vorgenommene Gliederung des Stückes in Unterabschnitte ist in dem Programm ebenfalls mit BEGIN und END angezeigt. Der Verständlichkeit halber habe ich die Töne - sonst durch Zahlen angesprochen - mit ihren bekannten Notenna men versehen und die realisierten Abschnitte des Liedes an den entspre chenden Programmstellen in der herkömmlichen Notation beigefügt. Die Funktionen wait, midion und midioft greifen auf flir den Atari übliche Systemfunktionen zurück und dienen lediglich der Kontrolle der MIDI -Schnittstelle. Eine Erläuterung der Arbeitsweise dieser Funktionen ist an dieser Stelle nicht erforderlich, da sie für das Verständnis des eigentlichen Programms nicht notwendig sind .3 Durch die Funktionen ton I) Eine ausführliche Unterscheidung der verschiedenen Programmierstile gibt Schefe 1985. 2) Eine genaue Beschreibung der Sprache C findet man in vielen Lehrbüchern. Es seien daher nur drei genannt: Plum 1985 Ist eine Einführung für den Anfänger; Schild! 1989 ist ein sehr gutes, aber kompakt geschriebenes Buch; als Nachschlagewerk für Turbo C auf dem Atari sei auf Repplinger 1989 verwiesen. Das vorliegende Programm wurde in Turbo C geschrieben. 3) Über den Aufbau des Betriebssystem TOS (The Operating System; Tramiel Operating System} mit BIOS (Basic Input Output System}, XBIOS (Extended Basic Input Output Sy stem} und GEMDOS ( Graphie Environment Managment Disc Operating System} und deren Funktionen berichten die vielen Atari-Bücher. Eine gute Einführung in MIDI - al lerdings mit der Programmiersprache BASIC - mit musikalischen Experimenten gibt
393 und melodie wird eine Strukturierung des Programmes erreicht. Sie arbeiten mit den zuvor erwähnten Funktionen. Zentral für das Verständnis des Programmes ist die Funktion melodie, die als Argumente die "Tonhö he", die "Lautstärke" und die "Dauer" erhält und den Argumenten gemäß einen Ton realisiert. Die "Tonhöhe" wird bei Synthesizern über eine Taste realisiert, die über die MIDI -Schnittstelle mittels der entsprechenden Tastennummer angesprochen wird. Die "Lautstärke" - die velocity (Schnelligke it ; Anschlagsstärke) - wird durch die ebenfalls durch Zahlen dargestellte Anschlagsintensität codiert, welche somit eine relative "Lautstärke" des erzeugten Tones realisiert. Die "Dauer" bewirkt ein Erklingen des Tones für die in reellen Zahlen angegebene Zeit. Das LISP-Programm wiederum illustriert die Erörterungen der Kapitel 2. 2. 4. 2, S. 118 ff.; 3. 2. 1 , S. 253 ff.; 3. 2. 2 , S. 272 ff. sowie des Kapitels 3. 1. 2 . , S. 193 ff. Das Programm1 realisiert das in Kapitel 3. 1 . 2, S. 193 u. 194 angegebene Lindenmayersystem LSROT zur Beschreibung eines Wachstumsprozesses. Die Zeichen des in Kap. 3. 1. 2 , S. 193 angegebenen Regelsystems LSROT müssen aus technischen Gründen umbenannt werden: Den Zahlen 1 bis 8 werden die ersten acht Buchstaben "a" bis "h" des Alphabets zugeordnet, d. h. 1 � a, 2 �b. 3 � c, etc. Die 0 wird durch "�" ersetzt und dem Zeichen "u" das Zeichen "?" zugeordnet. Die " (" behält ihre Bedeutung. Die Repräsentation einer Zeichenkette erfolgt durch eine Liste mit den entsprechenden Elementen, so z. B.: 1 � (a)
oder
2u2u8(l )07060504
(b ? b ? h (a) � g � f � e
�
d)
Es müssen zuerst die Regeln des Lindenmayersystems LSROT eingegeben werden. Dies geschieht, indem Antezedens und Konsequens der Regeln eingegeben werden. Die Funktion input dient zum Aufbau des Regelsystems. Sie muß pro Regel einmal aufgerufen werden. Die Funktion Lindenmayer nimmt als Argument das Axiom des entStroh 1990. Eine exzellente Einführung in die Idee des Programmierens, den Rechner· aufbau und die Arbeitsweise eines Computers, die von einem speziellen Rechner abstrahiert und für den Anfänger zur Einarbeitung geeignet ist, findet sich in Arbib 1984, besonders in den Kapiteln 2 und 9. Man vgl. auch Kap. 2. 2. 5. 1, S . 159 ff. dieser Arbeit. 1) Es wird für das Programm der bei Müller (1985, 80·82) angegebene Algorithmus verwendet.
394 sprechenden Lindenmayersystems. Bei dem Beispiel handelt es sich um das Zeichen "a", d. h. die 1 in dem Regelsystem von Kap. 3. I. 2, S. 193. Die Funktion Lindregel leistet die "eigentliche" Arbeit, denn sie unter sucht die vorliegende Kette auf mögliche Regelanwendungen und führt diese durch. Die Parall,elität der Regelanwendung erfolgt hierbei allerdings sukzessiv. Da aber alle in einem Schritt möglichen Ersetzungen bei der Funktionsanwendung von Lindregel durchgeführt werden, erhält man den Eindruck einer parallelen Ersetzung bei der Ableitung der einzelnen Ketten. Die Funktion kmal führt zu der einer Folge von k Anwendungen der Funktion Lindenmayer. Es ist eine Sitzung dokumentiert, in der die in Kap. 3. I. 2 , S. 194 angegebene Ableitung durchgeführt wird. Weiterhin verdeutlicht der folgende "trace" die Komplexität der Be rechnung, die sich bei nur zwei Anwendungen von Lindenmayer ergibt. Das PROLOG-Programm' implementiert das in Kapitel 3. 1 . I , S. 184 ff. u. bes. S. 187 definierte Erwartungskonzept am Beispiel eines endli chen Automaten. Zu erkennen sind wieder die Aufteilung des Programms in die Datenbasis - hier bestehend aus dem endlichen Automaten mit seinen Transitionen und Zuständen - und das Regelsystem, welches die Konzepte "akzeptieren" und "erwarten" definiert.
I) Eine Beschreibung der Arbeitsweise und Interpretation von PROLOG-Programmen findet sich in Kapitel 3. 2. 3., S. 295 ff. u. bes. S. 301 ff.
395 Beispielprogramm in der Programmiersprache C ZU Kap. 3. 2. 2, S. 274-275 <stdio.h> (time.h> <ext.h) <stdlib.h>
11include llinclude 11include 11include 11include I•
+++++++++++++++++++++++++++
void void void void void I•
++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
{ }
BEGIN END
++++++++++++++++++++
void
{
DAS PROGRAMM
++++++++++++++ ++++++++++
•I
•I
main(void) register int laufvariable, lauf; const int c1 60, d1 = 62, e1 = 64, f1 = 65, g1 =
=
67, a1 = 69, g = 55;
printf("Es wird alias gespielt:\n" "Bitte RETURN-Taste betaetigen!\n"); for
•I
wait(float zahl); midion(int kanal, int taste, int lautstaerke); midioff(int kanal, int taste); ton(int kanal, int taste, int lautstaerke, float dauer); melodie(int taste, int lautstaerke, float dauer);
11define 11define I*
Prototypen
(lauf BEGIN
for
=
1 ; (lauf < = 2); lauf++ )
(laufvariable BEGIN melodie(cl, melodie(d1, melodie(e1, melodie(c1, END;
=
70, 60, 63, 55,
1 ; (laufvariable < = 2); laufvariable++) 0.5); 0.5) 0.5) 0.5)
;1
396 for
(laufvariable = 1; (laufvariable < = 2); laufvariable++) BEGIN melodie(el, 70, 0.5); melodie(fl, 60, 0.5); melodie(g1, 65, 2.0 * 0.5); END;
J J J
for
(laufvariable = 1; (laufvariable < = 2); laufvariabte••) BEGIN melodie(gl, 70, 0.5/2.0); melodie(al, 60, 0.5/2.0); melodie(gl, 60, 0.5/2.0); melodie(fl, 61, 0.512.0); melodie(el, 65, 0.5); melodie(cl, 45, 0.5); END;
IDn; J
for
I
(laufvariable = 1; (laufvariable < = 2); laufvariable++ ) BEGIN melodie(c1, 65, 0.5); melodie(g, 53, 0.5); melodie(cl, SO, 1); END;
END; printf("Das Programm ist beendet. Bitte RETURN-Taste"); getchO; } I•
+++++++++++++++++ FUNKTIONSDEFINITIONEN ++++++++++++++++
•I
I•
Alle Funktionen haben keinen Rueckgabewert, d. h. void:
•I
I* I• I• I• I•
Rueckgabewert Name wait void midion void
I•
void void
midioff ton
I•
void
melodie
I•
Argumente mit Datentyp und Bedeutung '(float dauer) (int kanal, int taste, int lautstaerke, float dauer) (int kanal, int taste) (int kanal, int taste, int lautstaerke, float dauer) (int taste, int lautstaerke, float dauer)
•I
•I
•I •I
•I •I
•I
•I
397 I• FUNKTIONSDEFINITION: MELODIE •I void melodie(int taste, int velo, float dauer) { ton(l, taste, velo, dauer); return; } I• FUNKTIONSDEFINITION: TON •I void ton(int kanal, int taste, int lautstaerke, float dauer) { midion(kanal, taste, lautstaerke); wait(dauer ); midioff(kanal, taste); return; } I• FUNKTIONSDEFINITION: MIDION •I void midion(int kanal, int taste, int lautstaerke) { const int midi = 3, an = 143; Bconout(midi, kanal+an); I• Der Kanal (1 - 16) wird geoeffnet •I Bconout(midi, taste); I• Die Tonhoehe wird angesprochen •I Bconout(midi, lautstaeerke); I• Velocity (0 - 127) •I return; } I• FUNKTIONSDEFINITION: MIDIOFF •I void midioff(int kanal, int taste) { const int midi = 3, aus = 0, an = 143; Bconout(midi, kanal+an); Bconout(midi, taste); Bconout(midi, aus); return; } I• FUNKTIONSDEFINITION: WAIT •I void wait(float zahl) { float test = 0; clock-t anfang, aus; anfang clock(); while (zahl test) { aus = clock(); test = (float) (aus - anfang) I (float) CLK-TCK; } =
>
} I* ++++++++++++ ENDE der FUNKTIONSDEFINITIONEN ++++++++++++•I
398 Beispielprogramm in der Programmiersprache LISP Es folgt das LISP-Programm für LSROT zu Kap. 3. 1. 2, S. 193-194
(DEFUN INPUT (ANTEZEDENS KONSEQUENZ) (PUTPROP ANTEZEDENS KONSEQUENZ (QUOTE LINDREG))) (DEFUN LINDENMAYER (STRUKTUR) (COND ((NULL STRUKTUR) NIL) ((ATOM STRUKTUR) (QUOTE FEHLER)) (T (LINDREGEL (CAR STRUKTUR) (CDR STRUKTUR))))) (DEFUN LINDREGEL (HEAD TAIL) (COND ((ATOM HEAD) (APPEND (GET HEAD (QUOTE LINDREG)) (LINDENMAYER TAIL))) (T (CONS (LINDENMAYER HEAD) (LINDENMAYER TAIL))))) (DEFUN KMAL (STRUKTUR K) . (COND ((ZEiROP K) STRUKTUR) (T (KMAL (LINDENMAYER STRUKTUR) (- K 1)))))
399 Es folgt die Sitzung mit der Ableitung von Zeichenketten mit dem Lin denmayersystem LSROT. Das Regelsystem wird in LISP als Liste von Punktepaaren repräsentiert, deren erstes Element das Antezedens der Regel als Atom enthalten, während die Zeichenkette der rechten Seite der Regel, das zweite Element des Punktepaares als Liste dargestellt ist. Die erste Regel ist wie folgt repräsentiert: (a . (b ? c)). Das Regelsystem fuer LSROT wird eingegeben. (input 'a '(b ? c)) (B ? C ) »
,, (input 'b (b)) (B) ·
(input 'c '(b ? d)) (B ? D ) >>
>>
(E
(input 'd '(e � d)) D) A
(input 'e '(f)) (F) >>
(input 'f '(g)) (G) »
(input 'g '(h (a))) (H (A)) »
(input '? '(?)) (?) »
,, (input ·� '(�)) n
;Es erfolgen die Ableitungen: (kmal '(a) 0) Entspricht PO der Ableitung des Kapitel 3.1.2 (A) ; Das Axiom
» »
»
(kmal '(a) 1) (B ? C)
Entspricht Pl der Ableitung des Kapitel 3.1.2
(kmal '(a) 2) (B ? B ? D)
Entspricht P2 der Ableitung des Kapitel 3.1.2
»
400
'' (kmal '(a) 3) ; Entspricht P3 der Ableitung des Kapitel 3.1.2 (B ? B ? E � D) »
(kmal '(a) 4) ; Entspricht P4 der Ableitung des Kapitel 3.1.2 E D)
(B ? B ? F
�
A
" (kmal '(a) S) ; Entspricht PS der Ableitung des Kapitel 3.1.2 (B ? B ? G � F � E � D) " (kmal '(a) 6) ; Entspricht P6 der Ableitung des Kapitel 3.1.2 (B ? B ? H (A) A G A F A E � D) " (kmal '(a) 7) ; Entspricht P7 der Ableitung des Kapitel 3.1.2 (B ? B ? (B ? C) � H (A) A G A F � E � D) »
(kmal '(a) 8) ; Entspricht P8 der Ableitung des Kapitel 3.1.2 H (A) � G A F E D)
(B ? B ? (B ? B ? D) A (B ? c)
" »
»
0
A
A
A
Es folgt ein "trace" der Funktion kmal mit einer Regelanwendung, der die Arbeitsweise der verschiedenen Funktionen verdeutlicht. (step (kmal '(a) 1)) form: (KMAL (QUOTE (A)) 1) 1 env: (NIL) ; Es liegen bisher keine Variablenbindungen vor. form: (QUOTE (A)) ; Die Form die betrachtet wird ist '(a) value: (A) ; Ihr Wert ist (a) form: 1 ; Die Form die betrachtet wird ist value: 1 ; Ihr Wert ist 1 env: ((((K 1) (STRUKTUR A)))) ; Die Variable k ist an 1 gebunden ; Die Variable Struktur ist an (a) gebunden form: (COND ((ZEROP K) STRUKTUR) (T (KMAL (1,-INDENMAYER STRUKTUR) ( K 1)))) env: ((((K . 1) (STRUKTUR A)))) 2 2 form: (ZEROP K) 3 form: K 3 value: 1 2 value: NIL 2 form: T 2 value: T env: ((((K 1) (STRUKTUR A)))) 2 .
-
.
401 2
form: (KMAL (LINDENMAYER STRUKTUR) (- K 1)) env: ((((K 1 ) (STRUKTUR A)))) form: (LINDENMAYER STRUKTUR) 4 form: STRUKTUR 4 value: (A) 4 env: ((((STRUKTUR A)))) 4 form: (COND ((NULL STRUKTUR) NIL) ((ATOM STRUKTUR) (QUOTE FEHLER)) (T (LINDREGEL {CAR STRUKTUR) (CDR STRUKTUR)))) s env: ((((STRUKTUR A)))) s form: (NULL STRUKTUR) 6 form: STRUKTUR 6 value: (A) s value: NIL env: ((((STRUKTUR A)))) s s form: (ATOM STRUKTUR) 6 form: STRUKTUR 6 value: (A) s value: NIL s form: T s value: T s env: ((((STRUKTUR A)))) s form: (LINDREGEL (CAR STRUKTUR) (CDR STRUKTUR)) 6 env: ((((STRUKTUR A)))) 6 form: (CAR STRUKTUR) 7 form: STRUKTUR 7 value: (A) 6 value: A 6 env: ((((STRUKTUR A)))) 6 form: (CDR STRUKTUR) 7 form: STRUKTUR 7 value: (A) 6 value: NIL 6 env: ((((TAIL) (HEAD . A)))) 6 form: (COND ((ATOM HEAD) (APPEND (GET HEAD (QUOTE LINDREG)) (LINDENMAYER TAIL))) (T (CONS (LINDENMAYER HEAD) (LINDENMAYER TAIL)))) env: ((((TAIL) (HEAD . A)))) 7 7 form: (ATOM HEAD) 8 form: HEAD 8 value: A 7 value: T env: ((((TAIL) (HEAD . A)))) 7
3 3
.
402 form: (APPEND (GET HEAD (QUOTE LINDREG)) (LINDENMAYER TAIL)) env: ((((TAIL) (HEAD . A)))) 8 8 form: (GET HEAD (QUOTE LINDREG)) 9 form: HEAD 9 value: A 9 env: ((((TAIL) (HEAD . A)))) 9 form: (QUOTE LINDREG) 9 value: UNDREG 8 value: (B ? C) 8 env: ((((TAIL) (HEAD . A)))) 8 form: (LINDENMAYER TAIL) 9 form: TAIL 9 value: NIL env: ((((STRUKTUR)))) 9 9 form: (COND ((NULL STRUKTUR) NIL) ((ATOM STRUKTUR) (QUOTE FEHLER)) (T (LINDREGEL (CAR STRUKTUR) (CDR STRUKTUR)))) 10 env: ((((STRUKTUR)))) 10 form: (NULL STRUKTUR) 11 form: STRUKTUR 11 value: NIL 10 value: T 10 form: NIL 10 value: NIL 9 value: NIL 8 value: NIIL 7 value: (B ? C) 6 value: (B ? C) S value: (B ? C ) 4 value: (B ? C ) 3 value: (B ? C) 3 env: ((((K . 1) (STRUKTUR A)))) 3 form: ( K 1) 4 form: K 4 value: 1 4 form: 1 4 value: 1 3 value: 0 3 env: ((((K . 0) (STRUKTUR B ? C)))) 3 form: (COND ((ZEROP K) STRUKTUR) (T (KMAL (LINDENMAYER STRUKTUR) (- K 1)))) env: ((((K 0) (STRUKTUR B ? C)))) 4 4 form: (ZEROP K) 7
-
.
403 form: K S S value: 0 4 value: T form: STRUKTUR 4 4 value: (B ? C) 3 value: (B ? C) 2 value: (B ? C) 1 value: (B ? C) 0 value: (B ? C ) (B ? C ) ; Das Ergebnis der einmaligen Regelanwendung.
404
Beispielprogramm in der Programmiersprache PROLOG zu Kap. 3. 1 . 1 , S. 184 ff. u. Kap. 3. 2. 3, S. 301 ff. I• Die Datenbasis •I trans(qO, trans(qO, trans(q1, trans(q1, trans(q2, trans(q2, trans(q3, trans(q3,
0, qO).
1, q1). 0, q1).
1, q2). 0, q2).
1, q3). 0, q3). 1, q3).
startzustand(qO ). endzustand (q2). gewinner(qO). gewinner(ql ). gewinner(q2). I• Die Regeln •I automat-erwartet(Zustand, Zeichenkette):gewinner(Zustand), erwartet(Zustand, Zeichenkette). erwartet(Zustand, [ ] ) : gewinner(Zus tand). erwartet(Zustand, [ Zeichen I Restliste]) : trans(Zustand, Zeichen, Fo1gezustand), erwartet(Folgezustand, Restliste). automat-akzeptiert(Zustand, Zei�henkette) startzustand(Zustand), akzeptiert(Zustand, Zeichenkette ). akzeptiert(Zustand, [ ] ) : endzustand(Zustand ). akzeptiert(Zustand, [Zeichen I Restliste]) trans(Zustand, Zeichen, Folgezustand), akzeptiert(Folgezustand, Restliste).
405 LITERATURVERZEICHNIS ABELSON, Harold & SUSSMAN, Gerald Jay with Julie Sussman 1989: The Structure and Interpretation of Computer Programs. Cambrid ge, Mass.: MIT-Press, 198910 . ABELSON, Robert P. 1981: Psychological Status of the Script Concept. American Psychelogist (1981) 36: 715-729. AGMON, Eyton 1990: Music Theory as Cognitive Science: Some Concep tual and Methodological Issues. Music Perceotion (19'90) 7/3: 285-308. ALAGIC, Suad, & ARBIB, Michael A. 1978: The Design of Well-struc tured and Cerreet Programs. New York: Springer, 1978. ALLEN, John 1979: An Overview of LISP. Byte (1979) 8: 10 ff. AMES, C. 1987a: Music, AI in, pp. 638-642. In: Shapiro, S. (Ed.): En cyclopaedia of Artificial Intelligence. New York: Wiley, 1987. AMES, C. 1987b: Automated Composition in Retrospect. Leonardo (1987) 20/2: 169-185. ANDERSON, John R. & BOWER, Gordon H. 1973: Human Associative Memory. New York: Wiley & Sons, 1973. ANDERSON, John R. 1976: Language, Memory and Thought. Hillsdale, NJ: Erlbaum, 1976. ANDERSON, John R. 1978: Arguments Concerning Representations for Mental Imagery. Psychological Review (1978) 85/4: 249-277. ANDERSON, J. A.; SILVERSTEIN, J. W.; RITZ, S. A. & JONES, R. S. 1977: Distinctive Features, Categorical Perception, and Probability Learning: Some Applications of a Neural Model. Psychological Re view (1977) 84: 413-451. ANDERSON, J. A. & HINTON, G. E. 1981: Models of Information Pro cessing in the Brain. In: G. E. Hinton & J. A. Anderson (Eds.): Parallel Models of Associative Memory. Hillsdale, New Jersey: Erlbaum, 1981. ANDLER, Daniel & LIVET, Pierre 1989: Psychologie - Les sciences cog nitives: emergence d'une nouvelle constellation, pp. 341-345. En cyclopaedia Universalis France. UniversaHa 1989: La politique, !es connaissances, Ia culture en 1989. Paris: Encyclopaedia Universalis France, 1989. ANSCHÜTZ, Herbert 1970: Kybernetik. Würzburg: Vogel, 1970. ARBIB, Michael A. 1969a: Memory Limitations of Stimulus-Response Mo dels. Psychological Review (1969) 76/5: 507-510. ARBIB, Michael A. 1969b: Automata Theory as an Abstract Boundary Condition for the Study of Information Processing in the Nervous System, pp. 3-19. In: Leibovic, K. N. (Ed.): Information Processing in the Nervous System. Berlin/New York: Springer, 1969. System, pp. 3-19. In: Leibovic, K. N. (Ed.): Information Processing in the Nervous System. Berlin/New York: Springer, 1969.
406 ARB!B, Michael A. 1<J73: Automata Theory in the Context of Theoretical Neurophysiology, pp. 191-277. In: Rosen, Robert (Ed.): Foundations of Mathematical Biology, Vol. III. Supercellular Systems. New York: Academic Press, 1973. ARBIB, Michael 1975: From Automata Theory to Brain Theory. Interna tional Journal of Man Machine Studies (1975) 7: 279-295. ARBIB, Michael A. 1<J80: Visuomotor Coordination: From Neural Nets To Schema Theory. Cognition and Brain Theory (1980) 4/1: 23-39. ARBIB, Michael A. 1981: Perceptual Structures and Distributed Motor Control. In: Brooks, V. B. (Ed.): Handbook of Physiology - the Nervous System II. Motor control. American Physiological Society, 1981. ARBIB, Michael A.; KFOURY, A. J. & MOLL, Robert N. 1981: A Basis for Theoretical Computer Science. New York: Springer, 1981. ARBIB, Michael A. 1<J84: Computers and the Cybernetic Society. London: Academic Press, 2nd Ed. 1984. ARBIB, Michael A. 1<J87a: Levels of Modeling of Mechanisms of Visually Guided Behavior. Behavioral and Brain Seiences (1987) 10: 407-465. ARBIB, Michael A. 1987b: Modularity and Interaction of Brain Regions Underlying Visuo-Motor Coordination. In: Garfield, J. L. (Ed.): Modularity in Knowledge Representation and Natural Language Understanding. Bradford Book, 1987. ARBIB, Michael A. 1987c: Brains, Machines and Mathematics. Berlin: Springer, 1987. ARBIB, Michael A.; CONKLIN, E. Jeffrey & HILL, Jane 1987: From Schema Theory to Language Theory. New York: Oxford University Press, 1987. ARBIB, Michael 1989: The Metaphorical Brain 2. Neural Net:vorks and Beyond. New York: Wiley, 1989. ATLAN, Henri 1972: L'organisation biologique et la theorie de l'informa tion. Paris: Hermann, 1972. BABBITT, Milton 1960: Twelve-Tone Invariants as Compositional Deter minants . The Musical Quarterly (1960) 46: 246-259. BABBITT, Milton 1961: Set-Structure as a Compositional Determinant. Journal of Music Theory (1961) 5/1: ' 72-94. BACH, Johann Sebastian o. J.: Das Musikalische Opfer ( BWV 1079 ) . (Bach: Klavierwerke) Czerny, Griepenkerl & Roitsch (Eds.) Leip zig: C . F. Peters, neu rev. Ausg. o. J. BACH, Johann Sebastian o. J.: Musikalisches Opfer '( BWV 1079) . Im Ur text und einer Einrichtung für den praktischen Gebrauch hrsg. von Ludwig Landshoff. Leipzig: Edition Peters, o. J. mit Beilage: J. S. Bach: Musikalisches Opfer ( BWV 1079 ) . Beiheft zur Urtext-Aus-
407 gabe. Bemerkungen zur Textkritik und Darstellung des Werkes von Ludwig Landshoff. Leipzig: Edition Peters, 1937. BAGGI, Denis L. 1991a: Neurswing: An Intelligent Workbench for the ln vestigation of Swing in Jazz. IEEE Computer (1991) 2417: 60-64. BAGGI, Denis L. 1991b: Neurswing: A Connectionist Workbench for the lnvestigation of Swing in Afro-American Jazz. In: Hewlett, Walter B. & Eleanor Selfridge-Field (Eds.): Computing in Musicology. A Directory of Research (1991) 7: 85. BAKER, Michael 1989a: A Computational Approach to Modeling Musical Grouping Structure. Contemporary Music Review (1989) 3/4: 311-325. BAKER, Michael 1989b: An Artificial lntelligence Approach to Musical Grouping Analysis. Contemporary Music Review (1989) 3/1: 43-68. BAILY, John 1988: Anthropological and Psychological Approaches to the Study of Music Theory and Musical Cognition. Yearbook for Tra ditional Music (1988) 20/1: 114-124. BALABAN, Mira 1981: Toward a Computerized Analytical Research of Tonal Music. Dissertation, Rehovat, Weizmann Institute of Seien ce, 1981. BALABAN, Mira & MURRAY, Neil V. 1985: Machine Tongues X: Prolog. Computer Music Journal (1985) 9/3: 7-12. BALABAN, Mira 1986: A Formal Basis For Research in Theories of We stern Tonal Music. In: Laske, Otto E. (Ed.) : Cognitive Musicology. CC AI The Journal for the Integrated Study of Artificial Intelli gence, Cognitive Science and Applied Epistemology (1986) 3/3: 241-268. BALABAN, Mira 1989: The Cross Fertilization Between Music and AI (Based on Experience with the CSM Project). Interface (1989) 18: 89-115. BALZANO, Gerald J. 1980: The Group-Theoretic Description of Twel ve-fold and Mieretonal Pitch Systems. Computer Music Journal (1980) 4: 66-84. BALZANO, Gerald J. 1982: The Pitch Set as a Level of Description for Studying Musical Pitch Perception, pp. 321-351. In: Clynes, M. (Ed.): Music, Mind and Brain: The Neuropsychology of Music. New York: Plenum, 1982. BALZANO, Gerald J. 1986: What are Musical Pitch and Timbre. Music Perception (1986) 3: 297-314. BARBAUD, P. 1965: La composition automatique. Paris: Dunod. 1965 BARBAUD, P. 1968: La musique, discipline scientifique. Paris: Dunod, 1968. BARON!, Mario 1983: The Concept of Musical Grammar. Music Analysis (1983) 2: 175-208. BARON!, Mario & CALLEGARI, L. (Eds.) 1984: Musical Grammars and Computer Analysis. Atti del Convegno (Modena, 4-6 ottobre 1982)
408 Firenze: Olschki, 1984. BARR, Avron 1983: Cognition as Computation, pp. 237-262. In: Machlup, F. & Mansfield, V. (Eds.): The Study of Information: Interdiscipli nary Messages.. New York: Wiley, 1983. BARR, Avron & FEIGENBAUM, Edward 1981: The Handbock of Artificial Intelligence. Vol. I . Chapter 3: Representation of Knowledge, p. 141-222. Chapter 11: Models of Cognition. Vol. II Chapter 6 B: Programming Languages for Al-Research. LISP, P. 15-29. Vol. III Chapter 11: Models of Cognition, pp. 1-74. Stanford/Los Altos: HeurisTech Press/ William Kaufmann, 1981. BARTON, G. Edward; BERWICK, Robert C. & RISTADT, Eric Sven 1987: Computational Complexity and Natural Language. Cambridge, Mass.: MIT-Press, 1987. BATEL, Günther; KLEINEN, Günter & SALBERT, Dieter 1987: Compu termusik: Theoretische Grundlagen - Kompositionsgeschichtliche Zusammenhänge - Musiklernprogramme. Laaber: Laaber, 1987. BAUER, Friedrich L. & GOOS, Gerhard 1982: Informatik. Eine einfüh-· rende Übersicht. Erster Teil. Berlin: Springer, 3. völlig neu bear beitete und erweiterte Auflage 1982. BECKER, Alton & BECKER, Judith 1979: A Grammar of the Musical Genre Srepegan. Journal of Music Theory (1979) 23: 1-43. BEEH, Volker 1977: Der Begriff der Erzeugbarkeit. Germanistische Lin guistik (1977) 1-2: 52-87. BEL, Bernard 1990a: En finir avec l'ethnomusicologie?, pp. 453-464. In: Preprint of the Acts of the Conference "Music and Information Technology" - MAI 90 - 3-6 octobre, Marseille (France), 1990. BEL, Bernard 1990b: Aquisition et representation de connaissances en musique. Aix-Marseille, Th�se 1990. BEL, Bernard 1991: Polymetric processing. with BP2. In: Walter B. Hew lett & Eleanor Selfridge-Field (Eds.): Computing in Musicology (1991) 7: 78-79. BEL, Bernard o. J.: Langages formels, forme et musique. Programme de Recherche M.I.M. PR 323, Marseille o. J. BENESCH, Helmut 1988: Zwischen Leib und Seele. Grundlagen der Psy chokybernetik. Frankfurt a. M.: Fischer, 1988. BENGTSSON, I. 1974: Empirische Rhythmusforschung in Uppsala. Ham burger Jahrbuch ftir Musikwissenschaft (1974) 1: 195-219. BENGTSSON, I. & GABRIELSSON, A. 1980: Methods for Analyzing Per formance of Musical Rythm. Scandinavian Journal of Psychology (1980) 21: 257-268. BENGTSSON, I . & GABRIELSSON, A. 1983 : Analysis and Synthesis of Musical Rhythm, pp. 27-60. In: Sundberg, J. (Ed.): Studies of Mu sic Performance. Publications issued by the Royal Swedish Acade my of Music, No. 39. Stockholm, 1983.
409 BERTONI, A. ; HAUS, G.; MAURI, G . & TORELLI, M . 1978: A Mathe matical Model for Analysing and Structuring Texts. Interface (1978) 7: 31-43. BEYLS, Peter 1990: Musical Morphologies from Self-organizing Systems. Interface (1990) 19: 205-218. BHARUCHA, Jamshed J. 1984: Event Hierarchies, Tonal Hierarchies, and Assimilations. A Reply to Deutsch and Dowling. Journal of Expe rimental Psychology (1984) 133/3: 421-425. BHARUCHA, Jamshed J. 1985: Kognitive Musikpsychologie, pp. 123-132. In: Bruhn, Herbert & Oerter, Rolf & Rösing, Helmut (Eds.): Mu sikpsychologie. Ein Handbuch in Schlüsselbegriffen. München u.a.: Urban & Schwarzenberg, 1985. BHARUCHA, Jamshed J. 1987a: MUSACT: A Connectionist Model of Musical Harmony, pp. 508-517. Proceedings of the Ninth Annual Conference of the Cognitive Science Society. Hillsdale, New Jer sey: Erlbaum, 1987. BHARUCHA, Jamshed J. 1987b: Music Cognition and Perceptual Facilia tion: A Connectionist Framework. Music Perception (1987) 5/1: 1-30. BHARUCHA, Jamshed J. 1988: Neural Net Modeling of Music, pp. 173-182. Proceedings of the First Workshop on Artificial Intelli gence and Music. Menlo Park, California: American Association for Artificial Intelligence, 1988. BHARUCHA, Jamshed J. 1991: Cognitive and Brain Mechanisms in Per ceptual Learning, pp. 349-358. In: Sundberg, Johan; Lennart Nord & Rolf Carlson (Eds.): Music, Language, Speech and Brain. Pro ceedings of an International Symposium at the Wenner-Gren Center, Stockholm, 5-8 September 1990. London: Macmillan, 1991. BHARUCHA, Jamshed J. & TODD, Peter M. 1989: Modeling the Percep tion of Tonal Structure with Neural Nets. Computer Music Journal (1989) 13/4: 44-53. BHARUCHA, Jamshed J. & OLNEY, Katherine L. 1989: Tonal Cognition, Artificial Intelligence and Neural Nets. Contemporary Music Re view (1989) 4: 341-356. BICKEL, Peter 1990: NZ•Forum -Computer Musik (2): Vom Musiker zum Musik-Operator. Musikmaschinen in der Pop-Musik. Neue Zeit schrift für Musik (1990) 151/3: 3-7. BIRBAUMER, Nils 1975: Physiologische Psychologie. Eine Einführung an ausgewählten Themen. Für Studenten der Psychologie, Medizin und Zoologie. Berlin/Heidelberg/New York: Springer, 1975. BIRBAUMER, Nils & SCHMIDT, R. F. 1989: Psychobiologie. Berlin: Springer, 1989. BISCHOF, Norbert 1966: Erkenntnistheoretische Grundlagenprobleme der Wahrnehmungspsychologie, S. 21 - 78. In: Gottschaldt, K. & Lersch,
410
Ph. & Sander, F. & Thomae, H. (Eds.): Handbuch der Psychologie in 12 Bänden. 1 . Band. Metzger, Wolfgang (Ed.): Allgemeine Psy chologie. I. Der Aufbau des Erkennens. 1. Halbband: Wahrnehmung und Bewußtsein. Göttingen: Verlag fUr Psychologie, 1966. BLOCK, Ned (Ed.) 1981a: Readings in the Philosophy of Psychology I, II. Cambridge, Mass.: Harvard University Press, 1981. BLOCK, Ned 1981b: Introduction: What is Functionalism?, 171-184. In: Block, Ned (Ed.): Readings in the Philosophy of Psychology. Cam bridge, Mass.: Harvard University Press, 1981. BLOCK, Ned 1981c: Troubles with Functionalism, pp. 268-305. In: Block, Ned (Ed.): Readings in the Philosophy of Psychology. Cambridge, Mass.: Harvard University Press, 1981. BLOCK, Ned (Ed.) 1981d: Imagery. Cambridge, Mass.: MIT, 1981. BOBROW, Daniel & COLLINS, Allan (Eds.) 1975: Representation and Understanding. Studies in Cognitive Science. New York: Academic Press, 1975. BODEN, Margaret 1987: Artificial Intelligence and Natural Man. Has socks: Harvester, 1987. BORETZ, Benjamin A. 1969: Meta-Variations I: Studies in the Foundati ons of Musical Thought. Perspectives in New Music (1969) 8/1: 1-74 BORETZ, Benjamin A. 1970a: Meta-Variations li: Sketch of a Musical Sy stem. Perspectives in New Music (1970) 8/2: 49-111. BORETZ, Benjamin A. 1970b: Meta-Variations III: The Construction of Musical Syntax. Perspectives in New Music (1970) 9/1: 23-42, (1971) 10: 232-270. BORETZ, Benjamin A. 1972: Meta-Variations IV: Analytical Fallout. Per spectives in New Music (1972) 11/1: 146-223. BORETZ, Benjamin A. 1973: Meta-Variations V: Analytical Fallout II. Perspectives in New Music (1973) 11/2: 156-203. BORETZ, Benjamin A. 1989: The Logic of What? Journal of Music The ory (1989) 33/1: 107-116. BOTEZ, M. I. & BOTEZ, T. H. & AUBE, M. 1983: La neuromusicologie, partie integrante de Ja neuropsychologie clinique. L'Union Medicale du Canada (1983) 112/4: 1-7. BRACHMAN, R. 1979: On the Epistemological Status of Semantic Net works. In: Findler, N. V. (Ed.): Associative Networks: Representa tion and Use of Knowledge by Computers. New York: Academic Press, 1979. BRAITENBERG, Valentin 1986: Künstliche Wesen: Verhalten kyberneti scher Vehikel. Braunschweig/Wiesbaden: Vieweg, 1986. BRAND, Stewart 1990: MEDIA LAB. Computer, Kommunikation und neue Medien - Die Erfindung der Zukunft am MIT. Reinbek: Rowohlt, 1990. BRANDL, Rudolf 1985: Some Aspects of Oral History in Consideration of
411 Musical Traditions from Africa and Levante - Based on a Neuro semiotical Approach. International RASM (1985) 16/1: 3-42. BRATKO, Ivan 1986: PROLOG. Programming for Artificial Intelligence. Reading, Mass.: Addison-Wesley, 1986. BREDENKAMP, J. & GRAUMANN, C. F. 1973: Möglichkeiten und Gren zen mathematischen Verfahrens in den Verhaltenswissenschaften, pp. 51-93. In: Gadamer, Hans Georg & Vogler, Paul (Eds.): Psychologische Anthropologie. (Neue Anthropologie, Bd. 5), Stuttgart: Thieme 1973. BREGMAN, A. S. & CAMPBELL, J. 1971: Primary Auditory Stream Se gregation and the Perception of Order in Rapid Sequences of To nes. Journal of Experimental Psychology (1971) 89: 244-249. BREGMAN, A. S. 1990: Auditory Scene Analysis: The Perceptual Organi zation of Sound. Cambridge, Mass.: MIT-Press, 1990. BREGMAN, A. S. 1991: Using Brief Glimpses to Decompose Mixture, pp. 284-293. In: Sundberg, Johan; Lennart Nord & Rolf Carlson (Eds.): Music, Language, Speech and Brain. Proceedings of an Internatio nal Symposium at the Wenner-Gren Center, Stockholm, 5-8 Sep tember 1990. London: Macmillan, 1991. BRENTANO, Franz 1874/1973: Psychologie vom empirischen Standpunkt. Leipzig, 1874. Hamburg: Meiner, 1973. BROWN , Matthew & DEMPSTER, Douglas J. 1989: The Scientific Image of Music Theory. Journal of Music Theory (198'9) 33: 65-106. BRÜDERLEIN, Rene 1978: Akustik für Musiker. Eine Einführung für Ler nende, Ausübende und Musiker. Regensburg: Bosse, 1978. BRUHN, Herbert 1988: Harmonielehre als Grammatik der Musik. Propo sitionale Schemata in Musik und Sprache. München/Weinheim: Psychologie Verlagsunion, 1988. BRUHN, Herbert; OERTER, Rolf & Helmut RÖSING (Eds.) 1985: Mu sikpsychologie: Ein Handbuch in Schlüsselbegriffen. München: Ver lagsunion Psychologie, 1985. BUHLERT, Klaus 1987: Computer in der Musik, pp. 141-161. In: Marhold, Gerhard (Ed.): Künstliche Intelligenz. Wesen und Bedeutung neuer Computerleistungen. Düsseldorf: VDI, 1987. BURBAT, Wolf 1988: Die Harmonik des Jazz. München/Kassel: Deut scher Taschenbuch Verlag & Bärenreiter Verlag, 1988. BURKS, Arthur W. 1972/73: Logic, Computers, and Men. Proceedings and Addresses of the American Philosophical Association (1972-73) 46: 39-57. BURKS, Arthur W. 1977: Chance, Cause, Reason. An Inquiry into the Nature of Scientific Evidence. Chicago/London: Chicago University Press, 1977. BURKS, Arthur W. 1986: A Radically Non-Von-Neumann Architecture for Learning and Discovery, pp. 1-17. Lecture Notes in Computer Science, 237. Berlin: Springer, 1986.
412 CAJAL, Rarnon y 1933: Neuronismo o reticularismo? las pruebas objecti vas de Ia unidad anatomica de las celulas nervosiosas, 1933. CAMILLERI, Lelio 1986: A Computational Theory of Music. Paper pre sented at the International Colloquium on Basic Concepts in Stu dies of Musical Signification, July 21-23 1986, Imatra, Finland. Erschienen in: Seboek, T. & Seboek, J. (Eds.): Semiotic Web '86: A Yearbook of Semiotic. Berlin: de Gruyter, 1987 CAMILLERI, Lelio; CARRERAS, F. ; GROSSE, P. & NENCINI, G. 1987: A Software Tool for Music Analysis. Interface (1987) 16/1-2: 28-38. CAMILLERI, Lelio 1'989: A Modular Approach to Music Cognition. In terface (1989) 18: 33-44. CAMILLERI, Lelio 1990: An Expert System Prototype for the Study of Musical Segmentation. Interface (1990) 1912-3: 147-154. CAMURRI , Antonio 1<J84: Un Linguaggio per la Descrizione e la Esecu zione di Processi Musicali Barsato sulle Reti di Petri. Master Thesis DIST, Univerität Genua, 1984. CAMURRI, Antonio ; HAUS, Goffredo & ZACCARIA, Renato 1986a: Describing and Performing Musical Processes by Means of Petri Nets. Interface (1986) 15: 1-23. CAMURRI, Antonio; HAUS, Goffredo & ZACCARIA, Renato 1986 b : Desribing and Performing Musical Processes, pp. 335-375. In: Mo rasso, P. & Tagliasco, V. (Eds.): Human Movement Understanding. From Computational Geometry to Artificial Intelligence (Advances in Psychology Bd. 33; Eds. G. E. Stelmach & Vroon, P. A.): Am sterdam: North-Holland, 1986. CAMURRI, Antonio ; GIACOMINI, M . ; PONASSI, A. & ZACCARIA, R. 1988: Key-Music: An Expert System Environment for Music Com position, pp. 119-126. Lischka, Christoph & Fritsch, Johannes (Eds.) Proceedings of the 14th International Computer Music Conference, Cologne, September 20-25, 1988. Köln: Feedback, 1988. CAMURRI, Antonio 1990: On the RoJe of Artificial Intelligence in Music Research. Interface (1990) 1912-3: 219-248. CAMURRI, Antonio; FRIXIONE, Marcello & ZACCARIA, Renato 1990: A Music Knowledge Representation System Combining Symbolic and Analogie Approaches, pp. 385-394. Preprint of the Acts of the Conference "Music and Information Technology" - MAI 90 - 3-6 octobre, Marseille (France), 1990. CAMURRI, Antonio 1991: HARP: A System for Intelligent Composer's Assistance. IEEE Computer (1991) 2417: 64-67. CARNAP, Rudolf 1951: Logical Foundations of Probabi1ity. 2nd ed.Chicago: The Universitv Of Chicago Press, 1951. CAZIMIR, Bogdan 1975: Une approche linguistique-mathemathique de Ja se miologie musicale, pp. 981-984. In: Chatman, Seymour & Eco, Umberto & Klinkenberg, Jean-Marie (Eds.): A Semiotic Landscape. Procee-
413 dings of the First International Congress of the International Associa tion for Semiotic Studies. Milan, June 1974. The Hague: Mouton, 1975. CAZIMIR, Bogdan 1976: Semiologie musicale et linguistique mathemati que. Semiotica (1976) 15/1: 48-57. CHAMBERS, J.A. & SPRECHER, J. W. 1980: Computer Assisted In struction: Current Trends and Critical Issues. Communications of the ACM (1980) 23: 332-342. CHARNIAK, Eugene 1984: Cognitive Science is Methodological Fine, pp. 263-276. In: Kintsch, W.; Miller, J. & Polson, P. (Eds.): Methods and Tactics in Cognitive Science. Hillsdale, New Jersey: Erlbaum, 1984. CHARNIAK, Eugene & McDERMOTT, Drew 1985: Introduction to Artifi cial Intelligence. Reading, Mass.: Addison-Wesley, 1985. CHEMILLIER, Mare 1990: Langages musicaux et automates - la rationa Hte du Iangage serie l , pp. 303-318. In: Preprint of the Acts of the Conference "Music and Information Technology" - MAI 90 3-6 octobre, Marseille (France), 1990. CHEN, Matthew Y. 1983: Toward a Grammar of Singing: Tune-Text As sociation in Gregorian Chant. Music Perception (1983) I : 84-122. CHEW, Stephen L.; LARKEY, Leah S.; SOLI, Sigfrid D.; BLOUNT, Joe & JENKENS, James J. 1982: The Abstraction of Musical Ideas. Memory & Cognition (1982) 10/5: 413-423. CHISHOLM, Roderick 1958: Sentences about Believing, pp. 510-520. In: Feig!, H. & Scriven, M. & Grover, M. (Eds.): Minneseta Studies in the Philosophy of Science, Vol. II. Concepts, Theories and the Mind-Body Problem. Minneapolis: University of Minneseta Press, 1958. CHISHOLM, Roderick & SELLARS, W. 1958: Chisholm-Sellars Corre spondence on Intentionality, pp. 521-539. In: Feiigl, H . ; Scriven, M. & Grover, M. (Eds.): Minneseta Studies in the Philosophy of Science, Vol. II. Concepts, Theories and the Mind-Body Problem. Minneapolis: University of Minneseta Press, 1958. CHOMSKY, Noam 1956/1975: The Logical Structure of Linguistic Theo ry. New York, London: Plenum Press, 1975. CHOMSKY, Noam 1957/1965: Syntactic Structures. London, The Hague, Paris: Mouton, 5 th ed., 1965. CHOMSKY, Noam 1959: On Certain Formal Properties of Grammars. In formation and Control (1959) 2: 137-167. CHOMSKY, Noam 1959/1964: A Review of Skinner's Verbal Behavior. Language (1959) 35/1: 26-58. CHOMSKY, Noam 1963: Formal Properties of Grammars, pp. 323-418. Luce, R. D., Bush, R. & Galanter, E. (Eds): Handbook of Ma thematical Psychology, Vol. II. New York: Wiley, 1963. CHOMSKY, Noam 1961 /1964: On the Notion "Rule of Grammar", pp.
414 119-136. Proceedings of the 12. Symposium on Applied Mathematics (1961) 12: 6-24. Wieder abgedruckt in: Fodor, J.A. & Katz, J. J. (Eds): The Structure of Language. Readings in the Philosophy of Language. Englewood Cliffs: Prentice Hall, 1964. CHOMSKY, Noam & MILLER, George A. 1963: Introduction to the For mal Analysis of Natural Languages. Duncan, L . ; Bush, Robert R. & Galanter, E. (Eds): Handbook of Mathematical Logic. New York: Wiley, 1963. CHOMSKY, Noam 1965: Aspects of the Theory of Syntax. Cambridge, Mass., MIT-Press, 1965. CHOMSKY, Noam 1966/1971: Cartesianische Linguistik. Ein Kapitel aus der Geschichte des Rationalismus. Tübingen: Niemeyer, 1971. Car tesian Linguistics. A Chapter in the History of Rationalist Thought. New York: Harper & Row, 1966. CHOMSKY, Noam 1980: Rules and Representations. Columbia University Press, 1980. CLARKE, Eric F. 1982: Timing in the Performance of Erik Satie's 'Ve xations'. Acta Psychologica (1982) SO: 1-19. CLARKE, Eric F. 1985: Some Aspects of Rhythm and Expression in Performance of Eric Satie's 'Gnossienne No. 5'. Music Perception (1985) 2/3: 299-328. CLARKE, Eric F. 1986: Theory, Analysis and the Psychology of Music: A Critica1 Evaluation of Lerdahl, F. and Jackendoff, R.,.. A Gene rative Theory of Music. Psychology of Music (1986) 14: 3-16. CLARKE, Eric F. 1987: Levels of Structure in the Organization of Mu sical Time. Contemporary Music Review (1987) 2: 211-238. CLARKE, Eric F. 1988: Generative Principles in Music Performance, pp. 1-26. In: Sloboda, John A. (Ed): Generative Processes in Music. The Psychology of Performance, Improvisation, and Composition. Oxford: Clarendon Press, 1988. CLASSEN, Peter 1976: Algebraische und automatentheoretische Grundla gen generativer Konstituentenstrukturgrammatiken. Frankfurt a. M.: Lang, 1976. COHEN, Joel E. 1966: Information Theory and Music. Behavioral Science (1962) 7: 137-163. COKER, Jerry 1985: Improvising Jazz. Rottenburg: advance music, 1985. (engl.) lmprovising Jazz. Englewood Cliffs, New Jersey: Prentice Hall, 1964. COLBY, Kenneth Mark 1971: Mind and Brain, Again. Mathematical Bio sciences (1971) 11: 4 7-52. COLBY, Kenneth 1978: Mind Models. An Overview of Current Work. Mathematical Bioseiences (1978) 39: 159-185. COOK, Nicholas 1989: Music Theory and 'Good Comparison': A Viennese Perspective. Jomnal of Music Theory (1989) 33/1: 117-142.
415 COPE, David 1987: An Expert System for Computer-assisted Compositi on. Computer Music Journal (1987) 1114: 30-46. COPE, David 1989: Experiments in Musical Intelligence (EMI): Non-Li near Linguistic-based Composition. Interface (19 89) 18: 117-139. COPE, David 1991a: Computers and musical style. Oxford: Oxford Univer sity Press, 1991. COPE, David 1991b: Recombinant Music. Using the Computer to Explore Musical Style. IEEE Computer (1991) 24/7: 22-28. COURTOT, Francis 1990: Representation evolutive pour l'aide a la com position, pp. 343-361. In: Preprint of the Acts of the Conference "Music and Information Technology" - MAI 90 - 3-6 octobre, Marseille (France), 1990. COWAN, Jack D. & SHARP, David H. 1988: Neural Nets and Artificia1 Intelligence, pp. 84-121. In: Graubard, Stephen R . (Ed.): The Arti ficial lntelligence Debate. False Starts, Real Foundations. Cam bridge, Mass.: MIT-Press, 1988. CRAIK, Kenneth 1943: The Nature of Explanation. Cambridge: Cambridge University Press, 1943. COY, Wolfgang 1988: Aufbau und Arbeitsweise von Rechenanlagen. Eine Einführung in Rechnerarchitektur und Rechnerorganisation für das Grundstudium Informatik. Braunschweig: Vieweg, 1988. CREUTZFELDT, 0. D. 1983: Cortex cerebri. Leistung, strukturelle und funktionelle Organisation der Hirnrinde. Berlin: Springer, 1983. CRICK, F. & ASANUMA, C. 1988: Certain Aspects of the Anatomy and Physiology of the Cerebra! Cortex, pp. 333-371, Chapter 20. In: McClelland, James & Rumelhart, David E., and the POP Research Group: Parallel Distributed Processing. Explorations in the Micro structure of Cognition. Volume 2: Psychological and Biological Models. Cambridge, Mass.: MIT Press, 1988 7 . DAHLHAUS, Car1 1971: Musiktheorie, pp. 9 3 - 132. In: Dahlhaus, Carl (Ed.): Einführung in die systematische Musikwissenschaft. Köln: Gerig, 1971. DAHLHAUS, Carl 1984: Die Musiktheorie im 18. und 19. Jahrhundert. Erster Teil. Grundzüge einer Systematik. In: Zaminer, Frieder (Ed.): Geschichte der Musiktheorie, Bd. 10. Darmstadt: Wissen schaftliche Buchgesellschaft, 1984. DAHLHAUS, Carl 1985: Was heißt "Geschichte der Musiktheorie"?, pp. 8-39. In: Zaminer , Frieder (Ed.): Geschichte der Musiktheorie. Ideen zu einer Geschichte der Musiktheorie. Einleitung in das Ge samtwerk, Bd 1. Darmstadt: Wissenschaftliche Buchgesellschaft, 1985. DAHLHAUS, Carl 1989: Die Musiktheorie im 18. und 19. Jahrhundert. Zweiter Teil. Deutschland. In: Zaminer, Frieder (Ed.): Geschichte
416 der Musiktheorie, Bd. 11. Darmstadt: Wissenschaftliche Buchge sellschaft, 1989. DALEN, Dirk van 1983: Algorithms and Decision Problems: A Crash Co urse in Recursion Theory, pp. 409-478. In: Gabbay, G. & Guenthner, F. (Eds.): Handbock of Philosophical Logic, Vol. I. Elements of Classical Logic. Dordrecht: Reidel, 1983. DAVIS, Randall & KING, Jonathan 1977: An Overview of Production Sy stems. Machine Intelligence (1977) 8 : 300-332. DEGLI ANTONI & HAUS, Goffredo 1983: Music and Causality . Procee dings of the 1983 International Computer Music Conference, San Francisco: Computer Music Association, 1983. DEGLI ANTONI, Giovanni & HAUS, Goffredo 1985: Netzrepräsentationen von Musikstücken, pp. 141-148. In: Bruhn, Herbert; Oerter, Rolf & Rösing, Helmut (Eds.): Musikpsychologie: Ein Handbuch in Schlüsselbegriffen. München: Verlagsunion Psychologie, 1985. DELIEGE, Irene 1985: Perception des formations elementaires de Ia mu sique. Voies de recherche de Ia psychologie cognitive. Analyse Musicale (1985) 4 : 20-28. DELIEGE, Irene 1987: Grouping Conditions in Listening to Music: An Approach to Lerdahl & Jackendoff's Grouping Preference Rules. Music Perception (1987) 4/4: 325-360. DESAIN, Peter 1990: LISP as a Second Language: Functional Aspects. Perspectives of New Music (1990) 28/1: 192-222. DESAIN, Peter & HONING, Henkjan 1989: Report on the First AlM Conference Sankt Augustin, Germany September 1988. Perspecti ves of New Music (1989) 27/2: 282-289. DEUTSCH, Diana 1980 : Music Perception. The Musical Quarterly (1980) 66/2: 165-179. DEUTSCH, Diana & FEROE, John 1981: The Interna! Representation of Pitch Sequences in Tonal Music. Psychological Review (1981) 88/6: 503-522. DEUTSCH, Diana (Ed.) 1982: The Psychology of Music. New York: Aca demic Press, 1982. DEUTSCH, Diana 1984: Two Issues Concerning Tonal Hierarchies: Com ment on Castellano, Bharucha and Krumhansl. Journal of Ex perimental Psychology (1984) 112/3: 413-416. DIEKMANN, Bernhard 1987: Die Entwicklung der Informationstechnik Anforderungen an die Weiterbildung. Auswirkungen auf den Ar beitsmarkt und das Bildungswesen, pp. 91 ff. In: Marhold, Gerhard (Ed.): Künstliche Intelligenz. Wesen und Bedeutung neuer Compu terleistungen. Düsseldorf: VDI, 1987. DOLSON, Mark 1989: Machine Tongues XII: Neural Networks. Computer Music Journal (1989) 13/3: 28-40. DORAN, James 1971: Some Recent Models of the Brain. Machine Intelli-
417
gence (1971) 6: 207-220. DOWLING W. J. 1978: Sca1e and Contour: Two Components of a Theory of Memory for Melodies. Psychological Review (1978) 84/4: 34} -354. DOWLING, W. J. 1979: The Cognitive Psychology of Music. Humanities Association Review (1979) 30: 58-68. DOWLING, W. J. 1984: Assimilation and Tonal Structure: Comment on Castellano, Bharucha and Krumhansl. Journal of Experimental Psy chology (1984) 113/3: 417-420. DOWLING, W. J. & HARWOOD, D. 1986: Music Cognition. New York: Academic Press, 1986. DRETSKE, Fred 1969: Seeing and Knowing. Chicago: Chicago University Press, 1969. DREYFUSS, Hubert L. 1985: Die Grenzen der künstlichen Intelligenz. Was Computer nicht können. Königstein, 1985. DUDEL, J. 1972: Erregung von Nerv und Muskel, pp. 19-70. In: Schmidt, R. F. (Ed.): Grundriß der Neurophysiologie. Berlin: Springer, 1972. EBCIOGLU, Kemal 1986: An Expert System for Chorale Harmonization, pp. 784-788. National Conference on Artificial lntelligence. Phila delphia: American Association of Artificial Intelligence (AAAI), 1986. EBCIOGLU, Kemal 1988: An Expert System for Harmonizing Four-part Chorales. Computer Music Journal (1988) 12/3: 43-51. ECKEL, Kurt 1982: Der Anteil der Sinnesphysiologie an der menschlichen Hörwelt, pp. 55-84. In: Harrer, Gerhart (Ed.): Grundlagen der Musiktherapie und Musikpsychologie. Stuttgart: Fischer, 1982. ECKMILLER, Rolf & MALSBURG, Christoph v. d. 1988 (Eds.): Neural Computers. Berlin: Springer, 1988. EDELMAN, Gerald M. & MOUNTCASTLE, Vernon B. 1978: The Mindful Brain. Cortical Organization and the Group-Selective Theory of Higher Brain Function. Cambridge, Mass.: MIT Press, 1978. EHRENFELS, Christian von 1890: Über "Gestaltqualitäten". Vierteljahres schrift für wissenschaftliche Philosophie (1890) 14: 249-292. ERMAN, L. D. & V. R. LESSER 1980: The HEARSEY 11 System: A Tu torial, pp. 361-381. In: Lea, W. A. (Ed.): Trends in Speechrecog nition. Prentice Hall, 1980. FALTIN, Peter 1971: Musikalische Syntax. Ein Experiment zum Problem des musikalischen Sinngehaltes. Arch.iv flir Musikwissenschaft (1977) 34: 1-19. FALTIN, Peter 1979: Phänomenologie der musikalischen Form. Eine expe rimentalpsychologische Untersuchung zur Wahrnehmung des musi kalischen Materials und der musikalischen Syntax. Wiesbaden: Steiner, 1979. FALTIN, Peter 1985: Bedeutung ästhetischer Zeichen: Musik und Sprache.
418 Nauck-Börner, Christa (ED.): Aachener Studien zur Semiotik und Kommunikationsforschung, Bd. I . Aachen: Raader, 1985. FALTIN, Peter 1990: Musikalische Syntax: Die bedeutunggebende Rolle der tönenden Beziehungen, pp. 152-160. Karbusicky, Vladimir (Ed.): Sinn und Bedeutung der Musik. Texte zur Entwicklung musiksemiotischen Denkens. Darmstadt: Wissenschaftliche Buchge sellschaft, 1990. FEDER, Georg 1978: Zur Situation der Musikforschung, pp. 163-178. In: Flashar, Hellmut; Lobkowitz, Nikolaus & Pöggeler, Otto (Eds.): Geisteswissenschaft als Aufgabe. Kulturpolitische Perspektiven und Aspekte. Berlin: de Gruyter, 1978. FEDER, Georg 1980: Empirisch-experimentelle Methoden in der Musik forschung. Kritische Bemerkungen zur Kompetenz und Eigenstän digkeil der Systematischen Musikwissenschaft und zur Relevanz einiger ihrer Ergebnisse. Musikforschung (1980) 33: 409-431. FISCHER, Michael D. 1986: Expert Systems in Anthropological Analysis. Bulletin of Information on Computing and Anthropology (1986) 4/3: 6-14. FLECHTNER, Hans Joachim 1968: Grundbegriffe der Kybernetik. Stutt gart: Wissenschaftliche Verlagsgesellschaft, 1968 3 . FLENDER, Reinhard 1987: Musikerziehung mit Hilfe von Computerpro grammen, pp. I 59-168. In: Batel, Günther; Kleinen, Günter & Sal bert, Dieter: Computermusik: Theoretische Grundlagen - Komposi tionsgeschichtliche Zusammenhänge - Musiklernprogramme. Laaber: Laaber, 1987. FLOROS, Constantin '1986: Über den Motivbegriff in der Musikwissen schaft. Studien zur Systematischen Musikwissenschaft. Hamburger Jahrbuch für Musikwissenschaft (1986) 9: 209-221. FODOR, Jerry A. & KATZ, Jerrold J. 1964: The Structure of Language. Readings in the Philosophy of Language. Englewood Cliffs: Prentice Hall, 1964. FODOR, Jerry A. 1981: Das Leib-Seele-Problem. Spektrum der Wissen schaft, (1981) März: 27-37. FODOR, Jerry A. & PYLYSHYN, Zenon W. 1988: Connectionism and Cognitive Architecture: A Critical Analysis. Cognition (1988) 28: 3-71. FÖRSTER, Heinz von 1967: Computation in Neural Nets. Currents in Mo dern Biology (196 7) 1: 4 7-93. FÖRSTER, Heinz von 1985: Über das Konstruieren von Wirklichkeiten, pp. 25-41. In: Förster, Heinz von: Sicht und Einsicht. Versuche zu einer operativen Erkenntnistheorie. Braunschweig/Wiesbaden: Vie weg & Sohn, 1985. FOKKER, Adrain D. 1975: New Music with 31 Notes. Bonn: Verlag für systematische Musikwissenschaft, 1975. FORTE, Allen 1959: Schenker's Conception of Musical Structure. A Re-
419 view and an Apraisal with References to Current Problems in Music Theory. Journal of Music Theory (1959) 3/1: 1-30. FORTE, Allen 1962: Tonal Harmony in Concept and Practice. New York: Holt, 1962. FORTE, Allen 1964: A Theory of Set-Complexes for Music. Journal of Music Theory (1964) 8/2: 136-183. FORTE, Allen 1973: The Structure of Atonal Music. 2nd ed. New Haven, London: Yale University Press, 1973. FRANKEL, Robert E.; ROSENSCHEIN, Stanley J. & SMOLIAR, Stephen W. 1976: A LISP-Based System for the Study of Schenkerian Analysis. Computers and the Humanities (1976) 10: 21-32. FRANKEL, Robert E.; ROSENSCHEIN, Stanley J. & SMOLIAR, Stephen W. 1978: Schenker's Theory of Tonal Music - Its Explication through Computational Processes. International Journal of Man Machine Studies (1978) 10: 121-138. FREKSA, Christian 1989: Wissensdarstellung und Kognitionsforschung. ln formationstechnik it (1989) 31/2: 134-140. FU, K. S. 1974: Syntactic Methods in Pattern Recognition. New York, 1974. GABRIELSSON, Alf 19�1: Music Psychology - A Survey of Problems and Current Research Activities, pp. 7-79. Basic Musical Functions and Musical Ability. Papers given at a Seminar Arranged by The Royal Swedish Academy of Music. Stockholm, February 1981. GABRIELSSON, Alf; BENGTSSON , I. & GABRIELSSON, B . 1983: Per formance of Musical Rhythm in 3/4 and 6/8 Meter. Scandinavian Journal of Psychology (1983) 24: 193-213. GABRIELSSON, Alf 1988: Timing in Music Performance and its Relations to Music Experience, pp. 27-51. In: Sloboda, John A. (Ed.): Ge nerative Processes in Music. The Psychology of Performance, Im provisation, and Composition. Oxford: Clarendon Press, 1988. GALE, Richard M . 1967: Propositions, Judgements, Sentences and State ments, pp. 494-505. In: Paul Edwards (Ed.): The Encyclopedia of Philosophy, Vol. 6. New York: Macmillan Company & Free Press, 1967. GANDY, Robin 1988: The Confluence of Ideas in 1936, pp. 55-111. In: Herken, Rolf (Ed.): The Universal Turing Machine - A Half-Cen tury Survey. Berlin: Kammerer & Unverzagt, 1988. GANTER, B.; HENKEL, H. & WILLE, R. 1985: MUTABOR - ein rech nergesteuertes Instrument zur Untersuchung von Stimmungen. Aku stica (1985) 57: 284-289. GANZHORN, Karl & WALTER, Wolfgang 1968: Technik der Datenverar beitung. Studium Generale (1968) 21: 828-858. GARDNER, Howard 1985/1989: Dem Denken auf der Spur. Der Weg der Kognitionswissenschaft. Stuttgart: Klett-Cotta, 1989. GASSER, Les 1991: Social Conceptions of Knowledge and Action: DAI Foun-
420 dations and Open Systems. Artificial Intelligence (1991) 47: 107-138. GAZZANIGA, Michael S. (Ed.) 1984: Handbook of Cognitive Neuroscien ce. New York: Plenum, 1984. GERKE, Peter R. 1987: Wie denkt der Mensch? Informationstechnik und Gehirn. New York: Springer, 1987. GJERDINGEN, Robert 0. 1990: Categorization of Musical Patterns by Self-Organizing Neuronlike Networks. Music Perception (1990) 7/4: 339-369. GÖSSEL, Michael 1972: Angewandte Automatentheorie. Bd. I: Grundbe griffe. Berlin: Akademie-Verlag, 1972. GOLDSTEIN, lra & PAPERT, Seymour 1977: Artificial Intelligence, Lan guage, and the Study of Knowledge. Cognitive Science (1977) 1 : 84-123. GOODENOUGH, Ward 1957: Cultural Anthropology and Linguistics, pp. 16 7-173. In: Garvin, Paul (Ed.): Report of the Seventh Annual Round Table Meeting on Linguistics and Language Study. Mono graph Series on Languages and Linguistics 9, 1957. GOODMAN, Nelson 1973: Die Sprachen der Kunst. Ein Ansatz zu einer Symboltheorie. Frankfurt a.M.: Suhrkamp, 1973. GORDON, John W. 1985: System Architectures for Computer Music. As sociation for Computing Machinery Computing Surveys (1985) 17/2: 191-235. GRABNER, Hermann 1974: Handbuch der funktionellen Harmonielehre. Regensburg: Bosse, 197 47 . GRAUBARD, Stephen R. (Ed.) 1988: The Artificial Intelligence Debate. False Starts, Real Foundations. Cambridge, Mass.: MIT-Press, 1988. GREGORY, Richard L. 1974: Choosing a Paradigm for Perception, pp. 255-283. In: Carterette, E. & Friedmann, M. (Eds.): Handbook of Perception. Vol. I: Historical and Physiological Roots of Per ception. New York: Academic Pt:ess, 1974. GREUSSAY, Patrick 1972: Un modele informatique de Ia structure musi cale. Paris/Vincennes, decembre. Recherche Linguistique (1972) 1 : 89-128. GREUSSAY, Patrick 1973: Modeles de descriptions symboliques en analy se musicale. Dissertation, Universität Paris VIII, 1973. GREUSSAY, Patrick 1985: Exposition ou exploration: Graphes Beethove niens, pp. 165-296. In: Machover, Tod (Ed.): Quoi ? Quand ? Comment ? La Recherche Musicale. Paris: Bourgois, 1985. GREUSSAY, Patrick 1988: L'ordinateur cellulaire. La Recherche (1988) 204/19: 1320-1330. GROSS, Maurice 1972: Mathematical Models in Linguistics. Englewood Cliffs, New Jersey: Prentice Hall, 1972. GRÜSSER, 0. J. 1976: Grundlagen der neuronalen Informationsverarbei tung in den Sinnesorganen und im Gehirn, pp. 234-273. In: Schindler, S. & Giloi, W. K. (Eds.): Informatik-Fachberichte, Bd.
421 16. Berlin: Springer, 1976 HABEL, Christopher 1986: Prinzipien der Referentialität. Untersuchungen zur propositionalen Repräsentation von Wissen. New York: Sprin ger, 1986. HAECKEL, Ernst 1899/1984: Die WelträtseL Gemeinverständliche Stu dien über monistische Philosophie. Stuttgart: Kröner, 1984. HÄNDLER, Wolfgang 197 4: Automatentheorie, pp. 63-88. In: Steinbuch, Kar! & Weber, W.: Taschenbuch der Informatik in drei Bänden. Bd. II: Struktur und Programmierung von EDV-Systemen. Berlin: Springer, 1974. HALL PARTEE, Barbara 1978: Fundamentals of Mathematics for Lingui stics. Dordrecht: Reidel, 1978. HALLE, Morris & STEVENS, Kenneth N. 1964: Speech Recognition: A Model and a Program for Research, pp. 604-6I2. In: Fodor, J.A. & Katz, J. J. (Eds): The Structure of Language. Readings in the Phi losophy of Language. Englewood Cliffs: Prentice Hall, 1964. HANDEL, Stephen 1989: Listening: An Introduction to the Perception of Auditory Events. Cambridge, Mass.: MIT-Press, 1989. HANDSCHIN, Jacques 1948: Der Toncharakter. Zürich: Atlantis, 1948. HARTMANN, William M. 1988: Pitch Perception and the Segregation and Integration of Auditory Entities, pp. 623-645. In: Gerald M. Edel man, W. Einar Gall & W. Maxwell Cowan (Eds.), Auditory Func tion. Neurobiological Basis of Hearing. New York: Wiley & Sons, 1988. HAUS, Goffredo & RODRIGUEZ, Antonio 1988: Music Description and Processing by Petri Nets. In: Grzegorz Rozenberg (Ed.), Advances in Petri Nets 1988, (Lecture Notes in Computer Science, Vol. 340). Berlin: Springer, 1988, pp. 175-199. HAUS, Goffredo & SAMETTI, Alberto 1991: Scoresynth: A System for the Synthesis of Music Scores Based on Petri Nets and Music Algebra. IEEE Computer (1991) 24/7: 56-60. HAYES-ROTH, B. 1985: A B1ackboard Architecture for Control. Artifici al Intelligence (1985) 26: 251-321. HEBB, Dona1d 0. 1949/1961: The Organization of Behavior. A Neuropsy cho1ogical Theory. New York: Wiley, 1949. (1961 6 ) HEBB, Donald 0. 1975: Einführung in die Psychologie. Weinheim, Basel: Beltz, 1975. HELMHOLTZ, Hermann von 1 857/1971: Über die physiologischen Ursa chen der musikalischen Harmonien. München: Kindler, 1971. HELMHOLTZ, Hermann von 1863/1913: Die Lehre von den Tonempfin dungen als physiologische Grundlage für die Theorie der Musik. Braunschweig: Vieweg, 1913. HELMHOLTZ, Hermann von 1867/1896: Handbuch der physiologischen Optik. Hamburg/Leipzig: Voss, 2 . umgearbeitete Auf!. 1896.
422 HELMHOLTZ, Hermann von 1878: Die Tatsachen der Wahrnehmung. Rede zur Gedächtnisfeier der Stiftung der Friedrich-Wilhelms Universität zu Berlin gehalten am 3. August 1878. Berlin: Königl. Akademie der Wissenschaften, 1878. HEMPEL, Carl Gustav 1977: Philosophie der Naturwissenschaften. 2. Aufl. München: dtv, 1977. HERSCHEL, Rudolf 1974: Einführung in die Theorie der Automaten, Sprachen und Algorithmen. München/Wien: Oldenbourg, 1974. HESSE, Horst.-Peter. 1972: Die Wahrnehmung von Tonhöhe und Klang farbe als Problem der Hörtheorie. (Veröffentlichungen des Staatli chen Instituts für Musikforschung, Bd. 6). Köln, 1972. HEWITT, Carl 1991: Open Information Systems Semantics for Distributed Artificial Intelligence. Artificial Intelligence (1991) 4 7: 79-116. HILLER, Lejaren 1956: Some Structural Principles of Computer Music. Journal of the American Musicological Society (1956) IX: 247-248. HOARE, C. A. R. 1972: Notes on Data Structuring, pp. 83-174. In: Dahl, 0. J. & Dijkstra, E. W. & Hoare, C. A. R.: Structured Program ming. New York: Academic Press, 1972. HOFSTÄTTER, Peter R. 1957: Gedächtnis, pp. 108 -114. In: Hofstätter, Peter R. (Ed.): Psychologie. Frankfurt a. M.: Fischer, 1957. HOFSTADTER, Douglas R. 1985: Gödel, Escher, Bach - ein endlos ge flochtenes Band. Stuttgart: Klett-Cotta, 1985. HOPCROFT, John E. & ULLMAN, Jeffrey D . 1979: lntroduction to Auto mata Theory, Languages and Computation. Reading, Mass.: Addison Wesley, 1979. HOWELL, Peter; WEST, Robert & CROSS, Ian (Eds.): Representing Mu sical Structure. London: Academic Press, 1991. HUGHES, David W. 1991: Grammars of Non-Western Musics: A Selec tive Survey, pp. 327-362. In: Howell, Peter; Robert West & Ian Cross (Eds.): Representing Musical Structure. London: Academic Press, 1991. HUNTER, Geoffrey 1988: What Computers Can't Do. Philosophy (1988) 63: 175-189. HUSSMANN, Michael; SCHEFE, Peter & FITTSCHEN, Andreas 1988: Das LISP-Buclh. Hamburg/New York: McGraw Hili, 1988. IMBERT, Michael et al. 1987: Cognitive Science in Europe: A Report from the FAST Programme of the Commission of the European Communities. Berlin: Springer, 1987. IMIG, Renate 1970: Systeme der Funktionsbezeichnung in den Harmonie lehren seit Hugo Riemann. Düsseldorf: Verlag der Gesellschaft zur Förderung der systematischen Musikwissenschaft e. V., 1 970. JACKENDOFF, Ray
1987:
Consciousness and the Computational Mind.
423 Cambridge, Mass.: MIT-Press, 1987. JACKENDOFF, RAY 1991: Musical Parsing and Musical Affect. Music Perception (1991) 9/2: 199-230. JAMES, William 1890/1902: The Principles of Psychology. 2 Volumes. London: MacMillian, 1902. JOHNSON-LAIRD, Philip Niebolas 1981: Cognition, Computers and Mental Models. Cognition (1981) 10: 139-143. JOHNSON-LAIRD, Philip Niebolas 1983: The Nature of Explanation, pp. 1 - 22. In: Johnson-Laird, Philip Nicholas: Mental Models. Towards a Cognitive Science of Language, lnference, and Consciousness. Cambridge: Cambridge University Press, 1983. JOHNSON-LAIRD, Philip Niebolas 1991: Jazz-Improvisation: A Theory at the Computational Level, pp. 291-325. In: Howell, Peter; Robert West & Ian Cross (Eds.): Representing Musical Structure. London: Academic Press, 1991. JOHNSON-LAIRD, Philip Nicholas; CHAFFIN, R . & HERRMANN, D. J. 1984: Only Connections: A Critique of Semantic Networks. Psy chological Bulletin (1984) 9612: 292-315. JONAS, Oswald 1972: Einführung in die Lehre Heinrich Schenkers . Das Wesen des musikalischen Kunstwerkes. Wien: Unversal Edition, 2. Auflage 1972. JONES, Jaqueline A.; MILLER, Benjamin 0. & SCARBOROUGH, Don 1988: A Rule-based Expert System for Music Perception. Behavior Research Methods, Instruments, & Computers (1988) 2012: 255-262. JONES, Jaqueline A.; MILLER, Benjamin 0. & SCARBOROUGH, Don 1990: Discovering the Grouping Structure in Music, pp. 923-930. Twelfth Annual Conference of the Cognitive Science Society. Hillsdale NJ, 1990. JONES, Jaqueline A.; SCARBOROUGH, Don & MILLER, Benjamin 1990: GTSIM: A Computer Simulation of Music Perception, pp. 435-441. In:. Preprint of the Acts of the Conference "Music and Information Technology" - MAI 90 - 3-6 Octobre, Marseille (France), 1990. JORDAN, M. I. 1988: An Introduction to Linear Algebra in Parallel Di stributed Processing. In: David E. Rumelhart, James L. McClelland & the PDP Research Group (Eds.): Parallel Distributed Processing. Explorations in the Microstructure of Cognition. Volume 1: Foun dations. Cambridge, Mass.: MIT-Press, 1988, pp. 365-422. JUNGBLUTH, Axel 1981: Jazz-Harmonielehre. Mainz: Schott, 1981. KADEN, Christian & BIERWISCH, Manfred 1983: Musikwissenschaft und Linguistik. Eine Diskussion. Beiträge zur Musikwissenschaft (1983) 25/3-4: 196-237. KADEN, Christian 1977: Literatur der Analysefragen Il: Klassifikation Segmentation - musikalische Grammatik. Neue Ansätze zur Lösung
424 alter Probleme der Musikanalyse. Beiträge zur Musikwissenschaft (1977) 2: 130-155. KAHLE, W. 1986: Nervensystem und Sinnesorgane, Band 3. In: Kahle, W.; Leonhardt, H. & Platzer, W. (Ed.): Taschenatlas der Anato mie für Studium und Praxis. In 3 Bänden. Stuttgart: Thieme, 5. überarbeitete Auflage 1986. KAPLAN, R. M. 1972: Augmented Transition Networks as Psychological Models of Sentence Comprehension. Artificial Intelligence (1972) 312: 77-100. KARBUSICKY, Vladimir 1979: Systematische Musikwissenschaft. Eine Einführung in Grundbegriffe, Methoden und Arbeitstechniken. Mün chen: Fink, 1979. KARBUSICKY, Vladimir 1986: Grundriß der musikalischen Semantik. Darmstadt: Wissenschafliehe Buchgesellschaft, 1986. KARBUSICKY, Vladimir 1988: Grundzüge der strukturalistischen Musik auffassung. Typoskript. Hamburg, 1988. KARP, R. M. 1960: A Note on the Application of Graph Theory to Digi tal Computer P-rogramming. Information and Control (1960) 3: 179-190. KASSLER, Michael 1963: A Sketch of the Use of Formalized Languages for the Assertion of Music. Perspectives of New Music (1963) 2: 83-94. KASSLER, Michael 1977: The Middleground of Heinrich Schenker's The ory of Tonality (1). Miscellanea Musicologica (1977) 9: 72-81. KATAYOSE, Haruhiro & INOKUCHI, Seiji 1990: Learning Performance Rules in Music Interpretation System, pp. 423-434. In: Preprint of the Acts of the Conference "Music and Information Technology" MAI 90 - 3-6 Octobre, Marseille (France), 1990. KEIDEL, Wolf D. (Ed.) 1975: Physiologie des Gehörs. Akustische lnfor mationsverarbeitung. Einführung für Ärzte, Biologen, Psychologen und Nachrichtentechniker. Stuttgart: Thieme, 1975, pp. 164-226. KEIDEL, Wolf D. 1971: Sinnesphysiologie. Teil I: Allgemeine Sinnesphy siologie, Visuelles System. Berlin: Springer, 1971. KEIDEL, Wolf D. 1989: Biokybernetik des Menschen. Darmstadt: Wissen schaftliche Buchgesellschaft, 1989. KEMKE, C. 1988: Der neue Konnektionismus. Informatik-Spektrum (1988) 11: 143-162. KESSLER, E. J. & HANSEN, C. & SHEPHARD, R. N. 1984: Tonal Schemata in the Perception of Music in Bali and in the West. Music Perception (1984) 2: 131-165. KFOURY, A. 1 . ; MOLL, Robert & ARBIB, Michael A. 1982: A Program ming Approach to Computability. New York: Springer, 1982. KIPPEN, Jim & BEL, Bernard 1984: Linguistic Study of Rhythm: Compu ter Models of Tabla Language. International Society for Traditio nal Arts Research (ISTAR) Newsletter (1984) 2: 28-33. KIPPEN, Jim 1986: Computational Techniques in Musical Analysis. Bulle-
425 tin of Information of Computing and Anthropology (1986) 4: 1-5 KIPPEN, Jim 1987: An Ethnomusicological Approach to Analysis of Musi cal Cognition. Music Perception (1987) 512: 173-196. KIPPEN, Jim 1988a: The Tabla of Lucknow. A Cultural Analysis of a Musical Tradition. Cambrigde: Cambridge University Press, 1988 (Diss. 1985). KIPPEN, Jim 1988b: On the Uses of Computers in Anthropological Rese arch. Current Anthropology (1988) 2912: 317-320. KIPPEN, Jim 1990: Music and the Computer - Some Anthropological Considerations, pp. 41-45. In: Preprint of the Acts of the Confe rence "Music and Information Technology" - MAI 90 - 3-6 octo bre, Marseille (France), 1990. KIPPEN, Jim & BEL, Bernard 1988: Modelling Music with Grammars: Formal Language Representation in the Bol Processor. Preprint 1988. KIPPEN, Jim & BEL, Bernard 1989: The ldentification and ModeHing of a Percussion "Language", and the Emergence of Musical Concepts in a Machine-Learning Experimental Set-Up. Computers and the Hu manities (1989) 23/3: 199-214. KLEENE, Stephen Cole 1951/1956/1974: Darstellung von Ereignissen in Nervennetzen und endlichen Automaten. In: Shannon, Claude S. & McCarthy, John (Eds.): Automata-Studies. Princeton: Princeton University, 1956/1974. KLEMM, Eberhard 1966: Zur Theorie einiger Reihen -Kombinationen. Ar chiv ftir Musikwissenschaft (1966) 23: 170-212. KOBSA, Alfred 1984: Artificial lntelligence und Kognitive Psychologie, pp. 99-122. In: Richter, L. & Stucky W. (Hrsg.): Leitfäden der angewandten Informatik: Artificial Intelligence - Eine Einführung. Stuttgart: Teubner, 1984. KOENIG, Gottfried Michael 1990: NZ•Forum-Computer Musik (1): Um gang mit "Projekt 1 ". Erfahrungen mit Computermusik. Neue Zeit schrift für Musik (1990) 151/1: 3-8. KRÄMER, Sybille 1988: Symbolische Maschinen. Die Idee der Formalisie rung in geschichtlichem Abriß. Darmstadt: Wissenschaftliche Buch gesellschaft, 1988. KRAUSE, Werner & WYSOTZKI, Fritz 1984: Computermodelle und psy chologische Befunde der Wissensrepräsentation, pp. 136-155. In: Klix, Friedhart (Ed.): Gedächtnis-Wissen-Wissensnutzung. Berlin: VEB Deutscher Verlag der Wissenschaften, 1984. KRIPKE, Saul A. 1987: Wittgenstein über Regeln und Privatsprache. Eine elementare Darstellung. Frankfurt a. M.: Suhrkamp, 19 87. KRUMHANSL, Carol L. 1990: Cognitive Foundations of Musical Pitch. New York: Oxford University Press, 1990. KRUMHANSL, Carol L. 1991: Melodie Structure: Theoretical and Empi rical Descriptions, pp. 269-283. In: Sundberg, Johan; Lennart Nord & Rolf Carlson (Eds.): Music, Language, Speech and Brain. Pro-
426 ceedings of an International Symposium at the Wenner-Gren Center, Stockholm, 5-8 September 1990. London: Macmillan, 1991. KRUMHANSL, Carol L. & CASTELLANO, Mary A. & BHARUCHA, J. J. 1984: Tonal Hierarchies in the Music of North India. Journal of Experimental Psychology 113 (1984) 3: 394-412. KRUMHANSL, Carol L. & SHEPHARD, Roger N. 1979: Quantification of the Hierarchy of Tonal Functions within a Diatonic Context. Jour nal of Experimental Psychology (1979) 5/4: 579-594. KUNST, Jaap 1976: Making Sense in Music (1 ): the Use of Mathematical Logic. Interface (1976) 5: 3-68. LABORATOIRE MUSIQUE ET INFORMATIQUE DE MARSEILLE o.J.: Qu'est-ce que le M.I.M.? Liste des Programmes de Recherche. Marseille, 7 S. LASKE, Otto E. 1975: On Psychomusicology. Intern. Rev. Soc. & Aesthe tics of Music (1975) 6/2: 269-281 LASKE, Otto E. 1977: Music, Memory and Thought. Explorations in Cog nitive Musicology. Ann Arbor, Mich. University Microfilms, 1977. LASKE, Otto E. 1986: Introduction. Otto E. Laske (Ed.): Cognitive Mu sicology. CC AI The Journal for the Integrated Study of Artificial Intelligence, Cognitive Science and Applied Epistemology (1986) 3/3: 159-183. LASKE, Otto E. 1987: Eine kurze Einführung in die Kognitive Musikwis senschaft: Folgen des Computers in der Musik, pp. 169-194. In: Batel, Günther; Kleinen, Günter & Salbert, Dieter: Computermusik: Theoretische Grundlagen - Kompositionsgeschichtliche Zusammen hänge - Musiklernprogramme. Laaber: Laaber, 1987. LASKE, Otto E. 1988: Introduction to Cognitive Musicology. Computer Music Journal (1988) 12/3: 43-57. LASKE, Otto E. 1989: Comments on the First Workshop on A. I. and Music. 1988 AAAI Conference St. Paul, Minnesota. Perspectives of New Music (1989) 27/2: 290-298. LASKE, Otto E. 1990: Two Paradigms of Music Research - Composition and Listening, S. 179-185. Preprint of the Acts of the Conference "Music and Information Technology" - MAI 90 - 3-6 octobre, Marseille (France), 1990. LAVOREL, Pierre M. & ARBIB, Michael A. 1981: Towards a Theory of Language Performance. Neurolinguistics, Perceptual-Motor-Processes, and Cooperative Computation. Theoretical Linguistics (1981) 8: 3-28. LEE, Christopher S. Lee 1991: The Perception of Metrical Structure , pp. 59-127. In: Howell, Peter; Robert West & Ian Cross (Eds.): Re presenting Musical Structure. London: Academic Press, 1991. LEMAN, Mare 1989a: Introduction to the Models of Musical Communica tion and Cognition. Interface (1989) 18: 3-7.
427 LEMAN, Mare 1989b: Adaptive Dynamics of Musical Listening. Contem porary Music Review (1989) 4 : 347-362. LEMAN, Mare 1989c: Symbolic and Subsymbolic Information Processing in Models of Musical Communication and Cognition. Interface (1989) 18: 141-160. LEMAN, Mare 1990a: Some Epistemological Considerations on Symbolic and Subsymbolic Processing, pp. 129-14 7. In: Preprint of the Acts of the Conference "Music and Information Technology" - MAI 90 - 3-6 octobre, Marseille (France), 1990. LEMAN, Mare 1990b: Emergent Properlies of Tonality Functions by Self Organzation. Interface (1990) 19/2-3: 85-106. LEMAN, Mare 1991a: Tonal Context by Pattern-Integration Over Time, pp. 21-39. In Antonio Camuri & Corrado Canepa (Eds.): IX Collo quium on Musical Informatics. Genova, 13-16 Novembre 1991. LEMAN, Mare 1991b: Künstliche Neuronale Netzwerke. Neue Ansätze zur ganzheitlichen Informationsverarbeitung in der Musikforschung, pp. 27-44. In. Schaffrath, Helmut (Ed.): Computer in der Musik. Über den Einsatz in Wissenschaft, Komposition und Pädagogik. Stuttgart: Metzler, 1991. LERDAHL, Fred 1988: Cognitive Constraints on Compositional Systems, pp. 231-259. In: Sloboda, John A. (Ed.): Generative Processes in Music. Oxford: Clarendon, 1988. LERDAHL, Fred 1989: Atonal Prolongational Structure. Contemporary Music Review (1989) Vol. 4, 65-87. LERDAHL, Fred 1991: Underlying Musical Schemata, pp. 273-290. In: Howell, Peter; Robert West & Ian Cross (Eds.}: Representing Mu sical Structure. London: Academic Press, 1991. LERDAHL, Fred & JACKENDOFF, Ray 1983: A Generative Theory of Tonal Music. Cambridge, Mass.: MIT-Press, 1983. LERDAHL, Fred & JACKENDOFF, Ray 1983/84: An Ove rview of Hierarchical Structure in Music. Music Perception, Winter (1983/84) 1/2: 229-252. LERDAHL, Fred & POTARD, Yves 1986: La composition assistee par or dinateur. I.R.C.A.M. Rapport de Recherche 41, 1986. LETTVIN, J. Y.; MATURANA, H.; McCULLOCH, W. S. & PITTS, W. H. 1959/1965: What the Frog's Eye teils the Frog's Brain. Procee dings of the IRE (1959) 47/11: 1940-1959. Wieder abgedruckt in: McCulloch, W. S.: Embodiments of Mind. Cambridge, Mass.: MIT, 1965, pp. 230-255. LEVELT, W. J. M. 1974: Formal Grammars in Linguistics and Psycho linguistics. Vol. I . An Introduction to the Theory of Formal Lan guages and Automata. The Hague: Mouton, 1974. LEVITT, David Alex 1981: A Melody Description System for Jazz Im provisation. Submitted in Partial Fullfillement of the Requirements
428 for the Degree of Master of Science at the Massachusetts Insti tute of Technology. June 1981. LEVITT, David Alex 1984: Machine Tongues X Constraint Languages. Computer Music Journal (1984) 8/1: 9-21. LEVY, M. 1976: Sur Je probl�me de Ia definition des unites musicales. Semiotica (1976) 15/1: 8-27. LEVY, Pierre 1987: La machine univers. Creation, cognition et culture informatique. Paris: La Decouverte, 1987. LIGETI, Györgi 1958: Pierre Boulez. Die Reihe. Information über serielle Musik (1958) 4: 38-63. LINDENMAYER, Aristid 1968: Mathematical Models for Cellular Inter actions in Development. Journal of Theoretical Biology (1968) 1 8 : 280-299. LINK, Godehard 1979: Montague-Grammatik. Die logischen Grundlagen. München: Fink, 1979. LISCHKA, Christoph 1984a: Metalogik der Musik, pp. 88-90. In: Haller, Rudolf (Ed.): Ästhetik. Akten des 8. Internationalen Wittgenstein Symposiums Teil 1 . 15. bis 21. August 1983 Kirchberg am Wechsel (Österreich). (Schriftenreihe der Wittgenstein Gesellschaft Bd. 10/1}. Wien, 1984. LISCHKA, Christoph 1984b: Audio-Pattern Understanding and Graph Grammars. International Computer Music Conference. Paris, 1984. LISCHKA, Christoph & GÜSGEN, H. W. 1986: "MrS/C". A Constrai ned-Based Approach to Musical Knowledge Representation. Inter national Computer Music Conference 1986. LISCHKA, Christoph 1987a: Connectionist Models of Musical Thinking, pp. 190-197. Proceedings of the 1987 International Computer Mu sic Conference, Illionois, Urbana 23-26 August 1987. LISCHKA, Christoph 1987b: Zeichenwandel in der abendländischen Musik notation. Zeitschrift für Semiotik (1987) 9/3-4: 269-281. LISCHKA, Christoph 1987c: Semiotik und Musikwissenschaft. Zeitschrift für Semiotik (1987) 9/3-4: 345-355. LISCHKA, Christoph & DIEDERICH, Joachim 1987: Gegenstand und Me thode der Kognitionswissenschaft. GMD-Spiegel (1987) 2/3: 21-32. LISCHKA, Christoph 1990: Some Remarks Concerning the Application of Neural Networks to Music and Musicology. In: Preprint of the Acts of the Conference "Music and Information Technology" MAI 90 - 3-6 octobre, Marseille (France), 1990. LISCHKA, Christoph 1991a: On Music Making, pp. 80-84. In: Camurri, Antonio & Corrado Canepa (Eds.): IX Colloquium on Musical In formatics, Genova, 13-16 Novembre 1991. LISCHKA, Christoph 1991b: Understanding Music Cognition: A Connectio nist View, pp. 417-445. In: De Poli, Giovanni; Aldo Piccialli & Curtis Roads (Eds.): Representations of Musical Signals. Cambrid-
429 ge, Mass.: MIT, 1991. LIVANT, W. P. 1961: Review of Experimental Music, by Hiller & Isaac son. Behavioral Science (1961) 6: 159-160. LONGUET-HIGGINS, H. Christopher 1987: Mental Processes: Studies in Cognitive Science. (Explorations in Cognitive Science Vol.. 1 . Bo den, Margaret (Ed.)). Cambridge, Mass.: MIT-Press & Bradford Book, 1987. LONGUET-HIGGINS, H. Christopher & LEE, C. S. 1984: The Rhythmic Interpretation of Monophonie Music. Music Perception, Summer (1984) 1/4: 424-441. LONGUET-HIGGINS, H. Christopher & STEEDMAN, Mark 1971: On ln terpreting Bach. Machine Intelligence (1971) 6: 221-241. LORENZEN, Paul 1974: Gleichheit und Abstraktion, pp. 190-198. Kon struktive Wissenschaftstheorie. Frankfurt a. M .: Suhrkamp, 197 4. LOY, Gareth & ABBOTT, Curtis 1985: Programming Languages for Com puter Music Synthesis, Performance, and Composition. Association for Computing Machinery Computing Surveys (1985) 1712: 235 -265. LYOTARD, Jean Francois: Das postmoderne Wissen. Ein Bericht. Theatro Machinarum (1982) 113-4. MACHOVER, Tod 1985: Le Concept de Recherche Musicale, pp. 11-31. In: Bourgois, Christian (Ed.) Quoi? Quand? Comment? La Recher che Musicale. Paris: IRCAM, 1985. MacKAY, Donald M. 1984: Mind Talk and Brain Talk, pp. 293-317. In: Gazzaniga, Michael S. (Ed.): Handbock of Cognitive Neuroscience. New York: Plenum, 1984. MALER, Wilhelm 1980: Beitrag zur durmolltonalen Harmonielehre. Lehr buch I, II. München, Leipzig: Leuckart, Bd. I 1980 10; Bd. II, 1975 5 . MANDL, Heinz & SPADA, Hans (Eds.) 1988: Wissenspsychologie. Mün chen/Weinheim: Psychologie Verlagsunion, 1988. MARIN, Oscar 1982: Neurological Aspects of Music Perception and Per formance, pp. 453-4 77. In: Deutsch, Diana (Ed.): The Psychology of Music. New York: Academic Press, 1982. MARIN, Oscar S. M. 1989: Neuropsychology, Mental Cognitive Models and Music Processing. Contemporary Music Review (1989) 4 : 255-263. MARINO, Giuseppe; MORASSO, Pietro & ZACCARIA, Renato 1986: Concurrent Parallel Processes, pp. 321-331. In: Morasso, P. & Ta gliasco, V. (Eds . ) : Human Movement Understanding. From Compu tational Geometry to Artificial Intelligence (Advances in Psycholo gy Bd. 33; Eds. G. E. Stelmach & Vroon, P . A.). Amsterdam: North-Holland, 1986. MARR, David 1977: Artificial Intelligence - A Personal View. Artificial Intelligence (1977) 9 : 37-48. MARSDEN, Alan & POPLE, Anthony 1989a: Towards a Connected Distri-
430 buted Model of Musical Listening. Interface (1989) 18/1-2: 61-72. MARSDEN, Alan & POPLE, Anthony 1989b: Modelling Musical Cognition as a Community of Experts. Contemporary Music Review (1989) 3: 29-42. MARTIN, J. G. 1972: Rhythmic (hierarchical) versus Serial Structure in Speech and other Behavior. Psychological Review (1972) 79: 487-509. MATHEWS, Max V. 1963: The Digital Computer as a Musical Instru ment. Science (1963) 142: 553-557. MATHEWS, Max V. 1969: The Technology of Computer Music. Cam bridge, Mass.: MIT, 1969. MATHEWS, Max V. & PIERCE, J. R. 1987: Der Computer als Musik instrument. Spektrum der Wissenschaft (1987) 4: 122-132. MAZLISH, Bruce 1967: The Fourth Discontinuity. Technology and Culture (1967) 8: 1-15. McADAMS, Stephen & BREGMAN, A. S. 1979: Hearing Musical Streams. Computer Music Journal (1979) 3/4: 26-43. McADAMS, Stephen 1984: The Auditory Image: A Metapher for Musical and Psychological Research on Auditory Organization, pp. 289-323. In: Crozier, W. R. & Chapman, A. J. (Eds.): Cognitive Processes in the Perception of Art. Amsterdam: North-Holland, 1984. McADAMS, Stephen 1987: Music: A Science of the Mind? Contemporary Music Review (1987) 2: 1-61. McADAMS, Stephen & DELIEGE, Irene (Eds.) 1989: Music and the Cog nitive Sciences. Proceedings from the Symposium on Music and the Cognitive Sciences, 14.-18. March 1988. Contemporary Music Review (1989) 4 . McCARTHY, John 1978: A Miere-Manual for LISP - Not the Whole Truth. ACM SIGPLAN (1978) 13/8: 215 - 216. McCARTHY, John 1978: History of LISP. ACM SIGPLAN (1978) 13/8: 217-223. McCLELLAND, James L. & RUMELHART, David E. and the PDP Research Group 1986: Parallel Distributed Processing. Explorations in the Microstructure of Cognition. Volume 2: Psychological and Biologi cal Models. Cambridge, Mass.: MIT 1986, 1988 7 . McCULLOCH, Warren Sturgis & PITTS, Walter 1943/1965: A Logical Calculus of the Ideas in Nervous Activity. Bulletin of Mathemati cal Biophysics (1943) 5: 115-133; Abgedruckt in: McCulloch, Warren Sturgis: Embodiments of Mind. Cambridge, Mass.: MIT-Press, 1965. McCULLOCH, Warren Sturgis 1965: A Historical Introduction to the Po stulational Foundations of Experimental Epistemology, pp. 359-371. In: McCulloch, Warren Sturgis: Embodiments of Mind. Cambridge, Mass.: MIT-Press, 1965. MEEHAN, James R. 1980: An Artificial lntelligence Approach to Tonal Music Theory. Computer Music Journal (1980) 4/2: 60-65. MEETHAM, A. R. & HUDSON, R. A. (Eds.) 1969: Encyclopaedia of Lin-
431 gu1st1cs, Information and Control. Oxford: Perga:mon, 1969. MICHON, J. A. 1974: Programs and 'programs' for Sequential Patterns in Motor Behavior. Brain Research (1974) 71: 413-424. MILLER, George A. 1981: Trends and Debates in Cognitive Psychology. Cognition (1981) 10: 215-225. MILLER, G. A. & CHOMSKY, N. 1963: Finitary Models of Language Users, pp. 419-491. In: Luce, R. D . ; Bush, R. & Galanter, E. (Eds): Handbook of Mathematical Psychology, Vol. II. New York: Wiley, 1963. MILLER, G. A. & GALANTER, E. & PRIBRAM, K. 1960/1970/1973: Plans and the Structure of Behavior. New York: Holt, 1960, 1970. Strategien des Handelns. Pläne und Strukturen des Verhaltens . Stuttgart: Klett, 1973. MILLER, Benjamin 0 . ; SCARBOROUGH, Don & JONES, Jaqueline A. 1988: A Model of Meter Perception in Music, pp. 717-723. Tenth An nual Conference of the Cognitive Science Society. Hillsdale, NJ, 1988. MILLER, Benjamin 0.; SCARBOROUGH, Don & JONES, Jaqueline A. 1989: Rule-based versus Constraint-satisfaction Approaches to the Perception of Meter in Music, pp. 26-35. Second Workshop on Artificial Intelligence and Music. Menlo Park, CA: American As sociation for Artificial Intelligence, 1989. MINSKY, Marvin 1963a: Steps toward Artificial Intelligence, pp. 406-450. In: Feigenbaum, Edward A. & Feldman, Julian (Eds.): Computers and Thought. New York: McGraw-Hill, 1963. MINSKY, Marvin 1963b: A Selected Descriptor-lndexed Bibliography to the Literature on Artificial Intelligence, pp. 453-523. In: Feigen baum, Edward A. & Feldman, Julian (Eds.): Computers and Thought. New York: McGraw-Hill, 1963. MINSKY, Marvin 1971: Berechnung: Endliche und unendliche Maschinen. Stuttgart: Kohlhammer, 1971. MÖHRING, Leonhard 1987: Computerharmonie - oder wie intelligent kann ein Computer eine Melodie harmonisieren. Junge Wissen schaft. Jugend forscht in Natur und Technik (1987) 2/4: 54-57. MOORE, F. Richard 1990: Elements of Computer Music. Englewood Cliffs, New Jersey: Prentice Hall, 1990. MOTTE-HABER, Helga de la 1982: Musikalische Hermeneutik und empirische Forschung, S. l?l-244. Dahlhaus, Carl & Motte-Haber, Helgade la (Eds.) : Neues Handbuch der Musikwissenschaft, Bd. 10. Systematische Mu sikwissenschaft. Wiesbaden: Athenaion; Laaber: Laaber-Verlag, 1982. MOTTE-HABER, Helga de la & NITSCHE, Peter 1982: Begründungen musik theoretischer Systeme, pp. 49-80. Dahlhaus, Ca:rl & Motte-Haber, Helga de la (Eds.): Neues Handbuch der Musikwissenschaft, Bd. 10. Systematische Musikwissenschaft. Wiesbaden: Athenaion; Laaber: Laaber- Verlag, 1982. MOUNTCASTLE, V. B. 1978: An Organizing Principle for Cerebra!
432 Function. The Unit Module and the Distribution System. Edelmann, G. M. & Mountcastle (Eds): The Mindful Brain. Cambridge, Mass., 1978. MÜLLER, Dieter 1985: LISP. Eine elementare Einführung in die Pro grammierung nichtnumerischer Aufgaben. Mannheim/Wien/Zürich: Bibliographisches Institut, 1985. MÜNCH, Oieter (Ed.) 1992: Kognitionswissenschaft. Grundlagen, Probleme, Perspektiven. Frankfurt a. M.: Suhrkamp, 1992. NARMOUR, Eugene 1983/84: Some Major Theoretical Problems Concer ning the Concept of Hierarchy in the Analysis of Tonal Music. Music Perception (1983/84) 112: 129-199. NATTIEZ, Jean-Jacques 1975: Fondements d'une semiologie de la musi que. Paris: Union Generale d'Editions, 1975. NATTIEZ, Jean-Jacques 1986: La semiologie musicale dix ans apres. Analyse Musicale (1986) 1: 22-32 u. 51. NAUCK-BÖRNER, Christa 1988: Strukturen des musikalischen Gedächt nisses. Anmerkungen zu formalen Modellen der Repräsentation. Musikpsychologie. Jahrbuch der Deutschen Gesellschaft für Mu sikpsychologie (1988) 5: 55-66. NEISSER, Ulric 1967: Cognitive Psychology. New York: Appleton, 1967. NELSON, Raymond J. 1968: lntroduction to Automata. New York: Wiley, 1968. NELSON, Raymond J. 1975: Machine Expectation. Synthese 31 (1975) 129-139. NELSON, Raymond J. 1982: The Logic of Mind. Oordrecht: Reidel, 1982. NELSON, Raymond J. 1987: Machine Models for Cognitive Science. Philosophy of Science (1987) 54: 391-408. NEUMANN, Oaniel 1980: The Life of Music in North India: The Organi zation of an Artistic Tradition. Oetroit: Wayne State University, 1980. NEUMANN, John von 195111967: The General and Logical Theory of Au tomata. In: Lloyd A. Jeffress (Ed.): Cerebra! Mechanisms in Be havior. New York: Wiley, 1951. (dt.) Allgemeine und logische The orie der Automaten. Kursbuch (1967) 8: 139-175. NEUMANN, John von 1954: Entwicklung und Ausnutzung neuerer mathe matischer Maschinen. In: Arbeitsgemeinschaft für Forschung des Landes Nordrhein-Westfalen, Vol. 45, Düsseldorf 1954. Abgedruckt in: Neumann, John von: Collected Works, Vol. V. Design of Com puters, Theory of Automata and Numerical Analysis, pp. 248-287. NEUMANN, P. G. & SCHAPPERT, H. 1959: Komponieren mit elektroni schen Rechenautomaten. Nachrichtentechnische Zeitschrift (1959) 12/8: 403-407. NEUMAIER, Wilfried 1989: Eine exakte Sprache der Musiktheorie. Mu siktheorie (1989) 4/1: 15-25. NEWELL, Allen & SHAW, J. C. & SIMON, Herbert A. 1958: Elements of a Theory of Human Problem Solving. Psychological Review (1958) 65/3: 151-166.
433
NEWELL, Allen & SIMON, Herbert A. 1963: Computers in Psychology, pp. 364-428; Ch. 7. In: Luce, R. Duncan ; Bush, Robert & Ga lanter, Eugene (Eds.): Handbock of Mathematical Psychology. Vol. I. New York: Wiley, 1963. NEWELL, Allen & SIMON, Herbert A. 1972: Human Problem Solving. Englewood Cliffs, New York, 1972. NEWELL, Allen 1973: Production Systems: Models of Control Structures. Chase, William G. (Ed.): Visual Information Processing. Procee dings of the Eigth Annual Carnegie Symposium on Cognition, Held at the Carnegie-Mellon University Pittsburgh, Pennsylvania, May 19, 1972. New York: Academic Press, 1973. NEWELL, Allen & SIMON, Herbert A. 1976: Computer Science as Em pirical Inquiry: Symbols and Search. Communications of the ACM (1976) 19/3: 113-126. NEWELL, Allen 1980: Pbysical Symbol Systems . Cognitive Science (1980) 4: 135-183. Nil, H. Penny 1986a: Blackboard Systems: The Blackboard Model of Pro blem Solving and the Evolution of Blackboard Architectures. Part One. AI Magazine Summer 1986, 38-53. Nil, H. Penny 1986b: Blackboard Systems: Blackboard Application Sy stems, Blackboard Systems from a Knowledge Engineering Per spective. Part Two. AI Magazine August 1986, 82-106. NOLTEMEIER, Hartmut 1981: Informatik I. Einführung in Algorithmen und Berechenbarkeit. München: Hanser, 1981. NORMAN, Donald A. (Ed.) 1982: Perspectives on Cognitive Science. Nor wood, NJ.: Ablex, 1982. NORMAN, Donald A. 1984: Worsening the Knowledge Gap. The Mystique of Computation Builds Unnecessary Barriers, pp. 220-233. In: Pa gels, Heinz R. (Ed.): The Scientific, Intellectual, and Social Impact of the Computer. (Annals of the New York Academy of Seiences Vol. 426), New York: The New York Academy of Sciences, 1984. OEPEN, G. & BERTOLD, H. 1987: Häufigkeit und Art amusischer Stö rungen nach unterschiedlichen Hirnläsionen, pp. 277-287. In: Droh, R. (Ed.): Musik in der Medizin. Neurophysiologische Grundlagen Klinische Applikationen-Geisteswissenschaftliche Einordnungen. Berlin: Springer, 1987. OESER, Erhard & SEITELBERGER, Franz 1988: Gehirn, Bewußtsein und Erkenntnis. In: Nagl, Walter & Wuketits, Franz M. (Eds.): Dimen sionen der moderner Biologie, Bd. 2. Darmstadt: Wissenschaftli che Buchgesellschaft, 1988. PALM, Günther 1988: Modellvorstellungen auf der Basis neuronaler Netz werke, pp. 488-502. In: Mandl, Heinz & Spada, Hans (Hrsg.): Wissenspsychologie. München: Psychologie Verlagsunion, 1988.
434 PAPERT, Seymour 1988: One Al or many?, pp. 1-14. In: Graubard, Stephen R. (Ed.): The Artificial Intelligence Debate. False Starts, Real Foundations. Cambridge, Mass.: MIT-Press, 1988. PARNCUTT, R 1988: Revision of Terhardt's Psychoacoustical Model of the Root's of a Musical Chord. Music Perception (1988) 6/1: 65-94. PARNCUTT, R. 1989: Harmony: A Psychoacoustical Approach. Berlin: Springer, 1989. PARTCH, Harry 1949: Genesis of a Music. Madison, Wisc., 1949. PASK, Gordon 1969: Psychology, Use of Models (Learning), pp. 447-452. In: Meetham, A. R. & Hudson, R. A. (Eds.): Encyclopaedia of Lin guistics, Information and Control. Oxford: Pergamon, 1969. PENFIELD, Wilder 1960: Neurophysiological Basis of Higher Functions of the Nervous System-Introduction, pp. 1441-1446. In: Field, John et al. (Eds.): Handbock of Physiology. A Critical, Comprehensive Pre sentation of Physiological Knowledge and Concepts. Section 1 : Neurophysiology, Vol. li!. Washington, D.C.: American Physiologi cal Society 1960. PENNYCOOK, Bruce W. 1985: Computer-Music Interfaces: A Survey. Association for Computing Machinery Computing Surveys (1985) 1712: 266-289. PERLMAN, A. H. & GREENBLATT 1981: Miles Davis meets Noam Chomsky - Some Observations om Jazz Improvisation and Langua ge Structure. In: W. Steiner (Ed.): The Sign in Music and Litera lure. Austin: University of Texas Press, 1981. PERONE, James 1985: Toward a Systematization of Segmentation. In terface (1985) 14: 237-24 7. PETSCHKE, Hellmuth 1979: Neurophysiologische Aspekte zum Musikerle ben, pp. 70-84. In Simon, Walther (Ed.): Mensch und Musik. Festschrift für Herbert von Karajan. Salzburg: Müller, 1979. PETERMANN, Bruno 1931: Das Gestaltproblem in der Psychologie im Lichte analytischer Besinnung. Ein Versuch grundsätzlicher Orien tierung. Leipzig: Barth, 1931. PETERS, P. Stanley Jr. 1969: On the Complexity of Language Processing by the Brain. In: Leibovic, K. N. (Ed.): Information Processing in the Nervous System. Berlin/New York: Springer, 1969. PFALTZ, J. L. & ROSENFELD, A. 1969: Web grammars. Proceedings of the International Joint Conference on Artificial Intelligence (IJ CAI), pp. 609-621. Washington, D. C., 1969. PIERCE, John R. 1965: Phänomene der Kommunikation. Informationstheorie - Nachrichtenübertragung - Kybernetik. Düsseldorf, Wien: Econ, 1965. PLUM, Thomas 1985: Das C-Lernbuch. Eine Einführung in die Sprache C. Müchen: Hanser, 1985. POPE, Stephen Travis 1986: Music Notations and the Representation of Musical Structure and Knowledge. Perspectives of New Music
435 (1986): 156-184. POPE, Stephen Travis 1991 (Ed.): The Well-tempered Object: Musical Applications of Object-orientated Software Technology. Cambridge, Mass.: MIT-Press, 1991. POPPER, Karl & ECCLES. John C. 1977/1982: Das Ich und sein Gehirn. München/Zürich: Piper, 19 82. POST, Emil L. 1936: Finite Combinatory Processes - Formulation One. The Journal of Symbolic Logic (1936) 113: 103-105. POVEL, Dirk-Jon & ESSENS, Peter 1985: Perception of Temporal Pat terns. Music Perception (1985) 2: 411-440. PRESSING, Jeff 1988: Improvisation: Methods and Models, pp. 128-178. In: Sloboda, John A. (Ed.): Generative Processes in Music. The Psychology of Performance, Improvisation, and Composition. Ox ford: Clarendon Press, 19 88. PRIBRAM, Karl H. 1981: Brain Mechanism in Music. Prolegomena to a Theory of the Meaning of Meaning. In: Clynes, Manfred (Ed): Music, Mind and Brain. New York: Plenum, 1981. PRIBRAM, Karl H. 1982: Computations and Representations, pp. 213-224. In: Simon, Thomas W. & Scholes, Robert J. (Eds.): Language, Mind and Brain. Hillsdale: Erlbaum, 1982. PUTNAM , Hilary 1983: Computational Psychology and Interpretation The ory, pp. 139-154. In: Putnam, Hilary: Philosophica1 Papers, Vol. III: Realism and Reason. Cambridge: Cambridge University Press, 1983. PYLK.KÖ , Pauli 1988: Tonal Harmony as a Formal System. Rantala, Veikko; Rowell, Lewis & Tarasti, Eero (Eds): Essays on the Phi losophy of Music. Acta Philosophica Fennica (1988) 48: 300-322 PYLYSHYN, Zenon W. 1973: The Role of Competence Theories in Cog nitive Psychology. Journal of Psycholinguistic Research (1973) 2/1: 21-50. PYLYSHYN, Zenon W. 1984: Computation and Cognition. Toward a Foun dation for Cognitive Science. Cambridge, Mass.: MIT-Press, 1984. PYLYSHYN, Zenon W. 1987: Cognitive Science, pp. 120-124. In: Shapiro, Stuart C. (Ed.): Encyclopaedia of Artificial Intelligence. New York: Wiley, 1987. QUINE, Willard van Orman 1960/1980: Wort und Gegenstand. Stuttgart: Reclam, 1980. Word and Object. Cambridge, Mass.: MIT-Press, 1960. QUINE, Willard van Orman 1969/1984: Naturalisierte Erkenntnistheorie, pp. 97-126. In: Quine, Willard van Orman: Ontologische Relativität und andere Schriften. Stuttgart: Reclam, 1984. (eng!.) Epistemology Naturalized. Ontological Relativity and Other Essays. New York: Columbia University Press, 1969. RAHN, John
1980a:
Basic Atonal Theory. New York: Schirmer, 1980.
436 RAHN, John 1980b: On Some Computational Models of Music Theory. Computer Music Journal (1980) 4/2: 66-72. RAHN, John 1989: Notes on Methodology in Music Theory. Journal of Music Theory (1989) 33/1: 27-62. RAHN, John 1990: Processing Musical Abstraction: Remarks on LISP and the Future of Musical Computing. Perspectives of New Music (1990) 28/1: 180-191. RASCH, Rudolf A. 1985: Relations Between Multiple Divisions of the Octave and the Traditional Tonal System. Interface (1985) 14: 75-108. REEKE, George N. & EDELMAN, Gerald M. 1988: Real Brains and Ar tificial Intelligence, pp. 143-173. In: Graubard, Stephen (Ed.): The Artificial Intelligence Debate. False Starts, Real Foundations. Cambridge, Mass.: MIT-Press, 1988. REITMAN, W. R. 1965: Cognition and Thought. New York: Wiley, 1965. REITMAN, W. R. 1961: Programming Intelligent Problem Solvers. IRE Trans. on Human Factors in Electronics.(l961) HFE-2, pp. 26-33. REPPLINGER, Uwe 1989: Turbo C für den Atari. Bonn: Addison-Wesley, 1989. RESTLE, Frank 1970: Theory of Serial Pattern Learning: Structural Trees. Psychological Review (1970) 6: 481-495. RIEMANN, Hugo 1874: Über das musikalische Hören, 1874. (1873) Mu sikalische Logik. Hauptzüge der physiologischen und psychologi schen Begründung unseres Musiksystems. Leipzig: C. F. Kahnt, 1873. RIEMANN, Hugo 1898/1921: Geschichte der Musiktheorie im IX.-XIX Jahrhundert. Berlin: 1921. RIEMANN, Hugo 1916/1975: Ideen zu einer "Lehre von den Tonvorstel lungen", pp. I 26. Jahrbuch der Musikbibliothek Peters ftir 1914/15. Ein- und Zweiundzwanzigster Jahrgang. Leipzig: C. F. Peters, 1916. Wieder abgedruckt in: Dopheide, Bernhard (Hrsg.): Musik hören. Darmstadt: Wissenschaftliche Buchgesellschaft, 1975, S. 14 ff. RIEMANN, Hugo 1917: Neue Beiträge zu einer Lehre von den Tonvor stellungen, pp. 1 - 21 . Jahrbuch der Musikbibliothek Peters für 1916. Dreiundzwanzigster Jahrgang. Leipzig: Peters, 1917. (Nachdruck: Vaduz: Kraus Reprint LTD., 1965) RISSET, Jean Claude & WESSEL, David L. 1982: Exploration of Timbre by Analysis and Synthesis, pp. 26-58. In: Deutsch, Diana (Ed.): The Psychology of Music. New York: Academic Press, 1982. ROADS, Curtis 1984: An Overview of Music Representations, pp. 7-37. In: Baroni, M. & Callegari , L.: Musical Grammars and Computer Analysis. Atti del Convegno: Modena, 4-6 ottobre 1982. Firenze: Olschki, 1984. ROADS, Curtis 1985a: Research in Music and Artificial Intelligence. ACM Computing Surveys (1985) 17/2: 163-190. ROADS, Curtis 198Sb: Grammars as Representations for Music, pp. 403443. Roads, Curtis & Strawn, John (Eds.): Foundations of Compu
-
437 ter Music. Cambridge, Mass.: MIT-Press, 1985. ROEDER, John 1988: A Declarative Model of Atonal Analysis. Music Perception (1988) 6/1: 21-34. ROEDERER, Juan G. 1974: Auditory Processing in the Nervous System, pp. 211 - 227. In: Conrad, M. & Güttinger, W. & Da! Cin, M . (Eds.): Physics and Mathematics of the Nervous System. Procee dings of a Summer School organized by the International Centre for Theoretical Physics, Trieste, and the Institute for Information Science, University of Tübingen, held at Trieste, August 21 - 31, 1973. (Lecture Notes in Biomathematics Bd. 4 , Levin, S. (Ed.)). Berlin: Springer, 1974. ROEDERER, Juan G. 1977: Physikalische und psycheakustische Grundlagen der Musik. Berlin: Springer, 1977. ROEDERER, Juan G. 1987: Neuropsychological Processes Relevant to the Perception of Music - An Introduction, pp. 81-1.06. In: Spintge, R. & Droh, R. (Eds.): Musik in der Medizin. Neurophysiologische Grundlagen - Klinische Applikationen - Geisteswissenschaftliche Ein ordnungen. Berlin: Springer, 1987. ROHWER, Jens 1967: Systematische Musiktheorie. Anmerkungen zu einer wissenschaftlichen Disziplin, pp. 131-139. In: Finscher, Ludwig & Mahling, Christoph-Hellmut (Eds.): Festschrift für Walter Wiora zum 30. Dezember 1966. Kassel: Bärenreiter, 1967. ROSENBLATT, Frank 1958: The Perceptron: A Probabilistic Model for Information Storage and Organization of the Brain. Psychological Review 65 (1958) 6: 386-408. ROSENZWEIG, Mark R. & LEIMAN, Arnold L. 1982: Physiological Psy chology. Lexington, Massachusetts: D. C. Heath & Company, 1982. ROSNER, Burton & MEYER, Leonard B. 1982: Melodie Processes and the Perception of Music, pp. 317-341. In: Diana Deutsch (Ed.): The Psychology of Music, Lonon: Academic Press, 1982. ROTHGEB, John 1966: Some Uses of Mathematical Concepts in Theories of Music. Journal of Music Theory (1966) X: 200-215. ROTHGEB, John 1968: Harmonizing the Unfigured Bass: A Computational Study. Dissertation, Yale Universität, 1968. ROTHGEB, John 1980: Simulating Musical Skills by Digital Computer. Computer Music Journal (1980) 4/2: 36-40. RUMELHART, D. E. 1980: Schemata: The Building Blocks of Cognition, pp. 33-58. In: Spiro, R. J. & Bruce, B . C. & Brewer, W. F. (Eds.): Theoretical issues in reading comprehension. Perspectives from Cognitive Psychology, Linguistics, Artificial Intelligence, and Education. Hillsdale, New Jersey: Erlbaum, 1980. RUMELHART, David E. & McCLELLAND, James L., and the PDP Re search Group 1986, 1987: Explorations in the Microstructure of Cognition. Volume 1 : Foundations. Cambridge, Mass.: MIT 1986, 1988 7. RUMELHART, David & NORMAN, Donald A. 1988: Representation in
438 Memory, pp 511 - 587. In: Atkinson, Richard C.; Herrnstein, Ri chard J.; Lindzey, Gardner & Luce, R. Duncan (Eds.): Stevens' Handbook of Experimental Psychology. Second Edition. Volume 2: Learning and Cognition. New York: Wiley, 1988. RUMELHART, D. E.; HINTON, G. E. & WILLIAMS, R. J. 1988: Lear ning Interna! Representations by Error Propagation, pp. 318-362. In: Rumelhard, David E. & McClelland James L. and the POP Re search Group: Explorations in the Microstructure of Cognition. Volume 1 : Foundations. Cambridge, Mass.: MIT 1986, 19887 SALOMAA, Arto K. 1978: Formale Sprachen. New York: Springer, 1978. SAMPSON, Jeffrey R. 1976: Adaptive Information Processing. An Intro ductory Survey. New York: Springer, 1976. SCARBOROUGH, Don L.; JONES, Jaqueline A. & MILLER, B�njamin 0.: 1988: An Expert System for Music Perception, pp. 9-19. Procee dings of the First Workshop on Artificia1 Intelligence and Music. American Association for Artificia1 Intelligence. Menlo Park, Cali fornia, 1988. SCARBOROUGH, Don L.; JONES, Jaqueline A. & MILLER, Benjamin 0. 1989: Modeling Music Cognition: An Expert System, pp. 132-146. Proceedings of the Arts & Technology li: A Symposium. Center for Electronic and Digital Sound at Connecticut College. New London CT, 1989. SCARBOROUGH, Don L. ; MILLER, Ben 0. & JONES, Jacqueline 1988: Connectionist Models for Tonal Analysis. Computer Music Journal (1988) 13/3: 49-55. SCHANK, Roger 1972: Conceptual Dependency: A Theory of Natural Language Understanding. Cognitive Psychology (1972) 3: 552-631. SCHANK, Roger & Wilensky, 1977: Response to Dresher and Hornstein. Cognition (1977) 5: 133-145. SCHEFE, Peter 1985: Informatik - Eine konstruktive Einführung. LISP, PROLOG und andere Konzepte der Programmierung. Mannheim/ Wien/Zürich: Bibliographisches Institut Wissenschaftsverlag, 1985. SCHENKER, Heinrich 1974: Das Meisterwerk in der Musik. Ein Jahr buch. 3 Teile in einem Band. Hildesheim/New York: Olms, 1974. Nachdruck von 1925. SCHENKER, Heinrich W. 1956: Neue musikalische Theorien und Phanta sien. Der Freie Satz 1 ; Der Freie Satz 2, Anhang mit Figurenta feln. Hrsg. und bearbeitet von Oswald Jonas. Wien: Universal Edi tion, 2. Aufl., 1956. SCHMIDT, R. A. 1975: A Schema Theory for Discrete Motor Skill Lear ning. Psychological Review (1975) 82: 225-260. SCHMIDT, R. A. 1976: A Schema as a Solution to some Persistent Pro-
439 blems in Motor Learning Theory, pp. 41-65. In: Stelmach, G.E. (Ed): Motor Control: Issues and Trends . New York: Academic Press, 1976. SCHMIDT, Robert F. 1972a: Der Aufbau des Nervensystems, pp. 1-18. In: Schmidt, R. F. (Ed.): Grundriß der Neurophysiologie. Berlin: Springer, 1972. SCHMIDT, Robert F. 1972b: Physiologie kleiner Neuronenverbände, pp. 104-128. In: Schmidt, R. F. (Ed.): Grundriß der Neurophysiologie. Berlin: Springer, 1972. Befehlsbibliothek. Hamburg: SCHILDT, Herbert 1989: Turbo C McGraw-Hill, 1989. SCHMUCKLER, Mark A. 1989: Expectation in Music. Investigation of Melo die and Harmonie Processes. Music Perception (1989) 7/2: 109-150 SCHNEIDER, Albrecht 1986: Tonsystem und Intonation. Studien zur Sy stematischen Musikwissenschaft. Hamburger Jahrbuch ftir Musik wissenschaft (1986) 9: 153-199. SCHNEIDER, Albrecht & SEIFERT, Uwe 1986: Zu einigen Ansätzen und Verfahren in neueren musiktheoretischen Konzepten. Acta Musico logica (1986) 58: 305-338. SCHNEIDER, Sigrun 1975: Mikrotöne in der Musik des 20. Jahrhunderts. Bonn, 1975. SCHNEIDER, Reinhardt 1980: Semiotik der Musik. Darstellung und Kritik. München: Fink, 1980. SCHNEIDER, Walter 1987: Connectionism: Is it a Paradigm Shift for Psychology ? Behavoir Research Methods, Instruments, & Compu ters (1987) 19/2: 73-83. SCHNELLE, Helmut 1973: Sprachphilosophie und Linguistik. Prinzipien der Sprachanalyse a priori und a posteriori. Reinbek: Rowohlt, 1973. SCHNELLE, Helmut 1988a: Turing Naturalized: Von Neumann's Unfinished Project, p. 539-559. Herken, Rolf (Ed.): The Universal Turing Ma chine. A Half Century Survey. Hamburg: Kammerer & Unverzagt, 1988. SCHNELLE, Helmut 1988b: Ansätze zur prozessualen Linguistik, pp. 137-190. In: Schnelle, Helmut & Rickheit, Gert (Eds.): Sprache in Mensch und Computer. Kognitive und neuronale Sprachverarbei tung. Opladen: Westdeutscher Verlag, 1988. SCHNELLE, Helmut & RICKHEIT, Gert (Eds.) 1988: Sprache in Mensch und Computer. Kognitive und neuronale Sprachverarbeitung. Opla den: Westdeutscher Verlag, 1988. SCHROEDER, M . R. 1969: Computers in Acoustics: Symbiosis of an Old Science and a New Tool. Journal Acoust. Society America (1969) 45: 1077-1088. SCHWARTZ, Jacob T. 1988: The New Connectionism: Developing Relati onships Between Neuroscience and Artificial Intelligence, pp. 123-142. In: Graubard, Stephen R. (Ed.): The Artificial Intelligence
440 Debate. False Starts, Real Foundations. Cambridge, Mass.: MIT Press, 1988. SEIDEL, Elmar 1966: Die Harmonielehre Hugo Riemanns, pp. 39-92. In: Vogel, Martin (Ed.): Beiträge zur Musiktheorie des 19. Jahrhun derts. Regensburg: Bosse, 1966. SEIDEL, Elmar 1967: Artikel: Ursatz. Riemann Musik-Lexikon. SachteiL Mainz: Schott, 1967. SEIFERT, Uwe 1986: Neuere methodische Ansätze in der Musiktheorie seit 1945 unter besonderer Berücksichtig�ng der Vereinigten Staa ten. Magisterarbeit Universität Hamburg, 1986. SEIFERT, Uwe 1989: Anmerkungen zu einigen Grundannahmen der Kog nitionswissenschaft. Vortrag gehalten auf dem 2. Hamburger Kog nitionskolloquium. Fachbereich Informatik Abt. KI der Universität Harnburg vom 27.-28. 10. 1989. SEIFERT, Uwe 1990: La Science Cognitive - Un nouveau paradigme de la recherche musicale?, pp. 51- 67. In: Preprint of the Acts of the Conference "Music and Information Technology" - MAI 90 - 3-6 Octobre, Marseille (France), 1990. SEIFERT, Uwe im Druck: Kognitive Musikpsychologie und Musiktheorie. Festschrift für Professor Jan Steszewski. Posen. SELLARS, Wilfried 1958: Intentionality and the Mental. Introduction, pp. 507-509. In: Feig!, H. & Scriven, M. & Grover, M. (Eds.): Minne sota Studies in the Philosophy of Science, Vol. Il. Concepts, Theories and the Mind-Body Problem. Minneapolis : University of Minneseta Press, 1958. SERAFINE, M . L. 1988: Music as Cognition: The Development of Thought in Sound. New York: Columbia University Press, 1988. SHAFFER, L. H. 1976: Intention and Performance. Psychological Review (1976) 83: 375-393. SHAFFER, L. H. 1980: Analyzing Piano Performance: A Study of Concert Pianists, pp. 443-455. In: Stelman, G. E. & Requin, J. (Eds): Tu torials in Motor Behavior. Amsterdam: North Holland, 1980. SHAFFER, L. H. 1981: Performances of Chopin, Bach and Bartok: Stu dies in Motor Programming. Cognitive Psychology (1981) 13: 327-376. SHAFFER, L.H.; CLARKE, E. F. & TODD, N. P. 1985: Metre and Rhythm in Piano Playing. Cognition (1985) 20: 61-77. SHANNON, Claude E. & McCARTHY, John (Eds.) 1956/1974: Automata Studies. New Jersey: Princeton University Press, 1956. (Annals of Mathematic Studies, No. 34). (dt.) Studien zur Theorie der Auto maten. Erweiterte Ausgabe, Übersetzung durch Franz Kaltenheck und Peter Weibel. München: Rogner & Bernhard, 1974. SHARKEY, Noel E. 1988: Neural Network Learning Techniques, pp. 157-180. In: Michael F. McTear (Ed.), Understanding Cognitive -
441 Science. Chichester: Horwood, 1988. SIDTIS, John J. 1984: Music, Pitch Perception, and the Mechanisms of Cortical Hearing, pp. 91-114. In: Gazzaniga, Michael S. (Ed.): Handbook of Cognitive Neuroscience. New York: Plenum, 1984. SIMON, Herbert A. 1962: The Architecture of Complexity. Proceedings of the American Philosophical Society (1962) 106: 417-482. SIMON, Herbert A. 1968: Perception du pattern musical par AUDITEUR. Seiences de l'art, tome V-2, S. 28-34, 1964. SIMON, Herbert A. & SUMNER, Richard K. 1968: Pattern in Music, pp. 219-250. In: Kleinmuntz, Benjamin (Ed.): Formal Representation of Human Jugdement. New York/London: Wiley, 1968. SIMON, Herbert A. 1979: Information Processing Models of Cognition. Annual Review of Psychology (1979) 30: 363-396. SIMON, Herbert & ERICSSON, K. Anders 1984: Protocol Analysis. Cam bridge, Mass.: MIT, 1984. SINZ, Rainer 1978: Gehirn und Gedächtnis. Funktion und Leistung des menschlichen Gehirns. Stuttgart, New York: Fischer, 1978. SLOBODA, John A. 1982: Music Performance, pp. 479-496. In: Deutsch, Diana (Ed.): Psychology of Music. New York: Academic Press, 1982. SLOBODA, John A. 1985: The Musical Mind. The Cognitive Psychology of Music. Oxford: Carendon, 1985. SLOBODA, John A. 1986: Cognition and Real Music: The Psychology of Music Comes of Age. Psychologica Belgica (1986) 26: 199-219. SLOBODA, John A. 1988 (Ed.): Generative Processes in Music. The Psycho1ogy of Performance, Improvisation, and Composition. Ox ford: Clarendon Press, 1988. SMOLENSKY, P. 1987: Connectionist AI, Symbolic AI, and the Brain. Artificial Intelligence Review (1987) 112: 95-109. SMOLIAR, Stephen W. 1967: EUTERPE: A Computer Language for the Expression of Musical Ideas. Artificial Intelligence Memo No. 129, Project MAC, Massachusetts Institute of Technology, April, 1967. SMOLIAR, Stephen W. 1971a: A Parallel Processing Model of Musical Structures. AI TR-242, Massachusetts Institute of Technology Ar tificial Intelligence Laboratory, September, 1971. SMOLIAR, Stephen W. 1971b: Using the EUTERPE Music System. Arti ficial Intelligence Memo No. 243, Massachusetts Institute of Technology, Artificial Intelligence Laboratory, September 1971. SMOLIAR, Stephen W. 1972: Music Theory - A Programming Linguistic Approach. Proceedings of the 25th Anniversary Conference of the Association for Computing Machinery (1972): 1001-1014. SMOLIAR, Stephen W. 1973a: Basic Research in Computer-Music Stu dies. Interface (1973) 2: 121-125. SMOLIAR, Stephen W. 1973b: A Data Structure for an Interactive Music
442 System. Interface (1973) 2: 127-140. SMOLIAR, Stephen W. 1974a: EUTERPE-8: A PDP-8-Based Music Pro cessor. Technical Report, The Moore School of Electrical Engi neering, University of Pennsylvania, 1974. SMOLIAR, Stephen W. 1974b: Process Structuring and Music Theory. Journal of Music Theory (1974) 18/1: 308-337. SMOLIAR, Stephen W. 1976a: Music Programs: An Approach to Music Theory Through Computational Linguistics. Journal of Music Theo ry (1976) 20/1: 105-131. SMOLIAR, Stephen W . 1976b: Schenkerian Analysis without Angst. Music Project Report No. 8, Department of Computer and Information Science, University of Pennsylvania, 1976. SMOLIAR, Stephen W 1977: SCHENKER: A Computer Aid for Analysing Tonal Music. SIGLASH Newsletter (1977) 10/1-2: 30-61. SMOLIAR, Stephen W. 1979: A Computer Aid for Schenkerian Analysis. Proceedings of the ACM (Association for Computing Machinery) 79 National Conference, 1979, pp. 110-159. SMOLIAR, Stephen W. 1980: A Computer Aid for Schenkerian Analysis. Computer Music Journal (1980) 4/2: 41-59. SMOLIAR, Stephen W. 1986: Review: Musical Grammars and Computer Analysis, M . Baroni and L. Callegari. Journal of Music Theory (1986) 30/1: 130-141. SMOLIAR, Stephen W. 1989: Lewin's Model of Musical Perception Re flected by Artificial Intelligence. Computers in Music Research (1989) 1: l-37. SMOLIAR, Stephen W. 1990a: Cognitive Musicology. To: Music-Rese arch, uk.ac.oxford.prg Subject: Cognitive musicology From: Stephen Smoliar «Smoliar, ed. isi.vaxa» Date: Thu, 25, Jan 90 20:49:54 PST SMOLIAR, Stephen W. 1990b: The Mental Processes of Musical Compo sition, p. 171-178. Preprint of the Acts of the Conference "Music and Information Technology" - MAI 90 - 3-6 octobre, Marseille (France), 1990. SPITZER, John 1989: Grammar of lmprovised Ornamentation: Jean Rous seau's Viol Treatise of 1687. Journal of Music Theory (1989) 3312: 299-332. STEEDMAN, Mark J. 1973: The Formal Description of Musical Percepti on. Unpublished Ph. D. thesis, Edinburgh University, 1973. STEEDMAN, Mark J. 1917: The Perception of Rhythm and Metre in Mu sic. Perception (1977) 6: 555-569. STEEDMAN, Mark J. 1984: A Generative Grammar for Jazz Chord Se quences. Music Perception (1984) 2/1: 52-77. STEELS, L. 1979: Reasoning Modeled as a Society of Communicating Experts. Al-TR-542, Cambridge Massachusetts, Artificial lntelli gence Laboratory, MIT, 1979. ..
443 STEGMÜLLER, Wolfgang 1973: Unvollständigkeit und Unentscheidbarkeit. Die metamathematischen Resultate von Gödel, Church, Kleene, Rosser und ihre erkenntnistheoretische Bedeutung. Wien, New York: Springer, 1973. STEGMÜLLER, Wolfgang 1983: Probleme und Resultate der Wissen schaftstheorie und Analytischen Philosophie, Bd. 1 : Erklärung, Begrün dung, Kausalität. 2. Auf!. Heidelberg, New York: Springer, 1983. STEINBUCH, Kar! 1961: Künstliche Intelligenz. Studium Generale (1961) 14: 400-407. STEPHAN, Rudolf (Ed.) 1957: Artikel: Musikwissenschaft, 236-238 in: Musik. Das Fischer Lexikon, Bd. S. Frankfurt a. M.: Fischer, 1957. STEVENS, Charles F. 1986: Die Nervenzelle, pp. 3-14. In: Gehirn und Nervensystem. Heidelberg: Spektrum der Wissenschaft, 1986 7 . STOFFER, Themas 1980: Mathematisierung in der Musikwissenschaft: Ei ne Bibliographie zur quantitativ-statistischen und algebraisch-for malen Analyse musikalischer Strukturen, pp. 198-222. Matthäus, Wolfgang (Ed.): Glottometrika 3 . Bochum: Studienverlag Dr. N. Brockmeyer, 1980. (Quantitative Linguistics, Vol. 5 ) STOFFER, Thomas 1981: Wahrnehmung und Repräsentation musikalischer Strukturen. Funktionale und strukturelle Aspekte eines kognitiven Modells des Musikhörens. (Dissertation Bochum), 1981. STOFFER, Thomas 198Sa: Parallelen zwischen Ernst Kurths Konzeption der Musikpsychologie und der gegenwärtigen Entwicklung einer kognitiven Musikpsychologie, pp. 87-99. In: K.-E. Behne, G. Klei nen & H. de la Motte-Haber (Eds.): Musikpsychologie - Empiri sche Psychologie - Empirische Forschungen - Ästhetische Experi mente. Jahrbuch der Deutschen Gesellschaft für Musikpsychologie Bd. 2 . Wilhelmshafen: Heinrichshofen's Verlag, 1985. STOFFER, Themas 198Sb: Modelle der kognitiven Verarbeitung und Re präsentation musikalischer Strukturen, pp. 1 47-184. In: Neumann, Odmar (Ed.): Perspektiven der Kognitionspsychologie. Berlin: Sprin ger, 1985. STOFFER, Thomas H. 1990a: Perspektiven konnektionistischer Modelle: Das Neuronale Netzwerk als Metapher im Rahmen der kogniti onspsychologischen Modellbildung, pp. 275-304. In: Meinecke, C. & Kehn, L. (Ed.): Sielefelder Beiträge zur Kognitionspsychologie. Göttingen: Hofgrebe, 1990. STOFFER, Themas H. 1990b: Musik als Sprache: Eine nicht unumstrittene Analogie und ihr .heuristischer Nutzen für die kognitive Psychologie. Sprache & Kognition (1990) 9: 59-71. STOYAN, Herbert & GÖRZ, Günter 1986: LISP. Eine Einführung in die Programmierung. Berlin: Springer, 1 . korrigierter Nachdruck 1986. STOYAN, Herbert 1988: Programmiermethoden der Künstlichen Intelli genz, Bd. 1. New York: Springer, 1988.
444 STROH, Wolfgang Martin 1974: Mathematik und Musikterminologie, pp. 33-54. In: Eggebrecht, H. H. (Ed.): Zur Terminologie der Musik des 20. Jahrhunderts. Stuttgart, 1974. STROH, Wolfgang Martin 1990a: NZ-Forum-Computer Musik (3): Musi kalische Rebellion gegen Musikcomputer? Zur Begründung des Musik projektes "Brain & Body". Neue Zeitschrift fl.ir Musik (1990) 151/5: 3-9. STROH, Wolfgang Martin 1990b: Midi-Experimente und Algorithmisches Komponieren - eine Anleitung zum kreativen Programmieren und Komponieren am Computer. Ein Lehrgang fl.ir den Atari ST. Ber lin: Musiklabor, 1990. STROHSCHNEIDER, Stefan & SCHAUB, Harald 1988: Konnektionismus und Kognitive Psychologie. Memorandum No. 64. Lehrstuhl Psycho logie an der Universität Bamberg. Projekt Mikroanalyse. DFG 200/S-7. STUMPF, Carl 1883: Tonpsychologie, Bd. I. Leipzig, 1883. STUMPF, Carl 1888: Kritiken und Referate: W. Wundt. Grundzüge der physiologischen Psychologie. - E. Luft. Über die Unterschiedsem pfindlichkeit für Tonhöhen. Vierteljahresschrift für Musikwissen schaft (1888) 4: 540-550. STUMPF, Carl 1907a: Erscheinungen und psychische Funktionen, pp. 1-40. Abhandlungen der Königlich Preussischen Akademie der Wissen schaften. Philosophisch-historische Klasse, 1906. Berlin: Verlag der Königlichen Akademie der Wissenschaften, 1907. STUMPF, Carl 1907b: Zur Einteilung der Wissenschaften. Aus den Ab handlungen der Königlich Preussischen Akademie der Wissenschaf ten vom Jahre U 906. Berlin: Verlag der Königlichen Akademie der Wissenschaften, 1907. STUMPF, Carl 1918: Empfindung und Vorstellung, pp. 17-116. Abhandlun gen der Königlich Preussischen Wissenschaften. Jahrgang 1918. Philosophisch -Historische Klasse Nr. 1 . Berlin: Verlag der König lichen Akademie der Wissenschaften, 1918. STUMPF, Carl 1939: Erkenntnislehre, Bd. 1 . Leipzig: Barth, 1939. STUMPF, Carl 1940: Erkenntnislehre, Bd. 2. Leipzig: Barth, 1940. SUNDBERG, Johan & LINDBLOM, Björn 1976: Generative Theories in Language and Music Description. Cognition (1976) 4: 99-122. SUNDBERG, Johan & LINDBLOM, Björn 1991: Generative Theories for Describing Musical Structure, pp. 245-272. Howell, Peter; Robert West & Ian Cross (Eds.): Representing Musical Structure. London: Academic Press, 1991. SUNDBERG, Johan; Lennart NORD & Rolf CARLSON (Eds.) 1991: Music, Language, Speech and Brain. Proceedings of an International Symposium at the Wenner-Gren Center, Stockho1m, S-8 Septem ber 1990. London: Macmillan, 1991. SUPPES, Patrick 1966: The Uses of Computers in Education, pp. 157-174. In: Flangan, Dennis (Ed.) Information. A Scientific American Book.
445 San Francisco: Freeman, 1966. (dt.) Suppes, Patrick. Anwendungen elektronischer Rechenanlagen im Unterricht, pp. 157-172. In: In formation, Computer und künstliche Intelligenz. Frankfurt a. M.: Umschau, 1967. SZEIDER, Stefan H. 1990: The Semanlies of Musical Scores - an Approach to the Mechanical Composition of Microtonal Music. Interface (1990) 19: 175-184. TARUSKIN, Richard 1989: Reply to Brown and Dempster. Journal of Mu sic Theory (1989) 33/1: 155-164. TERHARDT, Ernst 1974: Pitch, Consonance and Harmony. The Journal of the Acoustical Society of America (1974) 55/4: 1061-1069. TERHARDT, Ernst 1976/77: Ein psycheakustisch begründetes Konzept der musikalischen Konsonanz. Acustica (1976/77) 36: 121-137. TERHARDT, Ernst 1979: Calculating Virtual Pitch. Hearing Research (1979) 1 : 155-182. TERHARDT, Ernst 1982: Oie psycheakustischen Grundlagen der musikali schen Akkordgrundtöne und deren algorithmische Bestimmung, pp. 23-50. Tiefenstruktur der Musik. Festschrift für Winckel. Berlin, 1982. TERHARDT, Ernst 1986: Methodische Grundlagen der Musiktheorie. Mu sicologica Austriaca (1986) 6: 107-126. TERHARDT, Ernst 1991: Music Perception and Sensory Information Ac quisition: Relationships and Low-Level Analogies. Music Perception (1991) 8/3: 217-240. TEUBER, Hans-Lukas 1961: Perception, p. 1595-1668. In: Field, John et al. (Eds.): Handbook of Physiology. A Critical, Comprehensive Pre sentation of Physiological Knowledge and Concepts. Section 1 : Neurophysiology, Vol. III, 1961. Washington, D.C.: American Phy siological Society 1961. THIES, Wolfgang 1987: Der Computer - ein neues Musikinstrument?, pp. 131-157. In: Batet, Günther; Kleinen, Günter & Salbert, Dieter: Computermusik: Theoretische Grundlagen - Kompositionsgeschicht liche Zusammenhänge - Musiklernprogramme. Laaber: Laaber, 1987. TODD, N. P. 1988: A Sequential Network Design for Music Applications. Touretzky, D., Hinton, G. & Sejnowski, T. (Eds.): Proceedings of the 1988 Connectionist Summer School. Menlo Park: Morgan Kaufmann, 1988. TODO, P. M. & LOY, D. G. (Eds.) 1991: Music and Connectionism. Cambridge, Mass.: MIT-Press, 1991. TROST, Harald 1984: Wissensrepräsentation in der Al am Beispiel Se mantischer Netze, pp. 47-72. In: Richter, L. & Stucky W. (Eds.): Leitfäden der angewandten Informatik: Artificial Intelligence - Ei ne Einführung. Stuttgart: Teubner, 1984.
446 TURING, Alan 1936/37/1987: On Computable Numbers, with an Applica tion to the Entscheidungsproblem. Proceedings of the London Ma thematical Society (1936-37) ser. 2, vol. 42: 230-265; corrections, lbid. (1937) vol. 45: 544-546. Wieder abgedruckt in: Davis, Martin (Ed.): The Undecidable. Basic Papers on Undecidable Propositions, Unsolvable Problems and Computable Functions. New York: Raven, 1965, pp. 116-154. (dt.) Über berechenbare Zahlen mit einer An wendung auf das Entscheidungsproblem, pp. 1 9 - 60. In: Dotzler, Bernhard & Kittler, Friedrich (Eds.): Alan M . Turing. Intelligence Service. Schriften. Berlin: Brinkman & Bose, 1987. TURING, Alan 1939/1965: Systems of Logic Based on Ordinals. Procee dings of the London Mathematical Society (1939) ser. 2, vol. 45: 161-228. Abgedruckt in: Davis, M. (Ed.): The Undecidable. Basic Papers on Undecidable Propositions, Unsovable Problems and Com putable Functions. New York: Raven, 1965, pp. 155-222. TURING, Alan 1950/1987: Rechenmaschinen und Intelligenz, pp. 147-182. In: Dotzler, B . & Kittler, F. (Eds.): Turing, Alan M . Intelligence Service. Schriften. Berlin: Brinkmann & Bose, 1987. (eng!.) Com puting Machinery and Intelligence. Mind (1950) 59. ULRICH, John Wade 1.977: The Analysis and Synthesis of Jazz by Com puter. Sth International Joint Conference on Artificial Intelligen ce-1977. IJCAI -77, 22-25 August. Proceedings of the Conference (1977) Volume 2 : 865-872. VECCHIONE, Bernard 1990a: Les science et !es technologies de Ia mu sique: La revolution musicologique des annees 1970-1980, pp. 69-128. In: Preprint of the Acts of the Conference "Music and Information Technology" - MAI 90 - 3-6 octobre, Marseille (France), 1990. VECCHIONE, Bernard 1990b: L'Analyse Metaformalisante, pp. 319-342. In: Preprint of the Acts of the Conference "Music and Informati on Technology" - MAI 90 - 3-6 Octobre, Marseille (France), 1990. VOGEL, Martin 1975: Die Lehre von den Tonbeziehungen mit einem Ta felanhang von Martin Käh1er. (Orpheus Schriftenreihe zu Grund fragen der Musik, Bd. 16). Bonn - Bad Godesberg: Verlag für sy stematische Mus.ikwissenschaft, 1975. VOGEL, Martin 1984: Anleitung zur harmonischen Analyse und zu reiner Intonation. (Orpheus Schriftenreihe zu Grundfragen der Musik, Bd. 34 ) Bonn - Bad Godesberg: Verlag für systematische Musikwis senschaft, 1984. .
WALLIN, NILS C. 1991: Biomusicology. Neurophysiological, Neuropsycho logical, and Evolutionary Perspectives on the Origins and Purposes of Music. Stuyvesant, NY: Pendragon, 1991. WASSERMANN, Philip D. 1989: Neural Computing. Theory and Practice.
447 New York: Van Nestrand Reinhold, 1989. WEBB, Judson Chambers 1980: Mechanism, Mentalism and Metamathe matics. An Essay on Finitism. Dordrecht: Reidel, 1980. WEHNER, Karlheinz 1980: Einblick in die cerebralen Grundlagen bei der Verarbeitung von Musik. Musiktherapeutische Umschau (1980) 1 : 123-140. WEIZENBAUM, Joseph 1976/ 1980: Die Macht der Computer und die Ohnmacht der Vernunft. Frankfurt a. M.: Suhrkamp, 2. Auflage 1980. (engl.) Computer Power and Human Reason. From Judgement to Calculation. Freeman, 1976. WELLEK, Albert 1933: Ernst Kurth: "Musikpsychologie". Berlin 1931, Max Hesses Verlag. Acta Musicologica (1933) V/I: 72 - 30. WELLEK, Albert 1934: Musik. (Krueger Festschrift). Neue Psychologische Studien (1934) 12/1. WELLEK, Albert 1948: Begriff, Aufbau und Bedeutung einer Systemati schen Musikwissenschaft. Die Musikforschung (1948) I: 157 - 171. WELLEK, Albert 1963: Psychologie. Bern: Francke, 1963. WENDER, Kar! Friedrich 1988: Semantische Netze als Bestandteil ge dächtnispsychologischer Theorien, pp. 55-73. In: Mandl, Heinz & Spada, Hans (Hrsg.): Wissenspsychologie. München/Weinheim: Psychologie Verlags Union, 198 8 . WESSEL, David 1979: Timbre Space a s a Musical Control Structure. Computer Music Journal (1979) 3/2: 42-52. WESSEL, David; FELCIANO, Richard; FREED, Adrian & WAWRZYNEK, John o. J.: The Center for New Music and Audio Technologies. Typoscript 5 Seiten. WEST, Robert; HOWELL, Peter & CROSS, Ian 1985: ModeHing Percei ved Musical Structure, pp. 21-52. In: Howell, Peter; Cross, Ian & West, Robert (Eds.): Musical Structure and Cognition. London: Academic Press, 1985. WEST, Robert ; CROSS, Ian & HOWELL, Peter 1987: Modelling Music as Input-Output and as Process. Psychology of Music (1987) 15/1: 7-29. WEST, Robert; HOWELL, Peter & CROSS, Ian 1991: Musical Structure and and Knowledge Representation, pp. 1-30. In: Howell, Peter; Robert West & Ian Cross (Eds.): Representing Musical Structure. London: Academic Press, 1991. WIDMER, Gerhard o . J.: A Knowledge-Intensive Approach to Machine Learning in Tonal Music: Learning to Write Two-Voice Counter point. Typoskript: Department of Medical Cybernetics and Artifi cial Intelligence, University of Vienna and Austrian Research In stitute for Artificial lntelligence, Vienna, o. J. WILLE, Rudolf 1980: Mathematische Sprache in der Musiktheorie, pp. 167-184. Jahrbuch Überblicke Mathematik 1980. WILLE, Rudolf 1985: Musiktheorie und Mathematik, pp. 4-31. In: Wille,
448 Rudolf & Götze, H. (Eds.): Musik und Mathematik. Berlin/Heidel berg/New York, 1985. WILLE, Rudolf 1990: Formale Begriffsanalyse diskutiert an einem Experi ment zum Musikerleben im Fernsehen, pp. 121-131. Musikpsycholo gie. Jahrbuch der Deutschen Gesellschaft für Musikpsychologie (1989) 6: 121-132. WINOGRAD, Terry 1968: Linguistics and the Computational Analysis of Tonal Harmony. Journal of Music Theory (1968) 12: 2-50. WINOGRAD, Terry 1972: Understanding Natural Language. Cognitive Psychology (1972) 3: 1-191. WINOGRAD, Terry 1975: Frame Representations and the Declarative/ Procedural Controversy. pp. 1 8 5-210. In: Bobrow, Daniel & Collins, Altan (Eds.): Representation and Understanding. Studies in Cogniti ve Science. New York: Academic Press, 1975. WINOGRAD, Terry & FLORES, Fernando 1986/1989: Erkenntnis - Ma schinen - Verstehen. Zur Neugestaltung von Computersystemen. Berlin: Rotbuch, 1989. (eng!.) Understanding Computers and Cogni tion. Ablex, 1986. WINSTON, Patrick Henry 1984: Artificial lntelligence. Reading, Mass.: Addison-Wesley, second edition 1984. WINSTON, Patrick Henry & HORN, Berthold Klaus Pau1 1989: LISP. Reading, Mass.: Addison-Wesley, third edition 1989. WIORA, Waller 1937/1972: Das musikalische Kunstwerk und die Syste matische Musikwissenschaft. pp. 223-226, Bd. 11. II. Congres In ternational d'Esthetique et de Science de I'Art. Paris: Alcan, 1937. Wieder abgedruckt in: Wiora, Walter: Historische und Systemati sche Musikwissenschaft. Ausgewählte Aufsätze von Waller Wiora. Tutzing: Schneider. 1972. WIORA, Waller 1948: Historische und systematische Musikforschung. The sen zu ihrer Zusammenarbeit. Die Musikforschung (1948) I : 171 -191. WIORA, Walter 1951: Der tonale Logos. Zu Handschins Buch "Der Ton charakter". Die Musikforschung (1951) IV: 1-35 u. 153-175. WIORA, Walter 1960: Die Fundierung der Allgemeinen Musiklehre durch die Systematische Musikwissenschaft. Musikalische Zeitfragen (1960) IX: 45-62. WIORA, Walter 1961: Musikalische Grundlagenforschung (Systematische Musikwissenschaft), pp. 1199-1203. Blume, Friedrich (Ed.): Die Musik in Geschieht� und Gegenwart. Allgemeine Enzyklopädie der Musik. Bd. 9. Delmel - Onslow. Kassel: Bärenreiter, 1961. WIORA, Walter (Ed.) 1962: Die Natur der Musik als Problem der Wis senschaft. Musikalische Zeitfragen X. Kassel: Bärenreiter, 1962. WIORA, Walter 1962a: Natur der Musik? Unnatur heutiger Musik?, pp. 7-18. Die Natur der Musik als Problem der Wissenschaft. Kassel: Bärenreiter, 1962.
449 WIORA, Walter 1962b: Nochmals: Die Natur der Musik und die Musik der Naturvölker, S. 112-122. Die Natur der Musik als Problem der Wissenschaft. Kassel: Bärenreiter, 1962. WIORA, Walter 1966: Albert Welleks "Grundriß der Systematischen Mu sikwissenschaft" und die Verbindung von systematischem und hi storischem Denken. Die Musikforschung (1966) XIX: 24 7-260. WIORA, Walter (Ed.) 1969: Die Ausbreitung des Historismus über die Musik. Aufsätze und Diskussionen. (Studien zur Musikgeschichte des 19. Jahrhunderts Bd. 14). Regensburg: Bosse, 1969. WIORA, Walter 1986: Zusammenhänge zwischen der Systematischen Mu sikwissenschaft und anderer Musikwissenschaft. Studien zur Syste matischen Musikwissenschaft. Hamburger Jahrbuch für Musikwis senschaft (1986) 9: 11-16. WOODS, W. A. 1975: What's in a Link: Foundations for Semantic Net works. In: Bobrow, D. G. & Collins, A. (Eds.): Representation and Understanding: Studies in Cognitive Science. New York: Academic Press, 1975. WRIGHT, James K. & BREGMAN, Albert S. 1987: Auditory Stream Se gregation and the Control of Dissonance in Polyphonie Music. Contemporary Music Review (1987) 2: 63-92. WUNDERLICH, Dieter 1974: Grundlagen der Linguistik. Reinbek: Ro wohlt, 1974. YOUNG, Richard M. 1979: Production Systems for ModeHing Human Cognition, pp. 35-45. In: Michie, Donald (Ed.): Expert Systems in the Micro-electronic Age. Edinburgh: Edinburgh University Press, 1979. ZANNOS, Ioannis 1991: Music Spaces: Generating Music with Cognitive Models. Typoscript Tokio, pp. 1-14, 1991. ZIMMERMANN, M. 1972: Sensorisches System, pp. 210-254. In: Schmidt, R. F. (Ed.): Grundriß der Neurophysiologie. Berlin: Springer, 1972.
450 LISTE DER ABBILDUNGEN Wright & Bregman Gabrielson et al. Hofstätter Ecke! Ecke! Keidel Keidel Rosenzweig & Leiman Ecke! Kahle Szentagothai Kahle Kahle Grüsser Schmidt Schmidt Arbib Keidel Keidel Schmidt Arbib Benesch Coker Canon perpetuus
1987, 1983, 1957, 1982, 1982, 1989, 1989, 1982, 1982, 1986, 1977, 1986, 1986, 1979, 1972, 1972, 1989, 1989, 1989, 1972, 1989, 1989, 1985,
67 201 259 74 76 160 160 281 67 229 238 227 227 258 3 92 55 156 ISS 51 53 61 Anhang C
Degli Anton i & Haus Kippen Kippen Kippen Franke!, Rosenschein & Smoliar Michon Jones, Miller & Scarborough
1985, 146 1988a, 144 1988a, 156 1988a, 157 1978, 137 1974, 19 1988, 260
s. s. s. s. s. s. s. s.
s.
33 34 45 47 48 49 49
so
s. s. s.
51 SI 53 54 54 55 57 59 61 61 62 63 63 183 211 225 226 228 238 239 240
s.
290
S.
s. s.
s. s. s.
s.
s. s. s. s. s.
s. s. s. s. s.
s. 319 s. 337
451 PERSONENREGISTER Abelson, Harold 293 f. Anderson, J. A. 305 f. Arbib, Michael 13, 66, 83, 159, 325, 376 Atlan, Henri 366 Babbitt, Milton 24, 27 Balaban, Mira 295 ff., 300 Bartlett, Frederic C. 304 Bel, Bernard 234 ff., 247, 367, 373 Bengtsson, I. 32 f., 364 Bischof, N. 52 Boretz, Benjamin 27 Braitenberg, Valentin 69, 84 f., 139 Brand!, Rudolph 324 Bregmann, A. 32, 364 Brentano, Franz v. 118., 179 Bruhn, Herbert 308 ff Burks, Artbur W. 42, 159, 161, 201 265 Cajal, R. I. 56 Camilleri, Lelio 1 8 , 367 Camurri, Antonio 216, 218, 367 Carnap, Rudoph 30 Cazimir, Bogdan 200, 215 Charniak, Eugene 42 Chisholm, Roderik 179 Chomsky, Noam 29, 97, 105, 106, 109 ff., 119, 123 f., 135, 173, 191, 369 f. Church, Alonzo 144, 171 Colby, Kenneth 52, 169 Cope, David 304 Craik, Kenneth 116, 119 Dahlhaus, Carl 21 Degli-Antoni, Giovanni 217 ff. Deliege, Irene 34 Descartes, Rene 172 Deutsch, Diana 29 Dowling, John 29
Ehrenfels, Christian
v.
184
Faltin, Peter 375 Feder, Georg 2:1 Flores, Fernando 42 Floros, Constantin 202 Förster, Heinz von 45, 85 Forte, Allen 27, 264 Freksa, Christian 306 Gabrielsson, Alf 32 f., 364 Galanter, Eugene 1 1 8 Gregory, R . L. 117 Greussay, Patrick 254, 259, 335, 367 Habel, Christopher 299, 306 Haeckel, Ernst 46 Halliday, M. A. K. 254 Hauss, Goffredo 217 ff. Hebb, Donald A. 53, 117, 309, 357 Helmholtz, Hermann v. 116, 200, 377 Hempel, Carl 30 f. Hesse, Horst-Peter 48 Hesse, Marie 376 Hofstadter,Douglas 316, 330 Jackendoff, Ray 37, 251, 254 f., 337 f., 341 f., 364, 373 James, William 74, 232 Jones, Jacqueline 36 7 Karbusicky, Vladimir 22 f., 30, 264 Kassler, M. 24 Khan, Kalifa (Ustad) Afaq Husain 237 f., 243, 248 f. Kippen, James 234 ff., 247, 367, 373 Kleene, Stephen Cole 98 f., 101, 103 ff., 113, 161 Krumhansl, Caro1 35, 364 Külpe, Oswald 271
452 Kunst, Jaap 201
Oppenheim, P. 30 f.
Laske, Otto E. 17, 254, 266, 334, 364, 369 Leman, Mare 17, 341 Lerdahl, Fred 37, 251, 255, 337 f., 364, 373 Lettvin, Jerome 180 f. Levitt, David A. 26 7 ff. Ligeti, György 276 Lindenmayer, Aristide 193 Lischka, Christoph 39, 200, 203 f., 215 f., 295, 341, 372 Lorente de No, R. 76 Longuet-Higgins, Christopher H. 17, 207, 254, 270, 367
Palm, Günther 76 Papert, Seymour 16, 341 Pitts, Walter 64, 68 ff., 82 ff., 97 ff., 103, 113, 342 Pope,Stephen 217 Post, Emil 28, 126, 129, 1 40, 144 f., 161, 171 Pribram, Kar! 118 Putnam, Hilary 41 f. Pylkkoe, Pauli 174 ff., 200, 206 f., 215 f., 254 Pylyshyn, Zenon W. 39
Machover, Todd 32, 267 Mackay, D. 46, 85 f., 119 Marr, David 173, 369 McAdams, Stephen 32, 364 McCarthy, John 18, 104, 149, 265 McCulloch, Warren St. 64, 68 ff., 82 ff., 97 ff., 103, 113, 161, 342, 366 McDermott, Drew 42 Metzger, Wolfgang 370, 377 Miller, George A. 11 8, 123 f. 367 Miller, Benjamin 0. Minsky, Marvin 75 f., 119, 146, 253, 265, 341 Mountcastle, V. 43
Rahn, John 27 Reitman, W. R. 271, 367 Riemann, Hugo 24 f., 200 ff., 377 Roads, Curtis 251, 268, 298 Roeder, John 295 Roederer, Juan G. 34, 52, 188 Rohwer, Jens 23 ff. Rosenblatt, Frank 342
Narmour, Eugen 291 Nattiez, Jean-Jaques 194 Nelson, R. J. 1 79 ff., 186, 188, 191 f. Neumaier, Wilfried 371 Neumann, John von 86 f., 159, 161 Newell, Allen 119, 122, 126, 159, 161 ff., 265, 342 Norman, D. 15 Oeser,Eugen 232
Quine, Willard van Orman 179, 366
Scarborough, Don 367 Schank, Roger 266, 306 Schenker, Heinrich 276, 373 Schmidt, R. F. 71 Schneider , Albrecht 22 f. Schnelle, Helmut 27 Schwartz, Jacob T. 77 Seidel, Elmar 277 Seifert,Uwe I 7 f., 27, 30 Seitetherger, Franz 232 Shaffer, L. H. 322, 326 Shannon, Claude 104 Shephard, Roger 35, 364 Sherrington, I. 56 Simon, Herbert A. 119, 122, 126, 159, 161 ff., 253, 265, 338, 342 359 Sloboda, John A. 271, 297, 306,
453 326, 328 Smoliar, Stephen 254, 271 ff., 296, 367, 372 Steedman, Mark 206 ff., 254, 266, 372 Steinbuch, Karl 18 Stoffer, Thomas H. 36 Stumpf, Carl 25, 200, 307, 375, 377 Sussmann, Gerald 293 f. Terhardt, Ernst 30 f., 34 Turing, Alan 126, 128 ff., 159, 161, 170 Vecchione, Bernard 250 Vogel, Martin 29 Waldemeyer H. 56 Wellek, Albert 24 Widmer, Gerhard 295 Wille, Rudolph 28, 201, 364, 371 Winograd, Terry 41, 251 ff., 264, 267, 269, 291, 296, 299 f., 367 Wiora, Waller 23 ff., 363 f., 368, 376 f., Wundt, Wilhelm 307 ,
Zaccaria, Renato 218
454 SACHREGISTER Ableitungsbaum s. Strukturbeschreibung Aktkonzept 118, 375 Akzeptor 98, 101, 108, 184 Algorithmus 86, 115, 116, 122, 126 f., 140 f., 144 ff., 365, 368 Alles-oder-Nichts-Prinzip 64 analysis by synthesis 116 artificial intelligence s . Künstliche Intelligenz artificial life 341 auditory stream segregation 32 f., 364 augmented transition network (ATN) 304, 371 f. Ausdruck regulärer 99 f., 104 symbolischer !SI, 156, 158, 167 Aussagenlogik 94 f. automata theory s . Automatentheorie automated composition s. Computermusik Automat abstrakter 236 s. Akzeptor endlicher 88, 90 ff., 101 ff., 108 f., 112 f., 115, 123 f., 129 f., 132, 136, 139, 174, 325, 365 s. Mealy-Automat s. Moore-Automat endlich-stochastischer 106 s. Generator s. Transduktor s . Turingmachine s. Wang-Maschine Automatentheorie abstrakte 88 strukturelle 88 Babbages These 85 ff., 125, 146, 171, 366
Bahnung 68, 77 Begriffsanalyse formale 28 Begriffsexplikation 30 f. Behaviorismus 117, 330 subjektiver 118 Beweis indirekter 79 Binäraddierer 91, 95, 98 blackboard-Modell 265, 292, 332 f., 335 f., 338 f., 357, 374 black box 4 3 f. bol-Prozessor 234, 247 Boolesche Funktionen s . Aussagenlogik Box-Notation 143 cell assernblies 53, 56, 117, 309 Church-Turing-These 144, 146 f., 171 f., 355, 366 cognition s. Kognition cognitive science(s) s. Kognitionswissenschaft column s . Modul-Konzept Computer 82, 86, 91, 95, 97, 99, 115, 122, 124, 126 f., 141, 144 f., 158, 161, 163, 236, 365 und Gehirn 96, 168 computer aided composition (CAC) s. Computermusik computer assisted instruction (CA!) s. Computermusik Computerbildung 15, 16 computer Iiteracy s. Computerbildung Computermusik 1 4 , 16, 217, 230, 253, 267, 296, 363 computer study of music (CSM) 296 conceptual dependency 266, 306, 371
455 connectionism s. Konnektionismus constraints 26 7 f., 3 72 cooperative computation 334, 339 deklarativ/prozedural 274, 294, 298 f., 307, 367 f. Delta-Regel 344 Distribuierte Künstliche Intelligenz (DAI) 293, 357, 374 Divergenz-Konvergenz-Schaltung 4 8 Epistemologie experimentelle 366 naturalisierte 366 Ereignis reguläres 97 ff., 109 f., 365 Erwartung 179, 186 f. Erwerbsmodell 114 EUTERPE 272 f. Explikation s. Begriffsexplikation facilitation s. Bahnung Feedback 119 finite state language s. Ereignis, reguläres Flußdiagramm 122 ff. frame (Rahmen) 304, 306, 323, 371 f. Funktion 90 Boolesche 78, 80, 88, 90 effektiv berechenbare 128, 144, 147 partiell rekursive 128, 140 f., 144, 147, 149, 365 primitiv rekursive 141 ff., 1 4 7 Funktionalismus 86 Gatter 72 f., 93 Gedächtnis 74 f., 82, 112, 114 f., 297 Gehirnmodell (brain model) 83,
308 f. Generator 108 Gewebegrammatik 200, 203 Grammatik 29, 96 ff., 105 ff., 109, 174 f., 215, 251, 365 ff., 370 kontextfreie 110 lineare 110 links- und rechtslineare 97 f., 110, 175 reguläre 97 f., 108, 110 systemische 254 ff. Typ-3 1 1 2 Grid-Theory 338 HEARSAY 332, 334 Hebbsche Regel 357 f. Hierarchie 119 ff., 373 Hintergrund 284 Induktion 373 f. Informatik musikalische 17, 363 Introspektion 128 f., 366 f. IPL (information processing langua ge) 119, 161, 167, 343 Kalkül lOS ff. Klangfarbe s. Timbre Kognition 39, 172, 364 Kognitionswissenschaft 13, 39 ff., 87, 114, 119, 136, 140 f., 145, 149, 159, 161 ff., 169 f., 172, 250, 266, 291, 296, 363 ff., 374, 377 Kognitive Musikologie s. Kognitive Musikwissenschaft Kognitive Musikpsychologie 24, 35 f. 77, 271, 297, 306, 317, 324, 331, 347, 364, 369 Kognitive Musikwissenschaft 39, 116, 119, 127, 149, 203, 206, 250 f., 253, 341, 363 f., 367 f., 372 f., 357 ff. Kognitive Psychologie 141, 234, 250,
456 297, 305 f., 309, 317, 330 f., 340 f. Kompetenz 105, 111, 1 1 3 f., 116, 173, 175, 177, 191, 253, 368 Konnektionismus 77 f., 83, 331, 339 ff., 36 7 f. Konstruktsprache 27 Kontinuitätstheorie 56 Kreativitätsargument 112 Künstliche Intelligenz 13, 18, 265, 270 Kurzzeitgedächtnis 76, 7 8 Kybernetische These s . Babbages These Langzeitgedächtnis 76, 78 Lernen 77 f., 82, 328, 344, 355 ff. Lindenmayersystem 1 9 3 ff., 196 LISP (list processing) 119, 146 ff. , 161, 167, 250, 252, 258 f., 261, 265, 268, 271 f., 276, 278 f., 280, 283 f., 298 ff., 302 f., 315, 343, 347, 353 f., 365 Logik, musikalische 202 s. Aussagenlogik MAP (musical actors by petri-nets) 210, 230 Markoff-Kette lOS f., 112 McCulloch-Pitts-Netz 80, 82 ff., 88, 90, 98, 115, 1 2 9 , 365 McCulloch-Pitts-Neuron 81 ff., 88 Mealy-Automat 90, 92, 98 Mechanismus s. Neo-Mechanismus Media-Lab 267 Menge reguläre s. Ereignis, reguläres Mittelgrund 284, 286 f. Modell internes 118 Modellierung 293 f. kognitive 52, 309 neuronale 52
·
Modul 53, 55 Moore-Automat 90 Musikologie theoretische 368 f. Musiktheorie, generative 36 ff., 265, 271, 291 f., 297. 334 f., 339 ff., 359 Standardsprache 27 ff., 31, 37, 201, 364 systematische 21 ff., 363 f., 368 f., 372, 374, 377 Neo-Konnektionismus s. Konnektionismus Neo-Mechanismus 172, 235, 366, These 171, 191, 253 Nervennetz , formales s. McCulloch-Pitts Netz Netz assoziatives s . semantisches feed forward 346, 360 konnektionistisches 343 ff., 357 logisches 82, 88, 91, 95, 97 f., 103 f., 115, 365 neuronales 77 f., 80, 82 f., 88 f., 91, 97, 104, 341 semantisches 297 f., 303, 309, 371 f. neural computer s. Konnektionismus neural networks s . Konnektionismus Neuromusikologie 52, 368, 370, 375 Neuron 57 f. formales s. McCulloch-Pitts Neu ron Neuronentheorie 56 Neuroscience computational 8 3 Normalform disjunktive 80, 93 parallel distributed processing s. Konnektionismus
457 Parsing 264 PASCAL 334 Performanz 105 f., 111, 113 ff., 172 f., 232, 251, 368 Perzeptron 341, 347 Petri-Netz 217 f. phase sequences 56, 117, 309 Phrase-Marker s. Strukturbeschreibung Phrasenstrukturgrammatik 107 physical symbol system 42, 126, 1 47, 158 ff., 253, 339, 342, 365, 367 f. PLAN 1 1 7 ff., 122, 124, 317, 322 f., 325 f. probe tone method 35, 364 Produktionssystem 297, 304, 326 ff., 335 f., 357. 371 f. Programm 119, 122, 124, 145, 147, 169, 325 f. Programmiersprache s. LISP s. PROLOG s. IPL Programmverifikation 292, 323 PROLOG 295 ff., 298, 300 ff. Proposition 305, 309 ff., 316 propositional/pictorial 36 7 f. Protokollanalyse 2 70 f. prozedural s. deklarativ/prozedural Prozeß musikalischer 217 f., 227, 230, 272 ff., 367 Psychomusikologie 52, 368 f., 372 Psychophysisches Niveau 52, 370 Regel 97 f., 106, 108, 113 f., 135 f., 212 Rekursion 141 f., 156, 315 ff. Repräsentation 135 f., 145 cerebrale 52 mentale 52, 135, 173, 250 f., 307, 369 reverberierender Kreisprozeß 76
Rhythmusforschung empirische 33 f., 364 Schaltwerk 91 kombinatorisches 81 f., 93, 95, 97, 103 sequentielles 365 s. Netz, logisches Schema-Konzept 309 ff., 316, 323 Schließen, unbewußtes 116, 201 Schwellenwertfunktion 67 ff. Script (Drehbuch) 304, 306, 323 Selbsteinbettungsargument 109, 111, 115 Semantik 264 Semi-Thue System 97, 106 f., 176 Signalübertragung 60 ff. Sprache akzeptierte 99 formale 97, 141 generierte 107 f. natürliche 97, 105 ff., 112 f., 135 reguläre s. Ereignis, reguläres Struktur 90 Strukturbeschreibung 110 f., 1 1 4 Summation 6 2 symbolisch/subsymbolisch 242 f. Synapse 58 f. System formales s. Kalkül kombinatorisches s. Kalkül Tabla 237 ff. Timbre 32 Tonarterkennung 359 ff. Tonpsychologie 36 TOTE (test operate test exit) 1 1 8 ff.' 323 fif. Transduktor 88, 98, 133 Turingmaschine 86, 88, 112 f., 116, 128 f., 132 ff., 140, 144, 172, 365 als endlicher Automat 132 Unmöglichkeitsbeweis 78
458 Ursatz 277 f., 281, 283 Verfahren, mechanisches s . Algorithmus Von-Neumann-Rechne-r 95, 103, 141, 159 f., 338 f. Vordergrund 289 f. Vorstellung musikalische 306 f. Vorverarbeitung (prep:rocessing) 50, 180 Wahrnehmung 115 f., 179, 276, 292 f., 316 f., 332, 371 als Hypothesenbildung 1 1 5 ff. Wang-�aschine 132, 137 web grammars s. Gewebegrammatik Widrow-Hoff-Regel s. Delta-Regel Wissen deklaratives 328 r. prozedurales 328 f. Wissenserwerb 249 f., 270 Wissenspsychologie 297 Wissensrepräsentation 297, 299, 304, 357 analog/pictoral 305 propositional 305 xor-Funktion 78 ff. 34 7 f., 350, 354 s. Aussagenlogik Zentralnervensystem (ZNS) 4 4 ff. Zustandsgraph 92, 103, 123, 177
Die Bände der
ORPhEUS - Schriftenreihe
zu Grundfragen der Musik
Martin Vogel, Die Intonation der Blechbläser. Neue Wege im Metallblasinstru mentenbau, 104 Seiten Band 2 Martin Vogel, Der Tristan - Akkord und die Krise der modernen Harmonielehre, 163 Seiten Band 3 Martin Vogel, Die Enharmonik der Griechen, Teil 1: Tonsystem und Notation, 152 Seiten Band 4 Martin Vogel, Die Enharmonik der Griechen, Teil 2: Der Ursprung der Enhar monik, 189 Seiten Adriaan D. Fokker, Neue Musik mit 31 Tönen, 89 Seiten; englische Ausgabe: Band 5 New Music with 31 Notes, translated by Leigh Gerdine. 95 Seiten Band 6 Giuseppe Tartini, Traktat über die Musik gemäß der wahren Wissenschaft von der Harmonie, übersetzt und erläutert von Alfred Rubeli, 397 Seiten Band 7 Rudolf Haase, Kaysers Harmonik in der Literatur der Jahre 1950 bis 1964, 162 Seiten Band 8 Martin Vogel, Die Zukunft der Musik, 231 Seiten Band 9 Renate Imig, Systeme der Funktionsbezeichnung in den Harmonielehren seit Hugo Riemann, 281 Seiten Alois Haba, Mein Weg zur Viertel- und Sechsteltonmusik, 125 Seiten, 9 Abb. Band 10 Band 11/12 Marianne Bröcker, Die Drehleier, ihr Bau und ihre Geschichte, 2. erweiterte Auflage, 2 Bände, 861 Seiten. 331 Abbildungen, 4 Faksimiles. 64 Notenbeispiele, 67 Zeichnungen im Text Band 13/14 Martin Vogel, Onos Lyras. Der Esel mit der Leier, 2 Bände, 740 Seiten, 190 Abb. Sigrun Schneider, Mikrotöne in der Musik des 20. Jahrhunderts. UntersuchunBand 15 gen zu Theorie und Gestaltungsprinzipien moderner Kompositionen mit Mikrotö nen, 317 Seiten, 9 Abbildungen Band 16 Martin Vogel, Die Lehre von den Tonbeziehungen, 480 Seiten Band 17 Cünter Schnitzler (Hg.), Musik und Zahl. Interdisziplinäre Beiträge zum Grenz bereich zwischen Musik und Mathematik, 297 Seiten Band 18 Albrecht Schneider, Musikwissenschaft und Kulturkreislehre. Zur Methodik und Geschichte der Vergleichenden Musikwissenschaft , 272 Seiten Band 19 Barbara Münxelhaus. Pythagoras Musicus. Zur Rezeption der pythagoreischen Musiktheorie als quadrivialer Wissenschaft im lateinischen Mittelalter, 286 Seiten, 30 Abbildungen Band 20/23 ·Nerner Danckert, Symbol, Metapher und Allegorie im Lied der Völker, aus dem Nachlaß herausgegeben von Hannelore Vogel, 4 Bände, 1584 Seiten Hellmuth Christian Wolff, Ordnung und Gestalt. Die Musik von 1900 bis 1950, Band 24 294 Seiten, 123 Notenbeispiele Band 25/26 Martin Vogel, Chiron, der Kentaur mit der Kithara, 2 Bände, 764 Seiten, 187 Abb. Wemer Danckert, Musik und Weltbild. Morphologie der abendländischen Musik, Band 27 aus dem Nachlaß herausgegeben von Marianne Bröcker, 472 Seiten, 144 Noten beispiele Jürgen Schläder, Undine auf dem Musiktheater. Zur Entwicklungsgeschichte der Band 2 8 deutschen Spieloper, SOS Seiten Band 2 9 Hannelore Thiemer, Der Einfluß der Phryger auf die altgriechische Musik, 178 Seiten, 20 Abbildungen Band 30 Martin Vogel, Musiktheater 1: Die Krise des Theaters und ihre Überwindung, 460 Seiten Martin Vogel, Musiktheater II: Lehrstücke, 464 Seiten Band 31 Band 3 2 Michael Hurte, Musik, Bild, Bewegung. Theorie und Praxis auditiv-visueller Kon vergenzen, 301 Seiten Band 33 Helmut Reis, Harmonie und Komplementarität. Harmonikale Interpretation des pythagoreischen Lehrsatzes, 272 Seiten Band
Die Blinde der
ORPhEUS-
Schriftenreihe zu G rundfragen der Musik
Martin Vogel, Anleitung zur harmonischen Analyse und zu reiner Intonation, 209 Seiten Martin Vogel, Schönberg und die Folgen. Die Irrwege der Neuen Musik, Teil I: Banb 35 Schönberg, 552 Seiten Band 36 Dorothea Baeumer , Victor Goldschmidts Harmonielehre der Kristalle, 223 Sei· ten Ruth Michels-Gebier, Schmied und Musik. Über die traditionelle Verknüpfung Band 37 von Schmiedehandwerk und Musik in Afrika, Asien und Europa, 201 Seiten Band 38 Heinz Gramann, Die Ästhetisierung des Schreckens in der europäischen Musik des 20. Jahrhunderts, 282 Seiten Band 39 Martin Vogel. Nietzsche und Wagner. Ein deutsches Lesebuch, 404 Seiten Albrecht Schneider, Analogie und Rekonstruktion. Studien zur Methodologie der Band 40 Musikgeschichtsschreibung und zur Frühgeschichte der Musik, 442 Seiten Band 41 Wolfgang Voigt, Dissonanz und Klangfarbe. Instrumentationsgeschichtliche und experimentelle Untersuchungen, 238 Seiten Band 42 Alexander Pilipczuk, Elfenbeinhörner im sakralen Königtum Schwarzafrikas, 136 Seiten. 47 Abbildungen Band 43 Martin Vogel, Musiktheater 111: Vier weitere Lehrstücke, 432 Seiten Band 44 Kimiyo Powils·Okano, Puccinis "Madama Butterfly", 432 Seiten Band 45 Martin Vogel, Die enharmonische Gitarre, 264 Seiten Band 46 Eva Küllmer, Mitschwingende Saiten. Musikinstrumente mit Resonanzsaiten, 407 Seiten, 116 Abbildungen Band 47 Martin Vogel, Musiktheater IV: Mozacts Aufstieg und Fall, 372 Seiten, 57 Ab· bildungen Band 48 Ludwig Stoffels, Die Winterreise, Band 1: Müllers Dichtung in Schuberts Ver· tonung, 383 Seiten Band 49 Hans Engel, Die Stellung des Musikers im arabisch-islamischen Raum, 350 Sei· ten, 34 Abbildungen Band SO Martin Vogel, Musiktheater V: Stücke für Saizburg, 478 Seiten, 79 Abbildungen Band 51 The Archaeology of Early Music Cultures. Third International Meeting of the ICTM Study Group on Music Archaeology, edited by Ellen Hickmann and David W. Hughes, 367 Seiten, 210 Abbildungen Band 52 Jutta Stüber, Die Intonation des Geigers, 371 Seiten Band 53 Karen Kopp, Form und Gehalt der Symphonien des Dimitrij Schostakowitsch, 439 Seiten Band 54 Helmut Reis. Der Goldene Schnitt und seine Bedeutung für die Harmonik.. 190 Seiten Band SS/56 Martin Vogel, Musiktheater VI/VII: Der Zauberflöte zweiter Teil, 2 Bände, 778 Seiten Band 57 Jutta Stüber, Mozarts Haydn-Quartette. lntonationsanalyse, 531 Seiten Band 58 Heribert Schröder, Tanz· und Unterhaltungsmusik. in Deutschland 1918-1933,426 Seiten, Faksimiles und Abbildungen Band 59 Günter Hartmann, Kar! Straube und seine Schule: "Das Ganze ist ein Mythos", 313 Seiten Band 60 Jutta Stüber, Beethovens Rasumowsky-Quartette op. 59. lntonationsanalyse, 369 Seiten Band 61 Martin Vogel, Die Naturseptime. Ihre Geschichte und ihre Anwendung, 510 Sei ten Band 62 Ludwig Stoffels, Die Winterreise, Band 2: Die Lieder der ersten Abteilung, 462 Seiten Band 63 Martin Vogel, Musiktheater Vlll: Der Lehrstücke dritte Folge, 354 Seiten Band 64 Regina Plate, Kulturgeschichte der Maultrommel, 235 Seiten Band 34
Die Bände der Band 65
Band 66 Band 67 Band 68
ORPbEUS
-
Schriftenreihe
zu
Grundfragen der Musik
Hermann Schwedes, Musikanten und Comödianten - eines ist Pack wie das an dere. Die Lebensformen der Theaterleute und das Problem ihreP bürgerlichen Akzeptanz, 422 Seiten Mark Lindley I Ronald Turner-Smith, Mathematical Models of Musical Scales. A New Approach, 308 Seiten Helmut Reis, Natur und Harmonik, 492 Seiten Jutta Stüber, Schuberts Quartett "Der Tod und das Mädchen".Anleitung zur Intona tionsanalyse