Grenzen der Mathematik
Dirk W. Hoffmann
Grenzen der Mathematik Eine Reise durch die Kerngebiete der mathematischen L...
405 downloads
1343 Views
14MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Grenzen der Mathematik
Dirk W. Hoffmann
Grenzen der Mathematik Eine Reise durch die Kerngebiete der mathematischen Logik
Autor Prof. Dr. Dirk W. Hoffmann Hochschule Karlsruhe Fakultät für Informatik und Wirtschaftsinformatik Moltkestraße 30 76133 Karlsruhe www.dirkwhoffmann.de
Wichtiger Hinweis für den Benutzer Der Verlag und der Autor haben alle Sorgfalt walten lassen, um vollständige und akkurate Informationen in diesem Buch zu publizieren. Der Verlag übernimmt weder Garantie noch die juristische Verantwortung oder irgendeine Haftung für die Nutzung dieser Informationen, für deren Wirtschaftlichkeit oder fehlerfreie Funktion für einen bestimmten Zweck. Der Verlag übernimmt keine Gewähr dafür, dass die beschriebenen Verfahren, Programme usw. frei von Schutzrechten Dritter sind. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag hat sich bemüht, sämtliche Rechteinhaber von Abbildungen zu ermitteln. Sollte dem Verlag gegenüber dennoch der Nachweis der Rechtsinhaberschaft geführt werden, wird das branchenübliche Honorar gezahlt.
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Spektrum Akademischer Verlag Heidelberg 2011 Spektrum Akademischer Verlag ist ein Imprint von Springer 11 12 13
14 15
5 4 3 2 1
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Planung und Lektorat: Dr. Andreas Rüdinger, Bianca Alton Redaktion: Dr. Michael Zillgitt Satz: Autorensatz Herstellung: Crest Premedia Solutions (P) Ltd, Pune, Maharashtra, India Umschlaggestaltung: SpieszDesign, Neu-Ulm Titelfotografie: © Nasa ISBN 978-3-8274-2559-1
Vorwort
Das Unmögliche zu erkennen, ist eine intellektuelle Leistung, die den Menschen einzigartig macht. In der Physik haben uns die Einstein’sche Relativitätstheorie oder die Heisenberg’sche Unschärferelation Grenzen aufgezeigt, die wir niemals überwinden werden. Die Ergebnisse sind negativ, und gerade deshalb verbreiten sie eine unwiderstehliche Faszination. Es ist das Unmögliche, das uns noch stärker zu fesseln vermag als das Mögliche. Auch die Mathematik ist von ähnlichen Negativresultaten betroffen. Die mathematische Logik des zwanzigsten Jahrhunderts hat fundamentale Erkenntnisse hervorgebracht, die uns die Grenzen dieser präzisen Wissenschaft in aller Klarheit vor Augen führen. So wissen wir heute, dass sich der Begriff der Wahrheit selbst für so einfache Theorien wie die Zahlentheorie nicht in Einklang mit dem Begriff der Beweisbarkeit bringen lässt. Es ist unmöglich, die Mathematik in einem formalen System einzufangen, in dem alle wahren mathematischen Aussagen bewiesen werden können. Dieses Buch entführt Sie auf eine Reise durch die Kerngebiete der mathematischen Logik. Es ist mein erklärtes Ziel, die Konzepte, Methoden und Ergebnisse dieser Disziplin in verständlicher Form offenzulegen, ohne einen Verlust an Tiefe zu erleiden. Wo immer es möglich ist, habe ich versucht, die Definitionen und Sätze mit Beispielen zu motivieren und durch zahlreiche Querbezüge in ihren sachlichen und historischen Kontext einzuordnen. Beweise von Sätzen, die nur am Rand eine Rolle spielen, sind bewusst nur skizzenhaft aufgenommen oder es wird darauf hingewiesen, wo ein Beweis nachgeschlagen werden kann. In diesem Sinn kann das vorliegende Buch die formal präzise Literatur aus dem Bereich der mathematischen Logik nicht an jeder Stelle ersetzen – und will es auch gar nicht. Allem anderen voran möchte ich die Faszination transportieren, die dieses Teilgebiet der Mathematik unzweifelhaft ausstrahlt. Sie, liebe Leser, müssen beurteilen, inwieweit mir dies gelungen ist. Für Hinweise zu Verbesserungsmöglichkeiten oder Fehlern bin ich jedem aufmerksamen Leser dankbar. An dieser Stelle möchte ich all denen meine Verbundenheit aussprechen, die mich während der Durchführung dieses ehrgeizigen Projekts unterstützt und damit zum Gelingen dieses Buchs beigetragen haben. Karlsruhe, im Oktober 2010
Dirk W. Hoffmann
Symbolwegweiser Definition Satz, Lemma, Korollar
Leichte Übungsaufgabe
Mittelschwere Übungsaufgabe
Schwere Übungsaufgabe
Lösungen zu den Übungsaufgaben In wenigen Schritten erhalten Sie die Lösungen zu den Übungsaufgaben: 1. Gehen Sie auf die Webseite www.dirkwhoffmann.de/GM 2. Geben Sie den neben der Aufgabe abgedruckten Webcode ein. 3. Die Musterlösung wird als PDF-Dokument angezeigt. Alternativ können Sie ein PDF-Dokument abrufen, das alle Musterlösungen gesammelt enthält.
Inhaltsverzeichnis
1 Historische Notizen 1.1 Wahrheit und Beweisbarkeit . . . . . . . . . . . 1.2 Der Weg zur modernen Mathematik . . . . . . . 1.2.1 Rätsel des Kontinuums . . . . . . . . 1.2.2 Auf den Spuren der Unendlichkeit . . 1.2.3 Macht der Symbole . . . . . . . . . . 1.2.4 Aufbruch in ein neues Jahrhundert . . 1.2.5 Grundlagenkrise . . . . . . . . . . . . 1.2.6 Axiomatische Mengenlehre . . . . . . 1.2.7 Hilberts Programm und Gödels Beitrag 1.2.8 Grenzen der Berechenbarkeit . . . . . 1.2.9 Auferstanden aus Ruinen . . . . . . . 1.3 Übungsaufgaben . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
1 1 7 7 13 27 31 36 42 44 53 61 67
2 Formale Systeme 2.1 Definition und Eigenschaften . . . . 2.2 Entscheidungsverfahren . . . . . . . 2.3 Aussagenlogik . . . . . . . . . . . . 2.3.1 Syntax und Semantik . . . 2.3.2 Aussagenlogischer Kalkül . 2.4 Prädikatenlogik erster Stufe . . . . . 2.4.1 Syntax und Semantik . . . 2.4.2 Prädikatenlogischer Kalkül 2.5 Prädikatenlogik mit Gleichheit . . . 2.6 Prädikatenlogik höherer Stufe . . . . 2.6.1 Syntax und Semantik . . . 2.6.2 Henkin-Interpretation . . . 2.7 Übungsaufgaben . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
71 71 83 87 87 93 102 103 108 111 116 116 120 123
. . . .
131 132 132 133 137
3 Fundamente der Mathematik 3.1 Peano-Arithmetik . . . . . . . . . . 3.1.1 Syntax . . . . . . . . . . . 3.1.2 Semantik . . . . . . . . . . 3.1.3 Axiome und Schlussregeln
. . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
VIII
3.2
3.3
Inhaltsverzeichnis
Axiomatische Mengenlehre . . . . . . . . . . . . . . . . . . . . 3.2.1 Zermelo-Fraenkel-Mengenlehre . . . . . . . . . . . . . 3.2.1.1 ZF-Axiome . . . . . . . . . . . . . . . . . 3.2.1.2 Das Auswahlaxiom . . . . . . . . . . . . . 3.2.1.3 Mengenlehre als Fundament der Mathematik 3.2.1.4 Einbettung der natürlichen Zahlen . . . . . 3.2.2 Ordinalzahlen . . . . . . . . . . . . . . . . . . . . . . 3.2.2.1 Definition und Eigenschaften . . . . . . . . 3.2.2.2 Der Unendlichkeit entgegen . . . . . . . . . 3.2.2.3 Ordnungstypen und Wohlordnungen . . . . 3.2.2.4 Transfinite Induktion . . . . . . . . . . . . 3.2.3 Kardinalzahlen . . . . . . . . . . . . . . . . . . . . . . Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . .
4 Beweistheorie 4.1 Gödel’sche Unvollständigkeitssätze . . . . . 4.2 Der erste Unvollständigkeitssatz . . . . . . 4.2.1 Arithmetisierung der Syntax . . . . 4.2.2 Primitiv-rekursive Funktionen . . . 4.2.3 Arithmetische Repräsentierbarkeit 4.2.4 Gödels Diagonalargument . . . . . 4.2.5 Rossers Beitrag . . . . . . . . . . 4.3 Der zweite Unvollständigkeitssatz . . . . . . 4.4 Gödels Sätze richtig verstehen . . . . . . . 4.5 Der Satz von Goodstein . . . . . . . . . . . 4.6 Übungsaufgaben . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
145 147 148 156 162 170 172 172 177 184 187 190 192
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
197 197 198 202 207 209 215 220 223 228 233 240
5 Berechenbarkeitstheorie 5.1 Berechnungsmodelle . . . . . . . . . . . . . . . . . 5.1.1 Turing-Maschinen . . . . . . . . . . . . . . 5.1.1.1 Erweiterungen des Basismodells 5.1.1.2 Alternative Beschreibungsformen 5.1.1.3 Universelle Turing-Maschine . . 5.1.2 Registermaschinen . . . . . . . . . . . . . . 5.2 Die Church’sche These . . . . . . . . . . . . . . . . 5.3 Grenzen der Berechenbarkeit . . . . . . . . . . . . . 5.3.1 Das Halteproblem . . . . . . . . . . . . . . 5.3.2 Der Satz von Rice . . . . . . . . . . . . . . Folgen für die Mathematik . . . . . . . . . . . . . . 5.4 5.4.1 Unentscheidbarkeit der PL1 . . . . . . . . . 5.4.2 Unvollständigkeit der Arithmetik . . . . . . 5.4.3 Hilberts zehntes Problem . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
243 244 244 248 250 253 258 261 268 268 271 273 274 281 289
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
IX
Inhaltsverzeichnis
5.5
5.4.3.1 Diophantische Repräsentierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . 292 5.4.3.2 Codierung von Registermaschinen . . . . . . . . . . . . . . . . . . . . . . . . 294 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
6 Algorithmische Informationstheorie 6.1 Algorithmische Komplexität . . . . 6.2 Die Chaitin’sche Konstante . . . . . 6.3 Unvollständigkeit formaler Systeme 6.4 Übungsaufgaben . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
313 314 322 332 335
7 Modelltheorie 7.1 Meta-Resultate zur Prädikatenlogik . . . . . . . 7.1.1 Modellexistenzsatz . . . . . . . . . . 7.1.2 Kompaktheitssatz . . . . . . . . . . . 7.1.3 Satz von Löwenheim-Skolem . . . . . 7.2 Nichtstandardmodelle von PA . . . . . . . . . . 7.2.1 Abzählbare Nichtstandardmodelle . . . 7.2.2 Überabzählbare Nichtstandardmodelle 7.3 Das Skolem-Paradoxon . . . . . . . . . . . . . 7.4 Boolesche Modelle . . . . . . . . . . . . . . . 7.4.1 Definition und Eigenschaften . . . . . 7.4.2 Ein einfacher Unabhängigkeitsbeweis . 7.5 Übungsaufgaben . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
339 340 343 345 349 352 353 356 363 370 371 376 383
. . . .
. . . .
. . . .
. . . .
. . . .
Literaturverzeichnis
391
Namensverzeichnis
399
Sachwortverzeichnis
403
1 Historische Notizen
„Mathematics takes us still further from what is human, into the region of absolute necessity, to which not only the world, but every possible world, must conform.“ Bertrand Russell [156]
1.1
Wahrheit und Beweisbarkeit
Wenige Dinge fesseln den Wissenschaftler so sehr wie die Rätsel der Natur. Von der Neugier getrieben, sind wir fortwährend auf der Suche nach Regeln und Strukturen in einer Welt, die mehr Fragen aufwirft als Antworten zulässt. Und trotzdem: Fassen wir die Entwicklungen der letzten Jahrhunderte zusammen, so blicken wir auf eine beachtliche Erfolgsbilanz zurück. Immer wieder ist es Wissenschaftlern gelungen, komplexe Sachverhalte auf einfachere, weniger komplexe Zusammenhänge zu reduzieren und auf diese Weise einer adäquaten Erklärung zuzuführen. Damit hat die Wissenschaft nicht nur unser tägliches Leben massiv verändert, sondern gleichsam die Grundlage geschaffen, auf der wir unser neuzeitliches Weltbild haben errichten können. Dass die Natur elementaren Regeln folgt, wurde bis zu Beginn des zwanzigsten Jahrhunderts von niemandem ernsthaft in Zweifel gezogen. Schließlich entspricht es sowohl unserer Intuition als auch unserer Erfahrung, dass jeder Wirkung eine Ursache vorausgeht und nichts in der Welt ohne Grund geschieht. Dieses Prinzip des zureichenden Grunds (lat. principium rationis sufficientis oder franz. principe de la raison suffisante) ist die unausgesprochene Grundannahme aller Naturwissenschaften. Ohne sie wäre die wissenschaftliche Methode ein stumpfes Schwert. Das Prinzip des zureichenden Grunds findet seine Personifizierung in Gottfried Wilhelm Leibniz, dem wahrscheinlich letzten Universalgelehrten der Welt (Abbildung 1.1). In Form eines metatheoretischen Grundsatzes ist das Prinzip eine tragende Säule in der Leibniz’schen Philosophie. Nach ihr ist die Welt, in der wir leben, die perfektest mögliche, eine Welt der vollständigen Harmonie, in der nicht nur jeder einzelne physikalische Vorgang eine Ursache, sondern auch jede metaphy-
„Im Sinne des zureichenden Grundes finden wir, dass keine Tatsache als wahr oder existierend und keine Aussage als wahr betrachtet werden kann, ohne dass ein zureichender Grund vorhanden wäre, warum es so ist und nicht anders“ [109]
Gottfried Wilhelm Leibniz (1646 – 1716) Abbildung 1.1: Gottfried Wilhelm Leibniz gehört zu den berühmtesten und außergewöhnlichsten Gelehrten des ausgehenden 17. und beginnenden 18. Jahrhunderts. Seine universelle Begabung war einzigartig. Zahllose Publikationen und Schriftwechsel aus den Bereichen der Philosophie, der Mathematik, den Naturwissenschaften sowie der Geschichts- und Rechtskunde bilden einen beispiellosen Nachlass.
2
1 Historische Notizen
sische Wahrheit eine Begründung besitzt. Demnach sind Aussagen niemals grundlos wahr und lassen sich stets durch andere Aussagen rechtfertigen, deren Wahrheit bereits bewiesen wurde.
Characteristica universalis
Calculus ratiocinator
Falsch
Wahr
Abbildung 1.2: Sein Leben lang war Leibniz von der Idee gefesselt, eine Universalsprache (Characteristica universalis) zu ersinnen, in der sich die Objekte, Konzepte und Beziehungen der realen Welt symbolisch erfassen lassen. Er war davon überzeugt, dass für diese Kunstsprache ein Regelwerk (Calculus ratiocinator) erschaffen werden könne, mit dem sich der Wahrheitsgehalt einer Aussage im Sinne einer mechanischen Prozedur systematisch berechnen lässt.
Mit seinem visionären Denken war Leibniz seiner Zeit weit voraus. Er träumte von einer Characteristica universalis, einer universellen Sprache, in der sich alle Facetten der menschlichen Erkenntnis in präziser Form erfassen lassen. Seine Sprache war nicht als Lautsprache konzipiert. Stattdessen hatte er eine symbolische Notation im Sinn, in der einzelne Alphabetzeichen Objekte oder Konzepte der realen Welt repräsentieren und die Beziehungen, die zwischen den Objekten oder Konzepten bestehen, auf der symbolischen Ebene sichtbar werden. Aufgrund der formalen Natur seiner Sprache war Leibniz überzeugt, dass der Wahrheitsgehalt von Aussagen durch die Anwendung eines festen Regelwerks, des Calculus ratiocinator, auf systematische Weise berechnet werden kann (Abbildung 1.2). Leibniz wusste um das Ausmaß seines ehrgeizigen Projekts und unternahm zu keiner Zeit den Versuch, sein großes Ziel allein zu erreichen. Nichtsdestotrotz hielt er konkrete Pläne für dessen Umsetzung bereit. In einem ersten Schritt galt es eine Enzyklopädie zu erstellen, die das gesamte bis dato verfügbare Menschheitswissen in sich vereint. Im zweiten Schritt war eine formale Sprache zu definieren, mächtig genug, um alle Konzepte und Beziehungen der erarbeiteten Wissensbasis zu beschreiben. Im letzten Schritt galt es, die logischen Schlussregeln auf die symbolische Ebene zu übertragen. Hierdurch wäre der formale Schlussapparat geschaffen, mit dem sich wahre Aussagen auf mechanische Weise erzeugen und verifizieren ließen. Leibniz war der festen Überzeugung, das Projekt mit einer Gruppe ausgewählter Wissenschaftler in rund fünf Jahren verwirklichen zu können. Zu Lebzeiten wurde ihm die Chance nie geboten, und so verblieb die Characteristica universalis im Reich der Träume. Als vielleicht größter Visionär seiner Zeit starb Gottfried Wilhelm Leibniz am 14. November 1716 im Alter von 70 Jahren – und mit ihm sein ehrgeiziges Projekt. Es sollte noch mehr als 200 Jahre dauern, bis sein Traum zumindest teilweise in Erfüllung ging. Im neunzehnten Jahrhundert führten die Fortschritte im Bereich der symbolischen Logik zu der Entwicklung formaler Systeme, die einer Characteristica universalis im Leibniz’schen Sinne in vielerlei Hinsicht nahe kommen. Heute sind wir mit der Aussagenlogik und der Prädikatenlogik im Besitz künstlicher Sprachen, mit denen wir mathematische Aussagen in symbolischer Form codieren und durch die Anwendung fest definierter Schlussregeln logische Folgerungen ableiten können. Beide Logiken sind Gegenstand von Kapitel 2. In Kapitel 3 werden wir auf der Prädikatenlogik die axiomatische Men-
1.1 Wahrheit und Beweisbarkeit
genlehre errichten. Diese wird sich als stark genug erweisen, um alle Gebiete der klassischen Mathematik zu beschreiben, und dient heute als formaler Unterbau für die gesamte moderne Mathematik. Mit der fortschreitenden Formalisierung der Mathematik rückten Fragestellungen in den Vordergrund, die sich nicht mit Theoremen befassten, die innerhalb eines formalen Systems abgeleitet werden konnten, sondern mit den Eigenschaften und Limitierungen der Systeme selbst. Zur Blüte reifte dieser Forschungszweig, den wir heute als Metamathematik bezeichnen, Anfang des zwanzigsten Jahrhunderts. Die seither gewonnenen Erkenntnisse sind gewaltig und zugleich verstörend. Bis in das zwanzigste Jahrhundert hinein zweifelte kaum ein Mathematiker ernsthaft daran, dass für jede mathematische Aussage ein Beweis oder ein Gegenbeweis gefunden werden kann, wenn nur lange genug danach gesucht wird. Dass Wahrheit und Beweisbarkeit in einem harmonischen Einklang stehen, war das ungeschriebene Dogma der Mathematik. Heute wissen wir, dass sich der Begriff der Wahrheit und der Begriff der Beweisbarkeit selbst für einfache Theorien wie die Zahlentheorie nicht in Kongruenz bringen lassen. Es ist unmöglich, die Mathematik in einem formalen System einzufangen, in dem alle wahren mathematischen Aussagen als solche bewiesen werden können. Die Erkenntnisse des zwanzigsten Jahrhundert haben unser mathematisches Weltbild von Grund auf verändert. Indem sie fundamentale Grenzen aufzeigen, die wir niemals werden überwinden können, haben sie in der Mathematik eine ganz ähnliche Bedeutung wie die Relativitätstheorie in der Physik. Heute wissen wir, dass ein Calculus ratiocinator nicht existieren kann. Die Leibniz’sche Vision einer mechanisierbaren Mathematik, so verlockend sie auch sein mag, ist ein Traum, der niemals Realität werden wird. Die Überlegungen, die zu diesem Ergebnis führen, sind der Inhalt dieses Buchs, und wir werden sie in den nächsten Kapiteln im Detail herausarbeiten. Soviel vorweg: Sie werden von so grundlegender Natur sein, dass es kein Entrinnen gibt; die Mathematik entzieht sich jedem formalen Korsett. An zwei Beispielen wollen wir demonstrieren, welche Auswirkungen sich für die gewöhnliche Mathematik ergeben. Vermutung 1.1 (Goldbach) Jede gerade natürliche Zahl n > 2 lässt sich als Summe zweier Primzahlen schreiben.
3
4
1 Historische Notizen
y
Goldbach'sche Vermutung V
12000
10000
Abbildung 1.3: Nach der Goldbach’schen Vermutung lassen sich alle geraden Zahlen n > 2 als Summe zweier Primzahlen schreiben. In dem nebenstehenden Diagramm sind die geraden natürlichen Zahlen auf der x-Achse und die Anzahl der möglichen Zerlegungen auf der y-Achse aufgetragen. Die Goldbach’sche Vermutung ist genau dann wahr, wenn die xAchse frei von Datenpunkten bleibt. Auch wenn vieles für die Wahrheit der Vermutung spricht, steht ein formaler Beweis bis heute aus.
8000
6000
4000
2000
0
Gerade natürliche Zahlen > 2 100000 200000 300000 400000 500000 600000 700000 800000
x
Die Goldbach’sche Vermutung gehört zu den ältesten und bedeutsamsten Problemen der Zahlentheorie (Abbildung 1.3). Benannt ist sie nach dem deutschen Mathematiker Christian Goldbach, der im Jahr 1742 in einem Brief an den Schweizer Mathematiker Leonhard Euler die These aufstellte, dass sich jede natürliche Zahl größer 2 als die Summe dreier Primzahlen1 schreiben lässt (Abbildung 1.4). Die hier formulierte Variante wird auch als starke Goldbach’sche Vermutung bezeichnet, da sich aus ihr die Gültigkeit der ursprünglich formulierten Variante ergibt. Das zweite Beispiel stammt ebenfalls aus dem Gebiet der Zahlentheorie und ist nicht weniger prominent: Vermutung 1.2 (Primzahlzwillinge) Es existieren unendlich viele Zahlen n mit der Eigenschaft, dass n und n + 2 Primzahlen sind. Tabelle 1.1 gibt eine Übersicht über die ersten 35 Primzahlzwillinge. Jede der beiden hier aufgeführten Vermutungen macht eine Aussage über die natürlichen Zahlen und ist entweder wahr oder falsch. Trotz1 In Goldbachs Definition ist die 1 ebenfalls eine Primzahl. Sonst wäre seine These bereits für den Fall n = 4 widerlegt.
5
1.1 Wahrheit und Beweisbarkeit
Aus dem Brief von Christian Goldbach an Leonhard Euler
Leonhard Euler (1707 – 1783) Abbildung 1.4: Im Jahr 1742 äußerte Christian Goldbach seine berühmte Vermutung in einem Brief an Leonhard Euler.
dem waren alle bisher getätigten Anstrengungen vergebens, sie zu beweisen oder zu widerlegen. Ob wir die Vermutungen mit den Mitteln der Zahlentheorie überhaupt beweisen oder widerlegen können, wissen wir nicht. Die Vehemenz, mit der sich beide einer Lösung bisher entzogen haben, mag den Verdacht der Unbeweisbarkeit nähren, Gewissheit liefert sie freilich nicht. Auch eine andere berühmte Vermutung der Zahlentheorie widersetzte sich über dreihundert Jahre lang allen Versuchen, sie zu beweisen. Im Jahr 1637 stellte der französische Mathematiker Pierre de Fermat die Behauptung auf, dass die Gleichung an + bn = cn für n > 2 keine Lösung in den ganzen Zahlen besitzt (Abbildung 1.5). Erst im Jahr 1995 konnte der Brite Andrew Wiles einen lückenlosen Beweis für die Taniyama-Shimura-Vermutung vorbringen, aus der sich der Fermat’sche Satz als Korollar ergibt [165, 195]. Ob für die Goldbach’sche Vermutung oder die Vermutung über die Existenz unendlich vieler Primzahlzwillinge doch noch ein Beweis gefunden werden wird, steht in den Sternen. Auch wenn sich die Anzeichen mehren [189, 191], herrscht bis heute Unsicherheit. Das Wissen über die Unvollständigkeit formaler Systeme ist die vielleicht größte Errungenschaft der mathematischen Logik des zwanzigsten Jahrhunderts und zweifelsfrei eine der verblüffendsten mathematischen Erkenntnisse überhaupt. In Kapitel 4 werden wir uns ausführ-
Primzahlzwillinge (3, 5) (5, 7) (11, 13) (17, 19) (29, 31) (41, 43) (59, 61) (71, 73) (101, 103) (107, 109) (137, 139) (149, 151) (179, 181) (191, 193) (197, 199) (227, 229) (239, 241) (269, 271) (281, 283) (311, 313) (347, 349) (419, 421) (431, 433) (461, 463) (521, 523) (569, 571) (599, 601) (617, 619) (641, 643) (659, 661) (809, 811) (821, 823) (827, 829) (857, 859) (881, 883) Tabelle 1.1: Die Primzahlzwillinge im Zahlenbereich zwischen 0 und 1000
6
Abbildung 1.5: Pierre de Fermat schrieb sein berühmtes lateinisches Zitat im Jahr 1637 an den Rand seiner Ausgabe der Arithmetica (siehe Abschnitt 1.2.1). Übersetzt lautet es wie folgt: „Es ist unmöglich, einen Kubus in zwei Kuben zu zerlegen oder ein Biquadrat in zwei Biquadrate oder allgemein irgendeine Potenz größer als die zweite in Potenzen gleichen Grades. Ich habe hierfür einen wahrhaft wunderbaren Beweis gefunden, doch ist der Rand hier zu schmal, um ihn zu fassen.“ Über 300 Jahre suchten Mathematiker erfolglos nach Fermats „wunderbarem Beweis“, und es gilt heute als sicher, dass kein kurzer Beweis für seine Vermutung existiert.
1 Historische Notizen
„Cubum autem in duos cubos, aut quadratoquadratum in duos quadratoquadratos, et generaliter nullam in infinitum ultra quadratum potestatem in duos eiusdem nominis fas est dividere. Cuius rei demonstrationem mirabilem sane detexi. Hanc marginis exiguitas non caperet.“
Pierre de Fermat (1607 – 1665)
lich mit dieser Thematik auseinandersetzen und die Schlüsselergebnisse sorgfältig herleiten. In Kapitel 5 werden wir noch einen Schritt weiter gehen und den Begriff der Beweisbarkeit um einen weiteren ergänzen. Die Rede ist von der Berechenbarkeit, einem Schlüsselbegriff, der für uns in zweierlei Hinsicht von Bedeutung ist. Zum einen wird er uns einen alternativen Weg aufzeigen, der uns einen schnelleren und eleganteren Zugang zu den Grenzen der Beweisbarkeit gewähren wird als jener, den wir in Kapitel 4 beschreiten. Zum anderen spielt er eine zentrale Rolle in der Informatik, wo sich die Grenzen der Berechenbarkeit ganz praktisch auswirken. Heute wissen wir, dass es unmöglich ist, einen Algorithmus zu formulieren, der für jedes vorgelegte Programm immer korrekt entscheidet, ob es eine gewisse funktionale Eigenschaft erfüllt oder nicht. Selbst so einfache Probleme wie die Frage nach der Existenz von Endlosschleifen liegen außerhalb des Berechenbaren. Genau dies ist der Grund, warum selbst die modernsten Compiler heute nicht viel mehr als eine syntaktische Prüfung der Quelltexte durchführen und nur wenige funktionale Fehler selbstständig erkennen. Auch hier sind wir mit einer ebenso grundlegenden wie unvermeidlichen Beschränkung konfrontiert, die wir nicht überwinden können.
1.2 Der Weg zur modernen Mathematik
1.2
7
Der Weg zur modernen Mathematik
Bevor wir uns voll und ganz den technischen Details der umrissenen Ideen widmen, wollen wir einen Rückblick auf die bewegte Geschichte der mathematischen Logik wagen. Nur so ist es möglich, die Ergebnisse adäquat einzuordnen und in ihrer gesamten Tragweite zu verstehen. Verlieren wir also keine Zeit!
1.2.1
Rätsel des Kontinuums
Wir beginnen unseren Streifzug durch die Geschichte der Mathematik im Griechenland des dritten Jahrhunderts. Dort entstand jenes dreizehnbändige Werk, das die Grundlagen der modernen Algebra schaffen sollte. Die Rede ist von der Arithmetica, einer Sammlung von über hundert algebraischen Rätseln und ihren Lösungen (Abbildung 1.6). Nur die Bände 1 bis 3 und 8 bis 10 sind heute noch im Original vorhanden. Für die Bände 4 bis 7 wurden arabische Übersetzung gefunden, die restlichen drei sind bis heute verschollen. Verfasst wurde die Arithmetica von Diophantos von Alexandria, von dessen Leben wir heute keine verlässliche Kenntnis haben. Lediglich ein Rätselvers aus der Zeit nach seinem Tod gibt uns zaghafte Hinweise über den Verlauf seines Lebens. In einer deutschen Übersetzung lautet er wie folgt [73]: „Wanderer, unter diesem Stein ruht Diophantos. Oh, großes Wunder, die Wissenschaft zeigt Dir die Dauer seines Lebens. Gott gewährte ihm die Gunst, den sechsten Teil seines Lebens jung zu sein. Ein Zwölftel dazu, und er ließ bei ihm einen schwarzen Bart sprießen. Ein Siebtel später war der Tag seiner Hochzeit, und im fünften Jahr ging aus dieser Verbindung ein Sohn hervor. Ach, bedauernswerter Jüngling: Er bekam die Kälte des Todes zu spüren, als er nur halb so alt war, wie sein Vater schließlich wurde. Vier Jahre danach fand dieser dann Trost für seinen Schmerz, und mit dieser Weisheit schied er aus dem Leben. Wie lange währte es?“ Bezeichnen wir das erreichte Alter des Diophantos mit x, so lässt sich der Rätselvers in die folgende Gleichung übertragen: x=
x x x x + + +5+ +4 6 12 7 2
Abbildung 1.6: Die Arithmetica ist ein dreizehnbändiges Werk, in dem Diophantos von Alexandria mehr als hundert algebraische Rätsel samt ihren Lösungen zusammentrug. Die allgemeine Lösbarkeit diophantischer Gleichungen ist Bestandteil des zehnten Hilbert’schen Problems, auf das wir in Abschnitt 5.4.3 im Detail zu sprechen kommen.
8
1 Historische Notizen
Die Multiplikation mit 84 eliminiert sämtliche Brüche: x
84x = 14x + 7x + 12x + 420 + 42x + 336
10 y
Damit können wir Diophantos’ Alter als die Lösung der Gleichung 370
x + y = 10 3
x + y3 = 370 Abbildung 1.7: Im vierten Band der Arithmetica stellte Diophantos die Aufgabe, die Seitenlängen x, y zweier Würfel so zu bestimmen, dass die Summe der Seitenlängen gleich 10 und die Summe der Würfelvolumina gleich 370 ist.
9x − 756 = 0
(1.1)
bestimmen und erhalten das Ergebnis x = 84. Ob Diophantos wirklich 84 Jahre alt wurde und den Schmerz verkraften musste, seinen eigenen Sohn sterben zu sehen? Wir werden es wahrscheinlich niemals mit Sicherheit wissen. Gleichung (1.1) ist ein einfaches Beispiel dessen, was wir heute als diophantische Gleichung bezeichnen. Im allgemeinen Fall hat eine solche Gleichung die Form p(x1 , x2 , . . . , xn ) = 0,
(1.2)
wobei p ist ein multivariables Polynom mit ganzzahligen Koeffizienten ist. Die Lösung einer diophantischen Gleichung ist die Menge der ganzzahligen Nullstellen von p. Wenn wir im Folgenden von diophantischen Gleichungen sprechen, werden wir, wo immer es sinnvoll erscheint, den Symbolvorrat geringfügig anpassen und z. B. x für x1 und y für x2 schreiben. Die Gleichung x1 3 + x2 3 + x1 + x2 − 380 = 0 liest sich dann beispielsweise so: x3 + y3 + x + y − 380 = 0
(1.3)
Gleichung (1.3) hat eine geometrische Bedeutung und löst ein Problem aus dem vierten Buch der Arithmetica. Wie in Abbildung 1.7 dargestellt, lassen sich x und y als die Seitenlängen zweier Würfel interpretieren, deren gemeinsames Volumen gleich 370 ist und die Summe ihrer Seitenlängen den Wert 10 ergibt. Mit x = 7, y = 3 und x = 3, y = 7 hat die Gleichung genau zwei Lösungen in den natürlichen Zahlen. Unendlich viele Lösungen besitzt z. B. die nachstehende diophantische Gleichung: x2 + y2 − z2 = 0
(1.4)
Sie beschreibt das im zweiten Buch der Arithmetica beschriebene Problem, ein Quadrat so in zwei Quadrate aufzuteilen, dass sich der Flächeninhalt nicht ändert. Die Lösungen dieser Gleichung sind die sogenannten pythagoreischen Tripel. Nach dem Satz des Pythagoras umfassen sie alle Dreiergruppen natürlicher Zahlen (x, y, z), die als Seitenlängen rechtwinkliger Dreiecke vorkommen (Abbildung 1.8).
9
1.2 Der Weg zur modernen Mathematik
Gleichung (1.4) können wir auf nahe liegende Weise verallgemeinern und erhalten mit x +y −z = 0 n
n
n
I Pythagoreische Tripel
x
(1.5)
jene legendäre Gleichung, die Pierre de Fermat zu seiner berühmten Vermutung veranlasste. Heute wissen wir, dass sie für n > 2 keine Lösung in den ganzen Zahlen besitzt. y
Beachten Sie, dass (1.5) keine gewöhnliche diophantische Gleichung ist, da die Variable n als Exponent auftaucht. Sie fällt in die größere Gruppe der exponentiellen diophantischen Gleichungen, die uns in Abschnitt 5.4.3 erneut begegnen wird. Dort werden wir uns ausführlich mit der Frage beschäftigen, ob sich die Lösbarkeit diophantischer Gleichungen durch ein systematisches Verfahren bestimmen lässt. Soviel vorweg: Wir werden eine verblüffende Antwort erhalten. Dass wir den Begriff der diophantischen Gleichungen heute ausschließlich dann verwenden, wenn wir Lösungen in den ganzen Zahlen suchen, wird seinem Namensgeber nur teilweise gerecht. Diophantos stellte den Leser der Arithmetica unter anderem vor das Problem, die pythagoreische Gleichung (1.4) für den Fall z2 = 16 zu lösen. Unter dieser Vor16 aussetzung hat die Gleichung mit 12 5 und 5 ausschließlich Lösungen in Q, der Menge der rationalen Zahlen. Genau wie die natürlichen Zahlen, die das Abzählen von Dingen ermöglichen, haben auch die rationalen Zahlen einen ganz praktischen Hintergrund: Sie entstehen immer dann, wenn zwei geometrische Längen p und q zueinander in Bezug gesetzt werden, und sind in diesem Sinne die algebraischen Grundbausteine der Geometrie. Wir wollen an dieser Stelle nicht vorschnell über die Tatsache hinweggehen, dass die Bruchschreibweise nur eine von mehreren Darstellungsmöglichkeiten ist. Beispielsweise können wir jede rationale Zahl qp auch in Form eines periodischen Dezimalbruchs schreiben: 1 8 1 3 1 1
= 0,125 = 0,1250 = 0,3333 . . . = 0, 3 = 1, 0 = 0, 9
Umgekehrt lässt sich jeder periodische Dezimalbruch systematisch in die Bruchdarstellung überführen. Um z. B. die Zahl x = 0,0238095 p q
(1.6)
in der Form darzustellen, wenden wir einen einfachen Trick an. Zunächst multiplizieren wir beide Seiten mit 1 000 000: 1 000 000x = 23809,5238095
z
Berechnen lassen sich pythagoreische Tripel über die Formeln x = m(u2 − v2 ) y = m(2uv) z = m(u2 + v2 ) Hierin sind m, u, v positive natürliche Zahlen mit u > v. I Beispiele
1 1 1 1 1 1 2 2 2 2 2 2
(m, u, v) 2 3 3 4 4 4 2 3 3 4 4 4
1 1 2 1 2 3 1 1 2 1 2 3
3 8 5 15 12 7 6 16 10 30 24 14
(x, y, z) 4 6 12 8 16 24 8 12 24 16 32 48
5 10 13 17 20 25 10 20 26 34 40 50
... Abbildung 1.8: Pythagoreische Tripel
10
1 Historische Notizen
1 4
3 4
2 4
Subtrahieren wir (1.6) von dieser Gleichung, so verschwindet der periodische Anteil: 999 999x = 23809,5
2 8
6 16
12 32
4 8
3 8
Damit erhalten wir für x die folgende Darstellung:
8 16
7 16
13 32
14 32
Abbildung 1.9: Da für zwei Zahlen x, y ∈ Q auch das arithmetische Mittel x+y 2 eine rationale Zahl ist, können wir jeden Punkt mit einer beliebigen Genauigkeit annähern.
1
x=
23809,5 238095 1 = = 999 999 9 999 990 42
Anders als die natürlichen Zahlen liegen die rationalen Zahlen dicht auf der Zahlengeraden. Das bedeutet, dass wir jeden Punkt beliebig genau durch eine Folge rationaler Zahlen annähern können. Dass die Approximation immer möglich ist, verdanken wir der Eigenschaft, dass für zwei beliebige Zahlen x, y ∈ Q auch das arithmetische Mittel x+y 2 eine rationale Zahl ist (Abbildung 1.9). Dennoch weist die Menge der rationalen Zahlen Lücken auf. So war bereits den Pythagoreern bekannt, dass die Länge der Diagonalen eines Quadrats mit der Seitenlänge 1 nicht durch eine rationale Zahl ausgedrückt werden kann (Abbildung 1.10). Was hat es mit dieser mysteriösen Diagonallänge auf sich? Von ihr wissen wir zunächst nur, dass √ sie mit sich selbst multipliziert das Ergebnis 2 liefert und deshalb als 2 √ geschrieben werden darf. Der Wert von 2 lässt sich mit √ 2 ≈ 1,41421356237309504880168872420969807856 ziemlich genau beziffern und kann durch die Angabe weiterer Nachkommastellen beliebig angenähert werden. Trotzdem wird es uns niemals gelingen, den √ Wert exakt niederzuschreiben. Schuld daran ist die Eigenschaft von 2, keine Bruchdarstellung zu besitzen. Ihre Dezimalbruchdarstellung ist nichtperiodisch und setzt sich aus unendlich vielen, unregelmäßig auftretenden Nachkommaziffern zusammen.
1
√2
Abbildung 1.10: Die rationalen Zahlen können den Zahlenstrahl nicht lückenlos überdecken. Beispielsweise lässt sich die Länge der Diagonalen eines Quadrats mit der Seitenlänge 1 nicht durch eine rationale Zahl ausdrücken.
Indem wir die Lücken zwischen den rationalen Zahlen schließen, erreichen wir die Menge der reellen Zahlen R, den wichtigsten Zahlenraum der gewöhnlichen Mathematik. Aufgrund ihrer Eigenschaft, den Zahlenstrahl lückenlos zu überdecken, wird die Menge der reellen Zahlen als das Kontinuum bezeichnet. √ Betrachten wir die Zahl 2 genauer, so tritt eine weitere wichtige Eigenschaft zum Vorschein. Sie ist eine reellwertige Lösung der algebraischen Gleichung x2 − 2 = 0
11
1.2 Der Weg zur modernen Mathematik
Allgemein heißt eine Zahl x algebraisch, wenn sie eine reellwertige Lösung einer Gleichung der Form an xn + an−1 xn−1 + . . . + a1 x + a0 = 0
(1.7)
ist, wobei die Koeffizienten ai allesamt aus der Menge der ganzen Zahlen stammen. Offensichtlich ist jede rationale Zahl sung der folgenden Gleichung ist:
p q
auch algebraisch, da sie die Lö-
q·x− p = 0 Jede algebraische Zahl ist auch eine reelle, aber gilt auch die Umkehrung? Ist jede reelle Zahl auch algebraisch? Sollte es tatsächlich Zahlen geben, die keine Lösung einer algebraischen Gleichung sind, so wären sie nicht einfach zu erfassen, da wir diese Zahlen weder als Dezimalbruch hinschreiben noch indirekt als Nullstelle eines algebraischen Terms charakterisieren können.
L=
∞
∑ 10−k!
k=1
Einer der Ersten, die fest an die Existenz solcher transzendenten Zahlen glaubten, war Leonhard Euler. Konkret hegte er die Vermutung, dass die √ Zahl a b für alle rationalen Zahlen a = 1 und alle natürlichen Zahlen b außerhalb der Menge der algebraischen Zahlen liegen müsse. Dennoch sollte es ihm zu Lebzeiten nicht gelingen, einen Beweis für seine Vermutung zu finden.
1! 3! 5! = 0,1100010 ... 010 ... 010 ... 2! 4!
Erst 1844 sollte Eulers Vermutung zur Gewissheit werden. In diesem Jahr gelang es dem französischen Mathematiker Joseph Liouville als erstem, die Existenz transzendenter Zahlen zweifelsfrei zu belegen [18]. Liouville führte den Beweis konstruktiv und konnte eine konkrete Zahl angeben, die sich der Beschreibung durch eine algebraischen Gleichung entzieht (Abbildung 1.11). Es ist die berühmte Zahl ∞
L :=
∑ 10−k! ,
k=1
die nach ihrem Entdecker heute als Liouville’sche Zahl bezeichnet wird. Ab dem Jahr 1844 war die Transzendenz nicht mehr länger eine pure Möglichkeit; sie war zur mathematischen Realität geworden. Liouvilles faszinierende Entdeckung blieb kein Einzelfall. 1873 bewies der französische Mathematiker Charles Hermite die Transzendenz der berühmten eulerschen Konstante e, der Basis des natürlichen Logarithmus. Im Jahr 1882 machte der deutsche Mathematiker Ferdinand von
Joseph Liouville (1809 – 1882) Abbildung 1.11: Im Jahr 1844 bewies der französische Mathematiker Joseph Liouville die Existenz transzendenter Zahlen.
12
1 Historische Notizen
Abbildung 1.12: Die reellen Zahlen lassen sich in rationale Zahlen und irrationale Zahlen einteilen. Jede rationale Zahl ist auch algebraisch, aber √ nicht umgekehrt. So lässt sich die Zahl 2 als Lösung einer algebraischen Gleichung darstellen, aber nicht als Bruch. Seit dem Jahr 1844 wissen wir, dass Zahlen existieren, die keine Lösung einer algebraischen Gleichung sind. Sie bilden zusammen die Menge der transzendenten Zahlen, der unter anderem die eulersche Konstante e und die Kreiszahl π angehören.
Ra tio Zah nale len
0, 1, 2, . . . 1 2 4 2, 3, 5,...
Irra ti Zah onale len
√ √ (1+√5) 2, 5, 2 , . . . e, π, . . .
che rais b e n Alg Zahle
te den zen n s n Tra Zahle
Lindemann eine weitere wichtige Entdeckung. Es gelang ihm zu beweisen, dass die Gleichung β1 eα1 + . . . + βn eαn = 0, in der α1 , . . . , αn und β1 , . . . , βn algebraische Zahlen sind, nur die triviale Lösung β1 = . . . = βn = 0 besitzt, falls alle αi paarweise verschieden sind. Dies ist die Aussage des berühmten Satzes von LindemannWeierstraß. Aus diesem Satz und der bekannten Beziehung eiπ = −1 folgt, dass auch die Kreiszahl π transzendent sein muss. Damit waren mit der eulerschen Konstante e und der Kreiszahl π gleich zwei der wichtigsten Konstanten der Mathematik als transzendent identifiziert (Abbildung 1.12).
d = r=1
Abbildung 1.13: Unter der Quadratur des Kreises wird die Aufgabe verstanden, zu einem gegebenen Kreis ein Quadrat mit dem gleichen Flächeninhalt zu konstruieren. Aus der Transzendenz der Kreiszahl π folgt, dass eine Konstruktion mit Zirkel und Lineal nicht möglich ist.
Lindemann hatte mit seinem Ergebnis zugleich eine der berühmtesten Fragen der Geometrie beantwortet. Die Rede ist von der Quadratur des Kreises, also der Aufgabe, zu einem gegebenen Kreis ein Quadrat mit dem gleichen Flächeninhalt zu konstruieren (Abbildung 1.13). Da sich jede mit Lineal und Zirkel konstruierbare Länge als Lösung einer algebraischen Gleichung formulieren lässt, folgt aus der Transzendenz von π die Unlösbarkeit des Quadraturproblems. Heute ist die „Quadratur des Kreises“ eine beliebte Metapher für ein unlösbares Problem. Schnell warf die Erkenntnis über die Existenz transzendenter Zahlen die Frage auf, wie viele dieser schwer greifbaren Zahlen tatsächlich existieren. Ist die Transzendenz eine seltene Eigenschaft ausgewählter Zahlen oder sollte sie gar das Kontinuum durchziehen, lautlos und für lange Zeit unbemerkt wie die hypothetische dunkle Materie unser Universum? Es ist das Wissen über die Unendlichkeit, das uns eine erstaunliche Antwort auf diese Frage liefern wird. Wir kommen gleich darauf zurück.
1.2 Der Weg zur modernen Mathematik
1.2.2
Auf den Spuren der Unendlichkeit
Die moderne Mathematik hat ihre Wurzeln im neunzehnten Jahrhundert, einem Jahrhundert des schier grenzenlosen Fortschritts, das nicht nur auf gesellschaftliche und politische Fragen neue Antworten geben konnte, sondern auch Wirtschaft und Wissenschaft revolutionieren sollte. Neue Erkenntnisse sorgten für eine Aufbruchstimmung in allen Bereichen der Ingenieurs- und Naturwissenschaften. Mendels Gesetze der Vererbung und Darwins Entdeckungen zur Entstehung der Arten ließen die Natur in einem neuen Licht erscheinen. Die Offenlegung des Periodensystems der Elemente legte den Grundstein der modernen Chemie. In der Physik revolutionierten die Maxwell’schen Gesetze das physikalische Weltbild, und mit der Entwicklung des ersten Impfstoffs durch Louis Pasteur nahm der Mensch todbringenden Krankheiten ihren Schrecken. Zur Jahrtausendwende wähnte sich die Wissenschaftsgemeinde an der Grenze der Allwissenheit, und für viele war es nur eine Frage der Zeit, bis auch das letzte Rätsel dieser Welt gelüftet sein würde. Allumfassende Theorien schienen in greifbarer Nähe. Auch die Mathematik stand im neunzehnten Jahrhundert ganz im Zeichen des Fortschritts. Die Infinitesimalrechnung wurde durch Cauchy und Weierstraß auf ein solides Fundament gestellt, und auch in anderen Bereichen wurden das unendlich Große und das unendlich Kleine von ihrer mystischen Aura befreit. Riemann und Gauß gaben der Geometrie durch den rigorosen Einsatz analytischer Methoden ein neues Gesicht, Dedekind und Kronecker lieferten wichtige Beiträge zur Zahlentheorie. Es war ein Jahrhundert der Spezialisierung, in dem das Interesse an erkenntnistheoretischen Fragen allmählich zu verblassen begann. Allen Fortschritten zum Trotz hatte die präziseste aller Wissenschaften eines nicht erreicht: die Schaffung einer einheitlichen Grundlage, auf der sich die Mathematik als Ganzes errichten lässt. Dass wir mit der Mengenlehre eine solche Grundlage heute unser eigen nennen, ist keine Selbstverständlichkeit, und wie so oft war es der Zufall, der die große Wende herbeiführen sollte. Es ist ein Kuriosum der Geschichte, dass ausgerechnet eine Frage der Analysis den Anstoß zur Begründung der Mengenlehre gab. Auslöser war die 1822 geäußerte Vermutung des französischen Mathematikers Jean Baptiste Fourier, dass sich jede beliebige Funktion in Form einer trigonometrischen Reihe darstellen lässt.2 Für stetige Funktionen war Fouriers Vermutung weitgehend bewiesen, und immer mehr Mathema2 Heute wissen wir, dass Fouriers Vermutung in ihrer ursprünglichen Form falsch ist. An ihrem wegbereitenden Charakter ändert dies jedoch nichts.
13
14
1 Historische Notizen
rz 6 Jan 3 M
Der deutsche Mathematiker Georg Cantor wurde am 3. März 1845 in Sankt Petersburg geboren. Sein Studium absolvierte er von 1862 bis 1867 in Zürich, Göttingen und Berlin, wo er berühmte Größen wie Karl Weierstraß, Ernst Eduard Kummer oder Leopold Kronecker zu seinen Lehrern zählen durfte. 1867 wurde ihm von der Universität Berlin die Doktorwürde verliehen. Danach wechselte er nach Halle, wo er zuerst als Privatdozent, danach als Extraordinarius und schließlich als ordentlicher Professor lehrte und forschte. Cantor gehört zu den bedeutendsten Mathematikern des späten neunzehnten und frühen zwanzigsten Jahrhunderts. Er gilt als der Begründer der Mengenlehre und legte mit dem Begriff der Kardinalität den Grundstein für den Umgang mit der Unendlichkeit. Der Begriff der Abzählbarkeit geht genauso auf Cantor zurück wie die Diagonalisierungsmethode, auf die wir gleich an mehreren Stellen dieses Buchs zurückgreifen werden.
1845 1918
Georg Cantor (1845 – 1918) Abbildung 1.14: Georg Cantor war der Begründer der modernen Mengenlehre. Mit zahlreichen Beiträgen zur Untersuchung des Unendlichen führte er die Mathematik in die Moderne.
Cantor schreckte nie davor zurück, neue Wege zu beschreiten. Dennoch sollte das hohe Maß an Unverständnis, Misstrauen und Feindseligkeit, das ihm auf seinem einsamen Weg entgegenschlug, tiefe Furchen in seiner Psyche hinterlassen. Es ist ein tragischer Aspekt in seinem Leben, dass vor allem sein Lehrer Leopold Kronecker gegen ihn rebellierte und ihn mit blinder Wut zu bekämpfen versuchte. Kronecker, der in ihm einen „Verderber der Jugend“ sah, nutzte seinen Einfluss geschickt aus, um einen Wechsel Cantors an die ehrwürdige Universität Berlin zu verhindern [198]. Halle sollte für Cantor die erste und zugleich letzte Station seiner wissenschaftlichen Laufbahn sein. Im Alter von 39 Jahren erkrankte Cantor an manischer Depression – ein Leiden, das ihn bis zu seinem Lebensende begleiten sollte. Kurz nach seinem siebzigsten Geburtstag wurde er nach einem erneuten Krankheitsausbruch in die Universitätsklinik Halle eingewiesen. Dort starb Georg Cantor am 6. Januar 1918 im Alter von 72 Jahren.
tiker gingen dazu über, die Ergebnisse auf den unstetigen Fall zu übertragen. Der deutsche Mathematiker Georg Cantor war einer davon (Abbildung 1.14). Cantor verfolgte den Plan, die Annahme der Stetigkeit schrittweise abzuschwächen, um sie schließlich ganz zu eliminieren. Seine Arbeit sollte schon bald Früchte tragen. In einem ersten Schritt gelang es ihm zu zeigen, dass Fouriers Vermutung auf Funktionen zutrifft, die endlich viele Unstetigkeitsstellen besitzen. Von seinem Anfangserfolg beflügelt, ging er daran, seine Ergebnisse auf Funktionen mit unendlich vielen Unstetigkeitsstellen zu übertragen. Cantor gelang dies nicht uneingeschränkt, sondern nur dann, wenn die Verteilung der Unstetigkeitsstellen bestimmten Eigenschaften genügte. Indem er die Unstetigkeitsstellen in Mengen (Mannigfaltigkeiten) zusammenfasste, konnte er zeigen, dass sich die Verteilungseigenschaften auf strukturelle Eigenschaften der konstruierten Mengen übertragen ließen. Noch wurden Cantors Mannigfaltigkeiten von vielen Mathematikern als befremdliche Obskuritäten empfunden, die so gar nicht zu den bis dato üblichen Begriffen passten. Bis sich die Mengenlehre als akzeptierte Grundlage der gesamten Mathematik etablieren konnte, war es noch ein langer Weg. Das Instrumentarium, das Cantor für seine Untersuchungen geschaffen hatte, war von so allgemeiner Natur, dass er sowohl endliche als auch unendliche Mengen in der gleichen Weise untersuchen konnte. Der Schlüssel für den Umgang mit dem Unendlichen liegt in der Be-
15
1.2 Der Weg zur modernen Mathematik
trachtung der Mächtigkeit (Kardinalität) einer Menge M. Sie wird mit |M| bezeichnet und entspricht für endliche Mengen schlicht der Anzahl ihrer Elemente. Zum Beispiel gelten die folgenden Beziehungen: M1 = 0/ M2 = {, ♦, ◦} M3 = {2, 3, 5}
I Bijektive Abbildung von N+ nach N
⇒
3
4
5
6
7
...
1
2
3
4
5
6
7
...
|M3 | = 3 0
♦ → 3,
2
⇒ |M1 | = 0 ⇒ |M2 | = 3
Die Mengen M2 und M3 sind gleichmächtig, da sie die gleiche Anzahl an Elementen enthalten. In diesem und nur in diesem Fall sind wir in der Lage, die Elemente beider Mengen eindeutig einander zuzuordnen. Für unser Beispiel könnte die Zuordnung folgendermaßen aussehen: → 2,
1
◦ → 5
I Bijektive Abbildung von 2N nach N
0
2
4
6
...
Stimmt die Anzahl der Elemente nicht überein, so kann eine derartige Zuordnung nicht gelingen. Damit sind wir in der Lage, den Begriff der Mächtigkeit an die Existenz einer entsprechenden Abbildung zu knüpfen:
0
|M1 | = |M2 |
2
3
4
5
6
7
...
I Bijektive Abbildung von Z nach N
Definition 1.1 (Mächtigkeit) Mit M1 und M2 seien zwei beliebige Mengen gegeben. M1 und M2 heißen gleichmächtig, geschrieben als
1
−1 0 0
1
−2 2 1
3
−3 4 2
5
6 3
−4
...
7
... ...
wenn eine bijektive Abbildung f : M1 → M2 existiert. Wir schreiben |M1 | ≤ |M2 | wenn eine injektive Abbildung f : M1 → M2 existiert. Zwei unendliche Mengen sind per Definition genau dann gleichmächtig, wenn sich ihre Elemente jeweils umkehrbar eindeutig einander zuordnen lassen. Auf den ersten Blick erscheint die Herangehensweise als unnatürlich und unnötig umständlich. Auf den zweiten Blick wird deutlich, dass die Definition darauf verzichtet, die Elemente einer Menge explizit zu zählen. Damit sind wir in der Lage, auch dann die Kardinalität zweier Mengen zu vergleichen, wenn diese unendlich viele Elemente enthalten. Hieraus ergeben sich überraschende Konsequenzen. Als Erstes betrachten wir die Menge N der natürlichen Zahlen und die Menge N+ der
Abbildung 1.15: Die Existenz einer bijektiven Abbildung zwischen den natürlichen, den positiven, den geraden und den ganzen Zahlen beweist die Gleichmächtigkeit dieser Mengen.
16
1 Historische Notizen positiven ganzen Zahlen. Obwohl die Menge N+ eine echte Teilmenge von N ist, lässt sie sich mit der folgenden Zuordnungsvorschrift bijektiv auf die natürlichen Zahlen abbilden (Abbildung 1.15 oben): f : x → (x − 1) In ähnlicher Weise können wir eine Abbildung zwischen 2N, der Menge der geraden nichtnegativen Zahlen, und N herstellen (Abbildung 1.15 Mitte): f : x →
x 2
Ebenso können wir die ganzen Zahlen, wie in Abbildung 1.15 (unten) gezeigt, bijektiv auf die Menge der natürlichen Zahlen abbilden. Die folgende Zuordnung ist eine von – Sie werden es ahnen – unendlich vielen Möglichkeiten: −2x − 1 falls x < 0 f : x → 2x falls x ≥ 0 Die Mengen der natürlichen und der ganzen Zahlen erweisen sich in der Tat als gleichmächtig. Doch damit nicht genug. Auch die Menge Q der rationalen Zahlen lässt sich bijektiv auf N abbilden. Abbildung 1.16 zeigt, wie eine passende Abbildung konstruiert werden kann. Alle Elemente von Q sind in einer Matrix angeordnet, die sich unendlich weit nach rechts und nach unten ausbreitet. Fassen wir x als Spaltennummer und y als Zeilennummer auf, so können wir jedem Bruch xy ∈ Q ein Element der Matrix zuordnen. Ein Element (x, y) können wir mit einer eindeutigen Zahl πN (x, y) ∈ N versehen, indem wir links oben, bei (0,0), beginnen und uns anschließend diagonal durch die Matrix bewegen. Die entstehende Abbildung πN : N2 → N heißt Cantor’sche Paarungsfunktion und lässt sich über die nachstehende Formel direkt berechnen: x+y
πN (x, y) = y + ∑ i = y + i=0
(x + y)(x + y + 1) 2
Über die Existenz einer bijektiven Zuordnung zwischen N und Q haben wir gezeigt, dass beide Mengen die gleiche Mächtigkeit besitzen. Mithilfe der Cantor’schen Paarungsfunktion lassen sich weitere Mengen als gleichmächtig identifizieren. Durch die rekursive Anwendung sind wir z. B. in der Lage, nicht nur jedem Paar (x, y) ∈ N2 , sondern auch jedem Tripel (x, y, z) ∈ N3 ein eindeutiges Element in N zuzuordnen. Diesen Zweck erfüllt die Funktion πN3 : N3 → N mit πN3 (x, y, z) := πN (πN (x, y), z)
17
1.2 Der Weg zur modernen Mathematik
3
6
10
15
21
2
4
7
11
16
22
29
5
8
12
17
23
30
9
13
18
24
31
14
19
25
32
20
26
33
27
34
28
...
...
1
...
0
... ...
... ...
...
35
...
...
Abbildung 1.16: Die abgebildete Paarungsfunktion ordnet jedem Tupel (x, y) ∈ N2 eine Zahl πN (x, y) ∈ N zu. Die Abbildung ist bijektiv und beweist, dass N2 und N gleichmächtig sind.
Führen wir den Gedanken in dieser Richtung fort, so erhalten wir mit πN1 (x1 ) := x1 πNn+1 (x1 , . . . , xn , xn+1 )
:=
πN (πNn (x1 , . . . , xn ), xn+1 )
(1.8) (1.9)
eine bijektive Abbildung von Nn auf N. Damit ist bewiesen, dass der ndimensionale Zahlenraum Nn stets die gleiche Mächtigkeit besitzt wie die Grundmenge N selbst – unabhängig davon, wie groß wir die Dimension n ∈ N auch wählen. In einer berühmten Arbeit aus dem Jahr 1874 publizierte Cantor, wie sich auch die Menge der algebraischen Zahlen bijektiv auf die Menge der natürlichen Zahlen abbilden lässt [19]. Hierzu ordnete er jeder algebraischen Gleichung der Form (1.7) zunächst eine Höhe N zu, die sich wie folgt berechnet: N := n − 1 + |an | + . . . + |a3 | + |a2 | + |a1 | + |a0 | Für jeden Wert von N existieren nur endlich viele algebraische Gleichungen, und jede dieser Gleichungen kann maximal N Lösungen besitzen. Damit sind wir in der Lage, die algebraischen Zahlen der Reihe nach aufzuzählen, und erhalten so eine eindeutige Zuordnung zu den natürlichen Zahlen.
18
Cantors Arbeit aus dem Jahr 1874 trägt den unscheinbaren Titel „Über eine Eigenschaft des Inbegriffs aller reellen algebraischen Zahlen“. Die Frage, warum Cantor einen Titel wählte, der dem Leser keinerlei Hinweis auf sein erzieltes Hauptergebnis, die Überabzählbarkeit der reellen Zahlen, gibt, ist in Historikerkreisen umstritten. Zum einen gibt es Anlass für die Vermutung, dass Cantor das eigentlich Revolutionäre seiner Arbeit zur Zeit der Veröffentlichung selbst nicht gesehen hat und ausschließlich an einem alternativen Beweis des Liouville’schen Satzes interessiert war. Hinweise darauf finden sich in einem Brief Cantors an Richard Dedekind vom 2.12.1873: [129] „Übrigens möchte ich hinzufügen, dass ich mich nie ernstlich mit ihr [der Frage nach der Abzählbarkeit des Kontinuums] beschäftigt habe, weil sie kein besonderes praktisches Interesse für mich hat und ich trete Ihnen ganz bei, wenn Sie sagen, dass sie aus diesem Grund nicht zu viel Mühe verdient. Es wäre nur schön, wenn sie beantwortet werden könnte; z.B., vorausgesetzt dass sie mit nein beantwortet würde, wäre damit ein neuer Beweis des Liouville’schen Satzes geliefert, dass es transzendente Zahlen gibt.“ Dagegen ist der Cantor-Biograph Joseph Dauben davon überzeugt, dass die Titelwahl politisch motiviert war und nur dazu dienen sollte, seinen Erzfeind Kronecker nicht auf die Arbeit aufmerksam zu machen [36]. „Had Cantor been more direct with a title like ’The set of real numbers is nondenumerably infinite’ or ’A new and independent proof of the existence of transcendental numbers’, he could have counted on a strongly negative reaction from Kronecker. After all, when Lindemann later established the transcendence of π in 1882, Kronecker asked what value the result could possibly have, since irrational numbers did not exist.“
1 Historische Notizen
Cantors wesentlich bedeutsamere Entdeckung war aber eine andere. In der gleichen Arbeit, in der er die Gleichmächtigkeit von N und der Menge der algebraischen Zahlen zeigte, bewies er, dass sich das Kontinuum einer entsprechenden Zuordnung entzieht. Offenbar scheint die Anzahl der reellen Zahlen jene der natürlichen Zahlen so sehr zu übersteigen, dass es unmöglich ist, eine Eins-zu-eins-Zuordnung zwischen beiden Mengen herzustellen. Damit hatte Cantor gezeigt, dass die Menge der natürlichen Zahlen und die Menge der reellen Zahlen stellvertretend für verschiedene Unendlichkeiten stehen. Begrifflich bringen wir den Unterschied wie folgt zum Ausdruck: Definition 1.2 (Abzählbarkeit, Überabzählbarkeit) Eine Menge M heißt I
abzählbar, falls |M| = |N|,
I
höchstens abzählbar, falls |M| ≤ |N|, und
I
überabzählbar, falls |M| ≤ |N|.
In Worten ausgedrückt ist eine Menge M höchstens abzählbar, wenn sie endlich oder abzählbar ist. Cantors erster Überabzählbarkeitsbeweis Um die Überabzählbarkeit der reellen Zahlen zu zeigen, führte Cantor einen klassischen Widerspruchsbeweis. Zunächst nahm er an, dass sich die reellen Zahlen vollständig in Form einer unendlich langen Liste aufzählen lassen: ω1 , ω2 , ω3 , . . .
(1.10)
Jedes Element ωi bezeichnet eine reelle Zahl, und für jede reelle Zahl x existiert per Annahme ein Index i mit ωi = x. Cantor gelang es zu zeigen, dass in jedem nichtleeren Intervall (α1 , β1 ) dennoch mindestens eine reelle Zahl ν existieren muss, die nicht in der Liste (1.10) auftaucht. Den Widerspruch leitete er her, indem er das Startintervall (α1 , β1 ) zu einer Intervallfolge der folgenden Bauart ergänzte: (α1 , β1 ), (α2 , β2 ), (α3 , β3 ), . . . Um das Folgeintervall (αi+1 , βi+1 ) zu bestimmen, wird die aufgestellte Liste der reellen Zahlen von links nach rechts durchsucht, bis zwei
19
1.2 Der Weg zur modernen Mathematik
Zahlen gefunden werden, die innerhalb des Intervalls (αi , βi ) liegen. Die kleinere von beiden bildet die linke Grenze und die größere die rechte Grenze des neuen Intervalls (Abbildung 1.17). Anschließend unterschied Cantor die nachstehenden Fälle: I
I
Fall 1: Die Anzahl der geschachtelten Intervalle ist endlich (Abbildung 1.18 oben). Dann gäbe es ein letztes Intervall (αν , βν ), und ν ν und αν +β zwei Zahlen vor uns, von denen wir hätten mit αν +β 2 3 mindestens eine nicht in (1.10) vorkommt. Fall 2: Die Anzahl der geschachtelten Intervalle ist unendlich. Aus der Tatsache, dass die Intervallgrenzen αi und βi beschränkt und gleichzeitig streng monoton steigend bzw. fallend sind, müssen beide Folgen einem Grenzwert zustreben, den Cantor als α∞ bzw. β∞ ∞ bezeichnet. Wäre α∞ < β∞ , so könnten wir mit α∞ +β erneut eine 2 Zahl konstruieren, die in (1.10) nicht vorkommt (Abbildung 1.18 Mitte). Aber auch die letzte Alternative, α∞ = β∞ , führt zu einem Widerspruch (Abbildung 1.18 unten). Einerseits ist der Grenzwert in jedem der gebildeten Intervalle enthalten. Andererseits stellt die Konstruktionsvorschrift sicher, dass jedes ωi ab einem gewissen Index j nicht mehr in (α j , β j ) liegt. Damit kann der Grenzwert nicht in (1.10) auftauchen.
Offensichtlich gibt es kein Entrinnen! Die entstehenden Widersprüche bringen unsere Annahme zu Fall, dass eine bijektive Abbildung zwischen den reellen und den natürlichen Zahlen existieren kann. Aus den von Cantor erzielten Teilergebnissen ergibt sich eine weitreichende Konsequenz für die Menge der transzendenten Zahlen. Da die Menge der algebraischen Zahlen abzählbar und die Menge der reellen Zahlen überabzählbar ist, kann keine Abbildung der transzendenten Zahlen auf die natürlichen Zahlen gelingen. Genau wie das Kontinuum ist auch die Menge der transzendenten Zahlen überabzählbar. Waren in der Mitte des neunzehnten Jahrhunderts nur eine Handvoll transzendenter Zahlen bekannt, so wissen wir heute, dass die Transzendenz alles andere als eine exotische Eigenschaft ausgewählter Zahlen ist. Bis auf eine kleine Teilmenge sind sämtliche Elemente des Kontinuums transzendent! Cantor hatte für diese Behauptung einen wahrhaft eleganten Beweis geliefert. Die inhaltliche Aussage seines Satzes war jedoch nicht neu; Liouville hatte bereits ein paar Jahre zuvor ein ähnliches Ergebnis erzielt. Der historisch bedeutende Teil in Cantors Arbeit ist in einem sei-
3
4
9
2
10 11
8 6 1 = 2
7
5 1
1 = 1
1
1 2 = 4
2 = 5
1 2
2 1
3 = 8 1 2
3 = 6 3 3
2 1
...
Abbildung 1.17: Cantors erster Beweis der Überabzählbarkeit des Kontinuums. Ausgehend von einer Aufzählung ωi der reellen Zahlen konstruierte Cantor zunächst eine Intervallfolge der Form (α1 , β1 ), (α2 , β2 ), (α3 , β3 ), . . .
I Fall 1 α1 α2 ...
αν βν ...
β2 β1
I Fall 2 α1 α2 ...
α∞ β∞ ...
β2 β1
oder α1 α2 ...
α∞
...
β2 β1
β∞
Abbildung 1.18: Gleichgültig, wie die Konstruktion der Intervallfolge verlaufen wird: Sämtliche Möglichkeiten führen zu einem Widerspruch.
20
f (1) =
0
,
5
4
9
0
0
7
5
8
...
f (2) =
0
,
7
1
4
4
5
6
6
3
...
f (3) =
0
,
7
4
3
9
6
1
4
2
...
f (4) =
0
,
2
3
1
1
1
7
4
5
...
f (5) =
0
,
2
7
9
7
7
4
0
0
...
f (6) =
0
,
3
8
6
4
8
7
2
8
...
f (7) =
0
,
5
6
0
6
9
3
7
4
...
f (8) =
0
,
2
1
3
4
4
9
9
9
...
...
...
...
...
...
...
...
...
...
...
Abbildung 1.19: Das Diagonalisierungsargument. Gäbe es eine bijektive Abbildung von den natürlichen auf die reellen Zahlen, so müsste sich die (unendlich lange) Ziffernfolge jeder reellen Zahl in einer Zeile der Zuordnungsmatrix wiederfinden lassen. Unabhängig von der gewählten Zuordnung sind wir immer im Stande, die Ziffernfolge einer reellen Zahl zu konstruieren, die nicht in der Matrix vorkommt. Diese können wir erzeugen, indem wir uns entlang der Hauptdiagonalen von links oben nach rechts unten bewegen und die vorgefundene Ziffer um eins erhöhen oder erniedrigen. Die konstruierte Ziffernfolge kommt nirgends in der Matrix vor, da sie sich von jener der iten Zeile per Konstruktion in der i-ten Ziffer unterscheidet. Die Überlegung zeigt, dass eine bijektive Zuordnung der Elemente aus R zu den Elementen aus N nicht möglich ist. Kurzum: Die Menge der reellen Zahlen ist nicht abzählbar.
1 Historische Notizen
ner Teilergebnisse versteckt: Es ist der Beweis der Überabzählbarkeit der reellen Zahlen.
Cantors zweiter Überabzählbarkeitsbeweis Drei Jahre später bewies Cantor seine Aussage erneut – diesmal auf verblüffend einfache Weise. Den Kern des Beweises bildet das von ihm entwickelte Diagonalisierungsargument, eine genauso leistungsfähige wie intuitive Methode, um eine Menge als überabzählbar zu identifizieren. Cantor stellte die folgende Überlegung an: Wenn die beiden Mengen N und R gleichmächtig wären, dann müsste eine bijektive Abbildung f : N → R existieren, die jedes Element x ∈ N eineindeutig auf ein Element f (x) ∈ R abbildet. Listen wir die Nachkommaanteile von f (1), f (2), f (3), . . . von oben nach unten auf, so entsteht eine Matrix, wie sie in Abbildung 1.19 skizziert ist. Formal entspricht das Element in Spalte x und Zeile y der x-ten Nachkommaziffer der Dezimalbruchdarstellung von f (y). Natürlich können wir nur einen winzigen Ausschnitt der entstehenden Matrix zeichnen, da die Funktion f für unendlich viele Werte y ∈ N definiert ist und sich die Dezimalbruchdarstellung der reellen Zahlen f (y) über unendlich viele Ziffern erstreckt.
21
Erneut hat uns der Cantor’sche Zugang zur Unendlichkeit eine verblüffende Eigenschaft von Zahlenmengen offengelegt. Die Gleichmächtigkeit von R und R2 bedeutet, dass eine Gerade in der Ebene gleich viele Punkte besitzt wie die Ebene selbst (Abbildung 1.21). Wir sind damit in der Lage, die Punkte der Ebene verlustfrei auf die Punkte einer Geraden abzubilden. Ebenso ist es möglich, die Ebene lückenlos mit den Punkten einer Geraden zu belegen.
πR1 (x1 )
:= x1
πRn+1 (x1 , . . . , xn , xn+1 ) := πR (πRn (x1 , . . . , xn ), xn+1 ) Am Beispiel der reellen Zahlen haben wir gesehen, dass eine Unendlichkeit existiert, die mächtiger ist als jene der natürlichen Zahlen. Das Ergebnis wirft die Frage auf, ob es eine weitere Unendlichkeit gibt, die
0 , 1 4 3 2 5 1 5 0 0 0 8 7 4 5 0 9 7 ... 0 ,
4
2
1
0
0
7
5
9
...
Abbildung 1.20: Im Reißverschlussverfahren lassen sich zwei reelle Zahlen zu einer einzigen reellen Zahl verschmelzen. Auf diese Weise lässt sich eine bijektive Abbildung von R2 auf R konstruieren und damit die Gleichmächtigkeit der beiden Mengen zeigen.
...
...
...
Kombinieren wir die Aufrufe von πR wieder rekursiv miteinander, so entsteht für jede natürliche Zahl n ∈ N eine Abbildung πRn , die den ndimensionalen Zahlenraum Rn bijektiv auf R reduziert. Formal ist die Abbildung πRn , in Analogie zu den Gleichungen (1.8) und (1.9), wie folgt definiert:
8
0
5
5
3
0 ,1
0
4
...
Trotzdem gelten einige der Eigenschaften, die wir für die Menge N herausgearbeitet haben, auch in der Menge der reellen Zahlen. So sind wir auch hier in der Lage, ein Tupel (x, y) ∈ R2 bijektiv auf die Menge R abzubilden. Abbildung 1.20 skizziert die zugrunde liegende Konstruktionsidee. Die beiden reellen Zahlen x ∈ R und y ∈ R werden zu einer gemeinsamen reellen Zahl πR (x, y) ∈ R verschmolzen, indem die Vor- und Nachkommaziffern reißverschlussartig miteinander verschränkt werden.
7
Mithilfe des Diagonalisierungsarguments können wir zeigen, dass die Matrix nie vollständig sein kann. Unabhängig von der konkreten Wahl von f existieren reelle Zahlen, die nicht in der Matrix enthalten sind und damit die Bijektivität von f ad absurdum führen. Wir konstruieren eine solche Zahl, indem wir uns entlang der Hauptdiagonalen von links oben nach rechts unten bewegen und die vorgefundenen Ziffern jeweils um eins erhöhen oder erniedrigen. Die entstehende Ziffernfolge interpretieren wir als die Nachkommaziffern einer reellen Zahl r. Wäre f eine bijektive Abbildung von N auf R, so müsste auch die Zahl r in irgendeiner Zeile vorkommen. Aufgrund des gewählten Konstruktionsschemas ist jedoch sichergestellt, dass sich die reelle Zahl der i-ten Zeile in der i-ten Ziffer von r unterscheidet. Die Annahme, eine bijektive Zuordnung zwischen N und R könnte existieren, führt zu einem unmittelbaren Widerspruch. Folgerichtig ist jeder Versuch, die reellen Zahlen nacheinander durchzunummerieren, zum Scheitern verurteilt.
...
1.2 Der Weg zur modernen Mathematik
...
...
Abbildung 1.21: Die zweidimensionale Ebene und die eindimensionale Gerade beinhalten die gleiche „Anzahl“ reeller Punkte. Jeder Punkt des einen geometrischen Objekts lässt sich eindeutig auf einen Punkt des anderen abbilden.
22
1 Historische Notizen
wiederum mächtiger ist als jene der reellen Zahlen. Der folgende Satz von Cantor beantwortet diese Frage positiv: Satz 1.1 (Satz von Cantor) Für jede Menge M ist die Potenzmenge 2M mächtiger als M.
Wir können diese Aussage beweisen, indem wir ein ähnliches Diagonalisierungsargument verwenden, mit dem wir bereits die Überabzählbarkeit der reellen Zahlen zeigen konnten. Auch hier gehen wir wieder von der Existenz einer bijektiven Abbildung f : M → 2M aus und führen die Annahme zu einem Widerspruch. Sei f eine Funktion, die M bijektiv auf die Menge 2M abbildet. Für jedes Element x ∈ M können wir zwei Fälle unterscheiden: Entweder ist x im Bildelement f (x) enthalten (x ∈ f (x)) oder nicht (x ∈ f (x)). Alle Elemente, auf die Letzteres zutrifft, fassen wir in der Menge T zusammen: T := {x ∈ M | x ∈ f (x)} Da f bijektiv und damit insbesondere auch surjektiv ist, muss ein Urbild xT existieren mit f (xT ) = T . Wie für alle Elemente aus M gilt auch für das Element xT entweder die Eigenschaft xT ∈ T oder xT ∈ T . Beide Fälle führen jedoch unmittelbar zu einem Widerspruch: f (xT ) ⇒ xT ∈ T xT ∈ T ⇒ xT ∈ xT ∈ T ⇒ xT ∈ f (xT ) ⇒ xT ∈ T Damit haben wir gezeigt, dass es eine bijektive Funktion f : M → 2M nicht geben kann. Aus dem Cantor’schen Satz ergeben sich zwei wichtige Konsequenzen. Zum einen zeigt er, dass es keine maximale Unendlichkeit gibt, d. h., wir sind nicht in der Lage, eine Universalmenge zu konstruieren, die mächtiger ist als alle anderen Mengen. Es scheint, als ob es die Unendlichkeit abermals schafft, sich jeglichen Grenzen zu entziehen. Zum anderen bringt der Satz eine hierarchische Ordnung in die unendliche Menge der verschiedenen Unendlichkeiten: N
2N
|N| < |2N | < |22 | < |22 | < |22
22
N
| < ...
Cantor verwendete den hebräischen Buchstaben Aleph (ℵ), um die Mächtigkeit einer unendlichen Menge zu beschreiben. Die kleinste Unendlichkeit wird mit der Kardinalzahl ℵ0 bezeichnet; sie entspricht der
23
1.2 Der Weg zur modernen Mathematik
Kardinalität der natürlichen Zahlen. Eine kleinere Unendlichkeit als |N| kann es nicht geben, da sich alle unendlichen Teilmengen von N bijektiv auf N abbilden lassen. Die nächstgrößere Unendlichkeit wird durch die Kardinalzahl ℵ1 beschrieben und so fort. Besitzt eine Menge M die Kardinalität ℵn , so bezeichnen wir die Kardinalität der Potenzmenge 2M mit 2ℵn . An dieser Stelle wollen wir mit dem berühmten Cantor-SchröderBernstein-Theorem (CSB-Theorem) ein wichtiges Hilfsmittel einführen, mit dem sich die Gleichmächtigkeit vieler Mengen bequem beweisen lässt. Um die Aussage des Theorems zu verstehen, werfen wir erneut einen Blick auf Definition 1.1. Dort haben wir die Schreibweise |M1 | ≤ |M2 | eingeführt, um auszudrücken, dass sich die Menge M1 injektiv in die Menge M2 abbilden lässt. Bildlich gesprochen bedeutet dies, dass sich die Elemente von M1 in die Menge M2 einbetten lassen, ohne ein Element von M2 doppelt zu belegen. Da jede bijektive Abbildung auch injektiv ist, folgt aus |M1 | = |M2 | immer auch |M1 | ≤ |M2 | und |M2 | ≤ |M1 |. Das Cantor-Schröder-Bernstein-Theorem besagt nun, dass dieser Schluss sogar in der umgekehrten Richtung gilt: Satz 1.2 (Cantor-Schröder-Bernstein-Theorem)
I Injektionen f und g
(−1;1)
[−1;1]
1
1
1/2
1/2
1/4
1/4
1/8
1/8 ...
0
0
−1/8
−1/8
−1/4
−1/4
−1/2
−1/2
Für zwei beliebige Mengen M1 und M2 gilt: Aus |M1 | ≤ |M2 | und |M2 | ≤ |M1 | folgt |M1 | = |M2 |. −1
Einen Beweis dieses Satzes finden Sie beispielsweise in [46] oder [196]. An zwei Beispielen wollen wir demonstrieren, wie sich das CantorSchröder-Bernstein-Theorem einsetzen lässt. Als erstes wollen wir es dazu verwenden, um das offene Intervall (−1; 1) und das geschlossene Intervall [1; 1] als gleichmächtig zu identifizieren. Zunächst halten wir fest, dass sich die Menge (−1; 1) über die identische Abbildung f : x → x auf triviale Weise injektiv in die Menge [1; 1] einbetten lässt. Andersherum existiert mit g : x → 2x auch eine injektive Abbildung des geschlossenen Intervalls in das offene. Damit sind wir schon am Ziel. Aus dem CSB-Theorem folgt die Gleichmächtigkeit der beiden Intervalle. Unbestritten stellt das Ergebnis unsere Intuition erneut auf eine harte Probe, da das geschlossene Intervall [−1; 1] zwei Elemente mehr zu enthalten scheint als sein offenes Pendant (−1; 1). Abbildung 1.22 beseitigt die Zweifel, ob hier alles mit rechten Dingen zugeht. Sie zeigt, wie eine bijektive Abbildung zwischen den beiden Intervallen konkret aussehen kann.
g
f
−1
I Bijektion h : (−1; 1) → [−1; 1]
⎧ (−)1 ⎪ ⎪ ⎪ ⎪ ⎪ (−) 12 ⎪ ⎪ ⎨ (−) 14 h : x → ⎪ 1 ⎪ ⎪ (−) 8 ⎪ ⎪ ⎪ ⎪ ⎩ x
falls falls
x = (−) 12 x = (−) 14
falls
x = (−) 18
falls ... sonst
1 x = (−) 16
Abbildung 1.22: Lässt sich eine Menge injektiv in eine andere Menge abbilden und umgekehrt, so kann durch die geschickte Kombination der beiden Abbildungen eine Bijektion zwischen den Mengen hergestellt werden. Dies ist die Aussage des berühmten Cantor-Schröder-BernsteinTheorems, hier demonstriert am Beispiel der Intervalle (−1; 1) und [−1; 1].
24
... 0 0 0 3 4 8 6 0 7 , 5 7 3 0 0 9 1 2 ...
1 Historische Notizen
Auf die gleiche Art und Weise können wir zeigen, dass sich die Menge der reellen Zahlen bijektiv auf das Einheitsintervall [0; 1] abbilden lässt. Eine injektive Einbettung von [0; 1] in R ist trivial. Umgekehrt können wir durch die Zuordnung ∞
∑
i=−∞
0 , 7 5 0 7 6 3 8 0 4 0 3 9 0 1 0 2 0 ...
Abbildung 1.23: Durch die Umsortierung der Ziffernfolge lassen sich alle reellen Zahlen injektiv in das Intervall [0; 1] einbetten.
∞ bi 10i → b0 10−1 + ∑ b−i 10−2i + bi 10−2i−1 i=1
jede reellen Zahl in das Intervall [0; 1] abbilden, ohne ein Element der Zielmenge doppelt zu belegen (Abbildung 1.23). Damit haben wir erneut die Voraussetzungen des CSB-Theorems erfüllt und die Gleichmächtigkeit von [0; 1] und R bewiesen. Dass sich die reellen Zahlen bijektiv auf das Intervall [0; 1] abbilden lassen, bringt eine entscheidende Vereinfachung mit sich, die wir in den nachfolgenden Kapiteln mehrfach ausnutzen werden. Anstatt die reellen Zahlen als Ganzes zu behandeln, ist es völlig ausreichend, unsere Betrachtungen auf die reellen Zahlen mit dem Vorkommaanteil 0 zu beschränken. Jetzt sind wir gewappnet, um einen wichtigen Zusammenhang zwischen den reellen Zahlen und der Potenzmenge der natürlichen Zahlen herzustellen. Schreiben wir eine reelle Zahl x aus dem Intervall [0; 1] im Binärsystem auf, so besitzt sie die folgende Form: ∞
x = ∑ bi 2−i i=1
Die Koeffizienten bi bilden aneinandergereiht eine unendlich lange Folge von Nullen und Einsen. Damit können wir x eindeutig eine Teilmenge der natürlichen Zahlen zuordnen, indem wir die Zahl n ∈ N genau dann in die Teilmenge aufnehmen, wenn die n-te Nachkommastelle von x gleich 1 ist: ∞
∑ bi 2−i
→ {n ∈ N | bn = 1}
(1.11)
i=1
Umgekehrt können wir jede Teilmenge von N injektiv in das Intervall [0; 1] einbetten: {n1 , n2 , . . .} →
∑ 2−2ni −1
(1.12)
i
Das CSB-Theorem liefert uns das Ergebnis, nach dem wir gesucht haben. Es zeigt, dass die Menge der reellen Zahlen die gleiche Mächtigkeit besitzt wie die Potenzmenge der natürlichen Zahlen: |R| = |2N | = 2ℵ0
(1.13)
25
1.2 Der Weg zur modernen Mathematik
Cantor beschäftigte sich intensiv mit der Frage, ob sich zwischen den Mengen N und R weitere Unendlichkeiten verbergen. Schon früh hegte er die Vermutung, dass es keine Menge geben kann, die bezüglich ihrer Kardinalität zwischen den natürlichen und den reellen Zahlen liegt. Demnach befänden sich die reellen Zahlen an zweiter Position (ℵ1 ) in der unendlich langen Liste der Unendlichkeiten. Genau dies ist der Inhalt der berühmten Kontinuumshypothese, die in ihrer symbolischen Form wie folgt lautet: ?
|R| = ℵ1
(1.14)
Aufgrund der oben herausgearbeiteten Äquivalenz (1.13) können wir Gleichung (1.14) auch in der Form 2ℵ0 = ℵ1 ?
schreiben und in naheliegender Weise verallgemeinern: 2ℵn = ℵn+1 ?
(1.15)
Die in Gleichung (1.15) geäußerte Vermutung heißt allgemeine Kontinuumshypothese. Plakativ besagt sie, dass die Potenzmengenoperation, während sie uns von einer Unendlichkeit zur nächsten führt, keine Unendlichkeiten überspringt. Die Kontinuumshypothese sollte Cantor bis zu seinem Lebensende beschäftigen. Einige Male glaubte er sich im Besitz eines Beweises, andere Male dachte er, die Hypothese widerlegt zu haben. Doch immer wieder tauchten Fehler auf, die seinen schon sicher geglaubten Erfolg zunichte machten. So sehr er sich auch bemühte, es blieb ihm zu Lebzeiten verwehrt, dieses große Rätsel des Kontinuums zu lüften. Cantor konnte nicht wissen, wie sehr er zum Scheitern verdammt war. Dass Cantors Mengenbegriff von vielen seiner Zeitgenossen abgelehnt und von einigen sogar heftig bekämpft wurde, lässt sich nur im historischen Kontext verstehen. Cantor schuf seinen Mengenbegriff in einer Zeit, in der die Diskussion um das Wesen der Unendlichkeit in vollem Gange war. Zwei Begriffe standen im Mittelpunkt des Diskurses: Die potenzielle Unendlichkeit und die aktuale Unendlichkeit. Den Unterschied zwischen diesen beiden Begriffen wollen wir am Beispiel der natürlichen Zahlen 0, 1, 2, 3, . . .
Über die Zuordnungsvorschrift (1.11) haben wir es geschafft, die reellen Zahlen aus dem Intervall [0; 1] injektiv in die Menge 2N einzubetten. Die Abbildung haben wir über die Binärdarstellung einer reellen Zahl definiert, und genau hier laufen wir in eine technische Schwierigkeit hinein, die auf den ersten Blick gern übersehen wird. Ausgelöst wird sie durch die Eigenschaft mancher reeller Zahlen, mehrere Binärdarstellungen zu besitzen. Beispielsweise besitzt die Zahl 12 die beiden Darstellungen 0,1 und 0,0111 . . .. Das bedeutet, dass die Vorschrift (1.11) der Zahl 12 sowohl die Menge {1} als auch die Menge {2, 3, 4, . . .} zuordnet und damit streng genommen gar keine Abbildung definiert. Glücklicherweise lässt sich dieses Problem einfach lösen. Die Mehrdeutigkeit verschwindet, wenn wir per Definition immer diejenige Darstellung mit der geringsten Anzahl Einsen zugrunde legen. Bei der Einbettung von 2N in [0; 1] müssen wir ebenfalls vorsichtig sein. Würden wir z. B. die Abbildungsvorschrift {n1 , n2 , . . .} →
∑ 2−n −1 i
i
verwenden, so wäre die Abbildung nicht mehr injektiv. Beispielsweise würden die Mengen {0} und {1, 2, 3, . . .} beide der Zahl 12 zugeordnet. Genau dies ist der Grund, weshalb ni in Gleichung (1.12) mit 2 multipliziert wird. Erst durch diesen Trick wird die Zuordnung injektiv, d. h., verschiedene Teilmengen der natürlichen Zahlen werden auf verschiedene reelle Zahlen abgebildet.
26
1 Historische Notizen
sichtbar machen. Außer der 0 wird jedes Element in dieser unendlich langen Liste durch die Anwendung der Nachfolgeroperation aus seinem Vorgänger gewonnen. Mit diesem Prozess können wir fortwährend neue Zahlen generieren, ohne dass die Anzahl der Iterationen nach oben beschränkt ist. Wir sagen, die Anzahl der Iterationen ist potenziell unendlich. Diese Art der Unendlichkeit birgt keinerlei Risiken in sich. Auch wenn die Anzahl der Iterationen keiner Grenze unterliegt, erreichen wir jede natürliche Zahl nach endlich vielen Schritten und müssen die Nachfolgeroperation daher niemals unendlich oft anwenden.
„So protestiere ich gegen den Gebrauch einer unendlichen Größe als einer Vollendeten, welches in der Mathematik niemals erlaubt ist.“ [60]
Carl Friedrich Gauß (1777 – 1855) Abbildung 1.24: Der deutsche Mathematiker Carl Friedrich Gauß zählt zu den genialsten Mathematikern des ausgehenden achtzehnten und beginnenden neunzehnten Jahrhunderts. Gauß hat in verschiedenen Gebieten der Mathematik, Astronomie und Physik Bahnbrechendes geleistet und führte die Göttinger Mathematik zu Weltruhm. Eine Gedenkmünze, die ein Jahr nach seinem Tod ausgegeben wurde, ehrt den brillanten Mathematiker mit dem Titel „Mathematicorum Principi“ (lat. „Dem Fürsten der Mathematiker“).
Reden wir stattdessen von den Zahlen, die sich durch die endliche Iteration der Nachfolgeroperation erzeugen lassen, als Ganzes, so haben wir den Sprung von der potenziellen Unendlichkeit in die aktuale Unendlichkeit vollzogen. Das besagte Ganze ist in diesem Fall nichts anderes als die Menge der natürlichen Zahlen selbst und besitzt unendlich viele Elemente. Ob wir die natürlichen Zahlen tatsächlich als ein abgeschlossenes Ganzes betrachten können oder lediglich das potenziell Unendliche als alleinige Grundlage akzeptieren dürfen, wurde in der Vergangenheit kontrovers diskutiert. Schon Aristoteles gehörte zu den Kritikern der aktualen Unendlichkeit [155]. Befeuert wurde die Kritik durch die scheinbaren Widersprüche, die sich im Umgang mit der Unendlichkeit ergeben. Weiter oben haben wir herausgearbeitet, dass eine Eins-zu-eins-Zuordnung zwischen den ganzen Zahlen Z und den natürlichen Zahlen N besteht, obwohl uns die Inklusionsbeziehung N ⊂ Z das Gegenteil suggeriert. In analoger Weise lässt sich zeigen, dass jede unendliche Teilmenge von N die gleiche Mächtigkeit besitzt wie die natürlichen Zahlen selbst. Einige Wissenschaftler, wie der namhafte Astronom Galileo Galilei, sahen hierin die Bestätigung dafür, dass Größenvergleiche zwischen unendlichen Mengen unzulässig sind und nur im Falle endlicher Mengen einen Sinn ergeben [58, 104]. Andere Wissenschaftler, wie der berühmte Mathematiker Carl Friedrich Gauß, lehnten den Umgang mit unendlichen Mengen als in sich geschlossene Größen vollständig ab (Abbildung 1.24). Für Cantor waren die angeblichen Paradoxien nichts weiter als Eigenschaften unendlicher Mengen. Er sah, dass die augenscheinlichen Widersprüche lediglich von der unbegründeten Annahme herrühren, dass unendliche Mannigfaltigkeiten die gleichen Eigenschaften besitzen müssen, wie die uns vertrauten endlichen Mengen. Einen Fürsprecher fand Cantor in Richard Dedekind. Genau wie er sah Dedekind in dem, was andere als Paradoxie bezeichneten, eine definierende Eigenschaft unendlicher Mengen. Offensichtlich hat eine Menge genau dann unendlich viele Elemente, wenn eine echte Teilmenge mit der gleichen Mächtigkeit existiert.
1.2 Der Weg zur modernen Mathematik
27
„[Cantors] Widerlegung der Bedenken gegen das Unendliche scheint mir im Ganzen wohlgelungen und treffend zu sein. Die Bedenken entstehen dadurch, dass dem Unendlichen Eigenschaften beigelegt werden, die ihm nicht zukommen, indem entweder Eigenschaften des Endlichen auf das Unendliche wie selbstverständlich übertragen werden oder eine Eigenschaft, die nur dem Absolutunendlichen zukommt, auf alles Unendliche übertragen wird. Auf die Unterschiede im Unendlichen nachdrücklich hinzuweisen, ist ein Verdienst dieser Schrift.“ [51]
Gottlob Frege (1848 – 1925)
„Das Unendliche wird sich in der Arithmetik doch schließlich nicht leugnen lassen, und andererseits ist es mit jener erkenntnistheoretischen Richtung unvereinbar. Hier ist, wie es scheint, das Schlachtfeld, wo eine große Entscheidung fallen wird.“ [51]
Abbildung 1.25: Der deutsche Mathematiker Gottlob Frege begründete mit dem Logizismus eine neue Denkrichtung. Auch er schreckte nicht vor dem aktual Unendlichen zurück; wie Cantor sah er darin den Schlüssel zu einer modernen Mathematik.
Obgleich das hohe Maß an Unverständnis, Misstrauen und Feindseligkeit tiefe Furchen in Cantors Psyche hinterließ, hielt er Kurs. Unbeirrt steuerte er in Richtung einer neuen Mathematik, die das aktual Unendliche zum Protagonisten erheben und damit ein für allemal von seiner Statistenrollen befreien sollte. Noch ahnte Cantor nicht, dass sein Gedankengerüst schon bald ins Wanken geraten würde.
1.2.3
Macht der Symbole
Genau wie Cantor war auch der drei Jahre später geborene Gottlob Frege ein Verfechter des aktual Unendlichen (Abbildung 1.25). Frege sah früh voraus, dass sich der Umgang mit der Unendlichkeit zu einer Grundsatzfrage der gesamten Mathematik entwickeln würde, die kontrovers genug war, um die Wissenschaftsgemeinde für lange Zeit zu spalten. Nichtsdestotrotz war er davon überzeugt, dass sich das aktual Unendliche über kurz oder lang als akzeptiertes Instrument in der Mathematik etablieren würde. Genau wie Cantor sah er die Mathematik von einer „mächtigen akademisch-positivistischen Skepsis“ [51] beherrscht, die den Fortschritt zwar verzögern konnte, aber nicht im Stande war, ihn dauerhaft aufzuhalten. Im Jahr 1879 publizierte Gottlob Frege sein wichtigstes Werk, die Begriffsschrift. In der Rückschau markiert das knapp hundertseitige Buch
28
v 8 No 26 Jul
1 Historische Notizen
Friedrich Ludwig Gottlob Frege wurde am 8. November 1848 im mecklenburgischen Wismar geboren. 1869 schrieb er sich an der Universität Jena ein, wo er in Ernst Abbe, dem Direktor der Carl-Zeiss-Werke, einen einflussreichen Lehrer und lebenslangen Unterstützer fand. Wahrscheinlich war es ein Vorschlag Abbes, der Frege bewog, nach vier Semestern an die renommierte mathematische Fakultät der Universität Göttingen zu wechseln. Dort promovierte er im Jahr 1873 auf dem Gebiet der Geometrie. Zurück in Jena reichte er 1874 seine Habilitationsschrift ein. Nach einigen Jahren der Privatdozentur wurde er 1879 zum Extraordinarius und 1896 schließlich zum ordentlichen Professor berufen. Frege zählt zu den Begründern der mathematischen Logik und der analytischen Philosophie. Im Jahr 1879 schuf er mit mit seiner berühmten Begriffsschrift einen axiomatischen Zugang zur Logik [57], der weit über die bereits bekannte
1848 1925
Aussagenlogik von George Boole hinausging. Mit den eingeführten Begriffen und Konzepten schuf er die Grundlage der modernen Prädikatenlogik. Die meiste Zeit seines Lebens vertrat Frege die Auffassung, dass die Mathematik ein Teil der Logik sei, und war damit ein überzeugter Verfechter des Logizismus. Nach Frege müssen sich alle Wahrheiten auf eine Menge von Axiomen zurückführen lassen, die nach seinen Worten „eines Beweises weder fähig noch bedürftig“ seien. Er stand damit in einer Gegenposition zu anderen Mathematikern seiner Zeit, von denen viele die Logik als isoliertes Teilgebiet der Mathematik begriffen. Frege zog sich nach der niederschmetternden Entdeckung der Russell’schen Antinomie weitgehend aus der Wissenschaft zurück und sollte keine bedeutenden Arbeiten mehr publizieren. Die Trümmer seines logizistischen Programms vor Augen, starb Frege als verbitterter Mann am 26. Juli 1925 im Alter von 76 Jahren.
einen Meilenstein in der Geschichte der mathematischen Logik und gehört zu den wichtigsten Einzelpublikation in diesem Bereich. In seinem Werk schuf Frege das, was wir heute als symbolische Logik bezeichnen. Ihm gelang es, eine künstliche Sprache zu ersinnen, die ausdrucksstark genug ist, um die gesamte gewöhnliche Mathematik zusammen mit ihrem logischen Schlussapparat zu formalisieren. Dennoch wurde die Bedeutung, die Freges Werk für die Mathematik haben sollte, zur Zeit der Drucklegung gemeinhin verkannt. Mehrheitlich trat man seiner Arbeit mit Gleichgültigkeit entgegen oder stand seinen Ideen gar abweisend gegenüber. Auch Cantor hielt die Begriffsschrift für weitgehend bedeutungslos. Aber was war es genau, das Freges Arbeit so besonders machte? Schon ein paar Jahre zuvor hatte George Boole mit der Aussagenlogik das Grundgerüst erschaffen, um logische Relationen zwischen Elementaraussagen mithilfe symbolischer Operatoren auszudrücken [10, 11]. Freges Ansatz ging jedoch weit über die boolesche Logik hinaus. Er erkannte, dass sich die logischen Direktiven nicht nur dazu verwenden ließen, um die Zusammenhänge zwischen elementaren Aussagen zu beschreiben; sie entpuppten sich als stark genug, um die Struktur der Elementaraussagen selbst zu formalisieren. Damit hob Frege eine wichtige Einschränkung der booleschen Logik auf, die streng zwischen der Ebene der Elementaraussagen (Boolesche Variablen, primary propositions) und der Ebene der logischen Relationen (Aussagenlogische Ausdrücke, secondary propositions) unterschied.
29
1.2 Der Weg zur modernen Mathematik
I Negation („nicht A“)
In der Frege’schen Logik wird beispielsweise die Aussage
A
„Alle Menschen sind sterblich“
I Implikation („Aus B folgt A“)
in der folgenden Implikationsform dargestellt:
A
„Für alle x gilt: Wenn x ein Mensch ist, dann ist x sterblich.“ In ähnlicher Weise lässt sich die Aussage
B
A B
auf die Und-Verknüpfung (Konjunktion) zurückführen:
B∧A
I Disjunktion („B oder A“)
„Für ein x gilt: x ist ein Mensch und x ist reich.“
A
Die von Frege eingeführte Darstellungsform ist die Grundlage der modernen Prädikatenlogik. Legen wir die heute gebräuchliche Schreibweise zugrunde, so lassen sich die oben formulierten Aussagen in der Form
B
x
(1.16) (1.17)
A
∀x A
I Existenzquantifikation („Für ein x ...“) x
(1.18) (1.19)
B∨A
I Allquantifikation („Für alle x ...“)
oder kürzer als ∀ x (M(x) → S(x)) ∃ x (M(x) ∧ R(x))
B→A
I Konjunktion („B und A“)
„Manche Menschen sind reich“
∀ x (Mensch(x) → Sterblich(x)) ∃ x (Mensch(x) ∧ Reich(x))
¬A
A
∃x A
Abbildung 1.26: Die Notation in Freges Begriffsschrift und die Schreibweise der modernen Prädikatenlogik im Vergleich
ausdrücken. Der Allquantor ‚∃‘ und der Existenzquantor ‚∀‘ werden verwendet, um quantitative Aussagen über die Elemente der Grundmenge (hier die Menge aller Menschen) zu machen. Gelesen wird ∀ x als „Für alle x gilt ...“ und ∃ x als „Es existiert ein x, für das gilt: ...“. Die Zeichen ‚→‘ und ‚∧‘ sind die heute üblichen Symbole für die logische Wenn-DannBeziehung (Implikation) und die Und-Verknüpfung (Konjunktion). Obwohl sich der konzeptionelle Kern der Begriffsschrift kaum von jenem der modernen Prädikatenlogik unterscheidet, könnten ihre Erscheinungsformen kaum unterschiedlicher sein. Verantwortlich hierfür ist die komplizierte zweidimensionale Notation, in der Frege seine Formeln niederschrieb (Abbildung 1.26). Die Art der Darstellung hat nicht nur die Zunft der Buchdrucker vor neue Herausforderungen gestellt; sie ist ebenso dafür verantwortlich, dass wir Freges Buch heute nur nach einer gründlichen Einarbeitung lesen können. Um einen plastischeren Eindruck von der Notation zu erhalten, zeigt Abbildung 1.27, wie sich die Formeln (1.18) und (1.19) in Freges Notation ausdrücken lassen.
I „Alle Menschen sind sterblich“ x
S(x)
∀ x (M(x) → S(x))
M(x) I „Manche Menschen sind reich“ x
R(x)
∃ x (M(x) ∧ R(x))
M(x) Abbildung 1.27: Zusammengesetzte Ausdrücke in Freges Notation
30
1 Historische Notizen
Mit der Begriffsschrift war es Frege gelungen, das logische Denken auf eine symbolische Ebene zu heben. Doch seine eigentlichen Ambitionen gingen deutlich weiter. Im Gegensatz zu vielen seiner Zeitgenossen, zu denen auch Cantor und Boole gehörten, sah er die Logik nicht als Teil der Mathematik, sondern umgekehrt die Mathematik als Teil der Logik an. Mit Vehemenz verfolgte er das Ziel, sämtliche mathematischen Begriffe und Konzepte auf elementare Begriffe der Logik zurückzuführen und auf diese Weise die gesamte Mathematik mit einem soliden Unterbau zu versehen. Mit seinem ambitionierten Projekt begründete Frege eine neue philosophische Denkrichtung, die wir heute als Logizismus bezeichnen. Einen wichtigen Teilerfolg erzielte Frege im Jahr 1884 mit der Publikation der Grundlagen der Arithmetik [56]. In diesem Werk unternahm er den Versuch, den Zahlenbegriff formal zu definieren, und erläuterte den Plan für die Durchführung seines logizistischen Programms. Anders als die Begriffsschrift war sein neues Werk eine rein umgangssprachliche Abhandlung. Frege hatte sein Ziel klar vor Augen und sollte die nächsten zwanzig Jahre seines Lebens fast vollständig der Formalisierung seiner Ideen widmen. Die Früchte seiner Arbeit waren die Grundgesetze der Arithmetik, ein zweibändiges Buch, das wir neben der Begriffsschrift als das zweite Hauptwerk Freges ansehen dürfen (Abbildung 1.28) [53, 54]. Um die Arithmetik logisch zu begründen, stellte Frege einen Zusammenhang zwischen dem Begriff der Zahl und dem Begriff der Menge her. Betrachten wir beispielsweise die Menge aller Wochentage, die Menge aller Weltwunder oder die Menge aller Siegel eines unverständlichen Buchs, so zählen wir in jedem Fall 7 Elemente. Wüssten wir noch nichts über die Zahl 7, so könnten wir zumindest feststellen, dass alle genannten Mengen gleich viele Elemente enthalten. Die Erkenntnis, dass wir über die Gleichmächtigkeit von Mengen sprechen können, ohne die konkrete Anzahl ihrer Elemente zu benennen, ermöglicht es, den Zahlenbegriff auf eine Mengeneigenschaft zurückzuführen. Frege tat genau dies. Im Sinne seiner Logik wird die Zahl 7 mit der Menge aller Mengen identifiziert, die sich bijektiv auf eine der genannten Beispielmengen abbilden lassen. Genau wie Cantor war auch Frege von der Korrektheit seiner Arbeit überzeugt. Noch waren die Wolken außer Sichtweite, die sich hinter dem Horizont zusammenzogen und den strahlend blauen Himmel der neu geschaffenen Mathematik schon bald verdunkeln sollten.
1.2 Der Weg zur modernen Mathematik
31
Abbildung 1.28: Auszug aus dem 1. Band der Grundgesetze der Arithmetik. Gottlob Frege schrieb das zweibändige Werk als Teil seines logizistischen Programms. Es war der erste umfassende Versuch, die Mathematik auf die Logik zurückzuführen.
1.2.4
Aufbruch in ein neues Jahrhundert
In der Nacht zum 1.1.1900 begrüßten die Menschen das neue Jahrhundert voller Euphorie. Die wissenschaftlichen Erkenntnisse des neunzehnten Jahrhunderts hatten die Allmachtsphantasie der Menschen befeuert, und auch die Mathematik wähnte sich dank der errungenen Erfolge auf dem richtigen Pfad. Vor diesem Hintergrund verwundert es nicht, dass die Eröffnungsrede des 2. internationalen Kongresses der Mathematiker in Paris nicht, wie üblich, aus einem Rückblick auf das Gewesene, sondern einem Ausblick auf das kommende Jahrhundert bestand. Die Rede begann mit den folgenden Worten: „Wer von uns würde nicht gern den Schleier lüften, unter dem die Zukunft verborgen liegt, um einen Blick zu werfen auf die bevorstehenden Fortschritte unserer Wissenschaft
32
1 Historische Notizen
n 14 Feb
David Hilbert wurde am 23.1.1862 in Königsberg als ältestes Kind einer ostpreußischen Juristenfamilie geboren. Die in seiner Heimatstadt ansässige Albertus-Universität (Albertina) bot ihm optimale Voraussetzungen, um seine Talente zu entwickeln. Das Studium der Mathematik beendete er 1884 mit der Promotion, 1886 folgte die Habilitation. Nach einigen Jahren der Privatdozentur wurde er 1892 von der Albertina zum Professor berufen. 1895 folgte Hilbert einem Ruf an die mathematische Fakultät der Universität Göttingen. Es waren Größen wie Gauß, Dirichlet und Riemann, die der Göttinger Mathematik einst zu großem Ruhm verhalfen. Gegen Ende des neunzehnten Jahrhunderts drohte dieser aufgrund mangelnder Nachfolger allmählich zu verblassen. Die Berufung Hilberts war Teil eines Neuanfangs, der die Göttinger Mathematik zu neuer Blüte führen sollte.
23 Ja
1862 1943
Hilbert war nicht nur ein außerordentlich begabter, sondern auch ein ungewöhnlich vielseitiger Mathematiker. Im Laufe seiner akademischen Karriere hat er seinen Forschungsschwerpunkt mehrfach gewechselt und nicht nur im Bereich der mathematischen Logik, sondern auch in der Geometrie, der Zahlentheorie, der Analysis und der theoretischen Physik seine Spuren hinterlassen. Wie kein anderer beeinflusste Hilbert die Mathematik des beginnenden zwanzigsten Jahrhunderts. Im Jahr 1900 hielt er auf dem internationalen Kongress der Mathematiker in Paris seine berühmte Jahrhundertrede, in der er 23 ungelöste Probleme vortrug, die Mathematiker für Jahrzehnte beschäftigen sollten. Noch heute sind einige Probleme offen. Hilbert starb am 14.2.1943 im Alter von 81 Jahren. Ein unauffälliger Grabstein auf dem Göttinger Stadtfriedhof erinnert leise und bescheiden an einen der größten Visionäre seiner Zeit. In Stein gemeißelt trägt er seine berühmten Worte: „Wir müssen wissen. Wir werden wissen.“
und in die Geheimnisse ihrer Entwicklung während der künftigen Jahrhunderte! Welche besonderen Ziele werden es sein, denen die führenden mathematischen Geister der kommenden Geschlechter nachstreben? Welche neuen Methoden und neuen Tatsachen werden die neuen Jahrhunderte entdecken – auf dem weiten und reichen Felde mathematischen Denkens?“ [84] Der Redner auf dem Podium war der erst 38 jährige David Hilbert (Abbildung 1.29). Trotz seines ungewöhnlichen Alters war der junge Mathematiker kein Unbekannter. Durch zahlreiche Erfolge auf verschiedenen Gebieten der Mathematik stieg er früh in den Olymp der bedeutendsten Mathematiker auf.
David Hilbert (1862 – 1943) Abbildung 1.29: Der deutsche Mathematiker David Hilbert zählt zu den berühmtesten und einflussreichsten Mathematikern der vorigen Jahrhundertwende. Im Jahr 1900 hielt er auf dem internationalen Kongress der Mathematiker in Paris eine wegweisende Rede, an der sich die weitere Stoßrichtung der gesamten Mathematik über Jahrzehnte hinweg orientieren sollte.
In Hilbert fand die axiomatische Methode einen genauso berühmten wie prominenten Fürsprecher, und es ist eines seiner Verdienste, dass sie Ende des neunzehnten Jahrhunderts in den Mittelpunkt des Interesses rückte. Für ihn war sie die einzige adäquate Antwort auf die jahrzehntelang geführte Diskussion über das Wesen der mathematischen Grundelemente. Anders als Frege hielt Hilbert nichts von dem Versuch, die natürlichen Zahlen durch die Rückführung auf andere Begriffe zu erklären; die verwendeten Begriffe waren für ihn kaum einsichtiger als der Begriff der natürlichen Zahlen selbst. Ebensowenig teilte er die Ansicht des prominenten Zahlentheoretikers Leopold Kronecker, die „natürlichen Zahlen
1.2 Der Weg zur modernen Mathematik
habe der liebe Gott geschaffen“ [187], so dass sich jede Definition derselben als genauso überflüssig wie sinnlos erweisen müsse. Hilberts Weg aus dem Dilemma war ein formalistischer. Anstatt die mathematischen Grundelemente ihrem Wesen nach zu erklären, beschränkte er sich auf die Benennung der logischen Beziehungen, die zwischen den betrachteten Objekten bestehen. Mit seiner Vorgehensweise konnte er im Jahr 1899 mit der Neuformulierung der euklidischen Geometrie einen durchschlagenden Erfolg erzielen. Aus insgesamt 20 Axiomen, eingeteilt in 5 Axiomengruppen, lassen sich alle Sätze der euklidischen Geometrie ableiten, ohne die verwendeten Symbole mit einer speziellen Interpretation zu versehen [80]. Mit dieser Arbeit wies Hilbert den Weg, auf dem ihn viele Mathematiker über Jahre hinweg begleiten sollten. In der Folgezeit wurden weite Bereiche der Mathematik in der gleichen Art und Weise axiomatisiert und damit einer präzisen Betrachtung zugänglich gemacht. In diesem modernen Sinn wird die Mathematik zu einem symbolischen Spiel, in dem die Regeln und nicht die Bedeutungen der Figuren die Partie bestimmen. Hilberts formalistische Methode bringt das Maß an Ehrlichkeit und Klarheit mit sich, nach dem Mathematiker von jeher streben: Sie ist frei von Interpretationsspielräumen jeglicher Art. In seiner Pariser Eröffnungsrede adressierte Hilbert 23 Probleme, die für die Mathematik von immenser Wichtigkeit, aber bis dato eben ungelöst waren. Nur die ersten 10 Probleme wurden vorgetragen, die letzten 13 sind nur in der schriftlichen Ausarbeitung der Rede enthalten. Hilbert war sich bewusst, welche wegweisende Rolle der Unendlichkeitsbegriff für die Zukunft der Mathematik haben würde, und so avancierte die Klärung der Kontinuumshypothese an die erste Stelle. „[...]. Die Untersuchungen von Cantor über solche Punktmengen machen einen Satz sehr wahrscheinlich, dessen Beweis jedoch trotz eifrigster Bemühungen bisher noch niemanden gelungen ist; dieser Satz lautet: Jedes System von unendlich vielen reellen Zahlen, d. h. jede unendliche Zahlen- (oder Punkt)menge ist entweder der Menge der ganzen natürlichen Zahlen 1, 2, 3, ... oder der Menge sämtlicher reellen Zahlen und mithin dem Kontinuum, d. h. etwa den Punkten einer Strecke äquivalent; im Sinne der Äquivalenz gibt es hiernach nur zwei Zahlenmengen, die abzählbare Menge und das Kontinuum.“ [84] An zweiter Stelle forderte Hilbert dazu auf, einen Beweis für die Widerspruchsfreiheit der arithmetischen Axiome zu liefern.
33
34
1 Historische Notizen
„[...]. Vor allem aber möchte ich unter den zahlreichen Fragen, welche hinsichtlich der Axiome gestellt werden können, dies als das wichtigste Problem bezeichnen, zu beweisen, dass dieselben untereinander widerspruchslos sind, d.h., dass man aufgrund derselben mittelst einer endlichen Anzahl von logischen Schlüssen niemals zu Resultaten gelangen kann, die miteinander in Widerspruch stehen.“ [84] Konkret handelt es sich um eine Reihe von Axiomen, die nach dem italienische Mathematiker Giuseppe Peano benannt sind. Wenn wir heute von den Peano-Axiomen reden, so sind die fünf Axiome 1, 6, 7, 8 und 9 aus Abbildung 1.30 gemeint. Sie drücken jene fünf Eigenschaften aus, über die sich die Ordnungsstruktur der natürlichen Zahlen eindeutig charakterisieren lässt.3 Ihren Ursprung haben die Axiome in der berühmten Abhandlung Was sind und was sollen die Zahlen von Richard Dedekind aus dem Jahr 1888 [45]. Dort waren sie noch umgangssprachlich formuliert und wurden von Peano ein Jahr später in eine symbolische Formelsprache gebracht [131] (aus dem lateinischen übersetzt in [72]). In Abschnitt 3.1 werden wir die Axiome in einer leicht modernisierten Form wieder aufgreifen und in die moderne Prädikatenlogik übersetzen. Der von Hilbert eingeforderte Widerspruchsfreiheitsbeweis für die arithmetischen Axiome ist von tragender Bedeutung für die gesamte Mathematik, da nahezu alle ihre Teilbereiche auf der Theorie der Zahlen aufbauen. Solange die Widerspruchsfreiheit nicht garantiert werden kann, besteht die Möglichkeit, dass sich sowohl die Gleichung 1 + 1 = 2 als auch die Gleichung 1 + 1 = 2 aus den Axiomen ableiten lässt. Die Auswirkungen wären von fatalem Ausmaß für alle Bereiche der Mathematik. Hilbert war fest davon überzeugt, dass sich die Widerspruchsfreiheit axiomatischer Systeme beweisen lässt, und seine Anfangserfolge schienen ihm Recht zu geben. Im Rahmen seiner Neuformulierung der Geometrie konstruierte er einen speziellen Zahlenbereich derart, dass jede beweisbare Beziehung zwischen den geometrischen Objekten einer beweisbaren Beziehung zwischen den Elementen dieses Zahlenbereichs entspricht und umgekehrt. Folgerichtig würde jeder Widerspruch, der sich aus den geometrischen Axiomen ergibt, als Widerspruch in der 3 Dass Peano die natürlichen Zahlen mit der 1 beginnen ließ und nicht, wie heute üblich mit der 0, spielt nur eine untergeordnete Rolle, schließlich haben wir in Abschnitt 1.2.2 gezeigt, dass sich die Mengen {0, 1, 2, . . .} und {1, 2, 3, . . .} bijektiv aufeinander abbilden lassen.
1.2 Der Weg zur modernen Mathematik
35
Giuseppe Peano (1858 – 1932) Abbildung 1.30: Auszug aus der übersetzten Originalarbeit von 1889, in der Giuseppe Peano die erste formale Axiomatisierung der natürlichen Zahlen publizierte. Das nach links geöffnete C verwendete Peano für die logische Implikation. Später wurde es als ⊃ geschrieben und entspricht dem heute gebräuchlichen Implikationsoperator →.
Arithmetik sichtbar werden. Mit anderen Worten: Vertrauen wir der Arithmetik, so folgt daraus die Widerspruchsfreiheit der geometrischen Axiome. Was Hilbert vollbrachte, war ein relativer Widerspruchsbeweis. Er hatte die Widerspruchsfreiheit der Geometrie erfolgreich auf die Widerspruchsfreiheit der Arithmetik reduziert. Für die Arithmetik selbst forderte Hilbert dagegen einen absoluten Beweis, der ohne die Annahme der Widerspruchsfreiheit eines anderen Systems auskommt. Ganz im Sinne des Henne-Ei-Problems würde jeder relative Beweis die Frage nach der Widerspruchsfreiheit lediglich auf ein anderes Axiomensystem verschieben. Im Augenblick seiner Rede stand für Hilbert außer Zweifel, dass ein absoluter Widerspruchsfreiheitsbeweis für die Arithmetik existiert. Noch war es für ihn lediglich eine Frage der Zeit, bis er gefunden werden würde. An zehnter Stelle forderte Hilbert dazu auf, ein Lösungsverfahren für diophantische Gleichungen zu erarbeiten (Abbildung 1.31).
36
1 Historische Notizen
x2 + y2 z2 = 0
„Eine diophantische Gleichung mit irgend welchen Unbekannten und mit ganzen rationalen Zahlenkoeffizienten sei vorgelegt: man soll ein Verfahren angeben, nach welchem sich mittelst einer endlichen Anzahl von Operationen entscheiden lässt, ob die Gleichung in ganzen rationalen Zahlen lösbar ist.“ [84] Wie in Abschnitt 1.2.1 dargelegt, hat eine diophantische Gleichung die Form p(x1 , x2 , . . . , xn ) = 0
Unlösbar
Lösbar
Abbildung 1.31: An zehnter Stelle seiner Jahrhundertrede forderte Hilbert dazu auf, ein allgemeines Lösungsverfahren für diophantische Gleichungen zu erarbeiten.
wobei p ein multivariables Polynom mit ganzzahligen Koeffizienten ist. Die Lösung einer diophantischen Gleichung ist die Menge der ganzzahligen Nullstellen von p. Was Hilbert damals als Verfahren bezeichnete, würden wir heute Algorithmus nennen. Zum Zeitpunkt seiner Rede war der Computer noch in weiter Ferne, und es herrschte nur eine vage Vorstellung davon, was unter einem Verfahren im Hilbert’schen Sinne genau zu verstehen sei. In der Tat sollten noch mehr als 30 Jahre vergehen, bis der Berechenbarkeitsbegriff durch Alan Turing und Alonzo Church in eine mathematisch präzise Form gebracht werden konnte. In Kapitel 5 werden wir im Detail auf die Berechenbarkeitstheorie zu sprechen kommen und zeigen, warum jeder Versuch, das von Hilbert eingeforderte Verfahren zu konstruieren, von Grund auf zum Scheitern verurteilt ist.
1.2.5
Grundlagenkrise
Das neue Jahrhundert war noch jung, als Gottlob Frege im Juni 1902 einen Brief des britischen Mathematikers und Philosophen Bertrand Russell erhielt (Abbildung 1.32). Was Frege las, sollte nicht nur seine eigene Arbeit im Mark erschüttern, sondern die gesamte Mathematik in die größte Krise ihrer mehrere tausend Jahre alten Geschichte stürzen. Frege erreichte der Brief just zu der Zeit, als er den zweiten Band der Grundgesetze der Arithmetik fertigstellte. Viele Jahre seines Lebens hatte er auf diese Arbeit verwendet und sah sie auf einen Schlag in Trümmern liegen. Für größere Änderungen war es ohnehin zu spät, und so schließt der zweite Band mit dem folgenden Nachwort [52, 55]: „Einem wissenschaftlichen Schriftsteller kann kaum etwas Unerwünschteres begegnen, als dass ihm nach Vollendung einer Arbeit eine der Grundlagen seines Baues erschüttert wird. In diese Lage wurde ich durch einen Brief des Herrn
37
1.2 Der Weg zur modernen Mathematik
ai 2 Feb
Bertrand Arthur William Russell war der Enkel des zweimaligen britischen Premierministers Lord John Russell und wurde am 18. Mai 1872 als drittes Kind einer liberalen Aristokratenfamilie geboren. Als er 2 Jahre alt war, fielen Mutter und Schwester der Diphtherie zum Opfer. Als er 1876 auch noch seinen Vater verlor, erstritten seine Großeltern das Sorgerecht. Zwei Jahre später verstarb sein Großvater, und seine Großmutter übernahm allein die Erziehung. Schon in frühen Jahren wurde Russells einzigartige Begabung für Mathematik und Philosophie sichtbar. Zunächst wurde er privat und später am renommierten Trinity College in Cambridge unterrichtet. In den Jahren 1890 bis 1894 widmete er sich dem Studium der Mathematik und lernte in dieser Zeit seinen Lehrer und späteren Freund Alfred North Whitehead kennen. Nach seinem Studium nutzte er bis 1901 die ihm gebotene Möglich-
18 M
1872 1970
keit, in Cambridge ohne Lehrverpflichtungen zu forschen, und wurde 1908 in die Royal Society aufgenommen. Eine einschneidende Veränderung erfuhr sein Leben durch den ersten Weltkrieg. Im Jahr 1916 wurde er aufgrund wiederholter pazifistischer Aktivitäten zu einer Geldstrafe verurteilt und seiner Anstellung am Trinity College enthoben [70]. Zwei Jahre später wurde ihm erneut der Prozess gemacht und eine zweijährige Gefängnisstrafe auferlegt. In der Folgezeit verfasste er eine Vielzahl bedeutender Werke über philosophische und gesellschaftliche Themen und wurde im Jahr 1950 mit dem Literaturnobelpreis geehrt. Durch seine literarische Arbeit gelangte er zu Weltruhm, und etliche Menschen verbinden seinen Namen heute ausschließlich mit seinem philosophischen Werk. Viele wissen nicht, dass sich hinter dem berühmten Philosophen Bertrand Russell zugleich einer der größten Mathematiker des zwanzigsten Jahrhunderts verbirgt.
Bertrand Russell versetzt, als der Druck dieses Bandes sich seinem Ende näherte.“ Was konnte Freges Arbeit so grundlegend erschüttern, dass er sein gesamtes Lebenswerk gefährdet sah? Die Antwort ist in der Proposition V, seinem fünften Grundgesetz, verborgen. Aus diesem Gesetz lässt sich das allgemeine Komprehensionsaxiom ableiten, das in moderner Schreibweise so lautet: ∃ y ∀ x ((x ∈ y) ↔ ϕ(x)) Hierin ist ϕ eine frei wählbare Formel, in der die Variable y nicht vorkommt. In Worten liest sich das allgemeine Komprehensionsaxiom wie folgt: Es existiert eine Menge y, die genau diejenigen Elemente x enthält, auf die die Eigenschaft ϕ zutrifft. Beschreibt ϕ beispielsweise die Eigenschaft, eine Primzahl zu sein, so sichert uns das Komprehensionsaxiom zu, von der Menge aller Primzahlen reden zu dürfen. Das Axiom wird häufig auch als Separationsaxiom bezeichnet, da die Bedingung ϕ diejenigen Elemente, die in y enthalten sind, von jenen separiert, die nicht in y enthalten sind. Es ist ein entscheidendes Merkmal der Frege’schen Logik, dass die Formel ϕ keinerlei Einschränkungen unterliegt. Russell erkannte die Gefahr dieser Freiheit und traf die folgende Wahl: ϕ(x) := (x ∈ x)
Bertrand Russell (1872 – 1970) Abbildung 1.32: Dem britischen Mathematiker und Philosophen Bertrand Russell gelang es, die Logik der naiven Mengenlehre als widersprüchlich zu entlarven. Seine Entdeckung stürzte die Mathematik in die größte Krise ihrer mehrere tausend Jahre alten Geschichte.
38
1 Historische Notizen
BARBIER -PARADOXON „You can define the barber as ’one who shaves all those, and those only, who do not shave themselves’. The question is, does the barber shave himself?“ [157] Fall 1: Der Barbier rasiert sich selbst. Hieraus folgt...
Die Formel beschreibt eine harmlos erscheinende Eigenschaft: Sie trifft auf alle Mengen x zu, die sich nicht selbst als Element enthalten. ϕ ist für die meisten Mengen wahr. So ist die Menge aller Menschen selbst kein Mensch und auch die Menge aller Primzahlen selbst keine Primzahl. Dagegen ist ϕ für die Menge aller Mengen falsch. Da sie selbst eine Menge ist, enthält sie sich auch selbst als Element. Mit der getätigten Wahl von ϕ garantiert uns das Komprehensionsaxiom die Existenz einer Menge y mit der folgenden Eigenschaft: ∀ x ((x ∈ y) ↔ (x ∈ x)) In Worten: Die Menge y ist die Menge aller Mengen, die sich nicht selbst als Element enthalten. Jetzt können wir über die sogenannte Instanziierungsregel den Allquantor eliminieren, indem wir x durch ein beliebiges Element ersetzen. Wählen wir für x die besagte Menge y, so erhalten wir den Widerspruch, dass sich die Menge y genau dann selbst enthält, wenn sie sich nicht selbst enthält: (y ∈ y) ↔ (y ∈ y)
Fall 2: Der Barbier rasiert sich nicht selbst. Hieraus folgt...
X
Abbildung 1.33: Der besagte Barbier rasiert genau diejenigen Männer, die sich nicht selbst rasieren. Die Frage, ob sich der Barbier selbst rasiert oder nicht, führt zu demselben Zirkelschluss, der auch der Russell’schen Antinomie zugrunde liegt.
Sowohl in der Frege’schen Logik als auch in der Cantor’schen Mengenlehre ist das allgemeine Komprehensionsaxiom eine tragende Säule. Durch ihr Wegbrechen stand die neue Mathematik mit einem Schlag auf wackligen Füßen. Die Russell’sche Antinomie macht deutlich, dass sowohl Frege als auch Cantor im Umgang mit dem aktual Unendlichen zu unvorsichtig waren. So harmlos das allgemeine Komprehensionsaxiom auch wirken mag – es lässt uns Mengen konstruieren, die wir nicht als abgeschlossenes Ganzes ansehen dürfen. Betrachten wir die Menge aller Mengen, die sich nicht selbst als Element enthalten, tatsächlich als aktual existent, so sind die entstehenden Widersprüche unausweichlich. Heute wird der Zirkelschluss der Russell’sche Antinomie gern am Beispiel des Barbier-Paradoxons erklärt (Abbildung 1.33). Russell selbst griff auf dieses Paradoxon zurück, um seine Antinomie mit Begriffen des Alltags einem größeren Leserkreis nahe zu bringen. Der hohe Bekanntheitsgrad der Russell’schen Antinomie täuscht häufig darüber hinweg, dass der Mengenbegriff schon vorher für Ungereimtheiten gesorgt hatte. So bemerkte Cantor im Jahr 1897, dass die Menge aller Kardinalzahlen ihre eigene Kardinalzahl nicht umfassen kann. Zwei Jahre später stieß er auf das Burali-Forti-Paradoxon, auf das wir in Abschnitt 3.2.2 zurückkommen werden. Benannt ist es nach dem italienischen Mathematiker Cesare Burali-Forti, der schon 1897 entdeckt
39
1.2 Der Weg zur modernen Mathematik
hatte, dass die Definition der Menge aller Ordinalzahlen zu Widersprüchen führt. Cantor hat die Entdeckung der Antinomien niemals publiziert, und wir wissen von seinen Erkenntnissen ausschließlich aus Briefwechseln mit Hilbert und Dedekind. Auch sie hielten die Antinomien wohl eher für Kuriositäten, die aus dem unzulässigen, weil informellen Gebrauch verschiedener Begriffe herrührten. Die Russell’sche Antinomie war anders. Zum einen war sie so elementar, dass alle Bereiche der Mathematik betroffen waren, die in irgendeiner Form auf den Begriff der Menge zurückgriffen. Zum anderen hatte Russell nicht nur gezeigt, dass die Menge aller Mengen, die sich nicht selbst enthalten, zu Widersprüchen führt, sondern auch, dass diese Menge innerhalb der Logik formal konstruiert werden kann. Anders als die Antinomien der Ordinal- oder Kardinalzahltheorien, die als kuriose Begleiterscheinungen am Rande eines ansonsten intakten mathematischen Kerns gewertet wurden, ließ sich die Russell’sche Antinomie nicht ignorieren. Was Russell entdeckte, war eine tektonische Verwerfung riesigen Ausmaßes, mitten im Herzen der Mathematik. Frege empfand die Entdeckung der Antinomie als schweren Schlag, der sein Lebenswerk wie eine Seifenblase zerplatzen ließ. Als zwei Jahre später seine Frau Margarete verstarb, verfiel er in eine tiefe Depression, von der er sich zeitlebens nicht mehr erholen sollte. Bertrand Russell teilte den Frege’schen Pessimismus nicht. Er erkannte, dass die entdeckten Antinomien durch die Konstruktion von Mengen entstehen, die „zu groß“ sind, um als abgeschlossenes Ganzes einen Sinn zu ergeben. Nach Russells Ansicht musste es durch die geschickte Abwandlung der zugrunde gelegten Axiome möglich sein, genügend Kontrolle über den Mengenbegriff zu erlangen, um die Mathematik von ihren Widersprüchen zu befreien. Zusammen mit dem britischen Mathematiker Alfred North Whitehead (Abbildung 1.34) versuchte er, Freges Traum doch noch zu verwirklichen. Es war der zweite Anlauf, ein widerspruchsfreies Fundament zu errichten, auf dem die Mathematik für alle Zeiten einen sicheren Halt finden sollte.
Alfred North Whitehead (1861 – 1947)
Nach zehn Jahren intensiver Arbeit war das Ergebnis greifbar: Die Principia Mathematica, erschienen in den Jahren 1910 bis 1913, waren fertiggestellt (Abbildung 1.35). Russell und Whitehead schufen ein monumentales Werk, das in Umfang und Tiefe weit über die Frege’sche Arbeit hinausgeht. Auf über 1800 Seiten, verteilt auf 3 Bände, unternahmen die Autoren den Versuch, alle mathematischen Erkenntnisse aus einer kleinen Menge von Axiomen systematisch herzuleiten. Auch
Abbildung 1.34: Der britische Mathematiker Alfred North Whitehead war der zweite Autor der Principia Mathematica. Genau wie sein Schüler und langjähriger Freund Bertrand Russell verabschiedete sich Whitehead in späteren Jahren von der reinen Mathematik und wandte sich verstärkt philosophischen Themen zu.
40
Abbildung 1.35: Principia Mathematica. Dieses monumentale Werk von Russell und Whitehead ist für uns nicht leicht zu lesen, da sich die Notation von der heute gebräuchlichen unterscheidet und in einigen Aspekten unglücklich gewählt wurde. So besitzt der Punkt in der Principia eine Doppelbedeutung. In Abhängigkeit von seiner Position wird er für die konjunktive Verknüpfung oder zum Klammern von Teilausdrücken verwendet. Die Abbildung zeigt drei Formeln aus der Originalausgabe der Principia Mathematica sowie deren Übersetzung in die heute übliche Schreibweise.
1 Historische Notizen
I
Drei Formeln der Principia . . .
I
und deren moderne Schreibweise
(2.03) (2.15) (2.16) (2.17)
(p → ¬q) → (q → ¬p) (¬p → q) → (¬q → p) (p → q) → (¬q → ¬p) (¬q → ¬p) → (p → q)
heute noch zählen die Principia Mathematica zu den berühmtesten mathematischen Werken unserer Geschichte. An Russells und Whiteheads monumentalem Werk werden sowohl die Vor- als auch die Nachteile einer vollständig formalisierten Mathematik sichtbar. Zum einen machen die Principia deutlich, dass sich nahezu alle Bereiche der gewöhnlichen Mathematik mit einer Präzision erfassen lassen, die in keiner anderen Wissenschaft vorhanden ist. Alle Beweise sind bis ins Detail ausgearbeitet und werden durch die Anwendung fest definierter Schlussregeln aus den Axiomen hergeleitet. Auf der anderen Seite fordert die erreichte Präzision ihren Tribut in einer gewaltig anwachsenden Komplexität. In Abbildung 1.36 ist die vielleicht berühmteste Passage der Principia zu sehen. Sie zeigt den Abschluss des formalen Beweises für die arithmetische Beziehung 1 + 1 = 2. Vor dem historischen Hintergrund wird deutlich, warum ein großer Teil der Principia der Typentheorie gewidmet ist. Hierbei handelt es sich um eine spezielle Form der Mengenlehre, in der sich die Widersprüche der Frege’schen Logik nicht reproduzieren lassen. Um die Antinomien zu umgehen, verfolgte Russell den Ansatz, Mengen hierarchisch zu ordnen. Auf der untersten Stufe befinden sich die Typ-1-Mengen, die lediglich Objekte des Individuenbereichs umfassen. Auf der nächsten Stufe befinden sich die Typ-2-Mengen, die ausschließlich Typ-1-Mengen als Elemente enthalten. Dann folgen die Typ-3-Mengen, die aus Typ2-Mengen bestehen, und so fort. Da eine Typ-n-Menge niemals selbst ein Element vom Typ n besitzen darf, kann sich eine Menge in der Typentheorie der Principia niemals selbst enthalten. Durch die Einführung dieser Mengenhierarchie war es Russell und Whitehead gelungen, jene
1.2 Der Weg zur modernen Mathematik
Abbildung 1.36: Formaler Beweis der arithmetischen Beziehung 1 + 1 = 2 im System der Principia Mathematica
Art von Selbstbezug zu vermeiden, die wenige Jahre zuvor die Mathematik in ihre tiefste Krise stürzte. Dennoch hat die Typentheorie die Zeit nicht überdauert, was im Wesentlichen an zwei Gründen liegt. Zum einen schränkt sie den Begriff der Menge so stark ein, dass sich etliche als harmlos geltende Mengen nicht mehr bilden lassen. Zum anderen führt ihre klobige Hierarchie dazu, dass viele Beweise im System der Principia deutlich umständlicher geführt werden müssen als beispielsweise in der Frege’schen Logik.
41
42
1 Historische Notizen
1.2.6
Axiomatische Mengenlehre
Die moderne Mengenlehre ist durch den formalen axiomatischen Aufbau von Ernst Zermelo und Abraham Fraenkel geprägt [50, 202]. Den Grundstein legte der deutsche Mathematiker Ernst Zermelo 1907 (Abbildung 1.37). Seine Mengenlehre bestand aus insgesamt 7 Axiomen, die zu dieser Zeit noch umgangssprachlich formuliert waren [202] (Abbildung 1.38). Erst im Jahr 1929 wurde sie von Thoralf Skolem in der Prädikatenlogik formal niedergeschrieben [168]. Obwohl die ZermeloMengenlehre einen deutlichen Fortschritt gegenüber dem Typensystem von Russell und Whitehead darstellt, ist sie ebenfalls zu konservativ ausgelegt. Beispielsweise ist es unmöglich, die (gutartige) Menge aller n-elementigen Mengen zu bilden, so dass selbst der widerspruchsfreie Kern der Frege’schen Logik nicht innerhalb der Zermelo-Mengenlehre nachgebildet werden kann. In den Folgejahren bewegte sich die Mathematik auf einem schmalen Grat. Einerseits galt es, die Zermelo-Axiome in einem Maß zu verändern, dass möglichst alle gutartigen Mengen innerhalb der Logik dargestellt werden können. Andererseits mussten Antinomien um jeden Preis ferngehalten werden, so dass die Erweiterung der Axiome sehr konservativ zu geschehen hatte. Im Zuge dieser Entwicklung wurde die Zermelo-Mengenlehre 1922 von Abraham Fraenkel um das Ersetzungsaxiom und 1930 von Zermelo um das Fundierungsaxiom ergänzt [50, 203] (Abbildung 1.38). Dafür ließ Zermelo in seiner Fassung von 1930 das Unendlichkeitsaxiom „als nicht zur allgemeinen Mengenlehre gehörig“ vorübergehend wegfallen, und auch das Auswahlaxiom war nicht mehr enthalten. Heute setzt sich die Zermelo-FraenkelMengenlehre, kurz ZF, aus den folgenden 9 Axiomen zusammen:
Ernst Friedrich Ferdinand Zermelo (1871 – 1953) [93] Abbildung 1.37: Mit 7 umgangssprachlich formulierten Axiomen legte der deutsche Mathematiker Ernst Zermelo den Grundstein der axiomatischen Mengenlehre.
I
Axiom der Bestimmtheit (Zermelo, 1908)
I
Axiom der leeren Menge (Zermelo, 1908)
I
Axiom der Paarung (Zermelo, 1908)
I
Axiom der Vereinigung (Zermelo, 1908)
I
Axiom der Aussonderung (Zermelo, 1908)
I
Axiom des Unendlichen (Zermelo, 1908)
I
Axiom der Potenzmenge (Zermelo, 1908)
I
Axiom der Ersetzung (Fraenkel, 1922)
I
Axiom der Fundierung (Zermelo, 1930)
43
1.2 Der Weg zur modernen Mathematik
I Axiom I (Axiom der Bestimmtheit)
„Ist jedes Element einer Menge M gleichzeitig Element von N und umgekehrt, ist also gleichzeitig M ⊂ N und N ⊂ M, so ist immer M = N. Oder kürzer: Jede Menge ist durch ihre Elemente bestimmt.“ I Axiom II (Axiom der Elementarmenge)
„Es gibt eine (uneigentliche) Menge, die ‚Nullmenge‘ 0, / welche gar keine Elemente enthält. Ist a irgend ein Ding des Bereichs, so existiert eine Menge {a}, welche a und nur a als Element enthält; sind a, b irgend zwei Dinge des Bereichs, so existiert immer eine Menge {a, b}, welche sowohl a als [auch] b, aber kein von beiden verschiedenes Ding x als Element enthält. “ I Axiom III (Axiom der Aussonderung)
„Ist die Klassenaussage Φ(x) definit für alle Elemente einer Menge M, so besitzt M immer eine Untermenge MΦ , welche alle diejenigen Elemente x von M, für welche Φ(x) wahr ist, und nur solche als Elemente enthält.“ I Axiom IV (Axiom der Potenzmenge)
„Jeder Menge T entspricht eine zweite Menge U (die ‚Potenzmenge‘ von T ), welche alle Untermengen von T und nur solche als Elemente enthält.“ I Axiom V (Axiom der Vereinigung)
„Jeder Menge T entspricht eine Menge ST (die ‚Vereinigungsmenge‘ von T ), welche alle Elemente der Elemente von T und nur solche als Elemente enthält.“ I Axiom VI (Axiom der Auswahl)
„Ist T eine Menge, deren sämtliche Elemente von 0/ verschiedene Mengen und untereinander elementfremd sind, so enthält ihre Vereinigung ∪T mindestens eine Untermenge S1 , welche mit jedem Element von T ein und nur ein Element gemein hat.“ I Axiom VII (Axiom des Unendlichen)
„Der Bereich enthält mindestens eine Menge Z, welche die Nullmenge als Element enthält und so beschaffen ist, dass jedem ihrer Elemente a ein weiteres Element der Form {a} entspricht, oder welche mit jedem ihrer Elemente a auch die entsprechende Menge {a} als Element enthält.“
I Axiom der Bestimmtheit (B)
„Jede Menge ist durch ihre Elemente bestimmt, sofern sie überhaupt Elemente besitzt.“ I Axiom der Aussonderung (A)
„Durch jede Satzfunktion f(x) wird aus jeder Menge m eine Untermenge mf ausgesondert, welche alle Elemente x umfasst, für die f(x) wahr ist. Oder: Jedem Teil einer Menge entspricht selbst eine Menge, welche alle Elemente dieses Teils enthält.“ I Axiom der Paarung (P)
„Sind a, b irgend zwei Elemente, so gibt es eine Menge, welche beide als Element enthält.“ I Axiom der Potenzmenge (U)
„Jeder Menge m entspricht eine Menge Um, welche alle Untermengen von m als Elemente enthält, einschließlich der Nullmenge und m selbst. An die Stelle der ‚Nullmenge‘ tritt hier ein beliebig ausgewähltes ‚Urelement‘ u0 .“ I Axiom der Vereinigung (V)
„Jeder Menge m entspricht eine Menge Sm, welche die Elemente ihrer Elemente enthält.“ I Axiom der Ersetzung (E)
„Ersetzt man die Elemente x einer Menge m eindeutig durch beliebige Elemente x des Bereiches, so enthält dieser auch eine Menge m , welche alle diese x zu Elementen hat.“ I Axiom der Fundierung (F)
„Jede (rückschreitende) Kette von Elementen, in welcher jedes Glied Element des vorangehenden ist, bricht mit endlichem Index ab bei einem Urelement. Oder, was gleichbedeutend ist: Jeder Teilbereich T enthält wenigstens ein Element t0 , das kein Element t in T hat.“ I Optional: Axiom der Auswahl (AC)
„Ist T eine Menge, deren sämtliche Elemente von 0/ verschiedene Mengen und untereinander elementfremd sind, so enthält ihre Vereinigung ∪T mindestens eine Untermenge S1 , welche mit jedem Element von T ein und nur ein Element gemein hat.“
Abbildung 1.38: Links: Zermelo-Mengenlehre in der Formulierung von Ernst Zermelo aus dem Jahr 1908 [202]. Rechts: Zermelo-Fraenkel-Mengenlehre in der Formulierung von Ernst Zermelo aus dem Jahr 1930 [203]
44
1 Historische Notizen
Wird das System zusätzlich um das Auswahlaxiom (axiom of choice) erweitert, so sprechend wir von der ZFC-Mengenlehre (Zermelo-Fraenkel with Choice). In Abschnitt 3.2 werden wir uns ausführlich mit der Zermelo-FraenkelMengenlehre befassen. Dort werden wir die Bedeutung der einzelnen Axiome im Detail besprechen und zeigen, wie sich die umgangssprachlichen Formulierungen mithilfe der Prädikatenlogik formal ausdrücken lassen. Die Zermelo-Fraenkel-Mengenlehre ist zum Rückgrat der modernen Mathematik geworden. Zum einen wurde mit ihr ein logisches Fundament geschaffen, das stark genug ist, um alle Begriffe und Konzepte der gewöhnlichen Mathematik zu formalisieren. Zum anderen ist es bis zum heutigen Tag niemand gelungen, einen Widerspruch innerhalb von ZF oder ZFC herzuleiten. Aber können wir daraus schließen, dass die Zermelo-Fraenkel-Mengenlehre tatsächlich frei von Widersprüchen ist? Können wir auf ihr wirklich die Mathematik errichten, ohne Gefahr zu laufen, dass unser Gedankengerüst eines Tages einstürzen wird wie das Frege’sche Kartenhaus um die Jahrhundertwende? Mit letzter Sicherheit wissen wir es nicht, und in Abschnitt 4.3 werden wir zu der erstaunlichen Erkenntnis gelangen, dass wir es niemals wissen werden.
1.2.7
Hilberts Programm und Gödels Beitrag
Durch die zunehmende Beschäftigung mit den verschiedensten formalen Systemen entstand im Laufe der Zeit eine Meta-Mathematik, die sich nicht mit der Ableitung von Sätzen innerhalb des Systems beschäftigt, sondern mit Sätzen, die Aussagen über das System treffen. In das Zentrum des Interesses rückten vor allem drei Fragestellungen vor: I
Vollständigkeit Ein formales System heißt vollständig, wenn jede wahre Aussage, die in der betrachteten Logik formuliert werden kann, innerhalb des Systems beweisbar ist. Mit anderen Worten: Für jede wahre Aussage ϕ muss es eine endliche Kette von Regelanwendungen geben, die ϕ aus den Axiomen deduziert. Beachten Sie, dass ein vollständiges formales System nicht preisgeben muss, wie eine solche Kette zu finden ist. Die Vollständigkeit garantiert lediglich deren Existenz.
I
Widerspruchsfreiheit Ein formales System heißt widerspruchsfrei, wenn für eine Aussage ϕ niemals gleichzeitig ϕ und die Negation von ϕ (geschrieben
1.2 Der Weg zur modernen Mathematik
als ¬ϕ) abgeleitet werden kann. Erfüllt ein formales System diese Eigenschaft nicht, so könnte es kaum wertloser sein. Es würde uns gestatten, jede beliebige Aussage zu beweisen. I
Entscheidbarkeit Ein formales System heißt entscheidbar, wenn ein systematisches Verfahren existiert, mit dem für jede Aussage entschieden werden kann, ob sie innerhalb des Kalküls beweisbar ist. Hinter der Eigenschaft der Entscheidbarkeit verbirgt sich nichts Geringeres als der Wunsch nach einer mechanisierten Mathematik. Wäre z. B. die Zahlentheorie vollständig und entscheidbar, so ließe sich für jede wahre zahlentheoretische Aussage auf maschinellem Wege ein Beweis konstruieren. Der Traum vieler Mathematiker würde wahr.
Hilbert war überzeugt, dass eine vollständige, widerspruchsfreie und entscheidbare Axiomatisierung der Mathematik gefunden werden kann. Seine Bemühungen, die mathematische Methode mit einem sicheren Fundament zu versehen, konkretisierte er in den zwanziger Jahren. Hilbert hatte im Sinn, die gewöhnliche Mathematik in ein formales System zu überführen, das alle gebräuchlichen Beweismethoden umfasst. Von innen betrachtet wäre dieses System eine formale Variante der gewöhnlichen Mathematik. Von außen betrachtet erschiene es als eine Ansammlung von Axiomen und Schlussregeln. Gelänge es sicherzustellen, dass durch die Anwendung der Schlussregeln keine Widersprüche aus den Axiomen abgeleitet werden können, so wäre die Korrektheit aller innerhalb des Systems verankerten Beweismethoden gesichert. Zugegebenermaßen wäre wenig gewonnen, wenn der Beweis der Widerspruchsfreiheit mit den gleichen umstrittenen Beweismethoden geführt würde, die im Inneren des Systems vorhanden sind. Hilbert hatte im Sinn, die Widerspruchsfreiheit der Mathematik ausschließlich mit finiten Mitteln zu führen. Grob gesprochen fasste dieser Begriff all jene Beweismittel zusammen, deren Korrektheit außer Frage stand. Ausgeschlossen waren Beweismethoden, die den Begriff des Unendlichen strapazieren. Ebenfalls ausgeschlossen waren nichtkonstruktive Schlussweisen wie der indirekte Beweis (reductio ad absurdum), der auf dem Satz vom ausgeschlossenen Dritten beruht (tertium non datur). Der Ausschluss dieser Methoden war ein Tribut an den Intuitionismus, eine philosophische Strömung in der Mathematik, die zu Beginn des zwanzigsten Jahrhunderts zunehmend an Popularität gewann und eine konstruktive Mathematik einforderte. Würde Hilberts Vorhaben gelingen, so wäre ein für alle Mal geklärt, dass das Fundament, auf dem wir die moderne Mathematik errichtet
45
Der Intuitionismus war neben dem Logizismus und dem Formalismus die dritte philosophische Strömung in der Mathematik des zwanzigsten Jahrhunderts. Er wurde im Jahr 1907 von dem niederländischen Mathematiker Luitzen Egbertus Jan Brouwer begründet und fand in Arend Heyting, Stephen Kleene, und Michael Dummett prominente Fürsprecher. Nach Brouwer baut die Mathematik auf intuitiv einsichtigen Begriffen auf, die keiner Definition bedürfen. Beispiele sind die natürlichen Zahlen oder die kontinuierlich verstreichende Zeit. Als existent akzeptierte er ausschließlich Objekte, die sich gedanklich konstruieren lassen. Brouwer setzte die Wahrheit einer Aussage mit deren Beweisbarkeit gleich. Das bedeutet, dass beispielsweise eine Aussage der Form ϕ ∨ ψ nur dann als wahr angesehen wird, wenn ein Beweis für ϕ oder ein Beweis für ψ konstruiert werden kann. Damit ist die Aussage ϕ ∨ ¬ϕ in der intuitionistischen Logik nicht allgemeingültig; sie ist nur dann wahr, wenn es gelingt, einen Beweis für ϕ oder einen Beweis für ¬ϕ zu entwickeln. Altbewährte Grundannahmen wie der Satz vom ausgeschlossenen Dritten (Tertium non datur) und der daraus resultierende Beweis durch Widerspruch verlieren hierdurch ihre Gültigkeit. In [82] äußerte sich Hilbert wie folgt über die intuitionistische Strömung: „Das Tertium non datur dem Mathematiker zu nehmen, wäre etwa, wie wenn man dem Astronomen das Fernrohr oder dem Boxer den Gebrauch der Fäuste untersagen wollte.“ Heute spielt der Intuitionismus fast nur noch im Bereich der mathematischen Philosophie eine Rolle. Aus der Schulmathematik wurde die intuitionistische Denkweise gegen Ende des zwanzigsten Jahrhunderts nahezu vollständig verdrängt, als die Auseinandersetzung mit philosophischen Fragestellungen allmählich zu verblassen begann.
46
1 Historische Notizen
haben, ein sicheres ist. Vor einem tektonischen Beben, wie es Jahre zuvor die Frege’sche Logik ereilte, bräuchten wir uns dann nicht mehr zu fürchten. Nebenbei hätte Hilbert auch auf einem anderen Schauplatz einen Kantersieg errungen. Dem Intuitionismus, den Hilbert zeitlebens zu bekämpfen versuchte, käme das Gelingen des Programms einem finalen Dolchstoß gleich. Zu Beginn verlief das Programm wie geplant. Zunächst gelang es zwei von Hilberts Schülern, Wilhelm Ackermann und John von Neumann, einen finiten Widerspruchsbeweis für eine abgeschwächte Variante der Peano-Arithmetik zu finden. Noch schien es nur eine Frage der Zeit zu sein, bis die technischen Probleme überwunden und der Beweis auf die gesamte Peano-Arithmetik übertragen werden könnte. Die Hoffnung auf ein schnelles Gelingen erfüllte sich nicht; stattdessen folgte ein gescheiterter Versuch dem nächsten. Es schien, als sei die PeanoArithmetik von einer unsichtbaren Wand umgeben, die alle Beweisversuche von sich abprallen ließ. Im Jahr 1929 wurden Hilberts Hoffnungen durch die Arbeiten des jungen Mathematikers Kurt Gödel zusätzlich genährt, als dieser in seiner Promotionsschrift die Vollständigkeit des engeren Funktionenkalküls4 bewies (Abbildung 1.39) [62]. Es war also möglich, ein formales System zu konstruieren, in dem sich jede allgemeingültige prädikatenlogische Formel erster Stufe in endlich vielen Schritten aus den Axiomen ableiten lässt. Damit hatte Gödel bewiesen, dass der logische Schlussapparat stark genug war, um als Grundlage für die Verwirklichung des Hilbert’schen Programms zu dienen. In diesen Tagen glaubte man das Programm auf einem guten Weg, und es schien nur eine Frage der Zeit zu sein, bis aus Hilberts Vision Wirklichkeit werden würde. 1930 war das Jahr, in dem die Entwicklung eine abrupte Kehrtwende nehmen sollte. Am 8. September bekräftigte Hilbert vor der Versammlung Deutscher Naturforscher und Ärzte in seiner Heimatstadt Königsberg seine tiefe Überzeugung, dass es in der Wissenschaft keine unlösbaren Probleme gebe. Ein Auszug aus seiner Rede wurde als Radioansprache ausgestrahlt (Abbildung 1.40).
(1906 – 1978) [92] Abbildung 1.39: Kurt Gödel ging als einer der größten Logiker aller Zeiten in die Geschichte ein. Seine bahnbrechenden Entdeckungen haben dazu geführt, dass wir unser Verständnis der mathematischen Methode von Grund auf überdenken mussten.
Zum Zeitpunkt seiner Rede wusste Hilbert noch nichts von den Ereignissen, die sich am Vortag an anderer Stelle in Königsberg abspielten. Es war die Tagung der exakten Erkenntnislehre, die die Mathematik für immer verändern sollte. Abgehalten wurde die dreitägige Konferenz von 5. bis zum 7. September 1930 von der Berliner Gesellschaft 4 Der Begriff des engeren Funktionenkalküls wurde durch die Hilbert’sche Schule geprägt und beschreibt im Wesentlichen das, was wir heute als Prädikatenlogik erster Stufe bezeichnen.
47
1.2 Der Weg zur modernen Mathematik
„Das Instrument, welches die Vermittlung bewirkt zwischen Theorie und Praxis, zwischen Denken und Beobachten, ist die Mathematik; sie baut die verbindende Brücke und gestaltet sie immer tragfähiger. Daher kommt es, dass unsere ganze gegenwärtige Kultur, soweit sie auf der geistigen Durchdringung und Dienstbarmachung der Natur beruht, ihre Grundlage in der Mathematik findet. Schon Galilei sagt: ‚Die Natur kann nur der verstehen, der ihre Sprache und die Zeichen kennengelernt hat, in der sie zu uns redet; diese Sprache aber ist die Mathematik, und ihre Zeichen sind die mathematischen Figuren‘. Kant tat den Ausspruch: ‚Ich behaupte, dass in jeder besonderen Naturwissenschaft nur so viel eigentliche Wissenschaft angetroffen werden kann, als darin Mathematik enthalten ist‘. In der Tat: Wir beherrschen nicht eher eine naturwissenschaftliche Theorie, als bis wir ihren mathematischen Kern herausgeschält und völlig enthüllt haben. Ohne Mathematik ist die heutige Astronomie und Physik unmöglich; diese Wissenschaften lösen sich in ihren theoretischen Teilen geradezu in Mathematik auf. Diese wie die zahlreichen weiteren Anwendungen sind es, denen die Mathematik ihr Ansehen verdankt, soweit sie solches im weiteren Publikum genießt.
Trotzdem haben es alle Mathematiker abgelehnt, die Anwendungen als Wertmesser für die Mathematik gelten zu lassen. Gauß spricht von dem zauberischen Reiz, den die Zahlentheorie zur Lieblingswissenschaft der ersten Mathematiker gemacht habe, ihres unerschöpflichen Reichtums nicht zu gedenken, woran sie alle anderen Teile der Mathematik so weit übertrifft. Kronecker vergleicht die Zahlentheoretiker mit den Lotophagen, die, wenn sie einmal von dieser Kost etwas zu sich genommen haben, nie mehr davon lassen können. Der große Mathematiker Poincaré wendet sich einmal in auffallender Schärfe gegen Tolstoi, der erklärt hatte, dass die Forderung ‚die Wissenschaft der Wissenschaft wegen‘ töricht sei. Die Errungenschaften der Industrie, zum Beispiel, hätten nie das Licht der Welt erblickt, wenn die Praktiker allein existiert hätten und wenn diese Errungenschaften nicht von uninteressierten Toren gefördert worden wären. ‚Die Ehre des menschlichen Geistes‘, so sagte der berühmte Königsberger Mathematiker Jacobi, ‚ist der einzige Zweck aller Wissenschaft‘. Wir dürfen nicht denen glauben, die heute mit philosophischer Miene und überlegenem Tone den Kulturuntergang prophezeien und sich in dem Ignorabimus gefallen. Für uns gibt es kein Ignorabimus, und meiner Meinung nach auch für die Naturwissenschaft überhaupt nicht. Statt des törichten Ignorabimus heiße im Gegenteil unsere Losung: Wir müssen wissen, wir werden wissen.“
Abbildung 1.40: Aus der Radioansprache von David Hilbert aus dem Jahr 1930 [83, 146]
für empirische Philosophie. Der erste Tag begann mit mehrstündigen Vorträgen über die drei philosophischen Hauptströmungen der Mathematik. Der Logizismus wurde von Rudolf Carnap, der Intuitionismus von Arend Heyting, einem Schüler Brouwers, und der Formalismus von John von Neumann vertreten. Zu den Rednern des zweiten Tags gehörte auch Kurt Gödel, der in einem zwanzigminütigen Kurzvortrag über den in seiner Dissertation erarbeiteten Vollständigkeitsbeweis referierte. Die Bombe platzte am dritten Tag, als sich Gödel während der abschließenden Podiumsdiskussion zu Wort meldete. Zunächst gab er zu bedenken, dass die Widerspruchsfreiheit eines formalen Systems, wie das der Principia Mathematica, nicht garantieren könne, dass alle abgeleiteten Theoreme wahre Aussagen sind. Selbst wenn die Widerspruchsfreiheit der Principia bewiesen sei, wäre nicht auszuschließen, dass sich innerhalb des Systems eine Aussage über die natürlichen Zahlen ableiten lie-
48
1 Historische Notizen
pr 14 Jan
Kurt Gödel wurde am 28. April 1906 im österreichisch-ungarischen Brünn geboren. Seine Geburtsstadt wurde 1918 Teil der neu gegründeten Tschechoslowakischen Republik, die er stets als Exil empfand. Im Alter von 17 Jahren nahm er die österreichische Staatsbürgerschaft an und zog ein Jahr später nach Wien, um das Studium der theoretischen Physik zu beginnen. Die legendäre Vorlesung über Zahlentheorie von Philipp Furtwängler lenkte Gödels Interesse aber schon bald auf die Grundlagen der Mathematik. Gödel war von dem gesellschaftlichen und kulturellen Leben Wiens angetan. Unter anderem trat er dem Wiener Kreis bei, einem akademischen Zirkel um Moritz Schlick, der sich mit wissenschaftsphilosophischen Fragen beschäftigte. Es war die Zeit in Wien, in der Gödel die beiden Unvollständigkeitssätze entdeckte, die unser mathematisches Weltbild so grundlegend verändert haben.
28 A
1906 1978
Obwohl sich die Verhältnisse in Wien nach der Machtergreifung Hitlers sukzessive verschärften, war sich Gödel des Ausmaßes der Gefahr nicht bewusst. Erst im Jahr 1940 nutzte er die wahrscheinlich letzte Möglichkeit zur Flucht in die USA. Sein Ziel war das Institute for Advanced Study in Princeton, an dem er zuvor mehrere Gastaufenthalte absolviert hatte. Aufgrund seines speziellen Charakters und seiner ausgeprägten Neigung zur Hypochondrie war Gödel nicht unumstritten, und es dauerte bis zum Jahr 1953, bis ihn das IAS zum Professor ernannte. Einen treuen Fürsprecher fand er in Albert Einstein, mit dem ihm eine lebenslange Freundschaft verband. Gödels geistiger Zustand war seit seiner Kindheit labil und sollte sich mit zunehmendem Alter kontinuierlich verschlimmern. Von starker Hypochondrie, Paranoia und Depression gezeichnet, starb Kurt Gödel am 14. Januar 1978 an den Folgen einer selbst herbeigeführten Unterernährung.
ße, die sich außerhalb des Systems betrachtet als falsch erweist. Dann folgte der entscheidende Satz: „Man kann – unter Voraussetzung der Widerspruchsfreiheit der klassischen Mathematik – sogar Beispiele für Sätze (und zwar solche von der Art des Goldbach’schen oder Fermat’schen) angeben, die zwar inhaltlich richtig, aber im formalen System der klassischen Mathematik unbeweisbar sind.“ [164] Dies ist die erste öffentliche Formulierung des ersten Gödel’schen Unvollständigkeitssatzes. Die Bombe war geplatzt, und doch schien niemand ihre seismischen Wellen zu spüren. Wir wissen nicht, ob sein zurückhaltendes Auftreten oder die Vermessenheit seiner Aussage dazu führte, dass niemand im Saal Gödels Beitrag kommentierte. Es ist wahrscheinlich, das kaum einer der Anwesenden richtig verstand, wovon der junge Mathematiker überhaupt sprach. Der einzige, der Gödel nach der Podiumsdiskussion um eine Unterredung bat, war der ungarische Mathematiker John von Neumann (Abbildung 1.41). Wie Gödel war auch von Neumann ein mathematisches Ausnahmetalent, und seine rasche Auffassungsgabe war bereits zu Lebzeiten legendär. Als einziger im Saal schien er in vollem Umfang zu verstehen, welche Auswirkungen sich aus der Unvollständigkeit für die
49
1.2 Der Weg zur modernen Mathematik
gesamte Mathematik ergeben. Entscheidend war, dass Gödels Ergebnisse von so allgemeiner Natur sind, dass sie auf jedes axiomatische System angewendet werden können, das ausdrucksstark genug ist, um die Zahlentheorie zu formalisieren. Damit war nicht nur gezeigt, dass der logische Apparat der Principia Mathematica unvollständig war, sondern auch, dass jeder Versuch, die Principia oder ein ähnliches System zu vervollständigen, von Grund auf zum Scheitern verurteilt ist. Gödel wies damit nicht nur den logischen Apparat der Principia Mathematica, sondern die gesamte formale Methode in ihre Grenzen. Seit seiner Entdeckung wissen wir, dass kein formales System jemals in der Lage sein wird, die Mathematik vollständig zu erfassen. Von Gödels Ergebnissen berauscht, setzte sich von Neumann in den Folgewochen intensiv mit den Konsequenzen des ersten Unvollständigkeitssatzes auseinander. Was von Neumann nach nur wenigen Wochen entdeckte, war von so frappierender Natur, dass er sich umgehend an Gödel wandte. Sein Brief vom 20.11.1930 beginnt mit den folgenden Worten: „Lieber Herr Gödel! Ich habe mich in der letzten Zeit wieder mit Logik beschäftigt, unter Verwendung der Methoden, die Sie zum Aufweisen unentscheidbarer Eigenschaften so erfolgreich benützt haben. Dabei habe ich ein Resultat erzielt, das mir bemerkenswert erscheint. Ich konnte nämlich zeigen, dass die Widerspruchsfreiheit der Mathematik unbeweisbar ist. Dies ist genauer so: In einem formalen System, das die Arithmetik umfasst, lässt es sich, in Anlehnung an Ihre Betrachtungen, aussprechen, dass die Formel 1 = 2 nicht Endformel eines von den Axiomen dieses Systems ausgehenden Beweises sein kann – und zwar ist diese Formulierung eine Formel des genannten formalen Systems. [...]“ [164] Der Brief kam zu spät. Was von Neumann beschrieb, ist der Inhalt des zweiten Gödel’schen Unvollständigkeitssatzes, den Gödel unabhängig entdeckt und zusammen mit seinem ersten Unvollständigkeitssatz bereits zur Publikation eingereicht hatte (Abbildung 1.42). Seine Arbeit trägt den unscheinbaren Namen „Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I“. Der Hauptteil seiner Publikation beschäftigt sich mit der Herleitung des ersten Unvollständigkeitssatzes; dagegen wird der Beweis des zweiten Unvollständigkeitssatzes nur skizziert. Gödel hatte vor, seine Beweisskizze in
John von Neumann (1903 – 1957) Abbildung 1.41: John von Neumann zählte zu den führenden Mathematikern des zwanzigsten Jahrhunderts. Geboren wurde er unter dem Namen Neumann János Lajos im österreichisch-ungarischen Budapest. Später nannte er sich Johann von Neumann und nahm nach seiner Emigration in die USA schließlich den Namen John von Neumann an. Zu seinem wissenschaftlichen Vermächtnis gehören zahlreiche Arbeiten aus den verschiedensten Gebieten der Mathematik. Rückblickend wird sein Name vor allem mit der Von-NeumannArchitektur verbunden. Sie ist auch heute noch das vorrangige Organisationsprinzip moderner Computersysteme.
50
1 Historische Notizen
Abbildung 1.42: 1931 publizierte Kurt Gödel seine beiden Unvollständigkeitssätze, die unser mathematisches Grundverständnis für immer verändern sollten [64]. Gödels Sätze manifestieren, dass sich die Begriffe der Beweisbarkeit und der Wahrheit nicht in Kongruenz bringen lassen; sie zeigen der mathematischen Methode Grenzen auf, die wir niemals überwinden werden.
einer Folgepublikation ausführlich darzulegen, aber dazu kam es nie. Bereits seine erste Arbeit stieß auf so viel Akzeptanz, dass er keine Notwendigkeit mehr sah, einen zweiten Teil zu veröffentlichen. Erst später wurde ein formaler Beweis des zweiten Unvollständigkeitssatzes von David Hilbert und Paul Bernays ausgearbeitet [86]. Was bedeutet der zweite Unvollständigkeitssatz für die Mathematik? Gödel und von Neumann hatten gezeigt, dass der Beweis der Widerspruchsfreiheit eines formalen Systems, das die Zahlentheorie umfasst, nicht mit den Mitteln des Systems selbst geführt werden kann. Hieraus folgt unmittelbar, dass sich die Widerspruchsfreiheit der Mathematik nicht mit den Mitteln der gewöhnlichen Mathematik selbst beweisen lässt. Aber genau das war der Plan, den Hilbert seit Jahren so vehement verfolgte. Der zweite Gödel’sche Satz versetzte dem Hilbert’schen Programm einen schweren Schlag, von dem es sich nie erholen sollte. Anders als von Neumann sah Gödel das Hilbert’sche Programm keinesfalls als gescheitert an. Auch wenn die Widerspruchsfreiheit der ge-
1.2 Der Weg zur modernen Mathematik
wöhnlichen Mathematik nicht mit den Mitteln der gewöhnlichen Mathematik selbst bewiesen werden kann, ist es nicht vollständig ausgeschlossen, dass trotzdem ein einfacheres System existiert, in dem sich ein entsprechender Widerspruchsbeweis durchführen lässt. In seiner Arbeit wies Gödel ausdrücklich darauf hin, „dass Satz XI [der zweite Unvollständigkeitssatz] (und die entsprechenden Resultate über M, A) in keinem Widerspruch zum Hilbert’schen formalistischen Standpunkt stehen. Denn dieser setzt nur die Existenz eines mit finiten Mitteln geführten Widerspruchsfreiheitsbeweises voraus, und es wäre denkbar, dass es finite Beweise gibt, die sich in P (bzw. M, A) nicht darstellen lassen.“5 [64] Doch wie sollte ein derartiges System aussehen, mit dem sich die Widerspruchsfreiheit der gewöhnlichen Mathematik beweisen lassen könnte? Zunächst müsste es neue Beweismittel umfassen, die in der gewöhnlichen Mathematik heute nicht enthalten sind. Des Weiteren müssten die neuen Beweismittel zu den finiten Mitteln zählen, d. h., sie müssten aus offensichtlichen Überlegungen heraus korrekt sein. Auch wenn die Existenz durch die Gödel’schen Unvollständigkeitssätze nicht ausgeschlossen wird, hat noch niemand ein solches System bisher gefunden, geschweige denn eine Vorstellung davon, wie es aufgebaut sein könnte. Nur wenige Experten sind der Meinung, dass ein solches System existiert. Unbestritten gehören die Gödel’schen Unvollständigkeitssätze zu den wichtigsten Erkenntnissen der Mathematik des zwanzigsten Jahrhunderts, und dem berühmten Philosophen Karl Popper schien sie „der wichtigste Beitrag zur Logik zu sein, seit sie durch Aristoteles geschaffen wurde“ [188]. In Kapitel 4 werden wir uns detailliert mit den Unvollständigkeitssätzen beschäftigen und zeigen, warum sie unser mathematisches Grundverständnis dramatisch verändert haben. Von Hilbert ist überliefert, dass er auf die Unvollständigkeitssätze zunächst mit Zorn reagierte [200]. Dennoch verschloss er sich der Realität nicht auf Dauer und akzeptierte Gödels Ergebnisse schon bald als unumstößliche Tatsachen. Für John von Neumann sollte die Logik dagegen nie mehr dieselbe sein. Er hielt zwar mehrere Vorlesungen über die Unvollständigkeitssätze, wandte sich aber bald danach anderen Tätigkeitsfeldern zu. Als wissenschaftlicher Berater begleitete er den Bau 5 P, M und A sind die Bezeichnungen Gödels für die formalisierte Peano-Arithmetik, die Mengenlehre bzw. die gesamte klassische Mathematik.
51
52
1 Historische Notizen
Abbildung 1.43: Der ENIAC (Electronic Numerical Integrator And Computer) war die erste voll funktionsfähige Rechenmaschine, die nahezu allen Definitionen des modernen Computer-Begriffs standhält und daher von vielen Experten als der erste wirkliche Computer der Welt angesehen wird. Der Rechnerkoloss wurde an der Moore School of Electrical Engineering der University of Pennsylvania unter der Leitung von J. Presper Eckert und John W. Mauchly gebaut und beeindruckte schon aufgrund seiner schieren Größe. Der ENIAC bestand aus insgesamt 30 Einheiten, die U-förmig über den gesamten Raum verteilt angeordnet waren. Die gesamte Konstruktion kam auf ein Gesamtgewicht von knapp 30 Tonnen.
des ENIAC, den wir rückblickend als den ersten universellen Computer der Welt ansehen dürfen (Abbildung 1.43). Im Jahr 1946 publizierte von Neumann ein wegweisendes Konzept für die Organisation von Mikrorechnern und auch heute noch ist die Von-Neumann-Architektur die Grundlage für den Bau vieler moderner Computersysteme [127]. Auch Bertrand Russell zog sich in den Folgejahren fast vollständig von der Logik zurück. Rückblickend ist es schwer zu ermessen, welche intellektuelle Leistung das Verfassen der Principia Mathematica erfordert haben muss. Fest steht, dass die zehnjährige Arbeit an diesem epochalen Werk auch in Russells brillantem Geist Spuren hinterließ (Abbildung 1.44). Andere Mathematiker reagierten mit Ignoranz auf die Unvollständigkeitssätze. Um eine wahre und zugleich unbeweisbare Aussage zu erhalten, konstruierte Gödel eine komplizierte Formel, die im Grunde genommen über sich selbst behauptet, nicht beweisbar zu sein. Viele seiner Kritiker waren der Meinung, dass der vorhandene Selbstbezug eine notwendige Bedingung ist, um eine unbeweisbare Aussage zu erhalten. In ihren Augen waren die von Gödel konstruierten Formeln nichts weiter als seltsame Kuriositäten am Rande eines intakten mathematischen Kerns – und wurden weitgehend ignoriert. Ist die von Gödel entdeckte Unvollständigkeit wirklich nur eine Laune der Logik, die in der gewöhnlichen Mathematik so gut wie keine Rolle spielt? In der zweiten Hälfte des zwanzigsten Jahrhunderts
53
1.2 Der Weg zur modernen Mathematik
wurde auch diese Hoffnung zerstört. Im Jahr 1977 gelang es den Mathematikern Jeff Paris und Leo Harrington, eine Variante des RamseyTheorems zu finden, die sich innerhalb der Peano-Arithmetik formulieren, aber nicht innerhalb der Peano-Arithmetik beweisen lässt. Das Ramsey-Theorem ist ein mathematisches Problem aus der Kombinatorik, benannt nach dem britischen Mathematiker Frank Plumpton Ramsey [145]. Äußerlich unterscheidet es sich eklatant von den trickreich konstruierten Formeln, mit denen Gödel die Unvollständigkeitssätze bewies. Das Ramsey-Theorem ist frei von Selbstbezügen jeglicher Art, und trotzdem ist es eine unbeweisbare Formel im Gödel’schen Sinne. Heute wissen wir, dass die Aussage der von Paris und Harrington gefundenen Variante äquivalent zur Widerspruchsfreiheit der PeanoArithmetik ist. Damit ergibt sich die Unbeweisbarkeit als zwangsläufige Folgerung aus dem zweiten Gödel’schen Unvollständigkeitssatz.
„[...]I always found myself hoping that perhaps Principia Mathematica would be finished some day. Moreover the difficulties appeared to me in the nature of a challenge, which it would be pusillanimous not to meet and overcome. So I persisted, and in the end the work was finished, but my intellect never quite recovered from the strain. I have been ever since definitely less capable of dealing with difficult abstractions than I was before. This is part, though by no means the whole, of the reason for the change in the nature of my work.“ [158]
In Abschnitt 4.5 werden wir mit dem Satz von Goodstein ein ebenso harmlos anmutendes Theorem der Zahlentheorie besprechen, das der englische Logiker Reuben Louis Goodstein im Jahr 1944 mit den Mitteln der Mengenlehre bewies [68]. Auch hier handelt es sich um einen wahren Satz, der sich innerhalb der Peano-Arithmetik formulieren, aber nicht innerhalb der Peano-Arithmetik beweisen lässt. Dies ist das erstaunliche Ergebnis einer Arbeit von Laurie Kirby und Jeff Paris aus dem Jahr 1982 [101]. Beide Beispiele zeigen, dass die von Gödel entdeckte Unvollständigkeit alles andere ist als eine kuriose Eigenschaft pathologisch konstruierter Aussagen; sie ist ein allgegenwärtiges Phänomen der Mathematik, das wir genauso akzeptieren müssen wie die Naturgesetze der Physik.
1.2.8
Grenzen der Berechenbarkeit
Gödels Arbeit verwies die Mathematik zweifelsohne in ihre Grenzen; unmissverständlich machte sie klar, dass ein widerspruchsfreier und zugleich vollständiger Kalkül für die Theorie der natürlichen Zahlen nicht existieren kann. Dennoch blieb die Hoffnung, dass zumindest die Frage nach der Entscheidbarkeit positiv beantwortet werden könnte. Die Unvollständigkeitssätze schließen nicht aus, dass ein systematisches Verfahren existiert, das für jede Aussage bestimmt, ob sie innerhalb des Systems beweisbar ist oder nicht. Um eine mathematisch exakte Lösung für das Entscheidungsproblem herbeizuführen, war es unumgänglich, den diffusen Begriff des systematischen Verfahrens zu präzisieren. Heute ist unser algorithmisches
Bertrand Russell (1872 – 1970) Abbildung 1.44: In hohem Alter verfasste Bertrand Russell seine dreibändige Autobiographie, die in den Jahren 1967 bis 1969 erschien.
54
1 Historische Notizen
Abbildung 1.45: 1936 gelang es Alan Turing, eine endgültige Klärung für das Hilbert’sche Entscheidungsproblem herbeizuführen [180]. Mit der Turing-Maschine schuf er ein abstraktes Maschinenmodell, auf dem weite Teile der modernen Berechenbarkeitstheorien beruhen.
Denken durch den täglichen Umgang mit dem Computer gut geschult. In den dreißiger Jahren war der Computer dem Reisbrett noch nicht entsprungen, und es herrschte nur eine vage Vorstellung davon, was es bedeutet, etwas „zu berechnen“. Übersprungen wurde diese Hürde im Jahr 1936, als der britische Mathematiker Alan Turing seine grundlegende Arbeit „On computable numbers, with an application to the Entscheidungsproblem“ der Öffentlichkeit präsentierte (Abbildung 1.45). Um den Begriff der Berechenbarkeit formal zu erfassen, konstruierte Turing ein abstraktes Maschinenmodell, das dem Funktionsprinzip moderner Computer sehr nahe kommt. In der Originalarbeit motivierte Turing die Konzeption seiner Maschine, die wir heute als Turing-Maschine bezeichnen, mit den folgenden Worten:
55
1.2 Der Weg zur modernen Mathematik
„Computing is normally done by writing certain symbols on paper. We may suppose this paper is divided into squares like a child’s arithmetic book.“
I
Zeichen ersetzen
...
1
0
0
...
1
0
...
0
...
Band 1 TuringMaschine
Das Zitat zeigt die Unbefangenheit, die sich durch Turings gesamte Arbeit zieht. Er startete seine Überlegungen über die Berechenbarkeit mit dem, was er seit seiner Kindheit zum Rechnen verwendete: einem leeren Stück karierten Papier. Unmittelbar danach nahm Turing dann doch eine erste Abstraktion vor. Er sah, dass die zweidimensionale Gestalt des Rechenpapiers im Grunde genommen keine Rolle spielt. Alle Berechnungen, die wir per Hand auf Papier durchführen können, sind auch auf einem eindimensionalen Band möglich – wenngleich nicht immer mit der gleichen Eleganz.
I
Kopf bewegen ...
1
Band
„We may suppose that there is a bound B to the number of symbols or squares which the computer can observe at one moment. [...] We will also suppose that the number of states of mind which will be taken into account is finite.“ Anschließend definiert Turing eine Menge von Elementaroperationen, aus denen sich komplexe Berechnungen zusammensetzen. Diese erlauben, das Symbol des aktuell betrachteten Felds auszutauschen und die Aufmerksamkeit auf eines der Nachbarfelder zu lenken: „The simple operations must therefore include: (a) Changes of the symbol on one of the observed squares. (b) Changes of one of the squares observed to another square within L squares of one of the previously observed squares.“ Beide Aktionen werden durch einen möglichen Wechsel des internen Zustands begleitet:
I
Zustand wechseln ...
1
1
Band TuringMaschine
Turing lässt weitere Annahmen folgen. Zunächst geht er davon aus, dass es nur endlich viele Symbole gibt, mit denen die Felder seines Bandes gefüllt werden können. Er ging außerdem davon aus, dass sich das menschliche Gehirn im Zuge einer Berechnung zu jedem Zeitpunkt in einem von endlich vielen Zuständen befindet.
TuringMaschine
„[...] I think that it is agreed that the two-dimensional character of paper is no essential of computation. I assume then that the computation is carried out on onedimensional paper, i.e. on tape divided into squares.“
Abbildung 1.46: Turing definierte wenige primitive Elementaroperationen, aus denen komplexe Berechnungen erwachsen. In jedem Bearbeitungsschritt kann eine TuringMaschine das aktuell betrachtete Symbol durch ein anderes ersetzen und das Betrachtungsfenster (observed square) verschieben. Die ausgeführten Aktionen gehen mit einem potenziellen Wechsel des inneren Zustands (state of mind) einher.
56
1 Historische Notizen
„The machine is to have the four m-configurations ’b’, ’c’, ’f’, ’e’ and is capable of printing ’0’ and ’1’. The bevahiour of the machine is described in the following table in which ’R’ means ’the machine moves so that it scans the square immediately on the right of the one it was scanning previously’. Similarly for ’L’. ’E’ means ’the scanned symbol is erased’ and ’P’ stands for ’prints’.“ [180] Configuration m-config. symbol b None c None e None f None
Behaviour operations final m-config. P0, R c R e P1, R f R b Alan Mathison Turing (1912 – 1954)
Abbildung 1.47: Das erste Beispiel einer Turing-Maschine. In seiner Arbeit aus dem Jahr 1936 bezeichnete sie Turing noch schlicht als computing machine. Der Begriff der Turing-Maschine wurde 1937 durch Alonzo Church geprägt [78].
„It may be that some of these changes necessarily involve a change of state of mind. The most general single operation must therefore be taken to be one of the following: (A) A possible change (a) of symbol together with a possible change of state of mind. (B) A possible change (b) of observed squares, together with a possible change of state of mind.“ Abbildung 1.46 fasst die erwähnten Elementaroperationen bildlich zusammen. Turing ersann seine Maschine, um die Menge der berechenbaren Zahlen zu charakterisieren. Was er hierunter im Detail verstand, wollen wir am Beispiel der in Abbildung 1.47 beschriebenen Turing-Maschine herausarbeiten. Konkret handelt es sich um das erste Beispiel aus seiner Originalarbeit. Die Maschine besitzt die vier Zustände b, c, e, f und wird in Zustand b (begin) auf einem leeren Band gestartet. Wie sie sich im Detail verhält, verrät ihre Instruktionstabelle. Direkt nach dem Start führt sie die Aktion P0, R aus. P0 steht für „Print 0“ und sorgt dafür, dass eine 0 auf das Band geschrieben wird. R steht für „Right“ und weist die Maschine an, den Schreib-Lese-Kopf ein Feld nach rechts zu bewegen. Danach wird der Zustand b verlassen und der Folgezustand c eingenommen. In
57
1.2 Der Weg zur modernen Mathematik
I
Start ...
Configuration m-config. symbol b None c None e None f None I
Schritt 1 ...
Configuration m-config. symbol b None c None e None f None I
Schritt 2 ...
Configuration m-config. symbol b None c None e None f None
I
Behaviour operations final m-config. P0, R c R e P1, R f R b 0
Configuration m-config. symbol b None c None e None f None
...
Configuration m-config. symbol b None c None e None f None I
Schritt 4
...
Behaviour operations final m-config. P0, R c R e P1, R f R b 0
...
I
Schritt 3
...
Schritt 5 ...
...
Behaviour operations final m-config. P0, R c R e P1, R f R b
Configuration m-config. symbol b None c None e None f None
Abbildung 1.48: Die erste Beispielmaschine aus Turings Originalarbeit in Aktion
diesem Zustand wird das Band nicht verändert; die Maschine bewegt den Schreib-Lese-Kopf lediglich ein Feld nach rechts und wechselt in den Zustand e. Jetzt schreibt die Maschine eine 1 auf das Band, bewegt den Schreib-Lese-Kopf erneut nach rechts und nimmt den Zustand f ein. Nach einer weiteren Rechtsbewegung wird wieder der Startzustand b erreicht (Abbildung 1.48). Indem die Maschine diesen Zyklus konti-
0
1
...
Behaviour operations final m-config. P0, R c R e P1, R f R b 0
1
...
Behaviour operations final m-config. P0, R c R e P1, R f R b 0
1
0
...
Behaviour operations final m-config. P0, R c R e P1, R f R b
58
1 Historische Notizen
n 7 Jun
Alan Mathison Turing wurde am 23. Juni 1912 in London-Paddington geboren. Zusammen mit seinem älteren Bruder wuchs Alan in England bei Freunden der Familie auf, während seine Mutter und sein Vater, ein Staatsdiener des britischen Empire, die meiste Zeit im indischen Chatrapur verbrachten. Bereits in seiner frühen Jugend wurde Turings außerordentliche mathematische Begabung sichtbar, genauso wie sein Unvermögen, sich gesellschaftlichen Normen und staatlichen Autoritäten zu beugen. Turing begann seine Ausbildung in einer Ganztagsschule in St. Michaels und wechselte im Alter von 14 Jahren an das bekannte Sherborne-Internat in Dorset. Nach seinem Schulabschluss schrieb er sich als Mathematikstudent am King’s College in Cambridge ein. Für Turing war dies nur die zweite Wahl; das renommiertere Trinity-College blieb ihm aufgrund motivationsbedingter schlechter Noten in den nichtnaturwissenschaftlichen Fächern verwehrt. Bereits ein Jahr nach seinem Abschluss gelang ihm der wissenschaftliche Durchbruch. 1936 publizierte er mit „On computable numbers, with an application to the Entscheidungsproblem“ eine der historisch wichtigsten Arbeiten auf dem Gebiet der mathematischen Logik.
23 Ju
1912 1954
Danach diktierte der zweite Weltkrieg den Lauf der Dinge. Turing begab sich nach Bletchley Park, wo er zusammen mit anderen Wissenschaftlern im Geheimen daran arbeitete, den Verschlüsselungscode der deutschen Wehrmacht zu brechen. In dieser Zeit entstand mit der Colossus eine Rechenmaschine, mit der sich der feindliche Funkverkehr in wenigen Stunden entschlüsseln ließ. Für Turing hatte ihr Bau eine ganz besondere Bedeutung. Obwohl sich die Colossus in wichtigen Punkten von seiner theoretisch ersonnenen computing machine unterschied, wurden viele Aspekte seiner Idee dennoch real. Nach dem zweiten Weltkrieg wandte sich Turing wieder vermehrt theoretischen Themen zu. Im Jahr 1950 schlug er mit dem Turing-Test ein Verfahren vor, mit dem sich der Intelligenzbegriff auf Maschinen übertragen lässt [182]. Im Jahr 1952 sollte Turings Karriere ein abruptes Ende finden. Als die Polizei sein Haus nach einem Einbruch untersuchte, gestand er eine homosexuelle Beziehung ein. Das prüde England der Fünfzigerjahre reagierte erbarmungslos und sprach Turing in einem Strafverfahren der sexuellen Perversion schuldig. Die angeordnete Zwangstherapie machte aus ihm einen gebrochenen Mann. Zwei Jahre später wurde er, kurz vor seinem 42ten Geburtstag, neben den Resten eines vergifteten Apfels tot aufgefunden.
nuierlich wiederholt, produziert sie den folgenden Bandinhalt: ...
0
1
0
1
0
...
Die geschriebenen Ziffern werden als die Nachkommaziffern einer reellen Zahl interpretiert, in unserem Fall als die Nachkommaziffern der Zahl 0,0101010101010101 . . . Die zwischen den Ziffern freigelassenen Bandstellen spielen für den dargestellten Zahlenwert keine Rolle. In Turings Maschinendefinition ist es ausdrücklich erlaubt, Felder leer zu lassen oder mit beliebigen Symbolen zu beschreiben, die keine Ziffern sind. Dennoch ist es kein Zufall, dass die betrachtete Maschine jedes zweite Feld leer lässt. In vielen seiner Maschinen nutzt Turing die Freistellen als temporäre Ablage für Hilfssymbole, die zur Steuerung des Programmablaufs benötigt werden, für den berechneten Zahlenwert aber keine Rolle spielen. Mit dem entwickelten Begriffsgerüst gelang Turing eine bemerkenswerte Gratwanderung. Zum einen erfüllt die Turing-Maschine in jeder Hin-
1.2 Der Weg zur modernen Mathematik
59
sicht die Anforderungen eines formalen Modells, so dass sie mathematisch präzise Aussagen über den Berechenbarkeitsbegriff erlaubt. Zum anderen ist sie von einer inneren Einfachheit und Klarheit geprägt, die einen überraschend intuitiven Zugang zu dieser komplexen Materie eröffnet. Im Gegensatz zu rein mathematischen Ansätzen, zu denen z. B. der zeitgleich von Alonzo Church entwickelte Lambda-Kalkül [29, 30] oder die in Abschnitt 4.2.2 vorgestellte Theorie der primitiv-rekursiven Funktionen gehören [48], erscheint die Turing-Maschine zum Anfassen nah. Die Popularität, die der Begriff der Turing-Maschine heute genießt, lässt häufig vergessen, dass das Maschinenmodell nur Mittel zum Zweck war. Turing hatte die Klärung des Entscheidungsproblems im Sinn und war hierfür gezwungen, den Berechenbarkeitsbegriff mathematisch präzise zu erfassen. Nachdem er mit der Turing-Maschine das nötige Instrumentarium geschaffen hatte, war er in der Lage, die folgenden beiden Hauptresultate zu beweisen: I
Es ist unmöglich, ein Verfahren zu konstruieren, das für jede TuringMaschine korrekt entscheidet, ob sie eine 0 auf das Band schreiben wird oder nicht. Gäbe es ein solches Verfahren, so ließe sich eine Turing-Maschine konstruieren, die eine andere Turing-Maschine in codierter Form entgegennimmt und die Antwort stets korrekt berechnet. Dass die Annahme über die Existenz einer solchen Maschine zu Widersprüchen führt, lässt sich mit der gleichen Diagonalisierungsmethode zeigen, mit der Cantor die Überabzählbarkeit des Kontinuums bewies.
I
Eine Turing-Maschine lässt sich in eine prädikatenlogische Formel erster Stufe übersetzen, die genau dann allgemeingültig ist, wenn die übersetzte Maschine irgendwann eine 0 ausgibt. Nach dem Gödel’schen Vollständigkeitssatz ist jede allgemeingültige prädikatenlogische Formel erster Stufe beweisbar. Hätte das Hilbert’sche Entscheidungsproblem eine Lösung, gäbe es also ein Verfahren, mit dem wir für jede prädikatenlogische Formel bestimmen könnten, ob sie beweisbar ist, so könnten wir für jede Turing-Maschine entscheiden, ob sie eine 0 ausgibt oder nicht. Aber genau dies ist nach dem oben Gesagten unmöglich.
Mit seinem bahnbrechenden Ergebnis zog Turing den Schlussstrich unter die langjährige Jagd nach einem Entscheidungsverfahren. Heute wissen wir: Es war eine Jagd nach dem mathematischen Perpetuum Mobile, die aus fundamentalen Überlegungen heraus nicht gelingen
Turings erstes Hauptresultat ist im Wesentlichen das, was wir heute als die Unlösbarkeit des Halteproblems bezeichnen. Dass der Begriff Halteproblem in seiner Originalarbeit nicht ein einziges Mal vorkommt, hat einen einfachen Grund. Die von Turing gegebene Definition seines Maschinenmodells entspricht in wenigen, aber wesentlichen Punkten nicht mehr dem heute verwendeten. Weil Turings computable machines für die Berechnung von reellen Zahlen konzipiert waren, schreiben sie eine unendliche Folge von Ziffern auf das Band und halten unter normalen Umständen niemals an. Erst im Jahr 1958 wurde das Maschinenmodell von Martin Davis in seine heutige Form gebracht und das Halteproblem das erste Mal erwähnt [39]. Konkret verbirgt sich dahinter die Frage, ob mithilfe eines systematischen Verfahrens für eine vorgelegte Turing-Maschine stets korrekt entschieden werden kann, ob sie für eine bestimmte Eingabe terminieren wird oder nicht. Die Tatsache, dass sich diese Frage mit exakt denselben Mitteln negativ beantworten lässt, mit denen Turing sein erstes Hauptresultat erzielte, ist die Legitimation für die regelmäßig geäußerte Behauptung, Turing hätte die Unentscheidbarkeit des Halteproblems bewiesen, obwohl der Begriff erst vier Jahre nach seinem Tod geprägt wurde. In Abschnitt 5.1.1 werden wir uns ausführlich mit dem Aufbau und der Funktionsweise von Turing-Maschinen in ihrer modernen Form beschäftigen.
60
1 Historische Notizen
konnte. Der Leibniz’sche Traum von einer mechanisierten Mathematik war ausgeträumt. Die von Turing begründete Berechenbarkeitstheorie ist insbesondere für die Informatik von unschätzbarem Wert. Zum einen ermöglicht sie, den zentralen Begriff des Algorithmus mathematisch präzise zu erfassen. Zum anderen macht sie deutlich, dass Probleme existieren, die sich nicht mithilfe systematischer Verfahren lösen lassen. Aber auch in ganz anderer Hinsicht ist die Berechenbarkeitstheorie von Bedeutung. Durch sie erhalten wir einen alternativen Zugang zur Beweistheorie, der uns erlauben wird, viele Beweise kürzer zu führen, als es vorher möglich war. So werden wir in Abschnitt 5.4.2 herausarbeiten, wie über die Arithmetisierung von Turing-Maschinen ein genauso eleganter wie kurzer Beweis für den ersten Gödel’schen Unvollständigkeitssatz gewonnen werden kann. Emil Leon Post (1897 – 1954) Abbildung 1.49: Emil Post verdanken wir wichtige Erkenntnisse auf dem Gebiet der Berechenbarkeitstheorie. Heute wird sein Name vor allem mit dem Post’schen Korrespondenzproblem verbunden, einem der wichtigsten unentscheidbaren Probleme.
In den Folgejahren entwickelte sich die Berechenbarkeitstheorie zu einem leistungsfähigen Instrument, mit dem sich eine Vielzahl von Fragestellungen als formal unentscheidbar identifizieren ließ. Die Hoffnung wuchs, auch hartnäckige Probleme einer Lösungen zuzuführen, die bis dato jedem Angriffsversuch stand hielten. In diesem Zusammenhang rückte auch das zehnte Hilbert’sche Problem erneut in den Mittelpunkt des Interesses. Im Jahr 1944 äußerte sich der Mathematiker Emil Leon Post mit den folgenden Worten (Abbildung 1.49): „One of the problems posed by Hilbert in his Paris address of 1900 is the problem of determining for an arbitrary diophantine equation with rational integral coefficients whether it has, or has not, a solution in rational integers. [...]. The above problem of Hilbert begs for an unsolvability proof.“ [135] Einer der ersten, die sich der Herausforderung annahmen, war Posts Schüler Martin Davis. Im Jahr 1953 erreichte er ein wichtiges Zwischenresultat [38], das er 1961 zusammen mit Hilary Putnam und Julia Robinson zu einem fast vollständigen Beweis für die Unentscheidbarkeit des zehnten Hilbert’schen Problems erweitern konnte [42]. In dieser Arbeit bewiesen die Autoren, dass kein Entscheidungsverfahren für exponentielle diophantische Gleichungen existieren kann. Hier dürfen Variablen, im Gegensatz zu gewöhnlichen diophantischen Gleichungen, auch als Exponent verwendet werden. Die verbleibende Beweislücke wurde 1970 durch Yuri Matijaseviˇc geschlossen (Abbildung 1.50) [116]. Der junge russische Mathematiker
61
1.2 Der Weg zur modernen Mathematik
zeigte, dass sich exponentielle diophantische Gleichungen auf gewöhnliche diophantische Gleichungen reduzieren lassen. Das bedeutet, dass ein Entscheidungsverfahren für gewöhnliche diophantische Gleichungen dazu verwendet werden kann, um auch den exponentiellen Fall zu lösen. Damit war klar, dass das von Hilbert gesuchte Entscheidungsverfahren nicht existieren kann. Das Rätsel um Hilberts zehntes Problem war gelöst, wenn auch nicht in seinem ursprünglich zugedachten Sinne. Im Jahr 1984 publizierten James Jones und Yuri Matijaseviˇc einen neuen Beweis, der die Unlösbarkeit des zehnten Hilbert’schen Problems auf verblüffend einfache Weise belegt [94]. Im Kern steht die Idee, Registermaschinen so in diophantische Gleichungen zu übersetzen, dass die übersetzte Maschine genau dann terminiert, wenn die generierte Gleichung eine Lösung in den ganzen Zahlen besitzt. Würde das von Hilbert gesuchte Verfahren für die Lösung diophantischer Gleichungen tatsächlich existieren, so wäre das Unmögliche geschafft: Wir hätten einen Weg gefunden, das Halteproblem für Registermaschinen zu entscheiden, und könnten auf diesem Weg auch das Halteproblem für Turing-Maschinen lösen. Damit hat Turings fundamentaler Beweis aus dem Jahr 1936 nicht nur das Hilbert’sche Entscheidungsproblem zu Fall gebracht; er liefert uns zugleich eine plausible Begründung für die Unlösbarkeit des zehnten Hilbert’schen Problems.
1.2.9
Auferstanden aus Ruinen
Die Arbeiten von Gödel und Turing waren ein Frontalangriff auf die Grundfesten der Mathematik. Ende der dreißiger Jahre lag das Hilbert’sche Programm in Trümmern, genauso wie die Vision einer mechanisierbaren Mathematik. Und dennoch sollten die Erkenntnisse des zwanzigsten Jahrhunderts einen Bereich der Mathematik ganz besonders beflügeln: die Mengenlehre. Kurt Gödel begann Ende der dreißiger Jahre, sich intensiv mit mengentheoretischen Problemen auseinanderzusetzen, und schon bald war er in der Lage, die ersten Früchte seiner Arbeit zu ernten. In den Mittelpunkt seines Interesses rückten relative Beweise der Widerspruchsfreiheit. In einem solchen Beweis wird die Widerspruchsfreiheit eines Systems B nicht direkt gezeigt; es wird lediglich bewiesen, dass sich die Widerspruchsfreiheit eines Systems A auf das System B überträgt. Am Beispiel der Zermelo-Fraenkel-Mengenlehre (ZF) und der PeanoArithmetik (PA) wollen wir skizzieren, wie sich ein relativer Widerspruchsbeweis führen lässt. Im Vorgriff auf Abschnitt 3.2.2 halten wir
Yuri Matijaseviˇc (geb. 1947) [115] Abbildung 1.50: Im Jahr 1970 gelang es dem russischen Mathematiker Yuri Matijaseviˇc, die letzte Lücke im Beweis der Unlösbarkeit des zehnten Hilbert’schen Problems zu schließen.
62
1 Historische Notizen
I Konstruktionsschema
0
:=
0/
n+1
:=
n ∪ {n}
fest, dass jede natürliche Zahl in Form einer speziell konstruierten Mengen dargestellt werden kann (Abbildung 1.51) [124, 126]. Damit dürfen wir PA ruhigen Gewissens als ein Teilsystem von ZF ansehen und können jede zahlentheoretische Aussage aus PA in eine entsprechende mengentheoretische Aussage aus ZF übersetzen. Beispielsweise lässt sich eine arithmetische Aussage der Form
I Beispiele
1 2 3
=
{0}
=
{0} /
=
{0, 1}
=
{0, / {0}} /
=
{0, 1, 2}
=
{0, / {0}, / {0, / {0}}} /
„Für alle Zahlen x gilt ...“ wie folgt innerhalb von ZF darstellen: „Für alle Mengen x, falls x eine Zahl repräsentiert, gilt: ...“
Abbildung 1.51: Mengendarstellung der natürlichen Zahlen
φ1 φ2
ψ3
ψ2 ¬ψ1
ψ1
ψ5 ψ4
Zermelo-FraenkelMengenlehre (ZF)
Einbettung von PA in ZF
¬φ1
PeanoArithmetik (PA)
Widerspruch in PA
Widerspruch in ZF
Abbildung 1.52: Relativer Beweis der Widerspruchsfreiheit. Jede Formel ϕi der Peano-Arithmetik (PA) wird so auf eine Formel ψi der Zermelo-Fraenkel-Mengenlehre (ZF) abgebildet, dass ϕi genau dann in PA beweisbar ist, wenn ψi in ZF beweisbar ist. Jeder Widerspruch innerhalb von PA wäre jetzt auch in ZF sichtbar, so dass aus der Widerspruchsfreiheit von ZF die Widerspruchsfreiheit von PA folgt.
Gelingt die Übersetzung derart, dass jede in PA beweisbare Aussage zu einer in ZF beweisbaren Aussage wird, so sind wir am Ziel. Jeder Widerspruch, der sich innerhalb von PA ableiten ließe, würde zugleich einen Widerspruch in ZF ergeben (Abbildung 1.52). Mit anderen Worten: Aus der Widerspruchsfreiheit von ZF folgt die Widerspruchsfreiheit von PA. Durch eine ähnliche Konstruktion gelang es Gödel, die relative Widerspruchsfreiheit zwischen der ZF- und der ZFC-Mengenlehre (ZermeloFraenkel-Mengenlehre mit Auswahlaxiom) zu zeigen [65]. Hierzu orientierte er sich an einer Idee von John von Neumann, Mengen hierarchisch anzuordnen [124]. Analog zur Neumann’schen Mengenhierarchie V definierte Gödel eine Hierarchie L, die ausschließlich aus Mengen besteht, die sich durch die wiederholte Anwendung bestimmter Bildungsregeln erzeugen lassen. Gödel bezeichnete diese Mengen als konstruktible Mengen. Da jede konstruktible Menge eine Menge ist, gilt offensichtlich die Beziehung L ⊆ V . Gödel interessierte sich für die Konsequenzen, die sich aus der Annahme ergeben, ausnahmslos jede Menge sei konstruktibel. Er tat dies, indem er den ZF-Axiomen das Konstruktibilitätsaxiom, kurz (V =L), hinzufügte. Durch eine trickreiche Konstruktion gelang es ihm, die Theorie ZF+(V =L) so in ZF einzubetten, dass jede in ZF+(V =L) beweisbare Aussage zu einer beweisbaren Aussage in ZF wird. Aufgrund dieser Konstruktion führt jeder Widerspruch, der sich in ZF+(V =L) ableiten lässt, auch zu einem Widerspruch in ZF. Ist also ZF widerspruchsfrei, so ist es auch ZF+(V =L). Jetzt kommt der entscheidende Schritt. In ZFC+(V =L) lässt sich das Auswahlaxiom als Theorem beweisen. Daraus folgt, dass das Auswahlaxiom mit den Axiomen von ZFC+(V =L) und damit erst recht mit den Axiomen von ZF verträglich ist. Mit anderen Worten: Ist die ZF-Mengenlehre selbst frei von Widersprüchen, so lässt sich das Auswahlaxiom widerspruchsfrei als weiteres Axiom hinzufügen. In der gleichen Weise gelang es Gödel, zu zeigen, dass sich ne-
63
1.2 Der Weg zur modernen Mathematik
pr 23 Mrz 2 A
Paul Joseph Cohen wurde am 2. April 1934 in Long Branch, New Jersey, geboren. Schon in jungen Jahren galt Cohen als mathematisches Wunderkind. Nach zwei Jahren am Brooklyn College in New York wechselte er an die University of Chicago. Dort erhielt er im Jahr 1954 seinen Master-Abschluss, vier Jahre später folgte die Promotion. 1958 führte ihn sein Weg an das Massachusetts Institute of Technology. Die Zeit zwischen 1959 und 1961 verbrachte er am Institute for Advanced Study in Princeton. 1961 wechselte er an die Stanford University, die ihn 1964 zum Professor ernannte. In Kalifornien hatte Cohen eine neue Heimat gefunden, die er als weniger hektisch empfand als seine vorherigen Stationen an der Ostküste. In Stanford fand er die Ruhe, um sich intensiv mit den Grundlagenproblemen der Mengenlehre auseinanderzusetzen. Im Jahr 1963 war es soweit. Cohen
1934 2007
konnte als erster einen lückenlosen Beweis für die lang gehegte Vermutung vorlegen, dass sich sowohl das Auswahlaxiom als auch die Kontinuumshypothese im System der Zermelo-Fraenkel-Mengenlehre weder beweisen noch widerlegen lassen. 1966 wurde er für sein Werk mit der Fields-Medaille geehrt. Die alle vier Jahre verliehene Auszeichnung ist die höchste im Bereich der Mathematik und hat eine ähnliche Bedeutung wie der Nobelpreis in anderen Wissenschaftsdisziplinen. In den 70er Jahren setzte sich Cohen vermehrt mit Problemen aus der Zahlentheorie auseinander, und mit der Riemann’schen Vermutung sollte erneut eines der bedeutendsten ungelösten Probleme der Mathematik sein Interesse wecken. Mit großer Hingabe beschäftigte sich Cohen bis zu seinem Lebensende mit dieser Vermutung; ein Beweis sollte ihm aber nicht mehr gelingen. Paul J. Cohen starb am 23. März 2007 an den Folgen einer seltenen Lungenkrankheit.
ben dem Auswahlaxiom auch die Kontinuumshypothese widerspruchsfrei zu den ZF-Axiomen hinzufügen lässt. Hatte Gödel mit seinem erneuten Coup das geschafft, wonach Cantor bis zu seinem Lebensende trachtete? War es ihm tatsächlich gelungen, dem Kontinuum das letzte große, über lange Zeit so vehement gehütete Geheimnis endlich zu entlocken? Auch wenn Gödels Arbeit von unschätzbarem Wert ist, war sie nur ein Teilerfolg. Aus der Tatsache, dass die Kontinuumshypothese mit den ZF-Axiomen verträglich ist, folgt nicht, dass sie wahr ist. Gödel war längst davon überzeugt, dass auch die Negation zu den ZF-Axiomen hinzugefügt werden kann, ohne einen Widerspruch zu erzeugen. Sollte seine Überzeugung zur Gewissheit werden, so wäre die Kontinuumshypothese innerhalb der Zermelo-Fraenkel-Mengenlehre unentscheidbar, d. h., es gäbe innerhalb von ZF weder einen Beweis für ihre Wahrheit noch einen Beweis für ihre Falschheit. Mehre Male glaubte Gödel, einen Beweis für seine Unabhängigkeitsvermutung in Händen zu halten, doch bei genauerer Analyse fanden sich stets Fehler in seiner Beweisführung. Erst im Jahr 1963 sollte Gödels Vermutung zur Gewissheit werden, als Paul Cohen bewies, dass sowohl die Negation des Auswahlaxioms wie auch die Negation der Kontinuumshypothese widerspruchsfrei zu den ZF-Axiomen hinzugefügt werden können [32–34] (Abbildung 1.53). Aus Gödels und Cohens Ergebnissen folgt, dass sich das Auswahlaxiom und die Kontinuumshypothese innerhalb der Zermelo-FraenkelMengenlehre weder beweisen noch widerlegen lassen.
64
1 Historische Notizen
Abbildung 1.53: Im Jahr 1963 bewies der amerikanischen Mathematiker Paul Cohen, dass sich die Negation der Kontinuumshypothese widerspruchsfrei zu den Axiomen der Zermelo-Fraenkel-Mengenlehre hinzufügen lässt. Ab da war gewiss, dass sich die Kontinuumshypothese innerhalb der ZF-Mengenlehre weder beweisen noch widerlegen lässt.
Cohens Arbeit ist ein Meilenstein auf dem Weg zur modernen Mengenlehre. Um die Unabhängigkeit beider Axiome zu beweisen, führte er eine neue Methode namens Forcing ein. Mit ihr lassen sich spezielle Modelle konstruieren, aus deren Existenz die Widerspruchsfreiheit eines Axiomensystems folgt. Anders als Gödel, der mithilfe des Konstruktibilitätsaxioms (V =L) ein inneres Modell der Mengenlehre konstruierte, führte Cohen eine Modellerweiterung durch. Unter gewissen Voraussetzungen lassen sich in diesem größeren Modell gewisse Eigenschaften erzwingen, wie z. B. die Falschheit der Kontinuumshypothese. Auf diese Weise konnte Cohen zeigen, dass die negierte Kontinuumshypothese mit den ZF-Axiomen verträglich ist, d. h. widerspruchsfrei zu den Axiomen hinzugefügt werden kann. Cohens Forcing-Methode ist so allgemein, dass sie in der Folgezeit auch auf andere Eigenschaften angewandt werden konnte. Heute gehört sie zu den Standardinstrumenten,
1.2 Der Weg zur modernen Mathematik
die uns im Bereich der Mengenlehre für das Führen von Unabhängigkeitsbeweisen zur Verfügung stehen. Cohens Vorgehensweise ist eng verwandt mit der Methode der booleschen Modelle [8, 162]. Diese wurde in den sechziger Jahren von Dana Scott, Robert Solovay, and Petr Vopˇenka mit dem Ziel eingeführt, einen intuitiveren Zugang zur Forcing-Methode zu schaffen. In Abschnitt 7.4 werden wir die Grundidee umreißen, die sich hinter booleschen Modellen verbirgt. Für Gödel war das Rätsel der Kontinuumshypothese damit immer noch nicht gelöst. Lange bevor Cohen seinen Beweis veröffentlichte, hatte er ausdrücklich darauf verwiesen, dass der damals noch ausstehende Unentscheidbarkeitsbeweis die Kontinuumshypothese nicht klären würde. Was Gödels damals zum Ausdruck brachte, war Zeugnis seiner platonischen Weltauffassung. Für ihn waren Mengen real existierende Gebilde der Gedankenwelt, so dass die Kontinuumshypothese in einem absoluten Sinn entweder wahr oder falsch sein muss. Dementsprechend ist die Unentscheidbarkeit lediglich der Beweis dafür, dass die zugrunde liegenden Axiome zu schwach sind, um die Wahrheit oder Falschheit der Kontinuumshypothese zu belegen. Um eine endgültige Klärung herbeizuführen, war es nach Gödels Meinung unausweichlich, die Mengenlehre um weitere Axiome zu ergänzen. In einer Veröffentlichung aus dem Jahr 1947 bringt Gödel seine Ansicht wie folgt zum Ausdruck: „Es könnte Axiome mit so reichen überprüfbaren Konsequenzen geben, die so viel Licht auf eine ganze Disziplin werfen und so mächtige Werkzeuge zur Lösung bestehender Probleme zur Verfügung stellen, [...] dass sie im gleichen Sinn wie eine gut etablierte physikalische Theorie als wahr angesehen werden müssten.“ [66, 67] Seine Worte unterstreichen, welche Kehrtwende die axiomatische Methode im Laufe der Geschichte vollzogen hat. Galten die geometrischen Axiome der alten Griechen noch als objektive, offensichtliche Wahrheiten, die keinerlei Beweis bedürfen, so sind die Axiome der modernen Mengenlehre davon weit entfernt. Sie erhalten ihre Legitimation nicht durch ihre eigene Einsichtigkeit, sondern durch die Konsequenzen, die sich aus ihnen ergeben. In der Tat folgt die Mathematik an dieser Stelle dem Vorgehen in der modernen Physik. Auch hier strapazieren die Gesetze der Quantenphysik die menschliche Intuition auf das höchste, und
65
66
Der Positivismus und der Platonismus sind philosophische Denkrichtungen in der Wissenschaft, die auf völlig unterschiedlichen mathematischen und physikalischen Weltbildern beruhen. Der Positivismus koppelt den Existenzbegriff an das Beobachtbare. Dementsprechend wird einer Fragestellung überhaupt nur dann ein Sinn zugesprochen, wenn sie sich im Rahmen eines Experiments objektiv entscheiden lässt. Metaphysische Anschauungen oder Theorien gelten als bedeutungslos. Die Frage, ob z. B. die natürlichen Zahlen als Teil einer realen Gedankenwelt eigenständig existieren oder lediglich der menschlichen Phantasie entspringen, wird von einem Positivisten weder bejaht noch verneint; stattdessen wird sie als bedeutungsleer zurückgewiesen. Der Platonismus erkennt mathematische Begriffe und Zusammenhänge als reale Gedankengebilde an, die in einem objektiven Sinne existieren. Die Wahrheit oder die Falschheit einer Aussage ist damit eine Eigenschaft, die auch ohne das Vorhandensein eines Beweises oder Gegenbeweises existiert. Nicht nur in der Physik, sondern auch in der Mathematik sehen Platoniker den Wissenschaftler in der Rolle des Entdeckers und nicht des Schöpfers.
1 Historische Notizen
dennoch akzeptieren wir sie als ernstzunehmende Theorie. Wir akzeptieren sie deshalb, weil die Folgerungen, die sich aus ihnen ergeben, mit den Phänomenen der Natur in Einklang stehen. Doch welche Axiome sind die richtigen, um die Zermelo-FraenkelMengenlehre so zu erweitern, dass sie zum einen den Begriff der Menge adäquat beschreibt und zum anderen Auskunft über bisher ungeklärte Fragen liefert? Gödel vermutete die Antwort im Bereich der Unendlichkeitsaxiome. Durch die Hinzunahme eines solchen Axioms wird, grob gesprochen, die Existenz von sehr großen Zahlen postuliert – Zahlen, die so groß sind, dass sich deren Existenz innerhalb der ZermeloFraenkel-Mengenlehre weder beweisen noch widerlegen lässt. Anhand des „kleinsten“ Unendlichkeitsaxioms wollen wir einen Einblick gewähren, wie die Hinzunahme eines solchen Axioms die Ausdrucksstärke des entstehenden Systems verändert. Das besagte Axiom ist das Axiom des Unendlichen, das wir weiter oben schon kennen gelernt haben. Es ist bereits Bestandteil von ZF und fordert die Existenz einer Menge mit unendlich vielen Elementen. Die Theorie, die durch die Entnahme des Unendlichkeitsaxioms entsteht, sei mit ZF−ω bezeichnet. Zwischen ZF und ZF−ω besteht der erstaunliche Zusammenhang, dass sich die Widerspruchsfreiheit von ZF−ω innerhalb von ZF beweisen lässt. ZF−ω selbst ist aber stark genug, um die Zahlentheorie zu formalisieren, und kann nach dem ersten Gödel’schen Unvollständigkeitssatz ihre eigene Widerspruchsfreiheit nicht selbst beweisen. Das bedeutet, dass wir durch die Hinzunahme des Unendlichkeitsaxioms in der Lage sind, Theoreme zu beweisen, die in der alten Theorie unentscheidbar sind. Heute gehört die Erforschung von Unendlichkeitsaxiomen zu den aktiven Forschungsschwerpunkten der Mengenlehre. Viele Male konnten neue Axiome gefunden werden, mit denen sich die Zermelo-FraenkelMengenlehre zu immer stärkeren Theorien ausbauen lässt. Ob die Zahlen überhaupt existieren, die durch die Hinzunahme großer Unendlichkeitsaxiome postuliert wird, wissen wir nicht; die Existenz dieser Zahlen ist ohne das Axiom weder beweisbar noch widerlegbar. Aber dürfen wir eine große unendliche Zahl überhaupt als existent bezeichnen? Existieren diese Zahlen in einem platonisch absoluten Sinn, oder sind wir gezwungen, auf eine positivistische Sichtweise auszuweichen, die zwischen der Existenz und der Beweisbarkeit riesiger Zahlen nicht unterscheidet? Sie sehen, dass die Ergebnisse der modernen Mengenlehre nicht nur aus inhaltlicher Sicht interessant sind. Mit ihr scheint eine philosophische Auseinandersetzung in die Mathematik zurückzukehren, die der zunehmenden Formalisierung im zwanzigsten Jahrhundert fast vollständig zum Opfer viel. Hier schließt sich der Kreis.
67
1.3 Übungsaufgaben
1.3
Übungsaufgaben
Die nachstehende Formel stammt aus Freges berühmter Begriffsschrift: F(y) f (x, y)
Aufgabe 1.1 Webcode 1292
F(x) b
a
F(a) f (b, a)
F(b) F(y) f (x, y) a
F(a) f (x, a)
Versuchen Sie, die Formel in die moderne Notation zu übersetzen.
In Abschnitt 1.2.2 haben wir herausgearbeitet, wie Cantor in seiner 1874 publizierten Arbeit die Abzählbarkeit der algebraischen Zahlen bewies. Hierzu ordnete er jeder Gleichung der Form an xn + an−1 xn−1 + . . . + a1 x + a0 eine Höhe N zu, die sich wie folgt berechnet: N = n − 1 + |an | + . . . + |a3 | + |a2 | + |a1 | + |a0 | War Cantor gezwungen, die Definition in dieser komplizierten Form zu wählen, oder hätte er sie durch eine der nachstehenden, leicht vereinfachten Definitionen ersetzen können? a) N = n b) N = |an | + . . . + |a3 | + |a2 | + |a1 | + |a0 | c) N = n + |an | + . . . + |a3 | + |a2 | + |a1 | + |a0 |
Aufgabe 1.2 Webcode 1060
68
Aufgabe 1.3 Webcode 1898
1 Historische Notizen
In Abschnitt 1.2.1 wurde gezeigt, wie sich die periodische Dezimalzahl 0,0238095 in den 1 überführen lässt. Bruch 42 a) Beweisen Sie auf die gleiche Weise die Beziehung 1 = 0, 9. b) Hat der Trick, den wir zur Umwandlung verwendet haben, ein gewisses Unbehagen bei Ihnen ausgelöst? Falls ja, dann besitzen Sie bereits ein gutes Gespür für die Gefahren im Umgang mit dem aktual Unendlichen. Versuchen Sie, die Beziehung 1 = 0, 9 zu beweisen, indem Sie vermeiden, eine unendliche Folge von Nachkommaziffern als ein abgeschlossenes Ganzes zu interpretieren.
0
0
0
0
0
0
0
0 , 1
9
0
...
In Abbildung 1.20 haben wir gezeigt, wie sich zwei reelle Zahlen im Reißverschlussverfahren zu einer einzigen reellen Zahl verschmelzen lassen. Auf diese Weise hatten wir eine bijektive Abbildung zwischen R2 und R hergestellt und damit die Gleichmächtigkeit beider Mengen bewiesen. ...
Aufgabe 1.4 Webcode 1001
0 , 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ... 0 ,
1
0
0
0
0
0 , 1 0 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 ... 0 ,
0
0
0
...
9
9
9
9
9
0 ,1
9
9
0
9
9
9
9
9
9
9
...
In Wirklichkeit haben wir an dieser Stelle ein wenig geschummelt, da die Dezimalbruchdarstellung einer reellen Zahl nicht immer eindeutig ist. Beispielsweise ist 0,11 = 0,109. Das bedeutet, dass die von uns konstruierte Abbildung von R2 auf R nicht injektiv und damit erst recht nicht bijektiv ist. Wie könnte man mit diesem Problem umgehen, ohne die Grundidee der Reißverschlusskonstruktion komplett aufzugeben? Aufgabe 1.5 Webcode 1367
Mit der Goldbach’schen Vermutung haben Sie eines der wichtigsten bis dato ungelösten Probleme der Zahlentheorie kennen gelernt. In ihrer starken Form lautet sie so: „Jede gerade natürliche Zahl n > 2 lässt sich als Summe zweier Primzahlen schreiben.“ Zeigen Sie, dass aus der starken Goldbach’schen Vermutung die folgende Aussage folgt: „Jede gerade natürliche Zahl n > 5 lässt sich als Summe dreier Primzahlen schreiben.“
69
1.3 Übungsaufgaben
In dieser Aufgabe geht es erneut um die Goldbach’sche Vermutung. a) Nehmen Sie an, die Vermutung sei falsch. Ließe sie sich dann mit den Mitteln der gewöhnlichen Arithmetik widerlegen?
Aufgabe 1.6 Webcode 1651
b) Nehmen Sie an, die Goldbach’sche Vermutung sei mit den Mitteln der gewöhnlichen Mathematik unbeweisbar. Lässt das Ergebnis in diesem Fall einen Rückschluss auf die Wahrheit oder die Falschheit der Vermutung zu? c) Lässt sich das Ergebnis auf die Vermutung über die Existenz unendlich vieler Primzahlzwillinge übertragen? d) Ist die Fermat’sche Vermutung ein mathematischer Satz vom Goldbach’schen Typ?
Aufgabe 1.7 Webcode 1853
Die Erd˝os-Straus-Vermutung besagt, dass die Gleichung 4 1 1 1 = + + n a b c für jede natürliche Zahl n > 1 eine Lösung in den natürlichen Zahlen besitzt. Könnten wir die Vermutung lösen, wenn wir im Besitz eines Entscheidungsverfahrens für diophantische Gleichungen wären?
Ergänzen Sie die nachstehenden Aussagen. Die Menge . . .
leer
endlich
abzählbar
überabzählbar
{M ∈ 2N | N ⊆ M} ist
{M ∈ 2N | |M| = |N|} ist {M ∈ 2N | |M| < |N|} ist {M ∈ 2N | |M| > |N|} ist
Aufgabe 1.8 Webcode 1600
2 Formale Systeme „Wenn es sich darum handelt, die Grundlagen einer Wissenschaft zu untersuchen, so hat man ein System von Axiomen aufzustellen, welche eine genaue und vollständige Beschreibung derjenigen Beziehungen enthalten, die zwischen den elementaren Begriffen jener Wissenschaft stattfinden. Die aufgestellten Axiome sind zugleich die Definitionen jener elementaren Begriffe, und jede Aussage innerhalb des Bereiches der Wissenschaft, deren Grundlagen wir prüfen, gilt uns nur dann als richtig, falls sie sich mittelst einer endlichen Anzahl logischer Schlüsse aus den aufgestellten Axiomen ableiten lässt.“ David Hilbert [87]
2.1
Definition und Eigenschaften
In Kapitel 1 haben wir die axiomatische Methode als die Grundlage der modernen mathematischen Beweisführung identifiziert und gezeigt, wie sie das Bild der Mathematik im Laufe der Zeit verändert hat. Im modernen Sinne wird das Führen eines Beweises als der Prozess verstanden, Sätze durch die Anwendung wohldefinierter Schlussregeln aus einer kleiner Menge a priori festgelegter Grundannahmen, den Axiomen, abzuleiten. Erst durch den präzisen deduktiven Charakter dieser Vorgehensweise konnte sich die Mathematik zu der exakten Wissenschaft entwickeln, wie wir sie heute kennen. Formale Systeme wurden mit dem Ziel geschaffen, die axiomatische Methode in eine strenge Form zu bringen. Was wir darunter im Detail zu verstehen haben, wollen wir anhand eines konkreten Beispiels, des Beispielkalküls E, herausarbeiten. Der Begriff des Kalküls wird ab jetzt häufiger auftauchen; wir werden ihn im Rest des Buchs als Synonym für den Begriff des formalen Systems verwenden. Dem Kalkül E nähern wir uns in mehreren Schritten, in denen nacheinander die Syntax, die Axiome und Schlussregeln sowie die Semantik von E festgelegt werden.
72
Ab jetzt werden wir es fortwährend mit zwei verschiedenen Sprachebenen zu tun haben. Die eine ist die Ebene der Kalkülsprache, die andere die gewöhnliche Sprache der Mathematik. Letztere wird auch als Meta-Ebene bezeichnet, weil wir sie verwenden können, um über ein formales System zu sprechen. Auf dieser Ebene bewegen wir uns außerhalb des Systems und können unser volles mathematisches Instrumentarium einsetzen, um seine Axiome und Schlussregeln zu analysieren und auf bestimmte Eigenschaften hin zu untersuchen. Auf der Ebene der Kalkülsprache (Objektebene) besitzen wir diese Bewegungsfreiheit nicht. Die Syntax und die Semantik der formulierbaren Aussagen werden hier durch ein präzises Regelwerk in ein starres Korsett gepresst. Die Vermischung von Objekt- und MetaEbene ist eine häufige Ursache von Verständnisschwierigkeiten im Bereich der mathematischen Logik und zugleich der Ausgangspunkt vieler augenscheinlicher Paradoxa. Um eine klare Trennung beider Ebenen herbeizuführen, werden alle Formeln der Kalkülsprache in einer serifenlosen Schrift dargestellt (z. B. s(0) = s(0)). Insbesondere dann, wenn die betrachteten Kalküle einen mächtigen Sprachumfang besitzen, wird die unterschiedliche Schriftwahl helfen, gewöhnliche mathematische Aussagen von den Formeln des Kalküls zu unterscheiden. An verschiedenen Stellen dieses Buchs werden immer wieder Formeln in gemischter Schreibweise auftreten, in denen einzelne Formelbestandteile durch griechische Buchstaben ersetzt sind (z. B. s(s(0)) = σ ). Ein solcher Ausdruck heißt Formelschema und ist selbst keine Formel der Kalkülsprache. Erst durch die Substitution des Platzhalters σ durch einen passenden Teilausdruck entsteht eine wohlgeformte Zeichenkette (z. B. s(s(0)) = s(0)).
2 Formale Systeme
Syntax Die Syntax definiert, nach welchen Regeln die Ausdrücke (Formeln) aufgebaut sein müssen, die sich innerhalb des Kalküls erzeugen und manipulieren lassen. Eine Formel ist in diesem Stadium nichts weiter als eine Folge von bedeutungsleeren Symbolen, die in einer festgelegten Art und Weise miteinander kombiniert werden dürfen. In den Formeln des Beispielkalküls E werden ausschließlich die Symbole ‚0‘, ‚s‘, ‚=‘, ‚>‘, ‚(‘, ‚)‘ und ‚¬‘ vorkommen. Die Menge dieser Symbole ist das Alphabet von E. Natürlich entspricht nicht jede Sequenz von Alphabetzeichen einer Formel. Als Formeln gelten nur wohlgeformte Zeichenketten, d. h. Zeichenketten, die nach bestimmten Bildungsregeln aufgebaut sind. Die Menge aller Formeln heißt die Sprache von E. Für die Sprache des Beispielkalküls E vereinbaren wir die folgenden Bildungsregeln: I
0 ist ein Term.
I
Ist σ ein Term, dann ist es auch s(σ ).
I
Sind σ , τ Terme, so sind die folgenden Ausdrücke Formeln: (σ = τ), (σ > τ), ¬(σ = τ), ¬(σ > τ)
Terme sind die Grundbausteine der kalküleigenen Kunstsprache. In symbolischer Form repräsentieren sie die Objekte, über die wir in E sprechen können. Durch die wiederholte Anwendung der ersten beiden Bildungsregeln lassen sich die nachstehenden Terme erzeugen: 0, s(0), s(s(0)), s(s(s(0))), s(s(s(s(0)))), . . . Die dritte Bildungsregel definiert, wie Terme zu Formeln kombiniert werden können. Unter anderem gehören die folgenden Formeln zur Sprache von E: (0 = 0), (0 > 0), ¬(0 = 0), (s(s(0)) = 0), ¬(0 = s(0)), . . . Axiome und Schlussregeln Die Axiome und die Schlussregeln von E sind in Tabelle 2.1 zusammengefasst. Ausgehend von einem einzigen Axiom stehen 6 Schlussregeln zur Verfügung, die zur Ableitung neuer Theoreme genutzt werden
73
2.1 Definition und Eigenschaften
können. Für jede ableitbare Formel ϕ schreiben wir ϕ und nennen ϕ ein Theorem von E. Der Ausdruck ϕ ist damit nichts anderes als die symbolische Schreibweise für die Aussage: „ϕ ist in E beweisbar“. Beachten Sie bei der Betrachtung der Schlussregeln, dass die Variablen lediglich Platzhalter sind, die durch beliebige Terme substituiert werden können. So lassen sich aus dem Formelschema (s(σ ) > τ) unter anderem die folgenden Instanzen bilden: I
Substitution 1: S := [σ ← s(s(0)), τ ← 0] (s(σ ) > τ)S = (s(s(s(0))) > 0)
I
Substitution 2: S := [σ ← s(0), τ ← s(s(0))] (s(σ ) > τ)S = (s(s(0)) > s(s(0)))
Mit den geleisteten Vorarbeiten sind wir in der Lage, den Kalkül zum Leben zu erwecken und durch die systematische Anwendung von Schlussregeln neue Theoreme abzuleiten. I
Beispiel 1: Ableitung von (s(s(s(s(0)))) > s(s(0)))
1. 2. 3. 4. 5.
I
Beispiel 2: Ableitung von ¬(s(s(0)) = s(s(s(0))))
(0 = 0) (s(0) = s(0)) (s(s(0)) = s(s(0))) (s(s(s(0))) > s(s(0))) (s(s(s(s(0)))) > s(s(0)))
(A1) (S1, 1) (S1, 2) (S2, 3) (S3, 4)
1. (0 = 0) 2. (s(0) = s(0))
(A1) (S1, 1)
3. (s(s(0)) = s(s(0))) 4. (s(s(s(0))) > s(s(0))) 5. ¬(s(s(0)) = s(s(s(0))))
(S1, 2) (S2, 3) (S5, 4)
Beide Beispiele verdeutlichen den symbolischen Charakter, den Beweise in formalen Systemen besitzen. Dank der präzisen Ausformulierung der Axiome und der Schlussregeln ist es nunmehr möglich, Theoreme auf der syntaktischen Ebene abzuleiten, ohne den einzelnen Formelbestandteilen eine Bedeutung zuzumessen; das Führen eines Beweises kommt der symbolischen Manipulation von Zeichenketten gleich.
Axiome (Kalkül E) (0 = 0)
(A1)
Schlussregeln (Kalkül E) (σ = σ ) (s(σ ) = s(σ ))
(S1)
(σ = σ ) (s(σ ) > σ )
(S2)
(σ > τ) (s(σ ) > τ)
(S3)
(σ > τ) ¬(σ = τ)
(S4)
(σ > τ) ¬(τ = σ )
(S5)
(σ > τ) ¬(τ > σ )
(S6)
Tabelle 2.1: Axiome und Schlussregeln des Beispielkalküls E. Alle Schlussregeln sind nach einem einheitlichen Schema aufgebaut. Über dem Mittelstrich ist die Prämisse notiert. Sie beschreibt, auf welche Formeln die Schlussregel angewendet werden darf. Die unter dem Mittelstrich notierte Aussage ist die Konklusion, d. h. die Schlussfolgerung, die aus der Prämisse abgeleitet werden kann.
2 Formale Systeme
Unbeweisbare Aussagen
(s(s(s(s(0)))) > s(s(0)))
(0 > s(0))
¬(s(0) > s(0)) ¬(s(s(0)) = s(s(s(0))))
23 11
0>1
4>2 Wahre Aussagen
Jetzt ist der Weg frei, um den Begriff des Beweises mit mathematischer Präzision zu erfassen. Syntaktische Ebene
Beweisbare Aussagen
Semantische Ebene
Interpretation
74
Definition 2.1 (Beweis) Ein formaler Beweis ist eine Kette von Formeln ϕ1 , ϕ2 , . . . , ϕn , die nach den folgenden Konstruktionsregeln gebildet wird: I
ϕi ist ein Axiom oder
I
ϕi entsteht aus den vorangegangenen Gliedern der Beweiskette durch die Anwendung einer Schlussregel.
Die letzte Formel dieser Kette ist das bewiesene Theorem.
Falsche Aussagen
Semantik Abbildung 2.1: Eine Interpretation weist den Formeln eines Kalküls eine Bedeutung zu. In diesem Beispiel werden die Terme als natürliche Zahlen, das Zeichen ‚=‘ als die Gleichheit und das Zeichen ‚>‘ als die Größer-Relation auf den natürlichen Zahlen interpretiert. Das Symbol ‚¬‘ hat in allen Kalkülen die gleiche Bedeutung und steht für die logische Negation (Verneinung).
Nachdem wir die Sprache festgelegt und mit den Axiomen und den Schlussregeln die Grundlage für die Ableitung neuer Theoreme geschaffen haben, ist es Zeit, den Kalkül mit einer Semantik zu versehen. Die Semantik bestimmt, wie wir die einzelnen Bestandteile einer Formel zu interpretieren haben, und verleiht den Formeln hierdurch eine Bedeutung. Erst die Wahl einer konkreten Interpretation berechtigt uns dazu, von wahren und von falschen Formeln zu sprechen (Abbildung 2.1). Behalten Sie dabei stets im Auge, dass der Wahrheitswert der meisten Formeln von der gewählten Interpretation abhängt. Je nachdem, für welche Interpretation wir uns entscheiden, kann eine Formel einmal einer wahren und ein anderes Mal einer falschen Aussage entsprechen. Von besonderem Interesse sind Interpretationen, in denen alle Theoreme eines Kalküls wahre Aussagen sind. Eine solche Interpretation heißt Modell. In Kapitel 7 werden wir uns im Rahmen der Modelltheorie ausführlich mit dem Aufbau, den Eigenschaften und der systematischen Konstruktion von Modellen befassen. Bevor wir die Semantik für den Beispielkalkül E festlegen, vereinbaren wir die folgende Schreibweise: n := s(s(. . . s (0) . . .))
(2.1)
n-mal
Die nachstehenden Beispiele zeigen, dass sich die meisten Formeln von
75
2.1 Definition und Eigenschaften
E jetzt deutlich kompakter schreiben lassen: (4 > 2) steht für (s(s(s(s(0)))) > s(s(0))) ¬(2 = 3) steht für ¬(s(s(0)) = s(s(s(0)))) (0 > 1) steht für (0 > s(0)) Mithilfe der eingeführten Schreibweise legen wir die Interpretation der Formeln von E wie folgt fest: n) entspricht der natürlichen Zahl n ∈ N (n = m) entspricht der Aussage n = m (n > m) entspricht der Aussage n > m ¬(n = m) entspricht der Aussage n = m ¬(n > m) entspricht der Aussage n ≤ m Weiter oben haben wir mit der Beweisbarkeitsrelation ‚‘ eine Schreibweise eingeführt, mit der die Ableitbarkeit einer Formel ausgedrückt werden kann. In analoger Weise werden wir die Modellrelation ‚|=‘ verwenden, um die Wahrheit einer Aussage zu äußern. Offensichtlich gelten die folgenden Beziehungen: |= (4 > 2) |= ¬(2 = 3) |= (0 > 1) |= ¬(1 > 0) Allgemein lässt sich die Modellrelation ‚|=‘ wie folgt definieren: |= (n = m) :⇔ n = m |= (n > m) :⇔ n > m |= ¬ϕ :⇔ |= ϕ
(2.2) (2.3) (2.4)
Die Definition stellt sicher, dass für keine Formel ϕ gleichzeitig |= ϕ und |= ¬ϕ gelten kann. Diese Eigenschaft trägt der festen Semantik des Negationsoperators ‚¬‘ Rechnung und wird von jeder Modellrelation erfüllt. In unserem Beispiel gilt aber noch mehr. Die Beziehung (2.4) stellt sicher, dass für jede Formel ϕ immer entweder |= ϕ oder |= ¬ϕ gilt. Diese besondere Eigenschaft ist deshalb erfüllt, weil wir die Wahrheit und Falschheit einer Formel in unserem Beispiel bewusst an eine ganz bestimmte Interpretation der Symbole geknüpft haben. In dieser Standardinterpretation entspricht jede Formel ϕ einer arithmetischen Aussage, die entweder wahr oder falsch ist, so dass entweder |= ϕ oder
76
2 Formale Systeme
|= ¬ϕ gelten muss. In der später diskutierten Aussagenlogik und Prädikatenlogik wird dies nicht mehr der Fall sein, da wir die Untersuchung dort auf beliebige Interpretationen ausweiten werden. Mit |= ϕ werden wir dann ausdrücken, dass ϕ allgemeingültig ist, d. h., in jeder möglichen Interpretation wahr ist und nicht nur in einer ganz bestimmten. Ist eine Formel ϕ für manche Interpretationen wahr und für andere falsch, so gilt das gleiche auch für ¬ϕ. In diesem Fall ist keine der Formeln ϕ oder ¬ϕ allgemeingültig und es gilt weder |= ϕ noch |= ¬ϕ. Wir halten fest: Satz 2.1
Achten Sie darauf, die Negationsvollständigkeit nicht mit der Vollständigkeit und die Widerspruchsfreiheit nicht mit der Korrektheit zu verwechseln. Jeder Begriff beschreibt eine andere Eigenschaft formaler Systeme. In der angelsächsischen Literatur herrscht eine genauso scharfe Abgrenzung zwischen den Begriffen. Ein negationsvollständiger Kalkül wird dort als negation complete und ein vollständiger Kalkül als complete bezeichnet. Ein widerspruchsfreier Kalkül heißt consistent und ein korrekter Kalkül heißt sound. Sowohl in der deutschsprachigen als auch in der englischsprachigen Literatur wird die Negationsvollständigkeit mitunter als syntaktische Vollständigkeit und die Vollständigkeit als semantische Vollständigkeit bezeichnet. Wenn die Gefahr einer Verwechslung ausgeschlossen ist, wird gerne auf den Zusatz „syntaktisch“ und „semantisch“ verzichtet und dann nur noch von der Vollständigkeit eines Kalküls gesprochen. Achten Sie bei dem Begriff der Vollständigkeit also immer darauf, ob er sich auf die syntaktische oder auf die semantische Ebene bezieht. In beiden Fällen ist seine Bedeutung eine völlig andere.
I
Es gilt niemals gleichzeitig |= ϕ und |= ¬ϕ.
I
Aus |= ϕ folgt nicht in allen Logiken |= ¬ϕ.
Die Beweisbarkeitsrelation ‚‘ und die Modellrelation ‚|=‘ sind die Grundlage für die Definition wichtiger Kalküleigenschaften, die uns durch alle Kapitel dieses Buchs begleiten werden. Behalten Sie die Begriffe gut in Erinnerung! Definition 2.2 Ein formales System (Kalkül) heißt I
widerspruchsfrei, wenn aus ϕ stets ¬ϕ folgt,
I
negationsvollständig, wenn aus ¬ϕ stets ϕ folgt,
I
korrekt, wenn aus ϕ stets |= ϕ folgt,
I
vollständig, wenn aus |= ϕ stets ϕ folgt.
Demnach ist ein Kalkül genau dann widerspruchsfrei, wenn es nicht möglich ist, eine Formel ϕ zusammen mit ihrer Negation ¬ϕ abzuleiten. Negationsvollständig ist ein Kalkül genau dann, wenn für jede Formel immer mindestens eine der beiden Alternativen ϕ oder ¬ϕ deduziert werden kann. Von besonderem Interesse sind Kalküle, die sowohl widerspruchsfrei als auch negationsvollständig sind. Nur in diesen Kalkülen gilt, dass für jede Formel immer genau eine der beiden Alternativen ϕ oder ¬ϕ abgeleitet werden kann. Die Widerspruchsfreiheit und die Negationsvollständigkeit sind syntaktische Eigenschaften, da in ihrer Definition keinerlei Gebrauch von der
2.1 Definition und Eigenschaften
Bedeutung der einzelnen Symbolen gemacht wird. Im Gegensatz hierzu sind die Korrektheit und die Vollständigkeit semantische Eigenschaften; sie stellen einen Bezug zwischen der Beweisbarkeit und der Wahrheit einer Aussage her. Ein Kalkül ist korrekt, wenn alle seine Theoreme wahre Aussagen sind, und es ist vollständig, wenn jede wahre Aussage auch ein Theorem ist, d. h., wenn sich jede wahre Formel durch die Anwendung endlich vieler Schlussregeln aus den Axiomen ableiten lässt. Es entsteht der natürliche Wunsch, sowohl korrekte als auch vollständige Kalküle zu definieren, da nur in ihnen der Unterschied zwischen der Beweisbarkeit und der Wahrheit einer Aussage verschwindet. Zwischen den syntaktischen Begriffen der Widerspruchsfreiheit und der Negationsvollständigkeit sowie den semantischen Begriffen der Korrektheit und der Vollständigkeit lassen sich zwei wichtige Zusammenhänge herstellen: Satz 2.2 I
Ist ein Kalkül vollständig und gilt für alle Formeln immer entweder |= ϕ oder |= ¬ϕ, so ist er auch negationsvollständig.
I
Ist ein Kalkül korrekt, so ist er auch widerspruchsfrei.
Die erste Aussage folgt direkt aus der Tatsache, dass zu jeder Formel ϕ entweder ϕ selbst oder deren Negation ¬ϕ eine wahre Aussage ist (es gilt nach Voraussetzung entweder |= ϕ oder |= ¬ϕ). Damit ist in einem vollständigen Kalkül immer mindestens eine der beiden Formeln ableitbar und der Kalkül damit negationsvollständig. Die zweite Aussage folgt aus der Tatsache, dass sich in einem korrekten Kalkül nur wahre Aussagen beweisen lassen. Da immer nur eine der beiden Formeln ϕ und ¬ϕ wahr sein kann, ist immer auch nur eine der beiden Formeln ableitbar und der Kalkül damit widerspruchsfrei. Damit ist es an der Zeit, einen erneuten Blick auf das Beispielkalkül E zu werfen und zu untersuchen, welche der in Definition 2.2 eingeführten Eigenschaften erfüllt sind und welche nicht. Aus der genaueren Analyse der Axiome und der Schlussregeln lassen sich die nachstehenden Schlussfolgerungen ziehen: I
E ist korrekt und widerspruchsfrei. Die Korrektheit folgt aus der speziellen Bedeutung, die wir den Formeln aus E zugewiesen haben. Mit der vorgenommenen Interpretation wird das (einzige) Axiom (A1) zu einer wahren Aussage über
77
78
2 Formale Systeme
die natürlichen Zahlen, und die Schlussregeln sind so gestaltet, dass aus einer wahren Aussage wiederum eine wahre Aussage folgt. Nach Satz 2.2 ist der Kalkül damit erst recht widerspruchsfrei. I
E ist weder negationsvollständig noch vollständig. Negationsvollständig wäre der Kalkül nur dann, wenn sich für jede Formel ϕ mindestens eine der Formeln ϕ und ¬ϕ ableiten lässt. Es ist aber weder (0 > 0) noch ¬(0 > 0) ein Theorem von E. Damit ist der Kalkül negationsunvollständig und nach Satz 2.2 erst recht unvollständig.
Wir wollen versuchen, den Kalkül E um zusätzliche Schlussregeln anzureichern. Hierzu sind in Tabelle 2.2 drei Kalkülerweiterungen zusammengefasst, die wir jetzt nacheinander untersuchen werden. Unsere besondere Aufmerksamkeit werden wir darauf richten, in welcher Weise sich die eingeführten Kalküleigenschaften verändert haben. Wir beginnen mit der Diskussion des Kalküls E2 , das sich von E lediglich durch die Hinzunahme der Schlussregel (S7) unterscheidet (Tabelle 2.2 links). Auf den ersten Blick geht durch die neue Regel die Eigenschaft der Korrektheit verloren, da wir (S7) verwenden können, um aus der Prämisse ¬(n > n) die Konklusion (n > n) abzuleiten. Über den natürlichen Zahlen interpretiert, repräsentiert die erste Formel eine wahre Aussage, die zweite aber ganz offensichtlich eine falsche. Wir wollen nun versuchen, den Widerspruch innerhalb von E2 sichtbar zu machen. Um mithilfe der Regel (S7) eine falsche Aussage herzuleiten, müssen wir für eine beliebige natürliche Zahl n zunächst die Formel ¬(n > n) beweisen. Anschließend können wir mit der Schlussregel (S7) das Theorem (n > n) ableiten und hätten damit eine Formel ϕ gefunden, für die sich sowohl ϕ als auch ¬ϕ beweisen lassen. Der Kalkül E2 wäre hierdurch als widersprüchlich entlarvt. Ein gezielter Blick auf die Schlussregeln zeigt, dass wir die Formel ¬(n > n) aber gar nicht innerhalb von E2 ableiten können. Die immer noch nicht vorhandene Negationsvollständigkeit verhindert hier, dass sich eine falsche Aussage beweisen lässt. Damit bleibt E2 trotz der Hinzunahme der semantisch inkorrekten Schlussregel (S7) korrekt und nach Satz 2.2 auch widerspruchsfrei. Als nächstes betrachten wir den Kalkül E3 , der aus E2 durch die erneute Hinzunahme einer Schlussregel entsteht (Tabelle 2.2 Mitte). Durch die neue Regel (S8) wird E3 in der Tat vollständig, d. h., jede wahre Aussage, die sich in der begrenzten Sprache unserer Beispielkalküle
79
2.1 Definition und Eigenschaften
Axiome (Kalkül E2 ) (0 = 0)
Axiome (Kalkül E3 ) (A1)
Schlussregeln (Kalkül E2 )
(0 = 0)
Axiome (Kalkül E4 ) (A1)
Schlussregeln (Kalkül E3 )
(0 = 0)
(A1)
Schlussregeln (Kalkül E4 )
(σ = σ ) (s(σ ) = s(σ ))
(S1)
(σ = σ ) (s(σ ) = s(σ ))
(S1)
(σ = σ ) (s(σ ) = s(σ ))
(S1)
(σ = σ ) (s(σ ) > σ )
(S2)
(σ = σ ) (s(σ ) > σ )
(S2)
(σ = σ ) (s(σ ) > σ )
(S2)
(σ > τ) (s(σ ) > τ)
(S3)
(σ > τ) (s(σ ) > τ)
(S3)
(σ > τ) (s(σ ) > τ)
(S3)
(σ > τ) ¬(σ = τ)
(S4)
(σ > τ) ¬(σ = τ)
(S4)
(σ > τ) ¬(σ = τ)
(S4)
(σ > τ) ¬(τ = σ )
(S5)
(σ > τ) ¬(τ = σ )
(S5)
(σ > τ) ¬(τ = σ )
(S5)
(σ > τ) ¬(τ > σ )
(S6)
(σ > τ) ¬(τ > σ )
(S6)
(σ > τ) ¬(τ > σ )
(S6)
¬(σ > τ) (τ > σ )
(S7)
¬(σ > τ) (τ > σ )
(S7)
(σ = τ) ¬(σ > τ)
(S8)
(σ = τ) ¬(σ > τ)
(S8)
Tabelle 2.2: Axiome und Schlussregeln der Kalküle E2 , E3 und E4
formulieren lässt, ist ein Theorem von E3 . Nach Satz 2.2 ist E3 damit automatisch auch negationsvollständig. Gleichzeitig hat E3 durch die Hinzunahme von (S8) die nötige Ausdrucksstärke erlangt, um den oben geschilderten Widerspruch innerhalb des Kalküls nachvollziehen zu können. Der folgende Beweis demonstriert, wie sich mit ¬(0 > 0) und (0 > 0) ein komplementäres Formelpaar ableiten lässt: 1. (0 = 0) 2. ¬(0 > 0) 3. (0 > 0)
(A1) (S8, 1) (S7, 2)
80
2 Formale Systeme
E3 ist somit widersprüchlich und nach Satz 2.2 erst recht inkorrekt.
Axiome (Kalkül E5 ) ¬(0 = 0)
(A1’)
Schlussregeln (Kalkül E5 ) ¬(σ = σ ) ¬(s(σ ) = s(σ ))
(S1’)
¬(σ = σ ) ¬(s(σ ) > σ )
(S2’)
¬(σ > τ) ¬(s(σ ) > τ)
(S3’)
¬(σ > τ) (σ = τ)
(S4’)
¬(σ > τ) (τ = σ )
(S5’)
¬(σ > τ) (τ > σ )
(S6’)
Entfernen wir die problematische Schlussregel (S7), so gelangen wir auf direktem Weg zu E4 (Tabelle 2.2 rechts). Obwohl dieser Kalkül eine Regel weniger besitzt, bleibt die Vollständigkeit erhalten; dafür sind alle Widersprüche verschwunden. Mit E4 haben wir genau das vor uns, wonach wir gesucht haben: Einen vollständigen und korrekten Kalkül, in dem sich jede wahre Aussage durch die Anwendung von endlich vielen Schlussregeln aus den Axiomen ableiten lässt. Als vorletztes Beispiel betrachten wir den Kalkül E5 , dessen Axiome und Schlussregeln in Tabelle 2.3 zusammengefasst sind. Von dem korrekten und vollständigen Kalkül E4 unterscheidet er sich dadurch, dass alle Prämissen und Konklusionen negiert auftauchen. E5 verhält sich hierdurch vollständig komplementär zu E4 , d. h., eine Aussage ϕ lässt sich in E5 genau dann ableiten, wenn seine Negation in E4 ableitbar ist. Der Kalkül ist der perfekte Lügner; jedes seiner Theoreme entspricht einer falschen Aussage, und jede falsche Aussage ist zudem ein Theorem. Damit ist E5 weder korrekt noch vollständig, besitzt aber weiterhin die syntaktischen Eigenschaften der Widerspruchsfreiheit und Negationsvollständigkeit. E5 ist der Beweis dafür, dass die Schlussrichtungen in Satz 2.2 nicht umgekehrt werden dürfen. Satz 2.3
¬(σ = τ) (σ > τ)
(S8’)
Tabelle 2.3: Axiome und Schlussregeln des Kalküls E5
I
Nicht jeder negationsvollständige Kalkül ist vollständig.
I
Nicht jeder widerspruchsfreie Kalkül ist korrekt.
Alle formalen Systeme basieren auf demselben Kerngedanken, Theoreme durch die Anwendung fest definierter Schlussregeln aus den Axiomen herzuleiten. Erst aus der Nähe betrachtet werden die großen Unterschiede in ihren Erscheinungsformen sichtbar. Einige Kalküle, zu denen auch die bisher besprochenen gehören, besitzen wenige Axiome und erlangen ihre Aussagekraft durch ein umfangreiches Repertoire an Schlussregeln. Andere sind reich an Axiomen und kommen dafür mit wenigen Schlussregeln aus. Nicht selten verfügen solche Kalküle über unendlich viele Axiome, die aus einem oder mehreren Axiomenschemata erzeugt werden. Was wir darunter im Detail zu verstehen haben, klärt ein Blick auf Tabelle 2.4. Der dargestellte Kalkül E6 verfügt neben dem bekannten Axiom (A1) über sieben Schemata, aus denen eine unendliche Anzahl weiterer Axiome gewonnen werden kann. Dagegen gibt es mit dem Modus
81
2.1 Definition und Eigenschaften
ponens (MP) nur noch eine einzige Schlussregel. Ein direkter Vergleich zwischen E6 und dem vollständigen und korrekten Kalkül E4 zeigt, dass zwischen beiden zwar ein struktureller, aber kein inhaltlicher Unterschied besteht. In beiden Kalkülen lassen sich ausnahmslos die gleichen Theoreme ableiten. I
Beispiel 1: Ableitung von (s(s(s(s(0)))) > s(s(0)))
1. 2. 3. 4.
(0 = 0) (0 = 0) → (s(0) = s(0)) (s(0) = s(0)) (s(0) = s(0)) → (s(s(0)) = s(s(0)))
5. (s(s(0)) = s(s(0))) 6. (s(s(0)) = s(s(0))) → (s(s(s(0))) > s(s(0))) 7. (s(s(s(0))) > s(s(0))) 8. (s(s(s(0))) > s(s(0))) → (s(s(s(s(0)))) > s(s(0))) 9. (s(s(s(s(0)))) > s(s(0))) I
Beispiel 2: Ableitung von ¬(s(s(0)) = s(s(s(0))))
1. 2. 3. 4. 5.
(0 = 0) (0 = 0) → (s(0) = s(0)) (s(0) = s(0)) (s(0) = s(0)) → (s(s(0)) = s(s(0))) (s(s(0)) = s(s(0)))
6. (s(s(0)) = s(s(0))) → (s(s(s(0))) > s(s(0))) 7. (s(s(s(0))) > s(s(0))) 8. (s(s(s(0))) > s(s(0))) → ¬(s(s(0)) = s(s(s(0)))) 9. ¬(s(s(0)) = s(s(s(0))))
(A1) (A2) (MP, 1,2) (A2) (MP, 3,4) (A3) (MP, 5,6) (A4) (MP, 7,8)
Axiome (Kalkül E6 ) (0 = 0)
(A1)
(σ = σ ) → (s(σ ) = s(σ )) (A2) (σ = σ ) → (s(σ ) > σ )
(A3)
(σ > τ) → (s(σ ) > τ)
(A4)
(σ > τ) → ¬(σ = τ)
(A5)
(σ > τ) → ¬(τ = σ )
(A6)
(σ > τ) → ¬(τ > σ )
(A7)
(σ = τ) → ¬(τ > σ )
(A8)
Schlussregeln (Kalkül E6 ) (A1) (A2) (MP, 1,2) (A2) (MP, 3,4) (A3) (MP, 5,6) (A6) (MP, 7,8)
In der Tat sind die meisten Kalküle, die wir später kennen lernen werden, in dieser Form gestaltet. Die Beziehungen zwischen den untersuchten Objekten werden in den Axiomen codiert sein und nicht in den Schlussregeln. Der gewählte Ansatz besticht vor allem durch seine Allgemeinheit. Gleichgültig, ob wir es später mit der Zahlentheorie, der Mengenlehre oder einem anderen Gebiet der Mathematik zu tun haben werden: Der formale Schlussapparat bleibt stets der gleiche. Um welche Schlussregeln es sich hierbei im Detail handelt, werden wir in den Abschnitten 2.3 und 2.4 herausarbeiten. Dort werden wir mit der
σ,σ → τ τ
(MP)
Tabelle 2.4: Axiome und Schlussregeln des Kalküls E6
82
2 Formale Systeme
Aussagenlogik und der Prädikatenlogik den Standardapparat des formalen logischen Schließens ausführlich besprechen. An dieser Stellen wollen wir den Begriff des formalen Systems noch um einen wichtigen Baustein ergänzen. Die Rede ist von Annahmen, die in der klassischen Mathematik in den verschiedensten Formen gemacht werden und nicht notwendigerweise selbst wahr sein müssen. Um auch Aussagen der Form „Unter der Annahme, dass M gilt, folgt . . . “ mithilfe eines formalen Systems modellieren zu können, erlauben wir, einen Beweis um eine Menge von Voraussetzungen zu ergänzen. In diesem erweiterten Kalkül ist ein Beweis eine Kette von Formeln ϕ1 , ϕ2 , . . . , ϕn , die nach den folgenden Konstruktionsregeln gebildet wird: I
ϕi ist ein Axiom oder
I
ϕi ist eine Voraussetzung oder
I
ϕi entsteht aus den vorangegangenen Gliedern der Beweiskette durch die Anwendung einer Schlussregel.
Bezeichnet M die Menge der Voraussetzungen, so schreiben wir M ϕ, falls sich die Formel ϕ mit den beschriebenen Konstruktionsregeln ableiten lässt. Mit dieser Notation können wir den weiter oben eingeführten Ausdruck ϕ als abkürzende Schreibweise für 0/ ϕ auffassen. Offenbar gelten die folgenden Beziehungen: Satz 2.4 I
{ϕ} ∪ M ϕ
I
Aus M ⊂ N und M ϕ folgt N ϕ
I
Aus M ϕ1 , . . . , M ϕn und {ϕ1 , . . . , ϕn } ϕ folgt M ϕ
I
M ϕ ⇔ für eine endliche Teilmenge M ⊆ M gilt M ϕ
Die Korrektheit der ersten drei Aussagen folgt unmittelbar aus den oben genannten Konstruktionsregeln. Einzig die letzte Aussage verdient unsere Beachtung. Sie gilt, da jeder Beweis aus einer endlichen Kette von Formeln besteht. Das bedeutet, dass wir M ganz einfach aus einem vorliegenden Beweis konstruieren können, indem wir alle verwendeten Voraussetzungen aufsammeln. Die endliche Anzahl von Beweisschritten stellt dann sicher, dass auch M endlich ist.
2.2 Entscheidungsverfahren
2.2
83
Entscheidungsverfahren „Das Entscheidungsproblem ist gelöst, wenn man ein Verfahren kennt, das bei einem vorgelegten logischen Ausdruck durch endlich viele Operationen die Entscheidung über die Allgemeingültigkeit bzw. Erfüllbarkeit erlaubt. [...] Das Entscheidungsproblem muss als das Hauptproblem der mathematischen Logik bezeichnet werden“ David Hilbert, Wilhelm Ackermann (Abb. 2.2) [85]
In Abschnitt 2.1 haben wir anhand mehrerer Beispiele die elementaren Eigenschaften formaler Systeme herausgearbeitet. Wie die Sprache, die Axiome oder die Schlussregeln eines Kalküls prinzipiell aussehen dürfen, haben wir bisher noch nicht exakt festgelegt und müssen es auch gar nicht. Für alle Betrachtungen, die nun folgen werden, ist es völlig ausreichend, wenn die untersuchten Kalküle die folgenden Minimaleigenschaften erfüllen: I
Die Anzahl der verwendeten Alphabetzeichen ist endlich.
I
Für jede Zeichenkette lässt sich entscheiden, ob sie eine Formel ist.
I
Für jede Formelfolge lässt sich entscheiden, ob sie ein Beweis ist.
Es bedarf einer gehörigen Portion destruktiven Scharfsinns, um ein formales System zu ersinnen, das diese Eigenschaften nicht erfüllt. Ausgeschlossen werden lediglich pathologische Konstrukte, in denen z. B. unendlich lange Beweisketten zugelassen sind oder ein endliches Symbolalphabet nicht ausreicht, um alle Formeln niederzuschreiben. Mit der getroffenen Vereinbarung sind wir gerüstet, um auf ein zentrales Problem des Hilbert’schen Programms zurückzukommen: Wilhelm Friedrich Ackermann (1896 – 1962)
Definition 2.3 (Entscheidungsproblem, syntaktisch) Die syntaktische Variante des Entscheidungsproblems lautet: I
Gegeben: ein Kalkül K und eine Formel ϕ
I
Gefragt: Gilt ϕ ?
Abbildung 2.2: Der deutsche Mathematiker Wilhelm Ackermann gehörte zu den bekanntesten Schülern von David Hilbert. Heute wird sein Name vor allem mit der Ackermann-Funktion verbunden, die uns in Kapitel 4 beschäftigen wird.
84
2 Formale Systeme
Ist die Formel φ = (s(s(0)) > s(0)) beweisbar?
(0 = 0)
(s(0) = s(0))
Um das Entscheidungsproblem zu lösen, müssen wir ein systematisches Verfahren ersinnen, das für jede Formel ϕ immer korrekt beantworten kann, ob ϕ ein Theorem ist, d. h., ob sich ϕ durch die Anwendung endlich vieler Schlussregeln aus den Axiomen ableiten lässt. Ein solches Verfahren heißt Entscheidungsverfahren. Für Hilbert war die Suche nach einem Entscheidungsverfahren ein zentraler Baustein seines Programms. In Kapitel 5 werden wir zeigen, warum Hilberts Traum für weite Teile der Mathematik niemals Realität werden konnte, doch bevor wir dieses negative Resultat im Detail diskutieren, wollen wir ein positives vorausschicken: Satz 2.5
(0 = 0)
(s(0) > 0)
(s(s(0)) = s(s(0))) (s(0) = s(0)) (0 = 0)
(s(s(0)) > s(0)) (s(s(0)) > 0) ¬(s(0) = 0) (s(0) > 0) ¬(0 = s(0)) ¬(0 > s(0))
Abbildung 2.3: Bottom-up-Entscheidungsverfahren für negationsvollständige und widerspruchsfreie Kalküle. Ausgehend von den Axiomen werden durch die sukzessive Anwendung der Ableitungsregeln so lange neue Theoreme erzeugt, bis ϕ oder ¬ϕ darunter ist.
Jeder widerspruchsfreie, negationsvollständige Kalkül besitzt ein Entscheidungsverfahren. Ob eine vorgelegte Formel ϕ in einem widerspruchsfreien und negationsvollständigen Kalkül bewiesen werden kann, kann auf ganz unterschiedlichem Wege entschieden werden. Abhängig von der Vorgehensweise sprechen wir von einem Bottom-up-Verfahren oder von einem Top-down-Verfahren: I
Bottom-up-Entscheidungsverfahren (Abbildung 2.3) Um zu entscheiden, ob eine Formel ϕ bewiesen werden kann, prüfen wir zunächst, ob sich ϕ oder ¬ϕ unter den Axiomen befindet. Ist dies nicht der Fall, erzeugen wir durch die Anwendung der Schlussregeln neue Theoreme. Wenden wir die Regeln in jedem Schritt auf ausnahmslos alle der bisher generierten Formeln an, so erhalten wir nach dem n-ten Schritt exakt diejenigen Theoreme, die in höchstens n Ableitungsschritten aus den Axiomen deduziert werden können. Die geschilderte Prozedur führen wir nun so lange durch, bis entweder die Formel ϕ oder die Formel ¬ϕ unter den Theoremen auftaucht. Da in einem negationsvollständigen Kalkül mindestens eine dieser Formeln abgeleitet werden kann, terminiert das Verfahren nach endlich vielen Schritten. Das Bottom-up-Verfahren scheint uns auf direktem Weg zum Ziel zu führen, und für Kalküle mit einer endlichen Axiomenmenge und einer endlichen Anzahl von Schlussregeln ist dies auch tatsächlich der Fall. Für diese Kalküle haben wir ein einfaches Verfahren zur Hand, mit dem wir in endlicher Zeit entscheiden können, ob eine Formel ϕ beweisbar ist oder nicht. Komplizierter wird die Situation dann,
85
2.2 Entscheidungsverfahren
wenn die Axiome als Schemata ausgelegt sind, die mit beliebigen Teilausdrücken instanziert werden dürfen. In diesem Fall müssten wir mit einer unendlichen Anzahl an Axiomen beginnen. Ebenfalls denkbar ist, dass die Schlussregeln schematisch definiert sind. Dann wäre es möglich, dass in einem einzigen Schritt unendlich viele neue Theoreme entstehen. Für solche Kalküle könnten wir das geschilderte Verfahren zunächst nicht anwenden. Dennoch lassen sich auch solche Kalküle entscheiden, z. B. mit dem Top-Down-Verfahren. Dieses ist so allgemein gehalten, dass es ohne Nachdenken auf jeden Kalkül anwendbar ist, der die oben formulierten Minimaleigenschaften erfüllt. I
Ist die Formel φ = (s(s(0)) > s(0)) beweisbar?
φ = (s(s(0)) > s(0)) Nein
Erzeuge eine neue Zeichenkette aus den Symbolen der Kalkülsprache
Top-down-Entscheidungsverfahren (Abbildung 2.4) Um zu entscheiden, ob eine Formel ϕ beweisbar ist, gehen wir folgendermaßen vor:
• Alle Zeichenketten, die mit Symbolen der Kalkülsprache aufgebaut sind, werden der Reihe nach aufgezählt. Eine einfache Möglichkeit besteht darin, zunächst die Zeichenketten der Länge 1 aufzuzählen, danach die Zeichenketten der Länge 2 und so fort. Da wir nur endlich viele Alphabetzeichen zulassen, muss jede Zeichenkette irgendwann in der Aufzählung erscheinen.
• Alle Zeichenketten, die keiner Formelfolge entsprechen, werden
wird geprüft, ob die letzte Formel gleich ϕ oder gleich ¬ϕ ist. Im ersten Fall ist bewiesen, dass ϕ ein Theorem ist, im zweiten Fall, dass ϕ kein Theorem ist. Die Negationsvollständigkeit stellt sicher, dass für mindestens eine der beiden Formeln ein Beweis existiert und der Algorithmus damit für jede Eingabe terminiert.
Die Forderung der Widerspruchsfreiheit ist essentiell für das Funktionieren beider Verfahren, da wir in einem widersprüchlichen Kalkül aus der Ableitbarkeit von ¬ϕ nicht auf die Nichtableitbarkeit von ϕ schließen können. Das bedeutet, dass wir in einem potenziell widersprüchlichen Kalkül nicht abbrechen dürfen, wenn ein Beweis für ¬ϕ gefunden wurde. Es wäre durchaus möglich, dass zu einem späteren Zeitpunkt auch ein Beweis für ϕ auftaucht. ϕ wäre dann ebenfalls ein Theorem.
Ist die Zeichenkette ein Beweis? Ja Ist die letzte Formel gleich φ ?
Ja
Nein Ist die letzte Formel gleich ¬ φ ?
φ
⊥
• Für jede gefundene Zeichenkette, die einem Beweis entspricht,
Ja
⊥
verworfen. Das gleiche gilt für Formelfolgen, die keine Beweise sind. Die Wahrscheinlichkeit, dass eine zufällig gebildete Zeichenkette diese Überprüfungsschritte übersteht, ist denkbar gering. Dennoch stellt die systematische Aufzählung sicher, dass jeder Beweis, unabhängig von seiner Komplexität, irgendwann einmal erscheinen wird.
Ist die Zeichenkette eine Formelfolge?
φ
Ja
Abbildung 2.4: Top-down-Entscheidungsverfahren für negationsvollständige und widerspruchsfreie Kalküle
86
2 Formale Systeme
An dieser Stelle wollen wir ein wenig Sand in unser Begriffsgetriebe streuen und das Eingangszitat von Hilbert und Ackermann betrachten. Ist Ihnen aufgefallen, dass der Begriff der Beweisbarkeit dort an keiner Stelle erwähnt wird? Tatsächlich haben Hilbert und Ackermann das Entscheidungsproblem gar nicht auf der syntaktischen, sondern auf der semantischen Ebene definiert. Definition 2.4 (Entscheidungsproblem, semantisch) Die semantische Variante des Entscheidungsproblems lautet: I
Gegeben: eine Formel ϕ
I
Gefragt: Gilt |= ϕ ?
Diese Definition entspricht der historischen Formulierung. Beide Varianten des Entscheidungsproblems besagen inhaltlich etwas anderes, und wir tun im Allgemeinen gut daran, sie wohl voneinander zu unterscheiden. Eine Ausnahme liegt dann vor, wenn wir einen korrekten und vollständigen Kalkül vor uns haben. In diesem Fall gilt die Beziehung ϕ ⇔ |= ϕ, so dass wir jedes Entscheidungsverfahren für die syntaktische Ebene ohne Änderung einsetzen können, um das semantische Entscheidungsproblem zu lösen. Satz 2.6 Mit einem korrekten und vollständigen Kalkül lässt sich das semantische Entscheidungsproblem lösen.
Wir haben gesehen, dass die Unterschiede zwischen der syntaktischen und der semantischen Ebene verschwinden, wenn wir einen korrekten und vollständigen Kalkül vor uns haben. Ein Kalkül, auf den das zutrifft, ist die Prädikatenlogik erster Stufe, die wir in Abschnitt 2.4 behandeln werden, und auf genau diesen Kalkül bezieht sich auch der Originalwortlaut von Hilbert und Ackermann. Hier spielt es keine Rolle, ob wir das Entscheidungsproblem auf der semantischen oder auf der syntaktischen Ebene formulieren. Dies ist der Grund, warum wir ab jetzt nur noch ganz allgemein von dem (Hilbert’schen) Entscheidungsproblem sprechen werden.
87
2.3 Aussagenlogik
2.3
Aussagenlogik
Die Aussagenlogik (PL0) beschäftigt sich mit atomaren Aussagen, die entweder wahr oder falsch sein können, und den Beziehungen, die zwischen solchen Aussagen bestehen („Es regnet“, „Die Straße ist nass“, „Wenn es regnet, dann ist die Straße nass“). Die Bedeutung der Aussagenlogik ist beträchtlich. Sie ist als Teilmenge in nahezu allen formalen Schlussapparaten enthalten und damit der kleinste gemeinsame Nenner, über den alle Logiken miteinander verbunden sind.
2.3.1
Syntax und Semantik
Genau wie im Fall der Beispielkalküle aus Abschnitt 2.1 nähern wir uns der Aussagenlogik in zwei Schritten. Wir beginnen mit der Definition der Syntax und legen im Anschluss daran die Semantik fest.
Definition 2.5 (Syntax der Aussagenlogik) Die Menge der aussagenlogischen Formeln über dem Variablenvorrat V = {A1 , A2 , A3 , . . .} ist rekursiv definiert: I
0 und 1 sind Formeln.
I
Jede Variable aus der Menge V ist eine Formel.
I
Sind ϕ und ψ Formeln, dann sind es auch
In Definition 2.5 haben wir die logischen Operatoren in der Schreibweise angegeben, die im deutschen Sprachraum heute üblich ist. Tabelle 2.5 zeigt, dass die verwendeten Symbole auf den deutschen Mathematiker Hans Hermes zurückgehen [79]. Es ist keine Besonderheit, dass sich die ursprünglich verwendete Notation im Laufe der Zeit weiterentwickelt hat, wohl aber die Geschwindigkeit, mit der sich die Veränderung vollzog. Die Gründe hierfür sind vielfältig. Zum einen betraten die Protagonisten der ersten Stunde unbeflecktes Neuland, und eine passende Notation stand nicht griffbereit zur Seite. Zum anderen waren viele Mathematiker der Überzeugung, ihre neuartigen Ideen nur in einer eigens dafür geschaffenen Sprache formulieren zu können. Die babylonische Sprachverwirrung macht uns das Leben heute nicht leicht. Auf frisch ausgebildete Mathematiker wirken die historischen Arbeiten aus dem Bereich der Logik oft fremdartig und sind ohne eine aufwendige Einarbeitung in die damals verwendete Nomenklatur kaum noch zu lesen.
∪
Russell
∼ϕ
∨
Hilbert
ϕ
∨
Hermes
¬ϕ
∨
Äquivalenz
−ϕ
Implikation
Peano
Konjunktion
Eine Formel, die lediglich aus einem Wahrheitswert oder einer aussagenlogischen Variablen besteht, heißt atomar. Sie besitzt die Eigenschaft, dass sie nicht weiter zerlegt werden kann. Eine Formel ϕ, die als Teil einer anderen Formel ψ vorkommt, bezeichnen wir als Teilformel von ψ und verwenden hierfür die etwas informelle Notation ϕ ∈ ψ. Ist ϕ keine Teilformel von ψ, so schreiben wir ϕ ∈ ψ. Variablen werden im Folgenden durchweg mit Großbuchstaben bezeichnet, allerdings
Disjunktion
Der Operator ‚¬‘ ist die Negation, ‚∧‘ die Konjunktion (UNDOperator), ‚∨‘ die Disjunktion (ODER-Operator) und ‚→‘ die Implikation. Ferner bezeichnen wir ‚↔‘ als Äquivalenz- und ‚‘ als Antivalenzoperator (XOR-Operator).
Negation
(¬ϕ), (ϕ ∧ ψ), (ϕ ∨ ψ), (ϕ → ψ), (ϕ ↔ ψ), (ϕ ψ)
∩
I
=
⊃
≡
&
→
∼
∧
→
↔
Tabelle 2.5: Alternative Schreibweisen der aussagenlogischen Operatoren [119]
88
2 Formale Systeme
I Bindungsregeln (Beispiele)
¬A ∧ B =
((¬A) ∧ B) A∨B∧C =
(A ∨ (B ∧ C)) A → C∨B =
(A → (C ∨ B)) A→BC =
((A → B) C) AB→C =
((A B) → C) I Kettenregeln (Beispiele)
¬¬A =
(¬(¬A)) A∧B∧C =
((A ∧ B) ∧ C) A∨B∨C =
((A ∨ B) ∨ C) A→B→C =
((A → B) → C) A↔B↔C =
((A ↔ B) ↔ C) ABC =
((A B) C)
Abbildung 2.5: Zur Vereinfachung der Schreibweise dürfen Klammerpaare weggelassen werden. Zweideutigkeiten werden mithilfe von Bindungs- und Kettenregeln beseitigt. Erstere teilen die Operatoren in schwächer bindende und stärker bindende Operatoren ein, Letztere regeln den Umgang mit Ausdrücken, in denen der gleiche Operator mehrmals hintereinander vorkommt.
werden wir von Fall zu Fall den Symbolvorrat anpassen und z. B. A, B, C anstelle von A1 , A2 , A3 verwenden. Ferner werden wir auf die Niederschrift des einen oder anderen Klammerpaars verzichten, wenn eine Formel hierdurch leichter lesbar wird. Wie in Abbildung 2.5 gezeigt, legen wir die übliche Konvention zugrunde, dass die Negation ‚¬‘ stärker bindet als die Konjunktion ‚∧‘ und diese wiederum stärker als die Disjunktion ‚∨‘. Die Operatoren ‚→‘, ‚↔‘ und ‚‘ binden am schwächsten; kommen sie in einem Ausdruck gemischt vor, so erfolgt die Klammerung linksassoziativ. Werden Teilterme mit demselben Operator verknüpft, so betrachten wir die entstehende Kette ebenfalls als linksassoziativ geklammert. Die einzige Ausnahme bildet der (einstellige) Negationsoperator, der rechtsassoziativ gruppiert wird. Die zweistelligen Operatoren ‚∧‘ und ‚∨‘ lassen sich zu mehrstelligen Operatoren verallgemeinern. Hierzu vereinbaren wir für die endlich vielen Formeln ϕ1 , . . . , ϕn die folgende Schreibweise: n
ϕi
:= ϕ1 ∧ . . . ∧ ϕn
i=1
n
ϕi
:= ϕ1 ∨ . . . ∨ ϕn
i=1
Nachdem wir den syntaktischen Aufbau einer Formel vollständig fixiert haben, wollen wir im nächsten Schritt die Semantik der Aussagenlogik festlegen. Hierzu werden wir vorab klären, was sich hinter dem bereits mehrfach zitierten Begriff der Interpretation genau verbirgt, und im Anschluss daran die Modellrelation ‚|=‘ definieren.
Definition 2.6 (Interpretation) Sei ϕ eine aussagenlogische Formel. A1 , . . . , An bezeichnen die in ϕ vorkommenden Variablen. Dann heißt jede Abbildung I : {A1 , . . . , An } → {0, 1} eine Interpretation von ϕ.
Eine Interpretation ordnet jeder Variablen einer aussagenlogischen Formel ϕ einen der beiden Wahrheitswerte 0 oder 1 zu und wird aufgrund dieser Eigenschaft auch als Belegung bezeichnet. Mit dem Begriff der Interpretation haben wir die Grundlage geschaffen, um die Semantik der Aussagenlogik formal zu definieren:
89
2.3 Aussagenlogik
Definition 2.7 (Semantik der Aussagenlogik) ϕ und ψ seien aussagenlogische Formeln und I eine Interpretation. Die Semantik der Aussagenlogik ist durch die Modellrelation ‚|=‘ gegeben, die induktiv über dem Formelaufbau definiert ist: I |= 1 I |= 0 I |= Ai I |= (¬ϕ) I |= (ϕ ∧ ψ) I |= (ϕ ∨ ψ) I |= (ϕ → ψ) I |= (ϕ ↔ ψ) I |= (ϕ ψ)
:⇔ :⇔ :⇔ :⇔ :⇔ :⇔ :⇔
I(Ai ) = 1 I |= ϕ I |= ϕ und I |= ψ I |= ϕ oder I |= ψ I |= ϕ oder I |= ψ I |= ϕ → ψ und I |= ψ → ϕ I |= (ϕ ↔ ψ)
Eine Interpretation I mit I |= ϕ heißt Modell für ϕ.
Abbildung 2.6 demonstriert den Semantikbegriff an einem konkreten Beispiel. Wir können jede aussagenlogische Formel ϕ mit n Variablen als eine boolesche Funktion f ϕ : {0, 1}n → {0, 1} auffassen, die für eine Belegung I genau dann den Funktionswert 1 annimmt, wenn I ein Modell für ϕ ist. Mit anderen Worten: Weist I den Variablen A1 , . . . , An die Wahrheitswerte a1 , . . . , an zu, dann ist der Funktionswert fϕ (a1 , . . . , an ) wie folgt gegeben: 1 falls I |= ϕ fϕ (a1 , . . . , an ) := 0 falls I |= ϕ Aufgrund des diskreten Definitionsbereichs lässt sich eine n-stellige boolesche Funktion als Wahrheitstabelle darstellen, in der alle möglichen Kombinationen der Argumente A1 , . . . , An zusammen mit dem zugeordneten Funktionswert zeilenweise aufgelistet sind (Abbildung 2.7). Wahrheitstabellen werden in der Literatur auch als Wahrheitstafeln oder Funktions(wert)tabellen bezeichnet. Abbildung 2.8 zeigt, wie sich Wahrheitstafeln für zusammengesetzte Ausdrücke erzeugen lassen. Ausgehend von den Elementaraussagen werden zunächst die Teilformeln und anschließend der Gesamtausdruck ausgewertet. Die drei Beispiele wurden ganz bewusst ausgewählt und
I 1. Interpretation: I(A) = 0, I(B) = 0
( A → B )→( B → A ) |= A |= B |= B |= A
|= A → B |= B → A
|= (A → B) → (B → A) I 2. Interpretation: I(A) = 0, I(B) = 1
( A → B )→( B → A ) |= A |= B |= B |= A
|= A → B |= B → A
|= (A → B) → (B → A) I 3. Interpretation: I(A) = 1, I(B) = 0
( A → B )→( B → A ) |= A |= B |= B |= A
|= A → B |= B → A
|= (A → B) → (B → A) I 4. Interpretation: I(A) = 1, I(B) = 1
( A → B )→( B → A ) |= A |= B |= B |= A
|= A → B |= B → A
|= (A → B) → (B → A) Abbildung 2.6: Eine Interpretation I ordnet jeder aussagenlogischen Variablen einen der beiden Wahrheitswerte 0 (falsch) oder 1 (wahr) zu, hier demonstriert am Beispiel der Formel ϕ = (A → B) → (B → A).
90
2 Formale Systeme
ϕ = ¬A ϕ A
ϕ = A∧B ϕ A B
ϕ = A∨B ϕ A B
0
1
0
0
0
0
0
0
1
0
0
1
0
0
1
1
1
0
0
1
0
1
1
1
1
1
1
1
Negation
Abbildung 2.7: Wahrheitstafeln der aussagenlogischen Operatoren
Konjunktion
Disjunktion
ϕ =A→B ϕ A B
ϕ =A↔B ϕ A B
ϕ =AB ϕ A B
0
0
1
0
0
1
0
0
0
0
1
1
0
1
0
0
1
1
1
0
0
1
0
0
1
0
1
1
1
1
1
1
1
1
1
0
Implikation
Äquivalenz
Antivalenz
stehen stellvertretend für drei wichtige Formelklassen. ϕ1 ist so beschaffen, dass sie genau dann wahr ist, wenn A wahr oder B falsch ist. In der Terminologie der Aussagenlogik wird ϕ1 als erfüllbare Formel bezeichnet. ϕ2 ist ebenfalls erfüllbar, besitzt aber im Gegensatz zu ϕ1 die Eigenschaft, dass sie unabhängig vom Wahrheitswert der Elementaraussagen immer wahr ist. Solche Formeln heißen allgemeingültig. In entsprechender Weise bezeichnen wir ϕ3 als unerfüllbare Formel, da sie niemals wahr werden kann. Formal halten wir das Gesagte in der folgenden Definition fest: Definition 2.8 (Erfüllbarkeit, Allgemeingültigkeit) Eine aussagenlogische Formel ϕ heißt I
erfüllbar, falls ϕ mindestens ein Modell besitzt,
I
unerfüllbar, falls ϕ kein Modell besitzt,
I
allgemeingültig, falls ¬ϕ unerfüllbar ist.
Eine allgemeingültige Formel bezeichnen wir auch als Tautologie. Abbildung 2.9 demonstriert, wie die unterschiedlichen Formelklassen zusammenhängen.
91
2.3 Aussagenlogik
Alle Begriffe aus Definition 2.8 lassen sich auf Mengen von aussagenlogischen Formeln erweitern. Eine Menge M = {ϕ1 , . . . , ϕn } heißt erfüllbar, wenn eine Interpretation I existiert, die für alle ϕi ∈ M ein Modell ist. Die Unerfüllbarkeit und Allgemeingültigkeit von Formelmengen definieren wir analog. M ist unerfüllbar, wenn ϕ1 , . . . , ϕn kein gemeinsames Modell besitzen. Ist dagegen jede Interpretation ein Modell für die Elemente von M, so nennen wir M allgemeingültig. Mit der Modellrelation in Händen sind wir gerüstet, um den Begriff der logischen Folgerung formal zu definieren:
I ϕ1 := (A → B) → (B → A)
ψ1
Seien ϕ1 , . . . , ϕn , ψ aussagenlogische Formeln. Wir schreiben {ϕ1 , . . . , ϕn } |= ψ, wenn jedes Modell von {ϕ1 , . . . , ϕn } auch ein Modell von ψ ist.
B
ψ1
ψ2
ϕ1
0
0
1
1
1
0
1
1
0
0
1
0
0
1
1
1
1
1
1
1
I ϕ2 := (A ∨ B) → (B ∨ A)
ψ4
A
B
ψ3
ψ4
ϕ2
0
0
0
0
1
0
1
1
1
1
1
0
1
1
1
1
1
1
1
1
I ϕ3 := (A ∨ ¬A) → (B ∧ ¬B)
ψ5
Vereinbaren wir zusätzlich die beiden Kurzschreibweisen |= ψ ϕ |= ψ
für 0/ |= ψ für {ϕ} |= ψ
ψ2
A
ψ3
Definition 2.9 (Logische Folgerung)
ψ6
A
B
ψ5
ψ6
ϕ3
0
0
1
0
0
0
1
1
0
0
1
0
1
0
0
1
1
1
0
0
so sind die folgenden Zusammenhänge offensichtlich: Abbildung 2.8: Wahrheitstafeln zusammengesetzter Formeln
I
|= ψ gilt genau dann, wenn ψ allgemeingültig ist.
I
ϕ |= ψ gilt genau dann, wenn ϕ → ψ allgemeingültig ist.
I
{ϕ1 , ϕ2 , . . . , ϕn } |= ψ gilt genau dann, wenn {ϕ2 , . . . , ϕn } |= ϕ1 → ψ. Spiegelachse
Erfüllbar
φ
Allgemeingültig (Tautologien)
ψ
¬ψ
Erfüllbar, aber nicht allgemeingültig
¬φ
Unerfüllbar
Abbildung 2.9: Das Spiegelungsprinzip visualisiert, wie sich die Eigenschaften der Formeln ϕ und ¬ϕ gegenseitig beeinflussen. Ist ϕ allgemeingültig, so ist ¬ϕ unerfüllbar. Ist ϕ nicht allgemeingültig, aber dennoch erfüllbar, so gilt das Gleiche für ¬ϕ. Damit ist die Allgemeingültigkeit eine exklusive Eigenschaft, die nur eine der beiden Formeln ϕ oder ¬ϕ erfüllen kann. Im Gegensatz hierzu können sowohl ϕ als auch ¬ϕ erfüllbar sein.
92
I
Kommutativgesetze ϕ ∧ψ ≡ ψ ∧ϕ ϕ ∨ψ ≡ ψ ∨ϕ
I
Distributivgesetze ϕ ∧ (ψ ∨ χ) ≡ (ϕ ∧ ψ) ∨ (ϕ ∧ χ) ϕ ∨ (ψ ∧ χ) ≡ (ϕ ∨ ψ) ∧ (ϕ ∨ χ)
I
Neutrale Elemente ϕ ∧1 ≡ ϕ ϕ ∨0 ≡ ϕ
I
Inverse Elemente ϕ ∧ ¬ϕ ≡ 0 ϕ ∨ ¬ϕ ≡ 1
I
Assoziativgesetze (ϕ ∧ ψ) ∧ χ ≡ ϕ ∧ (ψ ∧ χ) (ϕ ∨ ψ) ∨ χ ≡ ϕ ∨ (ψ ∨ χ)
I
Idempotenzgesetze ϕ ∧ϕ ≡ ϕ ϕ ∨ϕ ≡ ϕ
I
Absorptionsgesetze (ϕ ∧ ψ) ∨ ϕ ≡ ϕ (ϕ ∨ ψ) ∧ ϕ ≡ ϕ
I
De Morgan’sche Regeln ¬(ϕ ∧ ψ) ≡ ¬ϕ ∨ ¬ψ ¬(ϕ ∨ ψ) ≡ ¬ϕ ∧ ¬ψ
I
Eliminationsgesetze ϕ ∧0 ≡ 0 ϕ ∨1 ≡ 1
I
Doppelnegationsgesetz ¬¬ϕ ≡ ϕ
Abbildung 2.10: Grundlegende Äquivalenzen aussagenlogischer Ausdrücke
2 Formale Systeme
In den kommenden Betrachtungen wird der Begriff der Äquivalenz immer wieder auftauchen: Definition 2.10 (Äquivalenz) Seien ϕ und ψ zwei aussagenlogische Formeln. Die Relation ’≡’ ist wie folgt definiert: ϕ ≡ ψ :⇔ ϕ |= ψ und ψ |= ϕ Zwei Formeln ϕ und ψ mit ϕ ≡ ψ heißen äquivalent. In Worten ausgedrückt, sind zwei Formeln ϕ und ψ genau dann äquivalent, wenn sie exakt dieselben Modelle besitzen. In Abbildung 2.10 sind wichtige Äquivalenzen zusammengefasst, die sich durch das Aufstellen von Wahrheitstafeln leicht verifizieren lassen. Vielleicht haben Sie sich gewundert, dass Abbildung 2.10 ausschließlich Formeln enthält, in denen die aussagenlogischen Elementaroperatoren ‚¬‘, ‚∧‘ und ‚∨‘ vorkommen. Dies ist der Tatsache geschuldet, dass sich alle anderen auf diese drei zurückführen lassen. Es ist ϕ → ψ ≡ ¬ϕ ∨ ψ ϕ ↔ ψ ≡ (¬ϕ ∨ ψ) ∧ (ϕ ∨ ¬ψ) ϕ ψ ≡ (¬ϕ ∨ ¬ψ) ∧ (ϕ ∨ ψ) Genauso gut können wir uns aufgrund der Äquivalenzen ϕ ∧ ψ ≡ ¬(ϕ → ¬ψ) ϕ ∨ ψ ≡ ¬ϕ → ψ ϕ ∧ ψ ≡ ¬(¬ϕ ∨ ¬ψ) ϕ ∨ ψ ≡ ¬(¬ϕ ∧ ¬ψ) auf eine der Mengen {¬, →}, {¬, ∨} oder {¬, ∧} beschränken und die jeweils anderen Operatoren als syntaktische Abkürzungen für komplexere Formeln interpretieren. Im nächsten Abschnitt werden wir diesen Umstand ausnutzen und einen Kalkül vorstellen, in dem ausschließlich Operatoren aus der Menge {¬, →} genannt werden. Der Ausschluss der anderen logischen Verknüpfungen ist keine Beschränkung im eigentlichen Sinne, da wir gerade gezeigt haben, dass sich alle aussagenlogischen Operatoren auf die Negation und die Implikation zurückführen lassen.
93
2.3 Aussagenlogik
2.3.2
Aussagenlogischer Kalkül
In Abschnitt 2.3.1 haben wir die Semantik der Aussagenlogik über die Modellrelation ‚|=‘ festgelegt. Wir wollen nun ein formales System einführen, in dem sich alle allgemeingültigen Formeln, und nur diese, aus den Axiomen ableiten lassen. Wie wir es mittlerweile gewohnt sind, erfolgt die Ableitung ausschließlich auf der syntaktischen Ebene. Das bedeutet, dass wir zum Beweis einer Aussage nichts über Interpretationen, Modelle oder andere Begriffe wissen müssen, die sich mit den semantischen Eigenschaften von Formeln beschäftigen. Die Axiome und Schlussregeln des aussagenlogischen Kalküls sind in Tabelle 2.6 zusammengefasst. Das erste Axiom stellt sicher, dass aus jeder Aussage ϕ die schwächere Aussage ψ → ϕ gefolgert werden kann und wird aus diesem Grund als Abschwächungsregel bezeichnet. Das zweite Axiom drückt die Distributivitätseigenschaft des Implikationsoperators aus. Das dritte und letzte Axiom ist die logische Kontraposition – ein Schlussprinzip, das wir tagtäglich einsetzen. Es besagt, dass wir die logische Schlussrichtung umdrehen können, wenn wir die Argumente verneinen („Wenn es regnet, dann ist die Straße nass“ ist gleichbedeutend mit „Wenn die Straße nicht nass ist, dann regnet es nicht“). Innerhalb des Kalküls existiert mit dem Modus ponens eine einzige Schlussregel, mit der neue Sätze abgeleitet werden können. Diese Regel ist uns intuitiv vertraut. Sie garantiert, dass eine Aussage ψ wahr sein muss, wenn wir wissen, dass ϕ wahr ist und ψ aus ϕ gefolgert werden kann.
Axiome ϕ → (ψ → ϕ)
(A1)
(ϕ → (ψ → χ)) → ((ϕ → ψ) → (ϕ → χ))
(A2)
(¬ϕ → ¬ψ) → (ψ → ϕ)
(A3)
Schlussregeln ϕ, ϕ → ψ ψ
(MP) Tabelle 2.6: Axiome und Schlussregeln des aussagenlogischen Kalküls
94
Dass die hier gewählte Beispielformel A → A wahr ist, folgt sofort aus der Definition des Implikationsoperators ‚→‘. Warum haben wir uns dann die Mühe gemacht, sie so aufwendig zu beweisen? Der Grund ist, dass die Beweisbarkeit und die Wahrheit zwei völlig unterschiedliche Begriffe sind. Um zu zeigen, dass die Formel A → A ein Theorem ist, müssen wir ihre Beweisbarkeit demonstrieren. Im formalen Sinne bedeutet dies nicht, dass sie wahr ist, sondern lediglich, dass sie innerhalb des Kalküls aus den Axiomen hergeleitet werden kann. Kurzum: Die Beweisbarkeit einer Formel ist eine syntaktische Eigenschaft und die Wahrheit einer Formel eine semantische. Es ist der natürliche Wunsch der Mathematiker, beide Begriffe in Kongruenz zu bringen, so dass aus der Beweisbarkeit die Wahrheit und aus der Wahrheit die Beweisbarkeit einer Formel folgt. Doch genau dies ist, wie wir in den nächsten Kapiteln zeigen werden, für weite Teile der Mathematik unmöglich.
2 Formale Systeme
Die folgende Ableitung zeigt, wie die Tautologie ϕ = A → A aus den Axiomen abgeleitet werden kann: 1. 2. 3. 4. 5.
(A → ((A → A) → A)) → ((A → (A → A)) → (A → A)) (A2) A → ((A → A) → A) (A1) (A → (A → A)) → (A → A) (MP, 1,2) A → (A → A) (A1) A→A (MP, 3,4)
Die ersten beiden Glieder der Beweiskette sind Instanzen des Distributivitätsaxioms und des Abschwächungsaxioms. Das dritte Glied entsteht durch die Anwendung der Schlussregel auf die vorher erzeugten Formeln, und das vierte ist wiederum eine Instanz des Abschwächungsaxioms. Jetzt lässt sich ϕ aus den Gliedern 3 und 4 durch die erneute Anwendung der Modus-Ponens-Schlussregel ableiten. Am Ende von Abschnitt 2.1 haben wir die Schreibweise M ϕ eingeführt. Sie drückt aus, dass wir ϕ mit einer Formelkette ϕ1 , . . . , ϕn ableiten können, die nach dem folgenden Schema aufgebaut ist: I
ϕi ist ein Axiom oder
I
ϕi ist eine Formel aus der Menge M oder
I
ϕi entsteht aus den vorangegangenen Gliedern der Beweiskette durch die Anwendung einer Schlussregel.
Am Ende der Formelkette steht die Formel ϕ, d. h., es ist ϕn = ϕ. Mithilfe der Menge M konnten wir einen Beweis um eine Reihe von Voraussetzungen ergänzen und auf diese Weise problemlos mit Aussagen der Form „Unter der Annahme, dass M gilt, folgt . . . “ umgehen. Vielleicht haben Sie sich die Frage gestellt, ob diese Erweiterung wirklich notwendig ist; schließlich sind wir in der Lage, beliebige Wenndann-Beziehungen mithilfe des Implikationsoperators zu formulieren. Der Unterschied zwischen beiden Konstrukten besteht darin, dass der Operator ‚→‘ innerhalb der Logik existiert, während die Folgerungsbeziehung M ϕ eine Aussage über die Beweisbarkeit der Aussage ϕ macht. Mit anderen Worten: M ϕ ist eine Meta-Aussage, die außerhalb der Logik steht. Nichtsdestotrotz existiert zwischen beiden Konstrukten ein enger Zusammenhang, den das nachstehende Theorem klar zum Ausdruck bringt:
95
2.3 Aussagenlogik
Satz 2.7 (Deduktionstheorem der Aussagenlogik) Für beliebige aussagenlogische Formeln ϕ, ϕ1 , . . . , ϕn und ψ gilt: {ϕ1 , . . . , ϕn } ∪ {ϕ} ψ
⇔
{ϕ1 , . . . , ϕn } ϕ → ψ
Alter Beweis
1 2 ... m 1
Beweis: Die Richtung von rechts nach links ist nahezu trivial. Gilt 1
{ϕ1 , . . . , ϕn } ϕ → ψ,
Die Schlussrichtung von links nach rechts erfordert etwas mehr Aufwand, folgt aber dem gleichen Schema. Ausgehend von einem Beweis für ψ aus {ϕ1 , . . . , ϕn } ∪ {ϕ} werden wir einen Beweis für ϕ → ψ aus {ϕ1 , . . . , ϕn } konstruieren. Das Grundschema des neuen Beweises ist in Abbildung 2.12 skizziert. Aus der vorhandenen Beweiskette χ1 , . . . , χm−1 , ψ erzeugen wir eine neue, in der nacheinander die Formeln ϕ → χi abgeleitet werden und am Ende die zu beweisende Behauptung ϕ → ψ steht. Damit ist die Grobstruktur festgelegt. Jetzt müssen wir noch überlegen, wie die verbleibenden Lücken in der Beweiskette geschlossen werden können. Wir unterscheiden drei Fälle:
1 2 ... m 1
... 1
χi
I
Abbildung 2.11: Beweisschema des Deduktionstheorems (Richtung von rechts nach links)
χi ist ein Axiom oder eine Voraussetzung χi → (ϕ → χi ) ϕ → χi
m 1
(A1) (MP)
Neuer Beweis
I
...
Alter Beweis
so existiert ein formaler Beweis, der ϕ → ψ aus {ϕ1 , . . . , ϕn } ableitet. Diese Schlusskette können wir auf einfache Weise zu einem Beweis verlängern, der ψ aus {ϕ1 , . . . , ϕn , ϕ} deduziert. Hierzu setzen wir ϕ zunächst als Instanz ein und leiten ψ anschließend durch die Modusponens-Schlussregel aus ϕ → ψ und ϕ ab (vgl. Abbildung 2.11).
Neuer Beweis
2
... 2 ... m 1
χi ist die Formel ϕ (ϕ → ((ϕ → ϕ) → ϕ)) → ((ϕ → (ϕ → ϕ)) → (ϕ → ϕ)) (A2) ϕ → ((ϕ → ϕ) → ϕ) (ϕ → (ϕ → ϕ)) → (ϕ → ϕ) ϕ → (ϕ → ϕ)
(A1) (MP) (A1)
ϕ →ϕ
(MP)
...
Abbildung 2.12: Beweisschema des Deduktionstheorems (Richtung von links nach rechts)
96
2 Formale Systeme
Ableitbare Theoreme I
Theorem T1 ϕ →ϕ
I
Theorem T6 (ϕ → ψ) → (¬ψ → ¬ϕ)
I
Theorem T11 ¬(ϕ → ψ) → ¬ψ
I
Theorem T2 (ϕ → ψ) → ((ψ → χ) → (ϕ → χ))
I
Theorem T7 ϕ → (¬ψ → ¬(ϕ → ψ))
I
Theorem T12 (ϕ → ¬ϕ) → ¬ϕ
I
Theorem T3 ϕ → ((ϕ → ψ) → ψ)
I
Theorem T8 ¬ϕ → (ϕ → ψ)
I
Theorem T13 (¬ϕ → ϕ) → ϕ
I
Theorem T4 ¬¬ϕ → ϕ
I
Theorem T9 ϕ → (ψ → (ϕ → ψ))
I
Theorem T14 (ϕ → ψ) → ((¬ϕ → ψ) → ψ)
I
Theorem T5 ϕ → ¬¬ϕ
I
Theorem T10 ¬(ϕ → ψ) → ϕ
I
Theorem T15 ¬(ϕ → ϕ) → ψ
Tabelle 2.7: Eine kleine Auswahl von Formeln, die sich im aussagenlogischen Kalkül ableiten lassen. Dem Theorem T8 kommt eine ganz besondere Bedeutung zu. Lässt es sich in einem Kalkül ableiten und steht der Modus ponens als Schlussregel zur Verfügung, so gilt das Folgende: Ist innerhalb des Kalküls ein einziger Widerspruch ableitbar, so ist ausnahmslos jede Formel ein Theorem. Warum dies so ist, lässt sich leicht einsehen. Nehmen wir an, die Formeln ϕ und ¬ϕ können beide aus den Axiomen hergeleitet werden. Aus dem Theorem ¬ϕ → (ϕ → ψ) lässt sich mithilfe des Modus ponens das Theorem ϕ → ψ deduzieren. Nach Voraussetzung ist ϕ ebenfalls ableitbar, so dass eine erneute Anwendung des Modus ponens das Theorem ψ hervorbringt. Da die Wahl von ψ keinen Einschränkungen unterliegt, können wir eine beliebige Aussage für ψ substituieren. Kurzum: In einem widersprüchlichen Kalkül lassen sich ausnahmslos alle Aussagen beweisen. Damit haben wir die Widerspruchsfreiheit als eine unabdingbare Eigenschaft des mathematischen Schließens entlarvt. Fehlt sie, so verkommt jedes formale System zu einem wertlosen Gedankengebilde.
I
χi wurde durch die Regel (MP) aus χ j und χ j → χi erzeugt. Dann wissen wir, dass weiter oben im Beweis die beiden Zeilen ϕ → χj ϕ → (χ j → χi ) vorkommen müssen und wir folgendermaßen verfahren können: (ϕ → (χ j → χi )) → ((ϕ → χ j ) → (ϕ → χi )) (ϕ → χ j ) → (ϕ → χi ) ϕ → χi
(A2) (MP) (MP)
Damit ist die Behauptung bewiesen. Für die praktische Beweisführung ist das Deduktionstheorem von unschätzbarem Wert. Zum einen erlaubt es uns, zwischen der Logik- und der Meta-Ebene nach Belieben hin- und herzuspringen. Zum anderen versetzt es uns in die Lage, Beweise deutlich platzsparender aufzuschreiben als es ohne das Theorem möglich wäre. Wir werden den Kalkül nun zum Leben erwecken und nacheinander die in Tabelle 2.7 genannten Theoreme beweisen. Sie stammen aus [118] und [117] und sollen einen plastischen Eindruck vermitteln, wie sich im aussagenlogischen Kalkül komplexere Beweise führen lassen.
97
2.3 Aussagenlogik
1. (ϕ → ((ϕ → ϕ) → ϕ)) → ((ϕ → (ϕ → ϕ)) → (ϕ → ϕ)) (A2) 2. ϕ → ((ϕ → ϕ) → ϕ) (A1) 3. (ϕ → (ϕ → ϕ)) → (ϕ → ϕ) 4. ϕ → (ϕ → ϕ)
(MP, 1,2) (A1)
5. ϕ → ϕ
(MP, 3,4)
Theorem T1 ϕ →ϕ
1. 2. 3. 4. 5. 6. 7. 8.
{ϕ → ψ, ψ → χ, ϕ} ϕ {ϕ → ψ, ψ → χ, ϕ} ϕ → ψ {ϕ → ψ, ψ → χ, ϕ} ψ {ϕ → ψ, ψ → χ, ϕ} ψ → χ {ϕ → ψ, ψ → χ, ϕ} χ {ϕ → ψ, ψ → χ} ϕ → χ {ϕ → ψ} (ψ → χ) → (ϕ → χ) (ϕ → ψ) → ((ψ → χ) → (ϕ → χ))
(Satz 2.4) (Satz 2.4) (MP, 1,2) (Satz 2.4) (MP, 4,5) (DT) (DT) (DT)
Theorem T2 (ϕ → ψ) → ((ψ → χ) → (ϕ → χ))
1. 2. 3. 4. 5.
{ϕ, ϕ → ψ} ϕ {ϕ, ϕ → ψ} ϕ → ψ {ϕ, ϕ → ψ} ψ {ϕ} (ϕ → ψ) → ψ ϕ → ((ϕ → ψ) → ψ)
(Satz 2.4) (Satz 2.4) (MP, 1,2) (DT) (DT)
Theorem T3 ϕ → ((ϕ → ψ) → ψ)
1. 2. 3. 4. 5. 6. 7. 8.
¬¬ϕ → (¬¬¬¬ϕ → ¬¬ϕ) {¬¬ϕ} ¬¬¬¬ϕ → ¬¬ϕ (¬¬¬¬ϕ → ¬¬ϕ) → (¬ϕ → ¬¬¬ϕ) {¬¬ϕ} ¬ϕ → ¬¬¬ϕ (¬ϕ → ¬¬¬ϕ) → (¬¬ϕ → ϕ) {¬¬ϕ} ¬¬ϕ → ϕ {¬¬ϕ} ϕ ¬¬ϕ → ϕ
(A1) (DT) (A3) (MP, 2,3) (A3) (MP, 4,5) (DT) (DT)
Theorem T4 ¬¬ϕ → ϕ
(T4)
Theorem T5 ϕ → ¬¬ϕ
1. ¬¬¬ϕ → ¬ϕ 2. (¬¬¬ϕ → ¬ϕ) → (ϕ → ¬¬ϕ) 3. ϕ → ¬¬ϕ
(A3) (MP, 1,2)
98
Theorem T6 (ϕ → ψ) → (¬ψ → ¬ϕ)
2 Formale Systeme
1. ¬¬ϕ → ϕ 2. {ϕ → ψ} ϕ → ψ
(T4) (Satz 2.4)
3. (¬¬ϕ → ϕ) → ((ϕ → ψ) → (¬¬ϕ → ψ)) 4. (ϕ → ψ) → (¬¬ϕ → ψ)
(T2) (MP, 1,3)
5. 6. 7. 8.
{ϕ → ψ} ¬¬ϕ → ψ (¬¬ϕ → ψ) → ((ψ → ¬¬ψ) → (¬¬ϕ → ¬¬ψ)) {ϕ → ψ} (ψ → ¬¬ψ) → (¬¬ϕ → ¬¬ψ) ψ → ¬¬ψ
9. {ϕ → ψ} ¬¬ϕ → ¬¬ψ 10. (¬¬ϕ → ¬¬ψ) → (¬ψ → ¬ϕ) 11. {ϕ → ψ} ¬ψ → ¬ϕ 12. (ϕ → ψ) → (¬ψ → ¬ϕ)
(MP, 2,4) (T2) (MP, 5,6) (T5) (MP, 8,9) (A3) (MP, 11,12) (DT)
Theorem T7 ϕ → (¬ψ → ¬(ϕ → ψ))
1. 2. 3. 4. 5.
ϕ → ((ϕ → ψ) → ψ) {ϕ} (ϕ → ψ) → ψ ((ϕ → ψ) → ψ) → (¬ψ → ¬(ϕ → ψ)) {ϕ} ¬ψ → ¬(ϕ → ψ) ϕ → (¬ψ → ¬(ϕ → ψ))
(T3) (DT) (T6) (MP, 3,4) (DT)
Theorem T8 ¬ϕ → (ϕ → ψ)
1. 2. 3. 4. 5.
¬ϕ → (¬ψ → ¬ϕ) {¬ϕ} ¬ψ → ¬ϕ (¬ψ → ¬ϕ) → (ϕ → ψ) {¬ϕ} (ϕ → ψ) ¬ϕ → (ϕ → ψ)
(A1) (DT) (A3) (MP, 2,3) (DT)
Theorem T9 ϕ → (ψ → (ϕ → ψ))
1. {ϕ} ψ → (ϕ → ψ) 2. ϕ → (ψ → (ϕ → ψ))
(A1) (DT)
Theorem T10 ¬(ϕ → ψ) → ϕ
1. ¬ϕ → (ϕ → ψ) 2. (¬ϕ → (ϕ → ψ)) → (¬(ϕ → ψ) → ¬¬ϕ)
(T8) (T6)
3. ¬(ϕ → ψ) → ¬¬ϕ 4. ¬¬ϕ → ϕ 5. (¬(ϕ → ψ) → ¬¬ϕ) →
(MP, 1,2) (T4)
99
2.3 Aussagenlogik
((¬¬ϕ → ϕ) → (¬(ϕ → ψ) → ϕ)) 6. (¬¬ϕ → ϕ) → (¬(ϕ → ψ) → ϕ)
(T2) (MP, 3,5)
7. ¬(ϕ → ψ) → ϕ
(MP, 4,6)
1. ψ → (ϕ → ψ) 2. (ψ → (ϕ → ψ)) → (¬(ϕ → ψ) → ¬ψ) 3. ¬(ϕ → ψ) → ¬ψ
(A1) (T6) (MP, 1,2)
Theorem T11 ¬(ϕ → ψ) → ¬ψ
(T7) (DT) (T5) (DT) (MP, 2,4) (DT) (T6) (MP, 6,7)
Theorem T12 (ϕ → ¬ϕ) → ¬ϕ
1. 2. 3. 4. 5. 6. 7. 8.
ϕ → (¬¬ϕ → ¬(ϕ → ¬ϕ)) {ϕ} ¬¬ϕ → ¬(ϕ → ¬ϕ) ϕ → ¬¬ϕ {ϕ} ¬¬ϕ {ϕ} ¬(ϕ → ¬ϕ) ϕ → ¬(ϕ → ¬ϕ) (ϕ → ¬(ϕ → ¬ϕ)) → (¬¬(ϕ → ¬ϕ) → ¬ϕ) ¬¬(ϕ → ¬ϕ) → ¬ϕ
9. (ϕ → ¬ϕ) → ¬¬(ϕ → ¬ϕ) 10. ((ϕ → ¬ϕ) → ¬¬(ϕ → ¬ϕ)) → ((¬¬(ϕ → ¬ϕ) → ¬ϕ) → ((ϕ → ¬ϕ) → ¬ϕ)) 11. ¬¬(ϕ → ¬ϕ) → ¬ϕ) → ((ϕ → ¬ϕ) → ¬ϕ 12. (ϕ → ¬ϕ) → ¬ϕ 1. {¬ϕ} ϕ → ¬¬ϕ 2. ¬ϕ → (ϕ → ¬¬ϕ) 3. 4. 5. 6. 7. 8.
(T5) (T2) (MP, 9,10) (MP, 8,11)
(T5) (DT)
(¬ϕ → (ϕ → ¬¬ϕ)) → ((¬ϕ → ϕ) → (¬ϕ → ¬¬ϕ)) (A2) (¬ϕ → ϕ) → (¬ϕ → ¬¬ϕ) (MP, 2,3) {¬ϕ → ϕ} (¬ϕ → ¬¬ϕ) (DT) (¬ϕ → ¬¬ϕ) → ¬¬ϕ (T12) {¬ϕ → ϕ} ¬¬ϕ (DT) ¬¬ϕ → ϕ (T4)
9. {¬ϕ → ϕ} ϕ 10. (¬ϕ → ϕ) → ϕ
(MP, 7,8) (DT)
Theorem T13 (¬ϕ → ϕ) → ϕ
100
Theorem T14 (ϕ → ψ) → ((¬ϕ → ψ) → ψ)
2 Formale Systeme
1. { ϕ → ψ } ϕ → ψ 2. (ϕ → ψ) → (¬ψ → ¬ϕ)
(Satz 2.4) (T6)
3. { ϕ → ψ } (¬ψ → ¬ϕ) 4. (¬ψ → ¬ϕ) → ((¬ϕ → ψ) → (¬ψ → ψ))
(MP, 1,2) (T2)
5. 6. 7. 8.
{ ϕ → ψ } (¬ϕ → ψ) → (¬ψ → ψ) {ϕ → ψ, ¬ϕ → ψ} ¬ψ → ψ (¬ψ → ψ) → ψ { ϕ → ψ, ¬ϕ → ψ } ψ
9. { ϕ → ψ } (¬ϕ → ψ) → ψ 10. (ϕ → ψ) → ((¬ϕ → ψ) → ψ)
Theorem T15 ¬(ϕ → ϕ) → ψ
1. 2. 3. 4. 5. 6.
{ ¬ψ } (ϕ → ϕ) (ϕ → ϕ) → ¬¬(ϕ → ϕ) { ¬ψ } ¬¬(ϕ → ϕ) ¬ψ → ¬¬(ϕ → ϕ) (¬ψ → ¬¬(ϕ → ϕ)) → (¬(ϕ → ϕ) → ψ) ¬(ϕ → ϕ) → ψ
(MP, 3,4) (DT) (T13) (MP, 7,8) (DT) (DT)
(T1) (T5) (MP, 1,2) (DT) (A3) (MP, 4,5)
Behalten Sie stets im Gedächtnis, dass die entwickelten Ableitungssequenzen keine echten formalen Beweise sind. Verantwortlich hierfür ist die Eigenschaft des Deduktionstheorems, eine Meta-Schlussregel zu sein, die Aussagen über Beweise macht und nicht innerhalb des Kalküls existiert. Dass wir die Ableitungssequenzen trotzdem als Beweise ansehen dürfen, verdanken wir unserer geleisteten Vorarbeit. Weiter oben haben wir gezeigt, wie sich jede mit (DT) markierte Ableitung durch eine äquivalente Sequenz ersetzen lässt, die ohne das Deduktionstheorem auskommt. In diesem Sinne können wir die gezeigten Ableitungssequenzen als Bauplan verstehen, aus dem sich systematisch eine echte Beweiskette erzeugen lässt. Abschließend wollen wir uns mit der Frage beschäftigen, wie es um die in Definition 2.2 fixierten Kalküleigenschaften bestellt ist. Die Korrektheit unseres Kalküls (aus ϕ folgt |= ϕ) liegt auf der Hand. Zunächst lässt sich zeigen, dass alle Axiome allgemeingültig sind. Ferner ist leicht nachzuvollziehen, dass die einzige Schlussregel des Kalküls – der Modus ponens – die Tautologieeigenschaft erhält. Damit ist der Kalkül korrekt und nach Satz 2.2 erst recht widerspruchsfrei.
101
2.3 Aussagenlogik
Tatsächlich ist der Kalkül sogar vollständig, d. h., alle allgemeingültigen Formeln lassen sich aus den Axiomen herleiten (aus |= ϕ folgt ϕ). Den vergleichsweise komplizierten Beweis wollen wir an dieser Stelle nicht führen. Eine detaillierte Ausarbeitung findet sich in beispielsweise in [97] oder [117]. Beachten Sie, dass der Kalkül nicht negationsvollständig ist, d. h., es existieren Formeln ϕ, für die weder ϕ noch ¬ϕ aus den Axiomen abgeleitet werden kann. Die Negationsunvollständigkeit ist kein Mangel des Kalküls; sie ist allein der Tatsache geschuldet, dass wir die Semantik aussagenlogischer Formeln nicht, wie in den Beispielen zuvor, an eine einzige Interpretation gekoppelt haben. In der Aussagenlogik drücken wir mit |= ϕ aus, dass ϕ allgemeingültig ist, d. h. unter jeder möglichen Interpretation wahr ist. In diesem Fall existieren viele Formeln ϕ, für die weder |= ϕ noch |= ¬ϕ gilt. Ein korrekter Kalkül für die Aussagenlogik kann daher niemals negationsvollständig sein. Abschließend sei bemerkt, dass die Wahl der Axiome unseres Kalküls bei weitem nicht eindeutig ist. Tabelle 2.8 fasst drei historisch wichtige Axiomatisierungen zusammen, die ebenfalls zu einem korrekten und vollständigen Kalkül für die Aussagenlogik führen.
Hilbert und Ackermann (1928) [85]
Kleene (1952) [103]
(ϕ ∨ ϕ) → ϕ
(A1)
ϕ → (ϕ ∨ ψ)
(A2)
(ϕ ∨ ψ) → (ψ ∨ ϕ)
(A3)
(ϕ → ψ) → ((χ ∨ ϕ) → (χ ∨ ψ))
(A4)
Rosser (1953) [153] ϕ → (ϕ ∧ ϕ)
(A1)
(ϕ ∧ ψ) → ϕ
(A2)
(ϕ → ψ) → (¬(ψ ∧ χ) → ¬(χ ∧ ϕ))
(A3)
ϕ → (ψ → ϕ)
(A1)
(ϕ → (ψ ∧ χ)) → ((ϕ → ψ) → (ϕ → χ))
(A2)
(ϕ ∧ ψ) → ϕ
(A3)
(ϕ ∧ ψ) → ψ
(A4)
ϕ → (ψ → (ϕ ∧ ψ))
(A5)
ϕ → (ϕ ∧ ψ)
(A6)
ψ → (ϕ ∧ ψ)
(A7)
(ϕ → ψ) → ((χ → ψ) → ((ϕ ∨ ψ) → χ))
(A8)
(ϕ → ψ) → ((ϕ → ¬ψ) → ¬ϕ)
(A9)
¬¬ϕ → ϕ
(A10)
Tabelle 2.8: Alternative Axiomatisierungen der Aussagenlogik [117]. Hilbert und Ackermann bauen ihre Logik auf den logischen Primitiven ‚¬‘ und ‚∨‘ auf und verwenden den Ausdruck ϕ → ψ als abkürzende Schreibweise für die Formel ¬ϕ ∨ ψ. Rosser beschränkt sich auf die logischen Primitive ‚¬‘ und ‚∧‘. Hier wird der Ausdruck ϕ → ψ ebenfalls als syntaktische Abkürzung verstanden, diesmal für die Formel ¬(ϕ ∧ ¬ψ). Kleene lässt neben ‚¬‘ und ‚∧‘ auch ‚∨‘ und ‚→‘ als primitive Operatoren zu, benötigt dafür aber eine größere Menge von Axiomen. Der Modus ponens ist die alleinige Schlussregel in allen drei Kalkülen.
102
I
2 Formale Systeme
2.4
Zu jedem ε > 0 existiert . . .
Prädikatenlogik erster Stufe
f(x)
Mit der Aussagenlogik haben wir das nötige Instrumentarium geschaffen, um logische Beziehungen zwischen elementaren Aussagen formal zu erfassen. Auch wenn sich viele Sachverhalte in der gezeigten Weise beschreiben lassen, sind die vorhandenen Ausdrucksmöglichkeiten bei weitem nicht stark genug, um als Grundlage für die Formalisierung der Mathematik zu dienen.
ε-Korridor
f(x0)+ε f(x0) f(x0)−ε
x
x0
I
. . . ein δ > 0 mit der Eigenschaft, . . .
Damit wir die Begriffe und Konzepte der gewöhnlichen Mathematik abbilden können, müssen wir die Aussagenlogik um mehrere Bausteine erweitern. Um welche es sich konkret handelt, wollen wir an einem wohlbekannten Beispiel aus der Analysis herausarbeiten: der Stetigkeit reellwertiger Funktionen [196] (Abbildung 2.13).
f(x)
Definition 2.11 (Stetigkeit) δ-Korridor
Die Funktion f : D → R ist stetig im Punkt x0 ∈ D, wenn zu jedem ε > 0 ein δ > 0 mit der folgenden Eigenschaft existiert:
ε-Korridor
f(x0)+ε f(x0)
x ∈ D ∧ |x − x0 | < δ ⇒ | f (x) − f (x0 )| < ε
f(x0)−ε
x0−δ
x0
x0+δ
x
Mithilfe der Quantoren ‚∀‘ („für alle“) und ‚∃‘ („es existiert“) können wir die Stetigkeitsbedingung wie folgt aufschreiben: ∀ (ε > 0) ∃ (δ > 0) ∀ (x ∈ D) (|x − x0 | < δ → | f (x) − f (x0 )| < ε)
I
. . . dass f (x) für alle x aus dem δ -Korridor innerhalb des ε-Korridors liegt.
Analysieren wir die Definition im Detail, so lassen sich neben den aussagenlogischen Verknüpfungen die folgenden Bestandteile isolieren:
f(x) δ-Korridor
I
f(x0)−ε
I
x0−δ
x0 x x0+δ
Variablen Mit x, x0 , ε und δ enthält die Formel vier Variablen. Jede Einzelne steht stellvertretend für ein Element des Individuenbereichs, der sich in unserem Beispiel über die Menge der reellen Zahlen erstreckt.
ε-Korridor
f(x0)+ε f(x) f(x0)
x
Abbildung 2.13: Eine reellwertige Funktion ist stetig an der Stelle x0 , wenn sie das Epsilon-Delta-Kriterium erfüllt.
Quantoren Variablen werden an Quantoren gebunden, um quantitative Aussagen über die Elemente des Individuenbereichs zu machen. In unserem Beispiel stehen die Variablen ε und x im Wirkungsbereich eines Allquantors, während δ durch einen Existenzquantor gebunden ist. x0 steht nicht im Wirkungsbereich eines Quantors; eine solche Variable heißt frei oder ungebunden.
2.4 Prädikatenlogik erster Stufe
I
103
Funktionen Mit f und | · | (Betragsfunktion) enthält die Formel zwei einstellige Funktionssymbole. Im Allgemeinen repräsentiert ein n-stelliges Funktionssymbol eine Abbildung, die n Elemente des Individuenbereichs auf ein anderes Element des Individuenbereichs abbildet.
I
Prädikate Die Formel enthält mit ‚∈ D‘ ein einstelliges und mit ‚<‘ ein zweistelliges Prädikat. Im Allgemeinen repräsentiert ein n-stelliges Prädikat eine Relation, die das Bestehen oder Nichtbestehen einer Beziehung zwischen n Elementen des Individuenbereichs ausdrückt.
Das diskutierte Beispiel vermittelt einen ersten Eindruck von der Beschaffenheit und der Ausdrucksstärke der Prädikatenlogik. Im nächsten Abschnitt wollen wir die umrissenen Ideen konkretisieren und mathematisch präzise aufarbeiten, was sich hinter einer prädikatenlogischen Formel im Einzelnen verbirgt.
2.4.1
Syntax und Semantik
Die Syntaxdefinition der Prädikatenlogik erfolgt in drei Schritten. Zunächst führen wir den Begriff der prädikatenlogischen Signatur ein. Darauf aufbauend definieren wir den Begriff des prädikatenlogischen Terms und erweitern diesen anschließend zum Begriff der prädikatenlogischen Formel.
Definition 2.12 (Prädikatenlogische Signatur) Eine prädikatenlogische Signatur Σ ist ein Tripel (VΣ , FΣ , PΣ ). Dieses besteht aus I
einer Menge VΣ von Variablen, z. B. {x1 , x2 , . . .},
I
einer Menge FΣ von Funktionssymbolen, z. B. {f1 , f2 , . . .},
I
einer Menge PΣ von Prädikaten, z. B. {P1 , P2 , . . .}.
Jede Funktion und jedes Prädikat besitzt eine feste Stelligkeit ≥ 0.
Grob gesprochen definiert eine prädikatenlogische Signatur den Vorrat an elementaren Symbolen, aus denen Formeln zusammengesetzt sind.
Die Aussagenlogik besitzt große Parallelen zur Prädikatenlogik und ist sogar vollständig als Teilmenge in ihr enthalten. Gerade deshalb ist Vorsicht angebracht, um gewisse Termini nicht zu verwechseln. Insbesondere der Begriff der Variablen erweist sich für viele Anfänger immer wieder als Fallstrick, da er in beiden Logiken mit unterschiedlichen Bedeutungen belegt ist. In der Prädikatenlogik ist eine Variable ein Platzhalter für ein beliebiges Element einer festgelegten Grund- oder Individuenmenge. Erst durch die konkrete Wahl eines Individuenelements wird eine Formel wie P(x) zu einer wahren oder einer falschen Aussage. In der Aussagenlogik stehen Variablen dagegen für atomare Aussagen, die wahr oder falsch sein können. Damit sind sie in Wirklichkeit 0-stellige Prädikate und haben mit den prädikatenlogischen Variablen nur den Namen gemeinsam.
104 I Signatur Σ
Σ = (VΣ , FΣ , PΣ ) mit
2 Formale Systeme
Genau wie in der Aussagenlogik werden wir auch hier den Symbolvorrat von Fall zu Fall anpassen und Variablen z. B. mit x, y, z, Funktionen mit f, g, h und Prädikate mit P, Q, R bezeichnen.
VΣ = {x, y}
Definition 2.13 (Prädikatenlogischer Term)
FΣ = {f (2-stellig) } PΣ = {P (2-stellig) }
Sei Σ = (VΣ , FΣ , PΣ ) eine prädikatenlogische Signatur. Die Menge der prädikatenlogischen Terme ist induktiv definiert: I
Jede Variable ξ ∈ VΣ ist ein Term.
x
I
Jedes 0-stellige Funktionssymbol f ∈ FΣ ist ein Term.
y
I
Sind σ1 , . . . , σn Terme und ist f ∈ FΣ ein n-stelliges Funktionssymbol, so ist f (σ1 , . . . , σn ) ein Term.
I Terme über Σ
f(x, x) f(x, y) f(f(x, y), x) f(x, f(x, y)) f(f(x, x), f(x, y)) ... I Atomare Formeln über Σ
P(x, x)
Wie in Abbildung 2.14 (oben) demonstriert, lassen sich aus dem Symbolvorrat einer prädikatenlogischen Signatur meist unendlich viele Terme erzeugen. Eine besondere Bedeutung fällt dabei den 0-stelligen Funktionssymbolen zu. Diese besitzen keine Parameter und spielen die Rolle von Konstanten. Mit den hier eingeführten Begriffen sind wir in der Lage, die Menge der prädikatenlogischen Formeln präzise zu definieren:
P(x, y)
Definition 2.14 (Syntax der Prädikatenlogik)
P(f(x, y), x) P(x, f(x, y)) P(x, f(f(x, y), x)) P(f(f(x, y), x), y) ... I Formeln über Σ
∀ x P(x, x) ∃ x P(x, x) P(f(x, x), x) ↔ P(y, y)
Sei Σ eine prädikatenlogische Signatur. Die Menge der atomaren prädikatenlogischen Formeln ist folgendermaßen festgelegt: I
Sind σ1 , . . . , σn Terme und P ein n-stelliges Prädikat, so ist P(σ1 , . . . , σn ) eine atomare Formel.
Die prädikatenlogischen Formeln sind induktiv definiert: I
Jede atomare Formel ist eine Formel.
I
Sei ξ ∈ VΣ . Sind ϕ und ψ Formeln, dann sind es auch
∀ y ∃ x (P(f(x, x), x) ↔ P(y, y))
0, 1, (¬ϕ), (ϕ ∧ ψ), (ϕ ∨ ψ), (ϕ → ψ), (ϕ ↔ ψ), (ϕ ψ)
∃ y ∀ x (P(f(x, x), x) ↔ P(y, y))
∀ ξ ϕ, ∃ ξ ϕ
...
Abbildung 2.14: Schrittweise Konstruktion prädikatenlogischer Ausdrücke
Abbildung 2.14 (unten) zeigt eine kleine Auswahl erzeugbarer Formeln. Beachten Sie, dass nicht alle Variablen zwangsläufig im Wirkungsbereich eines Quantors stehen müssen. Beispielsweise kommt die Variable x in der Formel P(x, x) frei oder ungebunden, in der Formel ∀ x P(x)
105
2.4 Prädikatenlogik erster Stufe
dagegen gebunden vor. Wir schreiben ϕ(x1 , . . . , xn ), um hervorzuheben, dass die Variablen x1 , . . . , xn in ϕ frei vorkommen. Dass eine Variable in der gleichen Formel sowohl frei als auch gebunden vorkommen kann, demonstriert das Beispiel in Abbildung 2.15.
Achten Sie darauf, die Regeln für den syntaktischen Aufbau prädikatenlogischer Formeln korrekt zu interpretieren! So steht die Formel ψ in
Der Umgang mit prädikatenlogischen Ausdrücken wird erheblich erleichtert, wenn die Variablen in zwei voneinander unabhängigen Teilausdrücken unterschiedlich benannt werden. Sind die quantifizierten Variablen einer geschlossenen Formel ϕ paarweise verschieden, so sprechen wir von einer bereinigten Formel. Abbildung 2.16 zeigt, wie jede Formel durch die Umbenennung mehrfach quantifizierter Variablen ohne Umwege in eine bereinigte Form gebracht werden kann.
∀x ϕ → ψ
Genau wie in der Aussagenlogik wird auch in der Prädikatenlogik die Semantik über eine Modellrelation ‚|=‘ festgelegt. Um diese präzise definieren zu können, müssen wir zunächst den Begriff der Interpretation auf prädikatenlogische Formeln erweitern: Definition 2.15 (Prädikatenlogische Interpretation) Sei Σ = (VΣ , FΣ , PΣ ) eine prädikatenlogische Signatur. Eine Interpretation über Σ ist ein Tupel (U, I) mit den folgenden Eigenschaften: I
U ist eine beliebige nichtleere Menge.
I
I ist eine Abbildung, die
• jedem n-stelligen Funktionssymbol f ∈ FΣ eine Funktion I( f ) : U n → U und
nach den vereinbarten Bildungsregeln außerhalb des Quantors. Soll ψ zum Bindungsbereich des Quantors gehören, muss der quantifizierte Teilausdruck als Ganzes geklammert werden. Die falsche Interpretation der Bildungsregeln ist eine häufige Fehlerquelle; Sie sind gut beraten, sich den folgenden Zusammenhang intensiv einzuprägen: ∀ x ϕ → ψ = ∀ x (ϕ → ψ)
Gebundenes Vorkommen von x
Freies Vorkommen von x
∀ x P(↓, y) → ∃ y P(↓, y) ∀ x P(x, y) → ∃ y P(x, y) ∀ x P(x,↑) → ∃ y P(x, ↑)
Freies Vorkommen von y
Gebundenes Vorkommen von y
Abbildung 2.15: Steht eine Variable im Wirkungsbereich eines Quantors, so sprechen wir von einem gebundenen, ansonsten von einem freien Vorkommen.
• jedem n-stelligen Prädikatsymbol P ∈ PΣ eine Relation I(P) ⊆ U n zuordnet.
Die Menge U wird in der Literatur als Individuenbereich, Grundmenge oder Universum bezeichnet. Beachten Sie, dass die getätigte Festlegung auch 0-stellige Funktions- und Prädikatsymbole einschließt. Einem 0-stelligen Funktionssymbol wird formal eine Funktion U 0 → U zugewiesen, hinter der sich ein einzelnes Element aus dem Individuenbereich und damit eine Konstante verbirgt. 0-stellige Prädikatsymbole stehen für Relationen über der Menge U 0 . Sie sind atomare Aussagen, die entweder wahr oder falsch sein können, und damit nichts anderes als die altbekannten aussagenlogischen Variablen. Die Abbildung I, die jedem Funktionssymbol f eine Funktion I( f ) zuordnet, lässt sich in naheliegender Weise auf variablenfreie Terme über-
∀ x P(x, y) → ∃ x P(x, y) Gebundene Umbenennung
∀ x P(x, y) → ∃ z P(z, y) (Bereinigte Formel) Abbildung 2.16: Durch die Umbenennung mehrfach verwendeter Variablen lassen sich prädikatenlogische Formeln bereinigen. In einer bereinigten Formel sind alle quantifizierten Variablen paarweise verschieden.
106
2 Formale Systeme
I Formel
tragen. Hierzu erweitern wir I nach dem folgenden induktiven Schema:
ϕ := ∀ x ∃ y P(f(x, y))
I( f (σ1 , . . . , σn )) := I( f )(I(σ1 ), . . . , I(σn ))
I Signatur
Abbildung 2.17 demonstriert den Interpretationsbegriff anhand zweier Beispiele. Beide assoziieren das Funktionszeichen f mit der gewöhnlichen Addition und das Prädikatsymbol P mit der Menge {0}, d. h., P(x) ist genau für die Zahl 0 wahr. Unterschiedlich gewählt sind die zugrunde liegenden Individuenmengen. Die erste Interpretation schöpft aus dem Bereich der ganzen Zahlen, während die zweite Interpretation nur die natürlichen Zahlen in Betracht zieht. Unter diesen Voraussetzungen liest sich die Beispielformel ϕ := ∀ x ∃ y P(f(x, y)) wie folgt:
VΣ := {x, y} FΣ := {f} PΣ := {P} I Erste Interpretation
U := Z I(f) := (x, y) → x + y
„Für alle x existiert ein y mit x + y = 0“
I(P) := {0}
…
…
y
0
x
„Für alle x existiert ein y mit x + y = 0“ ist in Z eine wahre Aussage. (U, I) |= ∀ x ∃ y P(f(x, y))
ϕ und ψ seien geschlossene prädikatenlogische Formeln und (U, I) eine Interpretation. Die Semantik der Prädikatenlogik ist durch die Modellrelation ‚|=‘ gegeben, die induktiv über dem Formelaufbau definiert ist:
U := N I (f) := (x, y) → x + y I (P) := {0}
…
…
0
Jetzt sind wir gerüstet, um die informellen Überlegungen zu präzisieren und die Modellrelation ‚|=‘ formal einzuführen.
Definition 2.16 (Semantik der Prädikatenlogik)
I Zweite Interpretation
y∉
Für die Menge der ganzen Zahlen ist die Aussage offensichtlich erfüllt, für die natürlichen Zahlen dagegen nicht.
x
„Für alle x existiert ein y mit x + y = 0“ ist in N eine falsche Aussage. (U , I ) |= ∀ x ∃ y P(f(x, y)) Abbildung 2.17: Zwei Interpretationen für die Formel ϕ := ∀ x ∃ y P(f(x, y))
(U, I) |= 1 (U, I) |= 0 (U, I) |= P(σ1 , . . . , σn ) :⇔ (I(σ1 ), . . . , I(σn )) ∈ I(P) (U, I) |= (¬ϕ) (U, I) |= (ϕ ∧ ψ) (U, I) |= (ϕ ∨ ψ) (U, I) |= (ϕ → ψ)
:⇔ :⇔ :⇔ :⇔
(U, I) |= ϕ (U, I) |= ϕ und (U, I) |= ψ (U, I) |= ϕ oder (U, I) |= ψ (U, I) |= ϕ oder (U, I) |= ψ
(U, I) |= (ϕ ↔ ψ) :⇔ (U, I) |= ϕ → ψ und (U, I) |= ψ → ϕ (U, I) |= (ϕ ψ) :⇔ (U, I) |= (ϕ ↔ ψ) (U, I) |= ∀ ξ ϕ :⇔ Für alle u ∈ U ist (U, I[ξ /u] ) |= ϕ (U, I) |= ∃ ξ ϕ :⇔ Es gibt ein u ∈ U mit (U, I[ξ /u] ) |= ϕ Eine Interpretation (U, I) mit (U, I) |= ϕ heißt Modell für ϕ.
107
2.4 Prädikatenlogik erster Stufe
In Definition 2.16 wird erstmals der Ausdruck I[ξ /u] verwendet. Ist (U, I) eine prädikatenlogische Interpretation, so ist mit (U, I[ξ /u] ) jene Interpretation gemeint, die der Variablen ξ das Individuenelement u zuordnet und sonst mit (U, I) identisch ist.
I Negationsgesetze
Genau wie im Falle der Aussagenlogik bezeichnen wir eine geschlossene Formel ϕ in der Prädikatenlogik als erfüllbar, wenn sie (mindestens) ein Modell besitzt. Ist jedes Modell einer Formelmenge M auch Modell einer Formel ϕ, so schreiben wir M |= ϕ („Aus M folgt ϕ“). Ist ausnahmslos jede Interpretation ein Modell von ϕ, gilt also 0/ |= ϕ, so ist ϕ allgemeingültig. Wie gewohnt bezeichnen wir ϕ in diesem Fall als Tautologie und verwenden die gekürzte Schreibweise |= ϕ.
I Bereichserweiterungsgesetze
Der Umgang mit offenen Formeln gestaltet sich ein wenig komplizierter. Wir wollen eine Formel mit den freien Variablen ξ1 , . . . , ξn genau dann als erfüllbar ansehen, wenn es eine Möglichkeit gibt, ξ1 , . . . , ξn so zu ersetzen, dass die resultierende Formel ein Modell besitzt. Analog hierzu betrachten wir eine offene Formel als allgemeingültig, wenn jede Ersetzung der freien Variablen zu einer allgemeingültigen geschlossenen Formel führt. Definition 2.17 (Erfüllbarkeit, Allgemeingültigkeit) Eine Formel ϕ mit den freien Variablen ξ1 , . . . , ξn heißt I
erfüllbar, falls ∃ ξ1 . . . ∃ ξm ϕ mindestens ein Modell besitzt,
I
unerfüllbar, falls ∃ ξ1 . . . ∃ ξm ϕ kein Modell besitzt,
I
allgemeingültig, falls ∀ ξ1 . . . ∀ ξm ϕ allgemeingültig ist.
Offensichtlich ist eine Formel ϕ mit den freien Variablen ξ1 , . . . , ξn genau dann allgemeingültig, wenn die Formel ∃ ξ1 . . . ∃ ξm ¬ϕ unerfüllbar ist. Den Begriff der Äquivalenz können wir bequem auf die bekannten Begriffe zurückführen. Wir bezeichnen zwei prädikatenlogische Formeln ϕ und ψ genau dann als äquivalent, geschrieben als ϕ ≡ ψ, wenn die Formel ϕ ↔ ψ allgemeingültig ist. Abbildung 2.18 fasst wichtige Äquivalenzen in einer Übersicht zusammen. Die beiden Negationsgesetze sind von besonderer Bedeutung; sie zeigen, dass wir einen der beiden Quantoren aus dem Symbolvorrat streichen können, ohne die Ausdrucksstärke der Prädikatenlogik zu verringern. Ausnutzen werden wir diese Eigenschaft im nächsten Abschnitt. Dort besprechen wir einen Kalkül, der ausschließlich Axiome und Schlussregeln für den Allquantor bereitstellt.
¬∃ ξ ϕ ≡ ∀ ξ ¬ϕ ∃ ξ ¬ϕ ≡ ¬∀ ξ ϕ
(∃ ξ ϕ) ⊕ ψ ≡ ∃ ξ (ϕ ⊕ ψ),
ξ ∈ ψ
(∀ ξ ϕ) ⊕ ψ ≡ ∀ ξ (ϕ ⊕ ψ),
ξ ∈ ψ
Abbildung 2.18: Wichtige prädikatenlogische Äquivalenzen. Das Zeichen ⊕ steht für eine beliebige Verknüpfung aus der Menge {∧, ∨, →, ↔, }, und die informelle Schreibweise ξ ∈ ψ drückt aus, dass die Variable ξ nicht in der Formel ψ vorkommt.
In der Aussagenlogik haben wir den Begriff der Tautologie als Synonym für den Begriff der allgemeingültigen Formel eingeführt. Wir wollen diese Konvention auch in der Prädikatenlogik beibehalten, wohl wissend, dass einige Bücher eine feinere Unterscheidung zwischen beiden Begriffen vornehmen. Mitunter wird eine prädikatenlogische Formel in der Literatur nur dann als Tautologie bezeichnet, wenn sie im aussagenlogischen Sinne allgemeingültig ist. Was das bedeutet, wollen wir am Beispiel der Formel (∀ x P(x)) ∨ ¬(∀ x P(x)) deutlich machen. Auf der aussagenlogischen Ebene hat diese Formel die Form ϕ ∨ ¬ϕ und ist deshalb auch im aussagenlogischen Sinne allgemeingültig. Dagegen hat die äquivalente Formel ∀ x P(x) ∨ ∃ x ¬P(x) die Form ϕ ∨ ψ und ist im aussagenlogischen Sinne nicht allgemeingültig. In Büchern, die dieser Terminologie folgen, ist damit nicht jede prädikatenlogisch allgemeingültige Formel auch eine Tautologie. Die Umkehrung dieser Aussage gilt jedoch auch dort.
108
2 Formale Systeme
I Beispiel 1: S := [x ← a]
2.4.2
Prädikatenlogischer Kalkül
(∀ x P(x, y))S = (∀ x P(x, y)) (∀ y P(x, y))S = (∀ y P(a, y)) (∀ x ∀ y P(x, y))S = (∀ x ∀ y P(x, y)) S ist eine Grundsubstitution I Beispiel 2: S := [x ← y, y ← f(y)]
(∀ x P(x, y))S = (∀ x P(x, f(y))) (∀ y P(x, y))S = (∀ y P(y, y)) (∀ x ∀ y P(x, y))S = (∀ x ∀ y P(x, y)) S ist eine Substitution, aber keine Grundsubstitution Abbildung 2.19: Eine Variablensubstitution der Form [ξ ← σ ] ersetzt alle freien Vorkommen der Variablen ξ durch den Term σ . Alle gebundenen Vorkommen bleiben unangetastet. Enthalten die eingesetzten Terme selbst keine Variablen, so sprechen wir von einer Grundsubstitution. Tabelle 2.9: Axiome und Schlussregeln des prädikatenlogischen Kalküls. Beachten Sie bei der Instanziierung von (A4), dass eine Instanz nur dann gebildet werden darf, wenn die Substitution von ξ durch σ kollisionsfrei durchgeführt werden kann. Von einer Kollision sprechen wir immer dann, wenn eine Variable von σ durch die Substitution in den Wirkungsbereich eines Quantors gerät. Dies ist beispielsweise für ϕ = ∃ y P(ξ , y) und σ = y der Fall. Würden wir auf die Forderung der Kollisionsfreiheit verzichten, so wäre die falsche Aussage ∀ x ∃ y P(x, y) → ∃ y P(y, y) ein Theorem des Kalküls. Bei der Instanziierung von (A5) ist ebenfalls Vorsicht geboten. Hier dürfen für σ nur solche Terme eingesetzt werden, in denen die Variable ξ nicht vorkommt.
In diesem Abschnitt beschäftigen wir uns mit der Frage, wie die Allgemeingültigkeit einer prädikatenlogischen Formel formal bewiesen werden kann. Genau wie im Fall der Aussagenlogik werden wir einen Kalkül definieren, in dem sich allgemeingültige Formeln durch die Anwendung von Schlussregeln aus einer Menge a priori festgelegter Axiome ableiten lässt. Um welche Axiome und Schlussregeln es sich konkret handelt, ist in Tabelle 2.9 zusammengefasst. Die Axiomenschemata (A1) bis (A3) sind alte Bekannte; sie sind mit den Axiomen des aussagenlogischen Kalküls identisch. Das Schema (A4) drückt aus, dass aus der Formel ∀ ξ ϕ Instanzen der Form ϕ[ξ ← σ ] folgen. Die Formel ϕ[ξ ← σ ] entsteht aus ϕ, indem alle freien Vorkommen von ξ , und nur diese, durch den prädikatenlogischen Term σ ersetzt werden. Wir sagen, die Formel ϕ(ξ ) wurde mit dem Term σ instantiiert (Abbildung 2.19). Das Schema (A5) erlaubt uns, eine Teilformel ϕ immer dann aus dem Wirkungsbereich eines Quantors herauszunehmen, wenn die quantifizierte Variable in ϕ nicht vorkommt. Theoreme können entweder mithilfe des bereits bekannten Modus ponens (MP) oder der neu hinzugekommenen Generalisierungsregel (G) deduziert werden. Letztere macht es möglich, aus der Formel ϕ die Generalisierung ∀ ξ ϕ abzuleiten.
Axiome ϕ → (ψ → ϕ)
(A1)
(ϕ → (ψ → χ)) → ((ϕ → ψ) → (ϕ → χ))
(A2)
(¬ϕ → ¬ψ) → (ψ → ϕ)
(A3)
∀ ξ ϕ → ϕ[ξ ← σ ] (für jede kollisionsfreie Substitution) (A4) ∀ ξ (ϕ → ψ) → (ϕ → ∀ ξ ψ) (für alle ϕ mit ξ ∈ ϕ)
(A5)
Schlussregeln ϕ, ϕ → ψ ψ
(MP)
ϕ ∀ξ ϕ
(G)
109
2.4 Prädikatenlogik erster Stufe
Ableitbare Theoreme I
Theorem T16 ∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ζ ∀ ξ ϕ(ξ , ζ )
I
Theorem T17 ∀ ξ (ϕ(ξ ) → ψ(ξ )) → (∀ ξ ϕ(ξ ) → ∀ ξ ψ(ξ ))
I
Theorem T18
Tabelle 2.10: Eine kleine Auswahl von Theoremen, die sich im prädikatenlogischen Kalkül beweisen lassen
∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ξ ϕ(ξ , ξ )
Genau wie im aussagenlogischen Fall ist das Deduktionstheorem ein wichtiger Baustein in der Beweisführung. Für geschlossene Formeln können wir die Formulierung aus Satz 2.7 eins zu eins übernehmen. Im Umgang mit freien Variablen müssen wir dagegen mehr Vorsicht walten lassen, wie die folgende Ableitungssequenz beweist: 1. { P(x) } P(x) 2. { P(x) } ∀ x P(x)
(Satz 2.4) (G)
Wäre das Deduktionstheorem uneingeschränkt gültig, so ließe sich mit P(x) → ∀ x P(x) eine Formel ableiten, die nicht allgemeingültig ist, aber genau dies darf im prädikatenlogischen Kalkül nicht möglich sein. Um eine korrekte Variante des Deduktionstheorems zu erhalten, müssen wir die Formulierung geringfügig anpassen: Satz 2.8 (Deduktionstheorem der Prädikatenlogik) Es seien ϕ, ϕ1 , . . . , ϕn und ψ beliebige prädikatenlogische Formeln. I
Ist ϕ geschlossen, dann gilt: {ϕ1 , . . . , ϕn } ∪ {ϕ} ψ ⇔ {ϕ1 , . . . , ϕn } ϕ → ψ
I
Enthält ϕ die freien Variablen ξ1 , . . . , ξn , dann gilt: {ϕ1 , . . . , ϕn } ∪ {ϕ} ψ ⇔ {ϕ1 , . . . , ϕn } (∀ ξ1 . . . ∀ ξn ϕ) → ψ
Wir wollen den Kalkül nun in Aktion erleben und exemplarisch die in Tabelle 2.10 aufgeführten Theoreme beweisen (vgl. [117]):
110
Theorem T16 ∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ζ ∀ ξ ϕ(ξ , ζ )
2 Formale Systeme
1. {∀ ξ ∀ ζ ϕ(ξ , ζ )} ∀ ξ ∀ ζ ϕ(ξ , ζ ) 2. ∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ζ ϕ(ξ , ζ )
(Satz 2.4) (A4)
3. {∀ ξ ∀ ζ ϕ(ξ , ζ )} ∀ ζ ϕ(ξ , ζ ) 4. ∀ ζ ϕ(ξ , ζ ) → ϕ(ξ , ζ )
(MP, 1,2) (A4)
5. {∀ ξ ∀ ζ ϕ(ξ , ζ )} ϕ(ξ , ζ ) 6. {∀ ξ ∀ ζ ϕ(ξ , ζ )} ∀ ξ ϕ(ξ , ζ )
(MP, 3,4) (G, 5)
7. {∀ ξ ∀ ζ ϕ(ξ , ζ )} ∀ ζ ∀ ξ ϕ(ξ , ζ ) 8. ∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ζ ∀ ξ ϕ(ξ , ζ )
(G, 6) (DT)
Theorem T17 ∀ ξ (ϕ(ξ ) → ψ(ξ )) → (∀ ξ ϕ(ξ ) → ∀ ξ ψ(ξ ))
1. {∀ ξ (ϕ(ξ ) → ψ(ξ ))} ∀ ξ (ϕ(ξ ) → ψ(ξ )) 2. {∀ ξ ϕ(ξ )} ∀ ξ ϕ(ξ ) 3. ∀ ξ (ϕ(ξ ) → ψ(ξ )) → (ϕ(ξ ) → ψ(ξ )) 4. {∀ ξ (ϕ(ξ ) → ψ(ξ ))} ϕ(ξ ) → ψ(ξ ) 5. ∀ ξ ϕ(ξ ) → ϕ(ξ ) 6. {∀ ξ ϕ(ξ )} ϕ(ξ ) 7. {∀ ξ (ϕ(ξ ) → ψ(ξ )), ∀ ξ ϕ(ξ )} ψ(ξ ) 8. {∀ ξ (ϕ(ξ ) → ψ(ξ )), ∀ ξ ϕ(ξ )} ∀ ξ ψ(ξ ) 9. {∀ ξ (ϕ(ξ ) → ψ(ξ ))} ∀ ξ ϕ(ξ ) → ∀ ξ ψ(ξ ) 10. ∀ ξ (ϕ(ξ ) → ψ(ξ )) → (∀ ξ ϕ(ξ ) → ∀ ξ ψ(ξ ))
(Satz 2.4) (Satz 2.4) (A4) (MP, 1,3) (A4) (MP, 2,5) (MP, 4,6) (G, 7) (DT) (DT)
Theorem T18 ∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ξ ϕ(ξ , ξ )
1. {∀ ξ ∀ ζ ϕ(ξ , ζ )} ∀ ξ ∀ ζ ϕ(ξ , ζ )
(Satz 2.4)
∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ζ ϕ(ξ , ζ ) {∀ ξ ∀ ζ ϕ(ξ , ζ )} ∀ ζ ϕ(ξ , ζ ) ∀ ζ ϕ(ξ , ζ ) → ϕ(ξ , ξ ) {∀ ξ ∀ ζ ϕ(ξ , ζ )} ϕ(ξ , ξ ) {∀ ξ ∀ ζ ϕ(ξ , ζ )} ∀ ξ ϕ(ξ , ξ )
(A4) (MP, 1,2) (A4) (MP, 3,4) (G, 5)
7. ∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ξ ϕ(ξ , ξ )
(DT)
2. 3. 4. 5. 6.
Abschließend wollen wir uns auch hier mit der Frage beschäftigen, welche der in Definition 2.2 formulierten Eigenschaften erfüllt werden und welche nicht. Von der Korrektheit des prädikatenlogischen Kalküls können wir uns leicht überzeugen. Mit den Axiomenschemata (A1) und (A3) haben wir uns bereits in Abschnitt 2.3.2 auseinandergesetzt; sie sind so beschaffen, dass alle Instanzen allgemeingültige Formeln sind. Ferner folgt aus der Definition des Allquantors, dass auch alle Instanzen
2.5 Prädikatenlogik mit Gleichheit
der Axiomenschemata (A4) und (A5) allgemeingültige Formeln sind, und diese Eigenschaft wird sowohl durch den Modus ponens als auch durch die Generalisierungsregel erhalten. Für die Generalisierungsregel folgt dies unmittelbar aus der Art und Weise, wie wir die Allgemeingültigkeit von Formeln mit freien Variablen festgelegt haben (vgl. Definition 2.17). Damit ist der Kalkül korrekt und nach Satz 2.2 auch widerspruchsfrei. Genau wie im Fall der Aussagenlogik ist auch der prädikatenlogische Kalkül vollständig, d. h., jede allgemeingültige Formel lässt sich durch die Anwendung der Schlussregeln nach endlich vielen Schritten aus den Axiomen deduzieren. Dass es überhaupt möglich ist, einen vollständigen Kalkül für die Prädikatenlogik erster Stufe zu definieren, wissen wir seit dem Jahr 1929. Es ist das Ergebnis des berühmten Vollständigkeitssatzes, den Kurt Gödel im Rahmen seiner Dissertation bewies [62, 63]. Der prädikatenlogische Teil des formalen Systems, das Gödel für seinen Vollständigkeitsbeweis verwendete, ist mit jenem aus Tabelle 2.9 identisch. Unterschiede bestehen ausschließlich in den aussagenlogischen Axiomen. Anstelle der Axiomenschemata (A1) bis (A3) verwendete Gödel die vier von Ackermann und Hilbert eingeführten Schemata aus Tabelle 2.8. Achten Sie darauf, den Gödel’schen Vollständigkeitssatz nicht mit den beiden Unvollständigkeitssätzen zu verwechseln, die Sie in Kapitel 4 kennen lernen werden. Auch wenn ihre Namen zum Verwechseln ähnlich klingen, sind ihre inhaltliche Aussagen völlig verschieden.
2.5
Prädikatenlogik mit Gleichheit
Beim Versuch, mathematische Sachverhalte innerhalb der Prädikatenlogik zu formalisieren, werden Sie schnell bemerken, dass dies in einigen Fällen problemlos gelingt, in anderen Fällen aber nur umständlich oder gar nicht möglich ist. Um dieses Phänomen zu demonstrieren, wollen wir eine Formel konstruieren, die genau dann wahr ist, wenn das zweistellige Prädikatzeichen R als eine linkstotale, rechtseindeutige Relation R interpretiert wird. Die Eigenschaft der Linkstotalität können wir problemlos niederschreiben: ∀ x ∃ y R(x, y) Die Eigenschaft der Rechtseindeutigkeit bereitet uns dagegen Schwierigkeiten. Wir müssen ausdrücken, dass zu keinem x zwei verschiedene Elemente y und z mit R(x, y) und R(x, z) existieren. Mit anderen Worten:
111
112
2 Formale Systeme
Axiome ξ= ˙ ξ
(A6)
ξ= ˙ ζ → (ϕ(ξ , ξ ) → ϕ(ξ , ζ )) (A7) falls ζ ∈ ϕ
Tabelle 2.11: Fügen wir dem formalen System aus Abschnitt 2.4.2 die Axiome (A6) und (A7) hinzu, so entsteht ein vollständiger Kalkül für die Prädikatenlogik erster Stufe mit Gleichheit. Die Platzhalter ξ und ζ stehen für beliebige prädikatenlogische Variablen.
Gilt sowohl R(x, y) als auch R(x, z), so müssen x und y Repräsentanten desselben Elements sein. Um diesen Sachverhalt zu formalisieren, fehlt uns ein wichtiger Baustein: die Gleichheit. Eine einfache Lösungsmöglichkeit besteht darin, den Gleichheitsoperator in Form eines speziellen Prädikatzeichens ‚=‘ ˙ direkt in die Logik zu integrieren. Folgen wir diesem Ansatz, so können wir die gesuchte Formel mit Leichtigkeit aufschreiben: ∀ x ∃ y (R(x, y) ∧ ∀ z (R(x, z) → z = ˙ y)) Um die Prädikatenlogik mit Gleichheit formal zu definieren, müssen wir lediglich zwei Definitionen aus Abschnitt 2.4 anpassen. Die erste betrifft den Aufbau atomarer Formeln: Ergänzung zu Definition 2.14 I
Sind σ und τ Terme, so ist (σ = ˙ τ) eine atomare Formel.
Ferner erweitern wir die Semantikdefinition um eine Zeile, die dem Symbol ‚=‘ ˙ seine ihm zugedachte Bedeutung verleiht:
I Beispiel 1
ϕ(x, x) := (x = ˙ x)
Ergänzung zu Definition 2.16
ϕ(x, y) := (y = ˙ x)
(U, I) |= (σ = ˙ τ) :⇔ I(σ ) = I(τ) x= ˙ y → (x = ˙ x→y= ˙ x)
(A7)
I Beispiel 2
ϕ(y, y) := (y = ˙ z) ϕ(y, x) := (x = ˙ z) y= ˙ x → (y = ˙ z→x= ˙ z)
(A7)
Abbildung 2.20: In Axiom (A7) steht der Ausdruck ϕ(ξ , ξ ) für eine beliebige Formel der Prädikatenlogik erster Stufe mit Gleichheit, in der ξ ausschließlich frei und ζ gar nicht vorkommt. ϕ(ξ , ζ ) entsteht aus ϕ(ξ , ξ ), indem einige Vorkommen von ξ durch die Variable ζ ersetzt werden.
Zu guter Letzt wollen wir den in Abschnitt 2.4.2 eingeführten Kalkül durch die Hinzunahme weiterer Axiome zu einem Kalkül für die Prädikatenlogik mit Gleichheit ausbauen. Tabelle 2.11 fasst zusammen, um welche Axiome es sich hierbei handelt. Das Axiom (A6) beschreibt die Reflexivität der Gleichheitsrelation. Es ist als Axiomenschema ausgelegt, in dem wir ξ durch eine beliebige Variable ersetzen dürfen. (A7) heißt Substitutionsaxiom und ist ebenfalls als Axiomenschema ausgelegt. Hierin stehen ξ und ζ für beliebige Variablen und ϕ(ξ , ξ ) für eine Formel, in der ξ ausschließlich frei und ζ gar nicht vorkommt. ϕ(ξ , ζ ) entsteht aus ϕ(ξ , ξ ), indem einige Vorkommen von ξ , aber nicht notwendigerweise alle, durch die Variable ζ ersetzt werden (Abbildung 2.20). In Worten besagt das Substitutionsaxiom, dass kein Schaden angerichtet wird, wenn wir in einer Formel ϕ Gleiches durch Gleiches ersetzen. Als Beispiele wollen wir die Theoreme aus Tabelle 2.12 in unserem neu geschaffenen Kalkül beweisen. Inhaltlich beschreiben die Theoreme die
113
2.5 Prädikatenlogik mit Gleichheit
Ableitbare Theoreme I
I
Theorem T19 σ= ˙ σ
I
Theorem T20 σ= ˙ τ →τ = ˙ σ
Tabelle 2.12: Eine Auswahl von Theoremen der Prädikatenlogik erster Stufe mit Gleichheit (vgl. [117]). Die Platzhalter σ , τ und ρ stehen für beliebige prädikatenlogische Terme.
Theorem T21 σ= ˙ τ → (τ = ˙ ρ →σ = ˙ ρ)
Reflexivität, die Symmetrie und die Transitivität der Gleichheitsrelation. Wie schon zuvor sind (T19) bis (T21) keine Theoreme im eigentliche Sinne, sondern Schemata, in denen wir die Platzhalter σ , τ und ρ durch beliebige prädikatenlogische Terme ersetzen dürfen.
Sei ξ eine beliebige Variable. 1. 2. 3. 4.
ξ= ˙ ξ ∀ξ ξ = ˙ ξ ∀ξ ξ = ˙ ξ →σ = ˙ σ σ= ˙ σ
Theorem T19 σ= ˙ σ (A6) (G, 1) (A4) (MP, 2,3)
Seien ξ , ζ beliebige Variablen.
Theorem T20 σ= ˙ τ →τ = ˙ σ
ξ= ˙ ζ → (ξ = ˙ ξ →ζ = ˙ ξ) {ξ = ˙ ζ} ξ= ˙ ξ →ζ = ˙ ξ {ξ = ˙ ζ, ξ = ˙ ξ} ζ= ˙ ξ {ξ = ˙ ξ} ξ= ˙ ζ →ζ = ˙ ξ
(A7) (DT) (DT) (DT)
5. ξ = ˙ ξ → (ξ = ˙ ζ →ζ = ˙ ξ) 6. ξ = ˙ ξ 7. ξ = ˙ ζ →ζ = ˙ ξ
(DT) (A6) (MP, 5,6)
1. 2. 3. 4.
8. ∀ ξ (ξ = ˙ ζ →ζ = ˙ ξ) ˙ ζ →ζ = ˙ σ) 9. ∀ ξ (ξ = ˙ ζ →ζ = ˙ ξ ) → (σ = 10. σ = ˙ ζ →ζ = ˙ σ 11. ∀ ζ (σ = ˙ ζ →ζ = ˙ σ)
(MP, 8,9) (G, 10)
12. ∀ ζ (σ = ˙ ζ →ζ = ˙ σ ) → (σ = ˙ τ →τ = ˙ σ) 13. σ = ˙ τ →τ = ˙ σ
(A4) (MP, 11,12)
(G, 7) (A4)
114
Theorem T21 σ= ˙ τ → (τ = ˙ ρ →σ = ˙ ρ)
2 Formale Systeme
Seien ξ , ζ , ν beliebige Variablen. 1. ζ = ˙ ξ → (ζ = ˙ ν →ξ = ˙ ν) (A7) 2. ξ = ˙ ζ →ζ = ˙ ξ (T19) 3. (ξ = ˙ ζ →ζ = ˙ ξ ) → ((ζ = ˙ ξ → (ζ = ˙ ν →ξ = ˙ ν)) → (ξ = ˙ ζ → (ζ = ˙ ν →ξ = ˙ ν))) (T2) 4. (ζ = ˙ ξ → (ζ = ˙ ν →ξ = ˙ ν)) → (ξ = ˙ ζ → (ζ = ˙ ν →ξ = ˙ ν)) (MP, 2,3) 5. ξ = ˙ ζ → (ζ = ˙ ν →ξ = ˙ ν) (MP, 1,4) 6. ∀ ξ (ξ = ˙ ζ → (ζ = ˙ ν →ξ = ˙ ν)) (G, 5) 7. ∀ ξ (ξ = ˙ ζ → (ζ = ˙ ν →ξ = ˙ ν)) → (σ = ˙ ζ → (ζ = ˙ ν →σ = ˙ ν)) 8. σ = ˙ ζ → (ζ = ˙ ν →σ = ˙ ν) 9. ∀ ζ (σ = ˙ ζ → (ζ = ˙ ν →σ = ˙ ν)) ˙ ζ → (ζ = ˙ ν →σ = ˙ ν)) 10. ∀ ζ (σ = → (σ = ˙ τ → (τ = ˙ ν →σ = ˙ ν)) 11. σ = ˙ τ → (τ = ˙ ν →σ = ˙ ν) 12. ∀ ν (σ = ˙ τ → (τ = ˙ ν →σ = ˙ ν)) 13. ∀ ν (σ = ˙ τ → (τ = ˙ ν →σ = ˙ ν)) → (σ = ˙ τ → (τ = ˙ ρ →σ = ˙ ρ)) 14. σ = ˙ τ → (τ = ˙ ρ →σ = ˙ ρ)
(A4) (MP, 6,7) (G, 8) (A4) (MP, 9,10) (G, 11) (A4) (MP, 12,13)
Vielleicht haben Sie sich gefragt, warum wir die Gleichheit in Form eines speziell hierfür geschaffenen Prädikatzeichens in die Logik integriert haben und nicht, wie vielleicht vermutet, durch die Hinzunahme weiterer Axiome. Die Antwort ist einfach: Innerhalb der Prädikatenlogik erster Stufe ist es unmöglich, eine Formel ϕ= zu konstruieren, die genau dann wahr ist, wenn ein bestimmtes Prädikatzeichen, z. B. P, als die Gleichheitsrelation interpretiert wird: (U, I) |= ϕ= ⇔ I(P) = {(x, y) ∈ U 2 | x = y}
(2.5)
Wir werden nun aufklären, warum die Gleichheit nicht in der Prädikatenlogik erster Stufe definiert werden kann. Konkret werden wir zeigen, dass aus jedem Modell (U, I) von ϕ= , in dem P als die Gleichheit interpretiert wird, ein anderes Modell (U , I ) von ϕ= konstruiert werden kann, in dem P diese Bedeutung verliert. Dies steht im Widerspruch zu (2.5). Würde die Formel ϕ= existieren, müsste sie so beschaffen sein, dass P in jedem Modell die Gleichheit ist.
115
2.5 Prädikatenlogik mit Gleichheit
Die Individuenmenge des neuen Modells entsteht, indem wir jedes Element u ∈ U um ein Kopie u ergänzen. Ferner erweitern wir die Interpretation der Prädikat- und Funktionszeichen so, dass es keine Rolle spielt, ob wir ein Originalelement aus U oder seine Kopie vor uns haben. Wie dies konkret funktioniert, demonstriert Abbildung 2.21 am Beispiel eines zweistelligen Prädikatsymbols P und einer Interpretation (U, I) mit dem Individuenbereich U = {u1 , u2 }. In (U, I) wird P als die Gleichheit interpretiert, d. h. als diejenige Relation, die exakt die beiden Kombinationen (u1 , u1 ) und (u2 , u2 ) umfasst. In der Interpretation (U , I ) beinhaltet P dagegen die Kombinationen (u1 , u1 ), (u1 , u1 ), (u1 , u1 ), (u1 , u1 ) und (u2 , u2 ), (u2 , u2 ), (u2 , u2 ), (u2 , u2 ). Die Wahl von I (P) sorgt dafür, dass es für das Bestehen oder Nichtbestehen der Relation nun irrelevant ist, ob wir ein Originalelement u ∈ U oder dessen Kopie u betrachten. Folgerichtig haben wir keine Möglichkeit, auf der Logikebene zwischen den Originalelementen und ihren Kopien zu unterscheiden. Ist (U, I) ein Modell für ϕ= , so ist es zwangsläufig auch (U , I ). In (U , I ) wird das Prädikatzeichen P allerdings nicht mehr als die Gleichheitsrelation interpretiert, da jedes Element jetzt zusätzlich in Relation zu seiner Kopie steht. Der Widerspruch zeigt, dass die Quantifikation über die Elemente des Individuenbereichs nicht stark genug ist, um zwischen einem Element und seiner Kopie zu unterscheiden. Wenn Sie sich die vorgenommene Konstruktion ein zweites Mal betrachten, werden Sie bemerken, dass sich dahinter ein simpler mathematischer Trick verbirgt. Hinter dem Übergang von U zu U steckt eine Äquivalenzklassenbildung, die jedes Element x ∈ U mit seiner Kopie x zu einer Äquivalenzklasse [x]∼ zusammenfasst: [x]∼ = [x ]∼ = {x, x } Jetzt ist auch klar, welche Bedeutung dem Prädikatzeichen P unter der Interpretation (U , I ) zukommt: Es ist die Gleichheit zwischen den gebildeten Äquivalenzklassen. Kurzum: Erfüllt eine Interpretation (U, I) die Beziehung I(P) = {(x, y) | x = y} so gilt für die Interpretation (U , I ) das Folgende: I (P) = {(x, y) | [x]∼ = [y]∼ } Die Diskussion zeigt, dass wir mit den Mitteln der Prädikatenlogik erster Stufe den Begriff der Gleichheit nur auf der Ebene von Äquivalenzklassen erfassen können. Um den Gleichheitsbegriff auf der Individuenebene zu definieren, sind die Mittel der ersten Stufe aber ganz offensichtlich zu schwach.
I
Übergang von U zu U U = {u1 , u2 }
U = {u1 , u2 , u1 , u2 } I
Übergang von I zu I I(P) = { (u1 , u1 ), (u2 , u2 ) }
I (P) = { (u1 , u1 ), (u2 , u2 ), (u1 , u1 ), (u2 , u2 ), (u1 , u1 ), (u2 , u2 ),
(u1 , u1 ), (u2 , u2 ) } Abbildung 2.21: Die Gleichheitsrelation lässt sich nicht innerhalb der Prädikatenlogik erster Stufe definieren. Aus jedem Modell (U, I), das ein Prädikatzeichen als die Gleichheit interpretiert, lässt sich ein Modell (U , I ) konstruieren, in der das Prädikatzeichen seine ihm zugedachte Bedeutung verliert.
116
2 Formale Systeme
2.6
Prädikatenlogik höherer Stufe
In den vorangegangenen Abschnitten haben wir festgelegt, dass die prädikatenlogischen Quantoren ‚∀‘ und ‚∃‘ ausschließlich auf Variablen angewendet werden dürfen. Das bedeutet, dass wir zwar freizügig über die Elemente des Individuenbereichs quantifizieren können, nicht aber über Funktionen und Prädikate. Solche Logiken heißen Logiken erster Stufe (first order logics). In diesem Abschnitt wollen wir uns von dieser Fessel befreien und den Weg zu Logiken höherer Stufe (higher-order logics) ebnen. Die Frage, die uns dabei am meisten beschäftigen wird, ist eine naheliegende: Können wir eine Logik erschaffen, die ausdrucksstärker ist als die PL1, die Prädikatenlogik erster Stufe, oder wird sich die Quantifikation über Prädikate und Funktionen lediglich als eine Frage des Komforts erweisen? Am Ende dieses Abschnitts wird die Erkenntnis stehen, dass wir die Ausdrucksstärke der Prädikatenlogik tatsächlich erhöhen können. Für Euphorie gibt es trotzdem keinen Grund, denn der Preis dafür ist hoch.
2.6.1
Prädikatvariable Prädikatvariable ∃ P ∀ x ∀ y (P(x, y) ↔ ∀ R (R(x) ↔ R(y)))
Individuenvariablen
Funktionsvariable Prädikatvariable ∀ P (∀ x ∃ y P(x, y) ↔ ∃ f P(x, f(x)))
Individuenvariablen Abbildung 2.22: Prädikatenlogische Formeln zweiter Stufe
Syntax und Semantik
Wir beginnen mit den nötigen syntaktischen Modifikationen, um die Prädikatenlogik erster Stufe zu einer Logik höherer Stufe auszubauen. Als erstes ergänzen wir die Menge VΣ einer prädikatenlogischen Signatur um zwei neue Variablentypen. Die Variablen des ersten Typs bezeichnen wir als Prädikatvariablen, die des zweiten als Funktionsvariablen. Um die verschiedenen Variablentypen auch optisch unterscheiden zu können, verwenden wir für Prädikatvariablen die Symbole P, Q, R, . . . und für Funktionsvariablen die Symbole f, g, h, . . .. Jede der neu eingeführten Variablen besitzt eine festgelegte Stelligkeit und darf überall dort auftauchen, wo in prädikatenlogischen Ausdrücken erster Stufe ein Prädikatzeichen bzw. ein Funktionssymbol mit der gleichen Stelligkeit stehen darf. Lassen wir jetzt noch zu, dass die Quantoren ‚∀‘ und ‚∃‘ auf die Variablen jeden Typs angewendet werden dürfen, so sind wir am Ziel. Wir haben die Prädikatenlogik zweiter Stufe, kurz PL2, erreicht (Abbildung 2.22). Als nächstes wollen wir den Quantoren ‚∀‘ und ‚∃‘ ihre intuitive Bedeutung verleihen, zunächst in umgangssprachlicher Form: ∀P ... =
„Für alle Prädikate gilt . . . “ ∃P ... =
„Es existiert ein Prädikat, für das gilt: . . . “
117
2.6 Prädikatenlogik höherer Stufe
∀f ... =
„Für alle Funktionen gilt . . . “ ∃f ... =
„Es existiert eine Funktion, für die gilt: . . . “ In der formalen Definition der Semantik werden wir die Bezeichner I[ξ /P] und I[ξ / f ] verwenden, in Anlehnung an den Bezeichner I[ξ /u] aus Definition 2.16. Ist (U, I) eine prädikatenlogische Interpretation und ξ eine Prädikatvariable, so ist mit (U, I[ξ /P] ) jene Interpretation gemeint, die ξ die Relation P zuordnet und ansonsten mit (U, I) identisch ist. Das gleiche gilt für I[ξ / f ] auf der Ebene der Funktionen. Mit den eingeführten Bezeichnern können wir die Semantik der Prädikatenlogik zweiter Stufe in wenigen Zeilen niederschreiben: I
ξ ist eine Prädikatvariable der Stelligkeit n (U, I) |= ∀ ξ ϕ :⇔ Für alle P ⊆ U n ist (U, I[ξ /P] ) |= ϕ (U, I) |= ∃ ξ ϕ :⇔ Es gibt ein P ⊆ U n mit (U, I[ξ /P] ) |= ϕ
I
ξ ist eine Funktionsvariable der Stelligkeit n (U, I) |= ∀ ξ ϕ :⇔ Für alle f : U n → U ist (U, I[ξ / f ] ) |= ϕ (U, I) |= ∃ ξ ϕ :⇔ Es gibt ein f : U n → U mit (U, I[ξ / f ] ) |= ϕ
Dies ist die Standardsemantik der Prädikatenlogik zweiter Stufe.
Betrachten wir ein einstelliges Prädikatzeichen P von einem mengentheoretischen Standpunkt, so können wir es als Teilmenge des Individuenbereichs interpretieren; P repräsentiert die Teilmenge, die genau jene Elemente enthält, für die P wahr ist. Dann ist eine Formel der Bauart ∀ P aber nichts anderes als eine Aussage, die über Teilmengen des Individuenbereichs quantifiziert. Wir können jetzt noch einen Schritt weiter gehen und eine neue Variablenklasse einführen, die eine Quantifikation über Teilmengen von Teilmengen gestattet. Auf diesem Weg gelangen wir zur Prädikatenlogik dritter Stufe. In dieser Logik können wir nicht nur über Elemente der Individuenmenge sowie Prädikate und Funktionen, sondern zusätzlich über Eigenschaften von Prädikaten und Funktionen quantifizieren. Auf dem eingeschlagenen Weg können wir zu immer neuen Logiken vordringen. Als nächstes erreichen wir die Prädikatenlogik vierter Stufe, dann die Prädikatenlogik fünfter Stufe und so fort.
Wir wollen nun ausloten, welche Freiheiten sich aus der vorgenommenen Logikerweiterung ergeben. Hierzu betrachten wir zunächst zwei prädikatenlogische Formeln erster Stufe. Eine davon liest sich so: ϕI := ∀ x ∀ y (f(x) = ˙ f(y) → x = ˙ y) Die Formel ist genau dann wahr, wenn f als injektive Funktion interpretiert wird (Abbildung 2.23 oben). Auf die gleiche Weise können wir die Surjektivität einer Funktion beschreiben (Abbildung 2.23 unten). Auch hier reicht eine Formel erster Stufe aus:
I Injektive Funktionen
„Jedes Element der Zielmenge besitzt höchstens ein Urbild.“
ϕS := ∀ y ∃ x (y = ˙ f(x)) Jetzt nutzen wir die volle Ausdrucksstärke der PL2 und kombinieren ϕI und ϕS in der folgenden Weise: (2.6) ϕ
I Surjektive Funktionen
„Jedes Element der Zielmenge besitzt mindestens ein Urbild.“
Abbildung 2.23: Injektive und surjektive Funktionen
118
2 Formale Systeme
...
... ... ...
formulieren können, verdeutlicht die Eleganz, die alle Logiken höherer Stufe unzweifelhaft besitzen. Die eigentliche Bedeutung dieser Formel ist aber eine andere. Ein wenig Wissen über injektive und surjektive Funktionen reicht aus, um zu erkennen, dass ϕ
...
(U, I) |= ϕ
(2.7)
... ...
Damit ist es uns gelungen, den Begriff der Endlichkeit innerhalb der Prädikatenlogik zweiter Stufe präzise zu beschreiben. Wir sagen, der Begriff der Endlichkeit wird durch ϕ
f
f
f
f
f
f
f
f
...
f
...
f
...
f
...
...
f
f
... ...
x, f (x), f ( f (x)), f ( f ( f (x))), . . . Abbildung 2.24: Für jede endliche oder abzählbare Menge existieren ein Element x und eine Funktion f , so dass sich die Elemente durch die Folge x, f (x), f ( f (x)), . . . der Reihe nach aufzählen lassen.
Eine genauso interessante Formel ist diese hier: ϕ≤N := ∃ f ∃ x ∀ P (P(x) ∧ ∀ y (P(y) → P(f(y))) → ∀ x P(x)) Die Formel besagt, dass wir die Elemente des Individuenbereichs in einer Sequenz der Form x, f (x), f ( f (x)), f ( f ( f (x))), f ( f ( f ( f (x)))), . . .
(2.8)
erfassen können. Die Variable x beschreibt das erste Element, und die Funktion f gibt an, wie wir von einem Element zum nächsten gelangen. Dass tatsächlich alle Elemente des Individuenbereichs erfasst werden, stellt die Formel wie folgt sicher: Sie besagt, dass sämtliche Elemente des Individuenbereichs bereits dann eine Eigenschaft P besitzen, wenn sie von allen in (2.8) aufgelisteten Elementen besessen wird. Wäre der Individuenbereich überabzählbar, so wäre diese Aussage nicht für alle Eigenschaften P erfüllt, egal, wie wir x und f auch wählen. Auf der anderen Seite können wir für jeden Individuenbereich, der endlich oder abzählbar ist, ein Element x und eine Funktion f finden, so dass alle Individuenelemente irgendwo in der unendlich langen Kette (2.8) vorkommen (Abbildung 2.24). Somit gilt (U, I) |= ϕ≤N ⇔ U ist höchstens abzählbar
(2.9)
Verknüpfen wir ϕ≤N und ¬ϕ
(2.10)
2.6 Prädikatenlogik höherer Stufe
Die Formeln ϕ
Im direkten Vergleich mit der Prädikatenlogik erster Stufe basiert die Definition der PL2-Semantik in viel stärkerem Maß auf dem naiven Mengenbegriff. Um die Bedeutung der Quantifikationen ∀ P ϕ oder ∃ P ϕ festzulegen, mussten wir unweigerlich auf das Konstrukt der Potenzmenge zurückgreifen und damit gleichsam darauf vertrauen, dass sich hinter diesem Begriff keine Widersprüche verbergen. Vor dem Hintergrund der mengentheoretischen Paradoxien wird dieses Vorgehen von manchen Logikern als illegitim zurückgewiesen.
I
Die Tatsache, dass Begriffe existieren, die sich in der PL2, nicht aber in der PL1 definieren lassen, bedeutet keinesfalls, dass wir mit der PL1 eine ausdrucksschwache Logik vor uns haben. In Kapitel 3 werden wir mit der Zermelo-Fraenkel-Mengenlehre eine sogenannte
119
120
2 Formale Systeme
Theorie erster Stufe kennen lernen, die stark genug ist, um nahezu alle Gebiete der gewöhnlichen Mathematik zu formalisieren. In den meisten Fällen gibt es daher keinen Grund, den sicheren Hafen der PL1 zu verlassen. I
Legen wir die Standardsemantik zu Grunde, so ist die PL2 im Gegensatz zur PL1 nicht mehr vollständig. Es ist also nicht mehr möglich, ein korrektes formales System zu konstruieren, in dem alle allgemeingültigen PL2-Formeln aus den Axiomen abgeleitet werden können. In Kapitel 4 werden Sie erkennen, warum die Unvollständigkeit der PL2 unvermeidbar ist. Sie ist eine direkte Konsequenz aus dem ersten Gödel’schen Unvollständigkeitssatz und der Tatsache, dass sich die natürlichen Zahlen innerhalb der Prädikatenlogik zweiter Stufe eindeutig axiomatisieren lassen.
2.6.2
Henkin-Interpretation
Die in der Standardsemantik festgelegte Interpretation der Quantoren ‚∀‘ und ‚∃‘ ist intuitiv naheliegend, aber nicht die einzig mögliche. Im Jahr 1950 schlug der US-amerikanische Logiker Leon Albert Henkin eine alternative Semantik vor, die wir jetzt in ihren Grundzügen darstellen wollen [76] (Abbildung 2.25). Im Zentrum der Henkin-Semantik steht die Idee, mit den Quantoren ‚∀‘ und ‚∃‘ nicht mehr über alle möglichen Relationen bzw. Funktionen zu iterieren, sondern nur noch über eine vorher festgelegte Auswahl. Zu diesem Zweck existieren in einer Henkin-Interpretation (U, I) für jede positive natürliche Zahl n zwei dedizierte Mengen R(n) und F (n). Die Menge R(n) enthält eine Auswahl an n-stelligen Relationen über dem Individuenbereich U, und F (n) enthält eine Auswahl an n-stelligen Funktionen. Die Bedeutung der Quantoren ‚∀‘ und ‚∃‘ ist folgendermaßen festgelegt: I
(U, I) |= ∀ ξ ϕ :⇔ Für alle P ∈ R(n) ist (U, I[ξ /P] ) |= ϕ
Leon Albert Henkin (1921 – 2006) [159] Abbildung 2.25: Dem US-amerikanischen Logiker Leon Albert Henkin verdanken wir wichtige Erkenntnisse auf dem Gebiet der Typentheorie. Im Jahr 1950 schuf er mit der Henkin-Semantik eine Alternative zur Standardsemantik der Prädikatenlogik höherer Stufe.
ξ ist eine Prädikatvariable der Stelligkeit n
(U, I) |= ∃ ξ ϕ :⇔ Es gibt ein P ∈ R(n) mit (U, I[ξ /P] ) |= ϕ I
ξ ist eine Funktionsvariable der Stelligkeit n (U, I) |= ∀ ξ ϕ :⇔ Für alle f ∈ F (n) ist (U, I[ξ / f ] ) |= ϕ (U, I) |= ∃ ξ ϕ :⇔ Es gibt ein f ∈ F (n) mit (U, I[ξ / f ] ) |= ϕ
121
2.6 Prädikatenlogik höherer Stufe
pr 1 Nov
Der US-amerikanische Logiker Leon Albert Henkin wurde am 19.4.1921 in Brooklyn, New York, geboren. Sein akademischer Werdegang führte ihn über das Columbia College an die renommierte Universität in Princeton, die ihm 1945, als Schüler von Alonzo Church, die Doktorwürde verlieh. 1953 wechselte Henkin an die University of California in Berkeley, wo er 1958 zum Professor berufen wurde. Seiner neuen akademischen Wirkungsstätte blieb er bis zu seiner Pensionierung im Jahr 1991 treu. Heute wird sein Name vor allem mit einem Vollständigkeitsbeweis der Prädikatenlogik erster Stufe verbunden, den Henkin im Jahr 1949 veröffentlichte [71, 75]. Neu war sein Ergebnis nicht, schließlich hatte Kurt Gödel die Vollständigkeit der PL1 rund 20 Jahre zuvor bereits bewiesen. Trotzdem ist der Beweis in zweierlei Hinsicht von Bedeutung. Zum
19 A
1921 2006
einen ist er deutlich einfacher als Gödels Originalbeweis, so dass viele moderne Lehrbücher heute der Henkin’schen und nicht der Gödel’schen Argumentationslinie folgen. Zum anderen lassen sich vieler seiner Grundideen auch auf Logiken höherer Stufe übertragen. Henkin hatte dies schon während seiner Doktorarbeit erkannt und wies auch in [75] darauf hin: „In the second place the proof suggests a new approach to the problem of completeness for functional calculi of higher order. Both of these matters will be taken up in future papers.“ Die versprochene Ausarbeitung folgte bereits ein Jahr später. In [76] führte er jene Interpretationen ein, die wir heute als Henkin-Interpretationen bezeichnen. Mit dieser Arbeit begründete er die wichtigste Alternative zur Standardsemantik der Logiken höherer Stufe. Leon Albert Henkin starb am 1. November 2006 im Alter von 85 Jahren.
Dies ist die Henkin-Semantik der Prädikatenlogik zweiter Stufe. Eine Einschränkung gibt es noch: In einer Henkin-Interpretation dürfen die Mengen R(n) und F (n) nicht vollständig frei gewählt werden. Sie müssen die folgenden beiden Bedingungen erfüllen: I
Alle Instanzen des Komprehensionsschemas ∃ ξ (∀ x1 . . . ∀ xn (ξ (x1 , . . . , xn ) ↔ ϕ(x1 , . . . , xn ))) sind wahr. In diesem Schema steht der Platzhalter ξ für eine beliebige Prädikatvariable der Stelligkeit n, und ϕ steht für eine Formel mit n freien Variablen, in der ξ nicht vorkommt. Das Komprehensionsschema stellt sicher, dass all diejenigen Relationen in R(n) enthalten sind, die sich durch eine Formel ϕ mit n freien Variablen charakterisieren lassen.
I
Alle Instanzen des Funktionsdefinitionsschemas ∀ ξ (∀ x1 . . . ∀ xn ∃1 y ξ (x1 , . . . , xn , y) → ∃ ν (∀ x1 . . . ∀ xn ξ (x1 , . . . , xn , ν(x1 , . . . , xn )))) sind wahr. Hierin bezeichnet ξ eine Prädikatvariable der Stelligkeit n + 1 und ν eine Funktionsvariable der Stelligkeit n. Den Ausdruck ∃1 y benutzen wir als Kurzschreibweise, um auszudrücken, dass die nachfolgende Formel für genau eine Belegung von y wahr ist. In Worten besagt das Funktionsdefinitionsschema, dass jede n-stellige
122
2 Formale Systeme
Interpretationen
Henkin-Interpretationen
Henkin-erfüllbare Formeln
ψ
Erfüllbare Formeln
Zwischen der Standardsemantik und der Henkin-Semantik besteht ein enger Zusammenhang. Da wir R(n) und F (n) so wählen können, dass ausnahmslos alle n-stelligen Relationen oder Funktionen darin enthalten sind, ist jede Interpretation der Standardsemantik immer auch eine Henkin-Interpretation, aber nicht umgekehrt. Das bedeutet, dass jede Formel, die unter allen Henkin-Interpretationen wahr ist, auch unter allen Interpretationen der Standardsemantik wahr sein muss. Genauso ist jede Formel, die unter mindestens einer Interpretation der Standardsemantik wahr ist, auch unter mindestens einer Henkin-Interpretation wahr. Damit offenbart sich uns der folgende Zusammenhang (Abbildung 2.26): ϕ ist Henkin-allgemeingültig ⇒ ϕ ist allgemeingültig ϕ ist erfüllbar ⇒ ϕ ist Henkin-erfüllbar
Henkinallgemeingültige Formeln
Die Umkehrungen dieser Aussagen gelten nicht.
Allgemeingültige Formeln
Unerfüllbare Formeln Henkinunerfüllbare Formeln
Funktion, die sich mithilfe einer linkstotalen, rechtseindeutigen Relation aus R(n + 1) beschreiben lässt, auch in der Menge F (n) enthalten sein muss. Folgerichtig sind die Mengen R(n + 1) und F (n) in einer Henkin-Interpretation nicht unabhängig voneinander.
¬ψ
Abbildung 2.26: Zwischen der Standardsemantik und der Henkin-Semantik besteht ein enger Zusammenhang. So ist jede Henkin-allgemeingültige Formel immer auch allgemeingültig und jede erfüllbare Formel immer auch Henkin-erfüllbar.
Mit der Henkin-Semantik gewinnen wir eine verloren geglaubte Eigenschaft zurück. Im Gegensatz zur Standardsemantik ist sie vollständig, d. h., es existieren formale Systeme, in denen sich die Henkinallgemeingültigen Formeln – und nur diese – aus den Axiomen ableiten lassen. Bei aller Euphorie dürfen wir dabei zwei Punkte niemals aus den Augen verlieren. Zum einen tragen die Quantoren in der HenkinSemantik nicht mehr die intuitive Bedeutung in sich, die wir ihnen gerne zukommen lassen möchten. Zum anderen verliert die Prädikatenlogik zweiter Stufe an Ausdrucksstärke, wenn wir die Standardsemantik durch die Henkin-Semantik ersetzen. Bereits so einfache Strukturen wie die natürlichen Zahlen lassen sich dann nicht mehr eindeutig erfassen. An dieser Stelle beginnen wir den Sog des ersten Gödel’schen Unvollständigkeitssatzes zu spüren, der uns von Kapitel zu Kapitel stärker in seinen Bann ziehen wird. Doch bevor wir in Kapitel 4 klären, was sich hinter diesen mysteriös anmutenden Sätzen im Detail verbirgt, wollen wir unseren Blick in Kapitel 3 zunächst auf die Fundamente richten, auf denen das verästelte Gebäude der modernen Mathematik errichtet ist.
123
2.7 Übungsaufgaben
2.7
Übungsaufgaben
Am Beispiel der Kalküle E, E2 , . . . , E6 haben wir grundlegende Eigenschaften formaler Systeme herausgearbeitet. a) Rekapitulieren Sie die Eigenschaften der verschiedenen Systeme, indem Sie die nachstehende Tabelle vervollständigen: E
E2
E3
E4
Widerspruchsfrei
Negationsvollständig
Korrekt Vollständig
E5
Aufgabe 2.1 Webcode 2763
E6
b) Angenommen, das Alphabetzeichen ‚>‘ wird nicht mehr als „größer“, sondern als „größer oder gleich“ interpretiert. Ist das System E4 dann weiterhin widerspruchsfrei, negationsvollständig, korrekt und vollständig? c) Ist es möglich, die Interpretationen der Symbole ‚>‘ und ‚=‘ so abzuändern, dass der Kalkül E3 korrekt wird?
Betrachten Sie die nachstehenden fünf Axiome, die eine Reihe von Eigenschaften zweier Klassen K und L festlegen. Sie stammen aus [123] und wurden in ihrer umgangssprachlichen Form belassen: 1. Je zwei beliebige Elemente von K sind in genau einem Element von L enthalten. 2. Kein Element von K ist in mehr als zwei Elementen von L enthalten. 3. Die Elemente von K sind nicht alle in einem einzigen Element von L enthalten. 4. Je zwei beliebige Elemente von L enthalten genau ein Element von K [gemeinsam]. 5. Kein Element von L enthält mehr als zwei Elemente von K. Unter der Verwendung der üblichen mathematischen Schlussregeln lassen sich aus den Axiomen verschiedene Konsequenzen ziehen. Ist es möglich, einen Widerspruch abzuleiten? Wie könnte ein formaler Beweis der Widerspruchsfreiheit gelingen?
Aufgabe 2.2 Webcode 2129
124
Aufgabe 2.3 Webcode 2748
2 Formale Systeme
In dieser Aufgabe betrachten wir vier Kalküle über einer rudimentären Sprache. Insgesamt lassen sich nur 42 Formeln bilden, die durch das Einsetzen der Terme 0, . . . , 6 in die Formeln ϕ1 (ξ ), ϕ2 (ξ ), ϕ3 (ξ ), ¬ϕ1 (ξ ), ¬ϕ2 (ξ ) und ¬ϕ3 (ξ ) entstehen. Die folgende Matrix gibt an, welche der 42 Aussagen wahr und welche falsch sind: 0
1
2
3
4
5
6
ϕ1 (ξ )
|=
|=
|=
|=
|=
|=
|=
ϕ2 (ξ )
|=
|=
|=
|=
|=
|=
|=
ϕ3 (ξ )
|=
|=
|=
|=
|=
|=
|=
¬ϕ1 (ξ )
|=
|=
|=
|=
|=
|=
|=
¬ϕ2 (ξ )
|=
|=
|=
|=
|=
|=
|=
¬ϕ3 (ξ )
|=
|=
|=
|=
|=
|=
|=
Die Axiome und die Schlussregeln der vier Kalküle sind nicht bekannt. Dafür sind wir für jeden Kalkül im Besitz einer Matrix, aus der wir ablesen können, welche Formeln aus den Axiomen hergeleitet werden können und welche nicht. Geben Sie für jeden Kalkül an, ob er vollständig, korrekt, widerspruchsfrei oder negationsvollständig ist. K1
0
1
2
3
4
5
6
K2
0
1
2
3
4
5
6
ϕ1 (ξ )
ϕ1 (ξ )
ϕ2 (ξ )
ϕ2 (ξ )
ϕ3 (ξ )
ϕ3 (ξ )
¬ϕ1 (ξ )
¬ϕ1 (ξ )
¬ϕ2 (ξ )
¬ϕ2 (ξ )
¬ϕ3 (ξ )
¬ϕ3 (ξ )
K3
0
1
2
3
4
5
6
K4
0
1
2
3
4
5
6
ϕ1 (ξ )
ϕ1 (ξ )
ϕ2 (ξ )
ϕ2 (ξ )
ϕ3 (ξ )
ϕ3 (ξ )
¬ϕ1 (ξ )
¬ϕ1 (ξ )
¬ϕ2 (ξ )
¬ϕ2 (ξ )
¬ϕ3 (ξ )
¬ϕ3 (ξ )
125
2.7 Übungsaufgaben
Aufgabe 2.4 Webcode 2890
Die Kalküle P1 und P2 seien durch die folgenden Axiome und Schlussregeln definiert: Axiome (Kalkül P1 ) (11,110)
Axiome (Kalkül P2 ) (A1)
Schlussregeln (Kalkül P1 )
(01,011)
(A1’)
Schlussregeln (Kalkül P2 )
(ϕ, ψ) (ϕ011, ψ100)
(S1)
(ϕ, ψ) (ϕ001, ψ0)
(S1’)
(ϕ, ψ) (ϕ11, ψ110)
(S2)
(ϕ, ψ) (ϕ01, ψ011)
(S2’)
(ϕ, ψ) (ϕ010, ψ011)
(S3)
(ϕ, ψ) (ϕ01, ψ101)
(S3’)
(ϕ, ψ) (ϕ10, ψ001)
(S4’)
Beide Kalküle arbeiten nach dem gleichen Grundprinzip. Das Axiom gibt ein Paar binärer Zeichenketten vor, und die Schlussregeln bestimmen, wie sich die Zeichenketten sukzessive verlängern lassen. Beide Kalküle unterscheiden sich lediglich in den binären Teilsequenzen, die fest in das Axiom und die Schlussregeln hineincodiert sind. a) Zu welchem Kalkül gehört der folgende Beweis? Geben Sie rechts für jeden Ableitungsschritt an, welche Schlussregel angewendet wurde. 1. (01,011)
(
)
2. (0110,011001)
(
)
3. (011001,011001101)
(
)
4. (01100110,011001101001)
(
)
5. (0110011010,011001101001001)
(
)
b) Lässt sich in den Kalkülen P1 und P2 ein Theorem der Form (ϕ, ϕ) ableiten? c) Existieren für die Kalküle P1 und P2 Entscheidungsverfahren? d) Gibt es ein Verfahren, das für alle Kalküle obigen Typs entscheidet, ob ein Theorem der Form (ϕ, ϕ) abgeleitet werden kann?
126
Aufgabe 2.5 Webcode 2235
2 Formale Systeme
Ergänzen Sie die Wahrheitstafeln der folgenden aussagenlogischen Formeln. Sind die Formeln erfüllbar, allgemeingültig oder unerfüllbar? I
ϕ1 = (¬A ∨ B) ∧ (¬B ∨ C) ∧ (¬C ∨ A) A
I
C
¬A ∨ B
¬B ∨ C
¬C ∨ A
(¬A ∨ B) ∧ (¬B ∨ C)
ϕ1
A→C
(A → B) ∧ (B → C)
ϕ2
AC
(A B) ∧ (B C)
ϕ3
ϕ2 = (A → B) ∧ (B → C) → (A → C) A
I
B
B
C
A→B
B→C
ϕ3 = (A B) ∧ (B C) ∧ (A C) A
B
C
AB
BC
127
2.7 Übungsaufgaben
Das Dirichlet’sche Schubfachprinzip ist nach dem deutschen Mathematiker Peter Gustav Lejeune Dirichlet benannt. Es besagt, dass eine endliche Menge M nicht injektiv auf eine Menge N abgebildet werden kann, wenn N weniger Elemente enthält als M. Jedem von uns ist das Schubfachprinzip aus dem Alltag geläufig. Verteilen wir m Gegenstände auf n Schubfächer und gilt m > n, so muss mindestens ein Schubfach mehrere Gegenstände enthalten. Im angelsächsischen Raum wird das Dirichlet’sche Schubfachprinzip als pigeonhole principle (Taubenschlagprinzip) bezeichnet. Auch hier ist die angestellte Überlegung die gleiche: Verteilen sich m Tauben auf n Taubenschläge und gilt m > n, so ist mindestens ein Taubenschlag mehrfach besetzt.
Aufgabe 2.6 Webcode 2857
Peter Gustav Lejeune Dirichlet (1805 – 1859) Ihre Aufgabe ist es, das Dirichlet’sche Schubfachprinzip für n Gegenstände und n − 1 Schubfächer zu formalisieren. Führen Sie hierzu für jede mögliche Kombination von Gegenständen und Schubfächern eine aussagenlogische Variable Aij ein, die genau dann den Wert 1 annimmt, wenn sich der i-te Gegenstand im j-ten Schubfach befindet.
In Abschnitt 2.3.1 haben wir gezeigt, dass sich jede aussagenlogische Formel so umschreiben lässt, dass ausschließlich die Operatoren ‚¬‘ und ‚→‘ darin vorkommen. Wir sagen, die Menge {¬, →} ist ein vollständiges Operatorensystem. In dieser Aufgabe betrachten wir die binären Operatoren ‚∧‘ (nand) und ‚∨‘ (nor) mit I |= (ϕ ∧ ψ) :⇔ I |= ϕ oder I |= ψ I |= (ϕ ∨ ψ) :⇔ I | = ϕ und I | = ψ a) Zeigen Sie, dass die Mengen { ∧ } und { ∨ } vollständige Operatorensysteme sind. b) Weisen Sie nach, dass ‚∧‘ und ‚∨‘ die beiden einzigen binären Operatoren sind, die allein ein vollständiges Operatorensystem bilden.
Aufgabe 2.7 Webcode 2123
128
Aufgabe 2.8 Webcode 2881
2 Formale Systeme
Beweisen Sie die nachstehenden Formeln im aussagenlogischen Kalkül: a) (ϕ → (ψ → χ)) → (ψ → (ϕ → χ)) b) ϕ → (ψ → ¬(ϕ → ¬ψ))
Aufgabe 2.9 Webcode 2698
In Abschnitt 2.5 haben Sie die Prädikatenlogik erster Stufe mit Gleichheit kennen gelernt. Ist es in dieser Logik möglich, Formeln mit den nachstehenden Eigenschaften zu konstruieren?
Aufgabe 2.10 Webcode 2042
Eine Relation R heißt
(U, I) |= ϕ≥n ⇔ U besitzt mindestens n Elemente (U, I) |= ϕ≤n ⇔ U besitzt höchstens n Elemente (U, I) |= ϕ=n ⇔ U besitzt genau n Elemente
I
reflexiv, wenn R(x, x) für alle x gilt,
I
linkskomparativ, wenn aus R(x, y) und R(x, z) immer R(y, z) folgt,
I
symmetrisch, wenn aus R(x, y) immer R(y, x) folgt.
Formalisieren Sie die Aussage „Jede reflexive, linkskomparative Relation ist symmetrisch“ in der Prädikatenlogik erster Stufe. Versuchen Sie anschließend, die Aussage im prädikatenlogischen Kalkül zu verifizieren. Um die Aufgabe nicht unnötig zu erschweren, dürfen Sie alle aussagenlogischen Tautologien als bereits bewiesen ansehen.
Aufgabe 2.11 Webcode 2128
Nehmen Sie an, die Schlussregeln eines formalen Systems seien so beschaffen, dass die erzeugten Theoreme in jedem Schritt länger werden, d. h., die Konklusion stets aus mehr Zeichen besteht als die Prämissen.
ϕ1
→
ϕ2 |ϕ2 | > |ϕ1 |
→
→
ϕ3 |ϕ3 | > |ϕ2 |
Existiert für ein solches System immer ein Entscheidungsverfahren?
ϕ4 |ϕ4 | > |ϕ3 |
2.7 Übungsaufgaben
129
In Abschnitt 2.6 haben wir erarbeitet, wie sich der Begriff der Endlichkeit innerhalb der Prädikatenlogik zweiter Stufe definieren lässt. Im Kern stand die Idee, mithilfe einer Formel zu behaupten, jede injektive Funktion sei surjektiv. Hätten wir den Begriff auch über die Forderung definieren können, dass jede surjektive Funktion auch injektiv ist?
Aufgabe 2.12 Webcode 2952
Welche Begriffe werden durch die nachstehenden Formeln definiert?
Aufgabe 2.13 Webcode 2999
a) ∀ f (∀ x ∃ y (x = ˙ f(y)) → ∀ x ∀ y (f(x) = ˙ f(y) → x = ˙ y)) b) ∃ R (∀ x ∀ y ∀ z (R(x, y) ∧ R(y, z) → R(x, z)) ∧ ∀ x (¬R(x, x) ∧ ∃ y R(x, y)))
3 Fundamente der Mathematik
„Aus dem Paradies, das Cantor uns geschaffen hat, soll uns niemand vertreiben können.“ David Hilbert [81] In Kapitel 2 haben wir die Aussagenlogik und die Prädikatenlogik eingeführt und gezeigt, wie sich die Schlussweisen der gewöhnlichen Mathematik innerhalb formaler Systeme nachbilden lassen. In diesem Kapitel werden wir auf der Prädikatenlogik aufbauen und sie durch die Hinzunahme neuer Axiome zu sogenannten Theorien erweitern. Konkret verstehen wir unter einer mathematischen Theorie ein formales System, dessen Axiome in zwei Gruppen unterteilt sind. I
Die Theorieaxiome (proper axioms) legen die Beziehungen fest, die zwischen den modellierten Objekten bestehen, und verleihen einer Theorie ihr individuelles Gesicht. Beispielsweise beschreiben die Theorieaxiome der Peano-Arithmetik die charakteristischen Eigenschaften der natürlichen Zahlen und sorgen dafür, dass die Symbole ‚+‘ und ‚ב ihre vertraute arithmetische Bedeutung erhalten. In analoger Weise legen die Theorieaxiome der Zermelo-FraenkelMengenlehre fest, welche Beziehungen zwischen jenen Objekten bestehen, die wir landläufig als Mengen bezeichnen.
I
Die logischen Axiome (logical axioms) definieren den mathematischen Schlussapparat eines formalen Systems. Auch wenn sie bei der Diskussion von Theorien häufig außer Acht gelassen werden, sind sie nicht weniger wichtig. Erst sie versetzen uns in die Lage, logische Folgerungen aus den Theorieaxiomen abzuleiten. Sind die logischen Axiome die in Abschnitt 2.4 eingeführten Axiome der Prädikatenlogik, so sprechen wir von einer Theorie erster Stufe (first order theory). Liegt dagegen die Prädikatenlogik zweiter Stufe zugrunde, so sprechen wir von einer Theorie zweiter Stufe (second order theory) und so fort.
Den einleitenden Worten wollen wir Taten folgen lassen und mit der Peano-Arithmetik und der Zermelo-Fraenkel-Mengenlehre die beiden wichtigsten Theorien erster Stufe detailliert untersuchen.
Bei einem Blick in andere Bücher werden Sie bemerken, dass mitunter eine Unterscheidung zwischen dem Begriff der Theorie und dem Begriff der axiomatisierbaren Theorie vorgenommen wird. Auf den ersten Blick wirft dieses Vorgehen Rätsel auf, da wir ohne Axiome keine Theorie formulieren können. Ist damit nicht jede Theorie trivialerweise axiomatisiert? Und wenn ja, warum existiert dann überhaupt eine derartige Unterscheidung? Der scheinbare Widerspruch löst sich dadurch auf, dass der Begriff der Theorie in der Literatur nicht einheitlich definiert ist. Manchmal wird er nicht als Synonym für eine formales System, sondern als Synonym für eine Formelmenge M verwendet, die unter der logischen Folgerungsrelation abgeschlossen ist (aus M |= ϕ folgt ϕ ∈ M). In Büchern, in denen diese Definition zugrunde gelegt ist, erhält der Begriff der axiomatisierbaren Theorie eine ganz natürliche Bedeutung. Eine Theorie M ist genau dann axiomatisierbar, wenn ein formales System existiert, in dem die Formeln aus M, und nur diese, in endlich vielen Schritten aus den Axiomen abgeleitet werden können.
132
3 Fundamente der Mathematik
3.1 Arithmetische Terme
Peano-Arithmetik
Abkürzung
0 x1 (x1 × x2 ) s(0)
1
s(s(s(s(s(0)))))
5
(x1 × s(s(0)))
x1 × 2
(s(0) + s(s(0)))
1+2
(s(0) × (x1 + x2 ))
1 × (x1 + x2 )
Tabelle 3.1: Beispiele arithmetischer Terme. Die Kurzschreibweise
Die Peano-Arithmetik, kurz PA, ist die Theorie der natürlichen Zahlen, zusammen mit der Addition und der Multiplikation. Genau wie im Fall der Beispielkalküle aus Kapitel 2 nähern wir uns in mehreren Schritten. In Abschnitt 3.1.1 legen wir die Syntax der Peano-Arithmetik fest, d. h., wir vereinbaren, nach welchen Regeln arithmetische Terme und arithmetische Formeln aufgebaut sind. Anschließend definieren wir in Abschnitt 3.1.2 die Semantik, indem wir die Formelbestandteile mit einer konkreten Bedeutung belegen. Danach führen wir in Abschnitt 3.1.3 die Axiome sowie den logischen Schlussapparat der Peano-Arithmetik ein und demonstrieren anhand mehrerer Beispiele, wie sich arithmetische Aussagen formal beweisen lassen.
3.1.1
n := s(s(. . . s (0) . . .))
Definition 3.1 (Syntax der Peano-Arithmetik)
n-mal
haben wir bereits in Abschnitt 2.1 eingeführt; sie wird uns auch hier als wertvolle Schreiberleichterung dienen.
Syntax
Die Menge der arithmetischen Terme ist induktiv definiert: I
0, x1 , x2 , x3 , . . . sind arithmetische Terme.
I
Sind σ und τ arithmetische Terme, so sind es auch
Arithmetische Formeln
s(σ ), (σ + τ), (σ × τ)
∃ x1 2 × x1 = 6 ∃ x1 x 1 × x1 = 9
Die Menge der arithmetischen Formeln ist induktiv definiert:
∃ x1 3 × x1 = 9
I
∃ x1 7 = 6 + x 1
(σ = τ) eine arithmetische Formel.
∀ x1 ∃ x2 ( ∃ x5 (x2 = x1 + x5 + s(0)) ∧
I
¬(x2 = s(0)) ∧
Tabelle 3.2: Beispiele arithmetischer Formeln. Solange die Eindeutigkeit gewahrt bleibt, werden wir zur Verbesserung der Lesbarkeit auf die Niederschrift mancher Klammerpaare verzichten.
Sind ϕ und ψ arithmetische Formeln, dann sind es auch (¬ϕ), (ϕ ∧ ψ), (ϕ ∨ ψ), (ϕ → ψ), (ϕ ↔ ψ), (ϕ ψ)
∀ x3 (∃ x4 (x3 × x4 = x2 ) → (x3 = s(0) ∨ x3 = x2 )))
Sind σ und τ arithmetische Terme, so ist
I
Ist ϕ eine arithmetische Formel, dann sind auch es auch ∀ ξ ϕ, ∃ ξ ϕ
mit ξ ∈ {x1 , x2 , x3 , . . .}
In den Tabellen 3.1 und 3.2 sind mehrere Terme und Formeln aufgeführt, die sich mit den vereinbarten Regeln bilden lassen.
133
3.1 Peano-Arithmetik
Äußerlich scheint sich die Sprache der Peano-Arithmetik nur wenig von der Sprache der Prädikatenlogik abzuheben, und ein vergleichender Blick auf Definition 2.14 bestätigt diese Vermutung. Der einzige Unterschied zwischen beiden Sprachen besteht darin, dass der Vorrat an Konstanten- und Funktionszeichen in der Peano-Arithmetik auf die Symbole ‚0‘, ‚s‘, ‚+‘, ‚ב und der Vorrat an Prädikatzeichen auf das Symbol ‚=‘ beschränkt ist. Die für prädikatenlogische Formeln eingeführten Schreiberleichterungen können wir daher bedenkenlos auf arithmetische Formeln übertragen. Insbesondere werden wir uns auch hier erlauben, die Notation der Variablen von Fall zu Fall anzupassen und auf das eine oder andere Klammerpaar zu verzichten, solange die Schreibweise immer noch eindeutig ist.
I Schema
I(0) := 0 I(s(σ )) := I(σ ) + 1 I(σ1 + σ2 ) := I(σ1 ) + I(σ2 ) I(σ1 × σ2 ) := I(σ1 ) × I(σ2 ) I Beispiel: σ = s(s(0)) + s(0)
I(σ ) = I(s(s(0)) + s(0)) = I(s(s(0))) + I(s(0)) = I(s(0)) + 1 + I(0) + 1 = I(0) + 1 + 1 + 1
3.1.2
Semantik
Erinnert Sie das Aussehen der arithmetischen Terme an die Beispielkalküle aus Abschnitt 2.1, anhand derer wir die grundlegenden Eigenschaften formaler Systeme herausgearbeitet haben? Die Übereinstimmungen sind nicht zufällig, und wir können die Peano-Arithmetik tatsächlich als eine Verallgemeinerung dieser Kalküle auffassen. Die Definition der Modellrelation ‚|=‘ schreibt sich daher fast von selbst: Definition 3.2 (Semantik der Peano-Arithmetik) ϕ und ψ seien geschlossene arithmetische Formeln. Die Semantik der Peano-Arithmetik ist durch die Modellrelation ‚|=‘ gegeben, die induktiv definiert ist: |= (σ1 = σ2 ) |= (¬ϕ) |= (ϕ ∧ ψ) |= (ϕ ∨ ψ) |= (ϕ → ψ) |= (ϕ ↔ ψ) |= (ϕ ψ)
:⇔ I(σ1 ) = I(σ2 ) :⇔ |= ϕ :⇔ |= ϕ und |= ψ :⇔ |= ϕ oder |= ψ :⇔ |= ϕ oder |= ψ :⇔ |= ϕ → ψ und |= ψ → ϕ :⇔ |= (ϕ ↔ ψ)
|= ∀ξ ϕ :⇔ Für alle n ∈ N gilt |= ϕ[ξ ← n] |= ∃ξ ϕ :⇔ Es gibt ein n ∈ N mit |= ϕ[ξ ← n] Jeder Term σ steht in der Peano-Arithmetik stellvertretend für eine natürliche Zahl, die in der Definition mit I(σ ) bezeichnet ist. Enthält σ
= 1+1+1 = 3
Abbildung 3.1: Enthält ein arithmetischer Term σ keine Variablen, so lässt sich sein zugeordneter Zahlenwert I(σ ) rekursiv über den Termaufbau berechnen.
Um den Nachfolger einer natürlichen Zahl zu benennen, existieren in der Literatur verschiedene Nomenklaturen. So werden die natürlichen Zahlen 0, 1, 2, 3, . . . in diesem Buch durch die arithmetischen Terme 0, s(0), s(s(0)), s(s(s(0))), . . . beschrieben. Andere Bücher verwenden dagegen die nachstehende Schreibweise: 0, S0, SS0, SSS0, . . . Sie ist kompakter, weicht aber von der gängigen Konvention ab, Funktionssymbole in prädikatenlogischen Formeln klein zu schreiben. Wieder andere Bücher verwenden anstelle von ‚S‘ einen Apostroph. Die obige Zahlenreihe erscheint dann in folgendem Gewand: 0, 0 , 0 , 0 , . . .
134
3 Fundamente der Mathematik
„6 ist eine gerade Zahl“ „3 ist ein Teiler von 9“
„7 ist größer als 6“
„Jede natürliche Zahl ist die Summe von vier Quadratzahlen“
keine Variablen, so lässt sich I(σ ), wie in Abbildung 3.1 gezeigt, rekursiv über den Termaufbau berechnen. Wie erwartet, beschreiben die Symbole ‚s‘, ‚+‘ und ‚ב die Nachfolgerfunktion, die Addition und die Multiplikation. Seien Sie sich stets darüber im Klaren, dass die Modellrelation der Peano-Arithmetik eine andere Bedeutung besitzt als die Modellrelation der Aussagen- oder Prädikatenlogik. Dort drückt |= ϕ aus, dass die Formel ϕ allgemeingültig ist, d. h., unter allen möglichen Interpretationen zu einer wahren Aussage wird. Im Fall der Peano-Arithmetik ist dies anders: Hier haben wir mit den natürlichen Zahlen eine ganz bestimmte Interpretation im Sinn. Wir nennen sie die Standardinterpretation und vereinbaren für sie die Kurzschreibweise (N, {s, +, ×}). In der Peano-Arithmetik drückt |= ϕ somit aus, dass ϕ eine wahre Aussage ist, wenn wir die Symbole im Sinne der Standardinterpretation deuten. Noch prägnanter können wir den Zusammenhang so aufschreiben: |= ϕ :⇔ (N, {s, +, ×}) ist ein Modell von ϕ
„7 ist eine Primzahl“
Da wir die Modellrelation in der Peano-Arithmetik an eine einzige Interpretation knüpfen, gilt für jede Formel ϕ entweder |= ϕ oder |= ¬ϕ. In der Aussagen- und Prädikatenlogik ist dies nicht der Fall. „Es gibt unendlich viele Primzahlen“
Wir werden nun an mehreren Beispielen herausarbeiten, dass die PeanoArithmetik die nötige Ausdrucksstärke besitzt, um gewöhnliche Aussagen der Zahlentheorie zu formalisieren. Abbildung 3.2 fasst in Worten zusammen, um welche Aussagen es sich handelt. PA I
Abbildung 3.2: Auswahl typischer Aussagen der Zahlentheorie
∃ x1 2 × x1 = 6 Die Formel besagt, dass eine natürliche Zahl x1 existiert, die mit 2 multipliziert das Ergebnis 6 ergibt. Sie steht damit für die äquivalente Aussage „6 ist eine gerade Zahl“.
I
∃ x1 3 × x1 = 9 Die Formel postuliert die Existenz einer natürlichen Zahl x1 , die mit 3 multipliziert den Wert 9 ergibt und ist äquivalent zur Aussage „3 ist ein Teiler von 9“. Um Formeln dieser Bauart in Zukunft kompakt niederschreiben zu können, vereinbaren wir die folgende Kurzschreibweise: σ | τ := ∃ ξ σ × ξ = τ In dieser und den nächsten Formeln, die eine abkürzende Schreibweise definieren, steht ξ für eine beliebige Variable, die in σ und τ nicht frei vorkommt.
3.1 Peano-Arithmetik
I
∃ x1 7 = 6 + x1 Die Formel ist eine andere Formulierung für die Beziehung 7 ≥ 6. Sie zeigt, dass sich die Vergleichsrelation ‚≥‘ problemlos auf die Addition zurückführen lässt und damit innerhalb der PeanoArithmetik beschrieben werden kann. Genau wie im Fall der Teilbarkeitsrelation wollen wir die Symbole ‚≥‘, ‚≤‘, ‚>‘ und ‚<‘ als abkürzende Schreibweise innerhalb von arithmetischen Formeln zulassen. Formal rechtfertigen wir die Schreiberleichterung durch die folgenden Definitionen: (σ ≥ τ) := ∃ ξ σ = τ + ξ (σ ≤ τ) := ∃ ξ σ + ξ = τ (σ > τ) := ∃ ξ σ = τ + ξ + 1 (σ < τ) := ∃ ξ σ + ξ + 1 = τ Ferner wollen wir eine bedingte Quantifizierung erlauben und hierzu die folgenden Abkürzungen vereinbaren: ∃ (ξ > σ ) ϕ := ∃ ξ (ξ > σ ∧ ϕ) ∀ (ξ > σ ) ϕ := ∀ ξ (ξ > σ → ϕ) Eine analoge Definition gelte für die Operatoren ‚<‘, ‚≥‘ und ‚≤‘.
I
∃ x1 ∃ x2 ∃ x3 ∃ x4 z = x1 × x1 + x2 × x2 + x3 × x3 + x4 × x4 Die Formel ist eine formale Beschreibung des Vier-Quadrate-Satzes von Lagrange. Dieser besagt, dass sich jede natürliche Zahl als Summe von vier Quadratzahlen schreiben lässt. In Abschnitt 5.4.3 wird uns dieser Satz im Zusammenhang mit dem zehnten Hilbert’schen Problem erneut begegnen.
I
∀ z (z | 7) → (z = 1 ∨ z = 7) Diese Formel besagt, dass für alle natürlichen Zahlen z, die ein Teiler von 7 sind, die Beziehung z = 1 oder z = 7 gilt. Damit ist die Formel äquivalent zu der Aussage „7 ist eine Primzahl“. Auch hier wollen wir durch eine entsprechende Definition für Schreiberleichterung sorgen: prime(σ ) := ¬(σ = 1) ∧ ∀ ξ (ξ | σ → (ξ = 1 ∨ ξ = σ ))
I
∀ x1 ∃ (x2 > x1 ) prime(x2 ) In Worten liest sich die Formel wie folgt: Für jede natürliche Zahl x1 existiert eine größere Zahl x2 , die eine Primzahl ist. Die Formel ist damit nichts anderes als die Formalisierung des berühmten Satzes von Euklid: „Es existieren unendlich viele Primzahlen“.
135
136
I
3 Fundamente der Mathematik
Satz von Euklid: „Es existieren unendlich viele Primzahlen.“ „Für jede Zahl x1 existiert eine größere Zahl x2 , die eine Primzahl ist.“
I
∀ x1 ∃ (x2 > x1 ) prime(x2 ) ∃ (x2 > x1 ) ϕ := ∃ x2 (x2 > x1 ∧ ϕ)
I
∀ x1 ∃ x2 (x2 > x1 ∧ prime(x2 )) prime(x2 ) := ¬(x2 = 1) ∧ ∀ x3 (x3 | x2 → (x3 = 1 ∨ x3 = x2 ))
I
∀ x1 ∃ x2 (x2 > x1 ∧ ¬(x2 = 1) ∧ ∀ x3 (x3 | x2 → (x3 = 1 ∨ x3 = x2 ))) x3 | x2 := ∃ x4 (x3 × x4 = x2 )
I
∀ x1 ∃ x2 (x2 > x1 ∧ ¬(x2 = 1) ∧ ∀ x3 (∃ x4 (x3 × x4 = x2 ) → (x3 = 1 ∨ x3 = x2 ))) x2 > x1 := ∃ x5 (x2 = x1 + x5 + 1)
I
∀ x1 ∃ x2 (∃ x5 (x2 = x1 + x5 + 1) ∧ ¬(x2 = 1) ∧ ∀ x3 (∃ x4 (x3 × x4 = x2 ) → (x3 = 1 ∨ x3 = x2 ))) 1 := s(0)
I
∀ x1 ∃ x2 (∃ x5 (x2 = x1 + x5 + s(0)) ∧ ¬(x2 = s(0)) ∧ ∀ x3 (∃ x4 (x3 × x4 = x2 ) → (x3 = s(0) ∨ x3 = x2 )))
Abbildung 3.3: Formalisierung des Satzes von Euklid in der Peano-Arithmetik
Vergessen Sie nicht, dass die neu eingeführten Operatoren lediglich den Stellenwert von syntaktischen Abkürzungen haben und die Ausdrucksstärke der Peano-Arithmetik nicht erhöhen. Auch wenn sie prinzipiell entbehrlich sind, erweisen sie uns wertvolle Dienste. Neben der Tatsache, dass wir mit den eingeführten Abkürzungen viele Formeln deutlich kompakter aufschreiben können, tragen Sie in großem Maße zu deren Verständnis bei. Als Beispiel zeigt Abbildung 3.3, welche Darstellung der Euklid’sche Satz besäße, wenn wir uns ausschließlich der syntaktischen Grundbausteine aus Definition 3.1 bedienten. Ihre wahre Bedeutung ist der entstandenen Formel kaum noch anzusehen. Zum Schluss führen wir mit dem erweiterten Existenzquantor ∃1 eine letzte Schreiberleichterung ein: ∃1 ξ ϕ(ξ ) := ∃ ξ (ϕ(ξ ) ∧ ∀ ζ (ϕ(ζ ) → ζ = ξ )) Mit der Formel ∃1 x ϕ(x) können wir auf kompakte Weise ausdrücken, dass ϕ(x) für genau eine Belegung von x wahr wird. Die Aussage ist stärker als jene der Formel ∃ x ϕ(x); diese besagt lediglich, dass mindestens eine derartige Belegung existieren muss.
137
3.1 Peano-Arithmetik
3.1.3
Axiome und Schlussregeln
0
Nachdem wir im vorigen Abschnitt die Syntax und die Semantik der Peano-Arithmetik festgelegt haben, wollen wir in diesem Abschnitt die Axiome und Schlussregeln ins Rampenlicht rücken. Um die tiefere Bedeutung der Axiome zu verstehen, wollen wir zunächst versuchen, die natürlichen Zahlen über ihre Eigenschaften zu charakterisieren.
1
2
3
4
...
...
Abbildung 3.4: Kettenförmige Struktur der natürlichen Zahlen
Die ersten beiden Axiome fließen wie von selbst aus der Feder: I
„0 ist eine natürliche Zahl.“
(P1)
(a)
I
„Jede Zahl x hat einen eindeutigen Nachfolger s(x).“
(P2)
0
2
(b)
2
0
1
3
Es scheint, als könnten wir die Struktur der natürlichen Zahlen aus Abbildung 3.4 treffend über diese beiden Eigenschaften beschreiben. Ein Blick auf die Beispiele in Abbildung 3.5 zeigt aber, dass auch solche Strukturen diese Eigenschaften erfüllen, die ganz und gar nicht unserer Vorstellung von den natürlichen Zahlen entsprechen. Die ungebetenen Gäste verschwinden erst dann, wenn wir zusätzlich die folgenden beiden Eigenschaften fordern: I
„0 ist nicht der Nachfolger irgendeiner Zahl.“
(P3)
I
„Verschiedene Zahlen haben verschiedene Nachfolger.“
(P4)
Die erste Eigenschaft eliminiert die Strukturen (a) und (c), die zweite die Strukturen (b) und (d). Auch wenn wir einer eindeutigen Charakterisierung der natürlichen Zahlen schon sehr nahe sind, bleibt ein schwerwiegendes Problem bestehen. Die formulierten Eigenschaften schließen nicht aus, dass neben dem Zahlenstrang der natürlichen Zahlen weitere Stränge mit der gleichen Struktur existieren (Abbildung 3.6). Um die Existenz solcher Schattenzahlen auszuschließen, müssen wir auf eine Eigenschaft zurückgreifen, die tiefgründiger ist als die bisher genannten. Die Lösung kommt in Form des Induktionsaxioms: I
„Enthält eine Menge M die Zahl 0 und folgt aus x ∈ M stets die Beziehung s(x) ∈ M, so enthält M alle natürlichen Zahlen.“
Da wir die Mengenzugehörigkeit einer Zahl x als Eigenschaft interpretieren und jede Eigenschaft in Form einer Mengenzugehörigkeit ausdrücken können, dürfen wir das Induktionsaxiom alternativ auch so formulieren:
3
(c)
0
1
2
3
...
1
2
3
4
...
(d)
0
Abbildung 3.5: Die Axiome (P1) und (P2) reichen nicht aus, um die Strukturen (a) bis (d) auszuschließen.
0
1
2
3
4
...
...
Abbildung 3.6: Die hier abgebildete Struktur erfüllt die Axiome (P1) bis (P4). Erst durch das Induktionsaxiom wird sie eliminiert.
138
3 Fundamente der Mathematik
Richard Dedekind (1831 – 1916)
Giuseppe Peano (1858 – 1932)
I
„0 ist eine natürliche Zahl.“
I
„Jede Zahl x hat einen eindeutigen Nachfolger s(x).“
I
„0 ist nicht der Nachfolger irgendeiner Zahl.“
I
∀ x ¬(0 = s(x))
I
„Verschiedene Zahlen haben verschiedene Nachfolger.“
I
∀ x ∀ y (s(x) = x(y) → x = y)
I
„Hat die Zahl 0 die Eigenschaft ϕ und folgt aus ϕ(x) stets ϕ(s(x)), so haben alle natürlichen Zahlen die Eigenschaft ϕ.“
I
ϕ(0) → (∀ x (ϕ(x) → ϕ(s(x))) → ∀ x ϕ(x))
Abbildung 3.7: Die Peano-Axiome, links in einer umgangssprachlichen Formulierung und rechts in der modernen Schreibweise der Peano-Arithmetik.
I
„Hat die Zahl 0 die Eigenschaft ϕ und folgt aus ϕ(x) stets ϕ(s(x)), so haben alle natürlichen Zahlen die Eigenschaft ϕ.“ (P5)
(P1) bis (P5) sind die berühmten Peano-Axiome, die im Jahr 1888 in ähnlicher Form von Richard Dedekind umgangssprachlich formuliert und ein Jahr später von Giuseppe Peano in eine formale Schreibweise übersetzt wurden. Die Beispiele in den Abbildungen 3.4 bis 3.6 haben gezeigt, dass wir auf kein Peano-Axiom verzichten können. Entfernen wir auch nur eines, so existieren neben den natürlichen Zahlen weitere Strukturen, die alle verbleibenden Axiome erfüllen. Die gegenteilige Fragestellung ist nicht weniger wichtig: Sind die natürlichen Zahlen durch die Peano-Axiome vollständig charakterisiert oder müssen wir weitere Axiome hinzufügen, um eine eindeutige Beschreibung zu erhalten? Der berühmte Isomorphiesatz von Richard Dedekind gibt eine beruhigende Antwort. Er besagt, dass die natürlichen Zahlen durch die Axiome (P1) bis (P5) bis auf Isomorphie eindeutig charakterisiert sind, d. h., bis auf die Art und Weise, wie wir die Zahlen benennen oder niederschreiben. Jetzt haben wir das nötige Wissen beisammen, um die Axiome und Schlussregeln der Peano-Arithmetik in ihrer ganzen Fülle zu verstehen. Zunächst zeigt Abbildung 3.7, wie die umgangssprachlich formulierten
139
3.1 Peano-Arithmetik
Theorieaxiome
Logikaxiome
σ = τ → (σ = ρ → τ = ρ)
(S1)
ϕ → (ψ → ϕ)
(A1)
σ = τ → s(σ ) = s(τ)
(S2)
(ϕ → (ψ → χ)) → ((ϕ → ψ) → (ϕ → χ))
(A2)
¬(0 = s(σ ))
(S3)
(¬ϕ → ¬ψ) → (ψ → ϕ)
(A3)
s(σ ) = s(τ) → σ = τ
(S4)
∀ ξ ϕ → ϕ[ξ ← σ ] ([ξ ← σ ] kollisionsfrei) (A4)
σ +0 = σ
(S5)
∀ ξ (ϕ → ψ) → (ϕ → ∀ ξ ψ) (ξ ∈ ϕ)
σ + s(τ) = s(σ + τ)
(S6)
σ ×0 = 0
(S7)
σ × s(τ) = (σ × τ) + σ
(S8)
ϕ(0) → (∀ x (ϕ(x) → ϕ(s(x))) → ∀ x ϕ(x))
(S9)
(A5)
Schlussregeln ϕ, ϕ → ψ ψ ϕ ∀ξ ϕ
Tabelle 3.3: Alle Axiome der Peano-Arithmetik in der Übersicht
Axiome als arithmetische Formeln niedergeschrieben werden können. Alle drei Formeln fügen wir der Peano-Arithmetik als Theorieaxiome hinzu. Beachten Sie, dass wir die ersten beiden Axiome nicht übersetzen müssen; sie sind bereits dadurch formalisiert, dass 0 als Konstantensymbol und s als (einstelliges) Funktionssymbol in der Sprache der Peano-Arithmetik verankert ist. Die Peano-Axiome allein bilden noch keinen Kalkül. Um einen solchen zu erhalten, müssen wir sie um weitere Theorieaxiome ergänzen. Darüber hinaus dürfen wir nicht vergessen, die unentbehrlichen Logikaxiome hinzuzufügen. Im Ergebnis entsteht eine längere Liste von Axiomen und Schlussregeln, die in Tabelle 3.3 zusammengefasst sind. Die Theorieaxiome (S1) und (S2) drücken wichtige Eigenschaften des Gleichheitsoperators aus. (S3) und (S4) sind die Peano-Axiome (P3) und (P4). Die Axiome (S5) bis (S8) beschreiben die elementaren Eigenschaften der Addition und Multiplikation und verleihen den Operatoren ‚+‘ und ‚ב ihre Bedeutung. Es folgt mit (S9) das Induktionsaxiom, von dessen Notwendigkeit wir uns weiter oben überzeugt haben. In der rechten Tabellenhälfte sind die Logikaxiome und die Schlussregeln aufgeführt.
(MP)
(G)
140
3 Fundamente der Mathematik
Ableitbare Theoreme I
Theorem PA1 σ =σ
I
Theorem PA2 σ =τ →τ =σ
I
Theorem PA3 σ = τ → (τ = ρ → σ = ρ)
I
Theorem PA4 σ = τ → (ρ = τ → σ = ρ)
I
Theorem PA5 ∀ x (σ = τ → σ + x = τ + x)
I
Theorem PA6 ∀ x (x = 0 + x)
I
Theorem PA7 σ + 1 = s(σ )
I
Theorem PA8 σ ×1 = σ
Tabelle 3.4: Eine kleine Auswahl arithmetischer Formeln, die sich im formalen System der Peano-Arithmetik beweisen lassen.
Sie sind eins zu eins der Prädikatenlogik entnommen und machen die Peano-Arithmetik zu einer Theorie erster Stufe. Alle Axiome sind als Axiomenschemata ausgelegt. Hierin stehen die Platzhalter σ und τ für Terme, ϕ, ψ und χ für Formeln und ξ für eine Variable. Wir wollen kurz innehalten und unsere Aufmerksamkeit erneut auf das Induktionsaxiom lenken. Ein gezielter Blick auf die verschiedenen Formulierungen zeigt, dass die formalisierte Variante (S9) eine prädikatenlogische Formel erster Stufe, die umgangssprachliche Variante (P5) dagegen eine Aussage zweiter Stufe ist. Dass wir tatsächlich eine Aussage zweiter Stufe vor uns haben, ist leicht einzusehen. Indem das Induktionsaxiom eine Aussage über beliebige Eigenschaften der natürlichen Zahlen macht, quantifiziert es über Prädikate. In der Peano-Arithmetik wird der Sachverhalt dadurch nachgebildet, dass wir (S9) als Axiomenschema ausgelegt haben. Da wir den Platzhalter ϕ durch eine beliebige Formel ersetzen dürfen, gibt es in der Peano-Arithmetik nicht ein einziges Induktionsaxiom, sondern unendlich viele. Auf den ersten Blick scheint es uns mit diesem Trick tatsächlich gelungen zu sein, die umgangssprachliche Formulierung des Induktionsaxioms formal zu erfassen. Auf den zweiten Blick wird jedoch schnell deutlich, dass wir einer exakten Formalisierung lediglich sehr nahe kommen. Konkret stehen wir vor dem Problem, dass uns das Axiomenschema nicht die Gültigkeit des Induktionsprinzips für alle Eigenschaften garantiert, sondern lediglich für jene, die sich durch eine Formel beschreiben lassen. Da nur abzählbare viele Formeln existieren, kann das Schema nur einen Teil der überabzählbar vielen Eigenschaften erfassen. Für den Moment wollen wir diesen unscheinbaren Schönheitsfehler ignorieren. Zu gegebener Zeit, in Abschnitt 7.2, werden wir die Thematik wieder aufgreifen und zeigen, welch weitreichende Konsequenzen sich aus diesem Phänomen tatsächlich ergeben. Wir wollen unseren Kalkül nun zum Leben erwecken und nacheinander die in Tabelle 3.4 aufgeführten Theoreme beweisen. Sie werden feststellen, dass sich die Beweisführung kaum von jener aus Abschnitt 2.4 unterscheidet; schließlich verwendet die Peano-Arithmetik den gleichen logischen Schlussapparat wie die Prädikatenlogik erster Stufe. Damit dürfen wir nicht nur den Fundus bisher bewiesener Tautologien nutzen, sondern auch auf sämtliche Hilfsmitteln zurückgreifen, die wir im Zusammenhang mit dem prädikatenlogischen Kalkül erarbeitet haben. Allem voran wird uns auch hier das Deduktionstheorem treu zur Seite stehen. Calculemus – lasst uns rechnen!
141
3.1 Peano-Arithmetik
1. σ + 0 = σ 2. σ + 0 = σ → (σ + 0 = σ → σ = σ ) 3. σ + 0 = σ → σ = σ 4. σ = σ
(S5) (S1)
Theorem PA1 σ =σ
(MP, 1,2) (MP, 1,3)
1. 2. 3. 4. 5. 6. 7.
σ = τ → (σ = σ → τ = σ ) {σ = τ} σ = σ → τ = σ {σ = τ, σ = σ } τ = σ {σ = σ } σ = τ → τ = σ σ = σ → (σ = τ → τ = σ ) σ =σ σ =τ →τ =σ
(S1) (DT) (DT) (DT) (DT) (PA1) (MP, 5,6)
Theorem PA2 σ =τ →τ =σ
1. 2. 3. 4. 5.
τ = σ → (τ = ρ → σ = ρ) σ =τ →τ =σ {σ = τ} τ = σ {σ = τ} τ = ρ → σ = ρ σ = τ → (τ = ρ → σ = ρ)
(S1) (S1) (DT) (MP, 1,3) (DT)
Theorem PA3 σ = τ → (τ = ρ → σ = ρ)
1. σ = τ → (τ = ρ → σ = ρ) 2. {σ = τ} τ = ρ → σ = ρ
(PA3) (DT)
Theorem PA4 σ = τ → (ρ = τ → σ = ρ)
ρ =τ →τ =ρ {ρ = τ} τ = ρ {σ = τ, ρ = τ} σ = ρ {σ = τ} ρ = τ → σ = ρ σ = τ → (ρ = τ → σ = ρ)
(PA2) (DT) (MP, 2,4) (DT) (DT)
3. 4. 5. 6. 7.
Beweis durch vollständige Induktion Sei ψ(x) := (σ = τ → (σ + x = τ + x)) 1. σ + 0 = σ 2. τ + 0 = τ 3. σ + 0 = σ → (σ = τ → σ + 0 = τ) 4. σ = τ → σ + 0 = τ
Theorem PA5 ∀ x (σ = τ → σ + x = τ + x) (S5) (S5) (PA3) (MP, 1,3)
142
3 Fundamente der Mathematik
5. {σ = τ} σ + 0 = τ 6. σ + 0 = τ → (τ + 0 = τ → σ + 0 = τ + 0) 7. {σ = τ} τ + 0 = τ → σ + 0 = τ + 0 8. {σ = τ} σ + 0 = τ + 0 An dieser Stelle ist der Induktionsanfang bewiesen
An dieser Stelle ist der Induktionsschritt bewiesen
Theorem PA6 ∀ x (x = 0 + x)
(DT) (PA4) (MP, 5,6) (MP, 2,7)
9. σ = τ → σ + 0 = τ + 0 10. ψ(0)
(DT) (Definition)
11. {ψ(x)} σ = τ → (σ + x = τ + x) 12. {ψ(x), σ = τ} σ + x = τ + x 13. σ + s(x) = s(σ + x) 14. τ + s(x) = s(τ + x) 15. σ + x = τ + x → s(σ + x) = s(τ + x) 16. {ψ(x), σ = τ} s(σ + x) = s(τ + x) 17. σ + s(x) = s(σ + x) → (s(σ + x) = s(τ + x) → σ + s(x) = s(τ + x)) 18. s(σ + x) = s(τ + x) → σ + s(x) = s(τ + x) 19. {ψ(x), σ = τ} σ + s(x) = s(τ + x) 20. σ + s(x) = s(τ + x) →
(Satz 2.4) (DT) (S6) (S6) (S2) (MP, 12,15)
(τ + s(x) = s(τ + x) → σ + s(x) = τ + s(x)) 21. {ψ(x), σ = τ} τ + s(x) = s(τ + x) → σ + s(x) = τ + s(x) 22. {ψ(x), σ = τ} σ + s(x) = τ + s(x) 23. {ψ(x)} σ = τ → σ + s(x) = τ + s(x) 24. {ψ(x)} ψ(s(x)) 25. ψ(x) → ψ(s(x)) 26. ∀ x (ψ(x) → ψ(s(x))) 27. ψ(0) → (∀ x (ψ(x) → ψ(s(x))) → ∀ x ψ(x)) 28. ∀ x (ψ(x) → ψ(s(x))) → ∀ x ψ(x) 29. ∀ x ψ(x) 30. ∀ x (σ = τ → σ + x = τ + x)
(PA4)
Beweis durch vollständige Induktion Sei ψ(x) := (x = 0 + x) 1. 0 + 0 = 0 2. 0 + 0 = 0 → 0 = 0 + 0 3. 0 = 0 + 0
(PA3) (MP, 14,19) (MP, 18,20)
(MP, 19,20) (MP, 14,21) (DT) (Definition) (DT) (G) (S9) (MP, 10,27) (MP, 26,28) (Definition)
(S5) (PA2) (MP, 1,2)
143
3.1 Peano-Arithmetik
4. ψ(0) 5. {ψ(x)} x = 0 + x 6. 0 + s(x) = s(0 + x) 7. x = 0 + x → s(x) = s(0 + x)
(Definition) Satz 2.4
An dieser Stelle ist der Induktionsanfang bewiesen
(S6) (S2)
8. {ψ(x)} s(x) = s(0 + x) (MP, 5,7) 9. s(x) = s(0 + x) → (0 + s(x) = s(0 + x) → s(x) = 0 + s(x)) (PA4) 10. {ψ(x)} 0 + s(x) = s(0 + x) → s(x) = 0 + s(x) (MP, 8,9) 11. {ψ(x)} s(x) = 0 + s(x) 12. {ψ(x)} ψ(s(x)) 13. ψ(x) → ψ(s(x)) 14. ∀ x (ψ(x) → ψ(s(x))) 15. ψ(0) → (∀ x (ψ(x) → ψ(s(x))) → ∀ x ψ(x)) 16. ∀ x (ψ(x) → ψ(s(x))) → ∀ x ψ(x) 17. ∀ x ψ(x) 18. ∀ x (x = 0 + x)
1. σ + s(0) = s(σ + 0) σ +0 = σ σ + 0 = σ → s(σ + 0) = s(σ ) s(σ + 0) = s(σ ) σ + s(0) = s(σ + 0) → (s(σ + 0) = s(σ ) → σ + s(0) = s(σ )) 6. s(σ + 0) = s(σ ) → σ + s(0) = s(σ ) 7. σ + s(0) = s(σ ) 8. σ + 1 = s(σ )
2. 3. 4. 5.
1. σ × s(0) = (σ × 0) + σ 2. σ × 0 = 0 3. ∀ x (σ × 0 = 0 → (σ × 0) + x = 0 + x) 4. ∀ x (σ × 0 = 0 → (σ × 0) + x = 0 + x) →
(MP, 6,10) (Definition) (DT) (G) (S9) (MP, 4,15) (MP, 14,16) (Definition)
(S6) (S5) (S2) (MP, 2,3)
An dieser Stelle ist der Induktionsschritt bewiesen
Theorem PA7 σ + 1 = s(σ )
(PA3) (MP, 1,5) (MP, 4,6) (Definition)
(S8) (S7) (PA5)
(σ × 0 = 0 → (σ × 0) + σ = 0 + σ ) 5. σ × 0 = 0 → (σ × 0) + σ = 0 + σ
(A4) (MP, 3,4)
6. (σ × 0) + σ = 0 + σ ) 7. σ × s(0) = (σ × 0) + σ →
(MP, 2,5)
Theorem PA8 σ ×1 = σ
144
3 Fundamente der Mathematik
((σ × 0) + σ = 0 + σ → σ × s(0) = 0 + σ ) 8. (σ × 0) + σ = 0 + σ → σ × s(0) = 0 + σ
(PA3) (MP, 1,7)
9. σ × s(0) = 0 + σ 10. ∀ x x = 0 + x
(MP, 6,8) (PA6)
11. 12. 13. 14. 15. 16. 17. 18.
∀x x = 0+x → σ = 0+σ σ = 0+σ σ = 0+σ → 0+σ = σ 0+σ = σ σ × s(0) = 0 + σ → (0 + σ = σ → σ × s(0) = σ ) 0 + σ = σ → σ × s(0) = σ σ × s(0) = σ σ ×1 = σ
(PA6) (MP, 10,11) (PA2) (MP, 12,13) (PA3) (MP, 9,15) (MP, 12,14) (Definition)
Nach einer langer Reise sind wir endlich am Ziel: Es ist uns gelungen, sämtliche Theoreme aus Tabelle 3.4 im System der Peano-Arithmetik formal zu beweisen. Dass wir die Beispiele in dieser Ausführlichkeit durchexerziert haben, hat einen einfachen Grund. Die pure Auflistung der Axiome und Schlussregeln eines Kalküls vermittelt keinerlei Empfindung dafür, wie leicht oder wie schwer es ist, Theoreme tatsächlich abzuleiten. Um einen Kalkül in seiner vollen Tiefe zu verstehen, führt kein Weg daran vorbei, die Axiome und Schlussregeln zum Leben zu erwecken, und genau das haben wir mit dem Beweis der Beispieltheoreme auch getan. Bevor wir unseren Blick gänzlich von den bewiesenen Theoremen abwenden, wollen wir noch einen wichtigen Spezialfall betrachten. Substituieren wir in den Theoremen (PA7) und (PA8) den Platzhalter σ durch 1, so ergeben sich auf einen Schlag zwei der am häufigsten zitierten Weisheiten über die natürlichen Zahlen. Korollar 3.1 Die nachstehenden Formeln sind Theoreme der Peano-Arithmetik: 1+1 = 2
1×1 = 1
3.2 Axiomatische Mengenlehre
3.2
145
Axiomatische Mengenlehre
In diesem Abschnitt rücken wir mit der Mengenlehre eines der wichtigsten Teilgebiete der Mathematik in den Mittelpunkt unserer Betrachtung. Dass dem Begriff der Menge heute eine so große Bedeutung zukommt, geht vor allem auf seine Ausdrucksstärke zurück. Die Mengenlehre enthält nicht nur die Peano-Arithmetik als Untertheorie; sie erweist sich sogar als stark genug, um sämtliche Begriffe der gewöhnlichen Mathematik zu formalisieren. Zusätzlich haben die zu Beginn des zwanzigsten Jahrhunderts aufgetauchten Antinomien die Blicke vieler Forscher auf dieses Teilgebiet der Mathematik gelenkt. Sie haben der Mengenlehre nicht nur zu unfreiwilliger Popularität verholfen, sondern zugleich gezeigt, dass das Fundament der Mathematik ein fragiles ist, dem wir uns mit großer Sorgfalt nähern müssen. Unter dem Schirm der axiomatischen Mengenlehre versammeln sich heute viele Theorien, mit dem gemeinsamen Ziel, die Risse im Fundament der Mathematik zu schließen. Eine der ältesten ist die Typentheorie. Als Herzstück der Principia Mathematica ist sie integraler Bestandteil jenes monumentalen Werks, das von Russell und Whitehead als vermeintliches Allheilmittel gegen die Antinomien der Mengenlehre in Stellung gebracht wurde. Im Kern der Typentheorie steht der Gedanke, jeder Menge eine Hierarchiestufe, einen Typ, zuzuordnen. Indem nur solche Mengen als existent erachtet werden, die einen höheren Typ als ihre Elemente haben, sind selbstbezügliche Konstrukte wie die Menge aller Mengen a priori ausgeschlossen. Eine Vereinfachung hat die Typentheorie durch den amerikanischen Logiker Willard Van Orman Quine erfahren. Im Jahr 1937 publizierte er unter dem Namen New Foundations eine axiomatisierte Variante, die viele Defizite ihres Vorgängers beseitigt [141, 142]. Seitdem gilt die Typentheorie in ihrer ursprünglichen Form als überholt. Heute wird der Mengenbegriff zumeist mit Theorien erklärt, die sich einer der beiden folgenden Kategorien zuordnen lassen: I
Theorien über dem Mengenbegriff Theorien dieser Kategorie kennen ausschließlich den Begriff der Menge. Ihr bekanntester Vertreter ist die Zermelo-Fraenkel-Mengenlehre, kurz ZF, sowie die um das Auswahlaxiom erweiterte Variante ZFC (Zermelo-Fraenkel with Choice). Beide sind Theorien erster Stufe und werden durch 9 bzw. 10 Axiome geformt, die von Ernst Zermelo und Abraham Fraenkel in den Jahren 1908 bis 1921 formuliert wurden. Ebenfalls zu dieser Kategorie zählt die weniger bekannte Kripke-Platek-Mengenlehre (KP) [69].
Die Darstellung der axiomatischen Mengenlehre unterscheidet sich von jener der Peano-Arithmetik in einem wichtigen Punkt. Anders als in Abschnitt 3.1 werden wir im Fall der Mengenlehre davon absehen, eine Standardinterpretation zu definieren. Dass wir unsere gewohnte Linie verlassen, hat einen triftigen Grund: War es in der Peano-Arithmetik vergleichsweise gefahrlos möglich, unsere intuitive Vorstellung von den natürlichen Zahlen in die Definition der Modellrelation ‚|=‘ umzusetzen, so ist dies in der Mengenlehre ungleich schwieriger. Um eine Standardinterpretation zu definieren, müssten wir uns zunächst auf einen bestimmten Individuenbereich festlegen. Für die Peano-Arithmetik war dies kein Problem: Dort entspricht der Individuenbereich schlicht der Menge der natürlichen Zahlen. Und in der Mengenlehre? Der Individuenbereich wäre, wir wagen es kaum auszusprechen, die Menge aller Mengen. Würden wir eine Standardinterpretation also tatsächlich auf diese naive Weise bilden, so hätten wir der Russell’schen Antinomie erneut Tür und Tor geöffnet. Sie sehen, wie vorsichtig wir im Falle der Mengenlehre tatsächlich agieren müssen, um Widersprüche zu vermeiden.
146
3 Fundamente der Mathematik
I
Theorien über dem Mengen- und dem Klassenbegriff Theorien dieser Kategorie unterscheiden zwischen Mengen und Klassen. Während z. B. die Russell’sche Menge aller Mengen in ZF und ZFC nicht existiert, ist sie in solchen Theorien in Form einer Klasse enthalten. Bildlich können wir uns eine Klasse als eine Ansammlung von Objekten vorstellen, die zu groß ist, um als abgeschlossenes Ganzes zu existieren. Antinomien werden in diesen Theorien also nicht durch den Ausschluss der strittigen Objekte überwunden; stattdessen werden sie von der Mengenwelt in die Klassenwelt verschoben. Klassen unterliegen dabei wichtigen Einschränkungen. Beispielsweise dürfen sie niemals ein Element einer anderen Mengen oder anderen Klasse sein.
Bei einem Blick in Zermelos Originalarbeit aus dem Jahr 1908 werden Sie feststellen, dass in seiner ursprünglichen Mengenlehre neben Mengen noch andere Objekte existieren. Diese anderen Objekte sind sogenannten Urelemente, die im Gegensatz zu Mengen selbst keine Elemente enthalten dürfen. In gewissem Sinne sind Urelemente und Klassen zwei komplementäre Begriffe. Während Klassen zu groß sind, um selbst Element einer anderen Menge oder Klasse zu sein, sind Urelemente zu klein, um eigenen Elemente zu enthalten. Urelemente entsprechen unserer intuitiven Vorstellung der Elemente einer Menge. Dennoch lassen sie sich auf einfache Weise durch andere Mengen repräsentieren und sind damit prinzipiell entbehrlich. Dies ist der Grund, weshalb wir auch die Zermelo-Mengenlehre zu jenen Theorien zählen dürfen, die ausschließlich Mengen als Objekte kennen. Konsequenterweise wurde die Unterscheidung in der später entwickelten ZermeloFraenkel-Mengenlehre dann auch fallen gelassen; hier wird der Begriff des Urelements nicht mehr erwähnt und nur noch von Mengen gesprochen.
Beispiele für Theorien dieser Art sind die Mengenlehre von Wilhelm Ackermann [3] sowie die weniger bekannte Morse-KelleyMengenlehre [100, 122]. Der bei weitem bekannteste Vertreter dieser Kategorie ist die um 1940 entstandene Neumann-Bernays-GödelMengenlehre, kurz NBG. Im Gegensatz zu ZF ist sie endlich axiomatisierbar, d. h., sie kommt ohne die Verwendung von Axiomenschemata aus. Trotz ihrer unterschiedlichen Ausrichtung sind ZF und NBG eng miteinander verflochten. Zum einen lassen sich sämtliche Theoreme von ZF auch in NBG beweisen. Zum anderen gilt auch die Umkehrung, wenn wir nur jene Theoreme betrachten, die ausschließlich Aussagen über Mengen tätigen. Sämtliche dieser NBGTheoreme sind auch in ZF beweisbar. In Abschnitt 3.2.1 werden wir unseren Blick auf die Zermelo-FraenkelMengenlehre richten, der wichtigsten Theorie aus dem Bereich der axiomatischen Mengenlehre. Unter anderem werden wir zeigen, dass sich die natürlichen Zahlen als spezielle Mengen interpretieren lassen und die Theorien ZF oder ZFC dazu benutzt werden können, zahlentheoretische Aussagen zu formalisieren. Der eingeschlagene Weg wird uns in Abschnitt 3.2.2 in das faszinierende Reich der Ordinalzahlen führen. Mit ihnen werden wir vertraute Grenzen überwinden und riesige Zahlen kennen lernen, die sich weit jenseits des Vorstellbaren befinden. Mit der Theorie der Ordinalzahlen in Händen werden wir in Abschnitt 3.2.3 schließlich in der Lage sein, den schon häufiger gefallenen Begriff der Kardinalität mathematisch präzise zu erklären. Damit ist es an der Zeit, hinter die Kulissen eines der spannendsten Gebiete der Mathematik zu blicken. Unbestritten ist der Weg, den wir gleich beschreiten, kein leichter. Doch seien Sie versichert: Durch die Erkenntnisse am Ende des Kapitels werden Sie für die Mühen reichlich belohnt.
147
3.2 Axiomatische Mengenlehre
3.2.1
Zermelo-Fraenkel-Mengenlehre
Die Grundbausteine der Zermelo-Fraenkel-Mengenlehre führen wir in zwei Schritten ein. Zunächst legen wir fest, nach welchen Regeln mengentheoretische Formeln gebildet werden. Danach beschäftigen wir uns ausführlich mit den Axiomen dieser Theorie. Definition 3.3 (Syntax der Zermelo-Fraenkel-Mengenlehre) Die Menge der mengentheoretischen Formeln über dem Variablenvorrat {x1 , x2 , x3 , . . .} ist rekursiv definiert: I
Sind ξ und ν Variablen, dann sind (ξ = ν) und (ξ ∈ ν) Formeln.
I
Sind ϕ und ψ Formeln, dann sind es auch (¬ϕ), (ϕ ∧ ψ), (ϕ ∨ ψ), (ϕ → ψ), (ϕ ↔ ψ), (ϕ ψ)
I
Ist ϕ eine Formel, dann sind auch es auch ∀ ξ ϕ, ∃ ξ ϕ
mit
ξ ∈ {x1 , x2 , x3 , . . .}
Neben den aussagenlogischen Operatoren und den prädikatenlogischen Quantoren kennt die ZF-Mengenlehre mit ‚=‘ und ‚∈‘ nur zwei Prädikatsymbole. Die intuitive Bedeutung dieser Symbole liegt auf der Hand: x1 = x2 drückt die Gleichheit zwischen den Mengen x1 und x2 aus, während x1 ∈ x2 besagt, dass x1 ein Element von x2 ist. Wie bisher werden wir den Variablenvorrat von Zeit zu Zeit anpassen und z. B. x, y, z anstatt x1 , x2 , x3 schreiben. Ebenfalls werden wir in gewohnter Weise auf die Niederschrift des einen oder anderen Klammerpaars verzichten, sofern die Eindeutigkeit gewahrt bleibt. Zur weiteren Vereinfachung wollen die folgenden Schreiberleichterungen zulassen: x = y := ¬(x = y) x ∈ y := ¬(x ∈ y) x ⊆ y := ∀ z (z ∈ x → z ∈ y) x ⊂ y := x ⊆ y ∧ x = y ∀ (x ∈ y) ϕ := ∀ x (x ∈ y → ϕ) ∃ (x ∈ y) ϕ := ∃ x (x ∈ y ∧ ϕ)
In der Literatur werden mengentheoretische Formeln uneinheitlich notiert. Allem anderen voran unterscheiden sich die Schreibweisen der Variablen. Das Dilemma: In der Mathematik sind wir daran gewöhnt, Mengen durchweg mit Großbuchstaben zu bezeichnen, genauso wie wir in der Logik daran gewöhnt sind, für die Variablen einer Formel Kleinbuchstaben zu verwenden. In der axiomatischen Mengenlehre stehen Variablen für Mengen, so dass es gute Gründe dafür gibt, sie sowohl groß als auch klein zu schreiben. In diesem Buch orientieren wir uns an der prädikatenlogischen Konvention, Variablen klein zu schreiben. Einige Theorien, zu denen beispielsweise die NBG-Mengenlehre gehört, forcieren eine gemischte Schreibweise, um Mengen und Klassen bereits auf der syntaktischen Ebene zu unterscheiden. Beispielsweise wird in der NBG-Formel ∃X ∀y y ∈ X mit X eine Klasse und mit y eine Menge bezeichnet. Letztendlich erfüllt jede Notation ihren Zweck. Dennoch sollten Sie bei der Durchsicht fremder Literatur immer zunächst einen Blick auf die verwendete Schreibweise werfen, um Missverständnisse im Vorfeld zu vermeiden.
148
3 Fundamente der Mathematik
3.2.1.1
ZF-Axiome
In diesem Abschnitt werden wir uns ausführlich mit dem Inhalt der verschiedenen Theorieaxiome beschäftigen und die Zermelo-FraenkelMengenlehre so in ein helleres Licht rücken. Axiom der Bestimmtheit (auch Axiom der Extensionalität)
I
∀ x ∀ y (x = y ↔ ∀ z (z ∈ x ↔ z ∈ y)) „Ist jedes Element einer Menge M gleichzeitig Element von N und umgekehrt, ist also gleichzeitig M ⊂ N und N ⊂ M, so ist immer M = N. Oder kürzer: jede Menge ist durch ihre Elemente bestimmt.“
=
Ernst Zermelo, 1908 ∈ ∈ ∈ ∈
In der axiomatischen Mengenlehre gilt das Prinzip der Extensionalität. Es besagt, dass die Bedeutung eines Ausdrucks allein durch seinen Umfang bestimmt ist, d. h. durch die Objekte, die er benennt oder beschreibt. In Bezug auf die Mengenlehre folgt daraus, dass zwei Mengen x und y genau dann gleich sind, wenn sie die gleichen Elemente enthalten (aus z ∈ x folgt immer auch z ∈ y und umgekehrt). Legen wir die oben eingeführten Abkürzungen zu Grunde, so können wir das Bestimmtheitsaxiom auch in der folgenden Form schreiben: ∀ x ∀ y (x = y ↔ x ⊆ y ∧ y ⊆ x)
Axiom der leeren Menge
I
∃ x ∀ y y ∈ x „Es gibt eine (uneigentliche) Menge, die ‚Nullmenge‘ 0, / welche gar keine Elemente enthält.“ Ernst Zermelo, 1908
Dieses Axiom postuliert die Existenz der leeren Menge. Von den konstruktiven Axiomen ist es das einzige, das uns eine Menge aus dem Nichts heraus entstehen lässt. Alle anderen Axiome werden uns lediglich erlauben, neue Mengen aus bestehenden zu erzeugen. Zur Schreiberleichterung werden wir uns der gewöhnlichen mathematischen Notation bedienen und die leere Menge mit dem Symbol 0/ bezeichnen. Behalten Sie dabei stets im Auge, dass wir mit 0/ kein neues
149
3.2 Axiomatische Mengenlehre
Symbol in die Sprache der Mengenlehre integrieren, sondern lediglich eine syntaktische Abkürzung vereinbaren. Konkret steht jede Formel ϕ, in der das Symbol 0/ vorkommt, stellvertretend für den Ausdruck ∃ x (∀ y y ∈ x ∧ ϕ[0/ ← x]) Hierin sind x und y zwei Variablen, von denen x nicht in ϕ vorkommen darf. Ferner steht der Ausdruck ϕ[0/ ← x] für die Formel ϕ, in der jedes Vorkommen des Symbols 0/ durch die neu eingeführte Variable x ersetzt wurde. Wenden wir die Ersetzung beispielsweise auf den Ausdruck 0/ ∈ z an, so entsteht die Formel ∃ x (∀ y y ∈ x ∧ x ∈ z)
(3.1)
Der so entstandene Ausdruck macht deutlich, dass mengentheoretische Formeln ohne die Einführung neuer Symbole schnell zu unüberschaubaren Gebilden degradieren. Dass die Ersetzung von 0/ vergleichsweise viel Mühe bereitet, hat einen einfachen Grund: Während alle bisher eingeführten Abkürzungen den Stellenwert von Prädikaten hatten, führen wir mit 0/ ein künstliches Konstantensymbol ein. In der bereinigten Formel (3.1) wird die Konstante durch die neu eingeführte Variable x beschrieben, und mithilfe der Variablen y wird sichergestellt, dass x tatsächlich der leeren Menge entspricht. I
∀ x ∀ y ∃ z ∀ u (u ∈ z ↔ u = x ∨ u = y)
Axiom der Paarung
„Sind a, b irgend zwei Dinge des Bereichs, so existiert immer eine Menge {a, b}, welche sowohl a als [auch] b, aber kein von beiden verschiedenes Ding x als Element enthält.“ Ernst Zermelo, 1908 Für zwei beliebige Mengen x und y garantiert das Paarungsaxiom die Existenz einer Menge z, die ausschließlich x und y als Elemente enthält. In gewöhnlicher mathematischer Notation besagt es, dass wir aus zwei beliebigen Mengen x und y immer auch die Menge {x, y} konstruieren können. Ist x = y, so entsteht die Menge {x}.
150
3 Fundamente der Mathematik
Zusammen mit dem Axiom der leeren Menge erlaubt das Paarungsaxiom die Konstruktion einer gehörigen Anzahl von Mengen, die sich in gewöhnlicher mathematischer Notation wie folgt lesen: 0, / {0}, / {0, / {0}}, / {0, / {0, / {0}}}, / {{0}, / {0, / {0}}}, / {{0}}, / ...
Axiom der Vereinigung
I
∀ x ∃ y ∀ z (z ∈ y ↔ ∃ (w ∈ x) z ∈ w) „Jeder Menge T entspricht eine Menge ST (die ‚Vereinigungsmenge‘ von T ), welche alle Elemente der Elemente von T und nur solche als Elemente enthält.“ Ernst Zermelo, 1908
In gewöhnlicher mathematischer Notation besagt das Vereinigungsaxiom, dass für jede Menge x auch die Menge y =
x :=
w
w∈x
existiert. Beispielsweise garantiert das Axiom für x = { 0, / {0, / {0}}, / {{0}} / }, die Existenz der Menge y = 0/ ∪ {0, / {0}} / ∪ {{0}} / = {0, / {0}} / Bildlich gesprochen entsteht die Vereinigungsmenge aus x, indem wir die Mengenhierarchie durch das Auflösen der zweiten Klammernebene abflachen und doppelte Vorkommen streichen. Wie gewohnt werden wir die Vereinigungsmenge zweier Mengen mit dem Symbol ‚∪‘ bezeichnen. Enthält eine Formel ϕ den Ausdruck ξ ∪ ν, so betrachten wir sie als Abkürzung für die Formel ∃ x (∀ y (y ∈ x ↔ y ∈ ξ ∨ y ∈ ν) ∧ ϕ[ξ ∪ ν ← x])
(3.2)
Das Ersetzungsschema ist dem der leeren Menge sehr ähnlich. x und y sind zwei neue Variablen, von denen x nicht in ϕ vorkommen darf, und der Ausdruck ϕ[ξ ∪ ν ← x] steht für die Formel ϕ, in der jedes Vorkommen der Zeichenkette ξ ∪ν durch die neu eingeführte Variable x ersetzt wurde. Dass wir die zusätzliche Variable x tatsächlich benötigen, hat einen ähnlichen Grund wie im Fall der leeren Menge. Wir haben mit
151
3.2 Axiomatische Mengenlehre
‚∪‘ ein neues Funktionssymbol geschaffen und benötigen die Variable x, um den Funktionswert zu referenzieren. Neben dem Symbol ‚∪‘ werden wir auch das Symbol ‚∩‘ verwenden, um den Schnitt zweier Mengen zu beschreiben. Analog zu (3.2) können wir jede Formel, die den Ausdruck ξ ∩ ν enthält, folgendermaßen umschreiben: ∃ x (∀ y (y ∈ x ↔ y ∈ ξ ∧ y ∈ ν) ∧ ϕ[ξ ∩ ν ← x])
I
∀ x ∃ y ∀ z (z ∈ y ↔ z ∈ x ∧ ϕ(z))
Axiom der Aussonderung (auch Axiom der Separation)
„Durch jede Satzfunktion f(x) wird aus jeder Menge m eine Untermenge mf ausgesondert, welche alle Elemente x umfasst, für die f(x) wahr ist. Oder: Jedem Teil einer Menge entspricht selbst eine Menge, welche alle Elemente dieses Teils enthält.“ Ernst Zermelo, 1908 Dieses Axiom besagt, dass für jede Menge x und für jede Eigenschaft P, die sich durch eine Formel ϕ beschreiben lässt, auch die Menge y = {z ∈ x | P(z)} existiert. In der ausgesonderten Menge y sind genau jene Elemente von x enthalten, die P erfüllen. Das Axiom ist als Axiomenschema ausgelegt, in dem der Platzhalter ϕ die Eigenschaft P repräsentiert. ϕ darf durch eine beliebige Formel ersetzen werden, in der z frei vorkommt. I
∃ x (0/ ∈ x ∧ ∀ (y ∈ x) {y} ∈ x)
Axiom des Unendlichen
„Der Bereich enthält mindestens eine Menge Z, welche die Nullmenge als Element enthält und so beschaffen ist, dass jedem ihrer Elemente a ein weiteres Element der Form {a} entspricht.“ Ernst Zermelo, 1908 Das Axiom garantiert uns die Existenz einer Menge x, I
so dass die leere Menge ein Element von x ist 0/ ∈ x
...
152
3 Fundamente der Mathematik
I
...
und für jedes y ∈ x auch die Menge {y} in x enthalten ist. ∀ (y ∈ x) {y} ∈ x
Das bedeutet, dass die Elemente 0, / {0}, / {{0}}, / {{{0}}}, / {{{{0}}}}, / {{{{{0}}}}}, / ... allesamt in x enthalten sind. Der Name des Axioms trägt der Tatsache Rechnung, dass die geforderte Eigenschaft von keiner endlichen Menge erfüllt werden kann. Folgerichtig dürfen wir in der Zermelo-Fraenkel-Mengenlehre immer davon ausgehen, dass Mengen mit unendlich vielen Elementen existieren. Die Zermelo’sche Formulierung des Unendlichkeitsaxioms ist nicht die einzig mögliche. In moderneren Abhandlungen über die Mengenlehre wird das Axiom auch gerne so formuliert: I
∃ x (0/ ∈ x ∧ ∀ (y ∈ x) y ∪ {y} ∈ x)
In dieser Variante wird gefordert, I
dass die leere Menge ein Element von x ist 0/ ∈ x
I
und für jedes y ∈ x auch die Menge y ∪ {y} in x enthalten ist. ∀ (y ∈ x) y ∪ {y} ∈ x
Eine Menge mit dieser Eigenschaft ist z. B. x = {0, / {0}, / {0, / {0}}, / {0, / {0}, / {0, / {0}}}, / {0, / {0}, / {0, / {0}}, / {0, / {0}, / {0, / {0}}}}, / ... Beide Formulierungen des Unendlichkeitsaxioms sind gleichwertig. Mithilfe der anderen ZF-Axiome können wir aus der einen Variante die andere herleiten und umgekehrt. Warum die Formulierung des Unendlichkeitsaxioms im Laufe der Zeit geändert wurde, werden Sie in Abschnitt 3.2.1.4 verstehen, wenn wir die Zermelo’sche und die Neumann’sche Zahlenreihe besprechen. Beide Zahlenreihen geben uns alternative Möglichkeiten an die Hand, um die natürlichen Zahlen in Form von Mengen darzustellen. Dort wird klar werden, dass das Axiom der Unendlichkeit eine ganz intuitive Aussage tätigt. Es behauptet schlicht, dass die natürlichen Zahlen eine Menge bilden. Das erste Axiom trägt diese Behauptung in sich, wenn wir die Zermelo’sche Zahlenrepräsentation zugrunde legen, und das zweite, wenn wir den Neumann’schen Ansatz verfolgen.
153
3.2 Axiomatische Mengenlehre
I
∀ x ∃ y ∀ z (z ∈ y ↔ z ⊆ x)
Axiom der Potenzmenge
„Jeder Menge m entspricht eine Menge Um, welche alle Untermengen von m als Elemente enthält, einschließlich der Nullmenge und m selbst.“ Ernst Zermelo, 1908 Das Axiom garantiert, dass zu jeder Menge x auch die Menge aller Teilmengen, d. h. die Potenzmenge y = 2x , existiert. Für x = {x1 , x2 , x3 } liest sich die Potenzmenge beispielsweise wie folgt: y = {0, / {x1 }, {x2 }, {x3 }, {x1 , x2 }, {x1 , x3 }, {x2 , x3 }, {x1 , x2 , x3 }} I
(∀ (a ∈ x) ∃1 b ϕ(a, b)) → (∃ y ∀ b (b ∈ y ↔ ∃ (a ∈ x) ϕ(a, b))) „Ist M eine Menge und wird jedes Element von M durch ‚ein Ding des Bereichs B‘ ersetzt, so geht M wiederum in eine Menge über.“ Abraham Fraenkel, 1922
Das Axiom besagt, dass für jede Funktion f , die mit einer Formel ϕ beschrieben werden kann, und jede Menge x = {x1 , x2 , x3 , . . .} auch die Menge y = { f (x1 ), f (x2 ), f (x3 ), . . .} existiert. Das Axiom ist als Axiomenschema ausgelegt, in dem wir den Platzhalter ϕ durch eine beliebige Formel ersetzen dürfen, die a und b als freie Variable enthält. Der Teilausdruck ∀ (a ∈ x) ∃1 b ϕ(a, b) stellt dabei sicher, dass ϕ eine Funktion f modelliert, die jedem Element a ∈ x genau ein Bildelement b zuordnet. Abraham Fraenkel führte das Ersetzungsaxiom als Ersatz für das Aussonderungsaxiom von Ernst Zermelo ein. In der Tat können wir in ZF das Aussonderungsaxiom aus dem Ersetzungsaxiom ableiten, nicht aber umgekehrt. Kurzum: Zermelos Mengenlehre ist eine echte Untertheorie
Axiom der Ersetzung
154
3 Fundamente der Mathematik
der Zermelo-Fraenkel’schen. Das Aussonderungsaxiom ist damit prinzipiell entbehrlich und manche Bücher wie z. B. [196] führen die ZFMengenlehre konsequenterweise mit nur 8 Axiomen ein. In den meisten Darstellungen wird das Aussonderungsaxiom trotzdem als Axiom aufgeführt und auch wir wollen uns dieser Gepflogenheit nicht widersetzen. Axiom der Fundierung (auch Axiom der Regularität) ∉ ∉ ∉
y
∉
∉
I
∀ x (x = 0/ → ∃ (y ∈ x) x ∩ y = 0) / „Jede (rückschreitende) Kette von Elementen, in welcher jedes Glied Element des vorangehenden ist, bricht mit endlichem Index ab bei einem Urelement. Oder, was gleichbedeutend ist: Jeder Teilbereich T enthält wenigstens ein Element t0 , das kein Element t in T hat.“ Ernst Zermelo, 1930
∉
Das Axiom der Fundierung besagt, dass wir in jeder nichtleeren Menge x ein Element y vorfinden können, dessen Elemente allesamt von den Elementen von x verschieden sind ( x ∩ y = 0). / Die Auswirkungen des Fundierungsaxioms sind größer, als es der erste Blick erwarten lässt. Zunächst halten wir fest, dass keine Menge existieren kann, die sich selbst als Element enthält (Abbildung 3.8). Um dies einzusehen, nehmen wir an, es gäbe eine Menge x1 mit x1 ∈ x1 . Dann würde die Menge x = {x1 } unmittelbar gegen das Fundierungsaxiom verstoßen, da x und x1 ein gemeinsames Element besäßen (wegen x1 ∈ x1 gilt x ∩ x1 = {x1 } = 0). / Das Fundierungsaxiom verhindert die Selbstinklusion sogar dann, wenn sie in Form einer Ringinklusion vorkommt, die sich über mehrere Hierarchiestufen erstreckt. Gäbe es tatsächlich Mengen x1 , x2 , x3 , . . . xn mit x1 ∈ x2 ∈ x3 ∈ . . . ∈ xn ∈ x1 so würde die Menge x = {x1 , x2 , x3 , . . . , xn } die Forderung des Fundierungsaxioms verletzen; jedes Element dieser Menge enthielte ein Element, das in x ebenfalls enthalten ist. Gleichermaßen unterbunden werden unendlich absteigende Inklusionsketten der Form x1
x2
x3 . . .
In diesem Fall steht die Menge {x1 , x2 , x3 , . . .} im Widerspruch zur Aussage des Fundierungsaxioms. Beachten Sie, dass die Umkehrung in die-
155
3.2 Axiomatische Mengenlehre
sem Fall nicht gilt. Unendlich aufsteigende Folgen
I Selbstinklusion
x1 ∈ x2 ∈ x3 . . . sind mit dem Axiom durchaus verträglich. Damit haben wir die Bedeutung dieses vergleichsweise mysteriös anmutenden Axioms aufgedeckt. Mit ihm ist wurde ein schwer zu überwindendes Bollwerk gegen die verschiedenen Formen der Russell’schen Antinomie in Stellung gebracht. Ist das errichtete Bollwerk unüberwindbar? Auch wenn nur wenige Mathematiker daran zweifeln, werden wir dies niemals mit unumstößlicher Gewissheit behaupten können. Warum dies so ist, wird Kapitel 4 klären. Dort werden wir herausarbeiten, dass sich die Widerspruchsfreiheit der ZF-Mengenlehre nicht mit den Mitteln der gewöhnlichen Mathematik beweisen lässt. Ganz nebenbei demonstriert das Fundierungsaxiom auch, wie wichtig die eingeführten Schreiberleichterungen sind, um die Lesbarkeit von Formeln sicherzustellen. Abbildung 3.9 zeigt, in welchem Gewand das Fundierungsaxiom erscheinen würde, wenn wir auf sämtliche Schreiberleichterungen verzichteten. Die wahre Bedeutung des Axioms ist jetzt kaum noch zu erkennen und verschwindet fast vollständig im Nebel der formalen Nomenklatur.
I
Axiom der Fundierung
∈ I Ringinklusion
∈
∈ ∈
∈ ∈
∈
I Unendlicher Abstieg
∋
∋
∋
∋
...
Abbildung 3.8: Das Fundierungsaxiom verbietet uns, Mengen zu definieren, die sich unmittelbar oder mittelbar selbst enthalten oder eine endlos absteigende Inklusionskette bilden. Hierdurch gelingt es, jene Antinomien von der ZF-Mengenlehre fernzuhalten, die die Mathematik einst in ihre größte Krise stürzten.
Ernst Zermelo (1871 – 1953)
„Jeder Teilbereich T enthält wenigstens ein Element t0 , das kein Element t in T hat.“ I
∀ x (x = 0/ → ∃ (y ∈ x) x ∩ y = 0) / ϕ(0) / := ∃ e ((∀ z z ∈ e) ∧ ϕ(e))
I
∃ e ((∀ z z ∈ e) ∧ ∀ x (x = e → ∃ (y ∈ x) x ∩ y = e)) ∃ (y ∈ x) ϕ := ∃ y (y ∈ x ∧ ϕ)
I
∃ e ((∀ z z ∈ e) ∧ ∀ x (x = e → ∃ y (y ∈ x ∧ x ∩ y = e))) ϕ(x ∩ y) := ∃ c (∀ b (b ∈ c ↔ b ∈ x ∧ b ∈ y) ∧ ϕ(c))
I
∃ c (∀ b (b ∈ c ↔ b ∈ x ∧ b ∈ y) ∧ ∃ e ((∀ z z ∈ e) ∧ ∀ x (x = e → ∃ y (y ∈ x ∧ c = e)))) x ∈ y := ¬(x ∈ y), x = y = ¬(x = y)
I
∃ c (∀ b (b ∈ c ↔ b ∈ x ∧ b ∈ y) ∧ ∃ e ((∀ z ¬(z ∈ e)) ∧ ∀ x (¬(x = e) → ∃ y (y ∈ x ∧ c = e))))
Abbildung 3.9: Ohne die vereinbarten Schreiberleichterungen wird das Fundierungsaxiom zu einem wahren Monster.
156
3 Fundamente der Mathematik
3.2.1.2
Das Auswahlaxiom
Es ist an der Zeit, uns dem zehnten und letzten Axiom der ZermeloFraenkel-Mengenlehre zuzuwenden: Dem Auswahlaxiom (Axiom of Choice, kurz AC). In der Vergangenheit wurde kontrovers diskutiert, ob AC zu den anderen Axiomen der Mengenlehre überhaupt hinzugenommen werden soll oder nicht. Bis heute ist die Diskussion nicht vollständig verebbt, und so haben wir es streng genommen mit zwei unterschiedlichen Mengenlehren zu tun: der ZF-Mengenlehre, bestehend aus den 9 Axiomen aus Abschnitt 3.2.1.1, und der ZFC-Mengenlehre (Zermelo-Fraenkel with Choice), die zusätzlich das Auswahlaxiom umfasst. Bevor wir uns im Detail damit befassen, welche Konsequenzen sich aus der Hinzunahme dieses in mancher Hinsicht mysteriösen Axioms ergeben, wollen wir zunächst seinen Inhalt offen legen: Axiom der Auswahl
I
(∀ (u, v ∈ x) (u = v → u ∩ v = 0) / ∧ ∀ (u ∈ x) u = 0) / → ∃ y ∀ (z ∈ x) ∃1 (w ∈ z) w ∈ y „Ist T eine Menge, deren sämtliche Elemente von 0/ verschiedene Mengen und untereinander elementfremd sind, so enthält ihre Vereinigung ∪T mindestens eine Untermenge S1 , welche mit jedem Element von T ein und nur ein Element gemein hat.“ Ernst Zermelo, 1930
Das Auswahlaxiom macht eine Aussage über alle Mengen x, I
deren Elemente paarweise disjunkte Mengen sind ∀ (u, v ∈ x) (u = v → u ∩ v = 0) /
I
und keines dieser Elemente die leere Menge ist. ∀ (u ∈ x) u = 0/
Für solche Mengen garantiert uns das Auswahlaxiom, dass wir aus jeder Menge z ∈ x ein Element auswählen und die gewählten Elemente anschließend in einer neuen Menge y zusammenfassen können. ∃ y ∀ (z ∈ x) ∃1 (w ∈ z) w ∈ y
Beachten Sie, dass uns das Auswahlaxiom lediglich die Existenz einer Auswahlmenge zusichert, aber nicht erklärt, wie wir diese konstruieren können. Das Axiom ist nicht konstruktiv. Des Weiteren wirkt es
157
3.2 Axiomatische Mengenlehre
mehr wie ein Theorem denn wie ein Axiom. Mit seiner sehr speziellen Aussage erweckt es den Anschein, als müsse es sich aus den anderen Axiomen als Konsequenz ergeben. Dass dem nicht so ist, haben Sie bereits in Kapitel 1.1 erfahren. Das Auswahlaxiom ist von den anderen Axiomen unabhängig und in ZF daher weder beweisbar noch widerlegbar [32, 65]. Genau wie im Fall der Kontinuumshypothese können wir das Auswahlaxiom, oder alternativ auch dessen Negation, zu den anderen Axiomen hinzufügen, ohne einen Widerspruch zu erhalten. Seiner Unbeweisbarkeit zum Trotz scheint das Auswahlaxiom dennoch eine intuitive Wahrheit auszudrücken. Warum sollte es nicht möglich sein, aus nichtleeren Mengen Elemente herauszunehmen? An die Auswahl selbst haben wir ja keinerlei Bedingung geknüpft, so dass beliebige Elemente unseren Zweck erfüllen. Und wenn eine Menge unendlich viele Elemente enthält? Umso besser! Offensichtlich sind jetzt mehr als genug Elemente vorhanden, um eines davon zu entnehmen. Nun, manchmal ist es ratsam, der eigenen Intuition zu misstrauen, insbesondere dann, wenn wir dem Begriff der Unendlichkeit gefährlich nahe kommen. Wir wollen das Auswahlaxiom kurz beiseite stellen und einen bekannten Begriff der Mathematik rekapitulieren: Den Begriff der Ordnung (vgl. Abbildung 3.10 und Abbildung 3.11).
Definition 3.4 (Ordnungsbegriffe)
I Beispiel 1: (Z \ {0}, ≺)
Beispiel 1: mit x ≺ y :⇔ x < y ∧ |x| = |y| -1 < 1
-2 < 2
-3 < 3 ...
...
Ordnung: Totale Ordnung: Wohlordnung:
Ja Nein Nein
I Beispiel 2: (Z, <)
-2 < -1 < 0 < 1 < 2 < 3 ...
...
Ordnung: Totale Ordnung: Wohlordnung:
Ja Ja Nein
I Beispiel 3: (N, <)
0 < 1 < 2 < 3 < 4 < 5 < 6 ...
Ordnung: Totale Ordnung: Wohlordnung:
Ja Ja Ja
Sei M eine Menge und ‚<‘ eine binäre Relation auf M. I
‚<‘ ist eine Halbordnung oder Ordnung, wenn ‚<‘ 1. irreflexiv ist, d. h., es gilt niemals x < x, 2. asymmetrisch ist, d. h., aus x < y folgt y < x, 3. transitiv ist, d. h., aus x < y und y < z folgt x < z.
I
‚<‘ ist eine lineare oder totale Ordnung auf M, wenn 1. ‚<‘ eine Ordnung ist und 2. für alle x, y ∈ M immer entweder x < y oder y < x gilt.
I
‚<‘ ist eine Wohlordnung auf M, wenn 1. ‚<‘ auf M eine totale Ordnung ist und 2. jede Menge N ⊆ M mit N = 0/ ein kleinstes Element besitzt, d. h., es existiert ein x ∈ N mit x < y für alle y ∈ N \ {x}.
Abbildung 3.10: Veranschaulichung der Ordnungsbegriffe. Die Menge Z \ {0} ist bezüglich ‚≺‘ geordnet, aber nicht total geordnet. Für alle Elemente x und y mit |x| = |y| gilt hier weder x ≺ y noch y ≺ x. Die Menge Z ist bezüglich ‚<‘ total geordnet, aber nicht wohlgeordnet. Beispielsweise hat die Menge Z selbst kein minimales Element. Wohlgeordnet bezüglich ‚<‘ ist dagegen die Menge N. Hier ist in jeder nichtleeren Teilmenge immer auch ein minimales Element enthalten.
158
3 Fundamente der Mathematik
I
Georg Cantor, 1883 [20] „Unter einer wohlgeordneten Menge ist jede wohldefinierte Menge zu verstehen, 1) bei welcher die Elemente durch eine bestimmt vorgegebene Succession miteinander verbunden sind, 2) welcher gemäß es ein erstes Element der Menge gibt, 3) und sowohl auf jedes einzelne Element (falls es nicht das letzte in der Succession ist) ein bestimmtes anderes folgt, 4) wie auch zu jeder beliebigen endlichen oder unendlichen Menge von Elementen ein bestimmtes Element gehört, welches das ihnen allen nächst folgende Element in der Succession ist (es sei denn, dass es ein ihnen allen in der Succession folgendes überhaupt nicht gibt).“
I
Moderne Formulierung 1) M ist bezüglich ‚<‘ total geordnet. 2) Ist M = 0, / so existiert in M ein kleinstes Element. 3) Existiert ein y mit x < y, so gibt es ein kleinstes y mit x < y. 4) Existiert ein y mit N < y (N ⊂ M), so gibt es ein kleinstes y mit N < y.
I
Georg Cantor, 1897 [22] „A. Jede Teilmenge F1 einer wohlgeordneten Menge F hat ein niederstes Element.“ „B. Ist eine einfach geordnete Menge F so beschaffen, dass sowohl F wie auch jede ihrer Teilmengen ein niederstes Element haben, so ist F eine wohlgeordnete Menge.“
Abbildung 3.11: Ein Stück Geschichte. In seiner Arbeit aus dem Jahr 1883 charakterisierte Georg Cantor den Begriff der Wohlordnung mithilfe von vier Eigenschaften, die sich auf den ersten Blick deutlich von jenen aus Definition 3.4 unterscheiden. Dass beide Definitionen tatsächlich den gleichen Ordnungsbegriff beschreiben, bewies Cantor im Jahr 1897.
Totale Ordnungen besitzen die Eigenschaft, dass wir zwei Elemente x und y immer in Beziehung zueinander setzen können; es gilt also entweder x < y oder y < x. Totale Ordnungen werden gerne als lineare Ordnungen bezeichnet, da wir uns die Elemente kettenförmig angeordnet vorstellen können. Seien Sie sich dabei stets bewusst, dass eine solche Anordnung nicht bedeuten muss, dass jedes Element x einen direkten Nachfolger besitzt. Beispielsweise ist die Menge Q bezüglich ‚<‘ total geordnet, aber zwischen zwei Elementen x und y gibt es stets ein weiteres Element z mit x < z und z < y. Vom Begriff der totalen Ordnung ist der Begriff der Wohlordnung nur einen kleinen Schritt entfernt. Eine Totalordnung auf M ist genau dann eine Wohlordnung, wenn sie zusätzlich die Eigenschaft erfüllt, dass je-
3.2 Axiomatische Mengenlehre
de nichtleere Teilmenge N ⊆ M ein minimales Element enthält. Es ist leicht einzusehen, dass die natürlichen Zahlen bezüglich ‚<‘ wohlgeordnet sind; schließlich existiert in jeder Teilmenge von N ein Element, das kleiner ist als alle anderen. Betrachten wir hingegen die Menge der ganzen Zahlen, so wird die Wohlordnungseigenschaft bereits durch die Menge Z selbst verletzt. Die Menge der ganzen Zahlen ist nach unten unbeschränkt und besitzt somit kein minimales Element. Genauso wenig ist die Menge der positiven rationalen Zahlen Q+ bezüglich ‚<‘ wohlgeordnet. Hier wird die Wohlordnungseigenschaft durch jedes linksseitig geöffnete Intervall verletzt. Trotzdem können wir mit einem Trick die Elemente aus Q+ so umordnen, dass eine Wohlordnung entsteht. Hierzu führen wir mit ‚≺‘ eine neue Ordnung ein, die wir für gekürzte Brüche folgendermaßen definieren (vgl. Abbildung 3.12): p2 p1 p1 < p2 falls p1 = p2 ≺ :⇔ q1 < q2 falls p1 = p2 q1 q2 Um unter zwei rationalen Zahlen qp11 und qp22 die kleinere zu bestimmen, werden zunächst die beiden Zähler p1 und p2 verglichen. Ein kleinerer Zähler ist in der neuen Vergleichsrelation gleichbedeutend mit einer kleineren Zahl. Nur wenn die Zähler gleich sind, entscheiden die Nenner q1 und q2 darüber, welche Zahl die kleinere ist. Tatsächlich haben wir es durch die Umsortierung geschafft, auf den rationalen Zahlen eine Wohlordnung zu definieren. Wir können jetzt eine beliebige nichtleere Teilmenge herausgreifen und werden immer ein eindeutiges Element identifizieren können, das bezüglich ‚≺‘ minimal ist. Der errungene Erfolg mag uns zu der Annahme verleiten, dass sich ausnahmslos jede Menge wohlordnen lässt. In Satzform lautet unsere Vermutung wie folgt: Satz 3.1 (Wohlordnungssatz) Jede Menge kann wohlgeordnet werden.
Als Beispiel betrachten wir die reellen Zahlen. Bezüglich der gewöhnlichen Vergleichsoperation ‚<‘ ist R nicht wohlgeordnet, da z. B. jedes nach links geöffnete Intervall die Wohlordnungseigenschaft verletzt. Sollte sich der Wohlordnungssatz aber tatsächlich als wahr erweisen, so müssten wir in der Lage sein, auch die Menge der reellen Zahlen wohlzuordnen. Nehmen Sie sich an dieser Stelle ruhig etwas Zeit und versuchen Sie, die reellen Zahlen so umzuordnen, dass eine Wohlordnung entsteht.
159
Der Begriff der Halbordnung wird in der Literatur unterschiedlich definiert. In manchen Büchern wird, wie hier, die Eigenschaft der Irreflexivität gefordert. Andere gehen von der Eigenschaft der Reflexivität aus und fordern anstelle der Asymmetrie die Antisymmetrie. In der Mathematik wird eine Relation als antisymmetrisch bezeichnet, wenn die Beziehungen x < y und y < x nur dann gleichzeitig gelten können, wenn x = y ist. Manche Autoren machen den Unterschied explizit deutlich, indem sie ausdrücklich von irreflexiven oder reflexiven Ordnungen sprechen. Beide Varianten haben ihre Berechtigung. Beispielsweise ist die Teilmengenrelation ⊆ eine reflexive Ordnung (es gilt stets x ⊆ x) und die Elementrelation ∈ eine irreflexive Ordnung (für keine Menge x gilt x ∈ x). Spätestens diese Beispiele machen klar, dass die maßgebende Eigenschaft einer Ordnungsrelation nicht deren Irreflexivität oder Reflexivität ist, sondern die asymmetrische bzw. antisymmetrische Anordnung der Elemente zusammen mit der Transitivität. Auch in unseren Betrachtungen spielt es keine Rolle, ob die untersuchten Ordnungsrelationen irreflexiv oder reflexiv sind. Aus diesem Grund werden wir die Unterscheidung weitgehend ignorieren und immer nur allgemein von Ordnungen sprechen.
160
3 Fundamente der Mathematik
1/1
1/2
1/3
...
2/1
2/2
2/3
...
3/1
3/2
3/3
...
4/1
4/2
4/3
...
5/1
5/2
5/3
...
6/1
6/2
6/3
...
7/1
7/2
7/3
...
8/1
8/2
8/3
...
Abbildung 3.12: Durch die geschickte Umsortierung der rationalen Zahlen können wir die Menge Q+ wohlordnen. In der neuen Aufzählung erscheinen zunächst die Brüche mit dem Zähler 1, danach folgen die Brüche mit dem Zähler 2 und so fort. Beachten Sie, dass jede rationale Zahle neben ihrer gekürzten Bruchdarstellung unendlich viele ungekürzte Darstellungen besitzt. Letztere sind in der Abbildung grau dargestellt und spielen für die Ordnungsdefinition keine Rolle.
Wahrscheinlich haben Sie bemerkt, dass der Trick, der uns die rationalen Zahlen auf so einfache Weise wohlordnen ließ, im Fall der reellen Zahlen versagt. Dass Sie mit Ihren Versuchen gescheitert sind, ist keine Schmach. Bis heute ist es niemandem gelungen, eine konstruktive Ordnungsvorschrift ‚≺‘ zu definieren, die zu einer Wohlordnung auf den reellen Zahlen führt. Die gescheiterten Versuche nähren den Verdacht, dass die Wohlordnung der reellen Zahlen überhaupt nicht gelingen kann. Dürfen wir unserer Intuition, die uns mit steigender Beharrlichkeit von der Falschheit des Wohlordnungssatzes überzeugen möchte, dieses Mal trauen? Ist das Auswahlaxiom tatsächlich wahr und der Wohlordnungssatz falsch? Damit ist es an der Zeit, den Schleier zu lüften und Fakten sprechen zu lassen. Es ist ein fundamentales Ergebnis der modernen Mengenlehre, dass der Wohlordnungssatz und das Auswahlaxiom äquivalent sind. In der Tat können wir den Wohlordnungssatz innerhalb von ZFC beweisen und umgekehrt das Auswahlaxiom in ZF herleiten, wenn wir den Wohlordnungssatz als Axiom hinnehmen (Abbildung 3.13). Eine konkrete Ordnungsvorschrift liefert der Beweis dagegen nicht. In der gleichen Weise, wie das Auswahlaxiom lediglich die Existenz einer Auswahlmenge postuliert, garantiert uns der Beweis des Wohlordnungssatzes zwar die Existenz einer solchen Ordnung, er sagt aber nicht, wie wir die Elemente konkret anordnen müssen. Eine weitere Konsequenz ergibt sich aus der Unabhängigkeit des Auswahlaxioms. Es folgt, dass die ZF-Axiome sowohl mit dem Wohlordnungssatz als auch mit seiner Negation verträglich sind. Wir können also annehmen, dass sich die reellen Zahlen wohlordnen lassen, oder das Gegenteil postulieren; keine dieser Annahmen wird zu einem Widerspruch führen, sofern die ZF-Axiome selbst widerspruchsfrei sind. Genau hierin liegt auch der Grund, warum Sie keine Wohlordnung auf den reellen Zahlen konstruieren konnten. Wäre es Ihnen gelungen, so hätten Sie gezeigt, dass die ZF-Axiome mit der Negation des Wohlordnungssatzes unverträglich sind, doch genau dies ist nicht der Fall. Ein wahrhaft erstaunliches Ergebnis der modernen Mengenlehre! Eine dritte Charakterisierung des Auswahlaxioms wollen wir nicht verschweigen. Sie kommt in Form des Zorn’schen Lemmas daher: Satz 3.2 (Zorn’sches Lemma) Jede nichtleere halbgeordnete Menge, in der jede total geordnete Teilmenge eine obere Schranke besitzt, enthält mindestens ein maximales Element.
161
3.2 Axiomatische Mengenlehre
Beweis, dass jede Menge wohlgeordnet werden kann. (Aus einem an Herrn Hilbert gerichteten Briefe.) Von E. Z ERMELO in Göttingen 1) Es sei M eine beliebige Menge, [...] 2) Jeder [nichtleeren] Teilmenge M [von M] denke man sich ein beliebiges Element m1 zugeordnet, das in M selbst vorkommt und das ‚ausgezeichnete‘ Element von M genannt werden möge. So entsteht eine ‚Belegung‘ γ der Menge M [2M − {0}] mit Elementen der Menge M von besonderer Art. [...] Im Folgenden wird nun eine beliebige Belegung γ zugrunde gelegt und aus ihr eine bestimmte Wohlordnung der Elemente von M abgeleitet. 3) Definition. Als ‚γ-Menge‘ werde bezeichnet jede wohlgeordnete Menge Mγ [⊆ M], welche folgende Beschaffenheit besitzt: ist a ein beliebiges Element von Mγ und A der ‚zugehörige‘ Abschnitt, der aus den vorangehenden Elementen x ≺ a von Mγ besteht, so ist a immer das ‚ausgezeichnete Element‘ von M − A. 4) Es gibt γ-Mengen innerhalb M. So ist z. B. m1 , das ausgezeichnete Element von M = M, selbst eine γ-Menge. [...] 5) Sind Mγ und Mγ irgend zwei verschiedene γ-Mengen (die aber zu derselben ein für allemal gewählten Belegung gehören!), so ist immer eine von beiden identisch mit einem Abschnitte der anderen. [...]
6) Folgerungen. Haben zwei γ-Mengen ein Element a gemeinsam, so haben sie auch den Abschnitt A der vorangehenden Elemente gemein. Haben sie zwei Elemente a, b gemein, so ist in beiden Mengen entweder a ≺ b oder b ≺ a. 7) Bezeichnet mal als ‚γ-Element‘ jedes Element von M, das in irgendeiner γ-Menge vorkommt, so gilt der Satz: Die Gesamtheit Lγ aller γ-Elemente lässt sich so ordnen, dass sie selbst eine γ-Menge darstellt, und umfasst alle Elemente der ursprünglichen Menge M. Die letztere ist damit selbst wohlgeordnet. [...] Somit entspricht jeder Belegung γ eine ganz bestimmte Wohlordnung der Menge M. [...] Der vorliegende Beweis beruht auf der Voraussetzung, dass Belegungen γ überhaupt existieren, also auf dem Prinzip, dass es auch für eine unendliche Gesamtheit von Mengen immer Zuordnungen gibt, bei denen jeder Menge eines ihrer Elemente entspricht. [...] Die Idee, unter Berufung dieses Prinzip eine beliebige Belegung γ der Wohlordnung zugrunde zu legen, verdanke ich Herrn Erhard Schmidt; meine Durchführung des Beweises beruht dann auf der Verschmelzung der verschiedenen möglichen ‚γ-Mengen‘, d. h. der durch das Ordnungsprinzip sich ergebenden wohlgeordneten Abschnitte.
Münden i. Hann., den 24. September 1904. Ernst Zermelo
Abbildung 3.13: Beweis des Wohlordnungssatzes durch Ernst Zermelo [46,201]. Zum ersten Mal äußerte er den Beweis im Jahr 1904 in dem hier zitierten Brief an David Hilbert. Zum besseren Verständnis sind diejenigen Passagen, die das Auswahlaxiom bemühen, farblich hervorgehoben.
Das Zorn’sche Lemma, das Auswahlaxiom und das Wohlordnungsprinzip sind äquivalent. Fügen wir eines davon den ZF-Axiomen hinzu, so können wir die anderen beiden als Theoreme ableiten. Auch wenn das Zorn’sche Lemma die am wenigsten intuitive Aussage tätigt, hat es mehrere Anwendungen in der gewöhnlichen Mathematik. Für wichtige Sätze der linearen Algebra und der Funktionalanalysis lassen sich mithilfe des Zorn’schen Lemmas vergleichsweise kurze Beweise konstruieren.
162
I "
I "
,
3 Fundamente der Mathematik
3.2.1.3
#
,"
,
##
Mengenlehre als Fundament der Mathematik
In diesem Abschnitt werden wir die Sprache der Zermelo-FraenkelMengenlehre weiter ausbauen und demonstrieren, wie sich die Begriffe der gewöhnlichen Mathematik in ZF formalisieren lassen. Hierzu werden wir eine Reihe neuer Sprachkonstrukte einführen, die in gewohnter Weise als syntaktische Abkürzungen zu verstehen sind. Sie werden dazu beitragen, die Formeln der ZF-Mengenlehre noch kompakter und verständlicher niederzuschreiben, als es bisher schon möglich war. Allem anderen vorweg wollen wir erlauben, die gewöhnliche Mengenschreibweise in Formeln der ZF-Mengenlehre zu verwenden. Für endliche Mengen ist dies problemlos möglich, da wir jede Formel ϕ, die einen Ausdruck der Form {ξ1 , . . . , ξn } enthält, durch eine äquivalente Formel der Bauart ∃ x (ψ(x) ∧ ϕ[{ξ1 , . . . , ξn } ← x])
I ""
,
#,
#
ersetzen können. In dieser Formel wird ψ(x) so gewählt, dass die Menge {ξ1 , . . . , ξn } eindeutig durch die neu eingeführte Variable x beschrieben wird. Natürlich darf anstelle von x auch jede andere Variable verwendet werden, die nicht in ϕ vorkommt. Als Beispiel seien die Mengen y = {y1 } und x = {x1 , x2 } gegeben. Die Menge y können wir durch die Formel ψ1 (y) := y1 ∈ y ∧ ∀ (z ∈ y) z = y1 beschreiben und die Menge x durch die Formel ψ2 (x) := x1 ∈ x ∧ x2 ∈ x ∧ ∀ (z ∈ x) (z = x1 ∨ z = x2 )
Abbildung 3.14: Mithilfe der Konstruktion "ξ , ν# := { {ξ }, {ξ , ν} } lässt sich auf den ungeordneten Elementen einer Menge eine Reihenfolge definieren. Der Begriff des geordneten Paares lässt sich dadurch genauso auf die Mengenlehre reduzieren wie der allgemeinere Begriff des geordneten n-Tupels.
Damit sind wir in der Lage, auch die Formel {y1 } = {x1 , x2 } → (x1 = y1 ∧ x2 = y1 )
(3.3)
in der ureigenen Sprache der ZF-Mengenlehre auszudrücken. In ihrer Reinform liest sie sich wie folgt: ∃ y (y1 ∈ y ∧ ∀ (z ∈ y) z = y1 ∧ ∃ y (∃ x (x1 ∈ x ∧ x2 ∈ x ∧ ∀ (z ∈ x) (z = x1 ∨ z = x2 ) ∧ ∃ y (∃ x ((y = x → (x1 = y1 ∧ x2 = y1 )))) Auf der eingeführten Mengenschreibweise können wir aufbauen und den Begriff des geordneten Paares formalisieren. Anders als in der Menge {ξ , ν} besitzen die Elemente ξ und ν in einem geordneten
163
3.2 Axiomatische Mengenlehre
I
„x ist eine zweistellige Relation“
I
∀ (y ∈ x) ∃ u ∃ v y = "u, v# I
∀ (y ∈ x) ∃ u ∃ v ∃ z1 ((u ∈ z1 ∧ ∃ z1 ((∀ (z ∈ z1 ) z = u) ∧ ∃ z2 ((u ∈ z2 ∧ v ∈ z2 ∧
Definition des geordneten Paares ∀ (y ∈ x) ∃ u ∃ v y = {{u}, {u, v}}
I
I
∃ z2 ((∀ (z ∈ z2 ) (z = u ∨ z = v)) ∧ ∃ z (z1 ∈ z ∧ z2 ∈ z ∧
Auflösen von {{u}, {u, v}} ∀ (y ∈ x) ∃ u ∃ v ∃ z ({u} ∈ z ∧ {u, v} ∈ z ∧ ∃ z ( ∀ (z ∈ z) (z = {u} ∨ z = {u, v}) ∧ ∃ z ( y = z) Auflösen von {u} ∀ (y ∈ x) ∃ u ∃ v ∃ z1 ((u ∈ z1 ∧ ∃ z1 ((∀ (z ∈ z1 ) z = u) ∧ ∃ z (z1 ∈ z ∧ {u, v} ∈ z ∧ ∃ z ( ∀ (z ∈ z) (z = z1 ∧ z = {u, v}) ∧ ∃ z ( y = z))
Auflösen von {u, v}
∃ z ( ∀ (z ∈ z) (z = z1 ∧ z = z2 ) ∧ ∃ z ( y = z))) I
Eliminieren der bedingten Quantoren ∀ y (y ∈ x → ∃ u ∃ v ∃ z1 ((u ∈ z1 ∧ ∃ z1 ((∀ z (z ∈ z1 → z = u)) ∧ ∃ z2 ((u ∈ z2 ∧ v ∈ z2 ∧ ∃ z2 ((∀ z (z ∈ z2 → (z = u ∨ z = v))) ∧ ∃ z (z1 ∈ z ∧ z2 ∈ z ∧ ∃ z ( ∀ z (z ∈ z → (z = z1 ∧ z = z2 )) ∧ ∃ z ( y = z))))
Abbildung 3.15: Formalisierung des Relationenbegriffs in der Sprache der Zermelo-Fraenkel-Mengenlehre
Paar "ξ , ν# eine feste Position, d. h., wir müssen einen Weg finden, um die Positionsinformation in eine gewöhnliche Menge hineinzucodieren. Hierzu bedienen wir uns eines einfachen, aber eleganten Tricks (Abbildung 3.14) und setzen "ξ , ν# := { {ξ }, {ξ , ν} } Die Definition erfüllt ihren Zweck: Obwohl die Menge { {ξ }, {ξ , ν} } selbst ungeordnet ist, können wir die Position von ξ und ν eindeutig aus der Struktur ihrer Elemente {ξ } und {ξ , ν} extrahieren. Vorgeschlagen wurde diese Mengendarstellung für geordnete Paare im Jahr 1921 von Kazimierz Kuratowski [107] und lässt sich in nahelie-
164
I Partielle Funktion
„Kein Element des Definitionsbereichs wird auf mehr als ein Element des Wertebereichs abgebildet“
3 Fundamente der Mathematik
gender Weise auf geordnete Tupel beliebiger Größe erweitern: "ξ1 # := ξ1 "ξ1 , . . . , ξn+1 # := ""ξ1 , . . . , ξn #, ξn+1 # Der eingeschlagene Kurs führt uns auf direktem Weg zum Begriff der Relation. Formal gesehen verbirgt sich hinter einer Relation eine Menge ξ von geordneten Paaren, so dass wir die Aussage „ξ ist eine Relation“ wie folgt innerhalb der Zermelo-Fraenkel-Mengenlehre beschreiben können:
I Totale Funktion
„Jedes Element des Definitionsbereichs wird auf ein und nur ein Element des Wertebereichs abgebildet“
Abbildung 3.16: In der Mathematik werden partielle und totale Funktionen unterschieden. Eine Funktion heißt partiell, wenn zu jedem Element des Definitionsbereichs höchstens ein Bildelement existiert; sie heißt total, wenn jedes Element des Definitionsbereichs genau ein Bildelement besitzt.
R(ξ ) := ∀ (y ∈ ξ ) ∃ u ∃ v y = "u, v# In dieser Schreibweise wirkt die Formel kompakt und elegant. Was sich in Wirklichkeit hinter ihr verbirgt, wird deutlich, wenn wir die eingeführten Abkürzungen schrittweise auflösen. Die entkleidete Formel ist in Abbildung 3.15 zu sehen; sie ist ein wahres Monster und demonstriert ein weiteres Mal, wie wichtig die vereinfachenden Schreibweisen wirklich sind. Ohne sie degradieren mengentheoretische Formeln zu riesigen Gebilden, deren Inhalt für uns Menschen nicht mehr zu erkennen ist. Zu guter Letzt wollen wir den Begriff der (partiellen) Funktion formal erfassen. Allgemein verstehen wir unter einer Funktion ξ eine binäre Relation der folgenden Form: ξ = {(u, v) | v = f (u)} Präzise formuliert ist eine binäre Relation ξ genau dann eine (partielle) Funktion, wenn sie rechtseindeutig ist, d. h., wenn zu jedem u höchstens ein v existiert mit (u, v) ∈ ξ (vgl. Abbildung 3.16). Somit können wir die Aussage „ξ ist eine Funktion“ folgendermaßen formalisieren: F(ξ ) := R(ξ ) ∧ ∀ u ∀ v ∀ w ("u, v# ∈ ξ ∧ "u, w# ∈ ξ → v = w)
Beweisebenen An mehreren Stellen dieses Buchs wurde betont, dass wir die ZermeloFraenkel-Mengenlehre als das formale Fundament der Mathematik ansehen dürfen. Eine erste Rechtfertigung halten wir bereits in Händen. Die Beispiele des geordneten Paares, der Relation und der Funktion haben gezeigt, dass ganz gewöhnliche Begriffe der Mathematik innerhalb der Mengenlehre beschrieben werden können. Zusätzlich werden wir in Abschnitt 3.2.2 erarbeiten, wie sich der Zahlenbegriff auf den Mengenbegriff reduzieren lässt. Sobald die natürlichen Zahlen formalisiert
165
3.2 Axiomatische Mengenlehre
sind, können wir darauf aufbauen und die ganzen Zahlen definieren. Auf den ganzen Zahlen lässt sich die Theorie der rationalen Zahlen errichten und hierauf wiederum die Theorie der reellen Zahlen. Setzen wir den Abstraktionsprozess fort, so erreichen wir sämtliche Gebiete der gewöhnlichen Mathematik; sie sind die Äste eines Baums, dessen Wurzel im Fundament der Mengenlehre einen fest Halt gefunden hat. Ein wichtiger Baustein unserer Rechtfertigung steht allerdings noch aus. Wir müssen gewährleisten, dass sich nicht nur die Begriffe, sondern auch die Beweise der gewöhnlichen Mathematik innerhalb der Mengenlehre nachvollziehen lassen. Am Beispiel des folgenden Satzes wollen wir demonstrieren, dass dies tatsächlich gelingt:
Mengentheoretische Hilfstheoreme ξ ∈ {ξ , ν}
(H1)
ξ ∈ {ν, ξ }
(H2)
ξ ∈ {ν, μ} → (ξ = ν ∨ ξ = μ)
(H3)
ξ ∈ ν → (ν = μ → ξ ∈ μ)
(H4)
ξ =ν →ν =ξ
(H5)
ξ = ν → (ν = μ → ξ = μ)
(H6)
ξ = ν → ({ξ , μ} = {ν, υ} → {ξ , μ} = {ξ , υ})
Satz 3.3 (Komponentengleichheit geordneter Paare) Für beliebige geordnete Paare "x, y# und "u, v# gilt die Beziehung Aus "x, y# = "u, v# folgt x = u und y = v
Um zu sehen, wie sich dieser Satz in der gewöhnlichen Sprache der Mathematik beweisen lässt, schlagen wir in einem der Standardwerke nach. In [117] lautet der Beweis im Originalwortlaut z. B. so:
(H7)
{ξ } = {ν} → ξ = ν
(H8)
{ξ , ν} = {μ} → ξ = μ
(H9)
{ξ , ν} = {μ} → ν = μ
(H10)
{ξ , ν} = {ξ , μ} → μ = ν
(H11)
Aussagenlogische Hilfstheoreme ϕ → (ψ → (ϕ ∧ ψ))
(TA1)
(ϕ ∨ ψ) → ((χ ∨ ψ) → „Assume "x, y# = "u, v#. Then {{x}, {x, y}} = {{u}, {u, v}}. Since {x} ∈ {{x}, {x, y}}, {x} ∈ {{u}, {u, v}}. Hence, {x} = {u} or {x} = {u, v}. In either case, x = u. Now, {u, v} ∈ {{u}, {u, v}}; so, {u, v} ∈ {{x}, {x, y}}. Then, {u, v} = {x} or {u, v} = {x, y}. Similarly, {x, y} = {u} or {x, y} = {u, v}. If {u, v} = {x} and {x, y} = {u}, then x = y = u = v; if not, {u, v} = {x, y}. Hence, {u, v} = {u, y}. So, if v = u, then y = v; if v = u, then y = v. Thus, in all cases, y = v.“
Damit wir den Satz überhaupt innerhalb von ZF beweisen können, übersetzen wir ihn zunächst in die formale Schreibweise: ∀ x ∀ y ∀ u ∀ v ("x, y# = "u, v# → x = u ∧ y = v) Wir wollen versuchen, den Beweis nicht unnötig zu verkomplizieren. Aus diesem Grund werden wir auf eine Reihe von Hilfstheoremen zurückgreifen, die entweder aussagenlogische Tautologien sind oder elementare Aussagen über die Elementrelation ‚∈‘ und die Gleichheitsrelation ‚=‘ tätigen. Tabelle 3.5 fasst zusammen, auf welche Theoreme wir dabei im Einzelnen zurückgreifen. Wir gehen davon aus, dass die
((ϕ ∧ χ) ∨ ψ))
(TA3)
(ϕ → ψ) → ((¬ϕ → ψ) → ψ) (TA2) (ϕ ∨ ψ) → ((ϕ → χ) → ((ψ → χ) → χ))
(TA4)
Tabelle 3.5: Hilfstheoreme für den Beweis von Satz 3.3
166
3 Fundamente der Mathematik
Variablen ξ , ν und μ nicht nur durch Variablen, sondern auch durch Mengenkonstrukte wie z. B. {x, y} ersetzt werden dürfen. Eine Warnung vorweg: Widerstehen Sie der Versuchung, die Rolle der Hilfstheoreme zu unterschätzen! Auch wenn sie inhaltlich einer Ansammlung von Trivialitäten gleichen, sind sie nicht in jedem Fall einfach zu beweisen. Führten wir die Beweise zusätzlich auf, so würde sich die nun folgende Ableitung um mehrere Seiten verlängern. Assume "x, y# = "u, v#. Then {{x}, {x, y}} = {{u}, {u, v}}. Since {x} ∈ {{x}, {x, y}},
{x} ∈ {{u}, {u, v}}. Hence, {x} = {u} or {x} = {u, v}.
1. "x, y# = "u, v# {{x}, {x, y}} = {{u}, {u, v}} (Def) 2. {x} ∈ {{x}, {x, y}} (H1) 3. {x} ∈ {{x}, {x, y}} → (H4) ({{x}, {x, y}} = {{u}, {u, v}} → {x} ∈ {{u}, {u, v}}) 4. {{x}, {x, y}} = {{u}, {u, v}} → {x} ∈ {{u}, {u, v}} (MP, 2,3) 5. "x, y# = "u, v# {x} ∈ {{u}, {u, v}} (MP, 1,4) 6. {x} ∈ {{u}, {u, v}} → ({x} = {u} ∨ {x} = {u, v}) (H3) 7. "x, y# = "u, v# {x} = {u} ∨ {x} = {u, v} (MP, 5,6) 8. {x} = {u} → x = u (H8) 9. {u, v} = {x} → x = u (H9) 10. {x} = {u, v} → {u, v} = {x} (H5) 11. {x} = {u, v} {u, v} = {x} (DT) 12. {x} = {u, v} x = u (MP, 10,11) 13. {x} = {u, v} → x = u (DT) 14. ({x} = {u} ∨ {x} = {u, v}) → (({x} = {u} → x = u) →
In either case, x = u. Now, {u, v} ∈ {{u}, {u, v}};
(({x} = {u, v} → x = u) → x = u)) 15. "x, y# = "u, v# ({x} = {u} → x = u) → (({x} = {u, v} → x = u) → x = u) 16. "x, y# = "u, v# ({x} = {u, v} → x = u) → x = u 17. "x, y# = "u, v# x = u 18. {u, v} ∈ {{u}, {u, v}}
(TA4) (MP, 11,14) (MP, 12,15) (MP, 13,16) (H2)
19. {u, v} ∈ {{u}, {u, v}} → ({{u}, {u, v}} = {{x}, {x, y}} → {u, v} ∈ {{x}, {x, y}}) 20. {{u}, {u, v}} = {{x}, {x, y}} → {u, v} ∈ {{x}, {x, y}} 21. {{x}, {x, y}} = {{u}, {u, v}} →
(H4)
(MP, 18,19)
167
3.2 Axiomatische Mengenlehre
{{u}, {u, v}} = {{x}, {x, y}} 22. "x, y# = "u, v# {{u}, {u, v}} = {{x}, {x, y}}
(H5) (MP)
23. "x, y# = "u, v# {u, v} ∈ {x, {x, y}} (MP) 24. {u, v} ∈ {{x}, {x, y}} → ({u, v} = {x} ∨ {u, v} = {x, y}) (H3) 25. "x, y# = "u, v# {u, v} = {x} ∨ {u, v} = {x, y} (MP) 26. {x, y} ∈ {{x}, {x, y}} (H2) 27. {x, y} ∈ {{x}, {x, y}} → ({{x}, {x, y}} = {{u}, {u, v}} → {x, y} ∈ {{u}, {u, v}}) (H4) 28. {{x}, {x, y}} = {{u}, {u, v}} → {x, y} ∈ {{u}, {u, v}} (MP, 26,27) 29. "x, y# = "u, v# {x, y} ∈ {u, {u, v}} (MP, 1,28) 30. {x, y} ∈ {{u}, {u, v}} → ({x, y} = {u} ∨ {x, y} = {u, v}) (H3) 31. "x, y# = "u, v# {x, y} = {u} ∨ {x, y} = {u, v} (MP, 29,30) 32. "x, y# = "u, v# {x, y} = {u} → {x, y} = {u, v} (27, Def. ∨) 33. "x, y# = "u, v#, {x, y} = {u} {x, y} = {u, v} (DT) 34. {x, y} = {u, v} → {u, v} = {x, y} 35. "x, y# = "u, v#, {x, y} = {u} {u, v} = {x, y} 36. "x, y# = "u, v# {x, y} = {u} → {u, v} = {x, y} 37. "x, y# = "u, v# {x, y} = {u} ∨ {u, v} = {x, y} 38. {x, y} = {u} → x = u 39. {x, y} = {u} x = u 40. {x, y} = {u} → y = u 41. {x, y} = {u} y = u 42. y = u → u = y
(H5) (MP, 33,34) (DT) (36, Def. ∨) (H9) (DT) (H10) (DT) (H5)
43. {x, y} = {u} u = y 44. x = u → (u = y → x = y)
(MP, 41,42) (H6)
45. {x, y} = {u} u = y → x = y
(MP)
46. {x, y} = {u} x = y 47. {u, v} = {x} → u = x
(MP) (H9)
48. {u, v} = {x} u = x 49. {u, v} = {x} → v = x
(DT) (H10)
50. {u, v} = {x} v = x 51. v = x → x = v 52. {u, v} = {x} x = v 53. u = x → (x = v → u = v)
(DT) (H5) (MP, 50,51) (H6)
so, {u, v} ∈ {{x}, {x, y}}. Then, {u, v} = {x} or {u, v} = {x, y}. Similarly,
{x, y} = {u} or {x, y} = {u, v}.
168
3 Fundamente der Mathematik
If {u, v} = {x} and {x, y} = {u}, then x = y = u = v;
if not, {u, v} = {x, y}.
Hence, {u, v} = {u, y}.
54. {u, v} = {x} x = v → u = v 55. {u, v} = {x} u = v
(MP) (MP)
56. y = u → (u = v → y = v) 57. {x, y} = {u} u = v → y = v
(H6) (MP, 41,56)
58. {x, y} = {u}, {u, v} = {x} y = v 59. {x, y} = {u}, {u, v} = {x} → y = v 60. x = y → (y = u → (x = y ∧ y = u)) 61. {x, y} = {u} y = u → (x = y ∧ y = u)
(MP, 55,58) (DT) (TA1) (MP, 46,60)
62. {x, y} = {u} x = y ∧ y = u 63. (x = y ∧ y = u) → (u = v → (x = y ∧ y = u ∧ u = v)) 64. {x, y} = {u}
(MP, 41,61)
u = v → (x = y ∧ y = u ∧ u = v) 65. {x, y} = {u}, {u, v} = {x} x = y∧y = u∧u = v 66. ({x, y} = {u} ∨ {u, v} = {x, y}) → (({u, v} = {x} ∨ {u, v} = {x, y}) → (({x, y} = {u} ∧ {u, v} = {x}) ∨ {u, v} = {x, y})) 67. "x, y# = "u, v# (({u, v} = {x} ∨ {u, v} = {x, y}) → (({x, y} = {u} ∧ {u, v} = {x}) ∨ {u, v} = {x, y})) 68. "x, y# = "u, v# ({x, y} = {u} ∧ {u, v} = {x}) ∨ {u, v} = {x, y} 69. "x, y# = "u, v# ¬({x, y} = {u} ∧ {u, v} = {x}) → {u, v} = {x, y} 70. "x, y# = "u, v#, ¬({x, y} = {u} ∧ {u, v} = {x})
(MP, 62,63)
{u, v} = {x, y} 71. x = u → ({u, v} = {x, y} → {u, v} = {u, y}) 72. {x, y} = {u} {u, v} = {x, y} → {u, v} = {u, y} 73. "x, y# = "u, v#, ¬({x, y} = {u} ∧ {u, v} = {x}) {u, v} = {u, y} 74. v = u {u, v} = {u, y} → v = y
So, if v = u, then y = v;
(TA1)
(MP, 55,64)
(TA2) (MP, 37,66) (MP, 25,67) (68, Def. ∨)
(H7) (MP, 17,71) (MP, 70,72) (H11)
75. "x, y# = "u, v#, ¬({x, y} = {u} ∧ {u, v} = {x}), v = u y=v (MP, 73,74) 76. "x, y# = "u, v#, ¬({x, y} = {u} ∧ {u, v} = {x})
169
3.2 Axiomatische Mengenlehre
v = u → y = v 77. v = u {u, v} = {u, y} → v = y 78. "x, y# = "u, v#, ¬({x, y} = {u} ∧ {u, v} = {x}) v=u→y=v 79. (v = u → y = v) → ((v = u → y = v) → y = v) 80. "x, y# = "u, v#, ¬({x, y} = {u} ∧ {u, v} = {x}) (v = u → y = v) → y = v 81. "x, y# = "u, v#, ¬({x, y} = {u} ∧ {u, v} = {x})
(DT) (H11) if v = u, then y = v. (MP, 73,77) (TA3) (MP, 78,79)
y=v (MP, 76,80) 82. "x, y# = "u, v# ¬({x, y} = {u} ∧ {u, v} = {x}) → y = v (DT) 83. (({x, y} = {u} ∧ {u, v} = {x}) → y = v) → ((¬({x, y} = {u} ∧ {u, v} = {x}) → y = v) → y = v) (TA3) 84. "x, y# = "u, v# (¬({x, y} = {u} ∧ {u, v} = {x}) → y = v) → y = v) (MP, 59,83) 85. "x, y# = "u, v# y = v (MP, 82,84) 86. x = u → (y = v → (x = u ∧ y = v)) 87. "x, y# = "u, v# y = v → (x = u ∧ y = v) 88. "x, y# = "u, v# x = u ∧ y = v 89. "x, y# = "u, v# → x = u ∧ y = v 90. ∀ x ∀ y ∀ u ∀ v ("x, y# = "u, v# → x = u ∧ y = v)
(TA1) (MP, 17,86) (MP, 85,87) (DT) (G, 4 mal)
Ein gehöriges Stück Arbeit liegt hinter uns! Auch wenn der Inhalt der bewiesenen Aussage nur wenig Aufsehen erregt, so ist die Komplexität des Beweises wahrlich beeindruckend. Das Beispiel zeigt nachdrücklich, wie schwierig die Beweisführung selbst für scheinbar naheliegende Aussagen ist. Doch seien Sie beruhigt. Niemand wird von Ihnen verlangen, komplizierte Theoreme auf einer solch tiefen Abstraktionsebene zu Fuß abzuleiten, geschweige denn auf die Idee kommen, die symbolische Ebene der Zermelo-Fraenkel-Mengenlehre als das Handwerkszeug einer neuen Mathematik auszurufen. In ihrer täglichen Arbeit werden Mathematiker aller Fachrichtungen auch in Zukunft Beweise auf der uns vertrauten Abstraktionsebene führen, auf der sich Formeln und umgangssprachliche Formulierungen in vertrauter Symbiose befinden. Nur so sind wir als Mensch überhaupt in der Lage, komplexe Theoreme zu beweisen. Was an dieser Stelle zählt, ist einzig und allein das Wissen, dass sich alle gezogenen Schlussfolgerungen soweit formalisieren lassen, dass sie auf der untersten Ebene einer symbolischen Manipulation von Zeichenketten gleichkommen.
Thus, in all cases, y = v.
170 I Basisfall: n = 0
I Schritt von n auf n + 1
Abbildung 3.17: Bildungsschema der Zermelo’schen Zahlenreihe I Basisfall: n = 0
3 Fundamente der Mathematik
3.2.1.4
Einbettung der natürlichen Zahlen
In Abschnitt 3.2.1.3 haben wir am Beispiel von Relationen und Funktionen demonstriert, wie sich elementare Begriffe der Mathematik innerhalb der Zermelo-Fraenkel-Mengenlehre formalisieren lassen. Wir wollen in der eingeschlagenen Richtung voranschreiten und zeigen, dass die Mengenlehre gleichermaßen stark genug ist, um über Zahlen zu sprechen. Das bedeutet, dass wir einen Weg finden müssen, die natürlichen Zahlen eindeutig auf Mengen abzubilden. Glücklicherweise müssen wir nicht lange suchen, da bereits die folgende Konstruktion ihren Zweck erfüllt (Abbildung 3.17): Definition 3.5 (Zermelo, 1908) Die Einbettung der natürlichen Zahlen in die Mengenlehre erfolgt rekursiv: 0 := 0/
I Schritt von n auf n + 1
Abbildung 3.18: Bildungsschema der Neumann’schen Zahlenreihe
n + 1 := {n}
Diese Mengendarstellung der natürlichen Zahlen wurde erstmals im Jahr 1908 von Ernst Zermelo untersucht. Er begründete darauf die berühmte Zermelo’sche Zahlreihe Z0 : „Die Menge Z0 enthält die Elemente 0, {0}, {{0}} usw. und möge als ‚Zahlreihe‘ bezeichnet werden, weil ihre Elemente die Stelle der Zahlzeichen vertreten können. Sie bilden das einfachste Beispiel einer ‚abzählbar unendlichen‘ Menge...“ Ernst Zermelo, 1908 [202] Eine modernere Einbettung der natürlichen Zahlen geht auf John von Neumann zurück (Abbildung 3.18). Da Ernst Zermelo diese Zahlenreihe nahezu zeitgleich entdeckt hat, wird sie mitunter auch als NeumannZermelo’sche Zahlenreihe bezeichnet. Definition 3.6 (von Neumann, 1923) Die Einbettung der natürlichen Zahlen in die Mengenlehre erfolgt rekursiv: 0 := 0/
n + 1 := n ∪ {n}
171
3.2 Axiomatische Mengenlehre
Zermelo’sche Zahlenreihe
Von Neumann’sche Zahlenreihe
0 = 0/ 1 = {0}
0 = 0/ 1 = {0}
= 2 = = 3 = = 4 =
= 2 = = 3 = = 4 =
{0} / {1} {{0}} / {2} {{{0}}} / {3}
= {{{{0}}}} / ...
{0} / {0, 1} {0, / {0}} / {0, 1, 2} {0, / {0}, / {0, / {0}}} / {0, 1, 2, 3}
= {0, / {0}, / {0, / {0}}, / {0, / {0}, / {0, / {0}}}} / ...
Abbildung 3.19: Einbettung der natürlichen Zahlen in die Mengenlehre nach Ernst Zermelo und nach John von Neumann.
In Abbildung 3.19 sind die Anfangsstücke beider Zahlenreihen gegenübergestellt. Auf den ersten Blick wirkt die Zermelo’sche Darstellung überlegen, da sie die natürlichen Zahlen sehr kompakt in die Mengenlehre einbettet. Erst der zweite Blick führt zu einem anderen Ergebnis und bringt die volle Eleganz der von Neumann’schen Zahlenreihe zum Vorschein. Zwei Eigenschaften sind besonders beachtenswert: I
Die Mengendarstellung einer Zahl n ist genau dann in der Mengendarstellung einer Zahl m enthalten, falls n < m. Damit ist die von Neumann’sche Zahlenreihe bezüglich der Elementrelation ‚∈‘ total geordnet. In gleicher Weise ist sie bezüglich ‚⊆‘ total geordnet. Die Teilmengeneigenschaft ist äquivalent zu n ≤ m.
I
Die Mengendarstellung einer Zahl n enthält exakt n Elemente, d. h., ihre Mächtigkeit ist mit der Zahl, die sie repräsentiert, identisch. Damit bringt die von Neumann’sche Zahlenreihe nicht nur den Ordnungs-, sondern auch den Mächtigkeitsaspekt der natürlichen Zahlen glasklar zum Ausdruck.
Die von Neumann’sche Konstruktion der natürlichen Zahlen ist der Spezialfall eines allgemeineren Konstruktionsschemas, das uns im nächsten Abschnitt genauer beschäftigen wird. Mit ihm werden wir die Tür in die Welt der Ordinalzahlen aufstoßen, eine faszinierende Welt wahrhaft riesiger Zahlen, von denen wir gerade einmal die allerkleinsten mit unserer begrenzten Vorstellungskraft noch intuitiv erfassen können.
172
3 Fundamente der Mathematik
3.2.2
Ordinalzahlen „Jede einfach geordnete Menge M [hat] einen bestimmten Ordnungstypus M; es ist dies der Allgemeinbegriff, welcher sich aus M ergibt, wenn unter Festhaltung der Rangordnung ihrer Elemente von der Beschaffenheit der letzteren abstrahiert wird [...]; den Ordnungstypus einer wohlgeordneten Menge F nennen wir die ihr zukommende ‚Ordnungszahl‘“ Georg Cantor, 1897 [22]
In Abschnitt 3.2.1.4 haben wir einen Weg gefunden, die natürlichen Zahlen in Form von Mengen darzustellen. Als besonders fruchtbar hat sich dabei die von Neumann’sche Zahlenreihe erwiesen. Hierin wird die Zahl 0 mit der leeren Menge identifiziert und der Nachfolger einer natürlichen Zahl n über die Vorschrift n ∪ {n} gebildet. In diesem Abschnitt werden wir die Idee der von Neumann’schen Zahlenreihe verallgemeinern und mit den Ordinalzahlen eine Mengenwelt kennen lernen, die uns erlauben wird, weit über die Grenzen der natürlichen Zahlen hinaus zu zählen. Die Reise in die Welt der Ordinalzahlen ist eine Reise in die Tiefen der Unendlichkeit, und wir wollen sie nicht beginnen, ohne eine Warnung auszusprechen. Der Weg, auf den wir uns begeben werden, führt mitten in die Dunkelheit. Steht uns unsere Vorstellungskraft zu Beginn noch treu zur Seite, so werden Sie schon bald erleben, wie sie im Rausch der Tiefe langsam schwinden und schließlich ganz versagen wird. Die Zahlen, die auf uns warten, sind so kolossal, dass wir keine Chance haben, ihre wahre Größe auch nur im Ansatz intuitiv zu erfassen. 3.2.2.1
Definition und Eigenschaften
So soll unsere Reise nun beginnen. Wir tasten uns behutsam voran und schicken zunächst den Begriff der transitiven Menge voraus: Definition 3.7 (Transitive Menge) Eine Menge z heißt transitiv, wenn gilt: I
Aus x ∈ y und y ∈ z folgt x ∈ z.
Oder, was gleichbedeutend ist: I
Aus y ∈ z folgt y ⊆ z.
173
3.2 Axiomatische Mengenlehre
Die erste definierende Eigenschaft hat ein bekanntes Gesicht. Ersetzen wir den Elementoperator ‚∈‘ beispielsweise durch das Symbol ‚⊆‘, so liest sich der Wortlaut dieser Definition wie die bekannte Transitivitätseigenschaft der Teilmengenrelation. Die zweite, äquivalente Definition macht aber schnell deutlich, dass transitive Mengen wahrhaft eigentümliche Gebilde sind; sie besitzen die merkwürdige Eigenschaft, dass jedes Element gleichzeitig eine Teilmenge ihrer selbst ist. Wie sehen solche Mengen konkret aus? Um zu erkennen, wie sich transitive Mengen von nicht transitiven Mengen unterscheiden, werfen wir erneut einen Blick auf die Zermelo’sche Zahlenreihe Z0 aus Abschnitt 3.2.1.4. Am Anfang dieser Reihe steht die leere Menge 0. / Sie erfüllt auf triviale Weise die in Definition 3.7 eingeforderte Beziehung und ist somit transitiv. An zweiter Position steht die Menge {0}. / Sie ist ebenfalls transitiv, da ihr einziges Element 0/ eine Teilmenge von jeder anderen Menge und damit auch eine Teilmenge von {0} / ist. Die Menge {{0}}, / die Zermelo’sche Repräsentation der Zahl 2, ist hingegen nicht transitiv, da das Element {0} / keine Teilmenge von {{0}} / ist. Das gleiche gilt für die Zermelo’schen Mengendarstellungen der anderen natürlichen Zahlen (Abbildung 3.20). Betrachten wir dagegen ein beliebiges Anfangsstück von Z0 , also eine Menge der Form { 0, / {0}, / {{0}}, / {{{0}}}, / . . . , {. . . {{{0}}} / . . .} }, so haben wir erneut eine transitive Menge vor uns. Jedes ihrer Elemente ist eine Teilmenge ihrer selbst (Abbildung 3.21). Der erworbene Eindruck soll für den Moment genügen. Wir werden jetzt einige elementare Eigenschaften von transitiven Mengen erarbeiten und beginnen mit dem Beweis wichtiger Abschlussmerkmale:
∅
Transitiv
{∅}
Transitiv
{{∅}} {{{∅}}}
Nicht transitiv
{∅}∕ ⊆ {{ ∅ }}
Nicht transitiv
{{ ∅ }} ∕ ⊆ {{{ ∅ }}}
... Abbildung 3.20: Nur die ersten beiden Elemente der Zermelo’schen Zahlenreihe sind transitive Mengen.
∅ Transitiv
{∅} Transitiv
{{∅}} {{{∅}}}
Transitiv
...
Satz 3.4 1. Ist x eine transitive Menge, dann ist es auch x ∪ {x}. 2. Ist x eine Menge transitiver Mengen, so ist auch 3. Ist x eine Menge transitiver Mengen, so ist auch
x transitiv. x transitiv.
4. Ist x eine transitive Menge, dann ist es auch 2x .
Beweis: 1. Sei y ∈ x ∪ {x}. Dann gilt y = x oder y ∈ x. Im ersten Fall gilt trivialerweise y ⊆ x. Im zweiten Fall gilt y ⊆ x ebenfalls, aufgrund der Transitivität von x. In beiden Fällen gilt also y ⊆ x und damit auch y ⊆ x ∪ {x}. 2. Sei y ∈ x. Dann ist y in mindestens einer Menge x mit
Abbildung 3.21: Fassen wir die Elemente eines beliebigen Anfangsstücks der Zermelo’schen Zahlenreihe zusammen, so entsteht eine transitive Menge.
174
∅ {∅} {{∅}} {{{∅}}}
3 Fundamente der Mathematik
Ordinalzahl
x ∈ x enthalten. Da x transitiv ist, gilt y ⊆ x . Folgerichtig gilt auch y ⊆ x. 3. Sei y ∈ x. Dann ist y in allen Mengen x mit x ∈ x enthal ten. Da x transitiv ist, gilt y ⊆ x . Folgerichtig gilt auch y ⊆ x. 4. Jedes x Element y ∈ 2 ist per Definition eine Teilmenge von x. Die Teilmengeneigenschaft bedeutet, dass jedes Element y ∈ y auch Element von x ist. Da x transitiv ist, folgt y ⊆ x und damit auch y ∈ 2x . Folgerichtig ist y ⊆ 2x und die Potenzmenge damit ebenfalls als transitiv identifiziert.
Ordinalzahl
Keine Ordinalzahl, {{∅}} ist nicht transitiv
Keine Ordinalzahl, {{{∅}}} ist nicht transitiv
... Abbildung 3.22: Nur die ersten beiden Elemente der Zermelo’schen Zahlenreihe sind Ordinalzahlen.
Ordinalzahl
...
Definition 3.8 (Ordinalzahl)
{∅}
{{{∅}}}
Jetzt sind wir gewappnet, den Begriff der Ordinalzahl formal zu definieren:
Eine transitive Menge x heißt Ordinalzahl, wenn alle ihre Elemente ebenfalls transitiv sind.
∅
{{∅}}
Als direkte Anwendung aus diesem Satz folgt, dass die Zermelo’sche Zahlenreihe Z0 selbst eine transitive Menge ist.
Keine Ordinalzahl, {{∅}} ist nicht transitiv
Keine Ordinalzahl, {{∅}} und {{{∅}}} sind nicht transitiv
Abbildung 3.23: Obwohl alle Anfangsstücke der Zermelo’schen Zahlenreihe transitiv sind, verletzen sie ab einer Größe von drei Elementen die Ordinalzahldefinition.
In den folgenden Betrachtungen werden wir der gängigen Konvention folgen und Ordinalzahlen mit den kleinen griechischen Buchstaben α, β , . . . bezeichnen. Seien Sie sich stets darüber im Klaren, dass sich hinter Ordinalzahlen keine Zahlen im eigentlichen Sinne verbergen, auch wenn ihr Name dieses Missverständnis geradezu provoziert. Definition 3.8 macht unzweifelhaft klar: Ordinalzahlen sind Mengen! Die Abbildungen 3.22 und 3.23 machen deutlich, dass lediglich die beiden ersten Elemente der Zermelo’schen Zahlenreihe auch Ordinalzahlen sind. Bevor wir uns größeren Ordinalzahlen zuwenden, wollen wir herausarbeiten, welche Konsequenzen sich aus Definition 3.8 ergeben. Zunächst halten wir fest, dass sich die meisten Aussagen von Satz 3.4 eins zu eins auf Ordinalzahlen übertragen lassen: Satz 3.5 1. Ist α eine Ordinalzahl, dann ist es auch α ∪ {α}. 2. Ist x eine Menge von Ordinalzahlen, so ist 3. Ist x eine Menge von Ordinalzahlen, so ist
x eine Ordinalzahl. x eine Ordinalzahl.
Beweis: Die Transitivität von α ∪ {α}, x und x ergibt sich unmittelbar aus Satz 3.4, so dass lediglich zu zeigen bleibt, dass diese Mengen
3.2 Axiomatische Mengenlehre
ausschließlich Elemente enthalten, die selbst transitiv sind. Dies folgt aber direkt aus der Definition der Ordinalzahl. Die nächsten Sätze bringen eine Reihe von charakteristischen Merkmalen zum Vorschein, die einen intuitiven Zugang zu den Ordinalzahlen gewähren. Die Beweise dieser Sätze sind sehr technischer Natur und erfordern unbestritten ein gewisses Maß an Fleißarbeit. Dass wir an dieser Stelle trotzdem so formal vorgehen, hat einen einfachen Grund. Die Welt der Ordinalzahlen sprengt unsere Intuition, und wir stünden ihr vollkommen wehrlos gegenüber, wenn wir auf eine mathematisch präzise Absicherung verzichten würden. Dennoch können Sie die Beweise beim ersten Lesen gefahrlos überspringen und später zu ihnen zurückkehren. Satz 3.6 (Trichotomiesatz) Für zwei beliebige Ordinalzahlen α und β gilt α ∈ β oder α = β oder β ∈ α Beweis: Wir schreiben T(α, β ) für (α ∈ β ∨ α = β ∨ β ∈ α) und führen den Beweis durch Widerspruch. Nehmen wir also an, T(α, β ) sei nicht für alle Ordinalzahlen α und β wahr. In diesem Fall garantiert uns das Fundierungsaxiom, dass es bezüglich ‚∈‘ ein kleinstes α geben muss (wir nennen es α0 ), für das T(α, β ) für mindestens ein β falsch ist. Jetzt können wir analog schließen, dass es ein kleinstes β geben muss (wir nennen es β0 ), für das T(α0 , β ) falsch wird. Wir halten fest: a) ¬T(α0 , β0 ) (wegen der speziellen Wahl von α0 , β0 ). b) Aus α ∈ α0 folgt T(α, β0 ) (wegen der Minimalität von α0 ). c) Aus β ∈ β0 folgt T(α0 , β ) (wegen der Minimalität von β0 ). Wir werden nun zeigen, dass T(α0 , β0 ) dennoch wahr sein muss, im Widerspruch zu a). Wir unterscheiden drei Fälle: 1. α0 = β0 . Dann ist T(α0 , β0 ) trivialerweise erfüllt. 2. Es existiert ein α ∈ α0 mit α ∈ β0 . Wegen b) gilt T(α, β0 ) und damit β0 = α oder β0 ∈ α. In beiden Fällen folgt β0 ∈ α0 (im letzteren Fall aufgrund der Transitivität von α0 ) und damit T(α0 , β0 ). 3. Es existiert ein β ∈ β0 mit β ∈ α0 . Wegen c) gilt T(α0 , β ) und damit α0 = β oder α0 ∈ β . In beiden Fällen folgt α0 ∈ β0 (im letzteren Fall aufgrund der Transitivität von β0 ) und damit T(α0 , β0 ).
175
Viele Wege führen nach Rom. Diese sprichwörtliche Weisheit ist für kaum einen anderen mathematischen Begriff so zutreffend wie für den Begriff der Ordinalzahl. In der Literatur werden Sie eine Vielzahl von Definitionen vorfinden, die von außen betrachtet sehr unterschiedlich wirken, schlussendlich aber alle den gleichen Zahlenbegriff beschreiben. Der hier verfolgte Ansatz, eine Ordinalzahl als eine transitive Menge transitiver Mengen zu definieren, geht auf eine Idee von Kurt Gödel aus dem Jahr 1937 zurück. Eine alternative Charakterisierung stammt von Paul Bernays aus dem Jahr 1941. Dieser Definition folgend ist eine Ordinalzahl α eine transitive Menge mit der Eigenschaft, dass jede transitive echte Teilmenge von α auch selbst ein Element von α ist [9]. Andere Autoren definieren Ordinalzahlen als transitive Mengen, die bezüglich der Mengeninklusion wohlgeordnet sind. Diese Charakterisierung kommt schon näher an die ursprüngliche Definition von Georg Cantor heran, der in Ordinalzahlen spezielle Repräsentanten für Wohlordnungen sah [22]. Im Cantor’schen Sinne entstehen Ordinalzahlen durch einen Abstraktionsprozesses, an dessen Ende nur noch die Ordnungsstruktur einer Menge zurückbleibt und die konkrete Beschaffenheit ihrer Elemente keine Rolle mehr spielt. Die historische Definition der Ordinalzahl ist eine bedeutende, und wir werden an späterer Stelle in diesem Kapitel auf sie zurückkommen.
176
3 Fundamente der Mathematik
Die Trichotomieeigenschaft der Ordinalzahlen ist eine wesentliche. Sie garantiert uns, dass wir zwei beliebige Ordinalzahlen vergleichen können, und sorgt dafür, dass Ordinalzahlen bezüglich ‚∈‘ total geordnet sind. Im Folgenden bringen wir diese Eigenschaft auch symbolisch zum Ausdruck: Achten Sie darauf, niemals von der Menge aller Ordinalzahlen zu sprechen! Dass die Annahme, alle Ordinalzahlen ließen sich zu einer Menge zusammenfassen, zu Widersprüchen führt, hat der italienische Mathematiker Cesare BuraliForti bereits im Jahr 1897 entdeckt [17]. Um das Burali-Forti-Paradoxon heraufzubeschwören, nehmen wir für den Moment an, die Menge aller Ordinalzahlen würde tatsächlich existieren. Da diese Menge, wir nennen sie O, ausschließlich Ordinalzahlen enthält, wäre sie eine Menge von transitiven Mengen. Nach Satz 3.8 sind alle Elemente von Ordinalzahlen ebenfalls wieder Ordinalzahlen, so dass jedes Element aus O auch eine Teilmenge von O wäre. Kurzum: Die Menge aller Ordinalzahlen wäre ebenfalls transitiv und damit selbst eine Ordinalzahl. Es wäre eine Zahl, für die gleichzeitig O ∈ O und O = O gelten müsste, was nach dem Trichotomiesatz (Satz 3.6) niemals sein kann. Insgesamt erweist sich der Zusammenschluss aller Ordinalzahlen als zu groß, um als geschlossenes Ganzes zu existieren. Gemeinsam bilden die Ordinalzahlen also keine Menge, dafür aber eine echte Klasse, die in der Literatur mit dem großen griechischen Buchstaben Omega bezeichnet wird:
Ω = Klasse aller Ordinalzahlen Achten Sie darauf, das Symbol Ω nicht mit der Chaitin’schen Konstante Ω zu verwechseln, die Sie in Kapitel 6 kennen lernen werden. Der gleiche Buchstabe bezeichnet in beiden Fällen etwas völlig anderes.
Definition 3.9 (Ordinalzahlordnung) Auf den Ordinalzahlen vereinbaren wir die folgende Ordnung: α < β :⇔ α ∈ β
Der nächste Satz bringt eine andere wichtige Eigenschaft von Ordinalzahlen zum Vorschein. Er besagt, dass die Teilmengenbeziehung und die Elementbeziehung für Ordinalzahlen zusammenfallen. Satz 3.7 (Äquivalenz von ‚∈‘ und ‚⊂‘) Für zwei beliebige Ordinalzahlen α und β gilt: α ∈ β genau dann, wenn α ⊂ β Beweis: Ist α ∈ β , so folgt aus der Transitivität von β die Beziehung α ⊆ β . Da sich eine Menge nicht selbst enthalten kann, folgt α = β und damit die Behauptung α ⊂ β . Sei nun α ⊂ β . Damit kann weder α = β noch β ∈ α gelten (im letzteren Fall erhielten wir β ∈ β ). Nach Satz 3.6 folgt jetzt unmittelbar α ∈ β , was zu beweisen war. Der nächste Satz bringt eine wichtige Abgeschlossenheitseigenschaft ans Licht. Ordinalzahlen bleiben unter sich! Satz 3.8 (Abgeschlossenheit unter ‚∈‘) Für eine beliebige Ordinalzahl β gilt: Jedes Element α ∈ β ist ebenfalls eine Ordinalzahl. Beweis: Sei α ∈ β . Die Elemente von Ordinalzahlen sind allesamt transitiv, und somit ist auch α eine transitive Menge. Aufgrund der Transitivität von β gilt für jedes Element x ∈ α auch x ∈ β . Jedes Element von α ist somit ebenfalls transitiv und α als Ordinalzahl identifiziert.
177
3.2 Axiomatische Mengenlehre
3.2.2.2
Der Unendlichkeit entgegen „Moria. Du fürchtest Dich vor diesen Mienen. Die Zwerge haben zu gierig und zu tief geschürft. Du weißt, was sie aufgeweckt haben in der Dunkelheit von Khazad-dûm. Schatten. Und Flamme.“ Aus D ER H ERR DER R INGE
In diesem Abschnitt werden wir damit beginnen, Ordinalzahlen real zu konstruieren. Die einfachste unter ihnen ist die leere Menge 0, / und eine weitere Ordinalzahl mit 0 Elementen kann es nicht geben. Das Aussehen von Ordinalzahlen mit einem Element liegt ebenfalls auf der Hand. Nach dem Trichotomiesatz muss 0/ in diesen Zahlen enthalten sein, so dass nur {0} / in Frage kommt. Diese Menge haben wir bereits weiter oben als Ordinalzahl identifiziert. Ordinalzahlen mit mehreren Elementen können wir nach dem gleichen Schema konstruieren. Aufgrund der Trichotomieeigenschaft kommen wir dabei stets zu dem Schluss, dass sämtliche der bisher konstruierten Ordinalzahlen in der neu konstruierten Menge enthalten sein müssen und somit für jedes n ∈ N eine eindeutig bestimmte Ordinalzahl mit genau n Elementen existiert. Ein Blick auf Abbildung 3.24 offenbart, dass die so konstruierten Mengen alte Bekannte sind: Die endlichen Ordinalzahlen sind exakt die Elemente der von Neumann’schen Zahlenreihe aus Abschnitt 3.2.1.4. Die Konstruktion macht gleichermaßen deutlich, wie wir innerhalb der Ordinalzahlen zählen können. Ausgehend von einer Ordinalzahl x gelangen wir zur nächsten, indem wir über die Bildungsvorschrift x ∪ {x} alle davor liegenden Ordinalzahlen zu x hinzufügen. Das Weiterzählen innerhalb der Ordinalzahl ist so wichtig, dass wir diesem Begriff eine eigene Definition gönnen:
∅ +1 := x ∪ {x}
Definition 3.10 (Ordinalzahlnachfolger) Sei α eine Ordinalzahl. Die Ordinalzahl s(α) := α ∪ {α} heißt der Nachfolger von α.
+1
{∅} +1
{∅,{∅}} +1
{∅,{∅},{∅,{∅}}} +1
...
Satz 3.5 liefert uns die nötige Gewissheit, dass die Menge α ∪ {α} für jede Ordinalzahl α wiederum eine Ordinalzahl ist und wir somit immer weiterzählen können. Der Übergang von α zu s(α) ist ein Spezialfall der Ordinalzahladdition, die wie weiter unten formal einführen werden.
Abbildung 3.24: Die systematische Konstruktion aller endlichen Ordinalzahlen bringt die von Neumann’schen Zahlenreihe hervor.
178
3 Fundamente der Mathematik
Im Vorgriff darauf schreiben wir aber bereits jetzt α + 1 für s(α) sowie α + 2 für s(s(α)) und so fort.
∅ +1 := x ∪ {x}
{∅} +1
{∅,{∅}} +1
{∅,{∅},{∅,{∅}}} +1
Limes-Sprung ( ∪ )
+1
...
ω
Wir wollen die endlichen Ordinalzahlen nun verlassen und die erste unendliche Menge konstruieren, die alle Ordinalzahleigenschaften erfüllt. Den Schlüssel hierzu liefert uns Satz 3.5 frei Haus. Bilden wir, wie in Abbildung 3.25 dargestellt, die Vereinigung aller endlichen Ordinalzahlen, so erreichen wir erneut eine Ordinalzahl. Es ist die berühmte Zahl ω := { 0, / {0}, / {0, / {0}}, / {0, / {0}, / {0, / {0}}}, / ... } ω ist in mehrfacher Hinsicht von Bedeutung. Zum einen ist sie die kleinste transfinite Ordinalzahl, d. h., die kleinste Zahl, die unendlich viele Elemente umfasst. Zum anderen besitzt sie die besondere Eigenschaft, nicht der Nachfolger einer anderen Ordinalzahl zu sein. Für kein kein α gilt s(α) = ω. Ordinalzahlen mit dieser Eigenschaft sind von so großer Bedeutung, dass wir ihnen einen eigenen Namen verleihen: Definition 3.11 (Grenzzahl, Limes-Ordinalzahl)
Abbildung 3.25: Limes-Sprung. Durch die Vereinigung aller endlichen Ordinalzahlen erreichen wir die erste unendliche Ordinalzahl ω. Sie ist identisch mit der von Neumann’schen Zahlenreihe und entspricht der Menge N der natürlichen Zahlen.
Eine Ordinalzahl γ heißt Grenzzahl oder Limes-Ordinalzahl, wenn sie nicht der Nachfolger einer anderen Ordinalzahl ist.
Noch in einer anderen Hinsicht ist ω von Bedeutung. Sie ist mit der von Neumann’schen Zahlenreihe identisch, die nach dem in Abschnitt 3.2.1.4 Gesagten der Menge der natürlichen Zahlen entspricht. Demnach lässt sich ω auch in der folgenden Form notieren (Abbildung 3.26): ω = {0, 1, 2, 3, . . .} Damit können wir nicht nur jede natürliche Zahl als Ordinalzahl auffassen, sondern auch die Menge der natürlichen Zahlen selbst. Jetzt erfolgt der entscheidende Schritt: Durch die Anwendung der Nachfolgeroperation können wir mit ω + 1, ω + 2, . . . Abbildung 3.26: Visualisierung der ersten transfiniten Ordinalzahl ω. Jeder Strich repräsentiert eine natürliche Zahl. Die Folge der Striche erstreckt sich in das Unendliche.
immer neue Ordinalzahlen bilden und über die natürlichen Zahlen hinauszählen. Mit der Theorie der Ordinalzahlen haben wir es geschafft, den Horizont der natürlichen Zahlen zu durchbrechen.
3.2 Axiomatische Mengenlehre
179
Der eingeschlagene Kurs führt uns auf direktem Weg in ein Zahlenuniversum, das sich weit über die Grenzen der natürlichen Zahlen hinaus erstreckt. Wie groß diese neu geschaffene Welt tatsächlich ist, wollen wir jetzt erkunden. Ausgehend von ω bilden wir nach dem bekannten Schema neue Ordinalzahlen und erhalten ω = {0, 1, 2, . . .} ω + 1 = {0, 1, 2, . . . , ω} ω + 2 = {0, 1, 2, . . . , ω, ω + 1} ... ω + (n + 1) = {0, 1, 2, . . . , ω, ω + 1, ω + 2, . . . , ω + n}
Abbildung 3.27: Visualisierung von ω + 1
... Wie sich die so erzeugten Ordinalzahlen grafisch veranschaulichen lassen, demonstrieren die Abbildungen 3.27 und 3.28. Ein erneuter Limes-Sprung führt uns auf direktem Weg zur Zahl ω + ω in Abbildung 3.29: ω +ω =
(ω + n)
n∈N
Dass wir die erreichte Zahl als ω + ω bezeichnen, ist zwar naheliegend, aber noch ohne formale Grundlage. Diese wollen wir nun schaffen und das verwendete Bildungsschema zu einem allgemeinen Schema für die Ordinalzahladdition erweitern. Wir vereinbaren: Abbildung 3.28: Visualisierung von ω + 2
α + 0 := α α + s(β ) := s(α + β ) α + γ :=
α +β
(für alle Limes-Ordinalzahlen γ)
β <γ
Damit können wir unsere Reise fortsetzen und nach noch größeren Ordinalzahlen trachten. Es sind dies die Zahlen ω + ω + . . . + ω, die wir mit der naheliegenden Schreibweise ω · n abkürzen. Dies bringt die folgenden Ordinalzahlen hervor: ω · 2 = {0, 1, . . . , ω, ω + 1, . . .} ω · 3 = {0, 1, . . . , ω, ω + 1, . . . , ω · 2, ω · 2 + 1, . . .} ... ω · (n + 1) = ω · n ∪ {ω · n, ω · n + 1, ω · n + 2, . . .} ...
Abbildung 3.29: Visualisierung von ω + ω
180
3 Fundamente der Mathematik
Vollziehen wir erneut einen Limes-Sprung, so erreichen wir die Zahl ω ·ω =
(ω · n)
n∈N
Auch hier fehlt uns die formale Rechtfertigung, die erreichte Zahl als ω · ω zu bezeichnen. Die nachstehende Definition der Ordinalzahlmultiplikation schließt die entstandene Lücke: α · 0 := 0 α · s(β ) := α · β + α
α · γ :=
α ·β
(für alle Limes-Ordinalzahlen γ)
β <γ
Abbildung 3.30 zeigt, wie wir uns die Menge ω · ω visuell vorstellen können. Wir erhalten eine Struktur, in der sich die natürlichen Zahlen unendlich oft wiederholen. Abbildung 3.30: Visualisierung von ω · ω
Wir wollen weiter an Fahrt aufnehmen und noch größeren Zahlen entgegenstreben. Es sind dies die Zahlen ω · ω · . . . · ω, die wir als ω n bezeichnen: ω2 = ω · ω ω3 = ω2 · ω
Widerstehen Sie der Versuchung, vertraute Rechenregeln auf die Addition und Multiplikation von Ordinalzahlen zu übertragen! Anders, als wir es von den natürlichen, rationalen oder reellen Zahlen gewohnt sind, ist weder die Ordinalzahladdition noch die Ordinalzahlmultiplikation kommutativ. Im Allgemeinen gilt: α + β = β + α, α · β = β · α Eine einfache Rechnung zeigt, warum. Beispielsweise ist ω + 1 = ω, gleichzeitig gilt aber 1+ω =
β <ω 1 + β
=ω
Für die Ordinalzahlmultiplikation ist die Situation ähnlich. Einerseits ist ω · 2 = ω, auf der anderen Seite ergibt sich 2·ω =
β <ω 2 · β
=ω
ω4 = ω3 · ω ... ω n+1 = ω n · ω ... In fast schon gewohnter Weise vollziehen wir den nächsten LimesSprung und erhalten die unglaublich große Zahl ωω =
ωn
n∈N
Abbildung 3.31 zeigt einen Weg auf, wie wir diese Zahl immer noch visuell erfassen können. Nach der Addition und der Multiplikation führen wir als dritte wichtige Operation die Potenzierung von Ordinalzahlen ein. Nach dem bisher Erarbeiteten lässt sich die Definition mit Leichtigkeit aufschreiben: α 0 := 1 α s(β ) := α β · α α γ :=
β <γ
αβ
(für alle Limes-Ordinalzahlen γ)
181
3.2 Axiomatische Mengenlehre
Abbildung 3.31: Visualisierung der Ordinalzahl ω ω durch eine sich unendlich eindrehende Spirale [194]. Um die Struktur zu verstehen, betrachten wir zunächst die ersten beiden Umdrehungen: 1. Umdrehung
2. Umdrehung
Beide Strukturen haben wir bereits kennen gelernt; sie sind mit jenen aus den Abbildungen 3.26 und 3.30 identisch und entsprechen den Ordinalzahlen ω und ω 2 . Der weitere Aufbau ist nun klar: Jede Umdrehung repräsentiert eine Ordinalzahl der Form ω n . Die dritte Umdrehung entspricht ω 3 , die vierte ω 4 und so fort. Indem sich die Spirale unendlich oft eindreht, entspricht sie der Vereinigung aller Ordinalzahlen ω n und damit der Zahl ω ω .
Auch wenn die bisher konstruierten Ordinalzahlen unsere Intuition bereits stark strapazieren, ist unsere Reise noch nicht zu Ende. Mit einem Handstreich können wir jetzt weitere Ordinalzahlen bilden, die ω ω weit hinter sich lassen. Es sind dies ω
ωω
,ω
ω ωω
,ω
ω ωω
ω
,ω
ω ωω
ωω
,ω
ω ωω
ωω
ω
,ω
ω ωω
ωω
ωω
,...,
Vollziehen wir den nächsten Limes-Sprung, indem wir die ω-Türme zu der Gesamtmenge ε0 :=
ω
ω.
ω ..
} n-mal
n∈N
vereinen, so erreichen wir eine wahrhaft riesige Zahl, die in vielerlei Hinsicht faszinierend ist. Beispielsweise besitzt ε0 als erste Ordinalzahl
182
3 Fundamente der Mathematik
die bemerkenswerte Fixpunkteigenschaft ω ε0 = ε0 Diese Eigenschaft ist intuitiv kaum noch greifbar. Das Rechnen mit den natürlichen Zahlen hat uns gelehrt, dass die Potenzierung mit großen Zahlen zu immer größeren Zahlen führt und der Größenunterschied dramatisch zunimmt, wenn wir den Exponenten auch nur geringfügig erhöhen. Die Zahl ε0 setzt diese Gesetzmäßigkeit außer Kraft. In gewissem Sinn ist sie so unbegreiflich groß, dass sie ihre eigenen Potenzen einschließt. Beachten Sie, dass sich hinter dieser Einschlusseigenschaft keine Antinomie der Russell’schen Art verbirgt. ε0 ist eine wohldefinierte Menge von Ordinalzahlen und enthält sich nicht etwa selbst. Die Elemente, die in ε0 enthalten sind, lassen sich sogar durchnummerieren. Folgerichtig ist die Menge ε0 , so unvorstellbar groß sie auch ist, immer noch abzählbar. ε0 besitzt eine weitere markante Eigenschaft. Alle Zahlen zwischen ω und ε0 lassen sich durch eine endliche Anzahl von Additionen und Potenzierungen von ω aus erreichen. Konkret bedeutet dieses Ergebnis, dass wir jede Ordinalzahl α mit 0 < α < ε0 in der Form α = ω β0 + ω β1 + . . . + ω βn
(3.4)
schreiben können, wobei β1 , . . . , βn allesamt Ordinalzahlen kleiner α sind. Lassen wir zusätzlich konstante Faktoren zu, so können wir Gleichung (3.4) in die sogenannte Cantor’sche Normalform übersetzen: Satz 3.9 (Cantor’sche Normalform) Jede Ordinalzahl α mit 0 < α < ε0 lässt sich in der Form α = c0 · ω β 0 + c 1 · ω β 1 + . . . + c n · ω β n schreiben, mit α > β0 > β1 > . . . > βn und c0 , . . . , cn ∈ N. Verzichten wir auf die Beschränkung α > β0 > β1 > . . . > βn , so lässt sich die Zahl ε0 ebenfalls in Cantor’scher Normalform notieren. Als Ergebnis erhalten wir dann die Fixpunktdarstellung ε0 = ω ε0 , die wir schon kennen. In diesem Fall bringt die Cantor’sche Normalform keine Vereinfachung mehr mit sich; insbesondere ist eine Darstellung von ε0 in der Form (3.4) nicht mehr möglich. Tatsächlich ist ε0 die kleinste Zahl, für die diese Eigenschaft verloren geht.
183
3.2 Axiomatische Mengenlehre
Cantor hatte Ordinalzahlen entsprechend ihrer Mächtigkeit zu Zahlklassen zusammengefasst, auf denen er später die Kardinalzahltheorie errichtete. Beispielsweise fallen alle endlichen Ordinalzahlen in die erste Zahlklasse und alle abzählbaren in die zweite. ω ist die kleinste Ordinalzahl der zweiten Zahlklasse. Cantor bemerkte schnell, dass die Addition, die Multiplikation und die Potenzierung aus der jeweiligen Zahlklasse nicht herausführen. Endliche Mengen werden durch diese Operationen auf endliche Mengen abgebildet, abzählbare auf abzählbare und so fort. Noch faszinierender ist aber, dass wir durch die Anwendung dieser Operationen nicht jedes Element der jeweiligen Klasse erreichen können. Ausgehend von ω bleiben wir durch die Anwendung endlich vieler Additionen, Multiplikationen und Potenzierungen stets innerhalb von ε0 . Dennoch ist leicht einzusehen, dass es jenseits von ε0 weitere abzählbare Ordinalzahlen geben muss. Indem wir einfach weiterzählen, erhalten wir mit ε0 + 1, ε0 + 2 genau solche Zahlen. Erliegen Sie nicht der Versuchung, sich diese Zahlen bildlich vorzustellen! Bereits die Menge ε0 sprengt unsere Vorstellungskraft, und wir wollen die weitere Reise daher nur noch schemenhaft skizzieren. Wie in Abbildung 3.32 dargestellt, existieren jenseits von ε0 eine ganze Reihe anderer ε-Zahlen, die ebenfalls eine Lösung der Fixpunktgleichung ω x = x sind. Auch diese Zahlen gehören zur zweiten Zahlklasse, d. h., sie sind immer noch abzählbare Mengen. Es lässt sich beweisen, dass jede εα -Zahl, deren ordinaler Index selbst abzählbar ist, wiederum eine abzählbare Menge ergibt. Bewegen wir uns weiter zu noch größeren Zahlen, so erreichen wir irgendwann ω1 , den kleinsten Repräsentanten der dritten Zahlklasse. Sie entsteht aus der Vereinigung aller abzählbaren Ordinalzahlen und erfüllt als erste die Eigenschaft der Überabzählbarkeit. Es folgen die Zahlen ω2 , ω3 , . . ., und so können wir immer weiter gehen. So unvorstellbar groß die Zahl ε0 auch ist, gegen die Zahlen, die uns am Horizont erwarten, wirkt sie wie ein einsamer Tropfen im Ozean der Unendlichkeit. Wir wollen unsere Vorstellungskraft nicht weiter strapazieren. Zu weit haben uns die Ordinalzahlen bereits in ihr Reich gelockt, um das Gesehene auch nur im Ansatz noch intuitiv erfassen zu können. Auch in anderer Hinsicht sind unsere Kräfte am Ende. Bereits zwischen ε0 und ω1 können Zahlen liegen, deren Existenz in der ZermeloFraenkel-Mengenlehre weder bewiesen noch widerlegt werden kann. Es scheint, als verlieren wir jenseits von ε0 den Halt; ohne Augenlicht wandeln wir in einer Welt, in der wir uns der Existenz der ertasteten Dinge nicht mehr sicher sein können. Von den bezirzenden Lockrufen der Unendlichkeit wollen wir uns nicht weiter verführen lassen und beenden an dieser Stelle unsere Reise.
Ω … ωωωω... , ωωωω... + 1, . . .
…
ωωω , ωωω + 1, . . .
…
ωω , ωω + 1, . . .
…
ω2 , ω2 + 1, . . .
…
ω1 , ω1 + 1, . . .
…
εεεω , εεεω + 1, . . .
…
εεε1 , εεε1 + 1, . . .
…
εεε0 , εεε0 + 1, . . .
…
εε1 , εε1 + 1, . . .
…
εε0 , εε0 + 1, . . .
…
εω ω , εω ω + 1, . . .
…
εω 2 , εω 2 + 1, . . .
…
εω · 2 , εω · 2 + 1, . . .
…
εω+1 , εω+1 + 1, . . .
…
εω , εω + 1, . . .
…
ε1 , ε1 + 1, . . .
…
ε0 + 1, . . .
ε0
Abbildung 3.32: Einige Ordinalzahlen jenseits von ε0
184
3 Fundamente der Mathematik
3.2.2.3
Ordnungstypen und Wohlordnungen
In Abschnitt 3.2.2.1 haben wir herausgearbeitet, dass sich Ordinalzahlen über die Elementrelation ‚∈‘ ordnen lassen. Konkret hatten wir die folgende Vereinbarung getroffen: α < β :⇔ α ∈ β Es ist ein wichtiges Ergebnis der Ordinalzahltheorie, dass diese Definition zu einer Wohlordnung führt. Warum dies so ist, wollen wir kurz begründen. Zunächst einmal ist die Ordnung total, da wir zwei Ordinalzahlen α und β aufgrund der Trichotomieeigenschaft stets vergleichen können. Des Weiteren enthält jede nichtleere Menge von Ordinalzahlen ein minimales Element. Dies folgt unmittelbar aus der Tatsache, dass wir jede unendlich absteigende Kette der Form α1 > α2 > α3 > α4 . . . in eine äquivalente Kette der Form α1
α2
α3
α4 . . .
umschreiben können. Die Wohlordnungseigenschaft ist damit eine unmittelbare Konsequenz aus dem Fundierungsaxiom, das die Konstruktion unendlich absteigender ∈-Ketten unterbindet. M1
x
In der Tat ist der Zusammenhang zwischen Wohlordnungen und Ordinalzahlen noch weit größer ist. Dies unterstreicht der folgende Satz, den wir ohne formalen Beweis akzeptieren wollen:
y
<1
f
f
-1
f
-1
f
Jede wohlgeordnete Menge ist zu genau einer Ordinalzahl ordnungsisomorph.
<2 f (x)
M2
Satz 3.10 (Isomorphiesatz für Ordinalzahlen)
f (y)
Abbildung 3.33: Zwei Mengen M1 und M2 heißen ordnungsisomorph, wenn eine bijektive Abbildung existiert, die alle Elemente von M1 ordnungserhaltend auf M2 abbildet. Von einer ordnungserhaltenden Abbildung sprechen wir immer dann, wenn aus x <1 y die Beziehung f (x) <2 f (y) folgt und umgekehrt.
Zunächst müssen wir klären, was sich hinter dem Begriff der Ordnungsisomorphie verbirgt. Wie in Abbildung 3.33 skizziert, werden zwei Ordnungen (M1 , <1 ) und (M2 , <2 ) als ordnungsisomorph bezeichnet, wenn eine bijektive Abbildung f : M1 → M2 existiert, die ordnungserhaltend ist. Von einer ordnungserhaltenden Funktion sprechen wir immer dann, wenn sie die folgende Eigenschaft besitzt: x <1 y ⇔ f (x) <2 f (y)
für alle x, y ∈ M1
Demnach sind zwei Mengen genau dann ordnungsisomorph, wenn sie gleichmächtig sind und ihre Elemente die gleiche Ordnungsstruktur
185
3.2 Axiomatische Mengenlehre
aufweisen. Welche Elemente in M1 und M2 konkret enthalten sind, spielt dabei keine Rolle. Über die Isomorphiefunktion f haben wir es geschafft, von der konkreten Beschaffenheit der Mengenelemente zu abstrahieren. Jetzt sind wir in der Lage, den Isomorphiesatz in seiner voller Breite zu verstehen. Er besagt, dass wir zu jeder wohlgeordneten Menge eine Ordinalzahl mit der gleichen Ordnungsstruktur finden können und diese Zahl zudem eindeutig bestimmt ist. Folgerichtig dürfen wir jede Ordinalzahl als Repräsentant einer ganz bestimmten Wohlordnung auffassen. Umgekehrt können wir jeder Menge M einen Ordnungstyp in Form einer eindeutig festgelegten Ordinalzahl zuordnen. Dieser Ordnungstyp ist „der Allgemeinbegriff, welcher sich aus M ergibt, wenn unter Festhaltung der Rangordnung ihrer Elemente von der Beschaffenheit der letzteren abstrahiert wird“. Den letzten Satz habe ich nicht mit meinen eigenen Worten beendet. Es sind die Worte von Georg Cantor, entnommen aus dem Eingangszitat von Abschnitt 3.2.2. Die ursprüngliche Vorstellung, die Cantor mit den Ordinalzahlen verband, tritt nun klar hervor. Cantor fand den Zugang zu den Ordinalzahlen nicht wie wir über den Begriff der transitiven Menge. Es waren seine akribisch durchgeführten Studien über das Wesen von Ordnungen und Wohlordnungen, die ihn diese wahrhaft faszinierende Welt riesiger Zahlen entdecken ließen.
0, 1, 2, 3, 4, 5, 6, 7, . . . Abstraktion
Abbildung 3.34: Wohlordnung der natürlichen Zahlen mit dem Ordnungstyp ω 1, 2, 3, 4, 5, 6, 7, . . . , 0 Abstraktion
Beispiele Wir wollen nun für verschiedene Wohlordnungen der natürlichen Zahlen herausarbeiten, mit welchen Ordinalzahlen ihre Ordnungstypen beschrieben werden können. I
Beispiel 1 (Abbildung 3.34) In diesem Beispiel sind die Elemente von N in ihrer natürlichen Reihenfolge belassen. Der Ordnungstyp dieser Zahlenreihe ist uns bereits bekannt; er wird durch die kleinste transfinite Ordinalzahl ω beschrieben.
Abbildung 3.35: Wohlordnung der natürlichen Zahlen mit dem Ordnungstyp ω + 1 0, 2, 4, 6, . . . , 1, 3, 5, 7, . . . Abstraktion
Wir können die natürlichen Zahlen auf verschiedene Weise umsortieren, ohne die Wohlordnungseigenschaft zu verlieren. Die nächsten Beispiele zeigen, auf welche Weise dies gelingen kann. I
Beispiel 2 (Abbildung 3.35) Per Definition ist die Zahl 0 ist in dieser Anordnung größer als alle anderen natürlichen Zahlen und taucht daher nicht am Anfang, sondern am Ende der Zahlenreihe auf. Alle anderen natürlichen Zahlen
Abbildung 3.36: Wohlordnung der natürlichen Zahlen mit dem Ordnungstyp ω · 2
186
3 Fundamente der Mathematik
0, 1, 2, 4, . . . , 3, 9, 15, . . . , 5, 25, 35, . . .
behalten ihre übliche Position. Nach dem Ordnungstyp dieser Anordnung müssen wir nicht lange suchen. Er wird durch ω + 1, den direkten Nachfolger von ω, beschrieben.
Abstraktion I
Beispiel 3 (Abbildung 3.36) Hier sind die natürlichen Zahlen in zwei Folgen aufgeteilt. Die erste umfasst alle geraden, die zweite alle ungeraden Zahlen. Jede Teilmenge besitzt ein minimales Element, so dass wir immer noch eine Wohlordnung vor uns haben. Erneut finden wir in den Reihen der Ordinalzahlen einen eindeutigen Vertreter, der exakt diese Anordnung der Elemente aufweist: Es ist die Ordinalzahl ω + ω oder, in anderer Schreibweise, die Ordinalzahl ω · 2.
I
Die Anordnung basiert auf der Idee, die natürlichen Zahlen als Vielfache von Primzahlen aufzuzählen. Auf die Zahlen 0 und 1 folgen zunächst alle Vielfache der Primzahl 2, danach alle Vielfache der Primzahl 3 und so fort. Um Doppelnennungen zu vermeiden, wird jede Zahl nur einmal aufgeführt. Mit diesem Vorgehen haben wir es geschafft, die natürlichen Zahlen in unendliche viele Folgen mit jeweils unendlich vielen Elementen zu zerlegen. Den zugehörigen Ordnungstyp kennen wir ebenfalls schon: Er wird durch die Ordinalzahl ω · ω = ω 2 beschrieben.
Abbildung 3.37: Wohlordnung der natürlichen Zahlen mit dem Ordnungstyp ω · ω
0, 1, 2, 4, 8, 16, 32, . . . , 3, 9, 27, . . . , 6, 18, 54, . . . , 12, 36, 108, . . . , 5, 25, . . . , 10, 50, . . . , 20, 100, . . . , 15, 75, . . . , 45, 225, . . . , 135, 675, . . . , 30, 150, . . . , 90, 450, . . . , 270, 1350, . . . , 60, 300, . . . , 180, 900, . . . , 540, 2700, . . .
Abstraktion
Beispiel 4 (Abbildung 3.37)
I
Beispiel 5 (Abbildung 3.38) Wie im vorigen Beispiel beginnen wir mit der Zahl 0. Der Rest der Anordnung basiert auf der Idee, die Position einer natürlichen Zahl aus ihrer Primfaktorzerlegung abzuleiten. Auf die 0 lassen wir zunächst alle Zweierpotenzen der Form 2n (n ≥ 0) folgen: 1, 2, 22 , 23 , 24 , 25 , . . .
(3.5)
Die Aufzählung setzen wir jetzt fort, indem wir diese Elemente nacheinander mit allen Dreierpotenzen der Form 3n (n ≥ 1) multiplizieren. Auf diese Weise erhalten wir die Zahlen 3, 32 , 33 , . . . , 2 · 3, 2 · 32 , 2 · 33 , . . . , 22 · 3, 22 · 32 , 22 · 33 , . . .
Abbildung 3.38: Wohlordnung der natürlichen Zahlen mit dem Ordnungstyp ω ω
Beachten Sie, dass aus jedem Element des Anfangsstücks (3.5) eine eigene Folge mit unendlich vielen Elementen geworden ist. Im nächsten Schritt schreiben wir die Zahlenreihe fort, indem wir die bisher erzeugten Elemente mit allen Fünferpotenzen der Form 5n (n ≥ 1) multiplizieren:
187
3.2 Axiomatische Mengenlehre 5, 52 , . . . , 2 · 5, 2 · 52 , . . . , 22 · 5, 22 · 52 , . . . , 3 · 5, 3 · 52 , . . . , 32 · 5, 32 · 52 , . . . , 33 · 5, 33 · 52 , . . . , 2 · 3 · 5, 2 · 3 · 52 , . . . , 2 · 32 · 5, 2 · 32 · 52 , . . . , 2 · 33 · 5, 2 · 33 · 52 , . . . , 22 · 3 · 5, 22 · 3 · 52 , . . . , 22 · 32 · 5, 22 · 32 · 52 , . . . , 22 · 33 · 5, 22 · 33 · 52 , . . . ,
Bisher haben wir nur diejenigen Zahlen erfasst, die neben 2, 3 und 5 keine weiteren Primfaktoren besitzen. Fahren wir nach diesem Schema fort und multiplizieren das erzeugte Anfangsstück mit immer neuen Primzahlpotenzen, so erreichen wir irgendwann jede natürliche Zahl. Die so erzeugte Anordnung ist eine abenteuerliche Konstruktion aus Reihen und Unterreihen, die sich immer weiter verzweigen. Dennoch ist uns auch diese Ordnungsstruktur bereits bekannt. Es ist die Struktur aus Abbildung 3.31, repräsentiert durch die Ordnungszahl ω ω . 3.2.2.4
Transfinite Induktion
In diesem Abschnitt wollen wir das Beweisprinzip der vollständigen Induktion auf beliebige wohlgeordnete Mengen verallgemeinern. Die angestellten Überlegungen werden uns auf direktem Weg zur transfiniten Induktion führen, mit der sich viele Aussagen über wohlgeordnete Mengen elegant beweisen lassen. Zunächst wollen wir rekapitulieren, was wir unter dem Prinzip der vollständigen Induktion zu verstehen haben. Eingeführt haben wir es in Abschnitt 3.1 in Form des Induktionsaxioms: ϕ(0) → (∀ x (ϕ(x) → ϕ(s(x))) → ∀ x ϕ(x))
M = {
Mitunter wird das Prinzip der vollständigen Induktion in einer alternativen Formulierung verwendet, die wir jetzt herleiten wollen. Sie folgt unmittelbar aus dem Minimalitätsprinzip, das in seiner umgangssprachlichen Formulierung folgendermaßen lautet: „Existiert ein x mit ¬ϕ(x), so gibt es ein kleinstes x mit ¬ϕ(x).“ In formaler Schreibweise liest sich das Minimalitätsprinzip wie folgt:
¬ϕ ,
ϕ ,
¬ϕ ,
¬ϕ }
,
Aussonderungsaxiom M := {x ∈ M | ¬ϕ(x)} ¬ϕ M = {
(3.6)
Das Prinzip der vollständigen Induktion ist immer dann anwendbar, wenn eine parametrisierte Aussage ϕ(x) für alle natürlichen Zahlen x ∈ N bewiesen werden soll. In diesem Fall reicht der Beweis, dass die Aussage für x = 0 wahr ist und sich deren Gültigkeit von einem beliebigen x ∈ N auf dessen Nachfolger vererbt.
∃ x ¬ϕ(x) → ∃ x (¬ϕ(x) ∧ ∀ (y < x) ϕ(y))
ϕ
,
¬ϕ ,
,
¬ϕ }
,
Wohlordnungsprinzip M hat ein minimales Element. ¬ϕ M
= {
,
¬ϕ ,
,
¬ϕ ,
}
„Existiert ein x mit ¬ϕ(x), so gibt es ein kleinstes x mit ¬ϕ(x).“ Abbildung 3.39: In jeder wohlgeordneten Menge M gilt das Minimalitätsprinzip. Es besagt, dass wir in M zu jeder Eigenschaft ϕ immer ein kleinstes Gegenbeispiel finden können, sofern in dieser Menge überhaupt eines existiert.
188
3 Fundamente der Mathematik
Wir wollen uns an dieser Stelle einen Moment Zeit nehmen und einen zweiten Blick auf die Formel (3.7) werfen. Zunächst sieht es so aus, als sei in der alternativen Formulierung der vollständigen Induktion der Induktionsanfang abhanden gekommen. Dass dem nicht so ist, lässt sich leicht einsehen. Hierzu lösen wir den Allquantor auf und betrachten die linke Seite der Formel (3.7) für den Fall x = 0: ∀ (y < 0) ϕ(y) → ϕ(0) Da keine natürliche Zahl kleiner als 0 existiert, ist die Unterformel ∀ (y < 0) ϕ(y) immer wahr, und wir können die linke Seite von Formel (3.7) folgendermaßen vereinfachen: ϕ(0) Der Induktionsanfang ist also keineswegs verschwunden, sondern als Spezialfall in der Induktionsformel versteckt.
Drehen wir die Schlussrichtung um, indem wir die linke und die rechte Seite der Implikation negieren, so entsteht eine äquivalente Aussage der folgenden Gestalt: ∀ x (ϕ(x) ∨ ¬∀ (y < x) ϕ(y)) → ∀ x ϕ(x) Bringen wir den Ausdruck jetzt noch in die Implikationsform, so sind wir am Ziel: ∀ x (∀ (y < x) ϕ(y) → ϕ(x)) → ∀ x ϕ(x)
(3.7)
Dies ist die zweite Variante, in der die vollständige Induktion gern verwendet wird. Um eine Aussage ϕ(x) für alle x ∈ N zu beweisen, nehmen wir für ein beliebiges x an, ϕ(y) sei für alle y < x wahr. Ist unter dieser Annahme auch ϕ(x) eine wahre Aussage, so ist ϕ(x) für alle x ∈ N bewiesen. Unbestritten ist die vollständige Induktion ein starkes Beweismittel. Umso verblüffender ist es, dass wir sie durch die simple Tatsache legitimieren konnten, dass innerhalb der natürlichen Zahlen immer ein kleinstes Gegenbeispiel existiert, sofern es überhaupt eines gibt. Diese Eigenschaft gilt aber nicht nur für die natürlichen Zahlen, sondern für jede wohlgeordnete Menge (Abbildung 3.39). Damit sind wir bereit, das Prinzip der transfiniten Induktion für wohlgeordnete Mengen auszusprechen: Satz 3.11 (Transfinite Induktion für wohlgeordnete Mengen) Für jede wohlgeordnete Menge (ξ , <) und jede Formel ϕ(ν) gilt ∀ (x ∈ ξ ) (∀ (y ∈ ξ , y < x) ϕ(y) → ϕ(x)) → ∀ (x ∈ ξ ) ϕ(x) Sehr häufig wird das Prinzip der transfiniten Induktion verwendet, um Eigenschaften von Ordinalzahlen zu beweisen. Die Formel in Satz 3.11 erscheint dann in folgendem Gewand: ∀ α (∀ (β < α) ϕ(β ) → ϕ(α)) → ∀ α ϕ(α)
(3.8)
Wir können noch einen Schritt weitergehen und die Ordinalzahl α einer Fallunterscheidung unterziehen: I
α = 0.
I
α ist der Nachfolger einer anderen Ordinalzahl.
189
3.2 Axiomatische Mengenlehre
ϕ(0)
∀ α (ϕ(α) → ϕ(α + 1))
∀ γ (∀ (β < γ) ϕ(β ) → ϕ(γ))
Abbildung 3.40: Ein transfiniter Induktionsbeweis besteht aus drei Teilen. Im Induktionsanfang wird der Beweis verankert. Danach wird gezeigt, dass sich die Gültigkeit von ϕ auf alle direkten Nachfolger und alle Limes-Ordinalzahlen vererbt.
I
α ist eine Limes-Ordinalzahl.
Damit können wir Formel (3.8) in eine Form bringen, wie wir sie in vielen Büchern unter dem Stichwort „Transfinite Induktion“ nachschlagen können: ⎛ ⎞ ϕ(0) ∧ ⎝ ∀ α (ϕ(α) → ϕ(α + 1)) ∧ ⎠ → ∀ α ϕ(α) ∀ γ (∀ (β < γ) ϕ(β ) → ϕ(γ)) In dieser Formel ist der Ausdruck ∀ γ als bedingter Quantor zu verstehen, der ausschließlich über Limes-Ordinalzahlen quantifiziert. Um eine Eigenschaften von Ordinalzahlen zu beweisen, reicht es demnach aus, die in Abbildung 3.40 skizzierten Einzelaussagen zu verifizieren. Konkret handelt es sich dabei um die folgenden drei Beweisschritte: I
Induktionsanfang ϕ(0)
I
1. Induktionsschritt: Vererbung auf den Ordinalzahlnachfolger ∀ α (ϕ(α) → ϕ(α + 1))
I
2. Induktionsschritt: Vererbung auf die nächste Limes-Ordinalzahl ∀ γ (∀ (β < γ) ϕ(β ) → ϕ(γ))
Gelingt der Beweis für alle drei, so garantiert uns das Prinzip der transfiniten Induktion, dass ϕ für alle Ordinalzahlen wahr sein muss.
190
Für Cantor waren Ordinalund Kardinalzahlen zwei verschiedene Paar Schuhe. Welche begriffliche Trennung er zwischen beiden Begriffen vornahm, zeigt ein vergleichender Blick auf die Eingangszitate der Abschnitte 3.2.2 und 3.2.3. Ordinalzahlen waren für Cantor das Ergebnis einer Abstraktion, in der die konkrete Beschaffenheit der Elemente einer Menge keine Rolle mehr spielt, wohl aber die Ordnung, in der sie zueinander stehen. Mit der Theorie der Kardinalzahlen vollzog er eine zweite Abstraktion, in der Mengen weder durch die Beschaffenheit ihrer Elemente noch durch deren Ordnung unterschieden werden (Abbildung 3.41). Auch wenn es der menschlichen Intuition entgegenkommt, Ordinalzahlen und Kardinalzahlen als Beschreibungen von Mengen auf verschiedenen Abstraktionsebenen zu sehen, ist diese Trennung nicht notwendig. Aus diesem Grund verzichtet die moderne Mengenlehre gänzlich auf diese Unterscheidung und führt den Begriff der Kardinalzahl direkt auf den Begriff der Ordinalzahl zurück. Als Denkstütze ist die Cantor’sche Vorstellung dennoch wertvoll. Verglichen mit der formalen Formulierung in Definition 3.12 schält sie klarer heraus, welche Grundgedanken sich hinter den Ordinal- und den Kardinalzahlen wirklich verbergen.
3 Fundamente der Mathematik
3.2.3
Kardinalzahlen „‚Mächtigkeit‘ oder ‚Kardinalzahl‘ von M nennen wir den Allgemeinbegriff, welcher mithilfe unseres aktiven Denkvermögens dadurch aus der Menge M hervorgeht, dass von der Beschaffenheit ihrer verschiedenen Elemente m und von der Ordnung ihres Gegebenseins abstrahiert wird. Das Resultat dieses zweifachen Abstraktionsakts, die Kardinalzahl oder Mächtigkeit von M, bezeichnen wir mit M.“ Georg Cantor, 1895 [21]
Nachdem wir uns ausführlich mit den Ordinalzahlen auseinandergesetzt haben, wollen wir in diesem Abschnitt einen Blick auf die verwandten Kardinalzahlen werfen. Ganz fremd sind uns diese Zahlen nicht. Bereits in Kapitel 1 haben wir sie ausgiebig dazu verwendet, die Mächtigkeit von Mengen zu beschreiben. Für endliche Mengen war dies einfach; hier haben wir die Mächtigkeit einer Menge ganz einfach mit der Anzahl ihrer Elemente gleichgesetzt. Für unendliche Mengen hatten wir dagegen auf das Cantor’sche Begriffsinstrumentarium zurückgegriffen. Nach ihm wird die kleinste Unendlichkeit mit der Kardinalzahl ℵ0 bezeichnet, die nächst größere mit ℵ1 und so fort. Zugegebenermaßen haben wir den Begriff der Kardinalzahl bisher nur informell verwendet. Dies wollen wir nun ändern und ihn formal zementieren. Wie die folgende Definition zeigt, können wir die Kardinalzahlen ganz einfach auf die uns mittlerweile wohlvertrauten Ordinalzahlen zurückführen: Definition 3.12 (Kardinalzahl) Eine Ordinalzahl α heißt Kardinalzahl, wenn aus β < α stets |β | < |α| folgt.
Die Definition macht unmissverständlich deutlich, dass Kardinalzahlen nichts anderes als besondere Ordinalzahlen sind. Ganz konkret sind es genau jene Ordinalzahlen, die bezüglich ihrer Mächtigkeit minimal sind; d. h., wir können zu einer Kardinalzahl niemals eine kleinere Ordinalzahl mit der gleichen Mächtigkeit finden. Im Folgenden halten wir uns an die Konvention, Kardinalzahlen mit den kleinen griechischen Buchstaben κ, λ oder μ zu bezeichnen.
191
3.2 Axiomatische Mengenlehre
Beachten Sie, dass für zwei endliche Ordinalzahlen α und β die Beziehungen β < α und |β | < |α| äquivalent sind. Solange wir den vertrauten Boden des Endlichen nicht verlassen, ist also jede Ordinalzahl auch eine Kardinalzahl. Im Unendlichen müssen wir mehr Vorsicht walten lassen. Zunächst gilt, dass die kleinste unendliche Kardinalzahl ℵ0 der kleinsten unendlichen Ordinalzahl entspricht; d. h., es gilt die Gleichung:
0, 1, 2, 3, 4, 5, 6, . . .
Erste Abstraktion
Ordinaler Typ: ω
Zweite Abstraktion
Kardinaler Typ: ω
Zweite Abstraktion
Kardinaler Typ: ω
Erste Abstraktion
Ordinaler Typ: ω + ω
ℵ0 = ω Auch wenn sich ab jetzt die Wege trennen, bleiben große strukturelle Gemeinsamkeiten zwischen den beiden Zahlenwelten bestehen. So erstreckt sich die Aleph-Reihe ebenfalls in das Unendliche hinein und hat eine ähnliche Struktur wie die Ordinalzahlen selbst. Konkret existiert für jede Ordinalzahl α auch eine Kardinalzahl ℵα . Daraus folgt sofort, dass auch die Kardinalzahlen eine echte Klasse bilden. Genau wie im Fall der Ordinalzahlen können wir uns zu immer größeren Kardinalzahlen vorarbeiten, allerdings preschen wir jetzt mit noch schwindelerregenderer Geschwindigkeit voran. Erinnern Sie sich an die astronomisch große Zahl ω1 , die kleinste überabzählbare Ordinalzahl? Auf der unendlichen Aleph-Skala ist ω1 nicht weit entfernt; sie erscheint bereits an zweiter Stelle! Danach folgt unmittelbar die Ordinalzahl ω2 und so fort. Die formale Definition der Kardinalzahl versetzt uns in die Lage, die Symbolik |M| auch für unendliche Mengen präzise zu erfassen. Bisher haben wir die Schreibweise |M| hauptsächlich in Vergleichen der Form |M| = |N| verwendet und damit ausgedrückt, dass eine bijektive Abbildung zwischen den Mengen M und N existiert. Ohne das Gleichheitszeichen hatte die Schreibweise |M| aber noch keine präzise Bedeutung. Dies wollen wir nun ändern und die Symbolik |M| über den Begriff der Kardinalzahl formal definieren: Definition 3.13 (Kardinalität, Mächtigkeit) Sei M eine beliebige Menge. Diejenige Kardinalzahl κ, die sich bijektiv auf M abbilden lässt, heißt die Kardinalität oder die Mächtigkeit von M, geschrieben als |M|. Damit ist die Bringschuld beglichen, die wir uns mit der informellen Verwendung von |M| und den Aleph-Zahlen in Kapitel 1 aufgebürdet haben. Mit Definition 3.13 im Blick ist die vormals symbolische Schreibweise |M| = ℵn jetzt zu einer echten Gleichung geworden, einer Gleichung, auf deren linker und rechter Seite präzise definierte Mengen stehen.
0, 2, 4, . . . , 1, 3, 5, . . . Abbildung 3.41: Ordinalzahlen abstrahieren von der Beschaffenheit der Elemente einer Menge. Kardinalzahlen vollziehen eine zweite Abstraktion, in der die Ordnung der Elemente ebenfalls keine Rolle mehr spielt. In diesem Beispiel sind zwei Ordnungen der natürlichen Zahlen dargestellt, die unterschiedliche ordinale Typen, aber den gleichen kardinalen Typ besitzen.
192
3 Fundamente der Mathematik
3.3 Aufgabe 3.1 Webcode 3667
Übungsaufgaben
Formalisieren Sie die folgenden Aussagen innerhalb der Peano-Arithmetik: a) „Es gibt natürliche Zahlen x, y mit x2 + y2 = 9.“ b) „x3 + y3 = z3 hat keine Lösung in den positiven natürlichen Zahlen.“ c) „x ist eine Zweierpotenz.“
Aufgabe 3.2 Webcode 3195
Welche der folgenden Formeln entspricht der Aussage „7 ist eine Primzahl“? a) ∀ z (z | 7 → (z = 1 ∨ z = 7)) b) ¬∃ (y > 1) ∃ (z > 1) 7 = y × z Welche der folgenden Formeln entspricht der Aussage „x ist eine Primzahl“? c) ∀ z ((z | x) → (z = 1 ∨ z = x)) d) ¬∃ (y > 1) ∃ (z > 1) x = y × z
Aufgabe 3.3 Webcode 3367
Formalisieren Sie die folgenden Aussagen mithilfe der Peano-Arithmetik: a) „Jede gerade natürliche Zahl n > 2 lässt sich als Summe zweier Primzahlen schreiben.“ b) „Für unendlich viele Zahlen n ist sowohl n als auch n + 2 eine Primzahl.“ Beide Aussagen sind alte Bekannte aus Kapitel 1. Die erste ist die berühmte Goldbach’sche Vermutung, die zweite die Vermutung über die Existenz unendlich vieler Primzahlzwillinge.
Aufgabe 3.4 Webcode 3734
In manchen Büchern wird das Induktionsaxiom ϕ(0) → (∀ x (ϕ(x) → ϕ(s(x))) → ∀ x ϕ(x)) in der geringfügig abweichenden Form (ϕ(0) ∧ ∀ x (ϕ(x) → ϕ(s(x)))) → ∀ x ϕ(x) eingeführt. Zeigen Sie, dass beide Definitionen äquivalent sind.
3.3 Übungsaufgaben
An erster Stelle der ZF-Axiomenliste haben wir das Axiom der Bestimmtheit eingeführt. In formaler Schreibweise lautete es wie folgt: ∀ x ∀ y (x = y ↔ ∀ z (z ∈ x ↔ z ∈ y))
193
Aufgabe 3.5 Webcode 3212
Nehmen Sie an, wir würden das Gleichheitszeichen aus der Sprache entfernen und das Bestimmtheitsaxiom nicht als Axiom sondern als Definition des Gleichheitszeichens auffassen. Dies bedeutet, dass wir das Gleichheitszeichen nicht mehr länger als natives Sprachelement, sondern nur noch als syntaktische Abkürzung behandeln dürfen. Können wir in der so modifizierten Mengenlehre immer noch die gleichen Theoreme ableiten?
An vierter Stelle der ZF-Axiomenliste haben wir das Axiom der Vereinigung eingeführt: ∀ x ∃ y ∀ z (z ∈ y ↔ ∃ (w ∈ x) z ∈ w) Unter anderem garantiert es uns, dass für zwei Mengen x und y die Vereinigungsmenge x ∪ y existiert. Im Zusammenhang mit diesem Axiom haben wir auch die Schreibweise x ∩ y als syntaktische Abkürzung für die Schnittmenge eingeführt. Ist die Existenz der Schnittmenge ebenfalls durch das Vereinigungsaxiom abgesichert? Falls nein, welche Axiome werden hierzu benötigt?
Ein unentbehrlicher Bestandteil der ZF-Mengenlehre ist das Fundierungsaxiom. Es besagt, dass wir in jeder nichtleeren Menge x ein Element y finden können, das mit x keine Elemente gemeinsam hat.
Aufgabe 3.6 Webcode 3700
Aufgabe 3.7 Webcode 3866
a) Welche Bedeutung besitzt das Axiom für die ZF-Mengenlehre? b) Ist das Fundierungsaxiom mit der Russell’schen Typentheorie verträglich?
In Abschnitt 3.2.1.3 haben wir gezeigt, dass sich der Begriff des geordneten Paares durch die Definition "ξ , ν# := { {ξ }, {ξ , ν} } auf den Begriff der Menge reduzieren lässt. Die gezeigte Möglichkeit ist nur eine von vielen. Beispielsweise können wir geordnete Paare nach einem Vorschlag von Norbert Wiener aus dem Jahr 1914 auch so darstellen [130, 192, 193]: "ξ , ν# := { {0, / {ξ }}, {{ν}} }
Aufgabe 3.8 Webcode 3115
194
3 Fundamente der Mathematik
a) Durch welche der folgenden Mengendiagramme werden die in diesem Kapitel diskutierten Definitionen des geordneten Paares visualisiert?
b) Nach welchem Konstruktionsmuster bildet das verbleibende Diagramm den Begriff des geordneten Paares ab? Ist es für die Darstellung geordneter Paare überhaupt geeignet?
Aufgabe 3.9 Webcode 3060
In Abschnitt 3.2.1.2 haben wir herausgearbeitet, dass die Relation ‚<‘ keine Wohlordnung auf der Menge Z der ganzen Zahlen ist.
Aufgabe 3.10 Webcode 3463
Das kartesische Produkt zweier Mengen ν und μ ist in der Mathematik wie folgt definiert:
Definieren Sie die Ordnungsrelation ‚<‘ so um, dass Z zu einer wohlgeordneten Menge wird.
ν × μ := {"x, y# | x ∈ ν ∧ y ∈ μ} a) Formalisieren Sie das kartesische Produkt im System der ZF-Mengenlehre. Geben Sie hierzu eine Formel K(ξ , ν, μ) an, die genau dann wahr ist, wenn ξ , ν, μ die Beziehung ξ = ν × μ erfüllen. b) Geben Sie eine Formel R(ξ , ν) an, die genau dann wahr ist, wenn ξ eine Relation über der Menge ν ist. Führen Sie Ihre Definition auf die Formel K(ξ , ν, μ) aus Teilaufgabe a) zurück. c) Auf Seite 164 haben Sie die Formel R(ξ ) kennen gelernt, die genau dann wahr ist, wenn ξ eine Relation über einer beliebigen Menge ist. Versuchen Sie, für R(ξ ) eine alternative Definition zu finden, die den Begriff der Relation auf das kartesische Produkt zurückführt. d) Aufbauend auf dem Relationenbegriff haben wir herausgearbeitet, wie sich der Begriff der partiellen Funktion innerhalb der Zermelo-Fraenkel-Mengenlehre beschreiben lässt. Lassen sich die Begriffe der totalen, der injektiven und der surjektiven Funktion auf die gleiche Weise formalisieren?
195
3.3 Übungsaufgaben
In dieser Übungsaufgabe greifen wir den formalen Beweis von Satz 3.3 auf, den Beweis über die Komponentengleichheit geordneter Paare. a) Werfen Sie einen Blick auf die Beweisschritte in den Zeilen 60 – 65. War es wirklich nötig, sie in den Beweis aufzunehmen?
Aufgabe 3.11 Webcode 3567
b) Am Ende des umgangssprachlich formulierten Originalbeweises werden zwei Fälle unterschieden. Zunächst wird der Fall v = u betrachtet, danach der Fall v = u. Hätten wir im formalen ZF-Beweis auf die Durchführung dieser Fallunterscheidung verzichten können?
Welche der folgenden Mengen sind transitiv? Welche sind Ordinalzahlen? Welche sind Kardinalzahlen? a) 0/
c) { {0}, / {{0}} / }
e) { 0, / {0}, / {{0}} / }
b) { 0/ }
d) { 0, / {{0}} / }
f) { 0, / {0}, / {0, / {0}} / }
Aufgabe 3.12 Webcode 3234
Aufgabe 3.13 Webcode 3196
Beweisen oder widerlegen Sie die folgenden Behauptungen: a) Ist x eine Ordinalzahl, dann ist es auch 2x . b) Die Ordinalzahladdition ist kommutativ, d. h., es gilt α + β = β + α. c) Die Ordinalzahlmultiplikation ist kommutativ, d. h., es gilt α · β = β · α.
Welche der folgenden Aussagen sind jeweils äquivalent zueinander? a) X ist leer
g) |X| = 0/
m) |X| ∈ ℵ0
b) X ist endlich
h) |X| = ℵ0
n) |X| ⊆ ℵ0
c) X ist höchstens abzählbar
i) |X| < ℵ0
o) |X| ⊂ ℵ0
d) X ist abzählbar
j) |X| > ℵ0
p) ℵ0 ∈ |X|
e) X ist unendlich
k) |X| ≤ ℵ0
q) ℵ0 ⊆ |X|
f) X ist überabzählbar
l) |X| ≥ ℵ0
r) ℵ0 ⊂ |X|
Aufgabe 3.14 Webcode 3034
4 Beweistheorie
„Man kann – unter Voraussetzung der Widerspruchsfreiheit der klassischen Mathematik – sogar Beispiele für Sätze (und zwar solche von der Art des Goldbach’schen oder Fermat’schen) angeben, die zwar inhaltlich richtig, aber im formalen System der klassischen Mathematik unbeweisbar sind.“ Kurt Gödel [164] In diesem Kapitel werden wir uns ausführlich mit der Beweistheorie, einer der tragenden Säulen der mathematischen Logik, beschäftigen. In ihrem Kern steht der Gedanke, Beweise als mathematische Objekte zu interpretieren und auf diese Weise einer präzisen Analyse zugänglich zu machen. Zur vollen Blüte ist die Beweistheorie in der ersten Hälfte des zwanzigsten Jahrhundert gereift. Sie hat verblüffende Erkenntnisse hervorgebracht, die einen tiefen Einblick in das Wesen des mathematischen Schließens gewähren und uns zugleich die Grenzen der Mathematik in aller Klarheit vor Augen führen. Um welche Erkenntnisse es sich hierbei im Detail handelt, ist Gegenstand dieses Kapitels. In den Abschnitten 4.1 bis 4.4 werden wir ausführlich die Gödel’schen Unvollständigkeitssätze diskutieren. Anschließend werden wir herausarbeiten, wie allgegenwärtig das Phänomen der Unvollständigkeit wirklich ist. Die in Abschnitt 4.5 vorgestellte Goodstein-Folge wird verdeutlichen, dass selbst harmlos wirkende Aussagen der gewöhnlichen Mathematik betroffen sind.
4.1
Gödel’sche Unvollständigkeitssätze
Die Gödel’schen Unvollständigkeitssätze sind das Herzstück der modernen Beweistheorie. Ihre Inhalte sind düster, und dennoch werfen sie ein so helles Licht auf das Wesen der mathematischen Methode, dass sie seit ihrer Entdeckung im Jahr 1931 unzählige Mathematiker und Naturwissenschaftler in ihren Bann ziehen konnten. Ich selbst las von ihnen das erste Mal in Douglas Hofstadters Meisterwerk Gödel, Escher,
Im Zusammenhang mit Gödels Unvollständigkeitssätzen werden wir immer wieder von formalen Systemen reden, die stark genug sind, um die PeanoArithmetik zu formalisieren. Was genau ist damit gemeint? In seiner Originalarbeit hat Gödel den Unvollständigkeitssatz für ein spezielles formales System bewiesen, das er kurzerhand als P bezeichnete. In seinen eigenen Worten ist P „im wesentlichen das System, welches man erhält, wenn man die Peano’schen Axiome mit der Logik der PM [Principia Mathematica] überbaut“ [64]. Weiter hinten in seiner Arbeit führt er aus, dass sein Ergebnis keinesfalls auf P beschränkt ist, sondern alle formalen Systeme erfasst, die ausdrucksstark genug sind, um über die additiven und multiplikativen Eigenschaften der natürlichen Zahlen zu sprechen. Neben der Peano-Arithmetik fallen hierunter auch alle Theorien, in denen sich die natürlichen Zahlen in Form anderer Objekte repräsentieren lassen. Mit der Zermelo-Fraenkel-Mengenlehre haben wir eine solche Theorie bereits kennen gelernt. Obwohl die natürlichen Zahlen in ZF und ZFC nicht als eigenständige Objekte existieren, lassen sie sich in Form spezieller Mengen repräsentieren und die Addition und Multiplikation auf entsprechende Mengenoperationen abbilden. Dies ist gemeint, wenn wir sagen, ein formales System sei stark genug, um die Peano-Arithmetik zu formalisieren.
198
4 Beweistheorie
Bach [90], kurz vor Beginn meines Studiums. Auch wenn seitdem fast 20 Jahre vergangen sind, ist die Faszination, die ich für Gödels Werk empfinde, ungebrochen. Unzweifelhaft sind es die Unvollständigkeitssätze, die mich zum Verfassen dieses Buchs bewegt haben.
Zu Gödels ärgsten Kritikern gehörte kein geringerer als der berühmte Mengentheoretiker Ernst Zermelo, dessen Name uns schon mehrfach in diesem Buch begegnet ist. Im September 1931 trafen beide auf der Versammlung der Deutschen Mathematiker-Vereinigung in Bad Elster zusammen. Erscheinungsbildlich hatte der zurückhaltende Gödel seinem damals 60-jährigen Antagonisten wenig entgegenzusetzen. Zermelo war bekannt für seine Wortgewandtheit und seine aufbrausende, manchmal auch jähzornige Art [44]. Er ließ in Bad Elster keinen Zweifel daran, was er von dem jungen Gödel und seinen absurden Ergebnissen hielt, und lehnte zunächst jede Konversation mit ihm ab. Dennoch kam ein persönliches Gespräch zustande, das unerwartet friedlich verlief. Bereits sechs Tage später teilte Zermelo dann aber schriftlich mit, einen Fehler im Beweis der Unvollständigkeitssätze gefunden zu haben. Es folgte ein Briefwechsel, in dem Gödel versuchte, die offensichtlichen Missverständnisse auszuräumen. Zermelo ließ sich von den gelieferten Argumenten nicht beirren und machte seine Kritik 1932 schließlich öffentlich [204]. Gödel war kein Mann der Konfrontation und unternahm danach keine weiteren Versuche mehr, dem alternden Zermelo seine Unvollständigkeitssätze zu erklären. Rudolf Carnap sagte später über den Briefwechsel, dass Zermelo die Erklärungsversuche Gödels „völlig missverstanden“ habe. [44].
Zwei Leitmotive prägen die folgenden Abschnitte. Zunächst ist es mir ein Anliegen, die Unvollständigkeitssätze entlang Gödels ursprünglicher Argumentationslinie aus dem Jahr 1931 herzuleiten. Auf diese Weise will ich versuchen, nicht nur den Inhalt der Unvollständigkeitssätze zu beweisen, sondern so weit wie dies möglich ist, auch einen Einblick in Gödels Gedankenwelt zu gewähren. Vorschnelle Euphorie möchte ich an dieser Stelle gleichwohl bremsen, denn auch nach der Lektüre dieses Kapitels wird sein Werk eine schwer zu lesende Arbeit bleiben. Gödel hat sie mit zahllosen Formeln und Definitionen gespickt, die den Blick auf das Wesentliche zunächst verstellen. Dennoch ist die akribische Präzision, mit der er seine Ergebnisse bewiesen hat, alles andere als ein Makel; ohne sie hätten die Sätze bei seinen Kritikern niemals die notwendige Akzeptanz gefunden. Für fast alle seiner Zeitgenossen waren Gödels Unvollständigkeitssätze ein schwerer Schlag, und viele standen ihnen schon deshalb kritisch gegenüber, weil nicht sein kann, was nicht sein darf. Es ist nicht mein Ziel, Gödels Ergebnisse mit diesem Buch gegen kritische Stimmen zu verteidigen. Stattdessen möchte ich versuchen, den Kern seiner faszinierenden Beweise offenzulegen und habe aus diesem Grund bewusst vermieden, die folgenden Abschnitte mit technischen Details zu überfrachten. Dies trifft insbesondere auf eine Reihe von Hilfssätzen zu, die inhaltlich wenig spektakulär sind, aber in vielen Fällen eine ausführliche technische Begründung erfordern. Die Beweise dieser Sätze sind nicht im Detail aufgeführt; dafür wird an den betreffenden Textstellen darauf hingewiesen, wo sie nachgeschlagen werden können.
4.2
Der erste Unvollständigkeitssatz
Der erste Gödel’sche Unvollständigkeitssatz ist der bekannteste und am häufigsten zitierte Satz der mathematischen Logik. Grob gesprochen besagt er, dass sich die Begriffe der Wahrheit und der Beweisbarkeit in hinreichend ausdrucksstarken formalen Systemen nicht in Einklang bringen lassen. Zwangsläufig müssen diese Systeme unvollständig sein, d. h., es existieren stets Aussagen, die zwar inhaltlich wahr sind, aber nicht innerhalb des Systems bewiesen werden können.
4.2 Der erste Unvollständigkeitssatz
...
Ein wichtiger Punkt vorweg: Nicht jedes formale System ist unvollständig. Betroffen sind nur jene, die ausdrucksstark genug sind, um die Peano-Arithmetik, also die natürlichen Zahlen zusammen mit der Addition und der Multiplikation, zu formalisieren. Unbestritten gehören die natürlichen Zahlen zum vitalen Kern der Mathematik; ohne sie würde diese Wissenschaft auf wenige Teilgebiete zusammenschrumpfen. Der Unvollständigkeitssatz attestiert damit nichts weniger als die Unmöglichkeit, ein formales System zu konstruieren, in dem alle wahren mathematischen Aussagen der gewöhnlichen Mathematik auch als solche bewiesen werden können. Über den ersten Unvollständigkeitssatz wurde viel publiziert, und ein Vergleich der verschiedenen Darstellungen offenbart zwei wichtige Besonderheiten. Zum einen verstellt die uneinheitlich verwendete Terminologie häufig den Blick darauf, dass es sich inhaltlich um den gleichen Satz handelt (vgl. Abbildung 4.1). Zum anderen werden Beweise angeführt, die sich in ihrer Länge drastisch unterscheiden. So kommt der Autor in [161] bereits nach wenigen Absätzen zu dem gewünschten Ergebnis, während sich Gödels Originalbeweis aus dem Jahr 1931 über viele Seiten erstreckt. Wie kann das sein? Zwei Gründe sind hierfür maßgebend. Zunächst einmal basieren viele der neueren Beweise auf dem Begriff der Berechenbarkeit. Mit der
199
Abbildung 4.1: Zwei Sätze aus der Gödel’schen Originalarbeit [64]. Satz V ist ein wichtiger Meilenstein im Beweis des ersten Unvollständigkeitssatzes. Seine inhaltliche Entsprechung ist Satz 4.5, den wir in Abschnitt 4.2.3 diskutieren werden. Gödel selbst hat den Beweis dieses Satzes nur umrissen. Exakt ausgearbeitet ist er beispielsweise in [170]. Satz VI ist das Hauptresultat zur Unvollständigkeit formaler Systeme. Aus ihm erhält Gödel an späterer Stelle seiner Arbeit die inhaltliche Aussage unseres Satzes 4.2 als Korollar. Beide Sätze sind hier bewusst in der ursprünglichen Gestalt dargestellt. Sie machen deutlich, wie sehr sich die damals verwendete Terminologie von der heutigen unterscheidet. Selbst auf den zweiten Blick ist es nicht immer einfach, zu erkennen, welche inhaltliche Aussage sich tatsächlich hinter ihnen verbirgt.
200
4 Beweistheorie
I Semantische Variante
„Jedes korrekte formale System, das stark genug ist, um die Peano-Arithmetik zu formalisieren, ist unvollständig.“ Widerspruchsfreie formale Systeme
Satz 4.1 (Erster Unvollständigkeitssatz, semantisch) Jedes korrekte formale System, das stark genug ist, um die PeanoArithmetik zu formalisieren, ist unvollständig.
Korrekte formale Systeme
Unvollständige formale Systeme
Formalisierung dieses Begriffs ebnete Alan Turing 1936 einen Weg, auf dem sich Gödels Ergebnis vergleichsweise rasch erreichen lässt. Der Hauptgrund ist aber ein anderer: Es existieren mehrere Varianten des ersten Unvollständigkeitssatzes, die sich nicht nur in der gewählten Formulierung unterscheiden, sondern auch inhaltlich eine geringfügig andere Aussage treffen. In der Literatur wird darauf nur selten hingewiesen, und dennoch ist es wichtig, diese Unterschiede zu verstehen. Nur so lassen sich Missverständnisse vorab vermeiden. Eine häufig bemühte Variante ist diese:
Negationsunvollständige formale Systeme
I Syntaktische Variante
„Jedes widerspruchsfreie formale System, das stark genug ist, um die Peano-Arithmetik zu formalisieren, ist negationsunvollständig.“ Widerspruchsfreie formale Systeme
Korrekte formale Systeme
Unvollständige formale Systeme
Negationsunvollständige formale Systeme
Abbildung 4.2: Die semantische Variante des ersten Gödel’schen Unvollständigkeitssatzes ist inhaltlich schwächer als die syntaktische Variante.
Dies ist die semantische Variante des ersten Gödel’schen Unvollständigkeitssatzes. Sie macht eine Aussage über korrekte formale Systeme, also über Systeme, in denen sich ausschließlich wahre Aussagen ableiten lassen (aus ϕ folgt |= ϕ). Umfasst ein solches System die PeanoArithmetik, ist es also ausdrucksstark genug, um über die additiven und multiplikativen Eigenschaften der natürlichen Zahlen zu sprechen, so ist es der Unvollständigkeit preisgegeben. In einem solchen System existiert stets eine wahre Aussage ϕ, die nicht innerhalb des Systems bewiesen werden kann. Für die semantische Variante des ersten Gödel’schen Unvollständigkeitssatzes gibt es in der Tat vergleichsweise kurze Beweise, auf die wir in Kapitel 5 zurückkommen werden. Neben der semantischen Version existiert eine zweite Variante, die den Begriff der Korrektheit vollständig vermeidet. Sie lautet wie folgt: Satz 4.2 (Erster Unvollständigkeitssatz, syntaktisch) Jedes widerspruchsfreie formale System, das stark genug ist, um die Peano-Arithmetik zu formalisieren, ist negationsunvollständig. Dies ist die syntaktische Variante des ersten Gödel’schen Unvollständigkeitssatzes. Sie macht eine Aussage über eine größere Klasse formaler Systeme, da als Voraussetzung nur noch die Widerspruchsfreiheit und nicht mehr die Korrektheit des Kalküls gefordert wird. Da jedes negationsunvollständige formale System, das die Peano-Arithmetik formalisiert, auch unvollständig ist und aus der Korrektheit eines formalen System stets dessen Widerspruchsfreiheit folgt, ist die semantische Formulierung eine direkte Folgerung aus der syntaktischen (Abbildung 4.2).
201
4.2 Der erste Unvollständigkeitssatz
Die inhaltliche Aussage des ersten Gödel’schen Unvollständigkeitssatz ist zweifellos beeindruckend; noch verblüffender ist allerdings die Art und Weise, wie Gödel diese Sätze bewies. In groben Worten gesprochen, gelang es ihm, einen Satz mit der folgenden Bedeutung zu konstruieren: „Ich bin innerhalb des Kalküls unbeweisbar.“
(4.1)
Die Selbstbezüglichkeit dieses Satzes erinnert an das BarbierParadoxon aus Abschnitt 1.2.5 und ist ein Schlüsselelement in Gödels Beweisführung. Für diesen Satz werden wir später zeigen, dass in einem formalen System, das die Voraussetzungen des ersten Unvollständigkeitssatzes erfüllt, weder der Satz selbst noch dessen Negation aus den Axiomen abgeleitet werden kann. Mit anderen Worten: Gödels Aussage ist innerhalb des Systems unentscheidbar. In Abschnitt 4.2.4 werden wir sehen, dass sich die Unentscheidbarkeit dieses Satzes in wenigen Zeilen beweisen lässt. Die eigentliche Schwierigkeit liegt woanders, nämlich in der Konstruktion des Satzes selbst. Wie um alles in der Welt konnte es Gödel schaffen, einen Satz zu konstruieren, der seine eigene Unbeweisbarkeit postuliert? Dieser Satz ist anders als alle uns vertrauten Theoreme der Analysis, der Algebra oder eines anderen Gebiets der gewöhnlichen Mathematik. Es ist ein Satz der Meta-Ebene, schließlich stellt er eine Behauptung über das formale System auf, in dem er selbst formuliert wurde. Indem der Satz über sich selbst spricht, tritt er gewissermaßen aus seinem eigenen formalen System heraus. Aber wie kann so etwas gelingen? Tatsächlich hatte Gödel eine Hintertür entdeckt, durch die Sätze ihr eigenes formales System in gewissem Sinne verlassen können. Die Kernidee seines Ansatzes besteht in der Konstruktion arithmetischer Aussagen, die zur gleichen Zeit zwei inhaltlich verschiedene Bedeutungen in sich tragen (Abbildung 4.3). I
Zuallererst besitzen diese Sätze eine arithmetische Bedeutung. Innerhalb des Kalküls betrachtet sind sie gewöhnliche Sätze der Peano-Arithmetik, und als solche machen sie Aussagen über die natürlichen Zahlen.
I
Von außen betrachtet besitzen die Sätze eine zweite, metatheoretische Bedeutung. Sie kommt durch einen verdeckten Isomorphismus zu Stande, dessen Entdeckung zu den Sternstunden der mathematischen Logik zählt. Gödel konnte zeigen, dass die Regeln und Axiome eines formalen Systems arithmetisch repräsentiert werden können und sich die symbolischen Manipulationen von Zeichenketten,
Welche Variante des ersten Unvollständigkeitssatzes hat Gödel im Jahr 1931 bewiesen? Ein Blick in seine Originalarbeit zeigt, dass sein Unvollständigkeitsresultat eine abgeschwächte Variante von Satz 4.2 ist. Gödel schaffte es damals noch nicht, sein Ergebnis unter der Annahme der Widerspruchsfreiheit zu beweisen, und musste stattdessen die sogenannte ω-Widerspruchsfreiheit voraussetzen. Erst im Jahr 1936 gelang Barkley Rosser der Nachweis, dass sich die ω-Widerspruchsfreiheit durch die gewöhnliche Widerspruchsfreiheit ersetzen lässt [40, 151]. Was sich hinter Gödels ursprünglicher Voraussetzung genau verbirgt, werden wir im Laufe dieses Kapitels herausarbeiten. Soviel vorweg: Jedes ω-widerspruchsfreie Kalkül ist auch widerspruchsfrei, nicht aber umgekehrt. Die Entscheidung Gödels, nicht die semantische, sondern die schwierigere syntaktische Variante zu beweisen, ist nur im historischen Kontext zu verstehen. Für Gödel war es wichtig, seinen Beweis nicht auf den semantischen Wahrheitsbegriff zu stützen, schließlich entstand seine Arbeit in einer Zeit, in der die Nachbeben der mengentheoretischen Paradoxien noch immer zu spüren waren und viele seiner Zeitgenossen dem Wahrheitsbegriff skeptisch oder gar feindselig gegenüberstanden. Es war eine Zeit, in der nach Gödels Worten „ein Konzept der objektiven mathematischen Wahrheit [...] mit größtem Misstrauen betrachtet und in weiten Kreisen als bedeutungsleer zurückgewiesen wurde.“ [44].
202
4 Beweistheorie
Kalkülebene
Meta-Ebene
Metatheoretische Bedeutung
"Ich bin innerhalb des Kalküls unbeweisbar." "Für alle natürlichen Zahlen gilt, ..."
wie sie bei der Durchführung formaler Beweise verwendet werden, auf die arithmetische Ebene übertragen lassen. Auf diese Weise gelang es ihm, metatheoretische Aussagen, wie z. B. die Frage nach der Existenz eines Beweises, in arithmetische Formeln hineinzucodieren. Das einzige, was Gödel hierfür benötigte, waren die Mittel der PeanoArithmetik, d. h. die natürlichen Zahlen zusammen mit der Addition und der Multiplikation. Damit hatte er ein erstaunliches Phänomen entdeckt: Jedes formale System, das die Peano-Arithmetik umfasst, ist stark genug, um metatheoretische Aussagen zu formulieren, und damit implizit in der Lage, über sich selbst zu sprechen.
Zahlentheoretische Bedeutung
4.2.1 Abbildung 4.3: Gödel gelang es, eine arithmetische Aussage zu konstruieren, die neben ihrer zahlentheoretischen Bedeutung eine zweite, metatheoretische Bedeutung besitzt. Diese kommt durch einen unsichtbaren Isomorphismus zustande, der einen Zusammenhang zwischen den symbolischen Manipulationen von Zeichenketten und den arithmetischen Eigenschaft der natürlichen Zahlen herstellt. Auf diese Weise gelang es Gödel, eine arithmetische Aussage zu konstruieren, die ihr eigenes System verlassen und ihre eigene Unbeweisbarkeit postulieren kann.
Arithmetisierung der Syntax
Es ist Zeit, uns genauer mit der Frage zu beschäftigen, wie wir mithilfe arithmetischer Formeln über die Eigenschaften formaler Systeme sprechen können. Um unser Ziel zu erreichen, müssen wir eine Möglichkeit finden, Formeln und Beweise mit den natürlichen Zahlen in Beziehung zu setzen. Konkret werden wir diesen Bezug über eine Zuordnungsvorschrift herstellen, über die wir jede Formel und jeden Beweis eines formalen Systems systematisch in eine natürliche Zahl übersetzen können. Die berechnete Zahl wird uns später als Stellvertreter für die ursprüngliche Formel bzw. den ursprünglichen Beweis dienen. Das formale System, für das wir uns in diesem Kapitel interessieren, ist die Peano-Arithmetik aus Abschnitt 3.1, und deshalb werden wir uns auf die Betrachtung dieses Systems beschränken. Die aufgezeigte Methodik ist aber so allgemein, dass sie auf beliebige formale Systeme angewendet werden kann. Die Syntax der Peano-Arithmetik lässt sich auf ganz unterschiedliche Weisen arithmetisieren. Eine einfache Möglichkeit besteht darin, die Formeln auf dem heimischen PC einzutippen und die intern abgelegte Bitfolge als natürliche Zahl zu interpretieren. Besonders einfach wird die Umwandlung, wenn wir auf den Unicode zurückgreifen (Abbildung 4.4). In dieser standardisierten Zeichentabelle sind sämtliche der von uns benötigten Logiksymbole vorhanden, so dass wir keine Änderung an der Formelsyntax vornehmen müssen. Um beispielsweise die Formel ∀x x = x unter dem Betriebssystem OS X in das Unicode-basierte UTF-16Format zu übersetzen, genügt es, auf der Konsole die folgende Befehls-
4.2 Der erste Unvollständigkeitssatz
203
Abbildung 4.4: Der Unicode umfasst insgesamt 16 Bereiche (planes), die jeder für sich 65536 verschiedene Zeichen aufnehmen können [4]. Das Ergebnis ist eine universelle Symboltabelle, die jedem bekannten Zeichen einen eindeutigen binären Code zuordnet, der auf jeder Hardware, unter jedem Betriebssystem und in jeder Programmiersprache immer derselbe ist.
sequenz einzutippen: echo -n "∀xx=x" | iconv -t UTF-16 | hexdump Das Ergebnis ist eine 12-elementige Byte-Sequenz oder, gleichbedeutend, eine 24-stellige Hexadezimalzahl, die wir mit ϕ notieren: ϕ = FE FF 22 00 00 78 00 78 00 3D 00 78 Header ’x’ ’x’ ’=’ ’x’ ’∀’ Die ersten zwei Bytes sind der UTF-16-Header. Danach folgen jeweils zwei Bytes, die den Unicode des jeweiligen Formelzeichens enthalten. Die Zahl ϕ bezeichnen wir als Gödelnummer der Formel ϕ und den Vorgang des Codierens als Gödelisierung. Die vorgestellte Codierung ist nur eine von vielen möglichen, und tatsächlich spielt es eine untergeordnete Rolle, mit welchem konkreten Zahlenwert eine Formel beschrieben wird. Damit eine Codierung für unsere Zwecke dienlich ist, muss sie lediglich drei Mindestanforderungen erfüllen: I
Die Codierung muss die Menge der Formeln injektiv in die Menge der natürlichen Zahlen einbetten, d. h., sie muss verschiedene Formeln mit unterschiedlichen Gödelnummern belegen. Die UTF-16Codierung erfüllt diese Forderung, da verschiedene Textfragmente immer auch eine unterschiedliche UTF-16-Darstellung besitzen.
204
4 Beweistheorie
Syntaktische Ebene
Arithmetische Ebene
0 + 0 = 0
(S5)
0 + 0 = 0 → (0 + 0 = 0 → 0 = 0)
(S1)
Gödelisierung
ϕ1 = FE FF 00 30 00 2B 00 30 00 3D 00 30
Gödelisierung
ϕ2 = FE 3D 00 92
Gödelisierung
ϕ3 = FE FF 00 30 00 2B 00 30 00 3D 00 30 21 92 00 30 00 3D 00 30
=ϕ1
=ϕ2
0 + 0 = 0 → 0 = 0
(MP, 1,2)
=ϕ3
FF 00 2B 00
00 30 00 30
30 21 30 00
00 92 00 3D
2B 00 3D 00
00 28 00 30
30 00 30 00
00 30 21 29
40 36 3 ϕ2 = ϕ1 · 1648 + 21920028 29 · 16 ) · 16 +
· 16 + (ϕ3 − FEFF ’→ (’
0 = 0
(MP, 1,3)
=ϕ4
Gödelisierung
Header
’)’
ϕ4 = FE FF 00 30 00 3D 00 30
12 12 ϕ3 = ϕ1 · 1616 + 2192 · 16 ) · 16 + (ϕ4 − FEFF ’→’
Header
Abbildung 4.5: Jede syntaktische Manipulation, die eine Beweiskette ϕ0 , . . . , ϕi z. B. durch die Anwendung einer Schlussregel verlängert, lässt sich als arithmetische Beziehung deuten, die zwischen den Gödelnummern ϕ0 , . . . , ϕi , ϕi+1 besteht.
I
Die Gödelnummern müssen berechenbar sein, d. h., es muss ein Verfahren existieren, mit dem wir die Zahl ϕ für jede Formel ϕ systematisch ermitteln können. Die UTF-16-Codierung erfüllt diese Forderung auf triviale Weise, schließlich können wir sie auf jedem PC direkt erzeugen.
I
Wir müssen für jede natürliche Zahl entscheiden können, ob sie eine Symbolkette codiert, die nach den Syntaxregeln unserer Kalkülsprache aufgebaut ist. Kurzum: Wir müssen für jede natürliche Zahl entscheiden können, ob sie eine Formel repräsentiert. Dies ist für UTF-16-codierte Zahlen ganz offensichtlich möglich.
205
4.2 Der erste Unvollständigkeitssatz
Auch wenn die UTF-16-Codierung alle Anforderungen erfüllt, ist sie für unsere Zwecke nur bedingt geeignet. Um den Grund hierfür zu verstehen, nehmen wir an, ϕ0 , . . . , ϕi+1 seien Formeln der PeanoArithmetik und ϕi+1 sei durch die Anwendung einer Schlussregel aus den vorangegangenen Formeln hervorgegangen. Auf der einen Seite besteht zwischen den Formeln ϕ0 , . . . , ϕi+1 eine syntaktische Beziehung, da die Anwendung einer Schlussregel einer symbolischen Manipulation der Zeichenketten gleich kommt. Auf der anderen Seite besteht zwischen den Gödelnummern ϕ0 , . . . , ϕi+1 eine arithmetische Beziehung. Abbildung 4.5 demonstriert das Gesagte am Beispiel eines Beweises, den wir in Abschnitt 3.1.3 geführt haben. Es ist der Beweis von Theorem PA1 mit der Instanziierung σ = 0. Verwenden wir zur Codierung das UTF-16-Format, so lassen sich die arithmetischen Beziehung zwischen den verschiedenen Gödelnummern nur umständlich beschreiben. Verwunderlich ist dies nicht, schließlich haben wir den Unicode für etwas verwendet, für das er nicht geschaffen wurde. Aus diesem Grund werden wir jetzt einen Ansatz verfolgen, der sich an den Darlegungen in [170] orientiert und aufgrund seines mathematischen Charakters für unsere Zwecke besser geeignet ist. Die Codierung ist jener in Gödels Originalarbeit sehr ähnlich. Die Übersetzung in natürliche Zahlen erfolgt schrittweise: I
I
Wie bei der UTF-16-Codierung ordnen wir jedem Symbol der Kalkülsprache eine natürliche Zahl zu, verwenden anstelle der Unicodes aber die Zahlenwerte aus Tabelle 4.1. Die Werte sind so gewählt, dass sämtlichen Logiksymbolen jeweils eine ungerade Zahl zugeordnet wird. Die geraden Zahlen sind für die Codierung von Variablen vorgesehen. Um eine einzelne Formel ϕ der Kalkülsprache zu codieren, schreiben wir die Zahlenwerte, anders als bei der UTF-16-Codierung, nicht einfach hintereinander auf. Stattdessen verwenden wir den Zahlenwert des i-ten Formelzeichens als Exponent der i-ten Primzahl und fassen alle Ausdrücke, wie in Abbildung 4.6 gezeigt, zu einem gemeinsamen Produkt zusammen. Bezeichnen wir den Zahlenwert des i-ten Formelzeichens mit ci und die i-te Primzahl mit πi , so können wir die Gödelnummer ϕ wie folgt notieren: ϕ := π1c1 · π2c2 · π3c3 · . . . Die Verwendung von Primzahlen ist an dieser Stelle essentiell. Da jede natürliche Zahl eindeutig durch ihre Primfaktoren beschrieben ist, werden zwei verschiedene Formeln immer auf verschiedene Gödelnummern abgebildet. Abbildung 4.7 fasst zusammen, wie sich
¬ $
∧ $
∨ $
→ $
↔ $
1
3
5
7
9
∀ $
∃ $
= $
( $
) $
11
13
15
17
19
0 $
s $
+ $
× $
21
23
25
27
x $
y $
z $
... $
2
4
6
...
Tabelle 4.1: Um die Syntax der PeanoArithmetik zu arithmetisieren, wird zunächst jedes Grundsymbol der Kalkülsprache in eine natürliche Zahl übersetzt.
0 21
+ 25
= 15
21 25 21 15 21 0 + 0 = 0 → 2 ∙ 3 ∙ 5 ∙ 7 ∙ 11
2
3
5
7
11
...
Primzahltabelle Abbildung 4.6: Um eine Formel zu gödelisieren, wird der Zahlenwert des i-ten Formelzeichens als Exponent der i-ten Primzahl verwendet. Anschließend werden alle Ausdrücke zu einem gemeinsamen Produkt zusammengefasst.
206
I
4 Beweistheorie
Gödelisierung von ϕ1
die vier Formeln aus dem Beweis von Theorem PA1 auf diese Weise gödelisieren lassen.
0 + 0 = 0 = 221 · 325 · 521 · 715 · 1121 = 2976791086050777886254142258705... 4735259615108039000000000000000... 000000
≈ 3 · 1067 I
Gödelisierung von ϕ2
I
Ein formaler Beweis ist nach Definition 2.1 eine Folge von Formeln und lässt sich nach dem gleichen Schema in eine natürliche Zahl übersetzen. Um eine Folge der Form ϕ1 , ϕ2 , ϕ3 , . . . zu codieren, verwenden wir die Gödelnummer der i-ten Formel als Exponent der i-ten Primzahl und fassen alle Ausdrücke erneut zu einem gemeinsamen Produkt zusammen:
0 + 0 = 0 → (0 + 0 = 0 → 0 = 0) = 221 · 325 · 521 · 715 · 1121 · 137 · 1717 · 1921 · 2325 · 2921 · 3115 · 3721 · 417 · 4321 · 4715 · 5321 · 5919 = 4254009852517873300162885099095... 2062912177152225723412983561076... 4204241788115952166723818682709... 1838340314531482866349985859639... 6267146087126501265378899938492... 1198219578838439107499451558520... 6839301168107657439662602002788... 1200381075268878821015628074667... 9122187572659828211350474489248... 5934282167896560823266182229402... 7587626403589167148247045777416... 0442969912665803065843000000000... 000000000000
≈ 4,2 · 10383 I
Gödelisierung von ϕ3 0 + 0 = 0 → 0 = 0 = 221 · 325 · 521 · 715 · 1121 · 137 · 1721 · 1915 · 2321 = 7733351355658080332438994260291... 6040167200248925434737188323592... 2061839580272843306988370847036... 4426273272154163855898916739004... 7767000000000000000000000
= ≈ 7,7 · 10148 I
Gödelisierung von ϕ4 0 = 0 = 221 · 315 · 521 = 14348907000000000000000000000 ≈ 1,4 · 1028
Abbildung 4.7: Gödelisierung der Beweisschritte von Theorem PA1
ϕ ϕ ϕ ϕ1 , ϕ2 , ϕ3 , . . . := π1 1 · π2 2 · π3 3 · . . . Für unseren Beispielbeweis erhalten wir mit 22
21 325 521 715 1121
32
·
21 325 521 715 1121 137 1717 1921 2325 2921 3115 3721 417 4321 4715 5321 5919
52
21 325 521 715 1121 137 1721 1915 2321
·
·
21 315 521
72
eine Zahl gigantischer Größe. Kein Buch der Welt hat genug Seiten, um ihrer Dezimalschreibweise auch nur annähernd Platz zu bieten. Wir sind deshalb gut beraten, die Zahl in ihrer faktorisierten Darstellung zu belassen. Auch wenn sich die beiden vorgestellten Codierungen deutlich voneinander unterscheiden, teilen sie einen gemeinsamen Makel: Beide bilden die Menge der Formeln zwar injektiv in die natürlichen Zahlen ab, aber nicht surjektiv. Das bedeutet, dass natürliche Zahlen existieren, die keine Gödelnummern sind. Für manche Betrachtungen ist es aber durchaus bequem, von einer Eins-zu-eins-Beziehung zwischen der Menge der Formeln und der Menge der natürlichen Zahlen auszugehen, und so stellt sich fast zwangsläufig die Frage, ob auch bijektive Gödelisierungen existieren. Die Antwort ist ein klares Ja, schließlich können wir alle syntaktisch korrekt aufgebauten Symbolsequenzen der Reihe nach aufzählen und der i-ten Formel ganz einfach die Gödelnummer i zuweisen. Praktisch ist diese Art der Gödelisierung nicht. Genau wie die UTF-16-Codierung hat sie den Nachteil, dass sich die syntaktischen Beziehungen, die durch die Axiome und Schlussregeln eines formalen Systems definiert werden, auf der arithmetischen Ebene nur umständlich beschreiben lassen.
207
4.2 Der erste Unvollständigkeitssatz
4.2.2
Primitiv-rekursive Funktionen
In diesem Abschnitt werden wir unser Augenmerk auf spezielle arithmetische Funktionen richten, die in Gödels Beweis eine zentrale Rolle spielen. In der Literatur werden sie treffend als primitiv-rekursive Funktionen bezeichnet, da sie rekursiv aus einer Reihe primitiver Elementarfunktionen gewonnen werden können. Was wir darunter genau zu verstehen haben, klärt die folgende Definition: Definition 4.1 (Primitiv-rekursive Funktionen) I
Die folgenden Funktionen sind primitiv-rekursiv:
• Die Nullfunktion z(n) := 0 • Die Nachfolgerfunktion s(n) := n + 1 • Die Projektion pni (x1 , . . . , xn ) := xi I
Sind g : Nk → N und h1 , . . . , hk : Nn → N primitiv-rekursiv, dann ist es auch f (x1 , . . . , xn ) mit
Die moderne Terminologie im Bereich der rekursiven Funktionen wurde erst nach dem Jahr 1931 geboren, und so findet sich der Begriff der primitiv-rekursiven Funktion an keiner Stelle in Gödels Originalarbeit wieder. Was wir heute als primitiv-rekursiv bezeichnen, nannte Gödel rekursiv. Die älteste bekannte Arbeit, die den Begriff der primitiven Rekursion verwendet, wurde von der ungarischen Mathematikerin Rózsa Péter (Abbildung 4.8) im Jahr 1934 publiziert [137], und der Begriff der primitiv-rekursiven Funktion taucht zum ersten Mal in einer Arbeit von Stephen Cole Kleene aus dem Jahr 1936 auf [102]. Trotzdem wird der Begriff der rekursiven Funktionen auch heute noch verwendet, allerdings meist als Abkürzung für die größere Klasse der sogenannten μrekursiven Funktionen, die alle berechenbaren Funktionen umfasst.
f (x1 , . . . , xn ) = g(h1 (x1 , . . . , xn ), . . . , hk (x1 , . . . , xn )) I
Sind g : Nn → N und h : Nn+2 → N primitiv-rekursiv, dann ist es auch f (m, x1 , . . . , xn ) mit f (0, x1 , . . . , xn ) = g(x1 , . . . , xn ), f (m + 1, x1 , . . . , xn ) = h( f (m, x1 , . . . , xn ), m, x1 , . . . , xn )
Die erste Regel legt die elementaren primitiven Funktionen fest; namentlich sind dies die Nullfunktion, die Nachfolgerfunktion und die Projektion. Die anderen Regeln geben an, wie sich aus bereits bekannten primitiv-rekursiven Funktionen weitere erschaffen lassen. Insgesamt haben wir es mit zwei verschiedenen Konstruktionsschemata zu tun: I
Komposition Die Kompositionsregel erlaubt uns, primitiv-rekursive Funktionen als Parameter in andere primitiv-rekursive Funktionen einzusetzen. Ist beispielsweise g(x1 , x2 , x3 ) primitiv-rekursiv, dann ist es auch die Funktion f (x1 , x2 ) := g(x2 , x1 , x1 ) = g(p22 (x1 , x2 ), p21 (x1 , x2 ), p21 (x1 , x2 ))
Rózsa Péter (1905 – 1977) Abbildung 4.8: Die ungarische Mathematikerin Rózsa Péter war eine der führenden Persönlichkeiten auf dem Gebiet der Rekursionstheorie. Zudem gelang es ihr als Verfasserin mehrerer populärwissenschaftlicher Bücher, ein Publikum weit über die Wissenschaftsgemeinde hinaus für sich zu begeistern [139, 140].
208
4 Beweistheorie
Primitiv-rekursive Funktionen gibt es in Hülle und Fülle! In der Tat ist es gar nicht so einfach, eine Funktion zu konstruieren, die sich systematisch berechnen lässt, aber nicht nach dem Schema der primitiven Rekursion aufgebaut ist. Im Jahr 1926 äußerte David Hilbert sogar die Vermutung, dass alle berechenbaren Funktionen primitiv-rekursiv seien [81]. Widerlegt wurde Hilberts Annahme noch im selben Jahr durch Wilhelm Ackermann. Ihm gelang es, eine Funktion zu konstruieren, die nicht primitivrekursiv ist, aber mithilfe verschachtelter Rekursionsaufrufe berechnet werden kann. Veröffentlicht hat Ackermann seine Funktion im Jahr 1928 [2]. 1935 wurde sie von Rózsa Péter vereinfacht und in die folgende bekannte Form gebracht [138]: A(0, n) := 2 · n + 1 A(m + 1,0) := A(m,1) A(m + 1, n + 1) := A(m, A(m + 1, n)) Auf den ersten Blick kommt die Funktion harmlos daher. Ihr geschickt gewähltes Rekursionsschema hat aber zur Folge, dass sie stärker wächst als jede primitivrekursive Funktion. Bereits A(4,2) entspricht einer Zahl mit ca. 20.000 Dezimalstellen, und für noch größere Werte von m und n können wir A(m, n) faktisch kaum noch ausrechnen. Zu Ehren Ackermanns wird diese Funktion als Ackermann-Funktion bezeichnet. Manche Autoren sind präziser und bezeichnen sie ihrer Herkunft entsprechend als Ackermann-Péter-Funktion.
Im Vorbeigehen demonstriert das Beispiel eine wertvolle Eigenschaft der Projektionsfunktion. Sie lässt sich gezielt einsetzen, um gewisse Variablen auszuwählen oder zu vertauschen. I
Primitive rekursion Hinter diesem Konstruktionsschema verbirgt sich der wahre Kern primitiv-rekursiver Funktionen. Ein gezielter Blick auf das Rekursionsschema zeigt, dass der Funktionswert f in einer Schleife berechnet wird, in der m die Rolle der Schleifenvariablen spielt. Ist m = 0, so wird der Funktionswert über die Funktion g bestimmt. Ist m > 0, so wird der Funktionswert ermittelt, indem die Funktion h auf den berechneten Funktionswert f (m − 1, x1 , . . . , xn ) sowie auf die Parameter m − 1 und x1 , . . . , xn angewendet wird.
Das Schema der primitiven Rekursion ist stark genug, um alle üblichen Arithmetikoperationen auszudrücken. Um z. B. die Addition, die Multiplikation und die Potenzierung von natürlichen Zahlen primitiv-rekursiv zu formulieren, gehen wir von der folgenden Darstellung aus: n falls m = 0 (4.2) add(m, n) = s(add(m − 1, n)) falls m > 0 mult(m, n) = pow(m, n) =
falls m = 0 falls m > 0
(4.3)
1 falls m = 0 mult(pow(m − 1, n), n) falls m > 0
(4.4)
0 add(mult(m − 1, n), n)
Durch den geschickten Einsatz der Projektionsfunktion können wir (4.2) bis (4.4) in die gesuchte Form bringen: add(0, n) = p11 (n), add(m + 1, n) = s(p31 (add(m, n), m, n)) mult(0, n) = 0, mult(m + 1, n) = add(p31 (mult(m, n), m, n), p33 (mult(m, n), m, n)) pow(0, n) = s(0), pow(m + 1, n) = mult(p31 (pow(m, n), m, n), p33 (pow(m, n), m, n)) Ohne Mühe können wir den Begriff der primitiv-rekursiven Funktion auch auf Relationen übertragen. Hierzu koppeln wir das Bestehen oder Nichtbestehen einer Relation ganz einfach an die Existenz einer entsprechenden charakteristischen Funktion:
4.2 Der erste Unvollständigkeitssatz
Definition 4.2 (Primitiv-rekursive Relationen) Eine Relation R zwischen den natürlichen Zahlen x1 , . . . , xn heißt primitiv-rekursiv, wenn eine primitiv-rekursive Funktion f mit der folgenden Eigenschaft existiert: R(x1 , . . . , xn ) ⇔ f (x1 , . . . , xn ) = 0 f nennen wir die charakteristische Funktion von R.
4.2.3
Arithmetische Repräsentierbarkeit
In diesem Abschnitt wollen wir die Peano-Arithmetik (PA) dazu verwenden, um über primitiv-rekursive Funktionen zu sprechen. Dass wir diverse Eigenschaften von Zahlen und Funktionen innerhalb von PA formalisieren können, wurde bereits mehrfach erwähnt. Aber wie war das genau gemeint? Wie können wir beispielsweise formal ausdrücken, dass eine natürliche Zahl x eine gerade Zahl ist? Die Peano-Arithmetik kennt neben der Nachfolgerfunktion, der Addition und der Multiplikation keine anderen Operationen; wie kann sie über etwas reden, das gar nicht in ihrem Sprachreservoir vorhanden ist? Die Lösung kommt erneut in Form des Extensionalitätsprinzips, das wir im Zusammenhang mit der Mengenlehre bereits kennen gelernt haben. Diesem Prinzip folgend, wird die Bedeutung eines Ausdrucks durch seinen Umfang – seine Extension – beschrieben, d. h. durch die Objekte, die er benennt oder beschreibt. In unserem Fall sind dies Mengen von natürlichen Zahlen. Damit ist klar, wie wir die Aussage „x ist eine gerade natürliche Zahl“ extensional erfassen können; sie wird eindeutig durch die Menge der geraden Zahlen beschrieben. Innerhalb der Peano-Arithmetik ist es ein Leichtes, die Menge der geraden Zahlen durch eine Formel ϕ(ξ ) mit einer freien Variablen ξ zu charakterisieren. Hierzu wählen wir ϕ(ξ ) derart, dass die Formeln ϕ(0), ϕ(2), ϕ(4), ϕ(6), ϕ(8), ϕ(10), . . . allesamt wahr und die Formeln ϕ(1), ϕ(3), ϕ(5), ϕ(7), ϕ(9), ϕ(11), . . .
209
210
Arithmetisch repräsentierbare Relationen I
„x ist eine gerade natürliche Zahl.“ ϕ(x) := (∃ z x = z × 2)
I
„x ist eine Quadratzahl.“ ϕ(x) := (∃ z x = z × z)
I
„x teilt y.“ ϕ(x, y) := (∃ z x × z = y)
I
„x ist größer oder gleich y.“ ϕ(x, y) := (∃ z x = y + z)
I
„x ist größer als y.“ ϕ(x, y) := (∃ z x = y + z + 1)
I
4 Beweistheorie
allesamt falsch sind. Eine Formel mit dieser Eigenschaft ist z. B. ϕ(x) = (∃ z x = z × 2) Die Grundidee ist damit vorgezeichnet, und bei genauerem Hinsehen wird klar, dass wir auf diese Weise nicht nur Eigenschaften von natürlichen Zahlen, d. h. einstellige Relationen, arithmetisch repräsentieren können, sondern auch beliebige Beziehungen, die zwischen zwei oder mehreren natürlichen Zahlen bestehen (Abbildung 4.9). Hierzu müssen wir unsere Vorgehensweise lediglich auf mehrstellige Relationen erweitern. Die folgende Definition bringt Klarheit: Definition 4.3 (Semantisch repräsentierbare Relationen) Sei R ⊆ Nn eine Relation und ϕ eine Formel mit n freien Variablen. R wird durch ϕ semantisch repräsentiert, wenn gilt: (x1 , . . . , xn ) ∈ R ⇒ |= ϕ(x1 , . . . , xn ) (x1 , . . . , xn ) ∈ R ⇒ |= ¬ϕ(x1 , . . . , xn )
„x ist eine Primzahl.“ ϕ(x) := (¬(x = 1) ∧ ∀ z (z | x → (z = 1 ∨ z = x)))
I
„x und y sind Primzahlzwillinge.“ ϕ(x, y) := (¬(x = 1) ∧ ¬(y = 1) ∧ ∀ z (z | x → (z = 1 ∨ z = x)) ∧ ∀ z (z | y → (z = 1 ∨ z = y)) ∧ y = x + 2)
Abbildung 4.9: Eine kleine Auswahl arithmetisch repräsentierbarer Relationen
Auch Funktionen lassen sich arithmetisch repräsentieren. Hierzu nutzen wir aus, dass sich jede n-stellige Funktion als Relation mit der Stelligkeit n + 1 auffassen lässt. Definition 4.4 (Semantisch repräsentierbare Funktionen) Sei f : Nn → N eine Funktion und ϕ eine Formel mit n + 1 freien Variablen. f wird durch ϕ semantisch repräsentiert, wenn gilt: f (x1 , . . . , xn ) = y ⇒ |= ϕ(x1 , . . . , xn , y) f (x1 , . . . , xn ) = y ⇒ |= ¬ϕ(x1 , . . . , xn , y)
Um die Definition mit Leben zu füllen, wollen wir erarbeiten, wie sich die Funktion pow(x, y) aus Abschnitt 4.2.2 arithmetisch repräsentieren lässt. Als erstes probieren wir, eine Formel mit einer freien Variablen z zu konstruieren, die nach dem folgenden Schema aufgebaut ist: ∃ u0 . . . ∃ uy (ψ0 (x, u0 ) ∧ . . . ∧ ψy (x, uy ) ∧ z = uy )
(4.5)
Für jede natürliche Zahl i mit 0 ≤ i ≤ y enthält diese Formel eine gebundene Variable ui und eine Teilformel ψi . Wählen wir ψi so, dass ψi (x, ui ) genau für ui = xi wahr ist, so entspricht der gesuchte Funktionswert z
211
4.2 Der erste Unvollständigkeitssatz
dem Inhalt der Variablen uy . Die Konstruktion der Teilformeln ψi bereitet uns dabei keinerlei Schwierigkeit; wir können ihren Wortlaut direkt aus dem primitiven Rekursionsschema der Exponentialfunktion extrahieren: ψ0 (x, u0 ) := (u0 = 1) ψi + 1 (x, ui + 1 ) := (∀ w (ψi (x, w) → ui + 1 = w × x)) Ein schwerwiegendes Problem bleibt allerdings bestehen: Da wir eine variable Anzahl an Quantoren verwendet haben und die freie Variable y zusätzlich im Index der Variablen uy auftaucht, ist (4.5) keine Formel der Peano-Arithmetik. Gelöst ist unser Problem erst dann, wenn wir es schaffen, sie in eine echte arithmetische Formel zu übersetzen. Um dieses Ziel zu erreichen, verfolgen wir die gleiche Grundidee, mit der wir die Mengen N und Nn in Kapitel 1 als gleichmächtig identifiziert haben. Dort haben wir gezeigt, dass sich endliche Folgen natürlicher Zahlen eineindeutig in eine natürliche Zahl hineincodieren lassen, und genau das werden wir auch mit unserer Zahlenfolge x0 , . . . , xy versuchen. Hierzu nehmen wir an, uns stehe eine Funktion α : N2 → N zur Verfügung, so dass für jede endliche Sequenz a0 , . . . , ay eine Zahl b mit α(b,0) = a0 , α(b,1) = a1 , . . . , α(b, y) = ay existiert. Wenn es uns jetzt noch gelänge, die Funktion α mit einer Formel ϕα arithmetisch zu repräsentieren, dann ließe sich Formel (4.5) folgendermaßen umschreiben: ∃ u (ϕα (u,0, 1) ∧ ∀ v ∀ w (v < y ∧ ϕα (u, v, w) → ϕα (u, v + 1, w × x)) ∧ (4.6) ϕα (u, y, z)) Abbildung 4.10 veranschaulicht die Bedeutung der einzelnen Formelbestandteile. Der Lösung unseres Problems sind wir schon sehr nahe. Die Anzahl der in (4.6) verwendeten Quantoren ist nun konstant, und die Variable y kommt nicht mehr als Index einer anderen Variablen vor. Am Ziel sind wir aber erst, wenn wir eine reale Funktion mit der Eigenschaft von α finden. Es ist Gödel zu verdanken, dass wir eine solche Funktion heute unser Eigen nennen dürfen. Im Gegensatz zu unserer fiktiven Funktion α mit zwei Variablen führte er eine Funktion β mit drei Variablen ein: β (x, y, z) := x mod (1 + y · (z + 1))
I ϕα (u,0, 1)
„An Position 0 von u steht der Wert 1.“ u=
...
1
I ∀ v ∀ w (v < y ∧ ϕα (u, v, w) →
ϕα (u, v + 1, w × x))
„Steht an Position v der Wert w, so steht an Position v + 1 der Wert w · x.“ u=
1
x
x2
...
xy
I ϕα (u, y, z)
„z ist der Wert an Position y.“ u=
1
x
x2
...
z y
Abbildung 4.10: Gäbe es eine Funktion mit den Eigenschaften von ϕα , so wären wir in der Lage, die Exponentialfunktion z = xy arithmetisch zu repräsentieren.
212
4 Beweistheorie
Das Sun Zi suanjing zählt zu den wichtigsten chinesischen Frühwerken der Mathematik. Niedergeschrieben wurde es von dem Rechenmeister Sun Zi in der ersten Hälfte des ersten Jahrhunderts, wahrscheinlich in den Jahren zwischen 280 und 473 n. Chr. [186]. Die bekannteste Stelle des Sun Zi suanjing befindet sich im dritten und letzten Kapitel [199]. Dort, in Aufgabe 26, fordert der Meister zur Lösung des folgenden Rätsels auf: „Es sei nun eine unbekannte Anzahl von Dingen gegeben. Wenn wir sie zu je drei zählen, bleibt der Rest zwei übrig. Wenn wir sie zu je fünf zählen, bleibt der Rest drei übrig. Wenn wir sie zu je sieben zählen, bleibt der Rest zwei übrig. Finde die Anzahl der Dinge heraus.“
Der folgende Satz zeigt, dass diese Funktion unseren Zweck erfüllt: Satz 4.3 Für jede endliche Zahlenfolge a0 , . . . , an existieren b und c mit ai = β (b, c, i) = b mod (1 + c · (i + 1)) Beweis: Wir beweisen den Satz in zwei Schritten: I
(1 + c · (i + 1)) für c = n! paarweise teilerfremd sind. Der Beweis lässt sich mit elementaren zahlentheoretischen Argumenten führen. Gäbe es eine Primzahl p, die sowohl (1 + c · (i + 1)) als auch (1 + c · (i + k + 1)) (1 ≤ k ≤ n)
In moderner Sprechweise ist dies die Aufforderung, das folgende System linearer Kongruenzen zu lösen: x≡2
mod 3
x≡3
mod 5
x≡2
mod 7
Wir nennen ein solches System auch eine simultane Kongruenz. Heute kennen wir eine Reihe von Sätzen, die Aussagen darüber treffen, wann solche Kongruenzen lösbar sind. Ihrer Herkunft entsprechend werden diese Sätze als Chinesische Restsätze bezeichnet. Die Variante, die im Beweis von Satz 4.3 verwendet wird, besagt das Folgende: Sind m0 , . . . , mn natürliche, paarweise teilerfremde Zahlen und a0 , . . . , an beliebige ganze Zahlen, so besitzt die simultane Kongruenz x ≡ a0
teilt, so wäre p auch ein Teiler der Differenz (1 + c · (i + k + 1)) − (1 + c · (i + 1)) = 1+c·i+c·k +c−1−c·i−c = c·k Das würde bedeuten, dass p mindestens eine der Zahlen c oder k teilt. Beide Annahmen werden wir jetzt zu einem Widerspruch führen:
• Angenommen, es gelte p|c. Dann ist p auch ein Teiler von c · (i + •
I
1), im Widerspruch zu unserer Annahme, dass p den Wert 1 + c · (i + 1) teilt. Angenommen, es gelte p|k. Wegen k ≤ n und c = n! ist k ein Teiler von c, und damit gilt auch p|c. Wir haben aber gerade gezeigt, dass dies nicht sein kann.
Da die Ausdrücke (1+c · (i+1)) paarweise teilerfremd sind, können wir den Chinesischen Restsatz anwenden. Dieser garantiert uns, dass die simultane Kongruenz
mod m0
x ≡ a0
mod mn
x ≡ a1 ...
... x ≡ an
Zunächst zeigen wir, dass die Ausdrücke
genau eine Lösung modulo m0 · . . . · mn .
x ≡ an
mod (1 + c · 1) mod (1 + c · 2) mod (1 + c · (n + 1))
213
4.2 Der erste Unvollständigkeitssatz
∃ b ∃ c (∃ d b = s(c × s(0)) × d + 1 ∧ 1 < s(c × s(0)) ∧ ∀ v ∀ w (v < y ∧ ∃ d b = s(c × s(v)) × d + w ∧ w < s(c × s(v)) → ∃ d b = s(c × s(v + 1)) × d + (w × x) ∧ (w × x) < s(c × s(v + 1))) ∧ ∃ d b = s(c × s(y)) × d + z ∧ z < s(c × s(y))) Auch wenn diese Formel von außen betrachtet wie eine wahllose Ansammlung arithmetischer Ausdrücke wirkt, lässt sie ihr streng konstruktiver Aufbau in einem hellen Licht erstrahlen. In ihrem Inneren verbirgt sie mit der Gödel’schen β -Funktion ein mathematisches Juwel. Können wir auf die gleiche Weise auch andere Funktionen arithmetisch repräsentieren? Die Antwort lautet Ja! Die Gödel’sche β -Funktion ist von so allgemeiner Natur, dass wir nach dem gleichen Schema beliebige primitiv-rekursive Funktionen oder Relationen arithmetisch repräsentieren können. Tatsächlich lässt sich durch eine Verallgemeinerung der oben gezeigten Formelkonstruktion der folgende Satz beweisen:
7
β (b, c,1)
β (b, c,2)
β (b, c,3)
β (b, c,4)
...
I a0 = 1, a1 = 2, a2 = 4
Für b = 3079 und c = 8 gilt: 3079 mod (1 + 8 · 1) = 1 3079 mod (1 + 8 · 2) = 2 3079 mod (1 + 8 · 3) = 4 3079 mod (1 + 8 · 4) = 10 3079 mod (1 + 8 · 5) = 4 1
2
4
10
4
...
β (b, c,4)
Ersetzen wir die Funktion ϕβ jetzt noch durch ihre Definition, so erhalten wir
7
I a0 = 1, a1 = 2, a2 = 4, a3 = 8
Für b = 115771826 und c = 64 gilt: 115771826 mod (1 + 64 · 1) = 1 115771826 mod (1 + 64 · 2) = 2 115771826 mod (1 + 64 · 3) = 4 115771826 mod (1 + 64 · 4) = 8 115771826 mod (1 + 64 · 5) = 287 1
2
4
8
287 β (b, c,4)
ϕβ (b, c, y, z))
0
β (b, c,3)
∀ v ∀ w (v < y ∧ ϕβ (b, c, v, w) → ϕβ (b, c, v + 1, w × x)) ∧
2
β (b, c,3)
∃ b ∃ c (ϕβ (b, c,0, 1) ∧
1
β (b, c,2)
Damit sind wir am Ziel und können die Exponentialfunktion folgendermaßen repräsentieren:
7 mod (1 + 2 · 5) = 7
β (b, c,2)
ϕβ (x, y, z, w) := ∃ d x = s(y × s(z)) × d + w ∧ w < s(y × s(z)) (4.7)
7 mod (1 + 2 · 4) = 7
β (b, c,1)
Natürlich existiert eine ganze Schar von Funktionen, um Sequenzen von natürlichen Zahlen in eine einzige Zahl hineinzucodieren. Wir dürfen in diesem Zusammenhang aber nicht vergessen, dass wir die Funktion arithmetisch repräsentieren müssen, und genau dies ist bei Gödels β Funktion problemlos möglich:
7 mod (1 + 2 · 3) = 0
β (b, c,1)
Abbildung 4.11 demonstriert, wie sich mithilfe der Gödel’schen β Funktion die Anfangsstücke der Folge aller Zweierpotenzen repräsentieren lassen.
7 mod (1 + 2 · 2) = 2
β (b, c,0)
was zu beweisen war.
Für b = 7 und c = 2 gilt: 7 mod (1 + 2 · 1) = 1
β (b, c,0)
ai = b mod (1 + c · (i + 1))
I a0 = 1, a1 = 2
β (b, c,0)
eine Lösung besitzt. Bezeichnen wir diese Lösung mit b, so gilt für alle ai die Beziehung
...
Abbildung 4.11: Codierung von Zahlenfolgen mit der Gödel’schen β -Funktion
214
4 Beweistheorie
Satz 4.4 Jede primitiv-rekursive Relation R(x1 , . . . , xn ) ist innerhalb der Peano-Arithmetik semantisch repräsentierbar. Bisher wurde durchgängig von einer semantischen Repräsentation gesprochen. Dies ist gerechtfertigt, da wir zwischen wahren und falschen Formeln unterschieden haben. Wir wollen unser Begriffsgerüst jetzt um eine zweite Art der arithmetischen Repräsentierbarkeit ergänzen, die den Begriff der Wahrheit durch den Begriff der Beweisbarkeit ersetzt. Da Beweise in formalen Systemen vollständig auf der syntaktischen Ebene geführt werden, reden wir in diesem Zusammenhang von einer syntaktischen Repräsentation. Definition 4.5 (Syntaktisch repräsentierbare Relationen) Sei R ⊆ Nn eine Relation und ϕ eine Formel mit n freien Variablen. R wird durch ϕ syntaktisch repräsentiert, wenn gilt: (x1 , . . . , xn ) ∈ R ⇒ ϕ(x1 , . . . , xn ) (x1 , . . . , xn ) ∈ R ⇒ ¬ϕ(x1 , . . . , xn ) Auch der Begriff der arithmetischen Repräsentierbarkeit ist von der babylonischen Sprachverwirrung betroffen, mit der wir im Bereich der mathematischen Logik an vielen Stellen leben müssen. Insbesondere in der angelsächsischen Literatur werden hierfür eine Vielzahl unterschiedlicher Begriffe verwendet. Beispielsweise werden syntaktisch repräsentierbare Relationen in Elliott Mendelsons Standardwerk als expressable und syntaktisch repräsentierbare Funktionen als representable bezeichnet [117]. Peter Smith verwendet den Begriff expressable in seinem Buch über die Gödel’schen Unvollständigkeitssätze dagegen als Synonym für die semantische Repräsentierbarkeit, unabhängig davon, ob damit Funktionen oder Relationen gemeint sind [170]. Syntaktisch repräsentierbare Funktionen und Relationen bezeichnet Smith als capturable.
Alle Relationen und Funktionen aus Abbildung 4.9 werden durch die angegebenen Formeln nicht nur semantisch, sondern auch syntaktisch repräsentiert. Den Beweis hierfür wollen wir nicht führen, da er mit erheblichem Aufwand verbunden ist. Für alle natürlichen Zahlen müssten wir zeigen, dass die entsprechenden Formelinstanzen von ϕ im formalen System der Peano-Arithmetik ableitbar bzw. nicht ableitbar sind. Gödel zeigte, dass die Aussage von Satz 4.4 auch auf der syntaktischen Ebene gilt. Genau dies ist die Aussage seines berühmten Satzes V, den wir in Abbildung 4.1 im Originalwortlaut zitiert hatten. In modernerer Formulierung liest er sich wie folgt: Satz 4.5 (Gödel, 1931) Jede primitiv-rekursive Relation R(x1 , . . . , xn ) ist innerhalb der Peano-Arithmetik syntaktisch repräsentierbar. Dieser Satz ist ein wichtiges Etappenziel auf dem Weg zu den Unvollständigkeitsresultaten. Sein Beweis ist sehr technisch, und selbst Gödel hat ihn in seiner Arbeit nur skizzenhaft angedeutet. Ausführlich ausgearbeitet ist er beispielsweise in [170].
4.2 Der erste Unvollständigkeitssatz
4.2.4
Gödels Diagonalargument
Bevor wir die Bühne zum großen Finale des Gödel’schen Beweises freigeben, wollen wir die bis jetzt erarbeiteten Ergebnisse kurz zusammenfassen: I
In Abschnitt 4.2.1 haben wir gezeigt, wie sich die Syntax einer formalen Sprache arithmetisieren lässt. Indem wir jeder Formel ϕ eine Gödelnummer ϕ zugeordnet haben, konnten wir die Manipulation von Zeichenketten auf der arithmetischen Ebene deuten.
I
In Abschnitt 4.2.2 haben wir den Begriff der primitiv-rekursiven Funktion eingeführt und anschließend auf numerische Relationen übertragen. Ohne uns in Details zu verlieren, haben wir angedeutet, dass sich viele im mathematischen Alltag angetroffene Funktionen primitiv-rekursiv formulieren lassen.
I
In Abschnitt 4.2.3 haben wir den Begriff der arithmetischen Repräsentierbarkeit eingeführt. Am Ende stand die Erkenntnis, dass wir die Gödel’sche β -Funktion dazu verwenden können, um jede primitiv-rekursive Relation innerhalb der Peano-Arithmetik syntaktisch zu repräsentieren.
Betrachten wir die gewonnenen Ergebnisse isoliert voneinander, so wirken sie wie gewöhnliche mathematische Aussagen. Jede Einzelne beleuchtet einen interessanten Aspekt der mathematischen Logik, aber keine von ihnen scheint das Potenzial zu besitzen, die Mathematik in ihren Grundfesten zu gefährden. Eine wahrhaft zerstörerische Wirkung entfalten sie jedoch dann, wenn wir sie in geeigneter Weise miteinander kombinieren. Wie die einzelnen Puzzle-Stücke zusammenpassen, hat Gödel in akribischer Präzision ausgearbeitet, und so liest sich seine Arbeit aus dem Jahr 1931 stellenweise wie der Bauplan eines mathematischen Sprengsatzes. Die explosive Wirkung seiner Arbeit ist bekannt. Mit dem Beweis der Unvollständigkeitssätze hat Gödel die lange gehegte Hoffnung auf die vollständige Formalisierung der Mathematik mit einem Handstreich in Schutt und Asche gelegt. Auf den folgenden Seiten werden wir die Gödel’sche Konstruktion in ihren Grundzügen nachvollziehen. Eine wesentliche Rolle spielen dabei diejenigen arithmetischen Formeln, die in Gödels Originalarbeit Klassenzeichen heißen. Mit diesem Begriff sind die Formeln der Form ϕ(ξ ) gemeint, also diejenigen Formeln, die genau eine freie Variable besitzen.
215
216
Tabelle 4.2: Abgebildet ist ein Ausschnitt einer unendlich großen Tabelle, die alle arithmetischen Formeln mit einer einzigen freien Variablen enthält. Die Tabelle ist so aufgebaut, dass die Formel mit der Gödelnummer i in der i-ten Zeile steht und alle Zeilen leer gelassen sind, deren Zeilennummer nicht die Gödelnummer eine Formel mit einer freien Variablen ist. Die Tabelle enthält unendlich viele Spalten, von denen jede einzelne mit einer natürlichen Zahl n markiert ist. Ist die Formel ϕi (n) innerhalb der PeanoArithmetik beweisbar, so enthält die i-te Zeile in der n-ten Spalte den Eintrag . Ist sie es nicht, so ist das entsprechende Feld mit markiert. In seiner Arbeit aus dem Jahr 1931 hat Gödel dargelegt, dass sich auf der Hauptdiagonalen ein unentscheidbarer Satz befinden muss. Hierzu konstruierte er eine natürliche Zahl g, für die er anschließend zeigte, dass weder ϕg (g) noch ¬ϕg (g) innerhalb der PeanoArithmetik beweisbar sein kann.
4 Beweistheorie
0
1
2
3
4
5
6
7
8
g ...
... ϕ1 (ξ )
...
...
...
...
...
...
ϕ4 (ξ )
...
...
ϕ5 (ξ )
...
...
ϕ6 (ξ )
...
...
... ϕ8 (ξ )
ϕg (ξ )
¬ϕg (ξ )
.. .
.. .
.. .
.. .
.. .
.. .
.. .
.. .
.. .
...
.. .
.. .
.. .
.. .
.. .
.. .
.. .
.. .
.. .
...
...
..
.
... .. .
...
.. .
...
...
..
.
Für das Verständnis der folgenden Überlegungen ist es hilfreich, sich diese Formeln als Zeileneinträge einer unendlich großen Tabelle vorzustellen (vgl. Tabelle 4.2). Innerhalb der Tabelle sind die Formeln so angeordnet, dass in der i-ten Zeile die Formel mit der Gödelnummer i erscheint. Die Formel in Zeile i bezeichnen wir im Folgenden mit ϕi (ξ ). Beachten Sie, dass nicht jede natürliche Zahl eine Gödelnummer ist und auch nicht jede Gödelnummer eine Formel beschreibt, die, wie hier gefordert, genau eine freie Variable besitzt. Deswegen sind in der Tabelle mehrere Zeilen vorhanden, die keine Einträge besitzen. Nun sind wir nicht an offenen, sondern an geschlossenen Formeln interessiert. Diese können wir erhalten, indem wir in der Formel ϕi (ξ ) die freie Variable durch einen arithmetischen Term der Form n ersetzen. Auf diese Weise entsteht für jede Zahl n ∈ N eine geschlossene Formel ϕi (n). Einige dieser Formeln sind innerhalb der Peano-Arithmetik beweisbar ( ϕ(n)), andere sind es nicht ( ϕ(n)). Um die Beweisbarkeitseigenschaft in unserer Tabelle sichtbar zu machen, existiert für jede natürliche Zahl n ∈ N eine separate Spalte. Steht in der i-ten Zeile und n-ten Spalte unserer Tabelle das Zeichen , so ist die Formel ϕi (n) beweisbar. Andernfalls ist das Feld mit dem Symbol markiert.
217
4.2 Der erste Unvollständigkeitssatz
In seinem Beweis machte sich Gödel eine trickreiche Argumentation zu eigen, die dem Cantor’schen Diagonalargument aus Abschnitt 1.2.2 sehr ähnlich ist. Es gelang ihm zu zeigen, dass sich auf der Hauptdiagonalen unserer Tabelle mindestens eine Formel befinden muss, die innerhalb der Peano-Arithmetik unentscheidbar ist. Konkret bedeutet dieses Ergebnis, dass eine natürliche Zahl g ∈ N existiert, für die weder ϕg (g) noch ¬ϕg (g) beweisbar ist. Wir werden nun herausarbeiten, wie sich der Wert von g berechnen lässt. Hierzu betrachten wir zunächst die Relation Gdl(x, y), die eine Beziehung zwischen zwei natürlichen Zahlen x und y herstellt: Gdl(x, y) :⇔ x ist die Gödelnummer eines Beweises von ϕy (y) Was sagt diese Relation genau aus? Zunächst halten wir fest, dass x und y natürliche Zahlen sind und wir x als die Gödelnummer eines Beweises und y als die Gödelnummer einer arithmetischen Formel interpretieren. Die Formel ϕy (y) ist das y-te Diagonalelement in unserer Tabelle. Per Definition stehen x und y genau dann in Relation zueinander, wenn x einen Beweis für die Formel ϕy (y) codiert. Anders gesagt: x codiert eine Sequenz von Formeln, die das Diagonalelement ϕy (y) in endlich vielen Schritten aus den Axiomen der Peano-Arithmetik ableitet. In seiner Originalarbeit hat Gödel bewiesen, dass Gdl(x, y) eine primitiv-rekursive Relation ist. Das bedeutet, dass eine primitiv-rekursive Funktion fGdl (x, y) existiert, die genau dann den Wert 0 berechnet, wenn x die Gödelnummer eines Beweises für die Diagonalaussage ϕy (y) ist. Nach Satz 4.5 ist die Relation Gdl(x, y) innerhalb der Peano-Arithmetik syntaktisch repräsentierbar; somit existiert eine Formel ψGdl (ξ , ζ ) mit der folgenden Eigenschaft: ψGdl (x, y) ⇔ x codiert einen Beweis für die Formel ϕy (y) ¬ψGdl (x, y) ⇔ x codiert keinen Beweis für die Formel ϕy (y) Aus ψGdl (ξ , ζ ) konstruieren wir nun die Formel ϕg (y) := ∀ x ¬ψGdl (x, y)
(4.8)
Das Ergebnis ist eine arithmetische Formel mit genau einer freien Variablen. Sie kommt in der g-ten Zeile unserer Tabelle vor und ist jene Formel, nach der wir gesucht haben. Sie besitzt die faszinierende Eigenschaft, dass ihre diagonalisierte Aussage ϕg (g) innerhalb von PA unentscheidbar ist, d. h., weder ϕg (g) noch ¬ϕg (g) lassen sich aus den Axiomen der Peano-Arithmetik herleiten. Warum dies so ist, werden wir jetzt begründen:
Dass wir mit Gdl(x, y) eine primitiv-rekursive Relation vor uns haben, ist keinesfalls selbstverständlich. Tatsächlich erstreckt sich der Beweis in Gödels Arbeit über sechs eng beschriebene Seiten. Gödel erzielte sein Resultat, indem er insgesamt 46 primitiv-rekursive Funktionen und Relationen definierte, die aufeinander aufbauen und immer komplexer werdende Sachverhalte ausdrücken. Aus heutiger Sicht wirken diese Funktionen und Relationen wie die Hilfsroutinen eines Programms, das für zwei Eingabewerte x und y entscheidet, ob x einen Beweis für das Diagonalelement ϕy (y) codiert. Der Vergleich ist durchaus angebracht. Heute wissen wir, dass jede Funktion, die von einem Programm ohne die Verwendung von While-Schleifen berechnet werden kann, primitiv-rekursiv ist und sich jede primitiv-rekursive Funktion in ein ebensolches Programm übersetzten lässt [89]. Auch wenn die Notation den Blick darauf versperrt, verbirgt sich im Beweis des ersten Unvollständigkeitssatzes eines der ersten Computerprogramme des zwanzigsten Jahrhunderts. Gödel konnte dies damals freilich noch nicht wissen. Im Jahr 1931 waren programmierbare Computer, wie wir sie heute kennen, noch in weiter Ferne.
218
4 Beweistheorie
Weiter oben haben wir herausgestellt, dass Gödels Beweis im Kern auf der Konstruktion einer Aussage beruht, die ihre eigene Unbeweisbarkeit postuliert. Ohne explizit darauf hinzuweisen, haben wir diese Formel mit ϕg (g) bereits konstruiert. Warum dies so ist, lässt sich leicht einsehen. Zunächst ist ϕg (g) das Diagonalelement von
I
Wäre ϕg (g) beweisbar, so müsste eine Gödelnummer m existieren, die den Beweis dieser Formel codiert. ϕg (g) ist das Diagonalelement der Formel ϕg (ξ ), und somit gilt Gdl(m, g). Da ψGdl die Relation Gdl syntaktisch repräsentiert, folgt daraus ψGdl (m, g)
¬ψGdl (m, g)
Jede konkrete Instanz ϕg (y) besagt, dass kein x die Gödelnummer eines Beweises für das Diagonalelement ϕy (y) ist:
einen unmittelbaren Widerspruch zu (4.9). Die Formel ϕg (g) kann nur dann beweisbar sein, wenn die Peano-Arithmetik widersprüchlich ist. In diesem Fall könnten wir jede beliebige arithmetische Formel aus den Axiomen ableiten.
„ϕy (y) ist nicht beweisbar.“ ϕg (y) =
ϕg (g) =
„ϕg (g) ist nicht beweisbar.“ Oder, was gleichbedeutend ist:
„Ich bin nicht beweisbar.“ ϕg (g) = Nicht selten wird Gödels Beweis dahingehend missverstanden, dass er auf der semantischen Bedeutung von ϕg (g) beruht. Einige Kritiker sehen in der Konstruktion von ϕg (g) sogar einen irregulären Selbstbezug, der Parallelen zur Russell’schen Antinomie aufweist und die Legitimität des Beweises in Frage stellt. Wenn Sie die Ausführungen auf diesen Seiten nochmals durchgehen, werden Sie jedoch schnell bemerken, dass wir die Formel ϕg (g) gar nicht inhaltlich gedeutet haben. Dass weder ϕg (g) noch ¬ϕg (g) beweisbar sein kann, sofern die Peano-Arithmetik frei von Widersprüchen ist, haben wir rein auf der syntaktischen Ebene gezeigt. Dennoch hilft die semantische Interpretation von ϕg (g) dabei, den Gödel’schen Beweis zu verstehen. Sie gibt einen Hinweis darauf, warum in jedem hinreichend ausdrucksstarken formalen System unentscheidbare Sätze existieren müssen.
(4.9)
Die Annahme ϕg (g) lautet ausgeschrieben ∀ x ¬ψGdl (x, g). Instanziieren wir die Variable x mit m, so erhalten wir mit
ϕg (y) = ∀ x ¬ψGdl (x, y)
Dann trägt die Formel ϕg (g) aber die folgende inhaltliche Aussage in sich:
Angenommen, es gelte ϕg (g).
I
Angenommen, es gelte ¬ϕg (g). Die Annahme lautet ausgeschrieben ¬∀ x ¬ψGdl (x, g), und daraus folgt ∃ x ψGdl (x, g)
(4.10)
Ist die Peano-Arithmetik widerspruchsfrei, so ist nicht gleichzeitig die Formel ϕg (g) beweisbar. Das bedeutet, dass keine natürliche Zahl die Gödelnummer eines Beweises für ϕg (g) sein kann. Es gilt also (0, g) ∈ Gdl, (1, g) ∈ Gdl, (2, g) ∈ Gdl, (3, g) ∈ Gdl, . . . Da ψGdl die Relation Gdl syntaktisch repräsentiert, können wir die folgenden Schlüsse ziehen: ¬ψGdl (0, g)
(4.11)
¬ψGdl (1, g)
(4.12)
¬ψGdl (2, g)
(4.13)
... Damit haben wir uns in eine prekäre Situation manövriert. Wäre ¬ϕg (g) innerhalb der Peano-Arithmetik beweisbar, so wäre es auch die Formel (4.10). Diese besagt, dass innerhalb der Menge der natürlichen Zahlen eine Zahl x existieren muss, für die ψGdl (x, g) wahr ist. Auf der anderen Seite scheinen die Formeln (4.11), (4.12), (4.13) usw. genau dies zu widerlegen. Für jede beliebige natürliche Zahl x können wir die Formel ¬ψGdl (x, g) beweisen. Offensichtlich ist es uns gelungen, einen Widerspruch zu erzeugen. Oder etwa nicht?
4.2 Der erste Unvollständigkeitssatz
Über den augenscheinlich entstandenen Widerspruch dürfen wir nicht allzu schnell hinweggehen. Wir haben ihn erhalten, weil wir die bewiesenen Formeln semantisch interpretiert haben. Hätten wir die Korrektheit der Peano-Arithmetik vorausgesetzt, hätten wir also angenommen, dass sich nur wahre arithmetische Aussagen aus den Axiomen ableiten lassen, so wären wir tatsächlich am Ziel. Ganz offensichtlich können die Formeln (4.10), (4.11), (4.12), (4.13), ... nicht gleichzeitig wahr sein. In der syntaktischen Variante des ersten Gödel’schen Unvollständigkeitssatzes ist aber lediglich die Widerspruchsfreiheit der PeanoArithmetik gefordert. Um hiergegen einen Einwand zu erheben, müssen wir für eine gewisse Formel ϕ zeigen, dass sowohl ϕ als auch ¬ϕ beweisbar sind. Dies ist uns mit den Formeln (4.10), (4.11), (4.12), (4.13), ... aber nicht gelungen. Auch wenn sie nicht gleichzeitig wahr sein können, erzeugen sie auf der syntaktischen Ebene keinen Widerspruch. Gödel sah sich mit genau diesem Problem konfrontiert und konnte es nur lösen, indem er nicht die Widerspruchsfreiheit, sondern die ω-Widerspruchsfreiheit zur Voraussetzung des ersten Unvollständigkeitssatzes erhob. Was wir unter diesem Begriff genau zu verstehen haben, klärt die folgende Definition: Definition 4.6 (ω-Widerspruchsfreiheit) Ein formales System (Kalkül) heißt ω-widerspruchsfrei, wenn I
es widerspruchsfrei ist und die folgende Eigenschaft erfüllt:
I
Gilt ¬ϕ(n) für alle n ∈ N, so folgt daraus ∃ x ϕ(x).
Die ω-Widerspruchsfreiheit ist eine stärkere Eigenschaft als die Widerspruchsfreiheit. Ganz offensichtlich ist jedes ω-widerspruchsfreie formale System auch widerspruchsfrei, nicht aber umgekehrt. Mit dem neuen Begriff sind wir in der Lage, jene Variante des ersten Unvollständigkeitssatzes zu formulieren, die Gödel in seiner Originalarbeit bewiesen hat. In moderner Sprechweise lautet sie wie folgt: Satz 4.6 (Gödel, 1931) Jedes ω-widerspruchsfreie formale System, das stark genug ist, um die Peano-Arithmetik zu formalisieren, ist negationsunvollständig. Mit diesem Ergebnis hat unsere Reise auf Gödels historischem Pfad ein erfolgreiches Ende gefunden. Zumindest für den Moment.
219
220
Um die Konstruktion der Rosser’schen Formel ϕr zu verstehen, wollen wir zunächst die inhaltliche Bedeutung der Gödel’schen Formel ϕg rekapitulieren. Weiter oben haben wir herausgearbeitet, dass jede konkrete Instanz ϕg (y) für die Aussage „ϕy (y) ist nicht beweisbar“ steht und das Diagonalelement ϕg (g) damit der folgenden Aussage entspricht: „Ich bin nicht beweisbar.“ Die Rosser’sche Formel lässt sich auf die gleiche Weise analysieren. Übersetzen wir die einzelnen Formelbestandteile in die natürliche Sprache, so lässt sich die inhaltliche Bedeutung von ϕr (y) folgendermaßen ausdrücken: „Ist ϕy (y) beweisbar, so existiert ein kürzerer Beweis für ¬ϕy (y).“
4 Beweistheorie
4.2.5
In seiner ursprünglichen Formulierung macht der erste Gödel’sche Unvollständigkeitssatz eine Aussage über ω-widerspruchsfreie formale Systeme. Dass sich die Annahme der ω-Widerspruchsfreiheit durch die schwächere Annahme der Widerspruchsfreiheit ersetzen lässt, wurde erst 1936 von dem US-amerikanischen Mathematiker John Barkley Rosser bewiesen, rund fünf Jahre nach der Publikation der Unvollständigkeitssätze [151, 171]. Es ist ein bemerkenswerter Aspekt seiner Arbeit, dass Rosser die Gödel’sche Argumentationslinie fast vollständig beibehalten konnte. Um den Unvollständigkeitssatz in seiner vollen Allgemeinheit zu beweisen, reicht es, die Gödel’sche Formel ϕg (y) durch die Rosser’sche Formel ϕr (y) := ∀ x (ψGdl (x, y) → ∃ (z ≤ x) ψGdl (z, y))
oder, was gleichbedeutend ist: „Wenn ich beweisbar bin, so existiert ein kürzerer Beweis für meine Negation.“ Unter der Annahme der Widerspruchsfreiheit ist diese Aussage aber äquivalent zu „Ich bin nicht beweisbar.“ Unsere Betrachtung zeigt, dass zwischen dem Gödel’schen und dem Rosser’schen Diagonalelement kein semantischer Unterschied besteht; beide postulieren ihre eigene Unbeweisbarkeit. Die Art und Weise, wie beide Formeln ihre inhaltliche Aussage codieren, ist dagegen eine völlig andere, und genau hierin liegt das Geheimnis des Rosser’schen Beweises.
(4.14)
zu ersetzen. Der Austausch von ϕg (g) durch ϕr (r) wird in der Literatur häufig als Rossers Trick bezeichnet. Die in (4.14) verwendete Teilformel ψGdl (z, y) kommt an dieser Stelle das erste Mal vor. Sie ist die syntaktische Repräsentation der folgenden primitiv-rekursiven Relation:
Damit entspricht das Diagonalelement ϕr (r) der Aussage „Ist ϕr (r) beweisbar, so existiert ein kürzerer Beweis für ¬ϕr (r)“
Rossers Beitrag
Gdl (x, y) :⇔ x ist die Gödelnummer eines Beweises von ¬ϕy (y) Wir werden nun zeigen, dass die Formel ϕr (r) innerhalb der PeanoArithmetik unentscheidbar ist. I
Angenommen, es gelte ϕr (r). Wäre ϕr (r) beweisbar, so müsste eine Gödelnummer m existieren, die den Beweis dieser Formel codiert. ϕr (r) ist das Diagonalelement der Formel ϕr (ξ ), und somit gilt Gdl(m, r). Da ψGdl die Relation Gdl syntaktisch repräsentiert, folgt daraus ψGdl (m, r)
(4.15)
Die Annahme ϕr (r) lautet ausgeschrieben ∀ x (ψGdl (x, r) → ∃ (z ≤ x) ψGdl (z, r)) Instanziieren wir die Variable x mit m, so erhalten wir ψGdl (m, r) → ∃ (z ≤ m) ψGdl (z, r)
(4.16)
Mit der Modus-ponens-Schlussregel folgt aus (4.15) und (4.16) ∃ (z ≤ m) ψGdl (z, r)
(4.17)
221
4.2 Der erste Unvollständigkeitssatz
ez 5 Sep 6 D
John Barkley Rosser wurde am 6. Dezember 1907 in Jacksonville geboren. An der University of Florida studierte er Physik und wechselte nach seinem Master-Abschluss an die renommierte Princeton University, wo er 1935 unter Alonzo Church in mathematischer Logik promovierte [150]. Nach kürzeren Aufenthalten in Princeton und Harvard erhielt er 1936 den Ruf an die Cornell University, die für die nächsten 30 Jahre zu seiner wissenschaftlichen Heimat werden sollte. Rosser ist neben der Verbesserung des Gödel’schen Beweises (Rossers Trick) vor allem für seine Arbeiten auf dem Gebiet der Rekursionstheorie bekannt. Im Jahr 1935 sorgte er für Aufsehen, als er zusammen mit Stephen Cole Kleene einen Widerspruch in der ursprünglichen Formulierung des λ -Kalküls von Alonzo Church fand (KleeneRosser-Paradoxon). Heute wird sein Name vor allem mit
1907 1989
dem Church-Rosser-Theorem verbunden, das die Konfluenzeigenschaft gewisser Termersetzungssysteme garantiert (Theorem 2 in [31]). Einen hohen Bekanntheitsgrad erzielte Rosser nicht zuletzt durch mehrere Bücher, die heute zur Standardliteratur der mathematischen Logik zählen [152– 154]. Rosser war nicht nur Theoretiker. Während des zweiten Weltkriegs beschäftigte er sich mit der Konstruktion ballistischer Raketen und übernahm später wichtige Beraterpositionen in der Weltraum- und Militärforschung. Im Jahr 1963 wurde er zum Direktor des Army Mathematics Research Centers (AMRC) ernannt, einer Einrichtung des USMilitärs zur strategischen Unterstützung der US-Invasion in Vietnam. In dieser Rolle war er nicht unumstritten; öffentlich dementierte er jegliche Beteiligung des AMRC an militärischen Projekten. Im Jahr 1973 ging Rosser in den Ruhestand und starb am 5. September 1989 mit 81 Jahren.
Ist die Peano-Arithmetik widerspruchsfrei, so ist nicht gleichzeitig die Formel ¬ϕr (r) beweisbar. Das bedeutet, das keine natürliche Zahl die Gödelnummer eines Beweises für ¬ϕr (r) sein kann. Es gilt also: ¬ψGdl (0, r)
(4.18)
¬ψGdl (1, r)
(4.19)
¬ψGdl (2, r) ...
(4.20)
Aus (4.18) und (4.19) folgt ¬∃ (z ≤ 1) ψGdl (z, r) Nehmen wir Formel (4.20) hinzu, so können wir ¬∃ (z ≤ 2) ψGdl (z, r) herleiten. Fahren wir in dieser Weise fort, so erhalten wir irgendwann ¬∃ (z ≤ m) ψGdl (z, r), im Widerspruch zu (4.17). Das Diagonalelement ϕr (r) kann also nur dann beweisbar sein, wenn die Peano-Arithmetik widersprüchlich ist.
222
4 Beweistheorie
I
Angenommen, es gelte ¬ϕr (r) Die Annahme lautet ausgeschrieben ¬∀ x (ψGdl (x, r) → ∃ (z ≤ x) ψGdl (z, r))
(4.21)
Sei m die Gödelnummer eines Beweises für ¬ϕr (r). Dann gilt: ψGdl (m, r) Die Peano-Arithmetik ist ausdrucksstark genug, um hieraus die folgende, inhaltlich abgeschwächte Aussage abzuleiten: ∀ x ((m ≤ x) → ∃ (z ≤ x) ψGdl (z, r))
(4.22)
Ist die Peano-Arithmetik widerspruchsfrei, so ist nicht gleichzeitig die Formel ϕr (r) beweisbar. Das bedeutet, dass keine natürliche Zahl die Gödelnummer eines Beweises für ϕr (r) sein kann. Es gilt also: ¬ψGdl (0, r) ¬ψGdl (1, r) ¬ψGdl (2, r) ... Genau wie im ersten Fall lassen sich hieraus nacheinander die folgenden Theoreme herleiten: ¬∃ (z ≤ 1) ψGdl (z, r) ¬∃ (z ≤ 2) ψGdl (z, r) ... ¬∃ (z ≤ m) ψGdl (z, r) Aus diesen Ergebnissen können wir innerhalb der Peano-Arithmetik den folgenden Schluss ziehen: ∀ x (ψGdl (x, r) → (m ≤ x))
(4.23)
Kombinieren wir die Ergebnisse (4.23) und (4.22) transitiv miteinander, so erhalten wir das folgende Theorem: ∀ x (ψGdl (x, r) → ∃ ( z ≤ x)ψGdl (z, r))
(4.24)
Damit haben wir es geschafft, mit (4.21) und (4.24) ein komplementäres Formelpaar abzuleiten. Wäre ¬ϕr (r) also tatsächlich beweisbar, so hätten wir die Peano-Arithmetik als widersprüchlich identifiziert.
4.3 Der zweite Unvollständigkeitssatz
Wir sind so weit, die Früchte unserer Arbeit zu ernten. Dank Rossers Trick können wir die Forderung der ω-Widerspruchsfreiheit fallen lassen und durch die schwächere Widerspruchsfreiheit ersetzen: Satz 4.7 (Rosser, 1936) Jedes widerspruchsfreie formale System, das stark genug ist, um die Peano-Arithmetik zu formalisieren, ist negationsunvollständig.
Dieser Satz wird in der Literatur häufig als das Gödel-Rosser-Theorem bezeichnet und ist im Wortlaut mit Satz 4.2 identisch. Es ist jenes Theorem, das wir als die syntaktische Variante des ersten Gödel’schen Unvollständigkeitssatzes bezeichnet haben.
4.3
Der zweite Unvollständigkeitssatz
In seiner Arbeit aus dem Jahr 1931 hat Gödel mehr bewiesen als die Unvollständigkeit der Arithmetik. Im zweiten Teil beschäftigte er sich ausführlich mit den Konsequenzen des ersten Unvollständigkeitssatzes und machte dabei ein weitreichende Entdeckung. Sie ist Inhalt dessen, was wir heute als den zweiten Gödel’schen Unvollständigkeitssatz bezeichnen. Dieser Satz besagt, dass kein formales System, das stark genug ist, um über die additiven und die multiplikativen Eigenschaften der natürlichen Zahlen zu sprechen, seine eigene Widerspruchsfreiheit beweisen kann. In diesem Abschnitt werden wir klären, wie diese Aussage im Detail gemeint ist und welche Konsequenzen sich hieraus für die Mathematik ergeben. Wenn wir sagen, ein formales System kann seine eigene Widerspruchsfreiheit beweisen, dann meinen wir das Folgende: I
Es existiert eine Formel Con, die genau dann wahr ist, wenn das formale System widerspruchsfrei ist.
I
Die Formel Con ist innerhalb des Systems beweisbar ( Con).
Per Definition ist ein formales System widerspruchsfrei, wenn für keine Formel ϕ sowohl ϕ als auch dessen Negation ¬ϕ aus den Axiomen abgeleitet werden kann. Um diese Eigenschaft zu formalisieren, benötigen wir das sogenannte Beweisprädikat. Hinter diesem Begriff verbirgt
223
Was wir heute als den zweiten Gödel’schen Unvollständigkeitssatz bezeichnen, heißt in der Originalarbeit schlicht Satz XI. Den Beweis zu diesem Satz hat Gödel nur grob umrissen, und seine Arbeit endet mit den folgenden Worten [64]: „In voller Allgemeinheit werden die Resultate in einer demnächst erscheinenden Fortsetzung ausgesprochen und bewiesen werden. In dieser Arbeit wird auch der nur skizzenhaft geführte Beweis von Satz XI ausführlich dargestellt werden. (Eingelangt: 17. XI. 1930) “ Die angekündigte Fortsetzung seiner Arbeit hat es nie gegeben; bereits die Skizze seines Beweises war für die meisten Mathematiker so überzeugend, dass kaum jemand an ihrer Richtigkeit zweifelte. Genauso wenig stand außer Frage, dass die vollständige Ausarbeitung des Beweises ein langwieriges und technisch kompliziertes Unterfangen sein würde. Die ersten, die sich dieser Aufgabe annahmen, waren David Hilbert und Paul Bernays. Im Jahr 1939 führten sie den Beweis für die Systeme Z und Zμ , zwei spezielle Varianten der Peano-Arithmetik [86]. Als Nebenprodukt ihres Beweises konnten sie präzise Kriterien aufstellen, die 1955 von Martin Löb weiter vereinfacht wurden [110] und im Englischen als derivability conditions bezeichnet werden. Werden sie von einem formalen System erfüllt, so lässt sich der Beweis des ersten Unvollständigkeitssatzes innerhalb dieses Systems formalisieren. Am Ende dieses Abschnitts wird die Erkenntnis stehen, dass es genau diese Eigenschaft ist, die ein formales System zum Opfer des zweiten Unvollständigkeitssatzes werden lässt. Ein formales System, das stark genug ist, um den Beweis des ersten Unvollständigkeitssatzes nachzuvollziehen, kann niemals seine eigene Widerspruchsfreiheit beweisen.
224
Gödel wählte einen geringfügig anderen Weg, um die Widerspruchsfreiheit eines formalen Systems zu beschreiben. Er nutzte aus, dass in jeder widersprüchlichen Theorie, die den gewöhnlichen aussagenlogischen Schlussapparat enthält, ausnahmslos jede Formel aus den Axiomen abgeleitet werden kann. Warum dies so ist, haben wir in der Randnotiz auf Seite 96 erörtert. Folgerichtig ist ein formales System bereits dann widerspruchsfrei, wenn eine einzige Formel existiert, die nicht beweisbar ist. Diese Charakterisierung können wir eins zu eins in jene Formel übersetzen, die Gödel in seiner Originalarbeit als Wid bezeichnet [64]: Wid := ∃ x (Form(x) ∧ ¬Bew(x)) Hierin ist Form(x) eine Formel, die genau dann beweisbar ist, wenn x die Gödelnummer eines syntaktisch korrekt geformten arithmetischen Ausdrucks ist. In seiner Arbeit hat Gödel ausführlich dargelegt, wie sich diese Formel konstruieren lässt. Es gibt noch eine dritte Möglichkeit, die Widerspruchsfreiheit zu beschreiben. Es genügt, ein beweisbares Theorem zu wählen (z. B. die Formel 0 = 1) und die Unbeweisbarkeit ihrer Negation zu fordern: Con := ¬Bew(0 = 1) Es ist irrelevant, für welche Variante wir uns am Ende entscheiden. Alle drei Charakterisierungen sind äquivalent.
4 Beweistheorie
sich eine zweistellige Relation B(x, y) mit der folgenden Eigenschaft: B(x, ϕ) :⇔ x codiert einen Beweis für die Formel ϕ B(x, y) ist also genau dann wahr, wenn x die Gödelnummer eines Beweises für die Formel mit der Gödelnummer y ist. Analog hierzu definieren wir die Relation B (x, y) wie folgt: B (x, ϕ) :⇔ x codiert einen Beweis für die Formel ¬ϕ Die Beweisprädikate B(x, y) und B (x, y) sind vereinfachte Varianten der weiter oben eingeführten Relationen Gdl(x, y) und Gdl (x, y) und genau wie diese primitiv-rekursiv. Damit sind B(x, y) und B (x, y) nach Satz 4.5 innerhalb der Peano-Arithmetik syntaktisch repräsentierbar. Das bedeutet, dass Formeln ψB (ξ , ζ ) und ψB (ξ , ζ ) mit den folgenden Eigenschaften existieren: ψB (x, ϕ) ⇔ x codiert einen Beweis für die Formel ϕ ¬ψB (x, ϕ) ⇔ x codiert keinen Beweis für die Formel ϕ ψB (x, ϕ) ⇔ x codiert einen Beweis für die Formel ¬ϕ ¬ψB (x, ϕ) ⇔ x codiert keinen Beweis für die Formel ¬ϕ Vereinbaren wir jetzt noch die vereinfachende Schreibweise Bew(σ ) := ∃ y ψB (y, σ ) Bew(¬σ ) := ∃ y ψB (y, σ )
(4.25) (4.26)
so können wir die Widerspruchsfreiheit der Peano-Arithmetik folgendermaßen formalisieren: Con := ¬∃ x (Bew(x) ∧ Bew(¬x)) Inhaltlich besagt die Formel genau das, wonach wir suchen: Es gibt keine Formel, für die sowohl die Formel selbst als auch deren Negation innerhalb der Peano-Arithmetik bewiesen werden kann. Kurzum: |= Con ⇔ „Die Peano-Arithmetik ist widerspruchsfrei“ Bevor wir die Konsequenzen untersuchen, die sich aus der Beweisbarkeit von Con ergeben, müssen wir noch einen wichtigen Zusammenhang zwischen dem Beweisprädikat B und der Relation Gdl herstellen. Während B(x, y) ausdrückt, dass x ein Beweis für die Formel mit der Gödelnummer y ist, besagt Gdl(x, y), dass x ein Beweis für das y-te Diagonalelement ϕy (y) ist. Es gilt also B(x, ϕy (y)) ⇔ Gdl(x, y)
225
4.3 Der zweite Unvollständigkeitssatz
Für y können wir natürlich auch die Zahl g wählen. g war die Gödelnummer der Diagonalaussage ϕg (g), die wir in Abschnitt 4.2.4 als unentscheidbar identifiziert haben: B(x, ϕg (g)) ⇔ Gdl(x, g) Für die weitere Argumentation ist es wichtig, dass wir den Zusammenhang zwischen Gdl und B innerhalb der Peano-Arithmetik ausdrücken: ∀ x (ψB (x, ϕg (g)) ↔ ψGdl (x, g))
(4.27)
Wie sich dieses Theorem innerhalb von PA ableiten lässt, ist detailliert in [170] beschrieben. Aus (4.27) können wir ∃ x ψB (x, ϕg (g)) ↔ ∃ x ψGdl (x, g) ableiten. Diese Formel ist äquivalent zu ¬∃ x ψB (x, ϕg (g)) ↔ ∀ x ¬ψGdl (x, g) und lässt sich mit (4.25) und (4.8) zu ¬Bew(ϕg (g)) ↔ ϕg (g) umformen. Weiter unten werden wir von diesem Theorem nur die Richtung von links nach rechts benötigen: ¬Bew(ϕg (g)) → ϕg (g)
(4.28)
Jetzt kommt der erste Unvollständigkeitssatz ins Spiel. In Worten besagt er, dass jedes widerspruchsfreie formale System, das stark genug ist, um die Peano-Arithmetik zu formalisieren, negationsunvollständig ist. Für den Beweis des zweiten Unvollständigkeitssatzes sind die folgenden beiden Tatsachen entscheidend: I
Der erste Unvollständigkeitssatz lässt sich innerhalb der PeanoArithmetik formulieren. Für unsere Zwecke benötigen wir gar nicht den vollständigen Satz, sondern lediglich die Aussage, dass aus der Widerspruchsfreiheit von PA die Unbeweisbarkeit des Gödel’schen Diagonalelements ϕg (g) folgt. Dies war der einfachere Fall im Beweis aus Abschnitt 4.2.4. Innerhalb der Peano-Arithmetik können wir die Aussage durch die folgende Formel beschreiben: Con → ¬Bew(ϕg (g))
(4.29)
226
Dass sich der Beweis des ersten Gödel’schen Unvollständigkeitssatzes innerhalb der Peano-Arithmetik nachvollziehen lässt, ist alles andere als selbstverständlich. Der Beweis von Hilbert und Bernays aus dem Jahr 1939 zeigt nachdrücklich, wie kompliziert er sich im Detail gestaltet [86]. Und dennoch wurde Gödels Behauptung 1931 niemals ernsthaft angezweifelt. Die Akzeptanz seiner informellen Beweisskizze war so groß, dass Gödel davon absah, sie in der angekündigten zweiten Veröffentlichung detailliert auszuarbeiten. Wie kann das sein? Die undurchsichtige Situation klärt sich auf, wenn wir uns daran erinnern, dass Gödel sein Ergebnis gar nicht für die Peano-Arithmetik, sondern für das System P bewiesen hat, das auf dem logischen Unterbau der Principia Mathematica beruht. Dass sich ein umgangssprachlicher Beweis innerhalb der Typentheorie der Principia nachvollziehen lässt, war 1931 keine spektakuläre Nachricht. In ihrem dreibändigen Werk hatten Russell und Whitehead eindrucksvoll unter Beweis gestellt, dass in ihrem System alle Schlussweisen der gewöhnlichen Mathematik reproduziert werden können. Die Arbeit von Hilbert und Bernays ist somit weit mehr als die Komplettierung der Gödel’schen Beweisskizze. In ihr wurde zum ersten Mal formal gezeigt, dass der Beweis des ersten Gödel’schen Unvollständigkeitssatzes innerhalb von Theorien nachvollzogen werden kann, die deutlich primitiver sind als die Typentheorie der Principia Mathematica.
4 Beweistheorie
I
Nicht nur der Unvollständigkeitssatz selbst, sondern auch sein Beweis lässt sich in die Peano-Arithmetik übertragen. Wie so etwas prinzipiell gelingen kann, haben wir in Abschnitt 3.2.1.3 dargelegt. Dort haben wir am Beispiel des Satzes über die Komponentengleichheit geordneter Paare gezeigt, wie sich ein umgangssprachlich formulierter Beweis innerhalb der Zermelo-Fraenkel-Mengenlehre formal nachvollziehen lässt. Bezogen auf den ersten Unvollständigkeitssatz bedeutet dieses Ergebnis, dass wir eine Formelsequenz konstruieren können, die mit den Axiomen von PA beginnt und folgendermaßen endet: Con → ¬Bew(ϕg (g))
(4.30)
Jetzt kommt der entscheidende Schritt: Wäre die Formel Con innerhalb der Peano-Arithmetik ableitbar, so könnten wir, wie in Abbildung 4.12 gezeigt, auch die Formel ¬Bew(ϕg (g)) ableiten. Nehmen wir jetzt das in (4.28) formulierte Ergebnis hinzu, so erhalten wir einen Beweis für ϕg (g). Aus dem ersten Unvollständigkeitssatz wissen wir aber bereits, dass die Formel ϕg (g) unbeweisbar ist. Damit sind wir am Ziel und können den zweiten Gödel’schen Unvollständigkeitssatz mit stolzer Brust verkünden: Satz 4.8 (Gödel, 1931) In jedem widerspruchsfreien formalen System, das stark genug ist, um die Peano-Arithmetik zu formalisieren, gilt Con. Es ist wichtig, aus dem zweiten Unvollständigkeitssatz nicht die falschen Schlüsse zu ziehen. Häufig wird Gödels zweiter Satz dahingehend falsch verstanden, dass aus der Beweisbarkeit von Con tatsächlich die Widerspruchsfreiheit des zugrunde liegenden formalen Systems folge. Dies ist aber keineswegs der Fall. Ist ein formales System, das den aussagenlogischen Schlussapparat beinhaltet, widersprüchlich, so lassen sich ausnahmslos alle Formeln aus den Axiomen ableiten und somit auch die Formel Con. Der gegenteilige Schluss ist korrekt: Gelingt es uns, in einem formalen System, das die Voraussetzungen des zweiten Unvollständigkeitssatzes erfüllt, tatsächlich die eigene Widerspruchsfreiheit zu beweisen, so muss es zwangsläufig widersprüchlich sein. Das bedeutet, dass wir den zweiten Unvollständigkeitssatz lediglich dazu benutzen können, um die Widersprüchlichkeit, nicht aber die Widerspruchsfreiheit eines formalen Systems zu beweisen.
227
4.3 Der zweite Unvollständigkeitssatz
bla Wäre die Widerspruchsfreiheit von PA innerhalb von PA beweisbar, ... so würde aus der Formalisierung des ersten Unvollständigkeitssatzes ... die Beweisbarkeit der Gödel’schen Diagonalaussage folgen. Diese ist in PA aber unbeweisbar!
bla
... Con ... ... Con → ¬Bew(ϕg (g)) ¬Bew(ϕg (g)) ¬Bew(ϕg (g)) → ϕg (g) ϕg (g)
(...) (Annahme) (...) (...) (4.30) (MP) (4.28) (MP)
Aus dem ersten Unvollständigkeitssatz wissen wir: ϕg (g)
Abbildung 4.12: Der finale Schritt im Beweis des zweiten Gödel’schen Unvollständigkeitssatzes. Wäre Con innerhalb der Peano-Arithmetik beweisbar, so ergäbe sich hieraus ein Beweis von ϕg (g), im Widerspruch zum ersten Unvollständigkeitssatz.
Die wahre Bedeutung des zweiten Unvollständigkeitssatzes ist eine andere: Wenn ein formales System seine eigene Widerspruchsfreiheit nicht beweisen kann, so kann der Beweis auch in keinem ausdrucksschwächeren System gelingen. Hieraus folgt unmittelbar, dass sich die Widerspruchsfreiheit der Mathematik nicht mit den Mitteln der gewöhnlichen Mathematik selbst beweisen lässt. Bedeutet dieses Ergebnis, dass wir z. B. der Peano-Arithmetik misstrauen müssen? Auch wenn der zweite Unvollständigkeitssatz die Hoffnung zunichte macht, dass wir PA mit Schlussweisen absichern können, die primitiver und damit glaubhafter sind als die Peano-Arithmetik selbst, so gibt es für ein solches Misstrauen keinen Grund. Kaum jemand stellt die Widerspruchsfreiheit von PA ernsthaft in Frage. Hierzu sind die Axiome zu einfach und die natürlichen Zahlen eine zu vertraute Struktur. Und wie sieht es mit der Mengenlehre aus? Reicht das Fundierungsaxiom wirklich aus, um sämtliche Antinomien aus der Mengenlehre zu verdrängen? Auch hier herrscht die Meinung vor, dass sich die Mathematik widerspruchsfrei auf ZF oder ZFC errichten lässt, einen formalen Beweis dafür halten wir aber nicht in Händen. Der zweite Unvollständigkeitssatz macht unmissverständlich klar, dass ein solcher Beweis nur in formalen Systemen möglich ist, die komplexer sind als ZF oder ZFC. Wir würden die Frage also lediglich auf ein anderes System verschieben. In der Tat zerstört der zweite Unvollständigkeitssatz jede Hoffnung, auf die Frage der Widerspruchsfreiheit von ZF oder ZFC jemals eine präzise Antwort zu erhalten.
228
4 Beweistheorie
4.4
Gödels Sätze richtig verstehen
Nur wenige mathematische Erkenntnisse wurden in der Vergangenheit so kontrovers diskutiert wie die Gödel’schen Unvollständigkeitssätze – und nur wenige wurden so oft missverstanden. Die Gründe hierfür sind vielfältig. Manche studieren die Sätze nur ungenau, andere ignorieren die Voraussetzungen oder überinterpretieren ihre inhaltlichen Aussagen; wiederum andere reißen die Unvollständigkeitssätze, bewusst oder unbewusst, aus ihrem mathematischen Kontext und preisen sie als Legitimation für die verschiedensten Dinge dieser Welt. In diesem Abschnitt wollen wir einige besonders häufig wiederkehrende Missverständnisse grob skizzieren und versuchen, sie durch eine saubere Erklärung auszuräumen. Nicht alles in diesem Abschnitt ist neu. Wenn Sie den bisherigen Text sorgsam gelesen haben, sollten Sie einige der geschilderten Missverständnisse schon nicht mehr als solche empfinden. In diesem Fall haben Sie bereits ein gutes Verständnis für das entwickelt, was die Gödel’schen Sätze besagen – und viel wichtiger noch: für das, was sie nicht besagen. Missverständnis 1: „Gödel hat gezeigt, dass in der Mathematik wahre Sätze existieren, die nicht beweisbar sind.“
Aus dem ersten Gödel’schen Unvollständigkeitssatz wird des öfteren der falsche Schluss gezogen, dass in der Mathematik Sätze existieren, die in einem absoluten Sinn unbeweisbar sind. Das Missverständnis klärt sich auf, wenn wir uns daran erinnern, was es heißt, etwas zu beweisen. Im formalen Sinne ist eine Formel ϕ beweisbar, wenn sie aus den Axiomen eines Kalküls durch die Anwendung von Schlussregeln hergeleitet werden kann. Das bedeutet, dass der Beweisbarkeitsbegriff immer an einen bestimmten Kalkül gekoppelt ist. Es ist leicht einzusehen, dass für jede Formel ϕ ein Kalkül existiert, in dem ϕ bewiesen werden kann. Folgerichtig ist die Beweisbarkeit immer eine relative Eigenschaft und niemals eine absolute. Als Beispiel soll die Formel ϕ für die Goldbach’sche Vermutung stehen, von der wir heute nicht wissen, ob sie in der Zermelo-FraenkelMengenlehre bewiesen werden kann oder nicht. Sollte sich herausstellen, dass ϕ in ZF unbeweisbar ist, so könnten wir ϕ zu den Axiomen von ZF hinzufügen und erhielten mit ZF ∪ {ϕ} ein formales System, in dem die Goldbach’sche Vermutung beweisbar ist. Ob es sinnvoll ist, das Gebäude der Mathematik auf diesem Kalkül zu errichten, ist eine andere Frage. Auch in der gewöhnlichen Mathematik ist der Begriff der Beweisbarkeit an einen Kalkül gekoppelt, allerdings wird er dort weder explizit
4.4 Gödels Sätze richtig verstehen
229
genannt, noch werden Beweise für gewöhnlich auf der formalen Ebene aufgeschrieben. Hier meinen wir mit „beweisbar“, dass eine Aussage im „gewöhnlichen Schlussapparat der Mathematik“ abgleitet werden kann. Das formale Pendant zu diesem Schlussapparat ist die ZermeloFraenkel-Mengenlehre, repräsentiert durch die Systeme ZF und ZFC. Behalten Sie stets im Gedächtnis, dass nicht alle formalen Systeme von der Gödel’schen Unvollständigkeit betroffen sind, sondern nur solche, die in der Lage sind, über die additiven und die multiplikativen Eigenschaften der natürlichen Zahlen zu sprechen. Hierunter fällt die Peano-Arithmetik, genauso wie die Zermelo-Fraenkel-Mengenlehre, in der sich die natürlichen Zahlen durch Mengen und die Addition sowie die Multiplikation durch Mengenoperationen darstellen lassen. Dass nicht jedes formale System unvollständig ist, hat auch schon die in Abschnitt 2.1 geführte Diskussion gezeigt. Dort haben wir einen korrekten und vollständigen Kalkül definiert, in dem eine Reihe primitiver Aussagen über die natürlichen Zahlen abgeleitet werden kann. Natürlich ist dieser Kalkül viel zu ausdrucksschwach, als dass wir ihm eine sinnvolle Anwendung innerhalb der Mathematik zuordnen könnten. Wir halten fest: Nicht jedes formale System ist unvollständig. Damit drängt sich unweigerlich die Frage auf, ab wann das Phänomen der Unvollständigkeit tatsächlich einsetzt. Wie ausdrucksstark muss ein formales System sein, damit es in den Sog des ersten Gödel’schen Unvollständigkeitssatzes gerät? Um der Antwort näher zu kommen, betrachten wir die beiden formalen Systeme in Tabelle 4.3. Links sind die Axiome der Presburger-Arithmetik aufgelistet, die bis auf die fehlenden Axiome für die Multiplikation mit der PeanoArithmetik übereinstimmen. Im Jahr 1929 hat der polnische Mathematiker Mojz˙ esz Presburger gezeigt, dass die Presburger-Arithmetik korrekt und vollständig ist. Das bedeutet, dass alle arithmetischen Formeln, die das Multiplikationszeichen nicht enthalten, aus den Axiomen abgleitet werden können. Um dem Phänomen der Unvollständigkeit zu erliegen, reicht es also nicht aus, über die additiven Fähigkeiten der natürlichen Zahlen sprechen zu können. Wir müssen zusätzlich in der Lage sein, auch über die Multiplikation zu reden. Das bedeutet mitnichten, dass ein formales System über die volle Ausdrucksstärke der Peano-Arithmetik verfügen muss, um dem Unvollständigkeitssatz zum Opfer zu fallen. Eine genaue Analyse des Gödel’schen Beweises hat gezeigt, dass die vollständige Induktion in diesem Zusammenhang so gut wie keine Rolle spielt. Ersetzen wir in PA
Missverständnis 2: „Gödel hat gezeigt, dass in jedem formalen System unentscheidbare Aussagen existieren.“
230
4 Beweistheorie
Presburger-Arithmetik
Robinson-Arithmetik
σ = τ → (σ = ρ → τ = ρ)
(P1)
σ = τ → (σ = ρ → τ = ρ)
(R1)
σ = τ → s(σ ) = s(τ)
(P2)
σ = τ → s(σ ) = s(τ)
(R2)
¬(0 = s(σ ))
(P3)
¬(0 = s(σ ))
(R3)
s(σ ) = s(τ) → σ = τ
(P4)
s(σ ) = s(τ) → σ = τ
(R4)
σ +0 = σ
(P5)
σ +0 = σ
(R5)
σ + s(τ) = s(σ + τ)
(P6)
σ + s(τ) = s(σ + τ)
(R6)
ϕ(0) → (∀ x (ϕ(x) → ϕ(s(x))) → ∀ x ϕ(x))
(P7)
σ ×0 = 0
(R7)
σ ×0 = 0
σ × s(τ) = (σ × τ) + σ
(R8)
σ × s(τ) = (σ × τ) + σ
σ = 0 ∨ ∃ ξ σ = s(ξ )
(R9)
Tabelle 4.3: Theorieaxiome der Presburger-Arithmetik (links) und der Robinson-Arithmetik (rechts)
das Induktionsaxiom durch das viel schwächere Axiom (R9) aus Tabelle 4.3, so gelangen wir auf direktem Weg zur Robinson-Arithmetik. Sie ist ausdrucksschwächer als die Peano-Arithmetik, aber ausdrucksstärker als die Presburger-Arithmetik. Wir wissen heute, dass all das, was zur Durchführung des Gödel’schen Beweises benötigt wird, in der Robinson-Arithmetik bereits vorhanden ist. Das bedeutet, dass wir die Voraussetzungen der Gödel’schen Unvollständigkeitssätze noch weiter abschwächen können. Die Sätze greifen für alle formalen Systeme, die stark genug sind, um die Robinson-Arithmetik zu formalisieren.
Missverständnis 3: „Der erste Gödel’sche Unvollständigkeitssatz steht im Widerspruch zu Gödels Vollständigkeitssatz.“
Wird der erste Unvollständigkeitssatz im Widerspruch zu Gödels erstem Unvollständigkeitssatz gesehen, so geht dies fast immer auf die nachlässige Verwendung der beteiligten Begriffe zurück. Auf die Schnelle betrachtet garantiert der Gödel’sche Vollständigkeitssatz den Zusammenhang ϕ ⇔ |= ϕ, während uns der erste Unvollständigkeitssatz attestiert, dass die Relationen ‚‘ und ‚|=‘ niemals in Einklang gebracht werden können. Der Widerspruch löst sich auf, wenn wir uns daran erinnern, wie das Symbol ‚|=‘ jeweils zu lesen ist. Im Kontext des Vollständigkeitssatzes besagt |= ϕ, dass ϕ allgemeingültig ist, d. h., die Formel ist unter allen
231
4.4 Gödels Sätze richtig verstehen
möglichen Interpretationen wahr. Im Kontext des Unvollständigkeitssatzes drückt |= ϕ dagegen aus, dass ϕ unter einer ganz bestimmten Interpretation wahr ist. Im Fall der Peano-Arithmetik ist dies jene, die als Grundmenge die natürlichen Zahlen umfasst und die Symbole ‚+‘, ‚ב und ‚s‘ als die Addition, die Multiplikation und die Nachfolgerfunktion interpretiert. Ferner gilt es zu beachten, dass der Gödel’sche Vollständigkeitssatz ausschließlich eine Aussage über die Prädikatenlogik erster Stufe tätigt und in der Prädikatenlogik zweiter Stufe seine Gültigkeit verliert. Der erste Gödel’sche Unvollständigkeitssatz gilt dagegen in allen formalen Systemen, die stark genug sind, um die Peano-Arithmetik zu formalisieren, und damit z. B. auch in der Prädikatenlogik zweiter Stufe. Spätestens jetzt wird klar, dass die inhaltlichen Aussagen der beiden Sätze völlig andere sind und neben den ähnlich klingenden Namen keine tiefer gehenden Gemeinsamkeiten bestehen. Es ist ein bekanntes Ergebnis der euklidischen Geometrie, dass sich das Parallelenpostulat (Abbildung 4.13) nicht aus den anderen Axiomen ableiten lässt, genauso wenig wie seine Negation. Tatsächlich ist das Parallelenpostulat unentscheidbar, weil die anderen euklidischen Axiome mehrere konsistente Interpretationen besitzen. Eine davon ist die Geometrie der Ebene; sie ist gewissermaßen die Standardinterpretation der euklidischen Geometrie, und hier ist das Parallelenpostulat ein wahrer Satz. Daneben existieren andere Interpretationen, wie die elliptische oder die hyperbolische Geometrie, die ebenfalls im Einklang mit den anderen euklidischen Axiomen stehen. In diesen nichteuklidischen Geometrien ist das Parallelenpostulat eine falsche Aussage. Existieren für die Axiome eines korrekten formalen Systems mehrere konsistente, nichtisomorphe Interpretationen, so müssen zwangsläufig unentscheidbare Sätze existieren. Es ist wichtig, das von Gödel entdeckte Unvollständigkeitsphänomen nicht mit dieser Art der Unvollständigkeit zu verwechseln oder gar gleichzusetzen. Die Unentscheidbarkeit des Parallelenpostulats rührt daher, dass die anderen Axiome zu schwach sind, um die geometrischen Objekte, die wir im Sinn haben, eindeutig zu charakterisieren. Der entstehende Interpretationsspielraum sorgt dann für die Existenz unentscheidbarer Sätze. Die Gödel’sche Unvollständigkeit ist viel tiefer gehend. Wir treffen sie auch in formalen Systemen an, die nur eine einzige konsistente Interpretation zulassen. Ein Beispiel eines solches Systems ist die PeanoArithmetik, formuliert in der Prädikatenlogik zweiter Stufe. Hier besagt der Isomorphiesatz von Dedekind, dass alle Modelle isomorph zum Standardmodell sind, und auch in diesem System existieren unentscheidbare Sätze.
Missverständnis 4: „Die Existenz unentscheidbarer Sätze beruht auf der Unzulänglichkeit der Axiome, die Eigenschaften der beschriebenen Objekte eindeutig zu charakterisieren. Unentscheidbare Sätze entstehen nur deshalb, weil die Axiome mehr als eine konsistente Interpretation zulassen.“
„Zu einer Geraden und einem Punkt außerhalb der Geraden gibt es genau eine Gerade, die durch den Punkt geht und parallel zur ersten Geraden ist.“
Euklid von Alexandria (ca. 365 v. Chr. – ca. 300 v. Chr.) Abbildung 4.13: Das Parallelenpostulat
232
Missverständnis 5: „Unvollständige formale Systeme lassen sich vervollständigen, indem für jede unentscheidbare Formel entweder die Formel selbst oder deren Negation als Axiom hinzugefügt wird.“
4 Beweistheorie
Gödel hat gezeigt, dass für jeden Kalkül, der die Voraussetzungen des ersten Unvollständigkeitssatzes erfüllt, eine Formel ϕg (g) konstruiert werden kann, die unentscheidbar ist. Für diese Formel gilt, dass weder sie selbst noch ihre Negation aus den Axiomen abgeleitet werden kann, und somit können wir eine davon widerspruchsfrei zu den Axiomen hinzufügen. Auf diese Weise, so scheint es, lässt sich das Gödel’sche Leck schließen und der Kalkül systematisch vervollständigen. Der zweite Blick macht deutlich, dass dieser Ansatz ins Leere laufen muss. Sobald wir die Axiomenmenge erweitert haben, können wir die Gödel’sche Konstruktion abermals anwenden und erhalten als Ergebnis eine Formel ϕg (g ), die von ϕg (g) verschieden ist und innerhalb des neuen Systems unentscheidbar ist. Aber wie kann es sein, dass wir beim zweiten Mal eine andere Formel erhalten? Der Grund ist dieser: Da wir dem Kalkül ein neues Axiom hinzugefügt haben, ändern sich die Gödelnummern aller Formeln, die in der Konstruktion des Gödel’schen Diagonalelements eine Rolle spielen, und damit auch das Diagonalelement selbst. Es gibt an dieser Stelle kein Entrinnen: Formale Systeme, die ausdrucksstark genug sind, um die Peano-Arithmetik zu formalisieren, lassen sich nicht vervollständigen.
Missverständnis 6: „Es ist eine Konsequenz des zweiten Unvollständigkeitssatzes, dass die Widerspruchsfreiheit der Peano-Arithmetik unbeweisbar ist.“
Der zweite Unvollständigkeitssatz besagt, dass ein formales System, das stark genug ist, um die Peano-Arithmetik zu formalisieren, seine eigene Widerspruchsfreiheit nicht beweisen kann. Daraus folgt, dass ein solches System erst recht nicht in der Lage ist, die Widerspruchsfreiheit eines ausdrucksstärkeren Systems zu beweisen. Kurzum: Innerhalb von PA ist die Widerspruchsfreiheit von PA genauso wenig beweisbar, wie die Widerspruchsfreiheit von ZF oder ZFC. Es ist falsch, die geschilderte Schlussrichtung umzukehren. Der zweite Unvollständigkeitssatz schließt keinesfalls aus, dass die Widerspruchsfreiheit eines formalen Systems in einem ausdrucksstärkeren System bewiesen werden kann. Es könnte also tatsächlich möglich sein, die Widerspruchsfreiheit von PA innerhalb von ZF oder ZFC zu zeigen. Dass dies tatsächlich gelingt, hat der deutsche Mathematiker Gerhard Gentzen im Jahr 1936 demonstriert [61]. Er codierte die Beweise der Peano-Arithmetik so geschickt als Ordinalzahlen, dass sich mit dem Prinzip der transfiniten Induktion die Widerspruchsfreiheit beweisen lässt. Gentzens Ergebnis widerspricht dem zweiten Unvollständigkeitssatz in keinem Wort. Mit der transfiniten Induktion hat er auf ein mengentheoretisches Mittel zurückgegriffen, das in PA nicht zur Verfügung steht. Das bedeutet, dass sich Gentzens Beweis innerhalb von ZF oder ZFC, nicht aber in PA formalisieren lässt.
233
4.5 Der Satz von Goodstein
4.5
Der Satz von Goodstein
Im Jahr 1944 bewies der englische Mathematiker Reuben Louis Goodstein einen Satz, der die volle Tragweite des Gödel’schen Unvollständigkeitsphänomens zum Vorschein bringt. Auf den ersten Blick wirkt der Satz von Goodstein wie ein gewöhnliches Theorem der Zahlentheorie; er macht eine Aussage über den Werteverlauf spezieller Zahlenfolgen, die wir heute als Goodstein-Folgen bezeichnen, und lässt sich mit den Mitteln der Ordinalzahltheorie aus Abschnitt 3.2.2 vergleichsweise einfach beweisen. Was den Satz von Goodstein so außergewöhnlich macht, ist die Tatsache, dass er genau wie die Gödel’sche Formel ϕg (g) oder die Rosser’sche Formel ϕr (r) innerhalb der Peano-Arithmetik unentscheidbar ist. Das bedeutet, dass weder der Satz selbst noch seine Negation aus den Axiomen hergeleitet werden kann, wenn die Peano-Arithmetik frei von Widersprüchen ist. Dies ist das erstaunliche Ergebnis einer Arbeit von Laurie Kirby und Jeff Paris aus dem Jahr 1982 [101]. Im Gegensatz zu den künstlich konstruierten Formeln von Gödel und Rosser ist der Satz von Goodstein aber alles andere als ein Kunstprodukt: Er ist ein gewöhnlicher Satz der Zahlentheorie und im Gegensatz zu ϕg (g) und ϕr (r) gänzlich frei von inhaltlichen Selbstbezügen. Um den Satz von Goodstein zu verstehen, benötigen wir ein wenig Grundwissen über die Darstellung natürlicher Zahlen. Zunächst halten wir fest, dass sich jede natürliche Zahl x in der Form x = an · bn + an−1 · bn−1 + an−2 · bn−2 + . . . + a1 b + a0
(4.31)
schreiben lässt mit a0 , . . . , an ≥ 0. b wird als Basis bezeichnet und ist eine beliebige natürliche Zahl größer 1. Fordern wir zusätzlich für alle i die Beziehung ai < b, so sind die Ziffern a0 , . . . , an eindeutig bestimmt, und wir nennen (4.31) die b-adische Darstellung von x. Für b = 2 und x = 36 erhalten wir z. B. das Ergebnis 36 = 1 · 25 + 1 · 22 Was wir für die Konstruktion der Goodstein-Folge benötigen, ist eine Repräsentation von x, die wir als expandierte b-adische Darstellung bezeichnen. Sie entsteht, indem die Exponenten in (4.31) rekursiv durch ihre eigene b-adische Darstellung ersetzt werden. Für die Zahl 36 liest sich die expandierte Darstellung zur Basis 2 wie folgt: 36 = 1 · 22
2 +1
+ 1 · 22
Dez 8 Mar
15 Der englische Mathematiker Reuben Louis Goodstein wurde am 15. Dezember 1912 in London geboren. Von der dort ansässigen St. Paul’s School wechselte er 1931 an die renommierte University of Cambridge. Das Studium der Mathematik absolvierte Goodstein mit Bravour. Seine nächste Station war eine Lecturer-Position an der University of Reading. Dort setzte er auch seine eigenen Forschungsvorhaben fort, für die er 1947 von der University of London mit der Doktorwürde ausgezeichnet wurde. 1948 folgte er einem Ruf an die University of Leicester, wo er bis zu seiner Pensionierung im Jahr 1977 als Professor lehrte und forschte. Goodstein engagierte sich zeitlebens in der Lehre und galt als hervorragender Didaktiker. Heute wird sein Name vor allem mit dem Satz von Goodstein verbunden, dem bekanntesten Beispiel dessen, was wir in der mathematischen Logik als natürliches Unabhängigkeitsphänomen bezeichnen (natural independence phenomenon). Grob gesprochen zählen hierzu alle gewöhnlichen Sätze der Mathematik, die sich genau wie die künstlich konstruierten Formeln von Gödel und Rosser der Beweisbarkeit in PA entziehen. Weniger bekannt ist, dass Goodstein der Schöpfer eines bekannten Begriffsschemas ist, das häufig verwendet wird, um Operationen jenseits der Potenzierung zu benennen. Die iterierte Potenzierung, die gern auch als Hyper-Exponentiation oder Super-Potenzierung bezeichnet wird, heißt bei Goodstein Tetration. Danach folgen, in der Reihenfolge der griechischen Vorsilben, die Pentation, die Hexation, die Heptation, die Octation und so fort. Reuben Goodstein starb in Leicester am 8. März 1985 im Alter von 72 Jahren.
1912 1985
234
4 Beweistheorie
g0 (36) = 36 = 2
22 +1
+2
Ferner benötigen wir eine spezielle Substitutionsfunktion, die Goodstein in seiner Originalarbeit mit Scb (x) bezeichnet. Für eine natürliche Zahl x wird Scb (x) berechnet, indem x zunächst in die expandierte b-adische Darstellung gebracht wird und anschließend alle Basen durch c ausgetauscht werden. Beispielsweise ergibt S32 (36) die Zahl
2
g1 (36) := S32 (g0 (36)) − 1 3 g1 (36) = 33 +1 + 33 − 1 = 3
33 +1
S32 (36) = S32 (22
2
+2·3 +2·3+2
4
+1
+ 2 · 42 + 2 · 4 + 1
5
+1
+ 2 · 52 + 2 · 5
Abbildung 4.14: Die ersten vier Elemente der Goodstein-Folge für den Startwert 36
gn+1 (x) =
Startwert 2
+ 33 = 22876792454988 (4.32)
x ist der Startwert der Folge, d. h., es gilt g0 (x) = x. Für die Berechnung von g1 übersetzen wir g0 zunächst in seine b-adische Darstellung mit b = 2. Anschließend ersetzen wir die Basis b, wie in Abbildung 4.14 gezeigt, durch b + 1 und erniedrigen das Ergebnis um 1. Die Berechnung der weiteren Folgenelemente funktioniert nach dem gleichen Schema. In jedem Schritt wird die Basis um 1 erhöht (base bumping) und das Ergebnis anschließend um 1 erniedrigt:
Startwert 1
3 +1
g0 (x), g1 (x), g2 (x), g3 (x), . . .
g1 (36) := S54 (g2 (36)) − 1 5 g3 (36) = 55 +1 + 2 · 52 + 2 · 5 + 1 − 1 = 55
+ 2 2 ) = 33
Jetzt besitzen wir das nötige Instrumentarium, um Goodstein-Folgen formal zu beschreiben. Zunächst halten wir fest, dass für jede natürliche Zahl x eine separate Goodstein-Folge existiert, deren Elemente wir folgendermaßen notieren:
g1 (36) := S43 (g1 (36)) − 1 4 g2 (36) = 44 +1 + 2 · 42 + 2 · 4 + 2 − 1 = 44
2 +1
Startwert 3
n+2 Sn+3 (gn (x)) − 1 0
Startwert 4
falls gn (x) > 0 falls gn (x) = 0 Startwert 5
Startwert 6
g0 (1) = 1
g0 (2) = 2
g0 (3) = 3
g0 (4) = 4
g0 (5) = 5
g0 (6) = 6
g1 (1) = 0
g1 (2) = 2
g1 (3) = 3
g1 (4) = 26
g1 (5) = 27
g1 (6) = 29
g2 (1) = 0
g2 (2) = 1
g2 (3) = 3
g2 (4) = 41
g2 (5) = 255
g2 (6) = 257
g3 (1) = 0
g3 (2) = 0
g3 (3) = 2
g3 (4) = 60
g3 (5) = 467
g3 (6) = 3125
g4 (1) = 0
g4 (2) = 0
g4 (3) = 1
g4 (4) = 83
g4 (5) = 775
g4 (6) = 46655
g5 (1) = 0
g5 (2) = 0
g5 (3) = 0
g5 (4) = 109
g5 (5) = 1197
g5 (6) = 98039
g6 (1) = 0
g6 (2) = 0
g6 (3) = 0
g6 (4) = 139
g6 (5) = 1751
g6 (6) = 187243
g7 (1) = 0
g7 (2) = 0
g7 (3) = 0
g7 (4) = 173
g7 (5) = 2454
g7 (6) = 332147
g8 (1) = 0
g8 (2) = 0
g8 (3) = 0
g8 (4) = 211
g8 (5) = 3325
g8 (6) = 555551
g9 (1) = 0
g9 (2) = 0
g9 (3) = 0
g9 (4) = 253
g9 (5) = 4382
g9 (6) = 885775
g10 (1) = 0
g10 (2) = 0
g10 (3) = 0
g10 (4) = 299
g10 (5) = 5643
g10 (6) = 1357259
g11 (1) = 0
g11 (2) = 0
g11 (3) = 0
g11 (4) = 348
g11 (5) = 7126
g11 (6) = 2011162
...
...
...
...
Abbildung 4.15: Entwicklung der Goodstein-Folge für die Startwerte 1 bis 6
...
...
235
4.5 Der Satz von Goodstein
Wie wahrscheinlich ist es, dass eine Goodstein-Folge den Wert 0 erreicht? In Abbildung 4.14 konnten wir beobachten, dass die Folgenelemente durch die fortwährende Erhöhung der Basis so rasant anwachsen, dass wir bereits nach wenigen Schritten kaum noch in der Lage sind, sie in Dezimalschreibweise zu notieren. Die Beispiele in Abbildung 4.15 zeigen zudem, dass wir dieses Phänomen schon für kleine Startwerte beobachten können. Ab x = 4 scheinen Goodstein-Folgen mit aller Macht gegen Unendlich zu streben, und die Vergrößerung des Startwerts befeuert den rasanten Anstieg zusätzlich. Damit ist es an der Zeit, den Satz von Goodstein zu formulieren. Im Angesicht der betrachteten Beispiele offenbart er Erstaunliches:
I Goodstein-Folge zum Startwert 1
gn (1) 4 3 2 1 0
0
1
2
3
4
5
6
7
n
I Goodstein-Folge zum Startwert 2
gn (2) 4
Satz 4.9 (Goodstein, 1944)
3 2
Jede Goodstein-Folge erreicht irgendwann den Wert 0.
1 0
Abbildung 4.16 zeigt, wann die ersten vier Goodstein-Folgen den Wert 0 erreichen. Die ersten drei Folgen tun dies sehr rasch. Für den Startwert 4 steigt die Folge erst einmal für lange Zeit an und erreicht bei 24 1 i = 24 · 224 224 · 2 − 3 ≈ 1,72 · 10121210694 4 ihr Maximum [6, 147]. Danach bleibt sie lange konstant und tritt anschließend in eine kontinuierliche Abstiegsphase ein. Den Wert 0 erreicht die Folge bei
i = 24 · 224 224 · 2 − 3 ≈ 6,89 · 10121210694 24
Diese Zahl sprengt unsere intuitive Vorstellung bei Weitem; sie entspricht einer Dezimalzahl mit mehr als 121 Millionen Ziffern!
0
1
2
3
4
5
6
7
n
I Goodstein-Folge zum Startwert 3
gn (3) 4 3 2 1 0
0
1
2
3
4
5
6
7
n
I Goodstein-Folge zum Startwert 4
gn (4) · 10-121210694 4
Dass jede Goodstein-Folge irgendwann den Wert 0 erreicht, ist schon für sich allein gesehen ein faszinierendes Ergebnis. Noch erstaunlicher ist aber, dass sich der Satz von Goodstein vergleichsweise einfach mit den Mitteln der Ordinalzahltheorie aus Abschnitt 3.2.2 beweisen lässt. Wie dies genau funktioniert, wollen wir uns nun ansehen. Im Kern basiert der Beweis auf der Idee, eine Goodstein-Folge nach dem folgenden Schema in eine Parallelfolge von Ordinalzahlen zu übersetzen: gn (x) = Sωn+2 (gn (x)) Abbildung 4.17 demonstriert, wie wir die Folge konstruieren können. Zunächst schreiben wir die Elemente einer Goodstein-Folge in expandierter b-adischer Darstellung auf und ersetzen anschließend alle Basen durch die Ordinalzahl ω.
3 2 1 0
0
1
2
3
4
5 6 7 · 10121210694
n
Abbildung 4.16: Werteverläufe der ersten vier Goodstein-Folgen
236
Abbildung 4.17: Jede Goodstein-Folge lässt sich in eine Parallelfolge von Ordinalzahlen übersetzen, die so lange streng monoton fällt, bis die Goodstein-Folge den Wert 0 erreicht. Wäre Satz 4.9 falsch, so gäbe es eine Goodstein-Folge, deren Elemente allesamt von 0 verschieden sind, und damit gäbe es auch eine unendlich absteigende Folge von Ordinalzahlen. Wir wissen aber bereits, dass eine solche Folge nicht existieren kann.
4 Beweistheorie
22
2 +1
+ 22
Transformation
ωω
ω +1
+ ωω
33
3 +1
+ 2 · 32 + 2 · 3 + 2
Transformation
ωω
ω +1
+ 2 · ω2 + 2 · ω + 2
44
4 +1
+ 2 · 42 + 2 · 4 + 1
Transformation
ωω
ω +1
+ 2 · ω2 + 2 · ω + 1
55
5 +1
+ 2 · 52 + 2 · 5
Transformation
ωω
ω +1
+ 2·ω2 + 2·ω
...
...
Für die weitere Argumentation ist die Monotonieeigenschaft der Substitution Sωk von Bedeutung. Diese besagt, dass die Größenverhältnisse zweier Zahlen durch die Substitution unangetastet bleibt: x < y ⇒ Sωk (x) < Sωk (y)
für alle k ∈ N
(4.33)
Jetzt können wir die Elemente gn (x) für alle n mit gn (x) > 0 nach oben abschätzen: gn+1 (x) = Sωn+3 (gn+1 (x)) n+2 (gn (x)) − 1) = Sωn+3 (Sn+3 n+2 < Sωn+3 (Sn+3 (gn (x)))
wegen (4.33)
= Sωn+2 (gn (x)) = gn (x) Voilà: Die konstruierte Parallelfolge ist streng monoton fallend. Das bedeutet, dass sich aus jeder Goodstein-Folge, deren Elemente alle von 0 verschieden sind, eine unendlich absteigende Folge von Ordinalzahlen konstruieren lässt. Aus Kapitel 3 wissen wir aber bereits, dass eine solche Folge nicht existieren kann. Das bedeutet im Umkehrschluss, dass jede Goodstein-Folge tatsächlich irgendwann den Wert 0 erreicht. Mithilfe der Ordinalzahltheorie war es für uns vergleichsweise einfach, den Satz von Goodstein als wahr zu identifizieren. Die eigentlich interessante Frage ist natürlich eine andere: Warum lässt sich das GoodsteinTheorem innerhalb der Peano-Arithmetik formulieren, aber nicht innerhalb der Peano-Arithmetik beweisen? Wie kann es sein, dass wir auf Beweismittel zurückgreifen müssen, die außerhalb der Theorie liegen, in der sich das Theorem formulieren lässt? Zu allererst wollen wir uns klar machen, dass die Peano-Arithmetik tatsächlich stark genug ist, um über den Satz von Goodstein zu sprechen.
237
4.5 Der Satz von Goodstein
Zu diesem Zweck bringen wir die Goodstein-Funktion G : N → N ins Spiel, die wie folgt definiert ist: G(x) := min{n | gn (x) = 0}
gn (1) 4
In Worten ausgedrückt, gibt der Funktionswert G(x) an, nach wie vielen Schritten die Goodstein-Folge mit dem Startwert x die Nulllinie erreicht. Abbildung 4.18 zeigt auf grafische Weise, wie sich die Funktionswerte G(x) für die ersten vier Goodstein-Folgen berechnen lassen. Als nächstes codieren wir die Goodstein-Funktion mithilfe einer arithmetischen Formel ϕG mit zwei freien Variablen x und y. Diese Formel erfüllt die folgende Beziehung:
3 2 1 0
0
1
2
3
4
5
6
7
2
3
4
5
6
7
2
3
4
5
6
7
n
I G(2) = 3
gn (2) 4
|= ϕG (x, y) ⇔ G(x) = y Dass sich eine Formel mit dieser Eigenschaft tatsächlich konstruieren lässt, ist ein Ergebnis, das wir in Kapitel 5 herausarbeiten werden. Dort werden wir zeigen, wie sich Turing-Maschinen arithmetisieren lassen, und damit werden wir implizit den Beweis erbringen, dass sich jede Funktion, die mit einem systematischen Verfahren berechnet werden kann, innerhalb der Peano-Arithmetik repräsentieren lässt. Auch wenn wir im Moment nur eine vage Vorstellung davon haben, was der Begriff des systematischen Verfahrens genau bedeutet, können wir die Goodstein-Funktion bereits jetzt als berechenbar identifizieren. Wir wissen ja schon, dass jede Goodstein-Folge irgendwann den Wert 0 erreicht. Damit können wir den Funktionswert G(x) systematisch ermitteln, indem wir die Folgenelemente so lange eines nach dem anderen ausrechnen, bis sich der Wert 0 einstellt. Als nächstes werden wir eine Beziehung zwischen der GoodsteinFunktion G(x) und dem Satz von Goodstein herstellen. Inhaltlich ist der Satz äquivalent zu der Aussage, die Funktion G(x) sei für alle n definiert, und dies ist wiederum äquivalent zu der Behauptung, die Goodstein-Funktion sei total. Wenn wir davon sprechen, die Totalität von ϕG (x) in PA zu beweisen, so meinen wir damit, das folgende Theorem herzuleiten: ∀ x ∃ y ϕG (x, y)
I G(1) = 1
3 2 1 0
n
gn (3) 4 3 2 1 0
0
1
n
I G(4) = 24 · 224 224 · 2 − 3 24
gn (4) · 10-121210694 4 3 2 1
Für Formeln dieser Bauart greift ein starkes Resultat, das auf Georg Kreisel zurückgeht:
0
Lässt sich die Totalität einer berechenbaren Funktion f : N → N innerhalb der Peano-Arithmetik beweisen, so existiert eine Funktion fα mit α < ε0 , die f dominiert.
1
I G(3) = 5
(4.34)
Satz 4.10 (Kreisel, 1952)
0
0
1
2
3
4
5 6 7 · 10121210694
n
Abbildung 4.18: Die ersten vier Funktionswerte der Goodstein-Funktion G
238
4 Beweistheorie
I Ackermann-Funktion
A(0, n) := 2 · n + 1 A(m + 1,0) := A(m,1) A(m + 1, n + 1) := A(m, A(m + 1, n)) I Funktionenhierarchie
Im Mittelpunkt dieses Satzes steht eine Dominanzaussage. Hier bezieht sich Kreisel auf eine Hierarchie schnell wachsender Funktionen, die auf Stanley Wainer und Martin Löb zurückgeht [111, 185]. Auch wenn die Hierarchie im Detail komplex ist, folgt sie der einfachen Grundidee, Funktionen anhand ihrer Wachstumsrate zu ordnen. Dies ist ein gängiges Vorgehen in der Mathematik, und solange wir den Bereich der „gewöhnlichen“ Funktionen nicht verlassen, auch nicht weiter schwer. Beispielsweise bildet die Folge n
A3 (n) := A(3, n) = O(2 ↑↑↑ n) A2 (n) := A(2, n) = O(2 ↑↑ n) A1 (n) := A(1, n) = O(2n ) A0 (n) := A(0, n) = O(n) Abbildung 4.19: Aus der AckermannFunktion abgeleitete Operatorenhierarchie
Die in Abb. 4.19 verwendete Notation 2 ↑k n geht auf den US-amerikanischen Informatiker Donald E. Knuth zurück [105]. 1976 schlug er diese Pfeilnotation als Lösung für ein lange bestehendes Problem der klassischen Mathematik vor, für Funktionen jenseits der Exponentiation keine eigene Symbolik zu kennen. Formal ist m ↑k n wie folgt definiert: ⎧ b falls k = 1 ⎨ a k := 1 falls n = 0 m↑ n ⎩ m ↑k−1 (m ↑k (n − 1)) sonst Mit der 1976 geschaffenen Notation hat Knuth den Weg geebnet, um Funktionen verschiedener Grade nach einem einheitlichen Schema zu benennen. Die am langsamsten wachsende Funktion, die mit der Pfeilnotation dargestellt werden kann, ist die Potenzierung (m ↑ n). Danach folgt mit (m ↑↑ n) die Tetration und so fort.
2n
n, 2 · n, 3 · n, . . . , n2 , n3 , . . . , 2n , 3n , . . . , 22 , 22 , . . .
(4.35)
eine natürliche Hierarchie immer schneller wachsender Funktionen. Komplizierter wird es, wenn wir versuchen, Funktionen in eine solche Hierarchie zu integrieren, die noch viel schneller wachsen. Ein Beispiel hierfür ist die Ackermann-Funktion A(m, n), die wir auf Seite 208 bereits kennen gelernt haben. Ihre Definition sieht auf den ersten Blick harmlos aus, und dennoch können wir den Funktionswert A(m, n) bereits für kleine Werte von m praktisch nicht mehr ausrechnen. Warum dies so ist, wird klar, wenn wir den Parameter m für verschiedene Werte konstant halten. Auf diese Weise entsteht aus A(m, n) für jede Zahl m ∈ N eine separate Funktion Am (n), deren Wachstumsverhalten in Abbildung 4.19 dargestellt ist. Die Funktion A0 (n) wächst linear, A1 (n) exponentiell, A2 (n) hyper-exponentiell und so fort. Damit entpuppt sich die Ackermann-Funktion als eine Art Universalfunktion, die eine unendliche Schar immer schneller wachsender Funktionen in sich vereint. Noch schneller wächst die Diagonalfunktion Aω (n) := An (n) Für jeden Wert von m wird Aω (n) ab einem gewissen n größer sein als Am (n). Wir sagen: Am wird durch Aω dominiert. Dass wir als Index dieser Funktion die Ordinalzahl ω gewählt haben, ist naheliegend, schließlich können wir Aω in der gleichen Weise als Grenzfunktion ansehen, wie wir ω als Limit-Ordinalzahl für die natürlichen Zahlen definiert haben. Ganz ähnlich sind auch Wainer und Löb vorgegangen. Die Löb-WainerHierarchie wird durch eine Folge von Funktionen fα mit einem ordinalen Index α gebildet. Die Funktionen f0 und f1 wachsen linear, f2 wächst bereits exponentiell, und für die Niederschrift für f3 müssten wir auf Exponentialtürme zurückgreifen, wie wir sie in Abschnitt 3.2.2.2 für die Konstruktion von Ordinalzahlen verwendet haben. Mithilfe der Löb-Wainer-Hierarchie sind wir in der Lage, das rasante Wachstumsverhalten der diagonalisierten Ackermann-Funktion quanti-
239
4.5 Der Satz von Goodstein
tativ einzufangen: Aω wächst mit der gleichen Geschwindigkeit wie die Funktion f ω . 1
1
Jetzt ist auch klar, wie wir den Satz von Kreisel zu lesen haben. Wird eine berechenbare Funktion f durch eine arithmetische Formel ϕ f beschrieben, so können wir innerhalb von PA nur dann auf einen Beweis für die Formel
...
...
∀ x ∃ y ϕ f (x, y) hoffen, wenn f von einer Funktion fα mit α < ε0 dominiert wird. Damit ist es an der Zeit, das Wachstumsverhalten der GoodsteinFunktion näher zu beleuchten. Der eklatante Sprung von G(3) auf G(4) weckt bereits die Vermutung, dass wir es hier mit einer Wachstumsrate zu tun haben, die jene der diagonalisierten Ackermann-Funktion noch deutlich übersteigt. Dass wir heute sehr genau über das Wachstumsverhalten der Goodstein-Funktion Bescheid wissen, verdanken wir Laurie Kirby und Jeff Paris. Im Jahr 1982 führten sie als erste den Beweis, dass G(x) genauso schnell wächst wie die Funktion fε0 aus der Löb-Wainer-Hierarchie [101]. Das bedeutet im Umkehrschluss, dass G jede Funktion f α mit α < ε0 dominiert, und damit folgt aus dem Satz von Kreisel, dass es unmöglich ist, Formel (4.34) innerhalb der PeanoArithmetik zu beweisen. Aus der Äquivalenz des Satzes von Goodstein und der Totalität von G(x) folgt jetzt sofort das gesuchte Ergebnis: Satz 4.11 (Kirby, Paris, 1982) Der Satz von Goodstein ist innerhalb von PA unbeweisbar.
1
1
0
1
0
1
0
1
0
0
0
0
(4.36)
für alle x beweisen können. Gleichzeitig attestiert uns Satz 4.11: (4.37)
Beide Varianten unterscheiden sich nur dadurch, dass die Quantifikation über x in (4.36) außerhalb des Kalküls und in (4.37) innerhalb des Kalküls vorgenommen wurde. Erneut wird deutlich, wie penibel wir zwischen der Kalkülebene (∀x) und der Meta-Ebene (für alle x) unterscheiden müssen.
0
0
0 ...
...
0
...
Existieren Funktionen, die schneller wachsen als die GoodsteinFunktion? Die Antwort ist Ja! Eine bekanntes Beispiel ist die Biber-Funktion B(n) (busy beaver function), die der ungarische Mathematiker Tibor Radó 1962 im Rahmen eines Wettbewerbs formulierte [15, 144]. Das ausgerufene Ziel war es, eine Turing-Maschine (busy beaver) mit möglichst wenig Zuständen zu konstruieren, die möglichst viele Einsen auf ein leeres Band schreibt [15, 144]. Der Funktionswert B(n) ist die maximal mögliche Anzahl Einsen für einen Biber mit n Zuständen. Da für jedes n nur endlich viele Biber existieren, ist der Wert der Biberfunktion für alle n wohldefiniert. Trotzdem sind die Funktionswerte nur bis n = 4 exakt bekannt:
1
∀ x ∃ y ϕG (x, y)
1
0
0
B(1) B(2) B(3) B(4)
Ein interessanter Aspekt soll an dieser Stelle nicht unerwähnt bleiben. Auch wenn es nicht möglich ist, Formel (4.34) in PA herzuleiten, so können wir für jeden konkreten Wert von x durchaus beweisen, dass die Funktion G an der Stelle x definiert ist. Das bedeutet, dass wir ∃ y ϕG (x, y)
1
1
1
4
6
13
B(5) ≥ 4098
Auch wenn für n ≥ 5 nur noch grobe Abschätzungen existieren, lassen sich beeindruckende Aussagen über die Wachstumsrate von B(n) treffen. So lässt sich beweisen, dass die Biberfunktion stärker wachsen muss als jede berechenbare Funktion. Das bedeutet, dass B(n) sowohl die Ackermann-Funktion als auch die Goodstein-Funktion dominiert. Die Biberfunktion selbst ist unberechenbar, d. h., es ist nicht möglich, ein Verfahren zu konstruieren, mit dem sich der Funktionswert B(n) für alle n systematisch ermitteln lässt.
240
4 Beweistheorie
4.6 Aufgabe 4.1 Webcode 4689
Übungsaufgaben
Auf Seite 202 haben Sie gelernt, wie sich Formeln der Peano-Arithmetik auf natürliche Zahlen abbilden lassen. Diese Übungsaufgabe soll Ihnen einen Eindruck über die Größe der Zahlen vermitteln, mit denen wir es hier konkret zu tun haben. Versuchen Sie herauszufinden, welche Formeln den folgenden Gödelnummern entsprechen: a) 27945122556290792802283166332500000000000 b) 920783852754905293279042680914408826637119384453120000 Hinweis: Es ist sehr aufwendig, derart große Zahlen per Hand zu faktorisieren. Greifen Sie hierzu auf ein Software-Werkzeug wie Mathematica oder Maple zurück oder verwenden Sie das Web-Portal WolframAlpha.
Aufgabe 4.2 Webcode 4044
Verwenden Sie die auf Seite 205 beschriebene Methode, um die Gödelnummer der Formel ∃ x s(x) = x zu berechnen. Wiederholen Sie die Rechnung für die Formel 1 + 0 = 1.
Aufgabe 4.3 Webcode 4884
Eine clevere Art der Gödelisierung hat Raymond Smullyan in [172] vorgeschlagen. In seiner Codierung wird jedem Formelzeichen zunächst einer der folgenden Basiscodes zugeordnet:
Hinweis: Es reicht, wenn Sie die Gödelnummern in faktorisierter Schreibweise notieren. Beide Zahlen besitzen ausgeschrieben weit über hundert Dezimalziffern.
0 $ 1
$ 0
( $ 2
) $ 3
f $ 4
, $ 5
v $ 6
∼ $ 7
⊃ $ 8
∀ $ 9
= $ 10
≤ $ 11
$ 12
Anschließend werden die ermittelten Codes als Ziffern einer Zahl zur Basis 13 aufgefasst. Konkret: Besteht eine Formel ϕ aus n Zeichen und bezeichnen wir den Basiscode des i-ten Zeichens mit ci , so berechnet sich die Gödelnummer über die Formel ϕ := ∑ni=1 ci · 13n−i . a) Ermitteln Sie die Gödelnummer für die Formel ∀ v v = v. b) Smullyan verwendet in seiner Logik das Hochkomma für die Nachfolgerfunktion. 0 steht für die Zahl 1, 0 für die Zahl 2 und so fort. Welche Gödelnummer besitzt der Ausdruck, der stellvertretend für die natürliche Zahl n steht?
241
4.6 Übungsaufgaben
Gegeben sei ein Kalkül K, in dem sich Relationen und Funktionen auf die gleiche Weise arithmetisch repräsentieren lassen, wie wir es von der Peano-Arithmetik her gewohnt sind. A1 und A2 stehen für die folgenden Aussagen: A1 : Repräsentiert ϕ eine Relation R semantisch, so repräsentiert sie R auch syntaktisch. A2 : Repräsentiert ϕ eine Relation R syntaktisch, so repräsentiert sie R auch semantisch. Vervollständigen Sie die folgende Aussagenmatrix: Ist der Kalkül K . . . I
korrekt und vollständig, so ist
I
korrekt und negationsvollständig, so ist
I
widerspruchsfrei und vollständig, so ist
I
widerspruchsfrei und negationsvollständig, so ist
Aussage A1 wahr
falsch
Aussage A2 wahr
falsch
In Abschnitt 4.2.3 haben wir herausgearbeitet, wie sich Relationen durch arithmetische Formeln syntaktisch repräsentieren lassen. In dieser Aufgabe geht es darum, diesen Begriff auf Funktionen zu übertragen. In der Literatur werden eine schwache und eine starke Form der syntaktischen Repräsentierbarkeit unterschieden: Definition 4.7 (Syntaktisch repräsentierbare Funktion) Sei f : Nn → N eine Funktion und ϕ eine Formel mit n + 1 freien Variablen. f wird durch ϕ schwach syntaktisch repräsentiert, wenn gilt: 1. 2.
f (x1 , . . . , xn ) = y ⇒ ϕ(x1 , . . . , xn , y) f (x1 , . . . , xn ) = y ⇒ ¬ϕ(x1 , . . . , xn , y)
f wird durch ϕ stark syntaktisch repräsentiert, wenn für alle x1 , . . . , xn zusätzlich gilt: 3.
Aufgabe 4.4 Webcode 4449
∃1 y ϕ(x1 , . . . , xn , y)
a) Warum wird ausschließlich bei Funktionen zwischen einer schwachen und einer starken Variante unterschieden, nicht aber bei Relationen? b) Hat es Sinn, bei der semantischen Repräsentierbarkeit von Funktionen eine hierzu analoge begriffliche Unterscheidung vorzunehmen?
Aufgabe 4.5 Webcode 4870
242
Aufgabe 4.6 Webcode 4040
4 Beweistheorie
In Abschnitt 4.2 haben Sie die semantische und die syntaktische Variante des ersten Gödel’schen Unvollständigkeitssatzes kennen gelernt. Eine weitere Variante ist diese hier:
Widerspruchsfreie formale Systeme
Korrekte formale Systeme
Unvollständige formale Systeme
Negationsunvollständige formale Systeme
„Jedes korrekte formale System, das stark genug ist, um die Peano-Arithmetik zu formalisieren, ist negationsunvollständig.“
Die Formulierung ist stärker als die semantische Variante, aber schwächer als die syntaktische. Lässt sie sich dennoch mit wenig Aufwand aus der semantischen Variante herleiten?
Aufgabe 4.7 Webcode 4135
Betrachten Sie die folgende Argumentation: a) Jede wahre Aussage der Zahlentheorie ist eine logische Folgerungen aus den Peano-Axiomen. b) Die Peano-Arithmetik formalisiert die Peano-Axiome. Als Theorie erster Stufe erfüllt sie die Voraussetzungen des Gödel’schen Vollständigkeitssatzes. Dieser besagt, dass in Theorien erster Stufe alle logischen Folgerungen innerhalb des Kalküls bewiesen werden können. c) Aus a) und b) folgt, dass jede wahre Aussage der Zahlentheorie innerhalb der Peano-Arithmetik beweisbar ist. Offensichtlich steht das Ergebnis im Widerspruch zu Gödels erstem Unvollständigkeitssatz. Wo steckt der Fehler?
5 Berechenbarkeitstheorie
„If it should turn out that the basic logics of a machine designed for the numerical solution of differential equations coincide with the logics of a machine intended to make bills for a department store, I would regard this as the most amazing coincidence that I have ever encountered.“ Howard Aiken [41] Die Berechenbarkeitstheorie ist neben der Beweistheorie die zweite tragende Säule der mathematischen Logik. Unter ihrem Schirm vereint sie alle Methoden und Erkenntnisse, die sich mit den Möglichkeiten und Grenzen der algorithmischen Methode beschäftigen. Zwei Fragestellungen sind in diesem Zusammenhang von vorrangiger Bedeutung: I
Wie lässt sich der Berechenbarkeitsbegriff formal definieren? Jeder von uns besitzt eine intuitive Vorstellung davon, was es bedeutet, etwas zu berechnen. Bei genauerer Betrachtung entpuppen sich unsere Gedankenmodelle aber schnell als zu vage, um daraus handfeste Schlüsse zu ziehen. In der Berechenbarkeitstheorie wird die intuitive Vorstellung durch die Definition präziser Berechnungsmodelle mit einem formalen Unterbau versehen. Einige dieser Modelle besitzen durch und durch mathematischen Charakter, während sich andere sehr nahe an der Hardware-Architektur realer Computersysteme orientieren.
I
Wo sind die Grenzen der Berechenbarkeit? Es ist ein Kernergebnis der Berechenbarkeitstheorie, dass viele unentscheidbare Probleme existieren, Probleme, deren Lösungen zwar existieren, aber nicht auf algorithmischem Wege bestimmt werden können. Die Konsequenzen, die sich hieraus ergeben, sind folgenschwer, und ihre Auswirkungen sind weit über die Algorithmenoder Computertechnik hinaus zu spüren. So wissen wir heute, dass die Berechenbarkeits- und die Beweistheorie eng miteinander verflochten sind und sich viele Negativresultate des einen Gebiets auf das andere übertragen.
Behalten Sie stets im Auge, dass sich die Berechenbarkeitstheorie mit der Existenz von algorithmischen Lösungen beschäftigt, aber nicht mit deren Effizienz. Die ersten Arbeiten auf diesem Gebiet stammen aus einer Zeit, in der es den Computer in seiner modernen Form noch gar nicht gab, und so waren Fragen nach dem Ressourcenverbrauch eines algorithmischen Verfahrens ohne Belang. Eher zufällig erhielt die Berechenbarkeitstheorie mit dem Bau der ersten Rechenmaschinen eine ganz praktische Bedeutung. In der Folgezeit entstand mit der Komplexitätstheorie ein eigenständiger Forschungszweig, der sich mit der Laufzeitund der Platzkomplexität von Algorithmen beschäftigt. Die Berechenbarkeitstheorie und die Komplexitätstheorie sind mittlerweile zu einem festen Bestandteil des Informatikstudiums geworden, und jeder Absolvent ist heute mit den Grundzügen beider Theorien vertraut. Dennoch wissen nur wenige, dass insbesondere die Berechenbarkeitstheorie ihre Wurzeln gar nicht in der Informatik hat. Sie wurde geschaffen, um Fragestellungen der mathematischen Logik zu beantworten, und ist älter als der erste real gebaute Computer.
244
5 Berechenbarkeitstheorie
TuringMaschine
In diesem Kapitel werden wir uns diesen Zusammenhang in zweierlei Hinsicht zu Nutze machen. Zum einen werden wir zeigen, wie sich für bereits bekannte Ergebnisse der Beweistheorie verblüffend einfache Beweise konstruieren lassen. Zum anderen werden wir die Ergebnisse der Berechenbarkeitstheorie dazu verwenden, um bisher offene gebliebene Fragen zu beantworten.
Configuration m-config. b c e f
symbol None None None None
Behaviour final operations m-config. P0, R c R e P1, R f R b
b c e f
→ → → →
q1 q2 q3 q4
’None’ 0 1
→ → →
S0 S1 S2
5.1
Berechnungsmodelle
In den folgenden beiden Unterabschnitten werden wir mit der TuringMaschine und der Register-Maschine zwei der wichtigsten Berechnungsmodelle genauer untersuchen. Anschließend werden wir die Church’sche These diskutieren und dabei feststellen, dass es keine Rolle spielt, welches Modell wir für die Untersuchung des Berechenbarkeitsbegriffs konkret verwenden.
5.1.1
Turing-Maschinen
In Abschnitt 1.2.8 haben wir die grundlegende Funktionsweise von Turing-Maschinen dargelegt und auch schon eine konkrete Beispielmaschine in Aktion erlebt. Wir wollen nun daran gehen, den Turing’schen Maschinenbegriff formal zu definieren:
Q = {q1 , q2 , q3 , q4 } S = {S0 , S1 , S2 } I = {(q1 , S0 , S1 , R, q2 ),
Definition 5.1 (Turing-Maschine)
(q2 , S0 , S0 , R, q3 ),
Eine Turing-Maschine ist ein Tripel (Q, S, I). Sie besteht aus
(q3 , S0 , S2 , R, q4 ),
I
der endlichen Zustandsmenge Q = {q1 , . . . , qN },
I
dem Bandalphabet S = {S0 , . . . , SM } und
I
der Instruktionsmenge I = {I1 , . . . , IK }.
(q4 , S0 , S0 , R, q1 )} Abbildung 5.1: Formale Beschreibung der ersten Maschine aus Turings Originalarbeit
Eine Instruktion aus der Menge I hat die Form (qi , S j , Sk , L, ql ) oder (qi , S j , Sk , R, ql ) oder (qi , S j , Sk , N, ql ) mit qi , ql ∈ Q und S j , Sk ∈ S.
Abbildung 5.1 zeigt, wie sich die erste Beispielmaschine aus Turings Originalarbeit in der vereinbarten Nomenklatur beschreiben lässt. Es ist
245
5.1 Berechnungsmodelle
(qi , S j , Sk , L, ql ) I
...
(qi , S j , Sk , R, ql )
Wird im Zustand qi das Symbol S j gelesen, dann
Sj
...
I
...
(qi , S j , Sk , N, ql )
Sj
qi
I I I
...
Sk
...
...
Wird im Zustand qi das Symbol S j gelesen, dann
Sj
qi
I
ersetze S j durch Sk , gehe nach links, wechsle in den Zustand ql .
I
Wird im Zustand qi das Symbol S j gelesen, dann
I I
...
...
qi
I
ersetze S j durch Sk , gehe nach rechts, wechsle in den Zustand ql .
Sk
ql
Abbildung 5.2: Interpretation der Instruktionen einer Turing-Maschine
die gleiche Maschine, die uns in Abschnitt 1.2.8 als Demonstrationsobjekt treu zur Seite stand. Der Zustand q1 und das Bandsymbol S0 besitzen in unserem Modell eine besondere Bedeutung. q1 ist der Initialzustand oder Startzustand, in dem jede Turing-Maschine per Definition beginnt. Das Symbol S0 wird dazu verwendet, um eine leere Bandstelle zu markieren. Um es optisch von den anderen zu unterscheiden, verwenden wir für S0 auch das Zeichen . Turing ließ seine Maschinen stets auf einem leeren Band starten, d. h., auf einem Band, dessen Felder allesamt mit dem Symbol vorbeschrieben waren. Nach dem Start beginnt eine Turing-Maschine mit der Ausführung von Berechnungsschritten (Abbildung 5.2). Zu Beginn eines Berechnungsschritts liest sie das Zeichen unter dem Schreib-Lese-Kopf ein. Findet die Maschine dort beispielsweise das Bandzeichen S j , so sucht sie in
...
I I
... ql
...
ersetze S j durch Sk , behalte die aktuelle Position, wechsle in den Zustand ql .
Sk
ql
...
246
5 Berechenbarkeitstheorie
Abhängigkeit vom aktuellen Zustand qi nach einer passenden Instruktion der Form (qi , S j , _, _, _)
(5.1)
Die gefundene Instruktion wird ausgeführt und im nächsten Berechnungsschritt der gesamte Vorgang wiederholt. Zwei Sonderfälle dürfen wir an dieser Stelle nicht übergehen. Unsere Definition schließt nicht aus, dass für ein Bandzeichen S j und einen Zustand qi mehr als eine Instruktion der Form (5.1) existiert. Solche Maschinen heißen indeterministisch und spielen in der Komplexitätstheorie eine wichtige Rolle (siehe z. B. [89]). Für unsere Betrachtungen gehen wir davon aus, dass die betrachteten Turing-Maschinen allesamt deterministisch sind und somit für kein Bandzeichen S j und Zustand qi mehr als eine Instruktion der Form (5.1) existiert. Davon unberührt ist es immer möglich, dass überhaupt keine passende Regel gefunden werden kann. In diesem Fall hält die Maschine an und führt keine weiteren Berechnungen mehr aus; wir sagen, die Maschine terminiert. Wir wollen nun darangehen, den geschilderten Berechnungsablauf formal zu beschreiben. Im Kern steht der Begriff der Konfiguration, der uns erlaubt, den augenblicklichen Zustand einer Turing-Maschine im Sinne einer Momentaufnahme zu erfassen. Definition 5.2 (Konfiguration) Sei M = (Q, S, I) eine Turing-Maschine. Jeder Vektor der Form x = (q, i, s0 , s1 , . . . , sn ) heißt Konfiguration von M. I
q ist der aktuelle Zustand der Maschine,
I
i die Position des Schreib-Lese-Kopfs und
I
s0 , s1 , . . . , sn der bisher benutzte Bandabschnitt.
Weiter oben haben wir festgelegt, dass eine Turing-Maschine im Zustand q1 beginnt und alle Bandstellen initial mit dem Zeichen beschrieben ist. Demnach startet jede Turing-Maschine in der Start- oder Initialkonfiguration xStart := (q1 , 0, )
247
5.1 Berechnungsmodelle
Ausgehend von der Initialkonfiguration können wir die Berechnungssequenz einer Turing-Maschine in eine Folge von Konfigurationen übersetzen. Abbildung 5.3 demonstriert, wie diese für unsere Beispielmaschine aussieht. Behalten Sie stets im Gedächtnis, dass die Maschinen aus Turings Originalarbeit für die Erzeugung von reellen Zahlen konzipiert waren. Eine solche Maschine schreibt die Ziffern einer reellen Zahl nacheinander auf ein initial leeres Band und hält im Normalfall niemals an. An dieser Stelle werden wir Turings historische Route verlassen und das Verhalten seiner Maschinen in einem moderneren Sinne interpretieren; wir werden sie dazu verwenden, um Funktionen der Form
(q1 , 0 , ) (q1 , , S1 , R, q2 ) (q2 , 1 ,S1, ) (q2 , , , R, q3 ) (q3 , 2 ,S1, , ) (q3 , , S2 , R, q4 ) (q4 , 3 ,S1, ,S2, ) (q4 , , , R, q1 )
f : S ∗ → S∗ zu berechnen. Hierzu wird zunächst eine Eingabewort ω ∈ S∗ an einer beliebigen Stelle auf das Band geschrieben und der Schreib-Lese-Kopf auf das erste Zeichen positioniert. Anschließend werden die oben beschriebenen Berechnungsschritte durchgeführt. Terminiert die Maschine, so interpretieren wir den Bandinhalt als den Funktionswert f (ω). Terminiert sie nicht, so betrachten wir die Funktion f an der Stelle ω als undefiniert. Turing-Maschinen sind damit auf natürliche Weise in der Lage, partielle Funktionen zu berechnen. Im Folgenden bezeichnen wir jede Funktion, die sich auf die geschilderte Weise berechnen lässt, als Turing-berechenbar. Wir halten fest: Turing-Maschinen nehmen von Hause aus Zeichensequenzen entgegen und keine Zahlen. Wollen wir mit Turing-Maschinen arithmetische Operationen ausführen, d. h., Funktionen der Form f : N→N
(q1 , 4 ,S1, ,S2, , ) (q1 , , S1 , R, q2 ) (q2 , 5 ,S1, ,S2, ,S1 , ) (q2 , , , R, q3 ) (q3 , 6 ,S1, ,S2, ,S1 , , ) (q3 , , S2 , R, q4 ) (q4 , 7 ,S1, ,S2, ,S1 , ,S2, ) (q4 , , , R, q1 ) (q1 , 8 ,S1, ,S2, ,S1 , ,S2, , ) (q1 , , S1 , R, q2 )
berechnen, so müssen wir eine geeignete Codierung finden, die Zahlenwerte auf Wörter der Menge S∗ abbildet. Zwei Codierungen drängen sich an dieser Stelle regelrecht auf:
(q2 , 9 ,S1, ,S2, ,S1 , ,S2, ,S1, )
I
(q3 ,10,S1, ,S2 , ,S1, ,S2, ,S1 , , )
Unäre Codierung Die Ein- und Ausgabewerte werden durch Einserfolgen entsprechender Länge repräsentiert (vgl. Abbildung 5.4 Mitte). Die unäre Codierung besitzt den Vorteil, dass sich viele Algorithmen besonders einfach in eine entsprechende Turing-Maschine übersetzen lassen. Für Komplexitätsbetrachtungen ist sie nicht geeignet, da bereits das Schreiben einer Zahl n einen linear steigenden Aufwand verursacht.
(q2 , , , R, q3 )
(q3 , , S2 , R, q4 ) ... Abbildung 5.3: Konfigurationsübergänge der diskutierten Beispielmaschine
248
5 Berechenbarkeitstheorie
I Allgemeines Berechnungsschema
...
ω
f (ω)
...
...
Band I Unäre Codierung
...
1
1
1
Binäre Codierung Die Ein- und Ausgabewerte werden im Binärformat auf das Band geschrieben (vgl. Abbildung 5.4 unten). Die Codierung entspricht jener, die in realen Computersystemen zum Einsatz kommt. Im Bereich der Komplexitätstheorie ist die binäre Codierung die bevorzugte Darstellung, da sich viele Ergebnisse direkt auf reale Rechnerarchitekturen übertragen lassen.
...
TuringMaschine
f (ω) ...
I
Mithilfe einer Turing-Maschine lässt sich die unäre Codierung einer natürlichen Zahl vergleichsweise einfach in die binäre Codierung übersetzen und umgekehrt. Für die Problemstellungen aus dem Gebiet der Berechenbarkeitstheorie ist die Wahl der Codierung damit irrelevant, da es hier lediglich um die Frage geht, ob und nicht wie effizient eine Lösung gefunden werden kann. 5.1.1.1
f (3) = 4 TuringMaschine
f (x) = x + 1 ...
1
1
1
1
...
Erweiterungen des Basismodells
In der Vergangenheit wurden aus dem Turing’schen Maschinenmodell verschiedene Varianten abgeleitet, von denen wir drei skizzenhaft vorstellen wollen (Abbildung 5.5). Eine ausführliche Beschreibung der Maschinentypen finden Sie in [89] oder [173].
Band I I Binäre Codierung
...
1
1
Einseitig beschränkte Turing-Maschinen verwenden ein Band, das sich nur in einer Richtung unendlich weit ausbreitet. Ohne Beschränkung der Allgemeinheit können wir von einem nach links begrenzten Band ausgehen und die Felder mit den natürlichen Zahlen durchnummerieren. Der Bandanfang besitzt den Index 0 und speichert das erste Zeichen der Eingabesequenz. Der Schreib-Lese-Kopf einer einseitig beschränkten Turing-Maschine kann sich nicht über das Bandende hinausbewegen. Eine angeforderte Linksbewegung wird in diesem Fall ignoriert, und der Schreib-Lese-Kopf verharrt in seiner Position.
...
f (3) = 4 TuringMaschine
f (x) = x + 1 ...
1
0
0
...
Band
Abbildung 5.4: Die unäre und die binäre Codierung im Vergleich
Einseitig beschränkte Turing-Maschinen
I
Mehrspur-Turing-Maschinen Eine k-Spur-Turing-Maschine besteht aus einem Band, das in k separate Spuren unterteilt ist. Die einzelnen Spuren werden von fest aneinandergekoppelten Schreib-Lese-Köpfen angesprochen. Ähnlich dem Prinzip, das konventionellen Festplattenlaufwerken zugrunde liegt, können sich die Köpfe alle gleichzeitig nach links oder rechts, aber nicht unabhängig voneinander bewegen.
249
5.1 Berechnungsmodelle
Einseitig beschränkte Maschine
1
0
TuringMaschine
Band
...
...
1
1
0
0
...
...
...
0
1
...
Band 1
...
1
1
0
...
...
Band
1
1
0
...
0
1
...
Band 2 TuringMaschine
1
gMehrband-Maschineg
TuringMaschine
Mehrspur-Maschine
Abbildung 5.5: Die einseitige Beschränkung des Bandes sowie das Hinzufügen neuer Spuren oder Bänder ändert nichts an der Berechnungsstärke der Turing-Maschine. Die entstehenden Maschinenmodelle sind äquivalent.
I
Mehrband-Turing-Maschinen Eine k-Band-Turing-Maschine besteht aus k Bändern, die von separaten Schreib-Lese-Köpfen angesprochen werden. Im Gegensatz zu Mehrspur-Turing-Maschinen gestattet sie, dass alle Schreib-LeseKöpfe unabhängig voneinander bewegt werden.
Es ist ein bekanntes Ergebnis der Berechenbarkeitstheorie, dass sich die vorgestellten Maschinenmodelle ineinander überführen lassen und die gleiche Berechnungsstärke besitzen wie das Basismodell [89]. Konkret besagt die Äquivalenz das Folgende: Ist eine Funktion mit einer Turing-Maschine berechenbar, so ist sie z. B. auch mit einer einseitig beschränkten Turing-Maschine berechenbar und umgekehrt. Das gleiche gilt für die anderen Maschinentypen. Diese Eigenschaft wird in der Berechenbarkeitstheorie häufig ausgenutzt. Wird ein Ergebnis beispielsweise für einseitig beschränkte Maschinen hergeleitet, so stellen die Äquivalenzen sicher, dass die Ergebnisse auch für die anderen Maschinenmodelle Bestand haben. Am Beispiel der einseitig beschränkten Turing-Maschinen wollen wir demonstrieren, wie sich die verschiedenen Maschinenmodelle gegenseitig simulieren lassen. Einseitig beschränkte Turing-Maschinen lassen sich durch das Basismodell simulieren, indem das Bandende durch ein dediziertes Symbol ‚♦‘ markiert und für alle qi ∈ Q eine Instruktion (qi , ♦, ♦, R, qi )
250
5 Berechenbarkeitstheorie
♢
S1
S2
...
hinzugefügt wird. Hierdurch wird der Schreib-Lese-Kopf auf die Startposition zurückbewegt, bevor der Bandanfang verlassen wird.
TuringMaschine
Band
♢
S1
S2
...
TuringMaschine
Band
Die Umkehrung gilt ebenfalls, d. h., wir können jede Turing-Maschine durch eine einseitig beschränkte Turing-Maschine simulieren. Wir beginnen, indem wir den Bandanfang erneut mit dem dedizierten Symbol ‚♦‘ markieren. Anschließend bewegen wir den Schreib-Lese-Kopf nach rechts auf das erste Zeichen der Eingabe und starten die Maschine. Solange sich der Kopf rechts des ersten Eingabezeichens befindet, verläuft die Berechnung wie gehabt. Bewegt die Maschine den SchreibLese-Kopf jedoch über die linke Grenze hinaus, treffen wir also auf das vorher eingefügte Symbol ‚♦‘, so müssen wir ein wenig Sonderarbeit leisten. Wir schaffen zunächst Platz für ein neues Zeichen, indem wir den gesamten Bandinhalt um eine Stelle nach rechts verschieben (Abbildung 5.6). Anschließend führen wir die Berechnung in gewohnter Weise fort. Die Konstruktion zeigt, dass wir jede Turing-Maschine in eine äquivalente Maschine übersetzen können, die niemals versuchen wird, den Schreib-Lese-Kopf nach links über die Startposition hinauszubewegen.
♢
S1
S2
...
TuringMaschine
Band
Abbildung 5.6: Jede Turing-Maschine lässt sich durch eine einseitig beschränkte Maschine simulieren. Steht der Schreib-LeseKopf, wie hier, ganz links, so wird die Kopfbewegung simuliert, indem der gesamte Bandinhalt eine Stelle nach rechts kopiert wird. Das Symbol ‚♦‘ wird benötigt, um das linke Ende des Bands zu markieren.
5.1.1.2
Alternative Beschreibungsformen
Die bisherige Darstellung von Turing-Maschinen orientierte sich eng an Turings Originalarbeit. In diesem Abschnitt wollen wir eine andere Darstellungsvariante diskutieren, die auf den britischen Mathematiker Stephen Wolfram zurückgeht und sich an jener des linearen Automaten orientiert [197]. Lineare Automaten bilden eine Untergruppe der zellulären Automaten: Definition 5.3 (Zellulärer Automat) Ein zellulärer Automat (cellular automaton), kurz ZA, ist ein 4Tupel (Z, Q, ν, δ ). Er besteht aus I
der Zellmenge Z,
I
der endlichen Zustandsmenge Q,
I
der Nachbarschaftsfunktion ν : Z → Z n ,
I
der Zustandsübergangsfunktion δ : Q × Qn → Q
Ein zellulärer Automat setzt sich aus mehreren Elementarautomaten zusammen, die in der Menge Z zusammengefasst sind und als Zellen be-
251
5.1 Berechnungsmodelle
gVon-Neumann-Nachbarschaftg
gMoore-Nachbarschaftg
z1
z2
z3
z1
z2
z3
z4
z
z5
z4
z
z5
z6
z7
z8
z6
z7
z8
ν(z) = {z2 , z4 , z5 , z7 }
z1 z4
ν(z) = {z1 , z2 , z3 , z4 , z5 , z6 , z7 , z8 }
Abbildung 5.7: Verschiedene Nachbarschaftsbeziehungen zellulärer Automaten
zeichnet werden. Jede Zelle befindet sich zu jedem Zeitpunkt in einem von endlich vielen Zuständen aus der Menge Q. In der Literatur werden die Zustände gern durch verschiedene Farben dargestellt. In diesem Fall entspricht die Menge Q dem verfügbaren Farbvorrat. In einem zellulären Automaten stehen die einzelnen Zellen in ständiger Interaktion. Wie sich eine Zelle verhält, wird zum einen durch ihren eigenen, aktuell eingenommenen Zustand und zum anderen durch den Zustand ihrer Nachbarzellen bestimmt. In welcher Nachbarschaftsbeziehung sich die Zelle befinden, definiert die Funktion ν. Sie bildet eine Zelle z auf einen n-elementigen Vektor ab, der alle Nachbarn von z enthält. Abbildung 5.7 zeigt, dass mit ν beliebige Topologien von Nachbarschaftsbeziehungen modelliert werden können. Das Schaltverhalten eines zellulären Automaten wird durch die Zustandsübergangsfunktion δ bestimmt. Befinden sich die Nachbarzellen z1 , . . . , zn von z in den Zuständen qz1 , . . . , qzn , so lässt sich der Nachfolgezustand von z wie folgt berechnen: qz = δ (qz , qz1 , . . . , qzn )
gHexagon-Nachbarschaftg
(5.2)
Jede Auswertung von δ entspricht der Änderung des Zustands einer einzelnen Zelle. Lineare Automaten sind zelluläre Automaten mit einer eindimensionalen Topologie; die Zellen sind nebeneinander angeordnet und erstrecken sich in beide Richtungen in das Unendliche. Damit bilden sie exakt
z2 z z5
z3 z6
ν(z) = {z1 , z2 , z3 , z4 , z5 , z6 }
252
5 Berechenbarkeitstheorie
I Regelschema
Aktueller Zustand
Aktuelles Bandzeichen
Folgezustand und Bewegung nach links
Neues Bandzeichen
I Vollständiger Regelsatz
Regel 1
Regel 2
Regel 3
Regel 4
I Automat in Aktion
Zeit
Abbildung 5.8: Durch eine Modifikation des Grundmodells lassen sich lineare zelluläre Automaten für die Simulation von Turing-Maschinen einsetzen.
das unendliche Band nach, das wir für die Modellierung von TuringMaschinen benötigen. Der Bandinhalt wird durch die Färbungen der Zellen dargestellt, so dass wir die zur Verfügung stehende Farbmenge in direkter Weise als das Bandalphabet einer Turing-Maschine interpretieren können. Beachten Sie, dass die Berechnung in einem linearen Automaten verteilt erfolgt und alle Zellen parallel eine Zustandsänderung durchführen. Im Gegensatz hierzu arbeitet eine Turing-Maschine mit einem dedizierten Schreib-Lese-Kopf, der sich zu jeder Zeit an einer wohldefinierten Position befindet. Um das Verhalten einer Turing-Maschine trotzdem mithilfe eines linearen Automaten beschreiben zu können, müssen wir das Automatenmodell geringfügig anpassen. Zunächst erweitern wir den linearen Automaten um eine dedizierte Kopfzelle (head cell), die als Schreib-Lese-Kopf fungiert. Das Schaltverhalten des erweiterten linearen Automaten legen wir analog zur Funktionsweise der Turing-Maschine fest. In jedem Berechnungsschritt wird die Kopfzelle umgefärbt und gegebenenfalls um eine Position nach links oder rechts geschoben. Außerdem reichern wir die Kopfzelle um einen zusätzlichen Zustand an, der mit dem Zustand der modellierten Turing-Maschine identisch ist. Abbildung 5.8 zeigt, wie sich die Beispielmaschine aus Abbildung 5.1 in der Notation des modifizierten linearen Automaten beschreiben lässt. Die Zustände q1 , q2 , q3 , q4 werden durch die Richtungen der verwendeten Keilsymbole und die Bandzeichen S0 , S1 , S2 durch die unterschiedlichen Einfärbungen der Zellen repräsentiert. Jede der vier Instruktionen wird durch je zwei Farbfelder und zwei Keilsymbole beschrieben. Das obere Farbfeld definiert das aktuelle und das untere das neu zu schreibende Bandzeichen. Die Richtung des oberen Keils gibt an, in welchem Zustand sich die Maschine befinden muss, damit die entsprechende Regel angewendet werden kann. Der Folgezustand und die auszuführende Kopfbewegung werden durch den unteren Keil festgelegt. Ist das Keilsymbol links des Folgezustands eingezeichnet, bewegt sich der SchreibLese-Kopf nach links, ist es rechts eingezeichnet, bewegt er sich nach rechts. In unserem Beispiel führen alle Instruktionen eine Kopfbewegung nach rechts aus. In der Nomenklatur von Stephen Wolfram wird der so konstruierte Automat als 4,3-Maschine bezeichnet, da er insgesamt 4 Keilrichtungen und 3 Farben unterscheidet.
253
5.1 Berechnungsmodelle
Universelle Turing-Maschine
In seiner Arbeit aus dem Jahr 1936 hat Turing gezeigt, dass seine Maschinen zu weit mehr fähig sind, als einfache Berechnungen durchzuführen. Besonders eindrucksvoll stellte er dies mit der Konstruktion einer universellen Maschine unter Beweis, die in der Lage ist, andere Maschinen zu simulieren. In seiner Arbeit hat Turing die universelle Maschine ausführlich in §6 beschrieben. Seine Ausführung beginnt mit den folgenden Worten [180]:
I Turing-Maschine M
...
ω
...
Eingabeband von M Berechnung
5.1.1.3
M Ausgabeband von M
Abbildung 5.9 veranschaulicht auf grafische Weise, wie die universellen Turing-Maschine arbeitet. Als Eingabe nimmt sie die Beschreibung einer anderen Maschine M in einer codierten Form entgegen, die Turing als Standardbeschreibung bezeichnet (standard description, kurz S.D). Nach dem Start beginnt die universelle Turing-Maschine, das Verhalten von M Schritt für Schritt zu simulieren. Ist die Berechnung beendet, so steht der gleiche Inhalt auf dem Band, den auch M produziert hätte; von außen ist dann nicht mehr zu unterscheiden, ob die Bandausgabe von M selbst geschrieben wurde oder im Rahmen einer Simulation entstanden ist. Insgesamt ist die universelle Turing-Maschine in ihrer Funktionsweise dem modernen Computer sehr ähnlich; sie agiert als Interpreter, der das Verhalten einer anderen Maschine in stoischer Manier simuliert. Die Standardbeschreibung ist das Programm, das von der universellen Maschine nach dem Start abgearbeitet wird. Für die Definition der Standardbeschreibung machte sich Turing zu Nutze, dass das Verhalten einer Maschine durch ihre Instruktionsmenge eindeutig definiert ist. Werden die Instruktionen hintereinander aufgeschrieben, so entsteht eine Zeichenkette, aus der sich die Funktionsweise einer Turing-Maschine vollständig rekonstruieren lässt. Für die Maschine aus Abbildung 5.1 sieht diese Zeichenkette z. B. so aus: ; q1 S0 S1 Rq2 ; q2 S0 S0 Rq3 ; q3 S0 S2 Rq4 ; q4 S0 S0 Rq1 Mit dem Semikolon hatte Turing ein neues Symbol eingeführt, das als Trennzeichen fungiert. Seine universelle Maschine sucht gezielt nach diesem Symbol, um mit wenig Aufwand den Anfang oder das Ende einer Instruktion anzusteuern. Unbedingt benötigt wird es nicht, da sich
f (ω)
...
...
...
I Universelle Turing-Maschine U
M Codierung von M ...
S.D.
ω
Eingabeband von U Berechnung
„It is possible to invent a single machine which can be used to compute any computable sequence. If this machine U is supplied with a tape on the beginning of which is written the S.D of some computing machine M, then U will compute the same sequence as M. “
U Ausgabeband von U
...
f (ω)
...
Abbildung 5.9: Arbeitsweise der universellen Turing-Maschine. Eine andere Maschine M wird simuliert, indem M als Zeichenkette codiert und zusammen mit dem Eingabewort ω auf das Band von U geschrieben wird. Nach dem Start wird U den Bandinhalt analysieren und das Verhalten von M Schritt für Schritt simulieren.
254
5 Berechenbarkeitstheorie ⎫ ⎪ ⎪ ⎬
(q1 , S0 , S1 , R, q2 ) (q2 , S0 , S0 , R, q3 ) (q3 , S0 , S2 , R, q4 ) (q4 , S0 , S0 , R, q1 )
Instruktions⎪ tabelle ⎪ ⎭
⎫ ⎪ ⎪ ⎬
; q1 S0 S1 Rq2 ; q2 S0 S0 Rq3 ; q3 S0 S2 Rq4 ; q4 S0 S0 Rq1
⎪ ⎪ ⎭
; DADDCRDAA ; DAADDRDAAA ; DAAADDCCRDAAAA ; DAAAADDRDA
Instruktionskette
A ↔1 L ↔4 ; ↔7
i-mal
⎫ ⎪ ⎪ ⎬ ⎪ ⎪ ⎭
C ↔2 R ↔5
Standard description (S.D) D↔3 N ↔6
⎫ 7313325311731133 . . . ⎬ Description number 5311173111332253 . . . ⎭ (D.N) 111173111133531 Abbildung 5.10: Turing-Maschinen
Abbildung 5.10 zeigt, wie es weitergeht. Nachdem die Instruktionskette gebildet ist, werden die Symbole qi und Si nach dem folgenden Schema durch die Bandsymbole D, A und C ersetzt. qi := D AAA . . . A
qi := D A . . A, Si := D C . . .C . i-mal
die Instruktionen mit etwas Zusatzaufwand auch ohne das Semikolon rekonstruieren lassen.
Gödelisierung
von
Ein Blick in Turings Originalarbeit deckt auf, dass dort eine andere Gödelnummer abgedruckt ist als jene, die wir in Abbildung 5.10 ermittelt haben. Schuld daran ist die Position des Semikolons. In seinen Erklärungen hatte Turing das Symbol benutzt, um das Ende einer Instruktion zu markieren, ganz so, wie es in modernen Programmiersprachen üblich ist. In Wahrheit funktioniert seine universelle Maschine aber anders; sie erwartet das Semikolon am Anfang und nicht am Ende einer Instruktion [136].
i-mal
Si := DCCC . . .C i-mal
Als Ergebnis erhalten wir das, was Turing als standard description, kurz S.D, bezeichnet. Es ist eine Folge von Zeichen, die das Verhalten der codierten Maschine eindeutig beschreibt. Zusätzlich hat Turing den Begriff der description number, kurz D.N, eingeführt. Sie wird aus der Standardbeschreibung gewonnen, indem jedes Zeichen durch eine festgelegte Ziffer ersetzt wird. Den Einfluss, den die Gödel’sche Arbeit aus dem Jahr 1931 auf Turing gehabt haben muss, wird an keiner anderen Stelle so deutlich wie hier. Gödel hatte gezeigt, dass sich die Formeln eines formalen Systems in natürliche Zahlen übersetzen lassen. Turings Codierung erfüllt den gleichen Zweck; sie zeigt, dass wir das Verhalten einer Turing-Maschine vollständig in eine einzige natürliche Zahl hineincodieren können. Wir wollen die Gemeinsamkeit auch sprachlich zum Ausdruck bringen und die description number einer Turing-Maschine M im Folgenden als die Gödelnummer von M bezeichnen. Turing war sich der großen Bedeutung seiner universellen Maschine bewusst und beschrieb sie in entsprechend großer Akribie. Neben einer mehrseitigen Erklärung der grundlegenden Funktionsweise ist in seiner Arbeit die vollständige Instruktionstabelle abgedruckt (vgl. Abbildung 5.11 und 5.12). Die universelle Maschine ist modular aufgebaut und setzt sich aus mehr als 50 Einzelmaschinen zusammen, die sich gegenseitig referenzieren. Um eine möglichst kompakte Darstellung zu erreichen, ließ er den Folgezustand einer Maschine auf den Startzustand einer anderen Maschine verweisen und versah die Referenz zusätzlich mit einem oder mehreren Parametern. Auf diese Weise hatte Turing einen Sprungbefehl erschaffen und damit auf ein Konzept zurückgegriffen, das viele Jahre später zum Standardrepertoire imperativer Programmiersprachen werden sollte. J. P. Burgess bezeichnet die universelle Maschine als „one of the intellectual landmarks of the last century“ [13], und es ist unzweifelhaft, dass Turing 1936 ein begeisterndes Kapitel Wissenschaftsgeschichte geschrieben hat. Teil dieses Kapitels sind aber auch zwei kleine Schönheitsfehler, die an dieser Stelle nicht unerwähnt bleiben sollen:
255
5.1 Berechnungsmodelle
L
f(C, B, α)
L
f(C, B, α) f1 (C, B, α)
R
f2 (C, B, α)
R
f1 (C, B, α)
R
B
cpe(U, F, α, β ) q(C)
f(pe1 (C, β ), C, ) R, R
pe1 (C, β )
Pβ
C
l(C)
L
C
r(C)
R
C
f (C, B, α)
f(l(C), B, α)
f (C, B, α)
f(r(C), B, α) f (c1 (C), B, α)
c(C, B, α) β
pe(C, β )
ce(C, B, α)
c (e(C, B, α), B, α)
ce(B, α)
ce (ce(B, α), B, α)
cp(C, U, F, α, β )
⎧ ⎨
γ
f (cp2 (C, U, γ), U, β )
γ
C
⎩ Not γ
U
cpe(C, U, F, α, β )
C
⎩ None
c1 (C)
cp2 (C, U, γ)
C R
⎧ ⎨ Any
pe1 (C, β )
cp1 (C, U, β )
f (cp1 (C1 , U, β ), f(U, C, β ), α)
cp (e (e(C, C, β ), C, α) , U, F, α, β ) ⎧ ⎨ Any
⎩ None ⎧ ⎨ Any q1 (C) ⎩ None q(C, α) q1 (C, α)
⎧ ⎨
cpe (cpe(U, F, α, β ), U, F, β ) R
q(C)
R
q1 (C)
R
q(C) C q (q1 (C, α))
α
C
⎩ Not α
L
q1 (C, α)
pe2 (C, α, β )
pe (pe(C, β ), α)
ce2 (B, α, β )
ce (ce(B, β ), α)
ce3 (B, α, β , γ)
ce (ce2 (B, β , γ), α)
ce4 (B, α, β , γ, δ ) ce5 (B, α, β , γ, δ , ε) e(C)
ce (ce3 (B, β , γ, δ ), α) ⎧ ⎨
ce (ce4 (B, β , γ, δ , ε), α) e
e
pe(C, β )
f1 (C, B, α)
R
e1 (C)
⎩ Not L e(C) ⎧ ⎨ Any R, E, R e (C) 1 e1 (C) ⎩ None C e
Not ⎪ ⎪ ⎪ ⎩ None ⎧ ⎪ α ⎪ ⎪ ⎨ f1 (C, B, α) Not α ⎪ ⎪ ⎪ ⎩ None ⎧ ⎪ ⎪ ⎨ α f2 (C, B, α) Not α ⎪ ⎪ ⎩ None
L
e
e
f(C, B, α)
⎧ ⎪ ⎪ ⎪ ⎨
Abbildung 5.11: Hilfsroutinen für die Konstruktion von Turings universeller Maschine aus dem Jahr 1936 [180]. Die farblich hervorgehobenen Passagen sind Korrekturen, die später von Emil Post und Donald Davies eingebracht wurden [37, 136].
I
Streng genommen arbeitet Turings universelle Maschine nicht exakt so, wie es in Abbildung 5.9 beschrieben ist. Das Problem stellt sich wie folgt dar: Simuliert die Maschine U die Maschine M, so ist sichergestellt, dass U die gleiche Ziffernfolge wie M generiert, allerdings erscheinen die Ziffern nicht an den gleichen Bandpositionen. Turings hatte seine Maschine so konstruiert, dass sie zusätzliche Hilfszeichen auf das Band schreibt, die zur Ablaufsteuerung dienen. Für ihn spielte der unterschiedliche Bandinhalt keine Rolle. Interpretieren wir aber den kompletten Bandinhalt als Ausgabe, so wie es heute üblich ist, dann produziert die universelle Maschine U eine andere Ausgabe als die simulierte Maschine M.
256
5 Berechenbarkeitstheorie
b
f(b1 , b1 , ::)
b1
R, R, P :, R, R, PD, R, R, PA
anf anf1 con(C, α)
con1 (C, α)
con2 (C, α)
kom
anf
mk1
q(anf1 , :) ⎧ ⎨ ⎩ ⎧ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎩ ⎧ ⎨ ⎩ ⎧ ⎪ ⎪ ⎪ ⎨
con(kom, y) Not A
R, R
con(C, α)
A
L, Pα, R
con1 (C, α)
A
R, Pα, R
con1 (C, α)
D
R, Pα, R
con2 (C, α)
None
PD, R, Pα, R, R, R C
C
R, Pα, R
Not C
R, R
;
R, Pz, L
z ⎪ ⎪ ⎪ ⎩ Not z nor ;
con2 (C, α) C con(kmp, x)
L, L
kom
L
kom cpe(e(kom, x, y), sim, x, y)
sim
f (sim1 , sim1 , z)
sim2 sim3 mk
⎧ ⎨ ⎩ ⎧ ⎨ ⎩
con(sim2 , ) sim3
A Not A
L, Pu, R, R, R
Not A
L, Py
A
L, Py, R, R, R
mk3 mk4 mk5
kmp
sim1
mk2
sim2 e(mk, z) sim3 q(mk1 , :)
sh
⎧ ⎨ ⎩ ⎧ ⎪ ⎪ ⎨
Not A
R, R
mk1
A
L, L, L, L
mk2
C
R, Px, L, L, L
mk2
⎪ ⎪ ⎩ ⎧ ⎨
D
R, Px, L, L, L
mk3
Not :
R, Pv, L, L, L
mk3
⎩
:
inst
inst1
mk4 con (l (l(mk5 )) , )
⎧ ⎨
Any
R, Pω, R
mk5
⎩
None
P:
sh f(sh1 , inst, u)
⎧ ⎨
D ⎩ Not D ⎧ ⎨ C sh3 ⎩ Not C ⎧ ⎨ C sh4 ⎩ Not C ⎧ ⎨ C sh5 ⎩ Not C sh2
mk4
:
⎧ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎩
R, R, R, R
sh3 inst
R, R
sh4 inst
R, R
sh5 pe2 (inst, 0, :) inst pe2 (inst, 1, :) q (l(inst1 ), u)
L
R, E
ce5 (ov, v, y, x, u, w)
R
R, E
ce5 (ov, v, x, u, y, w)
N
R, E
ce5 (ov, v, x, y, u, w)
Abbildung 5.12: Ein Stück Wissenschaftsgeschichte: Alan Turings universal machine aus dem Jahr 1936 [180]. Die farblich hervorgehobenen Passagen sind Korrekturen, die später von Emil Post und Donald Davies eingebracht wurden [37, 136].
I
Turings ursprüngliche Instruktionstabelle ist an mehreren Stellen fehlerhaft. Vereinzelt hatte er Symbole vertauscht, die falschen Indizes verwendet oder schlicht eine Instruktionsregel vergessen. Viele dieser Fehler wurden später von Emil Post und Donald Davies entdeckt [37, 136]. Die meisten davon sind vergleichsweise einfach zu korrigieren; sie sind das, was wir heute als typische Implementierungsfehler bezeichnen.
257
5.1 Berechnungsmodelle
I
Schwerer wiegt, dass Turing auch architektonische Fehler unterliefen, die sich kaum beseitigen lassen. Beispielsweise versagt die Simulation bei Maschinen, die den Schreib-Lese-Kopf mehrmals an die gleiche Stelle bewegen und eine vormals geschriebene Ziffer durch eine andere ersetzen. Wahrscheinlich hatte Turing diesen Fall schlicht nicht bedacht, da er gedanklich immer nur solche Maschinen im Sinn hatte, die eine reelle Zahl Ziffer für Ziffer von links nach rechts auf das Band schreiben. Dennoch lässt sein Maschinenmodell das geschilderte Verhalten explizit zu.
Dass seine Maschine in ihrer ursprünglichen Form kleine Fehler aufweist, mindert Turings Leistung nicht. Die Defizite sind nicht von grundsätzlicher Natur, und so war es nur eine Frage der Zeit, bis die ersten Maschinen entwickelt wurden, die jede andere Turing-Maschine fehlerfrei simulieren konnten und damit exakt so funktionierten, wie es in Abbildung 5.9 beschrieben ist. Ein Meilenstein in dieser Richtung war die universelle Turing-Maschine von Marvin Minsky aus dem Jahr 1962. Sie beseitigte sämtliche Fehler und Limitierungen des Turing’schen Originalentwurfs und war zudem deutlich einfacher aufgebaut; die Minsky-Maschine unterscheidet lediglich 7 Zustände und 4 Bandzeichen. In der von Stephen Wolfram vorgeschlagenen Nomenklatur wird sie als 7,4-Maschine bezeichnet. Im Jahr 2002 stellte Wolfram eine weiterentwickelte Maschine vor, die ebenfalls universell ist, aber mit noch weniger Zuständen auskommt (Abbildung 5.13 oben). Während Minskys Modell noch 7 Zustände benötigte, kommt die neue 2,5-Maschine mit nur 2 Zuständen aus. Die Anzahl der Bandzeichen musste Wolfram allerdings von 4 auf 5 erhöhen. Bedeutender sollte jedoch seine zeitgleich veröffentlichte 2,3Maschine werden (Abbildung 5.13 unten). Wolfram schlug die Maschine als einen potenziellen Kandidaten für die kleinstmögliche universelle Turing-Maschine vor [197]. Obwohl er seine Vermutung nicht beweisen konnte, erzielte er ein beachtliches Zwischenresultat: Ihm gelang der Nachweis, dass 2 Bandzeichen und 2 Zustände nicht ausreichen, um die Eigenschaft der Universalität zu erreichen. Wäre die 2,3-Maschine also tatsächlich universell, so wäre sie gleichzeitig die kleinste. 2007 hat die Suche nach der kleinstmöglichen universellen Maschine ein erfolgreiches Ende gefunden. In jenem Jahr gelang dem 20-jährigen Briten Alex Smith der Nachweis, dass die 2,3-Maschine tatsächlich universell ist. Leider ist sie nicht einfach zu „programmieren“. Bevor eine Maschine simuliert werden kann, muss sie mit einem speziellen Compiler in eine passende Eingabe übersetzt werden, die bereits für primitive Maschinen eine gigantische Größe erreicht.
I 2,5-Maschine
(q1 , S4 , S3 , L, q2 ) (q1 , S3 , S4 , R, q2 ) (q1 , S2 , S0 , R, q1 ) (q1 , S1 , S0 , R, q1 ) (q1 , S0 , S1 , L, q1 )
(q2 , S4 , S2 , L, q2 ) (q2 , S3 , S4 , R, q2 ) (q2 , S2 , S4 , R, q1 ) (q2 , S1 , S0 , R, q1 ) (q2 , S0 , S3 , L, q1 )
I 2,3-Maschine
(q1 , S2 , S1 , L, q1 ) (q1 , S1 , S2 , L, q1 ) (q1 , S0 , S1 , R, q2 )
(q2 , S2 , S1 , R, q1 ) (q2 , S1 , S2 , R, q2 ) (q2 , S0 , S2 , L, q1 )
Abbildung 5.13: Turing-Maschinen von Stephen Wolfram aus dem Jahr 2002 [197]
258
Speicher Ri i 1 2 3 4 5 ...
5 Berechenbarkeitstheorie
Programm Li i 1 2 3 4 5 ...
5.1.2
In diesem Abschnitt werden wir mit der Registermaschine ein Berechnungsmodell besprechen, das in Aufbau und Funktion dem realen Computer sehr ähnlich ist [94,120,121]. Anders als bei der Turing-Maschine ist kein Band mehr vorhanden; stattdessen existieren mehrere Register, die natürliche Zahlen beliebiger Größe aufnehmen können und sich wie bei realen Computern über eine individuelle Speicheradresse direkt ansprechen lassen (Abbildung 5.14). Das aufwendige Hin- und Herbewegen eines Schreib-Lese-Kopfs, wie wir es von der Turing-Maschine her gewöhnt sind, kann hierdurch vollständig entfallen. Gesteuert wird die Registermaschine über ein Programm, das aus einer nummerierten Liste von Instruktionen besteht.
Abbildung 5.14: Allgemeiner Aufbau einer Registermaschine
Der Begriff der Registermaschine wird in der Literatur unterschiedlich definiert. Manche Autoren statten die Maschinen mit unendlich vielen Registern aus, die entweder beliebig große natürliche Zahlen speichern können oder nur Zahlen aus einem begrenzten Bereich. Noch unterschiedlicher fallen die Befehlssätze aus. Der hier vorgestellte Maschinentyp basiert auf einer Sprache, die in der Literatur gern als Goto-Sprache bezeichnet wird [89, 161, 173]. Andere Maschinenmodelle nutzen dagegen Instruktionen, die an die Assembler-Sprachen der frühen Mikroprozessoren erinnern [49, 89]. Das Eingabe- und Ausgabeverhalten wird ebenfalls unterschiedlich gehandhabt. Einige Maschinentypen tauschen die Eingabe- und Ausgabewerte nicht, wie hier, über die Register, sondern über spezielle Speicherbänder aus [49, 89]. Es ist ein bedeutendes Ergebnis der Berechenbarkeitstheorie, dass sich die genannten Unterschiede nicht auf die Berechnungsstärke auswirken und es daher keine Rolle spielt, welches dieser Modelle für die Untersuchungen des Berechenbarkeitsbegriffs verwendet wird.
Registermaschinen
Definition 5.4 (Registermaschine) Eine Registermaschine ist ein Tupel (R, I). Sie besteht aus I
der endlichen Registermenge R = {R1 , . . . , Rr } und
I
der endlichen Instruktionsmenge I = {L1 , . . . , Ll }.
Jede Instruktion hat eine der folgenden Formen: I
Li : R j ← R j + 1
I
Li : goto Ln
(n = i + 1)
I
Li : R j ← R j − 1
I
Li : if R j = 0 goto Ln
(n = i + 1)
I
Li : stop
I
Li : if R j = 0 goto Ln
(n = i + 1)
Nach dem Start einer Registermaschine werden alle Register per Definition mit dem Wert 0 initialisiert, und es wird mit der Ausführung der Instruktion L1 begonnen. Die Auswahl der Folgeinstruktion funktioniert so, wie wir es von imperativen Programmiersprachen gewöhnt sind. Normalerweise folgt auf die Instruktion Li die Instruktion Li+1 , es sein denn, der Kontrollfluss wird durch einen unbedingten Sprung (goto) oder einen bedingten Sprung (if goto) direkt beeinflusst oder die Berechnung mit dem Befehl stop explizit beendet. Registermaschinen verfügen über rudimentäre Arithmetikfähigkeiten, die im Vergleich zu realen Computern spartanisch wirken; außer der Möglichkeit, den Inhalt eines Registers um eins zu erniedrigen oder zu erhöhen, werden keine anderen Operationen unterstützt. Für die Subtraktion existiert eine Sonderregel. Da Registermaschinen keine negativen Zahlen verarbeiten können, wird die Subtraktion saturiert ausge-
259
5.1 Berechnungsmodelle
Berechnende Maschine
i
Speicher Ri
Ein- und 1 2 Ausgabe 2 3 4 ...
Inhalt von R1
Akzeptierende Maschine
Programm Li
Speicher Ri i 1 Eingabe 2 3 4 5 ...
i 1 2 3 4 5
...
Ja
Programm Li
i 1 2 3 4 5
Eingabe akzeptiert?
...
Nein
Abbildung 5.15: Transduktoren und Akzeptoren im Vergleich
führt. Das bedeutet, dass die Berechnung 0 − 1 nicht dem Wert −1, sondern den Wert 0 liefert. Genau wie Turing-Maschinen lassen sich auch Registermaschinen auf zwei unterschiedliche Arten nutzen: I
Als berechnende Maschine (Abbildung 5.15 links) In diesem Fall nimmt die Maschine in Register R1 die Eingabe entgegen und legt dort auch das Ergebnis ab [95]. Alle anderen Register stehen für die Speicherung von Zwischenergebnissen zur Verfügung. Eine berechnende Maschine wird auch als Transduktor bezeichnet.
I
Als akzeptierende Maschine (Abbildung 5.15 rechts) Anstatt einen konkreten Ergebniswert zu berechnen, liefert die Maschine in diesem Fall lediglich eine Ja-Nein-Antwort. Wir sagen, eine Registermaschine akzeptiert die Eingabe in R1 , wenn sie nach endlich vielen Schritten terminiert und zu diesem Zeitpunkt alle Register den Wert 0 enthalten [94]. Andernfalls wird die Eingabe nicht akzeptiert. Wir sagen auch, die Eingabe wird zurückgewiesen oder verworfen.
L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L11 L12 L13 L14 L15 L16 L17 L18 L19 L20
if R1 = 0 goto L20 R2 ← R2 + 1, R3 ← R3 + 1 R1 ← R1 − 1 if R1 = 0 goto L16 R1 ← R1 − 1 R4 ← R4 + 1, R5 ← R5 + 1 R3 ← R3 − 1 if R3 = 0 goto L6 R4 ← R4 + 1, R2 ← R2 − 1 if R2 = 0 goto L9 R3 ← R3 + 1, R4 ← R4 − 1 if R4 = 0 goto L11 R2 ← R2 + 1, R5 ← R5 − 1 if R5 = 0 goto L13 if R1 = 0 goto L5 R3 ← R3 − 1 if R3 = 0 goto L16 R2 ← R2 − 1, R1 ← R1 + 1 if R2 = 0 goto L18 stop
Abbildung 5.16: Registermaschinenprogramm aus [95]
260
5 Berechenbarkeitstheorie
Befehl
R1 R2 R 3 R 4 R 5
Befehl
R1 R2 R3 R4 R5
0
2
0
0
0
0
L1
if R1 = 0 goto L20
1
2
0
0
0
0
L2
R2 ← R 2 + 1 R3 ← R 3 + 1
13
0
0
2
0
1
L12
2
2
1
1
0
0
L3
R1 ← R 1 − 1
14
0
0
2
0
1
L13
3
1
1
1
0
0
L4
if R1 = 0 goto L16
4
1
1
1
0
0
L5
R1 ← R 1 − 1
15
0
1
2
0
0
L14
if R5 = 0 goto L13
5
0
1
1
0
0
L6
R4 ← R 4 + 1
16
0
1
2
0
0
L15
if R1 = 0 goto L5
R5 ← R 5 + 1
17
0
1
2
0
0
L16
R3 ← R 3 − 1
12
0
0
1
1
1
L11
R3 ← R 3 + 1 R4 ← R 4 − 1 if R4 = 0 goto L11
R2 ← R 2 + 1 R5 ← R 5 − 1
6
0
1
1
1
1
L7
R3 ← R 3 − 1
18
0
1
1
0
0
L17
if R3 = 0 goto L16
7
0
1
0
1
1
L8
if R3 = 0 goto L5
19
0
1
1
0
0
L16
R3 ← R 3 − 1
8
0
1
0
1
1
L9
R4 ← R 4 + 1
20
0
1
0
0
0
L17
if R3 = 0 goto L16
R2 ← R 2 − 1
21
0
1
0
0
0
L18
R2 ← R 2 − 1
9
0
0
0
2
1
L10
if R2 = 0 goto L7
10
0
0
0
2
1
L11
R3 ← R 3 + 1
22
1
0
0
0
0
L19
if R2 = 0 goto L18
R4 ← R 4 − 1
23
1
0
0
0
0
L20
stop
11
0
0
1
1
1
L12
R1 ← R 1 + 1
if R4 = 0 goto L11
Abbildung 5.17: Ablaufprotokoll für die Eingabe R1 = 2
Als Beispiel ist in Abbildung 5.16 das Registermaschinenprogramm aus der bekannten Arbeit „Proof of Recursive Unsolvability of Hilbert’s Tenth Problem“ von James P. Jones und Juri Matijaseviˇc aus dem Jahr 1991 abgedruckt [95]. Das Programm ist für einen Transduktor, d. h. für eine berechnende Maschine ausgelegt. Wird es mit der Eingabe R1 = 2 gestartet, so werden nacheinander die in Abbildung 5.17 dargestellten Berechnungsschritte ausgeführt. Nach 23 Schritten hält die Maschine an und hinterlässt in R1 den Ergebniswert 1. Vielleicht ist Ihnen aufgefallen, dass Jones und Matijaseviˇc geringfügig von den getroffenen Vereinbarungen aus Definition 5.14 abgewichen sind, da sie in den Zeilen L2 , L6 , L9 , L11 , L13 und L18 mehrere Einzelinstruktionen zu einem gemeinsamen Befehl zusammengefasst haben. Diese Verallgemeinerung stellt uns vor keinerlei Probleme, da wir zusammengefasste Befehle jederzeit auf mehrere Zeilen aufteilen können.
261
5.2 Die Church’sche These
n 11Aug
Viele Errungenschaften auf dem Gebiet der Berechenbarkeitstheorie sind mit dem Namen Alonzo Church verbunden. Geboren wurde der amerikanische Logiker am 14. Juni 1903 in Washington, D.C. Die Schule besuchte er in Ridgefield, Connecticut. Nach dem Studium und der Promotion an der Princeton University folgten Aufenthalte in Chicago, Harvard, Göttingen und Amsterdam. Nach seiner Rückkehr in die USA wurde er 1929 in Princeton zum Assistant Professor, 1939 zum Associate Professor und 1947 zum Full Professor ernannt. Church blieb Princeton lange treu. Erst nach seiner Emeritierung im Jahr 1967 wechselte er an die University of California, Los Angeles, wo er weitere 23 Jahre lehrte und forschte. Drei Jahre nach seiner zweiten Emeritierung, am 11. August 1995, starb Alonzo Church in Hudson, Ohio, im Alter von 92 Jahren. Zu seinen größten Leistungen gehört die Entdeckung des λ Kalküls im Jahr 1930. Mit ihm wollte Church die Mathematik mit einem formalen Unterbau versehen, der frei von Paradoxien, aber weniger umständlich sein sollte als die konkurrierende Typentheorie von Russell und Whitehead. Damals
14 J u
1903 1995
5.2
war noch nicht abzusehen, dass die Zukunft des λ -Kalküls nicht in der Mathematik, sondern in der Informatik liegen würde. Im Laufe der Zeit wurde er zu einem wertvollen Hilfsmittel für die formale Untersuchung von Programmiersprachen und bildet heute den operativen Kern der funktionalen Programmiersprachen Lisp. Im Jahr 1936 gelang es Church, aus dem λ -Kalkül das gleiche Ergebnis abzuleiten, das Turing wenige Monate später mithilfe der Turing-Maschine erzielte: die Unentscheidbarkeit der Prädikatenlogik erster Stufe [29]. Damit nahm er das Hauptresultat aus Turings berühmter Publikation zwar zeitlich vorweg, sein Beweis besaß aber bei Weitem nicht die Klarheit und Eleganz des Turing’schen Ansatzes. Ebenfalls aus dem Jahr 1936 stammt die berühmte Church’sche These [30], die wir in Abschnitt 5.2 diskutieren. Rückblickend dürfen wir Church als den geistigen Ziehvater einer neuen Logikergeneration bezeichnen. Unter seinen 31 Doktoranden befinden sich mit Martin Davis, Leon Henkin, Stephen Kleene, Michael Oser Rabin, Barkley Rosser, Dana Scott, Raymond Smullyan und Alan Turing namhafte Logiker, von denen uns die meisten an anderer Stelle dieses Buchs schon begegnet sind oder noch begegnen werden.
Die Church’sche These
Mit der Turing-Maschine und der Registermaschine haben wir zwei Berechnungsmodelle kennen gelernt, die auf den ersten Blick sehr unterschiedlich wirken. Aus der Ferne betrachtet scheint die Registermaschine das leistungsfähigere Berechnungsmodell zu sein, da alle Register frei adressiert werden können und sich hierdurch viele Algorithmen ohne große Umwege in ein Registermaschinenprogramm übersetzen lassen. Auf den ersten Blick wirkt auch ihr Speicher größer als der einer Turing-Maschine. Anstelle eines einzelnen Bands existiert eine frei wählbare Anzahl von Registern, die beliebig große natürliche Zahlen speichern können. Erst auf den zweiten Blick wird deutlich, dass die großzügige Gestaltung des Maschinenmodells zu keiner Steigerung der Berechnungsstärke führt. Jede Funktion, die mithilfe einer Registermaschine berechnet werden kann, ist auch mithilfe einer Turing-Maschine berechenbar [121]. Lässt sich diese Beobachtung verallgemeinern? Um der Antwort näher zu kommen, werden wir kurz eine Reihe weiterer Berechnungsmodelle skizzieren. Anschließend werden wir klären, ob sich die Berechnungsstärke der Turing-Maschine mit einem dieser Modelle überbieten lässt.
262
5 Berechenbarkeitstheorie
while x1 = 0 do
I
x3 := x2 ; while x3 = 0 do x0 := succ(x0 ); x3 := pred(x3 ) end; x1 := pred(x1 )
Die While-Sprache ist eine fiktive Computersprache, die dem imperativen Programmierparadigma folgt. Ein While-Programm schöpft aus einem unendlichen Vorrat an Variablen xi , i ∈ N, von denen x1 , . . . , xn zur Übergabe der Eingabewerte verwendet werden. Das Ergebnis wird in x0 gespeichert, und die restlichen Variablen dienen zur Ablage von Zwischenergebnissen.
end
Optisch erinnert die While-Sprache an klassische imperative Programmiersprachen wie C oder Pascal, allerdings ist der Sprachschatz auf ein Minimum beschränkt. Er umfasst lediglich die beiden Operatoren succ und pred, die Zuweisung ‚:=‘, den Kompositionsoperator ‚;‘ und das Schleifenkonstrukt while do end.
Befehl
x0
x1
x2
x3
1
0
2
2
0
while x1 = 0 do
2
0
2
2
0
x3 := x2
3
0
2
2
2
while x3 = 0 do
4
0
2
2
2
x0 := succ(x0 )
5
1
2
2
2
x3 := pred(x3 )
6
1
2
2
1
while x3 = 0 do
7
1
2
2
1
x0 := succ(x0 )
8
2
2
2
1
x3 := pred(x3 )
9
2
2
2
0
while x3 = 0 do
10
2
2
2
0
x1 := pred(x1 )
11
2
1
2
0
x3 := x2
12
2
1
2
2
while x3 = 0 do
13
2
1
2
2
x0 := succ(x0 )
14
3
1
2
2
x3 := pred(x3 )
15
3
1
2
1
while x3 = 0 do
16
3
1
2
1
x0 := succ(x0 )
17
4
1
2
1
x3 := pred(x3 )
18
4
1
2
0
while x3 = 0 do
19
4
1
2
0
x1 := pred(x1 )
20
4
0
2
0
while x1 = 0 do
Abbildung 5.18: While-Programm für die Multiplikation zweier natürlicher Zahlen x1 und x2 . Der Ablaufplan demonstriert die Programmausführung für den Fall x1 = 2 und x2 = 2. Am Ende der Berechnung enthält das Register x0 den Ergebniswert 4.
While-Programme (Abbildung 5.18)
I
μ-rekursive Funktionen Die Menge der μ-rekursiven Funktionen ist die kleinste Menge, die alle primitiv-rekursiven Funktionen enthält und außerdem unter der Anwendung des μ-Operators abgeschlossen ist. Mit diesem Operator lässt sich eine n + 1-stellige Funktion f : Nn+1 → N nach dem folgenden Schema auf eine n-stellige Funktion reduzieren: ⎧ ⎫ f (m, x1 , . . . , xn ) = 0 ⎬ ⎨ (5.3) (μ f )(x1 , . . . , xn ) := min m | und für alle k < m ist ⎩ ⎭ f (k, x1 , . . . , xn ) = ⊥ Degradiert die rechte Seite von Gleichung (5.3) zur leeren Menge, so ist kein minimales Element vorhanden und der Funktionswert undefiniert ((μ f )(x1 , . . . , xn ) = ⊥).
I
Lambda-Kalkül (Abbildung 5.19) Der Lambda-Kalkül (kurz λ -Kalkül) basiert auf der Idee, komplexe mathematische Funktionen durch die Kombination allgemein gehaltener Rechenvorschriften zu definieren. Die grundlegende Operation ist die Anwendung einer Funktion f auf ein Argument x, geschrieben als ( f x). Ist z. B. add eine Funktion zur Addition zweier Zahlen, so berechnet ((add x) y) die Summe x + y. Mithilfe des λ -Operators lassen sich Variablen binden und damit aus bestehenden Funktionen neue erzeugen. Beispielsweise bezeichnet (λ x.((add x) x)) eine von x abhängige Funktion, die den Wert 2 · x berechnet. λ -Ausdrücke lassen sich freizügig kombinieren. So kann eine Funktion beliebige λ -Terme als Argumente erhalten und damit insbesondere auch auf Funktionen angewendet werden. Wie der Ausdruck ((λ x.x) (λ x.x)) zeigt, kann sich eine Funktion sogar selbst als Argument entgegennehmen.
263
5.2 Die Church’sche These
I
Termersetzungssysteme (Abbildung 5.20) Ein Termersetzungssystem besteht aus einer Menge von Ersetzungsregeln der Form l → r, den sogenannten Produktionen. Auf der linken und der rechten Seite stehen Terme, die neben den Symbolen einer Menge Σ auch Variablen enthalten dürfen. Die Ersetzungsregeln werden verwendet, um ein vorgelegtes Eingabewort ω ∈ Σ∗ sukzessive umzuformen. Hierzu wird zunächst geprüft, ob sich ω und die linke Seite einer Produktion l → r durch eine Substitution S angleichen lassen (lS = rS). In diesem Fall ist rS das Ergebnis. Termersetzungssysteme existieren in vielen Variationen. Wichtige Vertreter sind die Phrasenstrukturgrammatiken (Typ-0-Grammatiken) [89] oder die Semi-Thue-Systeme, die der norwegische Mathematiker Axel Thue im Jahr 1914 zur Untersuchung von Ableitungskalkülen ersann [179].
I Reduktionsregeln
I
μ∈ϕ
→
λ μ.ϕ[ξ ← μ]
(β ) ((λ ξ .ϕ)ψ)
→
ϕ[ξ ← ψ]
(η)
→
ϕ
(α)
λ ξ .ϕ λ ξ .ϕξ
Ableitung ((((λ y.(λ z.(λ x.((yz)x)))) (λ w.(λ x.(wx))))P)v)
β
⇒ (((λ z.(λ x.(((λ w.(λ x.(wx)))z)x)))P)v) β
⇒ ((λ x.(((λ w.(λ x.(wx)))P)x))v) β
⇒ (((λ w.(λ x.(wx)))P)v) β
Wir wissen heute, dass es keine Rolle spielt, welches der vorgestellten Modelle wir zur Begründung des Berechenbarkeitsbegriffs zu Rate ziehen; trotz ihrer unübersehbaren äußerlichen Unterschiede besitzen alle die gleiche Ausdrucksstärke. Das bedeutet, dass der Berechenbarkeitsbegriff stets derselbe bleibt, egal ob wir ihn über die Turing-Maschine, die Registermaschine, die While-Sprache, die Menge der μ-rekursiven Funktionen, den λ -Kalkül oder mithilfe von Termersetzungssystemen definieren. Für den amerikanischen Logiker Alonzo Church war dies die empirische Bestätigung für die These, dass der intuitive Berechenbarkeitsbegriff mit dem Begriff der Turing-Berechenbarkeit zusammenfällt. Genau dies ist der Inhalt der berühmten Church’schen These: Satz 5.1 (Church’sche These) Die Klasse der Turing-berechenbaren Funktionen stimmt mit der Klasse der intuitiv berechenbaren Funktionen überein.
⇒ ((λ x.(Px))v) β
⇒ (Pv) Abbildung 5.19: Ableitung im λ -Kalkül
I Produktionen
xI
Die Church’sche These ist kein Satz im mathematisch präzisen Sinne, da der Begriff der intuitiv berechenbaren Funktion keine formale Definition besitzt. Gäbe es diese, so hätten wir uns – bewusst oder unbewusst
xIU
(Regel 1)
Mx
→
Mxx
(Regel 2)
xIIIy
→
xUy
(Regel 3)
xUUy
→
xy
(Regel 4)
I Ableitung von MUIIU aus MI
MI
Der Begriff der intuitiv berechenbaren Funktion bedarf an dieser Stelle besonderer Aufmerksamkeit. Er bezeichnet eine Funktion, die von einem Menschen – in welcher Form auch immer – ausgerechnet werden kann. Damit besagt die Church’sche These nichts anderes, als dass jede Funktion, die überhaupt in irgendeiner Weise berechenbar ist, auch durch eine Turing-Maschine berechnet werden kann.
→
⇒
MII
(Regel 2)
⇒
MIIII
(Regel 2)
⇒
MUI
(Regel 3)
⇒
MUIU
(Regel 1)
⇒
MUIUUIU
(Regel 2)
⇒
MUIIU
(Regel 4)
Abbildung 5.20: MIU-System von Douglas Hofstadter [90], hier formuliert als Termersetzungssystem
264
5 Berechenbarkeitstheorie
– bereits auf ein konkretes Berechnungsmodell festgelegt und die eigentliche Bedeutung dieses Begriffs ad absurdum geführt. Folgerichtig wird es niemals möglich sein, die Church’sche These zu beweisen. Wir können lediglich Indizien für ihre Gültigkeit sammeln, und genau dies ist Forschern in der Vergangenheit vielfach gelungen. Alle bisher unternommenen Versuche, die Menge der berechenbaren Funktionen durch die Angabe eines ausdrucksstärkeren Berechnungsmodells zu vergrößern, waren bisher vergebens. Selbst so ausgefallene Konzepte wie der Quantenrechner [128] oder das DNA computing [5] konnten die Grenze des maschinell Berechenbaren nicht verschieben. Die Church’sche These ist die Legitimation für die folgende Definition, die den bereits mehrfach bemühten Begriff der Berechenbarkeit nun endlich mit einem formalen Unterbau versieht:
I Entscheidbarkeit ω
Definition 5.5 (Berechenbarkeit) Eine partielle Funktion f : Σ∗ → Σ∗ heißt berechenbar, wenn eine Turing-Maschine M mit der folgenden Eigenschaft existiert: I
Entscheider für N
Ist f (x) = ⊥, so beschreibt M bei Eingabe von ω das Band mit f (ω) und hält an.
ω in N ? I
Ist f (x) = ⊥, so rechnet M bei Eingabe von ω für immer weiter.
Ja
Nein
I Semi-Entscheidbarkeit ω
In dieser Definition ist Σ eine beliebige Menge, die als Bandalphabet einer Turing-Maschine in Frage kommt. Von hier ist es nur noch ein kleiner Schritt, um auch den Begriff der Entscheidbarkeit formal zu erfassen: Definition 5.6 (Entscheidbarkeit, Semi-Entscheidbarkeit)
Semi-Entscheider für N ω in N ?
Ja
Abbildung 5.21: Bildliche Darstellung der beiden Entscheidbarkeitsbegriffe
Eine Menge N ⊆ Σ∗ heißt entscheidbar, falls die charakteristische Funktion χN : Σ∗ → {0, 1} berechenbar ist mit 1 falls ω ∈ N χN (ω) := 0 falls ω ∈ N Eine Menge N ⊆ Σ∗ heißt semi-entscheidbar, falls die partielle charakteristische Funktion χN : Σ∗ → {1} berechenbar ist mit 1 falls ω ∈ N χN (ω) := ⊥ falls ω ∈ N
265
5.2 Die Church’sche These
ω
Im Kern dieser Definition steht der Begriff der charakteristischen Funktion. Sie ist das formale Bindeglied zwischen dem auf Funktionen ausgelegten Berechenbarkeitsbegriff und dem für Mengen formulierten Entscheidbarkeitskriterium. Abbildung 5.21 demonstriert, wie sich die beiden Entscheidbarkeitsbegriffe bildlich erfassen lassen. Ist eine Menge N entscheidbar, dann existiert eine algorithmisch arbeitende Maschine, die ein Element ω ∈ N entgegennimmt und die Frage beantwortet, ob ω zu N gehört oder nicht. In der bildlichen Darstellung werden die beiden möglichen Antworten durch zwei separate Glühlampen symbolisiert, von denen genau eine nach endlicher Zeit aufleuchtet. Wann eine der Lampen zu glühen beginnt, wissen wir nicht. Dennoch können wir uns darauf verlassen, dass dies sowohl für den Fall ω ∈ N als auch für den Fall ω ∈ N irgendwann der Fall sein wird. Um die Mengenzugehörigkeit zu entscheiden, müssen wir uns also lediglich in Geduld üben und lange genug warten. Im Gegensatz zu einem Entscheider besitzt ein Semi-Entscheider nur eine einzige Glühlampe. Wird er mit einem Element ω ∈ N gestartet, so beginnt die Lampe nach endlicher Zeit zu leuchten. Für ω ∈ N lässt sich keine verlässliche Aussage mehr treffen. Hier können wir niemals mit Sicherheit sagen, ob sich die Maschine innerhalb einer Endlosschleife befindet oder zu einem späteren Zeitpunkt doch noch eine positive Antwort liefern wird. Damit ist die Semi-Entscheidbarkeit gleichbedeutend mit einer Halbaussage. Die gestellte Frage „Ist ω ∈ N?“ wird nur im positiven Fall nach endlicher Zeit beantwortet. Fällt die Antwort negativ aus, so zeigt die Maschine keinerlei Reaktion. In manchen Fällen reicht die Eigenschaft der Semi-Entscheidbarkeit trotzdem aus, um eine Menge N zu entscheiden. Dies ist immer dann der Fall, wenn neben N auch das Komplement N semi-entscheidbar ist. Abbildung 5.22 zeigt auf grafische Weise, wie sich die Semi-Entscheider für N und N zu einem Entscheider für N kombinieren lassen. Beide Semi-Entscheider werden gleichzeitig mit dem Eingabewort ω versorgt und parallel simuliert. Liegt ω in N, so reagiert der erste SemiEntscheider nach einer endlichen Zeitspanne; ist ω nicht in N, so reagiert irgendwann der zweite. In Satzform lautet unser Ergebnis folgendermaßen: Satz 5.2 Für eine Menge N gilt: N ist entscheidbar ⇔ N und N sind semi-entscheidbar
Semi-Entscheider für N ω in N ? Ja
Nein
Semi-Entscheider für N
ω
Abbildung 5.22: Sind sowohl N als auch das Komplement N semi-entscheidbar, so lässt sich die Menge N entscheiden.
266
I
5 Berechenbarkeitstheorie
Entscheidbarkeit Ja
I
Nein
Entscheider für N
Entscheider für N
ω∈N
ω∉N
In derselben Weise wollen wir einen weiteren Begriff formal zementieren, den wir bereits des öfteren informell verwendet haben. Die Rede ist von der Aufzählbarkeit von Mengen. Genau wie im Falle der Entscheidbarkeit können wir auch diesen Begriff auf die Berechenbarkeit einer Funktion zurückführen: Definition 5.7 (Aufzählbarkeit) Eine Menge N = 0/ heißt aufzählbar, wenn eine surjektive und berechenbare Funktion f : N → N existiert.
Aus dieser Definition geht erst auf den zweiten Blick hervor, dass hier jenes Konzept beschrieben wird, das die meisten von uns intuitiv mit dem Begriff der Aufzählbarkeit verbinden. Sehen wir also genauer hin! Ist eine Menge N aufzählbar, so existiert per Definition eine TuringMaschine M, die unter der Eingabe einer natürlichen Zahl x den Funktionswert f (x) berechnet. M versetzt uns in die Lage, die Werte
Semi-Entscheidbarkeit Ja
f (0), f (1), f (2), f (3), . . .
I
Semi-Entscheider für N
Semi-Entscheider für N
ω∈N
ω∉N
Aufzählbarkeit ω1, ω2, ω3, ω4, ω5, ω6, ...
Aufzähler für N
Abbildung 5.23: Entscheidbarkeit, SemiEntscheidbarkeit und Aufzählbarkeit im Vergleich
nacheinander zu berechnen. Auf diese Weise entsteht eine immer länger werdende Liste von Elementen aus N. Wir wissen aber noch mehr. Da f per Definition surjektiv ist, wird jedes Element ω ∈ N irgendwann in unserer Aufzählung erscheinen. Als Ergebnis erhalten wir eine algorithmisch arbeitende Maschine, die alle Elemente von N nacheinander aufsagt (Abbildung 5.23). Beachten Sie, dass wir lediglich die Surjektivität und nicht die Bijektivität von f gefordert haben. Damit ist es explizit erlaubt, dass die Elemente von N in der generierten Aufzählung mehrfach vorkommen dürfen. Wir wollen versuchen, zwischen der Aufzählbarkeit, der Abzählbarkeit und der Semi-Entscheidbarkeit einen Zusammenhang herzustellen. Ganz offensichtlich ist jede aufzählbare Menge auch abzählbar, da wir jedes ihrer Elemente mit mindestens einer natürlichen Zahl in Bezug setzen können. Auf der anderen Seite existieren zahlreiche abzählbare Mengen, für die keine Funktion f : N → N existiert, die gleichzeitig surjektiv und berechenbar ist. Ein prominentes Beispiel kennen wir schon: die Menge aller wahren arithmetischen Formeln. Zwischen der Aufzählbarkeit und der Semi-Entscheidbarkeit einer Menge besteht ebenfalls eine enge Verwandtschaft. Zunächst ist jede aufzählbare Menge N auch semi-entscheidbar, schließlich können wir alle Elemente der Reihe nach aufsagen und genau dann stoppen, wenn wir das gesuchte Element ω gefunden haben. Ist ω ∈ N, so werden wir
267
5.2 Die Church’sche These
das Element nach endlich vielen Schritten antreffen. Ist ω ∈ N, so fahren wir für immer fort. Es gilt sogar die umgekehrte Richtung: Jede semi-entscheidbare Menge N ist aufzählbar. Dies einzusehen, ist alles andere als trivial. Um die Elemente von N aufzuzählen, müssen wir den zur Verfügung stehenden Semi-Entscheider so ansteuern, dass er niemals in eine Endlosschleife gerät. Aber wie kann das gelingen? Zum Erfolg verhilft uns abermals die Cantor’sche Paarungsfunktion π, die eine Zuordnung zwischen der Menge aller Tupel (i, j) ∈ N2 und der Menge der natürlichen Zahlen herstellt. Durch geschickten Einsatz dieser Funktion ist es tatsächlich möglich, die Elemente einer semi-entscheidbaren Menge nacheinander aufzusagen. Abbildung 5.24 zeigt, wie dies möglich ist: I
In einer unendlichen Schleife werden nacheinander die Elemente π −1 (0), π −1 (1), π −1 (2), π −1 (3), . . .
(5.4)
berechnet. Als Ergebnis erhalten wir eine Folge, in der jedes Tupel (i, j) ∈ N2 irgendwann auftaucht. I
Für jedes Tupel (i, j) starten wir den Semi-Entscheider mit dem iten Element von Σ∗ . Stellt er die Mengenzugehörigkeit innerhalb von j Schritten fest, so gibt er ω aus. Ist der Semi-Entscheider nach j Schritten noch zu keinem Ergebnis gekommen, brechen wir die Berechnung ab und fahren mit dem nächsten Tupel fort. Da für jedes ω ∈ N ein j ∈ N mit der Eigenschaft existiert, dass der SemiEntscheider die Mengenzugehörigkeit in j Schritten positiv beantwortet, werden nacheinander alle Elemente von N erzeugt.
Damit ist es uns gelungen, den folgenden Satz zu beweisen: Satz 5.3 (Aufzählbarkeit und Semi-Entscheidbarkeit) Für eine Menge N gilt: N ist aufzählbar ⇔ N ist semi-entscheidbar Kombinieren wir die Aussagen der Sätze 5.2 und 5.3, so erhalten wir ohne weiteres Zutun das folgende Ergebnis: Korollar 5.1 Für eine Menge N gilt: N ist entscheidbar ⇔ N und N sind aufzählbar
n := 0
( i , j ) := π−1(n) n := n + 1
ω := das i-te Element von Σ*
Semi-Entscheider für N ω ∈ N? Abbruch nach j Schritten Ja
ω ausgeben
Abbildung 5.24: Durch den geschickten Einsatz der Cantor’schen Paarungsfunktion ist es möglich, die Elemente einer semientscheidbaren Menge der Reihe nach aufzuzählen.
268
5 Berechenbarkeitstheorie
5.3
Grenzen der Berechenbarkeit
In diesem Abschnitt werden wir die algorithmische Methode an ihre Grenzen führen. Wir beginnen unsere Diskussion mit verschiedenen Varianten des Halteproblems und werden die gewonnenen Erkenntnisse anschließend mit dem Satz von Rice verallgemeinern.
5.3.1
Das Halteproblem
Als Halteproblem werden mehrere Fragestellungen bezeichnet, die sich mit den Terminierungseigenschaften von Turing-Maschinen beschäftigen. Konkret geht es um die Frage, ob auf algorithmischem Wege entschieden werden kann, ob eine Turing-Maschine unter gewissen Eingaben terminiert oder für immer weiter rechnet. Wir beginnen mit der Definition des allgemeinen Halteproblems: Definition 5.8 (Allgemeines Halteproblem) Das allgemeine Halteproblem lautet wie folgt:
Tabelle 5.1: Ein einfaches Diagonalisierungsargument reicht aus, um die Unentscheidbarkeit des Halteproblems zu beweisen. In der nebenstehenden Tabelle sind alle Eingaben auf der horizontalen Achse und alle Turing-Maschinen auf der vertikalen Achse aufgelistet. Der Tabelleneintrag in der i-ten Zeile und der j-ten Spalte gibt an, ob die Maschine Mi unter Eingabe von ω j hält. Wäre das Halteproblem entscheidbar, so ließe sich eine Turing-Maschine konstruieren, die den Diagonaleintrag (i, i) bestimmt und genau dann terminiert, wenn Mi unter Eingabe von ωi nicht hält. Diese Maschine kann nirgends in der Liste auftauchen, im Widerspruch zur Tabellenkonstruktion.
I
Gegeben: Turing-Maschine M und Eingabewort ω
I
Gefragt: Terminiert M unter Eingabe von ω?
: Maschine terminiert : Maschine läuft für immer weiter ω1
ω2
ω3
ω4
ω5
ω6
ω7
...
M1
...
M2
...
M3
...
M4
...
M5
...
M6
...
M7 .. .
... .. .
.. .
.. .
.. .
.. .
.. .
.. .
..
.
269
5.3 Grenzen der Berechenbarkeit
ωi
Für den Moment gehen wir davon aus, das Halteproblem sei entscheidbar. Diese Annahme werden wir jetzt mit einem einfachen Diagonalisierungsargument, das jenem aus Abschnitt 1.2.2 sehr ähnlich ist, zu einem Widerspruch führen.
Wäre das Halteproblem entscheidbar, so würde eine Turing-Maschine H existieren, die ein Eingabewort ω und eine Turing-Maschine M in codierter Form entgegennimmt und stets korrekt bestimmt, ob M bei Eingabe von ω terminiert. Die fiktive Turing-Maschine H ist nichts anderes als eine Maschine zur Berechnung der soeben konstruierten Matrix. Wie es in Abbildung 5.25 skizziert ist, können wir aus H eine zweite Maschine H konstruieren. Diese berechnet für das Eingabewort ωi das Matrixelement (i, i) und verhält sich reziprok zu der erhaltenen Antwort. H terminiert bei Eingabe von ω genau dann, wenn Mi für immer weiter rechnen würde. Da H selbst eine Turing-Maschine ist, müssen wir sie in einer bestimmten Zeile der konstruierten Matrix wiederfinden können; der Aufbau der Matrix garantiert ja gerade, dass alle Maschinen der Reihe nach aufgezählt werden. Doch egal, in welcher Zeile wir auch nachschauen: Die Diagonalkonstruktion führt immer einen Widerspruch herbei. Für alle i ∈ N gilt H = Mi , da Mi die Eingabe ωi genau dann akzeptiert, wenn sie von H abgelehnt wird. Der Widerspruch macht deutlich, dass wir die Annahme über die Existenz von H fallen lassen müssen und es keine Maschine geben kann, die das Halteproblem entscheidet. Satz 5.4 Das allgemeine Halteproblem ist unentscheidbar.
Ein einfaches Diagonalisierungsargument hat ausgereicht, um eines der wichtigsten Ergebnisse der Berechenbarkeitstheorie zu beweisen. Wie bedeutend Satz 5.4 tatsächlich ist, werden die folgenden Betrachtungen jetzt nach und nach zum Vorschein bringen.
H
Turing-Maschine H'
Als Erstes konstruieren wir eine Matrix, wie sie in Tabelle 5.1 ausschnittsweise dargestellt ist. Auf der vertikalen Achse sind alle TuringMaschinen und auf der horizontalen Achse alle Eingabewörter verzeichnet. Die Reihenfolge spielt dabei keine Rolle; wichtig ist nur, dass jede Turing-Maschine und jedes Eingabewort auch wirklich in irgendeiner Zeile oder Spalte erscheinen. Die einzelnen Felder der Matrix geben uns Auskunft über das Terminierungsverhalten unserer Maschinen. Hierzu ist in der i-ten Zeile und der j-ten Spalte verzeichnet, ob die Turing-Maschine Mi unter Eingabe von ω j terminiert.
Mi
„Hält Mi für ωi? ja
nein
Endlosschleife
Halte an
Abbildung 5.25: Gäbe es eine TuringMaschine H, die das Halteproblem entscheidet, so könnten wir diese zu einer Maschine H umbauen, die genau dann für das Eingabewort ωi terminiert, wenn die Turing-Maschine Mi bei Eingabe von ωi unendlich lange rechnet. Mithilfe des Diagonalisierungsarguments können wir die Konstruktion von H als widersprüchlich entlarven und daraus schließen, dass die Maschine H nicht existieren kann.
Behalten Sie stets im Auge, dass sich die Gültigkeit von Satz 5.4 auf jedes Berechnungsmodell überträgt, das dieselbe Ausdrucksstärke besitzt wie die Turing-Maschine. Hierunter fallen die Registermaschine aus Abschnitt 5.1.2 sowie alle besprochenen Varianten der TuringMaschine aus Abschnitt 5.1.1.1. Dort hatten wir mit der einseitig beschränkten Maschine, der Mehrspur-Maschine und der Mehrband-Maschine drei Erweiterungen des Turing’schen Maschinenmodells eingeführt, die allesamt die gleiche Ausdrucksstärke besitzen.
270
5 Berechenbarkeitstheorie
Halteproblem auf leerem Band
ω, M
Konstruiere aus ω und M eine neue TuringMaschine Mω.
Neben dem allgemeinen Halteproblem existiert eine abgeschwächte Variante, die wie folgt definiert ist: Definition 5.9 (Halteproblem auf leerem Band) Das Halteproblem auf leerem Band lautet wie folgt:
Entscheider für das allgemeine Halteproblem
Mω
Gegeben: Turing-Maschine M
I
Gefragt: Terminiert M unter Eingabe des leeren Worts ε?
Während das allgemeine Halteproblem fordert, dass wir die Terminierungseigenschaft für beliebige Turing-Maschinen und beliebige Eingaben entscheiden können, betrachtet das spezielle Halteproblem nur den Fall, dass die Berechnung auf einem leeren Band gestartet wird. Formal ist die Eingabe dann das leere Wort, das gewöhnlich mit ε bezeichnet wird.
"Schreibe ω auf das Eingabeband und simuliere M."
Entscheider für das Halteproblem auf leerem Band
Das spezielle Halteproblem ist augenscheinlich einfacher zu lösen als das allgemeine. Dennoch lässt sich mit einem einfachen Reduktionsbeweis zeigen, dass auch dieses Problem unentscheidbar ist. In einem solchen Beweis wird gezeigt, dass aus der Entscheidbarkeit des Halteproblems auf leerem Band die Entscheidbarkeit des allgemeinen Halteproblems folgen würde. Wir sagen, das allgemeine Halteproblem wird auf das Halteproblem auf leerem Band reduziert. Wie eine solche Reduktion in unserem speziellen Fall durchgeführt werden kann, zeigt Abbildung 5.26.
Hält Mω?
Ja
I
Nein
Abbildung 5.26: Reduktion des allgemeinen Halteproblems auf das Halteproblem auf leerem Band. Wären wir in der Lage, das Halteproblem auf leerem Band zu lösen, so könnten wir einen Entscheider für das allgemeine Halteproblem konstruieren. Aus der Unentscheidbarkeit des allgemeinen Halteproblems folgt unmittelbar, dass auch das Halteproblem auf leerem Band nicht entschieden werden kann.
Um zu entscheiden, ob eine Turing-Maschine für ein Eingabewort ω hält, wird zunächst eine Turing-Maschine Mω konstruiert, die alle Zeichen von ω auf das Band schreibt und anschließend M simuliert. Mω wird mit einem leeren Band gestartet und terminiert genau dann, wenn die Originalmaschine M mit der Eingabe ω terminiert. Gäbe es also eine Turing-Maschine, die das Halteproblem auf leerem Band entscheidet, so wären wir auch in der Lage, das allgemeine Halteproblem zu entscheiden. Aus Satz 5.4 folgt jetzt sofort, dass auch das spezielle Halteproblem unentscheidbar sein muss. Satz 5.5 Das Halteproblem auf leerem Band ist unentscheidbar.
271
5.3 Grenzen der Berechenbarkeit
5.3.2
I Erster Fall: M⊥ erfüllt E
Der Satz von Rice
ω
Im Folgenden bezeichnet M eine beliebige Turing-Maschine, fM die von M berechnete Funktion und E eine funktionale Eigenschaft von M (also eine Eigenschaft von fM ). E soll nichttrivial sein, d. h., es gibt mindestens eine Maschine, die die untersuchte Eigenschaft besitzt, und mindestens eine Maschine, die sie nicht besitzt. Die folgende Aufzählung enthält eine exemplarische Auswahl möglicher Eigenschaften. Der Phantasie sind an dieser Stelle keine Grenzen gesetzt: M schreibt irgendwann eine 0 auf das Band.
I
Alle Ausgaben von M sind mindestens n Zeichen lang.
I
M berechnet eine totale Funktion.
M terminiert
ME
f (ω) I Zweiter Fall: M⊥ erfüllt E nicht
ω
ε M
Wir wollen ausloten, welche Konsequenzen sich aus der Existenz eines Entscheidungsverfahrens für E ergeben. Hierzu führen wir zunächst die Turing-Maschine M⊥ ein, die die überall undefinierte Funktion f (ω) = ⊥ berechnet. M⊥ lässt sich sehr simpel konstruieren: Sie terminiert für keine Eingabe. Für den Moment wollen wir annehmen, dass M⊥ die gewählte Eigenschaft E erfüllt. Da E nichttrivial ist, existiert mindestens eine weitere Maschine ME , die E nicht erfüllt. Wir fassen zusammen: M⊥ erfüllt die Eigenschaft E ME erfüllt die Eigenschaft E nicht
M
(5.5) (5.6)
Die Maschinen M und ME vereinen wir nun zu einer gemeinsamen Maschine H. Wie der obere Teil von Abbildung 5.27 zeigt, wird innerhalb von H zunächst die Maschine M mit dem leeren Eingabewort ε gestartet. Hält diese nach endlich vielen Schritten an, so wendet H die Maschine ME auf das Eingabewort ω an.
M terminiert
ME
Turing-Maschine H
I
ε
Turing-Maschine H
Die Unentscheidbarkeit des Halteproblems hat uns gezeigt, dass Aussagen über Turing-Maschinen existieren, die sich einer maschinellen Beweisbarkeit entziehen. Kein algorithmisches Verfahren ist in der Lage, die Terminierungseigenschaft für alle Turing-Maschinen Mi und alle Eingabewörter ω j stets korrekt vorherzusagen. Durch eine geeignete Reduktion waren wir darüber hinaus in der Lage, auch das Halteproblem auf leerem Band als unentscheidbar zu identifizieren. In diesem Abschnitt wollen wir uns mit der Frage beschäftigen, ob noch weitere Aussagen über Turing-Maschinen existieren, die nicht algorithmisch entschieden werden können. So viel vorweg: Wir werden eine verblüffende Antwort erhalten.
f (ω)
Abbildung 5.27: Kernstück des Beweises für den Satz von Rice. Über die dargestellte Zusammenschaltung wird ein direkter Zusammenhang zwischen der untersuchten Maschineneigenschaft E und dem Halteproblem hergestellt.
272
Die Tragweite des Satzes von Rice ist enorm! In einem Rundumschlag macht er die Hoffnung zunichte, irgendeine nichttriviale funktionale Eigenschaft über Turing-Maschinen algorithmisch entscheiden zu können. Die Grenzen, die uns dieser Satz auferlegt, reichen tief in die Praxis der realen SoftwareEntwicklung hinein. So folgt daraus unmittelbar, dass es keinen Algorithmus geben kann, der für ein beliebiges Programm maschinell verifiziert, ob es sich entsprechend seiner Spezifikation verhält. Selbst so einfache Probleme wie die Frage nach der Existenz von Endlosschleifen entziehen sich einer algorithmischen Lösung. Seine Allgemeinheit macht den Satz von Rice zu einer der wertvollsten Aussagen der Berechenbarkeitstheorie.
5 Berechenbarkeitstheorie
Um das Verhalten von H zu verstehen, unterscheiden wir zwei Fälle: I
M terminiert nicht: In diesem Fall ist H funktional identisch mit M⊥ und erfüllt die Eigenschaft E.
I
M terminiert: In diesem Fall ist H funktional identisch mit ME und erfüllt die Eigenschaft E nicht.
Mit dieser Konstruktion ist es uns gelungen, einen direkten Zusammenhang zwischen der Eigenschaft E und der Terminierung von M herzustellen. Würde ein Verfahren existieren, das E entscheidet, so könnten wir das Halteproblem für jede beliebige Maschine M lösen. Kurzum: Wir hätten ein Entscheidungsverfahren für das Halteproblem gefunden. Beachten Sie, dass die obige Überlegung stets unter der Annahme stand, dass die gewählte Eigenschaft E auf M⊥ zutrifft. Sollte dies nicht der Fall sein, so modifizieren wir die Maschine H wie in der unteren Hälfte von Abbildung 5.27 gezeigt. Anstelle von ME starten wir eine beliebige Maschine ME , die E erfüllt. Die Fallunterscheidung liest sich jetzt wie folgt: I
M terminiert nicht: In diesem Fall ist H funktional identisch mit M⊥ und erfüllt die Eigenschaft E nicht.
I
M terminiert: In diesem Fall ist H funktional identisch mit ME und erfüllt die Eigenschaft E.
Wiederum ist es uns gelungen, einen Eins-zu-eins-Zusammenhang zwischen E und der Terminierung von M herzustellen. Gäbe es ein Entscheidungsverfahren für die Eigenschaft E, so könnten wir das Halteproblem ebenfalls lösen. Die Unentscheidbarkeit des Halteproblems führt damit unweigerlich zu der Erkenntnis, dass ein Entscheidungsverfahren für E nicht existieren kann. Genau dies ist die Aussage des berühmten Satzes von Henry Gordon Rice aus dem Jahr 1953. Satz 5.6 (Satz von Rice) Sei E sei eine nichttriviale funktionale Eigenschaft von TuringMaschinen. Dann ist das folgende Problem unentscheidbar: I
Gegeben: Turing-Maschine M
I
Gefragt: Besitzt M die Eigenschaft E?
273
5.4 Folgen für die Mathematik
5.4
Folgen für die Mathematik
Zu Beginn dieses Kapitels haben wir den hohen Stellenwert der Berechenbarkeitstheorie unter anderem damit begründet, dass die Erkenntnisse auf diesem Gebiet tief in die Mathematik hineinwirken. Wie engmaschig die Berechenbarkeitstheorie auf der einen und die Beweistheorie auf der anderen Seite tatsächlich miteinander verwoben sind, werden wir in diesem Abschnitt am Beispiel von drei prominenten Negativresultaten demonstrieren. Es sind dies keine Geringeren als I
die Unlösbarkeit des Hilbert’schen Entscheidungsproblems,
I
die Unvollständigkeit der Arithmetik und
I
die Unlösbarkeit des zehnten Hilbert’schen Problems.
Alle drei Negativresultate werden wir durch die Reduktion des Halteproblems beweisen. Konkret werden wir zeigen, dass sich die Lösung für eines der drei Probleme dazu verwenden lässt, um die Terminierung von Turing-Maschinen oder Registermaschinen zu entscheiden (Abbildungen 5.28 und 5.29). Wäre auch nur eines der drei Probleme lösbar, so wäre es auch das Halteproblem. Wir wissen aber bereits aus Abschnitt 5.3.1, dass das Halteproblem unentscheidbar ist.
Turingmaschine M
Reduktion
Turing, 1936
Prädikatenlogische Formel
Entscheidungsverfahren für die Prädikatenlogik erster Stufe
Hält M auf leerem Band?
Ja
Nein
Turingmaschine M
Um den Blick auf das Große und Ganze zu wahren, wollen wir zunächst alle drei Reduktionen grob skizzieren. Im Anschluss daran liefern wir die technischen Details in separaten Unterabschnitten nach.
Reduktion Arithmetische Formel
I
Unlösbarkeit des Hilbert’schen Entscheidungsproblems In Abschnitt 5.4.1 werden wir demonstrieren, dass sich das Halteproblem auf leerem Band mithilfe eines Entscheidungsverfahrens für die Prädikatenlogik erster Stufe lösen lässt. Im Kern des Beweises steht die Idee, eine einseitig beschränkte Turing-Maschine M in eine prädikatenlogische Formel ϕM mit der folgenden Eigenschaft zu übersetzen: M terminiert ⇔ ϕM ist allgemeingültig Über die so hergestellte Beziehung lässt sich die Frage nach der Terminierung einer einseitig beschränkten Turing-Maschine mithilfe eines prädikatenlogischen Entscheidungsverfahrens beantworten. Aus der Unentscheidbarkeit des Halteproblems können wir dann schließen, dass kein Entscheidungsverfahren für die Prädikatenlogik existieren kann.
Korrekter und vollständiger Kalkül für die Peano-Arithmetik
Ja
Hält M auf leerem Band?
Nein
Abbildung 5.28: Gäbe es ein Entscheidungsverfahren für die Prädikatenlogik erster Stufe (oben) oder einen korrekten und zugleich vollständigen Kalkül für die Peano-Arithmetik (unten), so ließe sich damit das Halteproblem entscheiden.
274
5 Berechenbarkeitstheorie
I
In Abschnitt 5.4.2 werden wir zeigen, dass sich das Halteproblem auf leeren Band auch mit einem Entscheidungsverfahren für die Peano-Arithmetik lösen lässt. Die Beweisidee ist wiederum die gleiche. Wir werden zeigen, dass sich eine Turing-Maschine M in eine arithmetische Formel ϕM übersetzen lässt, für die gilt:
Registermaschine R
Jones, Matijasevič 1984 Diophantische Gleichung
Reduktion
ϕM ist wahr ⇔ M terminiert Über diese Beziehung können wir die Frage nach der Terminierung einer Turing-Maschine mit einem Entscheidungsverfahren für PA beantworten und daraus schließen, dass ein solches Verfahren nicht existieren kann. In Kombination mit Satz 2.5 erhalten wir ein erstaunliches Ergebnis als Nebenprodukt frei Haus: die semantische Variante des ersten Gödel’schen Unvollständigkeitssatzes.
Lösungsverfahren für diophantische Gleichungen
Ja
Hält R unter Eingabe von x?
Unvollständigkeit der Arithmetik
I
Nein
Abbildung 5.29: Ein Lösungsverfahren für diophantische Gleichungen könnten wir verwenden, um das Halteproblem für Registermaschinen zu entscheiden.
Unlösbarkeit des zehnten Hilbert’schen Problems In Abschnitt 5.4.3 werden wir demonstrieren, dass sich das Halteproblem auch mit einem Entscheidungsverfahren für diophantische Gleichungen lösen lässt. Dieses Mal werden wir den Beweis aber nicht mithilfe von Turing-Maschinen führen. Stattdessen werden wir zeigen, wie sich eine Registermaschine in eine diophantische Gleichung ϕR = 0 mit der folgenden Eigenschaft übersetzen lässt: ϕR = 0 hat eine Lösung ⇔ R terminiert Über die so hergestellte Beziehung können wir die Frage nach der Terminierung einer Registermaschine mithilfe eines Lösungsverfahrens für diophantische Gleichungen beantworten. Wiederum folgt aus der Unentscheidbarkeit des Halteproblems sofort, dass kein Lösungsverfahren für diophantische Gleichungen existieren kann.
Die Marschroute ist damit vorgezeichnet, und wir können uns ruhigen Gewissens den Einzelheiten widmen. Für das Verständnis der weiteren Kapitel werden die Details nicht benötigt, und es ist gefahrlos, sie beim ersten Lesen zu überspringen.
5.4.1
Unentscheidbarkeit der PL1
In diesem Abschnitt werden wir herausarbeiten, wie sich eine einseitig beschränkte Turing-Maschine M in eine prädikatenlogische Formel übersetzen lässt, die genau dann allgemeingültig ist, wenn M unter Eingabe eines leeren Bands terminiert. Die Konstruktion dieser Formel ist
275
5.4 Folgen für die Mathematik
ein Schlüsselelement in Turings historischem Beweis und wird ausführlich in §11 seiner Arbeit beschrieben [180]. Auf den nächsten Seiten werden wir den Kern seines Gedankengangs offenlegen.
RS0(t,0) RS2(t,1)
Turing beginnt mit der Definition mehrere Prädikate, mit denen sich die Konfigurationen von einseitig beschränkten Turing-Maschinen beschreiben lassen (Abbildung 5.30): I(t, y) : Zum Zeitpunkt t steht der Kopf über der Zelle y RSj (t, y) : Zum Zeitpunkt t enthält die Zelle y das Symbol S j Kqi (t) : Zum Zeitpunkt t ist die Maschine im Zustand qi F(x, y) : x, y sind natürliche Zahlen mit y = x + 1
Unter den getroffenen Annahmen sind wir in der Lage, jede Instruktion in eine prädikatenlogische Formel ‚Inst‘ zu übersetzen, die den Übergang von einer Konfiguration zur nächsten beschreibt. Als erstes betrachten wir eine Instruktion der Form (qi , S j , Sk , L, ql ). Der Konfigurationsübergang, der durch diese Instruktion ausgelöst wird, lässt sich wie folgt charakterisieren: Wenn in der Konfiguration zum Zeitpunkt t...
• die Zelle y das Zeichen S j enthält • und der Schreib-Lese-Kopf über der Zelle y steht • und sich die Maschine im Zustand qi befindet, I
RSj (t, y) I(t, y) Kqi (t)
dann ist in der Konfiguration zum Zeitpunkt t + 1...
• der Schreib-Lese-Kopf nach links gerückt • und das Zeichen S j durch Sk ersetzt • und der Folgezustand ql eingenommen.
I(t + 1, y − 1) RSk (t + 1, y) Kql (t + 1)
Kombinieren wir die Teilformeln miteinander, so erhalten wir das folgende Zwischenergebnis: ∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t)) → (I(t + 1, y − 1) ∧ RSk (t + 1, y) ∧ Kql (t + 1)))
RS0(t,3)
S2
0
1
2
3
...
I(t,0)
q2
Die angegebene Bedeutung der Prädikate ist deren intendierte Bedeutung. Damit die nachfolgende Konstruktion funktioniert, müssen wir sicherstellen, dass die Symbole I, RSj , Kqi und F nur in dem gewünschten Sinne interpretiert werden können. Wie dies geschehen kann, werden wir weiter unten diskutieren. Für den Moment gehen wir einfach davon aus, dass die Prädikate die gewünschte Bedeutung besitzen.
I
RS0(t,2)
(5.7)
Kq2(t)
Abbildung 5.30: In seiner Arbeit aus dem Jahr 1936 führte Turing mehrere Prädikate ein, mit denen sich die Konfigurationen von einseitig beschränkten TuringMaschinen beschreiben lassen.
276
5 Berechenbarkeitstheorie
Einen wichtigen Aspekt haben wir noch vergessen. Wir müssen sicherstellen, dass der Bandinhalt an allen Stellen unverändert bleibt, über denen sich der Schreib-Lese-Kopf nicht befindet: ∀ z (z = y →
M
(RSi (t, z) → RSi (t + 1, z)))
(5.8)
i=0
Die Formeln (5.7) und (5.8) fügen wir jetzt konjunktiv zusammen: ∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t)) → (I(t + 1, y − 1) ∧ RSk (t + 1, y) ∧ Kql (t + 1) ∧ ∀ z (z = y →
M
(RSi (t, z) → RSi (t + 1, z)))))
(5.9)
i=0
Die Formel (5.10) unterscheidet sich in zwei Punkten von Turings eigener Formulierung. Zum einen wurde die in der Originalarbeit verwendete Variable x in t umbenannt, um ihre inhaltliche Bedeutung hervorzuheben. t bezeichnet einen Zeitpunkt – den t-ten Berechnungsschritt – und y eine Zellennummer. Zum anderen ist Turing in der letzten Formelzeile ein gravierender Fehler unterlaufen. Im Original lautet sie folgendermaßen: ∀ z (F(y , z) ∨ (RSj (x, z) → RSk (x , z))) Sinn ergibt diese Formel nicht, und sie wurde von Turing auch schnell verbessert. Ein Jahr nach dem Erscheinen seiner Originalarbeit publizierte er mehrere Korrekturen in einem Artikel mit dem Titel „On Computable Numbers, with an Application to the Entscheidungsproblem. A Correction“ [181]. Dort hat er seine ursprüngliche Formel korrigiert und bis auf einen vergessenen Allquantor in die korrekte Form gebracht.
Diese Formel ist noch keine Formel der Prädikatenlogik, da wir mit ‚+‘ ein Funktionszeichen und mit ‚=‘ ein Prädikatzeichen verwendet haben, das uns in der PL1 gar nicht zur Verfügung steht. Über das Prädikat F(x, y) können wir die Ausdrücke t + 1, y − 1 und z = y aber ganz einfach eliminieren: Inst(qi , S j , Sk , L, ql ) := ∀ t ∀ y ∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t) ∧ F(t, t ) ∧ F(y , y)) → (I(t , y ) ∧ RSk (t , y) ∧ Kql (t ) ∧ ∀ z (F(y , z) ∨
M
(RSi (t, z) → RSi (t , z)))))
(5.10)
i=0
Jetzt ist klar, wie sich die anderen Instruktionstypen in eine prädikatenlogische Formeln übersetzen lassen. Hierzu brauchen wir (5.10) nur geringfügig umzuschreiben: Inst(qi , S j , Sk , R, ql ) := ∀ t ∀ y ∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t) ∧ F(t, t ) ∧ F(y, y )) → (I(t , y ) ∧ RSk (t , y) ∧ Kql (t ) ∧ ∀ z (F(z, y ) ∨
M i=0
(RSi (t, z) → RSi (t , z)))))
(5.11)
277
5.4 Folgen für die Mathematik
Inst(qi , S j , Sk , N, ql ) := ∀ t ∀ y ∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t) ∧ F(t, t ) ∧ F(y , y)) → (I(t , y) ∧ RSk (t , y) ∧ Kql (t ) ∧ ∀ z (F(y , z) ∨
M
(RSi (t, z) → RSi (t , z)))))
(5.12)
i=0
Indem wir alle Instruktionen einer Turing-Maschine M auf die gezeigte Weise in Formeln übersetzen und diese anschließend konjunktiv miteinander verknüpfen, können wir den kompletten Instruktionssatz von M in eine einzige Formel hineincodieren. Für unsere Beispielmaschine aus Abbildung 5.1 sieht diese Formel folgendermaßen aus: Des(M) = Inst(q1 , S0 , S1 , R, q2 ) ∧ Inst(q2 , S0 , S0 , R, q3 ) ∧ Inst(q3 , S0 , S2 , R, q4 ) ∧ Inst(q4 , S0 , S0 , R, q1 ) Die Bezeichnung Des(M) stammt von Turing und ist die Abkürzung für „description of M“. Ausgeschrieben ergibt die Formel ein wahres Monstrum: ∀ t ∀ y ∀ t ∀ y ((RS0 (t, y) ∧ I(t, y) ∧ Kq1 (t) ∧ F(t, t ) ∧ F(y, y )) → (I(t , y ) ∧ RS1 (t , y) ∧ Kq2 (t ) ∧ ∀ z (F(z, y ) ∨ ((RS0 (t, z) → RS0 (t , z)) ∧ (RS1 (t, z) → RS1 (t , z)) ∧ (RS2 (t, z) → RS2 (t , z)))))) ∧
∀ t ∀ y ∀ t ∀ y ((RS0 (t, y) ∧ I(t, y) ∧ Kq1 (t) ∧ F(t, t ) ∧ F(y, y )) → (I(t , y ) ∧ RS1 (t , y) ∧ Kq2 (t ) ∧ ∀ z (F(z, y ) ∨ ((RS0 (t, z) → RS0 (t , z)) ∧
(RS1 (t, z) → RS1 (t , z)) ∧ (RS2 (t, z) → RS2 (t , z)))))) ∧ ∀ t ∀ y ∀ t ∀ y ((RS0 (t, y) ∧ I(t, y) ∧ Kq1 (t) ∧ F(t, t ) ∧ F(y, y )) → (I(t , y ) ∧ RS1 (t , y) ∧ Kq2 (t ) ∧ ∀ z (F(z, y ) ∨ ((RS0 (t, z) → RS0 (t , z)) ∧ (RS1 (t, z) → RS1 (t , z)) ∧ (RS2 (t, z) → RS2 (t , z)))))) ∧
∀ t ∀ y ∀ t ∀ y ((RS0 (t, y) ∧ I(t, y) ∧ Kq1 (t) ∧ F(t, t ) ∧ F(y, y )) → (I(t , y ) ∧ RS1 (t , y) ∧ Kq2 (t ) ∧ ∀ z (F(z, y ) ∨ ((RS0 (t, z) → RS0 (t , z)) ∧ (RS1 (t, z) → RS1 (t , z)) ∧ (RS2 (t, z) → RS2 (t , z))))))
278
5 Berechenbarkeitstheorie
Des(M) beschreibt den Übergang von einer Konfiguration in die nächste, sagt aber nichts darüber aus, in welcher Konfiguration die Maschine startet. Per Definition hatten wir vereinbart, dass zum Zeitpunkt 0 I
der Schreib-Lese-Kopf über der Zelle 0 steht,
I
der Startzustand q1 eingenommen ist und
I
ein leeres Band vorliegt.
I(0,0) Kq1 (0) ∀ y RS0 (0, y)
Damit können wir das Gesamtverhalten von M folgendermaßen beschreiben: I(0, 0) ∧ Kq1 (0) ∧ ∀ y RS0 (0, y) ∧ Des(M)
(5.13)
Um diese Formel zu einer echten prädikatenlogischen Formel zu machen, muss die 0 eliminiert werden. Turing nutzte aus, dass es keine Rolle spielt, ob sich die Maschine zum Zeitpunkt 0 oder zu einem späteren Zeitpunkt u in dieser Konfiguration befindet. Damit lässt sich das Problem lösen, indem die 0 durch ein existenziell quantifiziertes Konstantensymbol u ersetzt wird. Formel (5.13) wird dann zu A(M) := ∃ u (I(u, u) ∧ Kq1 (u) ∧ ∀ y RS0 (u, y)) ∧ Des(M) Zu guter Letzt wollen wir die Terminierung von M mithilfe einer Formel Halt(M) beschreiben. Um den Aufbau dieser Formel zu verstehen, erinnern wir uns daran, dass eine Turing-Maschine genau dann weiter rechnet, wenn eine Instruktion angewendet werden kann. Betrachten wir eine Instruktion der Gestalt (qi , S j , _, _), so ist sie genau dann anwendbar, wenn I
sich die Maschine im Zustand qi befindet und
Kqi (t)
I
in der aktuell adressierten Zelle y
I(t, y)
I
das Bandzeichen S j gespeichert ist.
RSj (t, y)
Damit können wir das Weiterrechnen einer Maschine mit einer Formel Cont(M,t) beschreiben, indem wir für jede Instruktion (qi , S j , _, _) die Teilformel ∃ y Kqi (t) ∧ I(t, y) ∧ RSj (t, y)
279
5.4 Folgen für die Mathematik
bilden und anschließend alle Teilformeln disjunktiv miteinander verknüpfen. Für unsere Beispielmaschine erhalten wir: Cont(M, t) = ∃ y (Kq1 (t) ∧ I(t, y) ∧ RS0 (t, y)) ∨
Instruktion (q1 ,S0 ,S1 ,R,q2 )
∃ y (Kq2 (t) ∧ I(t, y) ∧ RS0 (t, y)) ∨
Instruktion (q2 ,S0 ,S0 ,R,q3 )
∃ y (Kq3 (t) ∧ I(t, y) ∧ RS0 (t, y)) ∨
Instruktion (q3 ,S0 ,S2 ,R,q4 )
∃ y (Kq4 (t) ∧ I(t, y) ∧ RS0 (t, y))
Instruktion (q4 ,S0 ,S0 ,R,q1 )
Mithilfe der so erzeugten Formel können wir die Terminierung einer Turing-Maschine jetzt ohne Umwege beschreiben:
∃ t ∃ y RS1 (t, y)
Halt(M) := ∃ t ¬Cont(M, t) In Worten besagt die Formel, dass die Maschine irgendwann eine Konfiguration erreicht, in der kein Weiterkommen mehr möglich ist. Kombinieren wir die Teilformeln A(M) und Halt(M) zu Un(M) := A(M) → Halt(M) so erhalten wir eine Formel mit der folgenden inhaltlichen Aussage: „M terminiert auf leerem Band.“ Einen wichtigen Punkt dürfen wir an dieser Stelle nicht übergehen. Die Formel Un(M) steht nur dann für diese Aussage, wenn wir die verwendeten Prädikate entsprechend ihrer intendierten Bedeutung interpretieren. Bezeichnen wir diese Interpretation mit (U, I) so können wir den Zusammenhang zwischen Un(M) und der Terminierung von M wie folgt präzisieren: M terminiert ⇔ (U, I) |= Un(M) Um das Hilbert’sche Entscheidungsproblem negativ zu beantworten, brauchen wir aber eine Formel, die genau dann allgemeingültig ist, wenn die Maschine M terminiert: M terminiert ⇔ |= Un(M)
In Turings historischer Arbeit aus dem Jahr 1936 werden Sie die Definition der Formel Halt(M) nicht finden, genauso wenig wie das Wort Halteproblem. In seinem ursprünglichen Beweis hatte Turing nämlich gar nicht das Halteproblem reduziert, sondern gezeigt, dass sich mit einem Entscheidungsverfahren für die Prädikatenlogik erster Stufe bestimmen lässt, ob eine Maschine irgendwann das Symbol S1 auf das Band schreibt. Folgen wir dem Turing’schen Weg, so erhalten wir eine Formel, die sogar noch einfacher ist als die hier konstruierte. Anstatt der vergleichsweise komplizierten Formel Halt(M) enthält sie den viel simpleren Ausdruck
(5.14)
Wir wollen uns nun mit der Frage beschäftigen, ob unsere Formel Un(M) diese Eigenschaft erfüllt. Die Richtung von rechts nach links
Diese Formel besagt, dass die betrachtete Maschine irgendwann eine Konfiguration erreicht, in der eine Zelle y das Bandsymbol S1 enthält. Kurzum: Die Maschine schreibt irgendwann das Symbol S1 . Dass beide Formeln den gleichen Zweck erfüllen, folgt unmittelbar aus dem Satz von Rice, den wir in Abschnitt 5.3.2 hergeleitet haben. Er besagt, dass kein Entscheidungsverfahren existieren kann, das für eine beliebige nichttriviale funktionale Eigenschaft immer korrekt entscheidet, ob eine Turing-Maschine die Eigenschaft erfüllt oder nicht. Es spielt also keine Rolle, ob wir in der konstruierten Formel ausdrücken, dass die Maschine terminiert, irgendein Symbol auf das Band schreibt oder eine andere nichttriviale funktionale Eigenschaft erfüllt.
280
I
5 Berechenbarkeitstheorie
G(z, x) z
...
x
z<x I
∨(G(x, y) ∧ F(y, z)) x
...
y
z
x < y∧y+1 = z I
∨(F(x, y) ∧ F(z, y)) x, z
y
x+1 = y∧z+1 = y
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬
⇒ ¬F(x, z) ⎪ ⎪ x + 1 = z ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
Abbildung 5.31: Die Formel Q stellt unter anderem sicher, dass die Prädikate F und G die dargestellten Ordnungseigenschaften erfüllen.
Die Formel Q werden Sie in Turings Originalarbeit aus dem Jahr 1936 nicht finden. Dort hatte er noch versucht, die intendierte Bedeutung des Prädikatzeichens F folgendermaßen zu beschreiben: N(u) ∧ ∀ x (N(x) → ∃ x F(x, x )) ∧ ∀ y ∀ z (F(y, z) → N(y) ∧ N(z)) In Turings Formel drückt N(ξ ) aus, dass die Variable ξ einer natürlichen Zahl entspricht. Unter dieser Interpretation besagt der erste Formelbestandteil, dass u ∈ N ist, der Mittelteil postuliert, dass jede Zahl einen Nachfolger hat, und der letzte Formelbestandteil drückt aus, dass aus y + 1 = z stets y, z ∈ N folgt. Turing übersah, dass seine Formel nicht garantiert, dass eine Zahl x einen eindeutigen Nachfolger besitzen. In seinem Beweis greift er auf diese Eigenschaft aber explizit zurück. In den 1937 publizierten Korrekturen hat Turing den Fehler behoben und die Formel Q als Ersatz für den oben genannten Ausdruck eingeführt.
ist einfach. Ist Un(M) allgemeingültig, gilt also |= Un(M), so ist die Formel unter jeder Interpretation wahr und damit auch unter jener Interpretation, die alle verwendeten Prädikatzeichen mit ihrer intendierten Bedeutung versieht. Dann besagt die Formel Un(M) genau das Gewünschte: M wird irgendwann eine Konfiguration erreichen, in der kein Weiterkommen mehr möglich ist. Kurzum: M terminiert. Gilt vielleicht sogar die Richtung von links nach rechts? Die Antwort ist Nein! Da wir die Allgemeingültigkeit einer Formel betrachten, müssen wir jetzt auch solche Interpretationen in Betracht ziehen, in denen die verwendeten Prädikate ihre intendierte Bedeutung verlieren. Beispielsweise sind wir bisher ohne Begründung davon ausgegangen, dass F(x, y) die Beziehung y = x + 1 ausdrückt. Werden die Symbole mit einer anderen Bedeutung versehen, dann kann Un(M) durchaus falsch sein, die Turing-Maschine M aber dennoch terminieren. Um die Beziehung (5.14) in beiden Richtungen sicherzustellen, müssen wir Un(M) um eine Teilformel ergänzen, die F in seine intendierte Bedeutung zwingt. Genau dies leistet Turings Formel Q, die er in [181] folgendermaßen angibt: Q = ∀ x ∃ w ∀ y ∀ z (F(x, w) ∧ (F(x, y) → G(x, y)) ∧ (F(x, z) ∧ G(z, y) → G(x, y)) ∧ (G(z, x) ∨ (G(x, y) ∧ F(y, z)) ∨ (F(x, y) ∧ F(z, y)) → ¬F(x, z))) Mit G hat Turing ein neues Prädikatsymbol mit der folgenden intendierten Bedeutung eingeführt: G(x, y) : x, y sind ganze Zahlen, und x ist kleiner als y Die einzelnen Formelbestandteile von Q besagen dann das Folgende: I
Jede Zahl hat einen Nachfolger F(x, w)
I
x + 1 ist größer als x F(x, y) → G(x, y)
I
Ist x + 1 < y, dann ist auch x < y F(x, z) ∧ G(z, y) → G(x, y)
I
F und G erfüllen die Ordnungseigenschaften aus Abbildung 5.31 G(z, x) ∨ (G(x, y) ∧ F(y, z)) ∨ (F(x, y) ∧ F(z, y)) → ¬F(x, z)
In seinen 1937 publizierten Korrekturen hat Turing gezeigt, dass die Formel Q die intendierte Bedeutung unserer Prädikate tatsächlich hinreichend beschreibt. Damit erhalten wir mit (A(M) ∧ Q) → Halt(M)
(5.15)
281
5.4 Folgen für die Mathematik
die Formel, nach der wir gesucht haben; sie ist genau dann allgemeingültig, wenn die beschriebene Turing-Maschine M auf leerem Band terminiert. Den finalen Schluss in Turings Beweis haben wir weiter oben bereits vorweggenommen. Gäbe es tatsächlich ein Entscheidungsverfahren für die Prädikatenlogik erster Stufe, so könnten wir damit das Halteproblem entscheiden. Um festzustellen, ob eine einseitig beschränkte TuringMaschine M auf leeren Band terminiert, müssten wir lediglich die Formel (5.15) konstruieren und anschließend überprüfen, ob sie allgemeingültig ist oder nicht. Im ersten Fall wüssten wir, dass M terminiert, im zweiten, dass M für immer weiterrechnet. Wir wissen aber bereits, dass das Halteproblem unentscheidbar ist, und deshalb kann auch für das Hilbert’sche Entscheidungsproblem keine positive Lösung existieren: Satz 5.7 (Turing, 1936) Es gibt kein Entscheidungsverfahren für die Prädikatenlogik.
5.4.2
Unvollständigkeit der Arithmetik
In diesem Abschnitt werden wir eine alternative Codierung von TuringMaschinen diskutieren. Anders als im vorangegangenen Abschnitt wird das Ergebnis keine gewöhnliche Formel der PL1 mehr sein, sondern eine Formel der Peano-Arithmetik. Konkret werden wir zeigen, wie sich eine Turing-Maschine M in eine arithmetische Formel übersetzen lässt, die genau dann wahr ist, wenn M terminiert. Der Begriff der Allgemeingültigkeit wird keine Rolle mehr spielen, da wir uns nur noch dafür interessieren, ob die konstruierten Formeln unter der Standardinterpretation der Peano-Arithmetik wahr oder falsch sind. In dieser Interpretation sind die Grundelemente die natürlichen Zahlen, ‚+‘ entspricht der Addition, ‚ב der Multiplikation und ‚s‘ der Nachfolgeroperation. Die Konstruktion basiert auf der Idee, eine Folge von Konfigurationsübergängen in eine einzige natürliche Zahl hineinzucodieren und über diese Zahl zu behaupten, dass sie eine terminierende Berechnungssequenz beschreibt. Wir wollen unserem Ziel in mehreren Etappen entgegen gehen und zunächst überlegen, wie eine einzelne Konfiguration als natürliche Zahl codiert werden kann. Im Allgemeinen hat eine Konfiguration die Form (q, i, s0 , s1 , . . . , sn )
(5.16)
282
5 Berechenbarkeitstheorie
R0(x) = 0
R2(x) = 0
R1(x) = 2 L(x) = 3 ...
I(x) = 0
S2
0
1 q1
2
3
...
wobei q den aktuellen Zustand, i die Position des Schreib-Lese-Kopfs und s0 , s1 , . . . , sn den bis jetzt benutzten Bandabschnitt repräsentiert. Den aktuellen Zustand und die Bandzeichen stellen wir durch natürliche Zahlen dar und verwenden die Zahl n stellvertretend für den Zustand qn oder das Bandzeichen Sn . Somit können wir alle Komponenten einer Konfiguration ausnahmslos als natürliche Zahlen auffassen. Um über die Komponenten einer Konfiguration innerhalb einer Formel sprechen zu können, führen wir mit I, Rj , K und L mehrere neue Funktionssymbole ein, die stellvertretend für die folgenden Funktionen stehen: I : (q, i, s0 , . . . , sn ) → Rj : (q, i, s0 , . . . , sn ) → K : (q, i, s0 , . . . , sn ) → L : (q, i, s0 , . . . , sn ) →
K(x) = 1
Abbildung 5.32: Beschreibung von TuringMaschinen-Konfigurationen mit den Funktionen I, Rj , K und L
i sj
(Kopfposition) (Symbol in der j-ten Zelle)
q (Zustand der Maschine) n + 1 (Anzahl benutzter Bandzellen)
Abbildung 5.32 zeigt, wie sich die Konfiguration einer Turing-Maschine mit den definierten Funktionen beschreiben lässt. Behalten Sie stets im Gedächtnis, dass wir eine Formel der PeanoArithmetik suchen. Eine solche Formel darf neben ‚0‘, ‚s‘, ‚+‘ und ‚ב keine weiteren Funktionszeichen und neben ‚=‘ keine weiteren Prädikatzeichen enthalten. Wir kommen also nicht umhin, die neu eingeführten Symbole irgendwann durch äquivalente arithmetische Ausdrücke zu ersetzen. Für den Moment wollen wir uns an diesem Missstand nicht stören, doch schon jetzt sei angemerkt, dass sich die neu eingeführten Funktionen durch äquivalente arithmetische Ausdrücke ersetzen lassen. Wie dies im Einzelnen gelingt, werden wir weiter unten klären. Mit den neu eingeführten Funktionen werden wir jetzt zwei wichtige Teilformeln definieren. Die erste ist die Formel ϕStart (x). Sie soll genau dann wahr sein, wenn die Variable x die Startkonfiguration einer Turing-Maschine beschreibt. Weiter oben haben wir festgelegt, dass in der Startkonfiguration I
der Schreib-Lese-Kopf über der Zelle 0 steht,
I
der Startzustand q1 eingenommen ist
I
und ein leeres Band vorliegt.
I(x) = 0 K(x) = 1 L(x) = 1 ∧ R0 (x) = 0
Die gesuchte Formel ϕStart (x) erhalten wir durch die konjunktive Verknüpfung der ermittelten Teilausdrücke: ϕStart (x) := (I(x) = 0 ∧ K(x) = 1 ∧ L(x) = 1 ∧ R0 (x) = 0)
283
5.4 Folgen für die Mathematik
Die zweite ist die Formel ϕCont (x). Sie soll genau dann wahr sein, wenn die Maschine in der Konfiguration x nicht terminiert, wenn also eine Instruktion gefunden werden kann, die x in eine Folgekonfiguration überführt. Die Formel können wir analog zur Formel Cont(M) aus Abschnitt 5.4.1 konstruieren. Für die dort betrachtete Maschine lautet sie beispielsweise so: ϕCont (x) := ∃ (y < L(x)) I(x) = y ∧ K(x) = 1 ∧ Ry (x) = 0 ∨
Instruktion (q1 ,S0 ,S1 ,R,q2 )
R0(x) = 0
R2(x) = 0
R1(x) = 2 L(x) = 3
...
S2
0
1 q1
I(x) = 0
2
3
...
∃ (y < L(x)) I(x) = y ∧ K(x) = 2 ∧ Ry (x) = 0 ∨
Instruktion (q2 ,S0 ,S0 ,R,q3 )
∃ (y < L(x)) I(x) = y ∧ K(x) = 3 ∧ Ry (x) = 0 ∨
K(x) = 1
Instruktion (q3 ,S0 ,S2 ,R,q4 )
∃ (y < L(x)) I(x) = y ∧ K(x) = 4 ∧ Ry (x) = 0
(q1 , S0 , S1 , N, q2 )
Instruktion (q4 ,S0 ,S0 ,R,q1 )
Zusätzlich definieren wir für jede Instruktion I eine Formel ϕI (x, y), die den Übergang von der Konfiguration x in die Konfiguration y beschreibt. Als erstes betrachten wir eine Instruktion (qi , S j , Sk , N, ql ), die den Schreib-Lese-Kopf nicht bewegt (Abbildung 5.33). Wird sie ausgeführt, so geht die Turing-Maschine von der Konfiguration x genau dann in die Konfiguration y über,
R0(x) = 1
R1(x) = 2 L(x) = 3 ...
I
wenn in der Ausgangskonfiguration x . . .
• • • • I
n beschriebene Zellen codiert sind,
L(x) = n
der Zustand qi eingenommen ist,
K(x) = i
der Schreib-Lese-Kopf über der Zelle h steht
I(x) = h
und die Zelle h das Zeichen S j enthält
Rh (x) = j
und in der Folgekonfiguration y . . .
• • • •
n beschriebene Zellen codiert sind,
L(y) = n
der Zustand ql eingenommen ist,
K(y) = l
der Schreib-Lese-Kopf über der Zelle h steht
I(y) = h
und die Zelle h das Zeichen Sk enthält.
Rh (y) = k
Ferner dürfen wir nicht vergessen, dass der Bandinhalt an allen Stellen gleich bleibt, an denen der Schreib-Lesekopf nicht steht: ∀ (h < n) (h = h → ∃ s (Rh (x) = s ∧ Rh (y) = s))
R2(x) = 0
S1
S2
0
1
2
3
...
I(x) = 0 q2 K(x) = 2
Abbildung 5.33: Ausführung einer Instruktion der Form (qi , S j , Sk , N, ql )
284
5 Berechenbarkeitstheorie
R0(x) = 1
Fügen wir alle Teilformeln zusammen, so erhalten wir das nachstehende Ergebnis:
R2(x) = 0
R1(x) = 2
I
ϕI (x, y) := ∃ h ∃ n (
L(x) = 3
...
S1
S2
0
1
2
3
L(x) = n ∧ K(x) = i ∧ I(x) = h ∧ Rh (x) = j ∧
...
L(y) = n ∧ K(y) = l ∧ I(y) = h ∧ Rh (y) = k ∧ ∀ (h < n) (h = h → ∃ s (Rh (x) = s ∧ Rh (y) = s)))
I(x) = 0 q2 K(x) = 2
(q2 , S1 , S2 , R, q3 )
R0(x) = 2
Für die anderen Instruktionstypen können wir ganz ähnlich verfahren, allerdings müssen wir ein wenig Mehrarbeit leisten, wenn der SchreibLese-Kopf auf der ersten oder der letzten Zelle der codierten Bandsequenz positioniert ist. Der einfachere Fall ist die Rechtsbewegung (Abbildung 5.34). Bezeichnen wir mit n1 und n2 die Längen der in x bzw. y codierten Bandabschnitte und mit h1 und h2 die Positionen des SchreibLese-Kopfs, so gilt: I
R2(x) = 0
I
L(x) = 3
S2
S2
0
1
2
3
Steht der Schreib-Lese-Kopf nicht ganz rechts,
h1 + 1 = n1
• so codiert y genauso viele Zellen wie x.
R1(x) = 2
...
Instruktionstyp (qi , S j , Sk , N, ql )
... I
n 1 = n2
Steht der Schreib-Lese-Kopf ganz rechts,
h1 + 1 = n1
• so ist in y eine Zelle mehr codiert als in x, • und diese Zelle ist leer.
n1 + 1 = n2 Rn1 (y) = 0
In beiden Fällen rückt der Kopf nach rechts.
h1 + 1 = h2
I(x) = 1
Die Formel ϕI (x, y) stellt sich dann folgendermaßen dar: q3
K(x) = 3
I
Instruktionstyp (qi , S j , Sk , R, ql ) ϕI (x, y) := ∃ h1 ∃ h2 ∃ n1 ∃n2 ( L(x) = n1 ∧ K(x) = i ∧ I(x) = h1 ∧ Rh1 (x) = j ∧
Abbildung 5.34: Ausführung einer Instruktion der Form (qi , S j , Sk , R, ql )
L(y) = n2 ∧ K(y) = l ∧ I(y) = h2 ∧ Rh1 (y) = k ∧ (h1 + 1 = n1 → n1 = n2 ) ∧ (h1 + 1 = n1 → (n1 + 1 = n2 ∧ Rn1 (y) = 0)) ∧ h 1 + 1 = h2 ∧ ∀ (h < n1 ) (h = h1 → ∃ s (Rh (x) = s ∧ Rh (y) = s))) Im Falle der Linksbewegung müssen wir noch wachsamer sein (Abbildungen 5.35 und 5.36). Steht der Schreib-Lese-Kopf bereits ganz links, ist also h1 = 0, so wird die Kopfbewegung simuliert, indem der gesamte Bandinhalt eine Stelle nach rechts kopiert wird. Wir halten fest:
285
5.4 Folgen für die Mathematik
I
• so codiert y genauso viele Zellen wie x • und der Schreib-Lese-Kopf rückt nach links. I
h1 = 0
Steht der Schreib-Lese-Kopf nicht ganz links,
n1 = n2 h1 = h2 + 1
R2(x) = 0
R1(x) = 2 L(x) = 3
h1 = 0
Steht der Schreib-Lese-Kopf ganz links,
• so ist in y eine Zelle mehr codiert als in x, • diese Zelle ist leer • und der Schreib-Lese-Kopf bleibt wo er ist.
R0(x) = 2
n1 + 1 = n2 R0 (y) = 0 h1 = h2
...
S2
S2
0
1
2
3
...
I(x) = 1
Das Umkopieren des Bandinhalts können wir mit der folgenden Formel beschreiben:
q3
∀ (h < n1 ) (h = 0 → ∃ s (Rh (x) = s ∧ Rh+1 (y) = s))
K(x) = 3
Insgesamt erhalten wir die folgende Formel: I
(q3 , S2 , S3 , L, q3 )
Instruktionstyp (qi , S j , Sk , L, ql ) ϕI (x, y) := ∃ h1 ∃ h2 ∃ n1 ∃n2 ( L(x) = n1 ∧ K(x) = i ∧ I(x) = h1 ∧ Rh1 (x) = j ∧
R0(x) = 2
L(y) = n2 ∧ K(y) = l ∧ I(y) = h2 ∧ (h1 = 0 → ( n1 = n2 ∧ h1 = h2 + 1 ∧ Rh1 (y) = k ∧ ∀ (h < n1 ) (h = h1 → ∃ s (Rh (x) = s ∧ Rh (y) = s)))) ∧ (h1 = 0 → ( n1 + 1 = n2 ∧ R0 (y) = 0 ∧ h1 = h2 ∧ R1 (y) = k ∧ ∀ (h < n1 ) (h = 0 → ∃ s (Rh (x) = s ∧ Rh+1 (y) = s))))) Indem wir alle Instruktionsformeln disjunktiv miteinander verknüpfen, erhalten wir eine Formel, die genau dann wahr ist, wenn die Maschine einen Übergang von der Konfiguration x in die Konfiguration y vollziehen kann: ϕTrans (x, y) := ϕI1 (x, y) ∨ ϕI2 (x, y) ∨ ϕI3 (x, y) ∨ . . . ∨ ϕIK (x, y) Als nächstes werden wir versuchen, beliebige Anfangsstücke einer Berechnungssequenz, d. h. eine endliche Folge von Konfigurationen κ0 , κ1 , κ2 , . . . , κm als natürliche Zahl zu codieren. Hierzu führen wir mit M ein einstelliges und mit C ein zweistelliges Funktionssymbol mit der folgenden Bedeutung ein: M : (κ0 , κ1 , κ2 , . . . , κm ) → m (Anzahl Berechnungsschritte) C : (κ0 , κ1 , κ2 , . . . , κm ), k → κk (k-te Konfiguration)
R2(x) = 0
R1(x) = 3 L(x) = 3 ...
S2
S3
0
1
2
3
...
I(x) = 0 q3
K(x) = 3
Abbildung 5.35: Ausführung einer Instruktion der Form (qi , S j , Sk , L, ql )
286
5 Berechenbarkeitstheorie
R0(x) = 2
Mit den beiden neuen Funktionen können wir eine terminierende Berechnungssequenz ohne Umwege beschreiben. Hierzu brauchen wir uns lediglich darauf zu besinnen, dass eine Turing-Maschine M nach n Berechnungsschritten terminiert, wenn sie
R2(x) = 0
R1(x) = 3 L(x) = 3
...
S2
S3
0
1
2
3
...
I(x) = 0
(q3 , S2 , S3 , L, q3 )
...
R2(x) = 3
R1(x) = 3
R3(x) = 0
S3
S3
0
1
2
3
I
und rechnet,
I
bis es kein Weiterkommen gibt.
ϕStart (C(z,0))
n = M(z) ∧ ∀ (u < n) ϕTrans (C(z, u), C(z, s(u))) ¬ϕCont (C(z, n))
(5.17) ϕM := ∃ z ∃ n (ϕStart (C(z,0)) ∧ n = M(z) ∧ ∀ (u < n) ϕTrans (C(z, u), C(z, s(u))) ∧ ¬ϕCont (C(z, n)))
K(x) = 3
L(x) = 4
in der Starkonfiguration beginnt
Zusammenfassend erhalten wir mit
q3
R0(x) = 0
I
...
jene Formel, nach der wir gesucht haben. ϕM ist genau dann wahr, wenn die Turing-Maschine M terminiert. Ihr einziger Makel: Sie ist keine Formel der Peano-Arithmetik, da sie eine Reihe von Funktionszeichen enthält, die uns in PA nicht zur Verfügung stehen, und die Variable y in der Formel ϕCont zudem als Index eines Funktionszeichens vorkommt. Dieses Umstands wollen wir uns jetzt annehmen und die Funktionszeichen nacheinander eliminieren. Der Schlüssel für unser Vorhaben ist wieder einmal die Gödel’sche β -Funktion β (x, y, z) := x mod (1 + y · (z + 1)) mit der wir uns ausführlich in Abschnitt 4.2.3 beschäftigt haben. Dort haben wir nachgewiesen, dass für jede Sequenz natürlicher Zahlen a0 , . . . , an zwei Zahlen b und c existieren mit
I(x) = 0 q3
β (b, c,0) = a0 , β (b, c,1) = a1 , β (b, c,2) = a2 , . . . Damit sind wir in der Lage, jede Konfiguration
K(x) = 3
Abbildung 5.36: Ausführung einer Instruktion der Form (qi , S j , Sk , L, ql ). Im dargestellten Fall steht der Schreib-Lese-Kopf bereits ganz links. Die Kopfbewegung wird simuliert, indem der gesamte Bandinhalt eine Stelle nach rechts kopiert wird.
x = (q, i, s0 , s1 , . . . , sn ) mithilfe zweier Zahlen b und c zu repräsentieren. Diese Zahlen lassen sich so wählen, dass die folgenden Eigenschaften erfüllt sind: β (b, c,0) = n + 1 β (b, c,1) = q
(Anzahl der codierten Zellen, L(x)) (Zustand der Maschine, K(x))
β (b, c,2) = i β (b, c,3) = s0 ...
(Kopfposition, I(x)) (Inhalt der ersten Zelle, R0 (x))
β (b, c, n + 3) = sn
(Inhalt der letzten Zelle, Rn (x))
5.4 Folgen für die Mathematik
Jetzt ist es nur noch eine Formsache, die Formeln ϕStart (x), ϕTrans (x) und ϕCont (x) in Formeln der Peano-Arithmetik zu übersetzen. Beispielsweise können wir die Formel ϕStart (x) = (I(x) = 0 ∧ K(x) = 1 ∧ L(x) = 1 ∧ R0 (x) = 0) wie folgt umschreiben: ϕStart (b, c) := (β (b, c, 2) = 0) ∧ (β (b, c, 1) = 1) ∧ (β (b, c,0) = 1) ∧ (β (b, c, 3) = 0) Ersetzen wir jetzt noch den Platzhalter β (b, c, n) durch den äquivalenten arithmetischen Ausdruck (4.7) aus Abschnitt 4.2.3, so erhalten wir eine echte PA-Formel: ϕStart (b, c) := ∃ d b = s(c × s(2)) × d + 0 ∧ 0 < s(c × s(2)) ∧ ∃ d b = s(c × s(1)) × d + 1 ∧ 1 < s(c × s(1)) ∧ ∃ d b = s(c × s(0)) × d + 1 ∧ 1 < s(c × s(0)) ∧ ∃ d b = s(c × s(3)) × d + 0 ∧ 0 < s(c × s(3)) Auf die gleiche Weise können wir die Formeln ϕTrans (x) und ϕCont (x) in entsprechende Formeln ϕTrans (b1 , c1 , b2 , c2 ) und ϕCont (b, c) transformieren. Übersichtlich sind diese Formeln nicht, und deshalb wollen wir darauf verzichten, sie in voller Gänze auszuschreiben. Auch den Platzhalter β (b, c, n) wollen wir ab jetzt nicht mehr eliminieren. Nachdem wir es geschafft haben, einzelne Konfigurationen arithmetisch zu codieren, wollen wir uns im nächsten Schritt davon überzeugen, dass sich endliche Berechnungssequenzen auf die gleiche Weise codieren lassen. Dies gelingt, indem wir die Gödel’sche β -Funktion ein zweites Mal bemühen. Nach dem oben Gesagten können wir eine endliche Berechnungssequenz κ0 , κ1 , κ2 , . . . , κm als eine Folge von jeweils zwei natürlichen Zahlen auffassen: b0 , c0 , b1 , c1 , . . . , bm , cm Mithilfe der Gödel’schen β -Funktion können wir diese Folge in der gewohnten Weise auf zwei natürliche Zahlen b und c verdichten. Wir wissen, dass b und c so gewählt werden können, dass die folgenden Eigenschaften gelten: β (b, c,0) = m β (b, c,2 · i + 1) = bi β (b, c,2 · i + 2) = ci
(Anzahl der Berechnungsschritte, M(z)) (erste Komponente von C(z, i)) (zweite Komponente von C(z, i))
287
288
5 Berechenbarkeitstheorie
Damit können wir Formel (5.17) folgendermaßen umschreiben: ϕM =∃ b ∃ c ∃ n (ϕStart (β (b, c, 1), β (b, c, 2)) ∧ n = β (b, c,0) ∧
(5.18)
∀ (u < n) ϕTrans (β (b, c, 2 × u + 1), β (b, c, 2 × u + 2), ∀ (u < n) ϕTrans (β (b, c, 2 × u + 3), β (b, c, 2 × u + 4)) ∧ ¬ϕCont (β (b, c, 2 × n + 1), β (b, c, 2 × n + 2))) Jetzt sind wir am Ziel. Mit ϕM haben wir eine PA-Formel konstruiert, die genau dann wahr ist, wenn die codierte Turing-Maschine M terminiert. Der Rest der Argumentation ist der gleiche wie im vorherigen Abschnitt. Gäbe es ein Entscheidungsverfahren für die Peano-Arithmetik, so könnten wir damit das Halteproblem lösen. Hierzu müssten wir lediglich Formel (5.18) konstruieren und prüfen, ob sie wahr oder falsch ist. Aus der Unentscheidbarkeit des Halteproblems folgt nun sofort Satz 5.8 Die semantische Variante des Entscheidungsproblems ist für die Peano-Arithmetik unlösbar. Der Satz besagt, dass kein systematisches Verfahren existiert, das für jede arithmetische Formel immer korrekt entscheidet, ob sie wahr oder falsch ist. Daraus folgt unmittelbar, dass es auch kein formales System für die Peano-Arithmetik geben kann, das korrekt und vollständig ist. Gäbe es ein solches, so könnten wir nach Satz 2.6 die semantische Variante des Entscheidungsproblems lösen. Aber genau dies ist nach Satz 5.8 unmöglich, und wir erhalten eines der bedeutendsten Ergebnisse der Beweistheorie als Korollar: die semantische Variante des ersten Gödel’schen Unvollständigkeitssatzes. Korollar 5.2 (Erster Gödel’scher Unvollständigkeitssatz) Jedes korrekte formale System, das stark genug ist, um die PeanoArithmetik zu formalisieren, ist unvollständig. Die Überlegungen in diesem Abschnitt haben gezeigt, dass wir die semantische Variante des ersten Gödel’schen Unvollständigkeitssatzes auf verblüffend einfache Weise herleiten können. Alles, was wir für seinen Beweis benötigen, sind das Wissen über die Unentscheidbarkeit des Halteproblems sowie die Erkenntnis, dass wir jede Turing-Maschine als arithmetische Formel codieren können. Ein wunderbares Ergebnis.
289
5.4 Folgen für die Mathematik
5.4.3
Hilberts zehntes Problem
In den beiden vorangegangenen Abschnitten haben wir durch die Reduktion des Halteproblems elegante Beweise für die Unlösbarkeit des Entscheidungsproblems der Prädikatenlogik und für die Unvollständigkeit der Arithmetik erhalten. Auf die gleiche Weise werden wir jetzt ein weiteres bedeutendes Negativresultat herleiten: die Unlösbarkeit des zehnten Hilbert’schen Problems. Auf dem 2. internationalen Kongress der Mathematiker in Paris hatte David Hilbert das Problem mit den folgenden Worten formuliert: „Eine diophantische Gleichung mit irgend welchen Unbekannten und mit ganzen rationalen Zahlenkoeffizienten sei vorgelegt: man soll ein Verfahren angeben, nach welchem sich mittelst einer endlichen Anzahl von Operationen entscheiden lässt, ob die Gleichung in ganzen rationalen Zahlen lösbar ist.“
1953
Davis: „Jede semi-entscheidbare Relation lässt sich als diophantische Gleichung mit einer beschränkt allquantifizierten Variable codieren.“ [38]
1961
Davis, Putnam, Robinson: „Jede semi-entscheidbare Relation lässt sich als exponentielle diophantische Gleichung codieren.“ [42]
David Hilbert, 1900 [84] In Kapitel 1 haben wir vorweggenommen, dass sich Hilberts zehntes Problem nicht lösen lässt, d. h., dass es unmöglich ist, ein systematisches Verfahren anzugeben, das für jede diophantische Gleichung immer korrekt entscheidet, ob sie lösbar ist oder nicht. Historisch wurde dieses Ergebnis in mehreren Etappen erzielt (Abbildung 5.37): I
1970
„Jede exponentielle diophantische Gleichung lässt sich in eine gewöhnliche diophantische Gleichung übersetzen.“ [116]
Im Jahr 1953 publizierte Martin Davis eine Arbeit mit dem Titel „Arithmetical Problems and Recursively Enumerable Predicates“ [38]. Darin konnte er zeigen, dass sich jede semi-entscheidbare Relation R(a1 , . . . , an ) in der Form ∃ y ∀ (z ≤ y) ∃ x1 . . . ∃ xm p(a1 , . . . , an , y, z, x1 , . . . , xm ) = 0
Matijaseviˇc:
⇒
Hilberts zehntes Problem ist unlösbar!
(5.19)
darstellen lässt. Hierin ist p ein multivariables Polynom mit n+m+2 Unbekannten. Mit dieser Gleichung hatte Davis den Fuß an den Rand der Ziellinie gesetzt; lediglich der Quantor ∀ (z ≤ y) hinderte ihn daran, sie zu überschreiten. Wäre es Davis gelungen, den Allquantor zu eliminieren, so hätte er Hilberts zehntes Problem entschieden. In Worten würde Gleichung (5.19) dann besagen, dass für jede semi-entscheidbare Relation R eine diophantische Gleichung konstruiert werden kann, die für (a1 , . . . , an ) ∈ R lösbar und für (a1 , . . . , an ) ∈ R unlösbar ist. Aus der Tatsache, dass das Halteproblem semi-entscheidbar ist, ergäbe sich dann in der Tat die Unlösbarkeit des zehnten Hilbert’schen Problems. 1953 schien die Lösung
1984
Jones, Matijaseviˇc: „Jede Registermaschine lässt sich exponentiell diophantisch repräsentieren.“ [94]
Abbildung 5.37: Sternstunden der Mathematik. Seit dem Jahr 1970 wissen wir, dass das zehnte Hilbert’sche Problem keine Lösung besitzt, und seit 1984 haben wir einen eleganten Beweis dafür in Händen.
290
5 Berechenbarkeitstheorie
zum Greifen nahe. Dennoch blieben alle Versuche, den Allquantor aus Gleichung (5.19) zu eliminieren, zunächst ohne Erfolg.
Jones, Matijasevič (1984) Registermaschine I
Reduktion
∃ x1 . . . ∃ xm r(a1 , . . . , an , x1 , . . . , xm ) = s(a1 , . . . , an , x1 , . . . , xm )
Exponentielle diophantische Gleichung
wobei r = s keine gewöhnliche diophantische Gleichung mehr war, sondern eine exponentielle. Im Gegensatz zu gewöhnlichen diophantischen Gleichungen dürfen Variablen hier auch als Exponent verwendet werden. Auch wenn das Ergebnis keinen direkten Rückschluss auf Hilberts zehntes Problem zuließ, wurde dennoch ein wichtiger Meilenstein erreicht: Davis, Putnam und Robinson hatten bewiesen, dass kein Entscheidungsproblem für exponentielle diophantische Gleichungen existieren kann.
Reduktion Diophantische Gleichung Matijasevič (1970)
Abbildung 5.38: Im Jahr 1984 zeigten Jones und Matijaseviˇc, wie sich Registermaschinen exponentiell diophantisch repräsentieren lassen. Zusammen mit dem Ergebnis von Matijaseviˇc aus dem Jahr 1970 ergibt sich daraus ein eleganter Beweis für die Unlösbarkeit des zehnten Hilbert’schen Problems.
Im Jahr 1961 publizierten Martin Davis, Hilary Putnam und Julia Robinson eine wegweisende Arbeit mit dem Titel „The Decision Problem for Exponential Diophantine Equations“ [42]. In dieser Arbeit bewiesen die Autoren einen Satz, der heute als Bounded quantifier theorem bekannt ist. Damit konnten sie den Davis’schen Allquantor tatsächlich eliminieren, doch der Preis dafür war hoch. Die resultierende Gleichung hatte die Form
I
Die Gewissheit, dass auch für gewöhnliche diophantische Gleichungen kein Entscheidungsverfahren existiert, haben wir seit 1970. In diesem Jahr bewies Yuri Matijaseviˇc, dass sich jede exponentielle diophantische Gleichung in eine gewöhnliche diophantische Gleichungen übersetzen lässt (Abbildung 5.38 unten) [116]. Der Beweis ist wenig anschaulich, und wir wollen ihn an dieser Stelle nicht führen. Dennoch spielt er in unserer Argumentation eine wichtige Rolle. Nur mit ihm folgt aus der Unlösbarkeit des Entscheidungsproblems für exponentielle diophantische Gleichungen auch wirklich die Unlösbarkeit des zehnten Hilbert’schen Problems.
I
Obwohl das Rätsel im Jahr 1970 gelöst war, verebbte das Interesse nicht. Der gefundene Beweis war zwar korrekt, dafür aber ungemein technisch und kompliziert. Im Jahr 1984 publizierten James Jones und Yuri Matijaseviˇc schließlich einen neuen Beweis für die Unentscheidbarkeit exponentieller diophantischer Gleichungen (Abbildung 5.38 oben) [94]. Inhaltlich bewiesen sie das Gleiche wie Davis, Putnam und Robinson etliche Jahre zuvor, erzielten ihr Ergebnis aber auf verblüffend elegante Weise. Sie fanden heraus, wie sich Registermaschinen exponentiell diophantisch codieren lassen. Dass es kein Entscheidungsverfahren für exponentielle diophantische Gleichungen geben kann, folgt dann sofort aus der Unentscheidbarkeit des Halteproblems.
291
5.4 Folgen für die Mathematik
Der Beweis von Jones und Matijaseviˇc besticht so sehr durch seine Klarheit und Eleganz, dass er sich zur Untersuchung in diesem Buch geradezu aufzwingt. Um ihn im Detail verstehen zu können, müssen wir aber noch ein wenig Vorarbeit leisten. Zunächst wollen wir klären, wann wir eine diophantische Gleichung als lösbar erachten. Anders als von Hilbert gefordert, werden wir die Lösungen nicht in den ganzen Zahlen, sondern in den natürlichen Zahlen suchen. Auf den ersten Blick machen wir hierdurch einen gewaltigen Fehler. Beispielsweise besitzt die Gleichung (x + 1)3 + (y + 1)3 = (z + 1)3
(5.20)
in den natürlichen Zahlen gar keine, in den ganzen Zahlen dagegen unendlich viele Lösungen. Dass wir den Wertebereich dennoch bedenkenlos wechseln dürfen, liegt daran, dass wir nicht an der Lösbarkeit ganz bestimmter Gleichungen, sondern an der Existenz von Entscheidungsverfahren interessiert sind. Hier gilt, dass wir ein Verfahren für die Lösbarkeit in den ganzen Zahlen dazu verwenden können, um die Lösbarkeit in den natürlichen Zahlen zu entscheiden, und umgekehrt. Wie die jeweiligen Problemreduktionen aussehen, ist in Abbildung 5.39 dargestellt. Eine der vier Schlussrichtungen ist nicht unmittelbar einsichtig. Um sie zu legitimieren, benötigen wir den berühmten Vier-QuadrateSatz von Lagrange, der uns in Abschnitt 3.1.2 bereits begegnet ist. Er besagt, dass sich jede natürliche Zahl als die Summe von vier Quadratzahlen darstellen lässt (Abbildung 5.40).
I
Reduktion von Z auf N p(x1 , . . . , xm ) = 0 hat eine Lösung in Zm
⇓⇑ p(p1 − q1 , . . . , pm − qm ) = 0 hat eine Lösung in N2m I
Reduktion von N auf Z p(x1 , . . . , xm ) = 0 hat eine Lösung in Nm Lagrange1)
⇓⇑ Lagrange1)
2 + y2 + z2 ) = 0 p(w21 + x12 + y21 + z21 , . . . , w2m + xm m m
hat eine Lösung in Z4m Abbildung 5.39: Gegenseitige Reduktion der Entscheidungsprobleme diophantischer Gleichungen 1) „Jede
natürliche Zahl lässt sich als Summe von vier Quadratzahlen darstellen.“
Bezogen auf die Beispielgleichung (5.20) bedeutet die Reduktion das Folgende: Die Frage, ob sie in den ganzen Zahlen lösbar ist, ist äquivalent zur Frage, ob die Gleichung (p1 − q1 + 1)3 + (p2 − q2 + 1)3 = (p3 − q3 + 1)3 eine Lösung in den natürlichen Zahlen hat. Analog gilt, dass (5.20) genau dann in den natürlichen Zahlen lösbar ist, wenn es für die Gleichung (w21 + x12 + y21 + z21 + 1)3 + (w22 + x22 + y22 + z22 + 1)3 = (w23 + x32 + y23 + z23 + 1)3 eine Lösung in den ganzen Zahlen gibt. Die Frage nach der Existenz eines Entscheidungsverfahrens ist damit unabhängig von der konkreten Wahl des Wertebereichs. Würde ein Verfahren existieren, das für jede diophantische Gleichung immer korrekt entscheidet, ob sie in den natürlichen Zahlen lösbar ist, so würde auch ein Entscheidungsverfahren für die Lösbarkeit in den ganzen Zahlen existieren und umgekehrt.
Joseph Louis de Lagrange (1736 – 1813) Abbildung 5.40: Im Jahr 1770 bewies der französische Mathematiker Joseph Louis de Lagrange eine von Bachet de Méziriac im Jahr 1612 geäußerte Vermutung. Sie besagt, dass sich jede natürliche Zahl als Summe von vier Quadratzahlen darstellen lässt.
292
5 Berechenbarkeitstheorie
5.4.3.1
Diophantische Repräsentierbarkeit
In diesem Abschnitt wollen wir klären, wie sich Relationen diophantisch repräsentieren lassen. Die Idee, die wir hierbei verfolgen, ist jener aus Abschnitt 4.2.1 sehr ähnlich. Dort haben wir gezeigt, wie sich Relationen arithmetisch repräsentieren lassen. Definition 5.10 (Diophantisch repräsentierbare Relationen) Sei R ⊆ Nn . Die (exponentielle) diophantische Gleichung p(a1 , . . . , an , x1 , . . . , xm ) = 0 repräsentiert R, wenn sie die folgende Eigenschaft erfüllt: (a1 , . . . , an ) ∈ R ⇔ p(a1 , . . . , an , x1 , . . . , xm ) = 0 hat eine Lösung
In Worten besagt die Definition das Folgende: Eine Relation R wird durch die Gleichung p = 0 diophantisch repräsentiert, wenn wir für jede Kombination (a1 , . . . , an ) ∈ R natürliche Zahlen x1 , . . . , xm finden können, mit p(a1 , . . . , an , x1 , . . . , xm ) = 0. Gilt umgekehrt (a1 , . . . , an ) ∈ R, so darf die Gleichung für keine Kombination von x1 , . . . , xm lösbar sein. In mathematischer Notation können wir den Sachverhalt so ausdrücken: R(a1 , . . . , an ) ⇔ ∃ x1 . . . ∃ xm p(a1 , . . . , an , x1 , . . . , xm ) = 0 Jetzt ist klar, wie wir Gleichung (5.19) zu lesen haben. Die von Davis verwendete Form ist bis auf den zusätzlichen Allquantor mit der hier präsentierten identisch. In Abbildung 5.41 sind mehrere diophantisch repräsentierbare Relationen exemplarisch zusammengefasst. Auch wenn die meisten davon sehr simpel sind, lässt das letzte aufgeführte Beispiel schon jetzt erahnen, dass auch komplexe Relationen diophantisch repräsentiert werden können. Es handelt sich um eine Gleichung mit 26 Unbekannten, die genau dann eine Lösung in den positiven natürlichen Zahlen besitzt, wenn die Zahl k + 2 eine Primzahl ist. [96, 148, 190] Das Primzahlbeispiel wollen wir nicht vorschnell übergehen. Vielleicht ist Ihnen aufgefallen, dass sich die abgebildete Gleichung aus insgesamt 14 Teilausdrücken zusammensetzt, die konjunktiv miteinander verbunden sind. Streng genommen ist sie damit keine echte diophantische Gleichung mehr, da sie neben arithmetischen Verknüpfungen auch Logikoperatoren enthält. Glücklicherweise lassen sich die Operatoren ‚∧‘
293
5.4 Folgen für die Mathematik
Auswahl diophantisch repräsentierbarer Relationen I
I
„x ist eine gerade natürliche Zahl“
„k + 2 ist eine Primzahl“
x−2·y = 0
wz + h + j − q
=
0
∧
(gk + 2g + k + 1)(h + j) + h − z
=
0
∧
3
I
2
=
0
∧
2n + p + q + z − e
=
0
∧
e3 (e + 2)(a + 1)2 + 1 − o2
=
0
∧
(a2 − 1)y2 + 1 − x2
=
0
∧
2
=
0
∧
n+l +v−y
=
0
∧
2
=
0
∧
ai + k + 1 − l − i
=
0
∧
16(k + 1) (k + 2)(n + 1) + 1 − f „x ist eine Quadratzahl“ x − y2 = 0
I
2
„x teilt y“
2 4
2
16r y (a − 1) + 1 − u
x·z−y = 0 2
I
(a − 1)l + 1 − m „x ist größer oder gleich y“ y+z−x = 0
I
2
2
2
2
2
2
=
0
∧
p + l(a − n − 1) + b(2an + 2a − n2 − 2n − 2) − m
=
0
∧
q + y(a − p − 1) + s(2ap + 2a − p2 − 2p − 2) − x
=
0
∧
z + pl(a − p) + t(2ap − p2 − 1) − pm
=
0
((a + u (u − a)) − 1)(n + 4dy) + 1 − (x + cu)
„x ist größer als y“ y+z+1−x = 0
Abbildung 5.41: Auswahl diophantischer repräsentierbarer Relationen. Auch die Menge aller Primzahlen lässt sich diophantisch repräsentieren [190]. Die Zahl k + 2 ist genau dann eine Primzahl, wenn die rechts abgebildete Gleichung eine Lösung in den positiven natürlichen Zahlen besitzt.
und ‚∨‘ sehr einfach eliminieren, so dass wir sie bedenkenlos innerhalb von diophantischen Gleichungen verwenden können. Es gelten die folgenden Zusammenhänge: p=0 ∨ q=0
⇔
p·q = 0
(5.21)
p=0 ∧ q=0
⇔
p +q = 0
(5.22)
2
2
Als nächstes definieren wir mit der Maskierungsrelation ‚‘ einen der Protagonisten im Beweis von Jones und Matijaseviˇc: Definition 5.11 (Maskierungsrelation ‚‘) r und s seien natürliche Zahlen mit den Binärdarstellungen n
r = ∑ ri 2i i=0
(0 ≤ ri ≤ 1),
n
s = ∑ si 2i
(0 ≤ si ≤ 1)
i=0
Die Maskierungsrelation ‚‘ ist wie folgt festgelegt: r s :⇔ ri ≤ si für alle i mit 0 ≤ i ≤ n
294
5 Berechenbarkeitstheorie
In Worten drückt r s aus, dass die i-te Binärstelle von r niemals größer ist als die i-te Binärstelle von s. Für den Moment wollen wir annehmen, dass auch die Maskierungsrelation diophantisch repräsentiert werden kann. Weiter unten werden wir uns davon überzeugen, dass dies wirklich so ist. Im Folgenden wird die Maskierungsrelation häufig im Zusammenhang mit einer speziellen Konstanten auftauchen, die Jones und Matijaseviˇc mit I bezeichnen. Sie steht stellvertretend für die Zahl s
Datenflussmatrix
I :=
∑ Qt
t=0
s
2
1
0
t
r1,s
...
r1,2
r1,1
r1,0
R1
r2,s
...
r2,2
r2,1
r2,0
R2
r3,s
...
r3,2
r3,1
r3,0
R3
r4,s .. .
...
r4,2 .. .
r4,1 .. .
r4,0 .. .
R4
2
1
0
(5.23)
s + 1 Ziffern
Q ist die Basis von I und wird später passend gewählt werden. Auf den ersten Blick ist die Bedeutung der Konstanten I schwer zu erkennen, da ihr exakter Wert in unserer Betrachtung überhaupt keine Rolle spielt. Benötigt wird sie ausschließlich aufgrund der speziellen Struktur ihrer Ziffernfolge; stellen wir I zur Basis Q dar, so entspricht sie einer Folge von genau s + 1 Einsen. 5.4.3.2
s
= 1 1 1 . . . 1 1 1 Q
Codierung von Registermaschinen
t
l1,s
...
l1,2
l1,1
l1,0
L1
l2,s
...
l2,2
l2,1
l2,0
L2
l3,s
...
l3,2
l3,1
l3,0
L3
l4,s .. .
...
l4,2 .. .
l4,1 .. .
l4,0 .. .
L4
Kontrollflussmatrix Abbildung 5.42: Tabellarische Darstellung der Berechnungssequenz einer Registermaschine. Die x-Achse ist die Zeitachse; hier hält die Tabelle für jeden Berechnungsschritt eine separate Spalte vor. Für jedes Register und jede Instruktion existiert eine eigene Zeile. In den Zeilen der Datenflussmatrix ist vermerkt, wie sich die Inhalte der Register ändern. Die Zeileneinträge der Kontrollflussmatrix enthalten entweder den Wert 1 oder 0. Eine 1 bedeutet, dass die Instruktion ausgeführt wird.
Jetzt sind wir gewappnet, um die Berechnungssequenz einer Registermaschine mithilfe einer exponentiellen diophantischen Gleichung zu codieren. Das Verhalten der Maschine werden wir über die folgenden Bezeichner erfassen: r j,t = Inhalt von Register R j zum Zeitpunkt t 1 zum Zeitpunkt t wird die Instruktion L j ausgeführt l j,t = 0 eine andere Instruktion wird ausgeführt Die Berechnungssequenz einer Registermaschine können wir mit einer zweidimensionalen Matrix beschreiben, wie sie in Abbildung 5.42 gezeigt ist. Die horizontale Achse ist die Zeitachse und erstreckt sich von rechts nach links. Vertikal besteht die Darstellung aus zwei Teilmatrizen. Die Datenflussmatrix (oben) hält für jedes Register eine eigene Zeile vor und beschreibt, wie sich die Registerinhalte über die Zeit verändern. In der Kontrollflussmatrix (unten) existiert für jede Instruktion eine eigene Zeile. Dort ist mit einer 1 bzw. einer 0 vermerkt, ob die Instruktion gegenwärtig ausgeführt wird oder nicht. In Abbildung 5.43 (oben) ist die vollständig ausgefüllte Daten- und Kontrollflussmatrix für das Registermaschinenprogramm aus Abbildung 5.16 zu sehen. Die Maschine wird mit der Eingabe R1 = 2 gestartet
295
5.4 Folgen für die Mathematik
23 22 21 20 19 18 17 16 15 14 13 12 11 10
9
8
7
6
5
4
3
2
1
0
1 0 0 0 0
0 0 0 2 1
0 1 0 1 1
0 1 0 1 1
0 1 1 1 1
0 1 1 0 0
1 1 1 0 0
1 1 1 0 0
2 1 1 0 0
2 0 0 0 0
2 0 0 0 0
1 0 0 0 0
0 1 0 0 0
0 1 0 0 0
0 1 1 0 0
0 1 1 0 0
0 1 2 0 0
0 1 2 0 0
0 1 2 0 0
0 0 2 0 1
0 0 2 0 1
0 0 1 1 1
0 0 1 1 1
0 0 0 2 1
23 22 21 20 19 18 17 16 15 14 13 12 11 10
9
8
7
6
5
4
3
2
1
0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
t R1 R2 R3 R4 R5 t L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L11 L12 L13 L14 L15 L16 L17 L18 L19 L20
Registerinhalt Registerinhalt Registerinhalt Registerinhalt Registerinhalt if R1 = 0 goto L20 R2 ← R2 + 1, R3 ← R3 + 1 R1 ← R 1 − 1 if R1 = 0 goto L16 R1 ← R 1 − 1 R4 ← R4 + 1, R5 ← R5 + 1 R3 ← R 3 − 1 if R3 = 0 goto L6 R4 ← R4 + 1, R2 ← R2 − 1 if R2 = 0 goto L9 R3 ← R3 + 1, R4 ← R4 − 1 if R4 = 0 goto L11 R2 ← R2 + 1, R5 ← R5 − 1 if R5 = 0 goto L13 if R1 = 0 goto L5 R3 ← R 3 − 1 if R3 = 0 goto L16 R2 ← R2 − 1, R1 ← R1 + 1 if R2 = 0 goto L18 stop
Q − 22+s+20 = 0 ∧ 1 + (Q − 1) · I = Qs+1 ∧ Qs = L20 ∧ R1 (Q/2 − 1)I ∧ R2 (Q/2 − 1)I ∧ R3 (Q/2 − 1)I ∧ R4 (Q/2 − 1)I ∧ R5 (Q/2 − 1)I ∧ R1 = QR1 + QL18 − QL3 − QL5 + 2 − y · Qs+1 ∧ R2 = QR2 + QL2 + −QL9 + QL13 − QL18 ∧ R3 = QR3 + QL2 − QL7 + QL11 − QL16 ∧ R4 = QR4 + QL6 + QL9 − QL11 ∧ R5 = QR5 + QL6 − QL13 ∧ L1 I ∧ L2 I ∧ L3 I ∧ L4 I ∧ L5 I ∧ L6 I ∧ L7 I ∧ L8 I ∧ L9 I ∧ L10 I ∧ L11 I ∧ L12 I ∧ L13 I ∧ L14 I ∧ L15 I ∧ L16 I ∧ L17 I ∧ L18 I ∧ L19 I ∧ L20 I ∧ I = L1 + L2 + L3 + L4 + L5 + L6 + L7 + L8 + L9 + L10 + L11 + L12 + L13 + L14 + L15 + L16 + L17 + L18 + L19 + L20 ∧ 1 L1 ∧ Q · L1 L20 + L2 ∧ Q · L1 L2 + Q · I − 2R1 ∧ Q · L2 L3 ∧ Q · L3 L4 ∧ Q · L4 L16 + L5 ∧ Q · L4 L5 + Q · I − 2R1 ∧ Q · L5 L6 ∧ Q · L6 L7 ∧ Q · L7 L8 ∧ Q · L8 L6 + L9 ∧ Q · L8 L6 + Q · I − 2R3 ∧ Q · L9 L10 ∧ Q · L10 L9 + L11 ∧ Q · L10 L9 + Q · I − 2R2 ∧ Q · L11 L12 ∧ Q · L12 L11 + L13 ∧ Q · L12 L11 + Q · I − 2R4 ∧ Q · L13 L14 ∧ Q · L14 L13 + L15 ∧ Q · L14 L13 + Q · I − 2R5 ∧ Q · L15 L5 + L16 ∧ Q · L15 L5 + Q · I − 2R1 ∧ Q · L16 L17 ∧ Q · L17 L16 + L18 ∧ Q · L17 L16 + Q · I − 2R3 ∧ Q · L18 L19 ∧ Q · L19 L18 + L20 ∧ Q · L19 L18 + Q · I − 2R2 ∧ Abbildung 5.43: Codierte Berechnungssequenz der hier besprochenen Beispielmaschine für die Eingabe R1 = 2
296
5 Berechenbarkeitstheorie
und terminiert nach 23 Schritten. Die so entstandene Berechnungssequenz kennen wir bereits; sie ist die gleiche, die wir in Abschnitt 5.1.2 verwendet haben, um das Verhalten von Registermaschinen zu erklären. Lediglich die Darstellung ist eine andere. In Abbildung 5.17 hatten wir das Verhalten noch mithilfe eines gewöhnlichen Ablaufprotokolls analysiert.
Registermaschine terminiert unter Eingabe von x
⇓⇑
s
Es existiert eine Lösung für p (Q, I, s, x, y, R1,..., Rr, L1,..., Ll ) = 0
…
Um die Berechnungssequenz einer Registermaschine diophantisch zu codieren, stellen wir zunächst jede Zeile der Datenflussmatrix und der Kontrollflussmatrix durch eine Zahl zur Basis Q dar. Dabei verfolgen wir die Idee, den Eintrag in der t-ten Spalte in die t-te Ziffer hineinzucodieren:
…
Kontrollfluss Datenfluss Ausgabe Eingabe Anzahl Schritte 111...111Q 2x+s+l (Basis) Abbildung 5.44: Codierung von Registermaschinen mithilfe exponentieller diophantischer Gleichungen.
Q 2
R j = ∑ r j,t Qt ,
0 ≤ r j,t <
L j = ∑ l j,t Qt ,
0 ≤ l j,t ≤ 1
t=0 s
(5.24) (5.25)
t=0
In diesen Gleichungen ist s die Anzahl der Berechnungsschritte, durchgeführt von einer Maschine mit den Registern R1 , . . . , Rr und den CodeZeilen L1 , . . . , Ll . Damit die Codierung funktioniert, müssen wir die Basis Q so groß wählen, dass alle darzustellenden Werte in eine einzige Ziffer hineinpassen. Insbesondere müssen wir auch darauf achten, dass bei der Verrechnung zweier Werte keine Überläufe zwischen den einzelnen Ziffern generiert werden. Auf der sicheren Seite sind wir, wenn der Wert von Q für eine Registermaschine mit r Registern, l Code-Zeilen und der Eingabe x folgendermaßen gewählt wird [94]: Q = 2x+s+l
(5.26)
Die Forderung, dass die Ziffern r j,t nicht den vollen Bereich 0 bis Q −1, sondern nur den Bereich 0 bis Q2 − 1 ausschöpfen dürfen, wird weiter unten wichtig werden. Wir benötigen sie, damit die Modellierung der bedingten Verzweigungsbefehle korrekt funktioniert. Wir werden nun daran gehen, die gesuchte diophantische Gleichung aufzustellen. Wie in Abbildung 5.44 gezeigt, wird sie die Variablen Q, I, s, x, y, R1 , . . . , Rr , L1 , . . . , Ll enthalten und für einen festgelegten Wert von x genau dann lösbar sein, wenn die codierte Registermaschine unter Eingabe von x terminiert. Es gilt sogar noch mehr: Haben wir eine konkrete Lösung in Händen, so können wir daraus die vollständige Berechnungssequenz rekonstruieren. In diesem Fall gilt:
297
5.4 Folgen für die Mathematik
I
I und Q besitzen die in (5.23) und (5.26) angegebenen Werte,
I
die Registermaschine terminiert nach s Schritten,
I
im Ausgaberegister R1 steht am Ende der Berechnung der Wert y,
I
R j codiert den Datenfluss, wie er in (5.24) festgelegt ist,
I
L j codiert den Kontrollfluss, wie er in (5.25) festgelegt ist.
Q2
Q0
+(Q − 1)I= 0 0 0 1 1 1 1 1 1
(5.27)
= Qs+1 = 0 0 1 0 0 0 0 0 0 Abbildung 5.45: Visualisierung der Gleichung (5.27) für den Fall Q = 8 und s = 1. Die einzelnen Ziffern sind hier im Binärsystem dargestellt. Die Ziffernwerte liegen zwischen 0 und 7 und sind deshalb 3 Bits breit.
Um die Terminierung der Registermaschine zu beschreiben, fordern wir, dass nach s Berechnungsschritten die Instruktion stop ausgeführt wird. Hierzu verwenden wir eine Gleichung der Form Q2
Qs = ∑ Lk ,
Q1
Q0
Q: 0 0 0 0 0 1 0 0 0
k
Q2
wobei die Summe über alle Zeilen der Form Lk : stop iteriert. I
Q1
1= 0 0 0 0 0 0 0 0 1
Abbildung 5.45 demonstriert an einem konkreten Beispiel, auf welche Weise Gleichung (5.27) den gewünschten Wert von I erzwingt. I
⇓⇑ Q2
Dass Q und I die gewünschten Werte erhalten, können wir folgendermaßen sicherstellen: Q − 2x+s+l = 0 ∧ 1 + (Q − 1) · I = Qs+1
Q0
I= 0 0 0 0 0 1 0 0 1
Wir werden nun eine Reihe von diophantischen Gleichungen formulieren, mit denen sich die genannten Eigenschaften erzwingen lassen: I
Q1
Q 2
Um den Datenfluss adäquat zu beschreiben, fordern wir zunächst, dass die Variablen R j die in (5.24) vereinbarte Form besitzen. Mithilfe der Maskierungsrelation gelingt dies folgendermaßen (Abbildung 5.46):
Q1
: 0 0 0 0 0 0 1 0 0 Q2
Q 2
Q1
( Q2
k
i
R j = QR j + ∑ QLk − ∑ QLi k
(5.28) (2 ≤ j ≤ r) (5.29)
i
Die erste Summe iteriert über alle Zeilen der Form Lk : R j ← R j + 1 und die zweite Summe über alle Zeilen der Form Li : R j ← R j − 1.
Q1
Q0
− 1) · I : 0 1 1 0 1 1 0 1 1
Ferner fügen wir für jedes Register eine eigene Registergleichung (register equation) hinzu, die beschreibt, wie sich der Registerinhalt über die Zeit verändert. Diese Gleichungen lauten folgendermaßen: R1 = QR1 + ∑ QLk − ∑ QLi + x − y · Qs+1
Q0
−1 : 0 0 0 0 0 0 0 1 1 Q2
Q R j ( − 1)I 2
Q0
R j ( Q2 − 1)I Q2
Q1
Q0
Rj : 0 ? ? 0 ? ? 0 ? ? r j,2
r j,1
r j,0
Abbildung 5.46: R j ( Q2 − 1)I stellt sicher, dass in jeder Ziffer r j,t das höchstwertige Bit gleich 0 ist.
298
I
5 Berechenbarkeitstheorie
Li : R j ← R j + 1, Li : R j ← R j − 1 Q2
Li :
Q1
Erstere führen zu einer Erhöhung des j-ten Registers und letztere zu einer Erniedrigung. Die Gleichungen codieren zudem die Start- und die Endkonfiguration. Sie sind so angelegt, dass die am weitesten rechts stehende Ziffer in R1 gleich x und in R2 , . . . , Rr gleich 0 ist. Ferner muss die Ziffer an der Position s + 1 in R1 gleich y und in R2 , . . . , Rr gleich 0 sein.
Q0
0 0 0 0 0 1 0 0 0 li,2
li,1
Q2
Q · Li :
li,0
Q1
Q0
0 0 1 0 0 0 0 0 0 li,1
Um den Programmablauf korrekt zu beschreiben, fordern wir, dass die Elemente der Kontrollflussmatrix ausschließlich die Werte 0 und 1 annehmen können und die Programmausführung mit der Instruktion L1 beginnt:
li,0
L1 I ∧ . . . ∧ Ll I ∧ 1 L1
Q · Li Li+1 Q2
Li+1 :
I
Q1
Q0
? ? 1 ? ? ? ? ? ? li+1,2
li+1,1
li+1,0
Darüber hinaus müssen wir sicherstellen, dass zu jedem Zeitpunkt genau eine Instruktion ausgeführt wird. Dies ist genau dann der Fall, wenn in jeder Spalte der Kontrollflussmatrix genau eine 1 vorhanden ist: l
I
Li : goto Ln Q2
Li :
Q1
Q0
0 0 0 0 0 1 0 0 0 li,2
li,1
Q2
Q · Li :
li,0
Q1
Q0
0 0 1 0 0 0 0 0 0 li,1
li,0
Q · Li Ln Q2
Ln :
Q1
Q0
? ? 1 ? ? ? ? ? ? ln,2
ln,1
ln,0
Abbildung 5.47: Modellierung des Kontrollflusses mithilfe der Maskierungsrelation ‚‘
I = ∑ Li i=1
Zusätzlich müssen wir mehrere Gleichungen formulieren, die den Übergang von einer Konfiguration in die nächste festlegen. Für nichtverzweigende Instruktionstypen lassen sie sich recht einfach niederschreiben (Abbildung 5.47): Li : R j ← R j + 1 : Q · Li Li+1 Li : R j ← R j − 1 : Q · Li Li+1 Li : goto Ln : Q · Li Ln Die Sprungbefehle Li : if R j = 0 goto Ln und Li : if R j = 0 goto Ln erfordern mehr Aufmerksamkeit. Dass die Programmausführung entweder in Zeile n oder in Zeile i+1 fortgesetzt wird, können wir noch vergleichsweise einfach formulieren: Q · Li Ln + Li+1 Jetzt müssen wir noch sicherstellen, dass immer die korrekte Folgeinstruktion ausgeführt wird. Um zu sehen, wie dies gelingen kann, betrachten wir den Ausdruck Q·I − 2·Rj Abbildung 5.48 zeigt, welches Bitmuster entsteht, wenn wir die Subtraktion im Binärsystem durchführen. Wichtig an dieser Stelle ist,
299
5.4 Folgen für die Mathematik
I
Schema
I
Q
Wegen ri, t < 2 und der Multiplikation mit 2 sind diese Bits gleich 0. Q2
Q1
0
0
0
1
0
0
0
1
0
0
0
0
- 2Rj
0
0
0
0
?
?
?
0
?
?
?
0
?
?
? (Übertrag) =
?
?
⎧ 0 falls ri, t- = 0 1 =⎨ 1 falls r ⎩ i, t-1 ≠ 0
?
Q · I 0001 0001 −2R j 0100 0001 1001 = 0000 1100
Q0
QI
I
?
?
?
I
⎧ 1 falls ri, t- = 0 1 =⎨ 0 falls r ⎩ i, t-1 ≠ 0
0001 0010 1101 1110
0001 0100 1001 1100
0000 0010 110 1110
Beispiel 2: r j,3 = 2, r j,2 = 1, r j,1 = 0, r j,0 = 0 Q · I 0001 0001 −2R j 0100 1 1001 = 0000 1100
? (Übertrag) ?
Beispiel 1: r j,3 = 2, r j,2 = 1, r j,1 = 2, r j,0 = 1
0001 0010 1100 1111
0001 0000 0000 0001
0000 0000 000 0000
Beispiel 3: r j,3 = 0, r j,2 = 0, r j,1 = 2, r j,0 = 1 Q · I 0001 0001 −2R j 0000 0000 = 0001 0001
0001 0000 0001 0000
0001 0100 1001 1100
0000 0010 110 1110
Abbildung 5.48: Die Bedeutung der Formel Q · I − 2 · R j . Das am weitesten rechts stehende Bit der t-ten Ziffer zeigt an, ob der Registerinhalt R j zum Zeitpunkt t − 1 gleich oder ungleich 0 ist.
dass wir in Gleichung (5.24) gefordert haben, dass die Ziffern r j,t allesamt die Bedingung r j,t < Q2 erfüllen. Das hat zur Folge, dass wir den Wert R j mit 2 multiplizieren können, ohne zwischen den Ziffern Überläufe zu generieren. Somit sind alle Ziffern von 2 · R j gerade, oder anders formuliert: In allen Ziffern von 2 · R j ist das am weitesten rechts stehende Bit gleich 0. Dies wiederum hat zur Folge, dass die Subtraktion Q · I − 2 · R j genau dann ein Übertragsbit von einem Binärpaket auf das nächste generiert, wenn das Register R j einen Wert = 0 enthält. Das bedeutet, dass wir am Bitmuster von Q · I − 2 · R j ablesen können, ob der Inhalt von Register R j zum Zeitpunkt t gleich oder ungleich 0 ist. Hierzu müssen wir lediglich die Ziffer mit der Wertigkeit Qt+1 betrachten. Ist das am weitesten rechts stehende Bit dieser Ziffer gleich 1, so ist r j,t = 0, ansonsten ist r j,t = 0. Damit können wir das Verhalten der bedingten Sprungbefehle wie folgt charakterisieren: Li : if R j = 0 goto Ln :
Q · Li Ln + Li+1 ∧ Q · Li Li+1 + Q · I − 2R j
300
5 Berechenbarkeitstheorie
r=0 s=0 s=1 s=2 s=3 s=4 s=5 s=6 s=7 s=8 s=9
rs r=1
rs rs r=2
r s r s r s r = 3
rs rs rs rs r=4
r s r s r s r s r s r = 5
r s r s r s r s r s r s r = 6
r s r s r s r s r s r s r s r = 7
rs rs rs rs rs rs rs rs r=8
r s r s r s r s r s r s r s r s r s r = 9
r s r s r s r s r s r s r s r s r s r s r = 10
s = 10 r s r s r s r s r s r s r s r s r s r s r s r = 11 s = 11 r s r s r s r s r s r s r s r s r s r s r s r s r = 12 s = 12 r s r s r s r s r s r s r s r s r s r s r s r s r s r = 13 s = 13 r s r s r s r s r s r s r s r s r s r s r s r s r s r s r = 14 s = 14 r s r s r s r s r s r s r s r s r s r s r s r s r s r s r s r = 15 s = 15 r s r s r s r s r s r s r s r s r s r s r s r s r s r s r s r s Abbildung 5.49: Ordnen wir die Kombinationen von r und s mit r s zweidimensional an, so entsteht die fraktale Struktur des Sierpinski-Dreiecks. Die Werte von s sind zeilenweise aufgetragen. Die Werte von r befinden sich auf den nach unten links verlaufenden Diagonalen.
Li : if R j = 0 goto Ln : Q · Li Ln + Li+1 ∧ Q · Li Ln + Q · I − 2R j Fügen wir alle Bausteine zusammen, so haben wir die Ziellinie fast erreicht. Wir erhalten eine diophantische Gleichung, die genau dann eine Lösung in den natürlichen Zahlen besitzt, wenn die codierte Registermaschine für die gewählte Eingabe terminiert. Wie die Formel für unsere konkrete Beispielmaschine aussieht, ist im unteren Teil von Abbildung 5.43 zu sehen. Nur noch ein einziges Puzzle-Stück fehlt in unserem Beweis. Wir sind bisher davon ausgegangen, dass sich die Maskierungsrelation ‚‘ diophantisch repräsentieren lässt, haben dafür aber noch keine Begründung geliefert. Dies wollen wir jetzt nachholen.
5.4 Folgen für die Mathematik
301
Als erstes wollen wir klären, für welche konkreten Werte von r und s die Beziehung r s erfüllt ist und für welche nicht. Wir unterscheiden zwei Fälle: I
1. Fall: r > s: An mindestens einer Bitstelle hat r den Wert 1 und s an der gleichen Bitstelle den Wert 0. Es gilt daher immer r s.
I
2. Fall: r ≤ s: Für manche Kombinationen gilt r s, für andere nicht. Die genaue Verteilung ist in Abbildung 5.49 dargestellt.
Die Struktur aus Abbildung 5.49 ist in der Mathematik keine Unbekannte. Wir haben das sogenannte Sierpinski-Dreieck vor uns, benannt nach dem polnischen Mathematiker Wacław Sierpi´nski (Abbildung 5.50). Im Bereich der fraktalen Geometrie wird das Dreieck gern verwendet, um das Prinzip der Selbstähnlichkeit zu demonstrieren. Grob gesprochen ist ein Objekt genau dann selbstähnlich, wenn es als Ganzes die gleiche Struktur aufweist wie seine Teile. Am Beispiel des Sierpinski-Dreiecks lässt sich die Eigenschaft gut erkennen. Trennen wir eines der drei Teildreiecke heraus, so erhalten wir erneut ein Sierpinski-Dreieck, das in seiner Struktur dem ursprünglichen gleicht. Das Sierpinski-Dreieck ist eng mit dem Pascal’schen Dreieck verwandt, das in der oberen Hälfte von Abbildung 5.51 dargestellt ist. Die Einträge des Pascal’schen Dreiecks lassen sich auf einfache Weise berechnen, indem die Randzellen zunächst mit dem Wert 1 gefüllt werden. Der Wert einer inneren Zelle entspricht dann ganz einfach der Summe der beiden darüber liegenden Werte. Das Pascal’sche Dreieck hat eine ganz praktische Bedeutung. Die Zelle in Zeile s und Spalte r enthält den Wert des Binomialkoeffizienten s r Diese Eigenschaft folgt sofort aus der vereinbarten Konstruktionsvorschrift und der bekannten Gleichung s+1 s s = + r+1 r r+1 Für unsere Zwecke wird das Pascal’sche Dreieck interessant, wenn wir seine Einträge modulo 2 betrachten. Jede gerade Zahl wird dann zu einer 0 und jede ungerade Zahl zu einer 1. Die untere Hälfte von Abbildung 5.51 zeigt, dass wir auf diese Weise genau jene Struktur erhalten, nach der wir suchen; wir erhalten das Sierpinski-Dreieck aus
Wacław Sierpi´nski (1882 – 1969) Abbildung 5.50: Im Jahr 1915 beschrieb der polnische Mathematiker Wacław Sierpi´nski jenes Fraktal, das wie heute als Sierpinski-Dreieck bezeichnen [163]. Im Bereich der fraktalen Geometrie wird es gerne dazu verwendet, um den Begriff der Selbstähnlichkeit zu erklären.
302
5 Berechenbarkeitstheorie
r=0 s=0 s=1
1
s=2
1
s=3
s=6 s=7 s=8 s=9 s = 11 s = 12 s = 13 s = 14 s = 15
1
1 1
11 12
15
66
91
105
36 45
55
78
21 28
165
220
286
35
84
120
4
35
330
6
84
462 462
792 924
7 8
792
9 45
165
495
r=9
1
36
120
330
r=8
1
28
210
r=7
1
21
126 126
r=6
1
56
210 252
495
5 15
70
r=5
1
10 20
56
r=4
1
6
15
7 8
10
13 14
1
3
10
6
9
1 1
1
1
1 1
s = 10
4 5
r=3
1
3
1 1
r=2
1 2
1
s=4 s=5
r=1
1
55
220
715 1287 1716 1716 1287 715
r = 10
1 10 11 66
286
r = 11
1
r = 12
1 12
78
364 1001 2002 3003 3432 3003 2002 1001 364
r = 13
1 13
91
r = 14
1 14
455 1365 3003 5005 6435 6435 5005 3003 1365 455 105
r = 15
1 15
1
r=0 s=0 s=1 s=2 s=3 s=4 s=5 s=6 s=7 s=8 s=9 s = 10 s = 11 s = 12 s = 13 s = 14 s = 15
1 1
1
1
1
0
0
1
1
0
1
0
1
1
1
0 0
1
0 1
0
0
1 1
1
1
1
1
0
0
1
0
r = 13
1 1
1 1
r = 12
1 0
0 1
r = 11
1 1
0
1
r = 10
1
1 0
0
r=9
1 1
1 1
r=8
1 0
0
0 0
0
1
0
r=7
1
0
0
0
1
1
0
r=6
1 0
0 0
0 0
1
1
r=5
1 1
1
0
0
0
0
0
r=4
1
0
1
0 1
1
0
0 0
1 0
0
1
r=3
1 1
0 1
0 0
1 0
1
1
0
0
r=2
1
1
1 0
0 1
1 0
0 1
1
1 1
1 1
1
1 1
1
1
1
r=1
1
1
r = 14
1 0
r = 15
1 1
1
Abbildung 5.51: Berechnen wir alle Koeffizienten modulo 2, so entsteht aus dem Pascal’schen Dreieck das Sierpinski-Dreieck.
5.4 Folgen für die Mathematik
I
303
Darstellung zur Basis 10 (10 + 1)0 = 1 · 100 (10 + 1)1 = 1 · 101 + 1 · 102 (10 + 1)2 = 1 · 102 + 2 · 101 + 1 · 100 (10 + 1)3 = 1 · 103 + 3 · 102 + 3 · 101 + 1 · 100 (10 + 1)4 = 1 · 104 + 4 · 103 + 6 · 102 + 4 · 101 + 1 · 100 Ab (10 + 1)5 ist die Basis 10 zu klein. Es entstehen Ziffernüberläufe.
I
Darstellung zur Basis 16 (16 + 1)0 = 1 · 160 (16 + 1)1 = 1 · 161 + 1 · 162 (16 + 1)2 = 1 · 162 + 2 · 161 + 1 · 160 (16 + 1)3 = 1 · 163 + 3 · 162 + 3 · 161 + 1 · 160 (16 + 1)4 = 1 · 164 + 4 · 163 + 6 · 162 + 4 · 161 + 1 · 160 (16 + 1)5 = 1 · 165 + 5 · 164 + 10 · 163 + 10 · 162 + 5 · 161 + 1 · 160 Ab (16 + 1)6 ist die Basis 16 zu klein. Es entstehen Ziffernüberläufe.
Abbildung 5.49. Damit haben wir es geschafft, einen elementaren Zusammenhang zwischen der Eigenschaft r s und den Elementen des Pascal’schen Dreiecks herzustellen: r s gilt genau dann, wenn das Pascal’sche Dreieck in Zeile s und Spalte r eine ungerade Zahl enthält: s rs ⇔ ist eine ungerade Zahl (5.30) r Nun gilt nach dem binomischen Lehrsatz das Folgende: s s r s (u + 1) = ∑ u r r=0 Das bedeutet, dass wir jede Zeile des Pascal’schen Dreiecks als die Ziffernfolge der Zahl (u + 1)s betrachten können, wenn wir die Basis u hinreichend groß wählen (Abbildung 5.52). Da die Binomialkoeffizienten die bekannte Beziehung s s ∑ r = 2s r=0
Abbildung 5.52: Jede Zeile des Pascal’schen Dreiecks können wir als die Ziffernfolge der Zahl (u + 1)s auffassen, wenn wir die Basis u hinreichend groß wählen. Die beiden nebenstehenden Beispiele zeigen, dass die Basis 10 ausreicht, um die ersten 5 Zeilen zu beschreiben; erst in der sechsten Zeile entstehen Überläufe. Gehen wir zur Basis 16 über, so wird auch die sechste Zeile korrekt dargestellt. Wollen wir zusätzlich auch die siebte Zeile erfassen, so müssen wir die Basis erneut vergrößern.
304
5 Berechenbarkeitstheorie
erfüllen, sind wir auf der sicheren Seite, wenn wir für u den Wert 2s + 1 wählen. Damit sind wir in der Lage, die Binomialkoeffizienten diophantisch zu erfassen. Es gilt: s m= ⇔ u = 2s + 1 und m ist die r-te Ziffer von (u + 1)s r ⎧ ∃ u ∃ w ∃ v u = 2s + 1 ∧ ⎪ ⎪ ⎨ (u + 1)s = vur+1 + mur + w ∧ (5.31) ⇔ w < ur ∧ ⎪ ⎪ ⎩ m
Kombinieren wir den Satz mit dem Ergebnis von Matijaseviˇc aus dem Jahr 1970, so erhalten wir das, was wir in diesem Abschnitt gesucht haben: Die Antwort auf Hilberts zehntes Problem. Korollar 5.3 Das zehnte Hilbert’sche Problem hat keine Lösung.
305
5.5 Übungsaufgaben
5.5
Übungsaufgaben Aufgabe 5.1 Webcode 5089
Die Instruktionsmengen zweier Turing-Maschinen M1 und M2 seien wie folgt gegeben: I1 := {(q1 , S0 , S1 , R, q2 ), (q2 , S0 , S0 , R, q3 ), (q3 , S0 , S2 , R, q1 )} I2 := {(q1 , S0 , S1 , R, q2 ), (q2 , S0 , S0 , R, q3 ), (q3 , S0 , S2 , R, q1 ), (q4 , S0 , S0 , R, q1 )} a) Erzeugen Sie die Standardbeschreibungen von M1 und M2 . b) Analysieren Sie das Verhalten der Maschinen. Welche Unterschiede fallen Ihnen auf?
In Abbildung 5.12 ist die Instruktionstabelle von Turings historischer universal machine dargestellt. Unter anderem wird dort die folgende Teilmaschine definiert: con(C, α)
con1 (C, α)
con2 (C, α)
⎧ ⎨
Not A
R, R
con(C, α)
⎩
A
L, Pα, R
con1 (C, α)
⎧ ⎪ ⎪ ⎪ ⎨
A
R, Pα, R
con1 (C, α)
D
R, Pα, R
con2 (C, α)
⎪ ⎪ ⎪ ⎩
None
PD, R, Pα, R, R, R
⎧ ⎨
C
R, Pα, R
⎩
Not C
R, R
C con2 (C, α) C
Wird die Maschine in der Konfiguration ...
;
D
A
D
D
C
R
D
A
A
gestartet, so terminiert sie nach 10 Berechnungsschritten, und der Schreib-Lese-Kopf steht an der folgenden Bandposition: ...
a) Tragen Sie den produzierten Bandinhalt in die Abbildung ein. b) Welche Teilaufgabe könnte die Maschine in Turings Gesamtkonstruktion erfüllen?
Aufgabe 5.2 Webcode 5743
306
Aufgabe 5.3 Webcode 5272
5 Berechenbarkeitstheorie
Damit eine Turing-Maschine von einer universellen Maschine simuliert werden kann, muss sie in geeigneter Weise codiert werden. In dieser Aufgabe geht es um die Codierung, die Turing in seiner Arbeit aus dem Jahr 1936 vorgeschlagen hat. Bewerten Sie die folgenden Aussagen:
Aufgabe 5.4 Webcode 5543
wahr
I
Jede natürliche Zahl ist die Gödelnummer einer Maschine.
I
Die Codierung ist injektiv.
I
Die Codierung ist surjektiv.
I
Die Codierung ist bijektiv.
falsch
Wir haben gezeigt, dass sich eine Turing-Maschine oder eine Registermaschine auf zwei Arten nutzen lässt: als Transduktor oder als Akzeptor. Für eine Funktion f : N → N bedeutet dies das Folgende: Als Transduktor nimmt die Registermaschine x als Eingabe entgegen und produziert y als Ausgabe. Als Akzeptor nimmt sie das Tupel (x, y) entgegen und akzeptiert die Eingabe genau dann, wenn x und y die Beziehung f (x) = y erfüllen. Ziel dieser Aufgabe ist es, einen Zusammenhang zwischen diesen Begriffen herzustellen. a) Kann eine berechnende Maschine eine akzeptierende Maschine simulieren? b) Kann eine akzeptierende Maschine eine berechnende Maschine simulieren?
Aufgabe 5.5 Webcode 5781
In Abschnitt 5.1.2 haben Sie eine Registermaschine kennen gelernt, die von James P. Jones und Yuri Matijaseviˇc im Jahr 1991 entworfen wurde [95]. Hierbei handelte es sich um einen Transduktor, der in Register R1 die Eingabe x entgegennimmt und dort auch die Ausgabe f (x) ablegt. Anhand des Ablaufprotokolls aus Abbildung 5.17 konnten Sie einen Eindruck gewinnen, wie sich die Maschine für den Fall R1 = 2 verhält. Nach 23 Schritten hielt sie an und hinterließ in R1 den Ergebniswert 1. a) Vervollständigen Sie die nachstehende Liste, indem Sie den Ablauf für weitere Eingaben simulieren: f (0) =
, f (1) =
, f (2) =
1
, f (3) =
, f (4) =
, f (5) =
b) Welche bekannte Zahlenfolge wird durch die Registermaschine berechnet?
307
5.5 Übungsaufgaben
Alle diskutierten Registermaschinen waren mit drei Sprungbefehlen ausgestattet: I
I
Li : goto Ln
Li : if R j = 0 goto Ln
I
Li : if R j = 0 goto Ln
a) Ist es möglich, damit den folgenden erweiterten Sprungbefehl zu implementieren?
Aufgabe 5.6 Webcode 5696
Li : if R j = 0 goto Ln else goto Lm b) Ändert sich die Ausdrucksstärke des Maschinenmodells, wenn wir uns auf den Sprungbefehl Li : if R j = 0 goto Ln beschränken?
In dieser Aufgabe sollen Sie sich mit dem zellulären Automaten beschäftigen, der über das folgende Regelschema definiert ist: Regel 1
Regel 5
Regel 2
Regel 6
Regel 3
Regel 7
Regel 4
Regel 8
Zustand Linker Nachbar
Rechter Nachbar
Folgezustand
Welche Ihnen bekannte Struktur wird durch diesen Automaten erzeugt? Vervollständigen Sie zur Beantwortung dieser Frage das folgende Diagramm. Die ersten drei Zeilen sind bereits ausgefüllt.
Aufgabe 5.7 Webcode 5742
308
5 Berechenbarkeitstheorie
Aufgabe 5.8 Webcode 5800
In Definition 5.7 haben wir vereinbart, dass eine Menge N genau dann aufzählbar ist, wenn eine surjektive und berechenbare Funktion f : N → N existiert. Welche Konsequenzen ergeben sich, wenn wir die Forderung nach der Surjektivität durch die Forderung nach der Bijektivität ersetzen?
Aufgabe 5.9 Webcode 5932
In Abschnitt 5.3.2 haben Sie den Satz von Rice kennen gelernt. In einem Rundumschlag macht er die Hoffnung zunichte, irgendeine nichttriviale Eigenschaft von Turing-Maschinen algorithmisch zu entscheiden. Doch ist das wirklich so? Als Beispiel betrachten wir die Eigenschaft einer Maschine, exakt 5 Zustände zu besitzen. Mit einem Blick auf die Instruktionstabelle können wir diese Eigenschaft für jede vorgelegte Maschine immer korrekt entscheiden. Aber genau dies dürfte nach dem Satz von Rice nicht möglich sein, oder vielleicht doch?
Aufgabe 5.10 Webcode 5193
In dieser Aufgabe betrachten wir die Formel Inst(qi , S j , Sk , L, ql ) aus Abschnitt 5.4.1. Mit ihr hat Turing in seiner Arbeit aus dem Jahr 1936 die Linksbewegung einer einseitig beschränkten Turing-Maschine beschrieben: Inst(qi , S j , Sk , L, ql ) := ∀ t ∀ y ∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t) ∧ F(t, t ) ∧ F(y , y)) → (I(t , y ) ∧ RSk (t , y) ∧ Kql (t ) ∧ ∀ z (F(y , z) ∨
M
(RSi (t, z) → RSi (t , z)))))
i=0
In Abschnitt 5.1.1.1 haben wir festgelegt, wie sich eine solche Maschine verhält, wenn der Schreib-Lese-Kopf ganz links steht: „Der Schreib-Lese-Kopf einer einseitig beschränkten TuringMaschine kann sich nicht über das Bandende hinausbewegen. Eine angeforderte Linksbewegung wird in diesem Fall ignoriert, und der Schreib-Lese-Kopf verharrt in seiner Position.“ Offenbar ist die verbale Beschreibung in der Formel ϕI (x, y) überhaupt nicht umgesetzt. a) Ist der Turing’sche Beweis etwa unvollständig? b) Wie schwierig wäre es, die verbale Beschreibung in die Formel ϕI (x, y) zu integrieren?
5.5 Übungsaufgaben
In Abschnitt 5.4.2 haben wir herausgearbeitet, wie sich Turing-Maschinen arithmetisieren lassen. In diesem Zusammenhang haben wir die PA-Formel ϕI (x, y) eingeführt, die den Übergang von einer Konfiguration x in eine Konfiguration y beschreibt. Für die Linksbewegung lautetet sie beispielsweise so:
309
Aufgabe 5.11 Webcode 5892
ϕI (x, y) := ∃ h1 ∃ h2 ∃ n1 ∃n2 ( L(x) = n1 ∧ K(x) = i ∧ I(x) = h1 ∧ Rh1 (x) = j ∧ L(y) = n2 ∧ K(y) = l ∧ I(y) = h2 ∧ (h1 = 0 → ( n1 = n2 ∧ h1 = h2 + 1 ∧ Rh1 (y) = k ∧ ∀ (h < n1 ) (h = h1 → ∃ s (Rh (x) = s ∧ Rh (y) = s)))) ∧ (h1 = 0 → ( n1 + 1 = n2 ∧ R0 (y) = 0 ∧ h1 = h2 ∧ R1 (y) = k ∧ ∀ (h < n1 ) (h = 0 → ∃ s (Rh (x) = s ∧ Rh+1 (y) = s))))) Wir hätten den Beweis vereinfachen können, indem wir ihn für einseitig beschränkte TuringMaschinen führen. Wie würde die Formel dann aussehen?
Am Beispiel der diophantischen Gleichung (x + 1)3 + (y + 1)3 = (z + 1)3 haben wir in Abschnitt 5.4.3 argumentiert, dass es einen Unterschied darstellt, ob wir nach Lösungen in den ganzen Zahlen oder in den natürlichen Zahlen suchen.
Aufgabe 5.12 Webcode 5970
a) Zeigen Sie, dass die Gleichung in den ganzen Zahlen unendlich viele Lösungen hat. b) Warum ist die Gleichung in den natürlichen Zahlen unlösbar?
In Abschnitt 5.4.3 haben wir erarbeitet, wie sich diophantische Gleichungen konjunktiv oder disjunktiv zusammenfassen lassen. a) Welche Relationen werden durch die folgenden beiden Gleichungen repräsentiert? a+x+1−b = 0 ∨ b+y+1−a = 0 a+x−b = 0 ∧ b+y−a = 0 b) Formen Sie die Ausdrücke in gewöhnliche diophantische Gleichungen um.
Aufgabe 5.13 Webcode 5100
310
Aufgabe 5.14 Webcode 5651
Aufgabe 5.15 Webcode 5999
5 Berechenbarkeitstheorie
R und S seien zwei diophantisch repräsentierbare Relationen. a) Ist die Relation R ∪ S diophantisch repräsentierbar? b) Ist die Relation R ∩ S diophantisch repräsentierbar?
In Abbildung 5.41 ist eine diophantische Gleichung mit 26 Unbekannten aufgeführt, die genau dann eine Lösung in den positiven natürlichen Zahlen besitzt, wenn k + 2 eine Primzahl ist. a) Kann diese Gleichung dazu verwendet werden, alle Primzahlen aufzuzählen? b) Lässt sich die Menge aller Primzahlzwillinge ebenfalls diophantisch repräsentieren?
Aufgabe 5.16 Webcode 5156
Das nachstehende Registermaschinenprogramm stammt aus der mehrfach zitierten Arbeit von Jones und Matijaseviˇc aus dem Jahr 1984 [94]: L0 L1 L2 L3 L4 L5
R2 ← R2 + 1 R2 ← R2 + 1 if R3 = 0 goto L5 R3 ← R3 − 1 goto L2 R3 ← L3 + 1 R4 ← R4 + 1
R2 ← R2 − 1 L6 if 0 < R2 goto L5 L7 R2 ← R2 + 1 R4 ← R4 − 1 L8 if 0 < R4 goto L7 L9 if R3 < R1 goto L5 L10 if R1 < R3 goto L1
L11 if R2 < R1 goto L10 L12 R1 ← R1 − 1 R2 ← R2 − 1 R3 ← R3 − 1 L13 if 0 < R1 goto L12 L14 stop
a) Mit Ri < R j wird eine Operation verwendet, die unser Registermaschinenmodell nicht von Hause aus unterstützt. Zeigen Sie, dass sich die Operationen mit den nativen Sprachelementen nachbilden lassen. b) Führen Sie das Programm für die Eingabe R1 = 2 händisch aus und erstellen Sie ein Ablaufdiagramm, das ähnlich aussieht wie jenes aus Abbildung 5.17. Beachten Sie, dass die Programmausführung in Zeile L0 beginnt und nicht, wie bisher, in Zeile L1 . c) Stellen Sie für diese Berechnungssequenz die Daten- und Kontrollflussmatrix auf. Wie eine solche Matrix aussieht, wurde in Abbildung 5.43 gezeigt. d) Wenn Sie die Registermaschine für verschiedene Eingabewerte starten, werden Sie feststellen, dass sie in manchen Fällen hält und in anderen für immer weiter rechnet. Versuchen Sie, einen Zusammenhang zwischen dem Eingabewert und der Terminierungseigenschaft herzustellen.
311
5.5 Übungsaufgaben
In Abschnitt 5.4.3.2 haben wir gezeigt, wie sich Registermaschinen diophantisch codieren lassen. Die von uns konstruierte Gleichung enthielt unter anderem den Teilausdruck L1 I ∧ . . . ∧ Ll I
(5.33)
Er stellt sicher, dass L1 , . . . , Ll ausschließlich aus den Ziffern 0 und 1 besteht. Darüber hinaus hatten wir über den Teilausdruck l
I = ∑ Li
(5.34)
i=1
erzwungen, dass in jeder Spalte der Kontrollflussmatrix höchstens eine 1 vorkommt. Auf den ersten Blick scheinen wir (5.33) gar nicht zu benötigen, da deren inhaltliche Aussage augenscheinlich aus (5.34) folgt. Beweisen oder widerlegen Sie diese Vermutung.
Aufgabe 5.17 Webcode 5548
6 Algorithmische Informationstheorie
„Any one who considers arithmetical methods of producing random digits is, of course, in a state of sin.“ John von Neumann [125] In Kapitel 5 haben wir uns ausführlich mit der Funktionsweise von Turing-Maschinen beschäftigt und dabei zwei wichtige Beobachtungen gemacht: Einerseits können wir Turing-Maschinen dazu verwenden, um Zeichensequenzen zu generieren. Andererseits können wir sie wie die Programme einer beliebigen Programmiersprache behandeln und somit selbst als Zeichensequenzen auffassen. In diesem Abschnitt werden wir diese Beziehung verallgemeinern und eine Zeichensequenz s mit dem kürzesten Programm in Bezug setzen, das s erzeugt. Auf diese Weise wird es uns gelingen, den Informationsgehalt oder die Komplexität einer endlich langen oder unendlich langen Zeichenkette exakt zu messen. Die ersten Untersuchungen dieser Art wurden gegen Ende der Sechzigerjahre von Ray Solomonoff, Andrej Kolmogorov und Gregory Chaitin durchgeführt. Aus diesen Forschungsarbeiten hat sich eine neue Theorie der Information entwickelt, die wir heute als algorithmische Informationstheorie bezeichnen. Das Ziel dieses Kapitels ist es, die Kernideen der algorithmischen Informationstheorie in ihren Grundzügen darzustellen. Hierzu werden wir in Abschnitt 6.1 zunächst klären, wie sich die Komplexität einer Zeichenkette durch die Rückführung auf den Algorithmenbegriff formal erfassen lässt. Unter anderem werden wir dabei lernen, präzise zwischen zufälligen und nicht zufälligen Zeichenketten zu unterscheiden. Gegenstand von Abschnitt 6.2 wird dann erneut das Turing’sche Halteproblem sein. Über den Begriff der Haltewahrscheinlichkeit werden wir auf direktem Weg zur Chaitin’schen Konstanten geführt, einer wahrhaft wundersamen Zahl, deren Entdeckung zu den Sternstunden der modernen mathematischen Logik zählt. Anschließend werden wir in Abschnitt 6.3 einen trickreichen Zusammenhang zwischen Kalkülen und Programmen herstellen und auf diese Weise die wahre Bedeutung der algorithmischen Informationstheorie offenlegen. Am Ende unserer Betrachtungen werden wir mit dem Chaitin’schen Unvollständigkeitssatz ein Theorem in Händen halten, das uns die Grenzen der mathematischen Methode ein weiteres Mal messerscharf vor Augen führen wird.
314
6 Algorithmische Informationstheorie
6.1
Algorithmische Komplexität
Wir beginnen unsere Diskussion mit zwei Fragen: I
Wie viel Information enthält die Struktur aus Abbildung 6.1?
I
Worin unterscheiden sich die Binärsequenzen aus Abbildung 6.2?
Die zweite Frage behandelt wir zuerst. In beiden Beispielen scheint die Abfolge der Nullen und Einsen augenscheinlich keiner Gesetzmäßigkeit zu folgen; sowohl die linke als auch die rechte Sequenz wirken geradewegs so, als hätten wir sie durch eine Reihe von Münzwürfen erzeugt. Doch dürfen wir unserer Intuition an dieser Stelle trauen? Sind die Nullen und Einsen tatsächlich willkürlich verteilt oder unterliegen ihre Anordnungen vielleicht doch verborgenen Gesetzmäßigkeiten, die wir mit bloßem Auge nur nicht erkennen?
Abbildung 6.1: Visualisierung einer dreidimensionalen Mandelbrot-Menge von Daniel White und Paul Nylander [134, 177]
Um dieser Frage auf den Grund zu gehen, wollen wir versuchen, beide Zahlenfolgen mit dem Computerprogramm Zip zu verkürzen. Die Idee ist naheliegend: Kompressionsprogramme suchen nach Gesetzmäßigkeiten, anhand derer sich die vorgelegte Eingabe aus einer verkürzten Bitsequenz wiederherstellen lässt. Gelingt die Kompression, so wäre der Beweis erbracht, dass die vorgelegten Ziffernfolgen keine Zufallssequenzen sind. Wurden die Folgen aber tatsächlich mit einer Münze erzeugt, so enthielten die ersten n Ziffern keine Information über die Werte an den übrigen Bitstellen. Die Binärsequenz wäre frei von jeglicher Redundanz, und das Kompressionsprogramm würde eine Ausgabe produzieren, die etwa die gleiche Länge besitzt wie die Eingabe.
1011100111011110100000011010111000001111011111111010001101001 1010101000000000011000001000110011100110010000011100010000101 1000001110100011101111000100001111010000100101110101101111000 0001001101101011000000101110011110001000110000111001011010110 0110110100010010100010001001010000001111100100000110101110010 1000000111100110001100100100001010011111100101010110100011110 1101000000001011001001111011110010110110101011111111110101001 1110111001111110111010001000011110010110111100111010001100111 0101011101101011011100000010001000001110100111000111110100111 0001011001101110111100111101101000100100010010011100001001011 0100110000110111110011110100111101111010100000010100011101010 0101101111010110011001010101100011110110101001100000010010111 0110011101111011001101010111011111101101100011110111111100100 1011011100001101110010010000010010001110000101100111110011101 0001111010110000101111000101000011111001101101110011010000111 0001111111000010001111011111111111010111001101110000000110011 010100111111010100001101 . . .
0000000111110010110101001001001111110100110001100011011001010 1110101111011111101000101011100010010111000111110001111010100 0101001110111100111011110011000011011110010100101001110110010 1111001111110111011000100010111100000111010001000111010110100 1011100100111000000110101000001100101101101001100010011101111 1011101101010001011111100000000010101011010001111001111011010 0110110001000000111001001101100011101001110110101000010010100 1100011011011101001111011001010111100001110101010000001001000 0110111010110101011010000001000111100100101001100010001111101 1000010000000101100011010001111101001001101001110001111001100 0111100101110000010011101011000101010111010011101011000101101 0001101101101111100000101010000100110111110100011011100011001 1111001110101111011011011011110001101001010000100110100011100 0000011011100000100010011001011001001100011111010000100100101 1001011000100110000011010010011100001010010110110111010100011 0100000100011101011001101110010000000110101100010010010100111 011111100111000001000101 . . .
Abbildung 6.2: Sind die dargestellten Binärsequenzen zufällig? (Vgl. [147])
315
6.1 Algorithmische Komplexität
Das Ergebnis des Experiments ist in Abbildung 6.3 zusammengefasst. Auf den ersten Blick scheint sich unsere Vermutung, zwei zufällige Binärsequenzen vor uns zu haben, tatsächlich zu bestätigen. In beiden Fällen produziert Zip eine Ausgabe, die geringfügig länger ist als die Eingabe. Doch wie aussagekräftig ist unser Experiment? Im Prinzip ist es nicht ausgeschlossen, dass sich in den willkürlich erscheinenden Ziffernfolgen eine Gesetzmäßigkeit verbirgt, die das Kompressionsprogramm einfach nicht erkennt. Abbildung 6.4 zeigt, dass die linke Ziffernfolge tatsächlich einer solchen Gesetzmäßigkeit unterliegt; sie besteht aus den ersten 1000 Nachkommaziffern der Zahl π, gerechnet modulo 2. Die Ziffernfolge ist damit alles andere als eine Zufallszahl und lässt sich mit einem einfachen Programm systematisch erzeugen. In der anderen Binärsequenz ist eine solche Gesetzmäßigkeit nicht vorhanden. Sie wurde aus den Ziffern einer Zufallszahl generiert, die dem 1955 erschienenen Buch A Million Random Digits with 100,000 Normal Deviates entstammt [35]. Dieses sehr spezielle Werk enthält auf mehr als 600 dicht beschriebenen Seiten insgesamt 1.000.000 Ziffern einer experimentell ermittelten Zahlenfolge. Da die Abfolge der Nullen und Einsen keiner Gesetzmäßigkeit unterliegt, lassen sich die Ziffern auch nicht systematisch berechnen. Wollen wir eine endliche Zufallssequenz mit einem Programm ausgeben, so sind wir gezwungen, alle Ziffern im Klartext zu codieren. Ein solches Programm sähe etwas so aus:
Erste Sequenz: 125 Byte
158 Byte
125 Byte
162 Byte
Zweite Sequenz:
Abbildung 6.3: Keine der beiden Sequenzen lässt sich mit dem Kompressionsprogramm Zip verkleinern.
I Sequenz 1
π
3.14159265358979323846. . . 3.26433832795028841971. . .
3.10111001110111101000. . . 3.00011010111000001111. . . I Sequenz 2
PRINT "0000000111110010110101001001001111110100110..."
Es ist leicht einzusehen, dass die Länge eines Programms dieser Form etwa der Länge der Ausgabe entspricht. Bei der Ausgabe von 1000 Ziffern ist dies noch kein Problem, und mit hoher Wahrscheinlichkeit ist ein solches Programm dann immer noch kürzer als eines zur Berechnung von π. Dies ändert sich, wenn wir längere Binärsequenzen betrachten. Wollten wir nicht nur 1000, sondern 1.000.000 Ziffern ausgeben, so würde das Programm zur Ausgabe der Zufallssequenz um den Faktor 1000 länger. Das Programm zur Berechnung von π würde hingegen nur geringfügig länger werden1 . Wir sagen, die erste Sequenz hat eine geringere algorithmische Komplexität. 1 Tatsächlich bleibt die Programmlänge nicht konstant. Sie steigt logarithmisch an, da wir die Anzahl der auszugebenden Nachkommastellen als Konstante in das Programm hineincodieren müssen.
3.08422689531964509303. . . 3.23209025601595334764. . .
3.00000001111100101101. . . 3.01001001001111110100. . . Abbildung 6.4: Nur die zweite Binärsequenz ist zufällig. Sie wurde aus den ersten 1000 Ziffern einer 1955 publizierten Zahl generiert, die im Rahmen eines Zufallsexperiments ermittelt wurde.
316
Die algorithmische Komplexität hat viele Namen. Häufig wird sie als Kolmogorov-Komplexität, manchmal auch als Kolmogorov-ChaitinKomplexität bezeichnet. Kolmogorov ersann den Begriff im Jahr 1965 [106] (Abbildung 6.5), Chaitin griff ihn 1969 auf [27] und machte ihn nicht zuletzt durch die Publikation mehrerer populärwissenschaftlicher Bücher einer breiten Öffentlichkeit bekannt [24–26]. Der eigentliche Vater der algorithmischen Komplexität ist aber ein anderer. Die Idee, die Komplexität von Zeichenketten auf den Algorithmenbegriff zurückzuführen, wurde bereits 1960 von Ray Solomonoff publiziert [174]. Eine zweiteilige Langfassung dieser Arbeit folgte im Jahr 1964 [175, 176]. Korrekterweise müssten wir also von der SolomonoffKomplexität sprechen, doch nur wenige Autoren verwenden diesen Begriff. Vereinzelt wird die algorithmische Komplexität auch als Beschreibungskomplexität bezeichnet, oder es wird von algorithmischer Information gesprochen.
6 Algorithmische Informationstheorie
Definition 6.1 (Algorithmische Komplexität) Die algorithmische Komplexität κ(s) einer endlichen Binärsequenz s ist die Länge des kürzesten Programms, das s ausgibt.
Um Missverständnissen vorab entgegenzuwirken, wollen wir die Definition in zwei Punkten präzisieren: I
Mit Programm meinen wir ein Programm, das in einer festgelegten Programmiersprache geschrieben ist. Welche Sprache wir dabei zugrunde legen, spielt für unsere Betrachtungen keine Rolle. Wichtig ist, dass die betrachteten Programme ohne Eingabe loslaufen, eine Reihe von Berechnungen durchführen und irgendwann eine Binärsequenz s ausgeben, sofern sie überhaupt terminieren. Das Vorbild für unser Programmmodell sind Turing-Maschinen, die auf einem leeren Band gestartet werden. Terminiert eine solche Maschine, so ist der geschriebene Bandinhalt die Zeichenkette s.
I
Mit der Länge eines Programms meinen wir die Anzahl der Bits, die für seine Codierung benötigt werden. Legen wir die Menge aller Java-Programme zugrunde, so meinen wir damit die Länge der Programmdatei in Bits. Messen wir die algorithmische Komplexität mithilfe von Turing-Maschinen, so entspricht die Programmlänge der Anzahl von Nullen und Einsen, die wir zur Darstellung ihrer Gödelnummer im Binärsystem benötigen.
Behalten Sie stets im Gedächtnis, dass wir mit der algorithmischen Komplexität keine Maßzahl im absoluten Sinn vor uns haben; der Wert von κ(s) hängt nicht nur von der Binärsequenz s, sondern immer auch von der vereinbarten Programmiersprache und der gewählten Gödelisierung ab. Ändern wir einen dieser Parameter, so ändert sich auch die algorithmische Komplexität κ(s).
Andrej Nikolajewitsch Kolmogorov (1903 – 1987)
Für die folgenden Betrachtungen ist es wichtig, dass wir Gödelnummern nicht als natürliche Zahlen, sondern als Bitsequenzen auffassen. Damit sind 0, 00, 000, . . . für uns verschiedene Gödelnummern, auch wenn sie der gleichen natürlichen Zahl entsprechen.
Abbildung 6.5: Der russische Mathematiker Andrej Kolmogorov ist der Namensgeber der Kolmogorov-Komplexität. Diese Bezeichnung ist das am häufigsten benutzte Synonym für den Begriff der algorithmischen Komplexität.
Jetzt sind wir in der Lage, auch die erste der zu Beginn dieses Abschnitts formulierten Fragen zu beantworten. Setzen wir den Informationsgehalt eines Objekts mit seiner algorithmischen Komplexität gleich, so enthält das Fraktal aus Abbildung 6.1 trotz seines Detailreichtums nur wenig Information. Mit einem überschaubaren Programm lässt sich die Bitfolge der Bilddatei in beliebiger Auflösung erzeugen.
317
6.1 Algorithmische Komplexität
Alles in allem hat die bisherige Diskussion zwei Dinge gezeigt: I
I
Ist die algorithmische Komplexität κ (s) berechenbar?
Mit der algorithmischen Komplexität κ(s) halten wir eine Maßzahl in Händen, die wir mit bloßem Auge nicht erfassen können. Die eingangs diskutierten Binärsequenzen unterstreichen nachdrücklich, dass ähnlich wirkende Objekte völlig unterschiedliche Komplexitäten besitzen können.
Eingabe:
Die Maßzahl κ(s) geht nicht immer mit unserer intuitiven Vorstellung von Komplexität einher. Selbst hochkompliziert wirkende Strukturen, wie das Fraktal aus Abbildung 6.1, können eine geringe algorithmische Komplexität aufweisen.
n := 1
Die Frage, die sich uns an dieser Stelle aufdrängt, ist eine naheliegende: Können wir ein Verfahren ersinnen, mit dem wir die algorithmische Komplexität für eine vorgelegte Binärsequenz s systematisch berechnen können? Die Antwort auf diese Frage ist negativ.
n := n + 1
s := die n-te Binärsequenz
Satz 6.1 s durchläuft die Binärsequenzen 0, 1, 00, 01, 000, 001, 010, 011, 100, ...
Es existiert kein systematisches Berechnungsverfahren für κ(s).
Beweis: Wir beweisen den Satz durch Widerspruch und nehmen an, es gäbe ein Programm, das κ(s) für beliebige Binärsequenzen s berechnen kann. Dieses können wir, wie in Abbildung 6.6 gezeigt, zu einem größeren Programm P erweitern. Die Funktionsweise von P ist simpel: Zu Beginn wird die Variable n mit dem Wert 1 initialisiert und anschließend in einer Schleife schrittweise um eins erhöht. In jeder Iteration wird die n-te Binärsequenz bestimmt (wir nennen sie s) und ihre algorithmische Komplexität berechnet. Sobald κ(s) größer als eine vordefinierte Konstante N ist, gibt das Programm s aus und hält an. Wie wird sich das Programm P für große Werte von N verhalten? I
Zunächst halten wir fest, dass P für alle Werte von N irgendwann eine Ausgabe produzieren und anhalten wird. Der Grund hierfür ist leicht einzusehen: Da es nur endlich viele Binärsequenzen mit einer algorithmischen Komplexität kleiner als N geben kann, müssen im Umkehrschluss unendlich viele Sequenzen mit einer Komplexität größer als N existieren. Folgerichtig muss die Bedingung κ(s) > N irgendwann wahr werden und das Programm terminieren.
Nein
κ (s) > N Ja? Ja Ausgabe: s
Abbildung 6.6: Für jeden Wert der Konstanten N wird das Programm irgendwann eine Binärsequenz s ausgeben, deren Komplexität größer als N ist (κ(s) > N). Wählen wir den Wert von N so, dass er die Länge des Programms signifikant übersteigt, so wird s von einem Programm ausgegeben, das kürzer als N ist (κ(s) < N). Der entstandene Widerspruch lässt nur einen Ausweg zu: Es kann kein Verfahren geben, mit dem wir die algorithmische Komplexität einer vorgelegten Binärsequenz immer korrekt berechnen können.
318
6 Algorithmische Informationstheorie
I
Für unsere Betrachtung ist die Programmlänge |P| entscheidend. Im Wesentlichen besteht P aus einer konstanten Anzahl Bits, und seine Länge wird lediglich durch die konkrete Wahl der Konstanten N noch geringfügig beeinflusst. Zur Codierung von N benötigen wir )log2 N* Bits, so dass wir die folgende Formel aufstellen können: |P| = c + )log2 N* Der exakte Wert der Konstanten c spielt für unsere Betrachtung keine Rolle. Ihn exakt zu beziffern, ist ohnehin schwierig, da er maßgeblich durch die verwendete Programmiersprache und die gewählte Gödelisierung beeinflusst wird.
I
Eine zufällig herausgegriffene Binärsequenz ist nur selten regelmäßig. Um den Grund hierfür zu verstehen, betrachten wir exemplarisch alle Sequenzen mit 1.000.000 Binärziffern. Eine Sequenz s soll als zufällig gelten, wenn ihre algorithmische Komplexität mindestens |s| − 10 beträgt. In unserem Beispielszenario existieren 21000000 Binärsequenzen der Länge |s|, aber nur 2999990 Binärsequenzen der Länge |s| − 10. Damit gibt es weniger als 2999990 Programme, die für die Erzeugung regelmäßiger Binärsequenzen in Frage kommen. Der Prozentsatz regelmäßiger Sequenzen lässt sich dann folgendermaßen nach oben abschätzen: 2999990 1 = 10 < 0,1% 21000000 2 Das bedeutet, dass sich unter 1000 Binärsequenzen im statistischen Mittel höchstens eine regelmäßige befindet. Die Rechnung zeigt: Fast alle Binärsequenzen sind zufällig!
Wählen wir für N den Wert 2c , so gilt |P| = c + )log2 2c * = 2 · c. Jetzt ist N wesentlich größer als die Programmlänge |P|. Starten wir P, so beginnt die Suche nach einer Binärsequenz s mit κ(s) > N. Nach dem oben Gesagten, wird P eine solche Sequenz finden, diese ausgeben und anschließend terminieren. Aber genau dies steht im Widerspruch zu der Tatsache, dass wir s gerade mit einem Programm ausgegeben haben, das kürzer ist als N; es müsste also gleichzeitig κ(s) < N und κ(s) > N gelten. Der Widerspruch lässt nur einen Ausweg zu: Wir müssen die Annahme verwerfen, κ(s) sei für jede beliebige Binärsequenz s berechenbar, und damit ist Satz 6.1 bewiesen.
Satz 6.1 besagt nicht, dass die algorithmische Komplexität für keine Binärsequenz berechnet werden kann; für einzelne Sequenzen kann eine Berechnung durchaus gelingen. Ausgeschlossen ist jedoch die Existenz eines allgemeinen Verfahrens, dass die algorithmische Komplexität für jede vorgelegte Binärsequenz immer korrekt berechnet. An dieser Stelle kommen wir auf die eingangs diskutierte Fragestellung zurück: Wann ist eine Binärsequenz zufällig? Mit dem Begriff der algorithmischen Komplexität verfügen wir über das passende Instrumentarium, um zwischen zufälligen und nicht zufälligen Binärsequenzen zu unterscheiden: Definition 6.2 (Endliche Zufallssequenz) I
Eine endliche Binärsequenz s heißt zufällig, wenn ihre algorithmische Komplexität κ(s) ungefähr |s| entspricht.
I
Eine endliche Binärsequenz s heißt regelmäßig oder komprimierbar, wenn ihre algorithmische Komplexität κ(s) deutlich kleiner ist als |s|.
319
6.1 Algorithmische Komplexität
Hinter dieser Definition verbirgt sich die Idee, dass wir immer dann von einer Zufallssequenz sprechen, wenn sie sich nicht aus einer deutlich kleineren Bitsequenz rekonstruieren lässt. Mit anderen Worten: Zufallssequenzen sind nicht signifikant komprimierbar. Sehr präzise ist diese Festlegung freilich nicht, schließlich bleibt völlig offen, was mit „deutlich kleiner“ oder „signifikant komprimierbar“ genau gemeint ist. Dieses Problem wird sich weiter unten von selbst erledigen, wenn wir den Übergang von endlich langen zu unendlich langen Binärsequenzen vollziehen.
Wie lautet die erste zufällige Binärsequenz > N ?
Eingabe:
Zunächst wollen wir uns mit der Frage beschäftigen, ob wir mit einem systematischen Verfahren entscheiden können, ob eine vorgelegte Zeichenkette s zufällig ist oder nicht. Da wir zu diesem Zweck lediglich entscheiden müssen, ob die algorithmische Komplexität einer Binärsequenz s ungefähr der Länge von s entspricht, schließt Satz 6.1 die Existenz eines solchen Verfahrens nicht von vorneherein aus. Ein Argument, das jenem aus dem Beweis von Satz 6.1 sehr ähnlich ist, lässt aber auch diese Hoffnung zerbersten. Satz 6.2
n := N
n := n + 1
s := die n-te Binärsequenz
Es existiert kein Verfahren, das für eine vorgelegte Binärsequenz s immer korrekt entscheidet, ob s zufällig ist oder nicht. Nein
Beweis: Wir nehmen wir an, es gäbe ein Programm, das eine beliebige Binärsequenz entgegennimmt und immer korrekt entscheidet, ob sie zufällig ist oder nicht. Dann wären wir in der Lage, ein Programm P zu schreiben, das den Ablaufplan aus Abbildung 6.7 implementiert. Zu Beginn wird die Variable n mit dem Wert N initialisiert und in einer Schleife schrittweise erhöht. Danach wird geprüft, ob die n-te Binärsequenz zufällig ist. Sobald P eine solche Sequenz findet, wird sie ausgegeben und das Programm angehalten. Erneut interessiert uns die Frage, wie sich P für große Werte von N verhalten wird. I
Zunächst halten wir fest, dass P für jeden Wert von N terminiert. Den Grund hierfür haben wir bereits im Beweis zu Satz 6.1 erörtert. Da unendlich viele Zufallssequenzen existieren, können wir für jedes N eine Zahl n mit n > N finden, die zu einer zufälligen Binärsequenz s führen wird.
I
Für unsere Betrachtung ist erneut die Programmlänge |P| entscheidend. Im Wesentlichen besteht P aus einer konstanten Anzahl von
random(s) Ja ? Ja Ausgabe: s
Abbildung 6.7: Das dargestellte Programm liefert den Beweis, dass kein Verfahren existieren kann, das für jede Binärsequenz s immer korrekt entscheidet, ob s zufällig ist oder nicht.
320
6 Algorithmische Informationstheorie
Bits, und seine Länge wird lediglich durch die konkrete Wahl von N noch geringfügig beeinflusst. Zur Codierung von N benötigen wir )log2 N* Bits, so dass wir die Programmlänge über die Formel |P| = c + )log2 N* abschätzen können. Wiederum spielt der genaue Wert der Konstanten c keine Rolle. I
Wählen wir für N den Wert 2c , so gilt |P| = c + )log2 2c * = 2 · c. Offensichtlich ist Konstante N jetzt signifikant größer als die Programmlänge |P|. Nach dem oben Gesagten wird das Programm auch für diesen Wert von N irgendwann eine zufällige Binärsequenz s finden, diese ausgeben und terminieren. Aber genau dies steht im Widerspruch zu der Tatsache, dass wir s gerade mit einem Programm ausgegeben haben, das signifikant kürzer ist als N.
Seien Sie sich auch hier dessen bewusst, dass Satz 6.2 nur die Existenz eines systematischen Verfahrens ausschließt, dass für jede vorgelegte Binärsequenz immer korrekt entscheidet, ob sie zufällig ist oder nicht. Für ganz spezielle Sequenzen kann ein Beweis trotzdem gelingen. Beispielsweise waren wir weiter oben in der Lage, die erste der eingangs diskutierten Binärsequenzen als regelmäßig zu entlarven. Wir wollen nun daran gehen, den Begriff der algorithmischen Komplexität auf unendlich lange Binärsequenzen zu übertragen. Eine naheliegende Definition wäre diese hier: Eine unendlich lange Binärsequenz s heißt regelmäßig, wenn ein Programm existiert, das alle Ziffern von s in einer Endlosschleife nacheinander ausgibt. Anstatt allgemein von einem Programm zu sprechen, könnten wir auch die Existenz einer TuringMaschine fordern, die alle Ziffern von s nacheinander auf ein leeres Band schreibt. Wiederum wird klar, was für eine Maschine wir im Sinn haben: Sie arbeitet ganz genau so wie eine computing machine aus der Turing’schen Originalarbeit. Obwohl diese Definition auf den ersten Blick reizvoll erscheint, werden wir sie nicht verwenden. Um den Grund hierfür zu verstehen, betrachten wir die Binärsequenz aus Abbildung 6.8. Entstanden ist sie, indem die Bits einer Zufallssequenz mit den Bits einer regelmäßigen Sequenz paarweise verschränkt wurden. Die Bits an den ungeraden Positionen sind aus den Nachkommastellen der Zahl π generiert und leicht berechenbar. Die Bits an den ungeraden Positionen sind unserer Zufallssequenz aus Abbildung 6.2 entnommen. Nach der vorgeschlagenen Definition wäre die konstruierte Bitfolge eine Zufallssequenz; sie enthält eine unberechenbare Teilfolge und kann daher von keinem Programm
321
6.1 Algorithmische Komplexität
1
0
1
1
1
0
0
1
1
1
0
...
π
0
1
1
1
1
0
0
1
1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 0 1 0 1 0 1 0 0 0 0 0 1 1 1 1 1 ... 0
0
0
0
0
0
0
1
1
1
1
1
0
0
1
0
1
1
...
Abbildung 6.8: Die dargestellte Binärsequenz entsteht, indem eine regelmäßige Bitfolge mit einer zufälligen Bitfolge verschränkt wird. Da sie eine unberechenbare Teilfolge enthält, kann sie von keinem Programm erzeugt werden. Dennoch würden wir die Binärsequenz nicht als zufällig erachten, da sich jedes Anfangsstück mit einem Programm ausgeben lässt, das etwa nur halb so lang ist wie die Sequenz selbst.
erzeugt werden. Als zufällig würden wir sie dennoch nicht bezeichnen, schließlich könnten wir jedes Anfangsstück mit einem Programm ausgeben, das signifikant kürzer ist als die Sequenz selbst (Abbildung 6.9). Aus diesem Grund werden wir einen anderen Weg wählen und den Begriff der unendlich langen Zufallssequenz auf die Definition für endliche Sequenzen zurückführen. Definition 6.3 (Unendliche Zufallssequenz) Eine unendlich lange Binärsequenz s = s1 , s2 , s3 , . . . mit si ∈ {0, 1} heißt zufällig, wenn eine Konstante c ∈ N existiert mit κ(s[1 . . . n]) > (n − c) für alle n s[1 . . . n] := s1 , . . . , sn bezeichnet das n-te Anfangsstück von s.
κ (n)
n n-c n 2
Eine Binärsequenz, die nicht zufällig ist, heißt regelmäßig oder komprimierbar. n
Nach dieser Definition ist die Sequenz aus Abbildung 6.8 nicht mehr zufällig. Da jedes Anfangsstück der Länge n mit einem Programm ausgegeben werden kann, das etwa halb so lang ist wie n, können wir c wählen, wie wir wollen: Ab einem bestimmten Wert von n wird die Komplexität des Anfangsstücks mit Sicherheit kleiner sein als n − c. Selbst für riesige Werte für c ist sichergestellt, dass die prozentuale Abweichung zwischen κ(s[1 . . . n]) und n gegen 0 strebt. Die Unschärfe, die Definition 6.2 negativ anhaftete, ist durch den Übergang zu unendlich langen Binärsequenzen jetzt vollständig verschwunden.
Abbildung 6.9: Jedes Anfangsstück der Binärsequenz aus Abbildung 6.8 lässt sich mit einem Programm ausgeben, das etwa halb so lang ist wie die Sequenz selbst. Daher wird die Komplexität des Anfangsstücks irgendwann kleiner sein als n−c, unabhängig davon, wie groß wir die Konstante c wählen. Die Bitfolge ist daher keine Zufallssequenz im Sinne von Definition 6.3.
322
6 Algorithmische Informationstheorie
6.2
Die Chaitin’sche Konstante „Omega [...] embodies an enormous amount of wisdom in a very small space [...] inasmuch as its first few thousand digits, which could be written on a small piece of paper, contain the answers to more mathematical questions than could be written down in the entire universe.“ Charles Bennett, Martin Gardner [59]
Im vorigen Abschnitt haben wir die Grundlage geschafft, um den Begriff der unendlich langen Zufallssequenz formal zu erfassen. Dabei sind wir zu der Erkenntnis gelangt, dass eine Binärsequenz selbst dann komprimierbar sein kann, wenn sie unberechenbar ist. Ein prominentes Beispiel ist die Haltesequenz H := h1 , h2 , h3 . . . mit 1 falls das i-te Programm terminert (6.1) hi := 0 sonst
G
0 1 00 01 10 11 000 001 010 011 100 101
Gödelnummer
H = 0 0 0 1 0 0 0 0 0 0 0 1 ... Das Programm mit der Gödelnummer 01 terminiert.
Wie bisher betrachten wir Programme, die in einer vorab festgelegten Programmiersprache verfasst sind und keine Eingabe verarbeiten. Nach dem Start läuft ein solches Programm entweder für immer weiter oder gibt irgendwann eine Binärsequenz aus und terminiert. Wir denken uns alle Programme anhand ihrer Gödelnummern durchnummeriert und bezeichnen das Programm mit der Gödelnummer i ganz einfach als das i-te (Abbildung 6.10). Um über die genaue Abfolge der Nullen und Einsen in H eine Aussage zu treffen zu, benötigen wir zweierlei (vgl. [147]): I
Wir müssen wissen, welchem Programm das i-te Bit in H entspricht. Kurzum: Wir müssen die verwendete Gödelisierung kennen. Ändert sich diese, so ändern sich auch die Bits von H. Die Haltesequenz ist also keine universelle Größe, sondern abhängig von der verwendeten Gödelisierung.
I
Wir müssen entscheiden können, ob das i-te Programm terminiert. Dass dies nur in Einzelfällen gelingen kann, folgt unmittelbar aus der Unentscheidbarkeit des Halteproblems. Ein Verfahren, das alle Bits von H nacheinander erzeugt, kann es nicht geben. Kurzum: Die Haltesequenz H ist unberechenbar.
Das Programm mit der Gödelnummer 101 terminiert. Abbildung 6.10: Das i-te Bit in der Haltesequenz H ist genau dann gleich 1, wenn das i-te Programm terminiert. Würden wir die Bitfolge vollständig kennen, so könnten wir das Halteproblem lösen. Im Umkehrschluss können wir aus der Unentscheidbarkeit des Halteproblems sofort schließen, dass H nicht systematisch berechnet werden kann.
Wir wollen versuchen, die Haltesequenz zu komprimieren. Hierzu nutzen wir aus, dass uns die ersten m Bits von H Auskunft darüber geben,
323
6.2 Die Chaitin’sche Konstante
I
wie viele der ersten m Programme anhalten (
I
und welche Programme dies sind.
(
Anzahl der Einsen)
I HelloWorld.pas
Position der Einsen)
Tatsächlich ist die zweite Information redundant. Sobald wir wissen, wie viele der ersten m Programme anhalten, können wir auch bestimmen, um welche es sich im Einzelnen handelt. Hierzu müssen wir lediglich den Ablauf der ersten m Programme parallel simulieren und die anhaltenden Programme notieren. Da wir genau wissen, wie viele Programme terminieren werden, wissen wir auch präzise, wann die Simulation beendet werden kann. Wir wollen versuchen, die Anzahl der terminierenden Programme als Wahrscheinlichkeit anzugeben, und lassen uns dabei von der folgenden Vorstellung leiten: Wir packen die Binärsequenzen der ersten m Programme in einen Behälter und nehmen wahllos eine Sequenz heraus. Die Wahrscheinlichkeit, eine Bitsequenz zu entnehmen, die der Gödelnummer eines anhaltenden Programms entspricht, bezeichnen wir als Haltewahrscheinlichkeit. Kenne wir diese, so können wir die Anzahl der terminierenden Programme ganz einfach durch die Multiplikation mit m zurückgewinnen. Problematisch wird diese Vorstellung dann, wenn wir nicht die ersten m Binärsequenzen, sondern alle endlichen Binärsequenzen in den Behälter packen. Hat dann die Vorstellung überhaupt noch Sinn, eine Binärsequenz zufällig herauszuziehen? Wie wäre beispielsweise die zu erwartende Durchschnittslänge der gezogenen Sequenzen? Für jeden konkreten Wert von l erhalten wir einen unmittelbaren Widerspruch, da nur endlich viele Sequenzen existieren, die kleiner sind als l, aber unendlich viele, die größer sind. Wir werden gleich sehen, dass wir Widersprüche dieser Art vermeiden können, wenn wir die erlaubten Gödelisierungen geringfügig einschränken. Konkret werden wir nur noch solche zulassen, die das Kriterium der Präfixfreiheit erfüllen. Die folgende Definition klärt, was wir hierunter im Detail zu verstehen haben.
Definition 6.4 (Präfixfreie Programmcodierung) Eine Programmcodierung heißt präfixfrei, wenn die Gödelnummer eines Programms niemals mit der Gödelnummer eines anderen Programms beginnt. Eine präfixfreie Codierung stellt sicher, dass jede Binärsequenz mit der Gödelnummer von höchstens einem Programm beginnt; kein Programm
PROGRAM HelloWorld; BEGIN WRITELN(’Hello World’); END.
50 6c 0a 57 65 27
52 6c 42 52 6c 29
4f 6f 45 49 6c 3b
47 57 47 54 6f 0a
52 6f 49 45 20 45
41 72 4e 4c 57 4e
4d 6c 0a 4e 6f 44
20 64 20 28 72 2e
48 3b 20 27 6c
65 0a 20 48 64
Abbildung 6.11: Pascal-Programme sind von Hause aus präfixfrei. Alle Programme enden mit dem Schlüsselwort ‚END‘, gefolgt von einem Punkt.
(q1 , S0 , S1 , R, q2 ) (q2 , S0 , S0 , R, q3 ) (q3 , S0 , S2 , R, q4 ) (q4 , S0 , S0 , R, q1 )
(q1 , S0 , S1 , R, q2 ) (q2 , S0 , S0 , R, q3 ) (q3 , S0 , S2 , R, q4 ) (q4 , S0 , S0 , R, q1 ) (q1 , S1 , S1 , R, q2 )
73 13 32 53 11 73 11 33 53 11 17 31 11 33 22 53 11 11 73 11 11 33 53 17 31 32 32 53 11
Abbildung 6.12: Turings Originalcodierung aus dem Jahr 1936 ist nicht präfixfrei. Die Gödelnummer der rechten Maschine beginnt mit der Gödelnummer der linken.
324
I
6 Algorithmische Informationstheorie
Beispiel
01
0010
1110
H = 000100000001000011000000000010... 101
0011
⇒ Die Programme mit den Gödelnummern 01, 101, 0010, 0011, 1110 terminieren. I
Haltewahrscheinlichkeiten 0 1
Ω1 = 0
00 01 10 11 Ω2 = 14
000 001 010 011 100 101 110 111 Ω3 = 38
0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 9 Ω4 = 16
Abbildung 6.13: In diesem Beispiel existieren 5 terminierende Programme. Die Haltewahrscheinlichkeit Ωn können wir ermitteln, indem wir alle Bitsequenzen der Länge n auflisten und anschließend zählen, wie viele davon mit der Gödelnummer eines terminierenden Programms beginnen.
ist der Anfang eines anderen. Einige Programmiersprachen wie z. B. Pascal sind von Hause aus präfixfrei. Hier endet jedes Programm mit dem speziellen Schlüsselwort ‚END.‘ (Abbildung 6.11). Viele Gödelisierungen von Turing-Maschinen erfüllen das Kriterium der Präfixfreiheit nicht. Verwenden wir beispielsweise das Codierungsschema aus Turings Originalarbeit, so können wir aus jeder Gödelnummer durch das Anhängen weiterer Zeichen eine andere Gödelnummer erzeugen (Abbildung 6.12). Es ist leicht einzusehen, dass sich durch eine geringfügige Modifikation auch Turing-Maschinen so codieren lassen, dass keine Gödelnummer der Anfang einer anderen ist. Somit können wir die Eigenschaft der Präfixfreiheit in den nachstehenden Betrachtungen bedenkenlos einfordern. Jetzt sind alle Voraussetzung geschaffenen, um den Begriff der Haltewahrscheinlichkeit solide zu definieren (Abbildung 6.13): Definition 6.5 (Haltewahrscheinlichkeit Ωn ) Sei s eine Binärsequenz, die aus allen 2n Binärsequenzen der Länge n zufällig herausgegriffen wurde. Die Haltewahrscheinlichkeit Ωn ist die Wahrscheinlichkeit, dass s mit der Gödelnummer eines terminierenden Programms beginnt.
Wir wollen versuchen, dem Begriff der Haltewahrscheinlichkeit eine noch intuitivere Bedeutung zu verleihen. Stellen Sie sich hierzu vor, dass wir die Gödelnummer eines Programms im Rahmen eines Zufallsexperiments erzeugen möchten. Zu diesem Zweck werfen wir mehrmals hintereinander eine Münze und notieren eine 1 für Kopf und eine 0 für Zahl. Wenn wir Glück haben, entsteht auf diese Weise irgendwann die Gödelnummer eines Programms. In diesem Fall beenden wir unser Experiment, da eine Verlängerung der erzeugten Binärsequenz aufgrund der Präfixfreiheit nicht mehr zum Erfolg führen kann. Natürlich kann es uns auch passieren, dass wir auf diese Weise niemals zu einer Gödelnummer gelangen. In diesem Fall fahren wir für immer mit dem Münzwurf fort. In Abbildung 6.14 ist der Entscheidungsbaum unseres Experiments zu sehen. Ausgehend von der Wurzel besitzt jeder Knoten zwei Nachfolger, die jeweils für eine der beiden Möglichkeiten stehen, die Sequenz um ein weiteres Bit zu verlängern. Als Ergebnis erhalten wir einen Baum, dessen Pfade entweder unendlich lang sind oder zu Blättern führen, die mit der Gödelnummer eines Programms markiert sind. Bezogen auf unser Zufallsexperiment besitzt die Haltewahrscheinlichkeit ei-
325
6.2 Die Chaitin’sche Konstante
000 00 001 0 010 01 011 100 10 101 1 110 11 111
0000 0001 0010 0011 0100
Gödelnummer eines nichtterminierenden Programms (Noch) keine Gödelnummer eines Programms
0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111
ne ganz praktische Bedeutung: Ωn ist die Wahrscheinlichkeit, mit maximal n Münzwürfen die Gödelnummer eines terminierenden Programms zu erzeugen. Das Experiment zeigt uns zugleich den Weg auf, wie wir die Haltewahrscheinlichkeit berechnen können. In unserem Beispiel existieren fünf terminierende Programme, gegeben durch die Gödelnummern 01, 101, 0010, 0011 und 1110. Das Programm mit der Gödelnummer 01 wird in unserem Experiment mit der Wahrscheinlichkeit 14 erzeugt, das Programm 101 mit der Wahrscheinlichkeit 18 und die Programme 0010, 1 . Alle Ereignis0011 und 1110 jeweils mit der Wahrscheinlichkeit 16 se sind stochastisch unabhängig. Somit ist die Gesamtwahrscheinlichkeit, eine der fünf Maschinen zu erzeugen, die Summe der Einzelwahrscheinlichkeiten. Mit Ω1 = 0 1 Ω2 = 4 1 1 3 Ω3 = + = 4 8 8 1 1 1 1 1 9 Ω4 = + + + + = 4 8 16 16 16 16
Gödelnummer eines terminierenden Programms
Abbildung 6.14: Durch das Werfen einer Münze werden so lange neue Bits generiert, bis die Gödelnummer eines Programms entsteht. Die Haltewahrscheinlichkeit Ωn hat in diesem Münzwurfexperiment eine intuitive Bedeutung. Sie ist die Wahrscheinlichkeit, mit maximal n Würfen ein terminierendes Programm zu erzeugen.
326
6 Algorithmische Informationstheorie
erhalten wir exakt die durch Abzählen ermittelten Wahrscheinlichkeiten aus Abbildung 6.13. Unsere Überlegung können wir in nahe liegender Weise verallgemeinern. Bezeichnet P ein terminierendes Programm und |P| die Länge seiner Gödelnummer, so geht P mit dem Gewicht 21|P| in die Berechnung der Gesamtwahrscheinlichkeit ein. Somit ist
„Suche die erste gerade natürliche Zahl > 2, die sich nicht als Summe zweier Primzahlen schreiben lässt.
Ωn =
∑
P hält, |P| ≤ n
P |P |= n
Terminiert P ?
Ja
Die Goldbach'sche Vermutung ist falsch.
Ωn
Nein
Die Goldbach'sche Vermutung ist wahr.
Abbildung 6.15: In der Bitfolge der Haltewahrscheinlichkeit Ωn sind die Antworten auf sämtliche mathematischen Fragestellungen codiert, die sich über die Terminierungseigenschaft eines Programms der Maximallänge n entscheiden lassen.
1 2|P|
(6.2)
Die Haltewahrscheinlichkeiten Ωn sind verblüffende Objekte der mathematischen Logik. In ihnen ist das nötige Wissen konzentriert, um sämtliche Fragestellungen zu entscheiden, die sich durch die Angabe eines berechenbaren Gegenbeispiels widerlegen lassen. Jede derartige Fragestellung können wir in ein Programm P übersetzen, das nach einem Gegenbeispiel sucht und im Erfolgsfall anhält (Abbildung 6.15). Hat P die Länge n, so können wir mithilfe von Ωn die Anzahl der Binärsequenzen bestimmen, die mit der Gödelnummer eines terminierenden Programms beginnen. Durch die schrittweise Simulation aller in Frage kommenden Programme können wir die terminierenden herausfiltern und auf diese Weise herausbekommen, ob P terminiert oder unendlich lange läuft. Im ersten Fall ist die mathematische Fragestellung widerlegt, im zweiten Fall ist sie bewiesen. Die Schar von mathematischen Problemen, die sich auf diesem Weg prinzipiell beweisen oder widerlegen lassen, ist riesig. Hierunter fallen viele berühmte und bisher ungelöste Probleme der Mathematik, wie die Goldbach’sche Vermutung oder die Riemann’sche Hypothese. In der Haltewahrscheinlichkeit liegt die Antwort auf diese Fragen verborgen, codiert in einer Abfolge von Bits, die auf wenigen Buchseiten problemlos Platz finden würde. Soweit die Theorie. Aber können wir tatsächlich darauf hoffen, die Goldbach’sche Vermutung oder die Riemann’sche Hypothese eines Tages auf solche Art und Weise zu entscheiden? Zunächst müssten wir einen Weg finden, die Haltewahrscheinlichkeit Ωn zu berechnen. Für kleine Werte von n kann dies tatsächlich gelingen. Da in diesem Fall nur wenige Gödelnummern betrachtet werden müssen, können wir darauf hoffen, alle terminierenden Programme durch eine individuelle Analyse zu bestimmen. Es ist leicht einzusehen, dass die Berechnung von Ωn aber höchstens für endliche viele n möglich ist. Wären wir in der Lage, unendlich viele Ωn zu berechnen, so hätten wir Zugriff auf genug Wissen, um das Halteproblem zu entscheiden. Um festzustellen, ob ein Programm P der Länge n anhält, müssten wir dann lediglich die nächst größere Zahl m bestimmen, für die Ωm berechenbar ist. Über die Haltewahrscheinlichkeit Ωm erhielten wir dann Auskunft darüber, wie
327
6.2 Die Chaitin’sche Konstante
viele Programme der maximalen Länge m terminieren. Anschließend könnten wir durch die parallele Simulation aller in Frage kommenden Programme entscheiden, ob P dazu gehört oder nicht. Aus der Unentscheidbarkeit des Halteproblems folgt also unmittelbar, dass Ωn unberechenbar sein muss, sobald n eine gewisse Grenze überschreitet. Wir wollen nun analysieren, wie sich die Haltewahrscheinlichkeiten Ωn für größere Werte von n entwickeln. Offensichtlich ist die Folge Ω1 , Ω2 , Ω3 , . . . I
monoton steigend und
I
nach oben beschränkt.
Ωn ≤ Ωn+1 )
( (
Ωn ≤ 1)
Hieraus folgt sofort, dass die Folge einem Grenzwert zustreben muss. Sie konvergiert gegen die berühmte Chaitin’sche Konstante Ω. Definition 6.6 (Chaitin’sche Konstante) Die Chaitin’sche Konstante Ω ist definiert als der Grenzwert Ω := lim Ωn = n→∞
1 |P| P hält 2
∑
Können wir Ω systematisch berechnen? Fest steht zunächst nur, dass wir aus der Definition der Chaitin’schen Konstanten keine direkte Berechnungsvorschrift ableiten können; soeben haben wir ja gezeigt, dass alle Ωn ab einem bestimmten Grenzwert unberechenbar sein müssen. Wir wollen daher versuchen, Ω auf anderem Wege zu erreichen, und schicken die folgende Definition voraus: Definition 6.7 (Haltewahrscheinlichkeit Ωkn ) Sei s eine Binärsequenz, die aus allen 2n Binärsequenzen der Länge n zufällig herausgegriffen wurde. Die Haltewahrscheinlichkeit Ωkn ist die Wahrscheinlichkeit, dass s mit der Gödelnummer eines Programms beginnt, das nach maximal k Schritten terminiert. Der einzige Unterschied zwischen Ωn und Ωkn besteht darin, dass in die Berechnung von Ωkn nicht mehr alle anhaltenden Programm der Maximallänge n eingehen, sondern nur noch solche, die innerhalb von k
Ω Ωn
Ωnn
n Abbildung 6.16: Die monoton steigenden Folgen Ωn und Ωnn streben demselben Grenzwert entgegen. Sie konvergieren von unten gegen die Chaitin’sche Konstante Ω.
328
6 Algorithmische Informationstheorie
Eingabe: Ω[1…n] (Die ersten n Bits von Ω)
Schritten terminieren. Offensichtlich gelten die folgenden Zusammenhänge (Abbildung 6.16): Ωnn ≤ Ωn ≤ Ω lim Ωn n→∞ n
k := 1
Berechne Ωkk
Ωkk[1…n] = Ω[1…n]? Ja
Ja Jetzt wissen wir: Jedes terminierende Programm P mit |P| ≤ n hält nach höchstens k Schritten an. M := Menge aller Binärsequenzen der Länge ≤ n, die mit der Gödelnummer eines Programms beginnen, das innerhalb von k Schritten anhält.
Ausgabe: Ωn =
n→∞
Auch wenn die Folgen Ω1 , Ω2 , Ω3 , . . . und Ω11 , Ω22 , Ω33 , . . . dem gleichen Grenzwert zustreben, sind sie grundverschieden. Im Gegensatz zur ersten Folge sind nämlich sämtliche Elemente der zweiten Folge berechenbar. Den Wert Ωnn können wir ganz einfach bestimmen, indem wir alle Programme P mit |P| ≤ n für maximal n Schritte simulieren und mitzählen, wie viele davon terminieren. Mit größeren Werten für n kommen wir auf diese Weise immer weiter an den Wert von Ω heran. Zahlen, die sich wie hier durch eine Folge berechenbarer Zahlen beliebig nahe annähern lassen, heißen rekursiv aufzählbar.
k := k + 1
Nein
= lim Ωn = Ω
(6.3) (6.4)
Folgt daraus, dass die Chaitin’sche Konstante Ω berechenbar ist? Auf den ersten Blick scheint dies tatsächlich der Fall zu sein. Die Konvergenzeigenschaft lehrt uns, dass sich die Nachkommabits von Ωnn mit der Zeit von links nach rechts stabilisieren müssen. Dabei dürfen wir ein schwerwiegendes Problem nicht übersehen: Zu keinem Zeitpunkt lässt sich mit Sicherheit sagen, ob ein Bit seinen endgültigen Wert eingenommen hat. Selbst wenn wir uns mit Ωnn bereits so nahe an Ω herangetastet haben, dass der Übergang von Ωnn zu Ωn+1 n+1 nur noch weit rechts stehende Bits beeinflusst, können sich diese Änderungen durch die Generierung von Überträgen nach links ausbreiten und somit auch Bits an den vorderen Positionen verändern. Es könnten also durchaus rekursiv aufzählbare Zahlen existieren, die nicht berechenbar sind. Dass wir mit der Chaitin’schen Konstanten Ω eine genau solche Zahl vor uns haben, ist eine Folge aus dem nachstehenden Satz:
|M| 2n
Abbildung 6.17: In Ω sind sämtliche Haltewahrscheinlichkeiten Ωn in einer einzigen Zahl vereint. Die ersten n Bits der Chaitin’schen Konstanten (Ω[1 . . . n]) reichen aus, um die Haltewahrscheinlichkeit Ωn zu rekonstruieren.
Satz 6.3 Ωn lässt sich aus den ersten n Bits von Ω rekonstruieren.
Beweis: Um aus den ersten n Bits von Ω die Haltewahrscheinlichkeit Ωn zu rekonstruieren, folgen wir dem Ablaufschema aus Abbildung 6.17: I
Wir fangen an, nacheinander die Folgenelemente Ω11 , Ω22 , Ω33 , . . . auszurechnen. Auf diese Weise nähern wir uns von unten immer weiter
329
6.2 Die Chaitin’sche Konstante
an Ω an und irgendwann werden Ωkk und Ω in den ersten n Bits übereinstimmen. Sobald dies passiert, notieren wir den Wert von k und bezeichnen ihn als k0 . I
Angenommen, wir erhöhen k über k0 hinaus. Können sich die ersten n Bits von Ωkk dann noch ändern? Die Antwort ist Nein! Würde auch nur eines der ersten n Bits einen anderen Wert annehmen, so wäre Ωkk > Ω, im Widerspruch zu (6.3). Da jedes Programm P mit dem 1 in die Haltewahrscheinlichkeit Ωkk eingeht und sich die Gewicht 2|P| ersten n Bits nicht mehr ändern können, muss jedes Programm P, das erst nach mehr als k0 Schritten anhält, eine Länge größer n haben.
I
Wir wissen jetzt, dass kein Programm P mit |P| ≤ n existieren kann, das nach mehr als k0 Schritten terminiert. Damit ist klar, wie wir die Haltewahrscheinlichkeit Ωn ermitteln können. Es ist ausreichend, alle Programme P mit |P| ≤ n für k0 Schritte zu simulieren. Terminiert ein Programm, so geht es mit dem Gewicht 21|P| in die Haltewahrscheinlichkeit Ωkk ein. Hat es nach k0 Schritten noch nicht angehalten, so wissen wir, dass es niemals anhalten wird.
Die Bedeutung von Satz 6.3 ist weit größer, als es der erste Blick vermuten lässt. Indem die Chaitin’sche Konstante das Wissen über sämtliche Haltewahrscheinlichkeiten in sich vereint, enthält sie die Antwort auf eine unermessliche Fülle mathematischer Fragestellungen. Unter anderem enthält Ω das Wissen, um das Halteproblem für beliebige Programme zu entscheiden, und muss daher unberechenbar sein. Damit macht Satz 6.3 unmissverständlich klar, dass der größte Teil dieser spektakulären Bitfolge unserem Auge für immer verborgen sein wird. Gleichsam weist Satz 6.3 den Weg, wie sich die zu Beginn dieses Abschnitts eingeführte Haltesequenz H komprimieren lässt. Da wir die ersten 2n Bits von H aus der Haltewahrscheinlichkeit Ωn zurückgewinnen können und sich Ωn aus den ersten n Bits von Ω rekonstruieren lässt, kann jedes Anfangsstück von H mit einem Programm erzeugt werden, dessen Länge nur logarithmisch wächst. Damit ist H keine Zufallszahl, und die einzelnen Bits sind nicht unabhängig voneinander. Die Chaitin’sche Konstante Ω ist ein wahrhaft wundersames Objekt der Mathematik. Selten wurde ihr Wesen treffender beschrieben als in einem Artikel von Charles Bennett und Martin Gardner aus dem Jahr 1979. Ein mittlerweile berühmtes Zitat aus diesem Artikel wollen wir an dieser Stelle keinesfalls übergehen: „Throughout history mystics and philosophers have sought a compact key to universal wisdom, a finite formula or text which,
Der Beweis zu Satz 6.3 enthält ein konstruktives Verfahren, mit dem die Haltewahrscheinlichkeit Ωn aus den ersten n Bits von Ω extrahiert werden kann. Wären wir in der Lage, diesen Algorithmus auch praktisch einzusetzen? Die Antwort ist Nein! Um den Grund hierfür zu verstehen, erinnern wir uns an das Kernelement des Algorithmus: die Berechnung der Sequenz Ω11 , Ω22 , Ω33 , Ω44 , . . . Wir müssen so lange neue Folgenelemente ausrechnen, bis die ersten n Bits von Ωkk mit den ersten n Bits von Ω übereinstimmen. Für welche Werte von k wird dies ungefähr der Fall sein? Den Zeitpunkt, an dem die ersten n Bits von Ωkk mit den ersten n Bits von Ω übereinstimmen, bezeichnen wir mit f (n): f (n) := min{k | Ωkk [1 . . . n] = Ω[1 . . . n]} Es lässt sich leicht zeigen, dass die Funktion f schneller gegen Unendlich streben muss als jede berechenbare Funktion. Wäre dies nicht der Fall, so könnten wir f (n) durch eine berechenbare Funktion g(n) nach oben abschätzen. Dann wären die g(n) ersten n Bits von Ωg(n) mit Sicherheit mit den ersten n Bits von Ω identisch, und wir hätten einen Weg gefunden, um jedes beliebige Bit der Chaitin’schen Konstanten zu berechnen. Aus der Unberechenbarkeit von Ω folgt damit unmittelbar, dass die Funktion g(n) und damit auch der Aufwand, die Haltewahrscheinlichkeiten Ωn aus Ω zu extrahieren, stärker wachsen muss als jede berechenbare Funktion. In der Chaitin’schen Konstanten steckt mehr Wissen, als wir uns träumen lassen, und gleichzeitig ist die Information darin optimal verschlüsselt. Ω entpuppt sich als der perfekte Gralshüter, der sein vollständiges Wissen niemals preisgeben wird. Ein deprimierendes Ergebnis.
330
Ω
0,00000010... 00000100... 00011000... 10000110... 10001111... 11001011... 10111010... 00010000... Abbildung 6.18: Die ersten 64 Nachkommabits von Ω
6 Algorithmische Informationstheorie
when known and understood, would provide the answer to every question. The use of the Bible, the Koran and the I Ching for divination and the tradition of the secret books of Hermes Trismegistus, and the medieval Jewish Cabala exemplify this belief or hope. Such sources of universal wisdom are traditionally protected from casual use by being hard to find, hard to understand when found, and dangerous to use, tending to answer more questions and deeper ones than the searcher wishes to ask. The esoteric book is, like God, simple yet undescribable. It is omniscient, and transforms all who know it. Omega is in many senses a cabalistic number. It can be known of, but not known, through human reason. To know it in detail, one would have to accept its uncomputable digit sequence on faith, like words of a sacred text.“
Charles Bennett, Martin Gardner [59]
Behalten Sie stets im Gedächtnis, dass die Bitfolge von Ω sowohl von der Wahl der Programmiersprache als auch von der vereinbarten Gödelisierung abhängt. Ändern wir diese, so ändern sich auch die Nachkommabits von Ω. Die herausgearbeiteten Eigenschaften bleiben davon unberührt. So ist Ω z. B. immer eine rekursiv aufzählbare Zufallszahl, unabhängig von der jeweils gewählten Programmiersprache. Im Jahr 2001 gelang Antonín Kuˇcera und Theodore Slaman der erstaunliche Beweis, dass auch die Umkehrung gilt [108]: Für jede rekursiv aufzählbare Zufallszahl x aus dem offenen Intervall von 0 bis 1 können wir eine Programmiersprache und eine Codierung finden mit x = Ω. Die Haltewahrscheinlichkeiten sind damit alles andere als einsame Skurrilitäten im grenzenlosen Raum der reellen Zahlen. Ganz im Gegenteil: Sie sind überall!
Die Unberechenbarkeit der Chaitin’schen Konstanten macht unmissverständlich klar, dass diese niemals als Ganzes erfasst werden kann. Dennoch bestand seit der Entdeckung von Ω die Hoffnung, zumindest über das Anfangsstück dieser anmutigen Ziffernfolge etwas zu erfahren. Tatsächlich ging dieser Wunsch 2002 zu einem guten Stück in Erfüllung. In diesem Jahr gelang es Cristian Calude, Michael Dinneen und Chi-Kou Shu, die ersten 64 Ziffern von Ω auszurechnen. Um die Bitwerte zu bestimmen, betrachteten die drei Forscher zunächst alle Binärsequenzen mit einer Länge von 84 Bits. Im ersten Schritt sortierten sie diejenigen aus, die keine Gödelnummer eines Programms repräsentieren. Danach galt es, den restlichen Datenbestand durch die Identifikation funktional identischer Programme zu reduzieren. Für die verbleibenden Programme wurde nun individuell untersucht, ob sie anhalten oder nicht, und auf diese Weise wurde das Wissen, das in den ersten Bits von Ω codiert ist, Stück für Stück zusammengetragen. Nachdem die terminierenden Programme identifiziert waren, musste noch der Beweis erbracht werden, dass die ermittelte Bitfolge stabil ist. Die entscheidende Entdeckung war, dass jedes terminierende Programm mit einer Länge größer als 84 Bits mit einer speziellen Bitsequenz beginnen muss, woraus Calude, Dinneen und Shu schließlich folgern konnten, dass mindestens 64 der 84 berechneten Bits stabil sein müssen. Abbildung 6.18 präsentiert das Ergebnis. Auf den ersten Blick wirkt die Abfolge der Nullen und Einsen rein zufällig. Handelt es sich bei der Chaitin’schen Konstanten Ω vielleicht um eine echte Zufallszahl im Sinne von Definition 6.3? Die Antwort ist Ja! Den Grund hierfür wird uns das Ablaufdiagramm aus Abbildung 6.19 offenbaren. Zu Beginn bestimmt das beschriebene Programm – wir nennen es P – mithilfe der ersten n Bits von Ω alle terminierenden Program-
331
6.2 Die Chaitin’sche Konstante
me der Maximallänge n und merkt sich deren Ausgabe. Anschließend wird die Variable i mit dem Wert 1 initialisiert und in einer Schleife schrittweise erhöht. In jeder Iteration wird die Variable s mit dem i-ten Binärmuster beschrieben und mit den vorher ermittelten Ausgaben verglichen. Genau dann, wenn s nicht die Ausgabe von einem der vorher simulierten Programme ist, gibt P den Inhalt von s aus und hält an.
Ist Ω eine zufällige Bitfolge?
Wie groß ist die algorithmische Komplexität des ausgegebenen Bitmusters s? Ganz offensichtlich kann κ(s) nicht größer als |P| sein, denn s wird von P ausgegeben. Auf der anderen Seite wird s von keinem Programm mit einer Länge ≤ n ausgegeben, und deshalb muss κ(s) größer sein als n. Wir halten fest: n < κ(s) ≤ |P|
Eingabe: − Ermittle mithilfe der ersten n Bits von Ω alle terminierenden Programme der Maximallänge n, simuliere sie und fasse ihre Ausgaben in der Menge M zusammen.
(6.5)
Über |P| können wir ebenfalls eine Aussage treffen. Um den Algorithmus in der skizzierten Form umzusetzen, benötigen wir eine konstante Anzahl von Bits für die Implementierung der Programmlogik. Zusätzlich brauchen wir Platz, um die ersten n Bits von Ω zu speichern, also mindestens κ(Ω[1 . . . n]) Bits. Damit können wir die Programmlänge von P folgendermaßen quantifizieren:
i := 1
|P| = c + κ(Ω[1 . . . n]) Jetzt können wir (6.5) ganz einfach in n < κ(x) ≤ c + κ(Ω[1 . . . n])
i := i + 1
umschreiben. Lösen wir die Ungleichung nach κ(Ω[1 . . . n]) auf, so erhalten wir die Beziehung κ(Ω[1 . . . n]) > n − c Jetzt haben wir das Ergebnis schwarz auf weiß: Die algorithmische Komplexität eines beliebigen Anfangsstücks Ω[1 . . . n] ist höchstens eine konstante Anzahl von Bits kleiner als n. Aber genau dies ist das charakteristische Merkmal, mit dem wir in Definition 6.3 den Begriff der Zufallszahl eingeführt haben. Damit gilt: Satz 6.4
s := die i-te Binärsequenz
Ja
s ∈ M? Nein Ausgabe: s
Die Bitfolge der Chaitin’schen Konstanten Ω ist zufällig. Aus Satz 6.4 folgt unmittelbar, dass die Chaitin’sche Konstante das Wissen über sämtliche Haltewahrscheinlichkeiten Ωn in extrem verdichteter Form in sich vereint. Die Information ist darin so perfekt codiert, dass keine weitere Kompression mehr möglich ist. Auch in dieser Hinsicht ist Ω ein wahrhaft wundersames Objekt der Mathematik!
Abbildung 6.19: Die Analyse dieses Programms offenbart, dass die Bitfolge der Chaitin’schen Konstanten keinerlei Gesetzmäßigkeit folgen kann: Ω ist eine Zufallszahl.
332
6 Algorithmische Informationstheorie
Kalkül K ⎫ ⎪ 0=0 ⎬ σ =σ ⎪ ⎭ f(σ ) = f(σ )
0=0 f(0) = f(0) f(f(0)) = f(f(0)) ...
Programm PK Abbildung 6.20: Wir setzen einen Kalkül K mit dem kleinstmöglichen Programm PK in Beziehung, das die Theoreme von K aufzählt und der Reihe nach ausgibt.
Kalkül K
Programm PK
6.3
Unvollständigkeit formaler Systeme
In diesem Abschnitt werden wir unsere Erkenntnisse aus dem Gebiet der algorithmischen Informationstheorie auf die Beweistheorie übertragen und mit dem Chaitin’schen Unvollständigkeitssatz ein Resultat im Gödel’schen Sinne erzielen. Dieser Satz wird ein helles Licht auf die Gründe werfen, warum es in jedem hinreichend ausdrucksstarken formalen System wahre Sätze geben muss, die sich der formalen Beweisbarkeit entziehen. Der Brückenschlag zwischen der algorithmischen Informationstheorie und der Beweistheorie gelingt auf erstaunlich einfache Weise, wenn wir einen Kalkül K mit dem kleinstmöglichen Programm PK in Beziehung setzen, das seine Theoreme aufzählt und nacheinander ausgibt (Abbildungen 6.20 und 6.21). Dass ein solches Programm für jeden Kalkül existieren muss, ist ein Ergebnis, das wir in Abschnitt 2.2 erzielt haben. Dort haben wir herausgearbeitet, dass sich die Theoreme eines Kalküls K sogar dann aufzählen lassen, wenn K nicht endlich axiomatisierbar ist. Auf diese Weise konnten wir zeigen, dass für jeden widerspruchsfreien und negationsvollständigen Kalkül ein Entscheidungsverfahren existiert. Wir wollen nun versuchen, die Programmlänge |PK | grob abzuschätzen. Zunächst halten wir fest, dass PK die Axiome und Schlussregeln von K enthalten muss. Die Anzahl der Bits, die wir hierfür benötigen, bezeichnen wir mit |K|. Hinzu kommt eine konstante Anzahl an Bits, die wir für die Implementierung der Aufzählroutine benötigen. Damit können wir die Länge von PK wie folgt beziffern: |PK | = |K| + c Den genauen Wert der Konstanten c kennen wir nicht, er spielt für unsere Überlegung aber auch keine Rolle.
Axiome Schlussregeln
Startwerte Programm
Theoreme
Ausgabe
Ableitung
Berechnung
Abbildung 6.21: Zusammenhang zwischen formalen Systemen (links) und Programmen (rechts)
Wenn wir im Folgenden von einem formalen System der Länge n oder einfach nur von einem n-Bit-System sprechen, so meinen wir damit, dass der betrachtete Kalkül K die Beziehung |PK | = n erfüllt. Mit anderen Worten: Es existiert ein Programm der Länge n, das die Theoreme von K der Reihe nach aufzählt. Nehmen wir an, K sei ein Kalkül, der hinreichend ausdrucksstark ist, um Formeln ϕn (s) mit der folgenden Bedeutung zu formalisieren: „Die algorithmische Komplexität von s ist größer als n.“
(6.6)
Für einen festen Wert von n wollen wir uns die Frage stellen, ob sich eine Formel ϕn (s) innerhalb von K beweisen lässt. Hierzu könnten wir
333
6.3 Unvollständigkeit formaler Systeme
das Programm PK starten und die ausgegebenen Theoreme beobachten. Mit etwas Glück tauchte eine der Formeln ϕn (s) irgendwann unter den ausgegebenen Theoremen auf und wir wüssten dann, dass sie innerhalb von K bewiesen werden kann. Für kleine Werte von n könnte dies tatsächlich so ablaufen.
Ist eine Formel mit der Aussage κ(s) > n in K beweisbar?
Wir werden das Programm PK jetzt zu einem Programm PK modifizieren, das nicht mehr alle gefundenen Theoreme ausgibt, sondern still nach dem Beweis für eine der Formeln ϕn (s) sucht (Abbildung 6.22). Wird ein solcher Beweis gefunden, so extrahiert PK die Binärsequenz s, gibt sie aus und hält an. Wird kein passender Beweis gefunden, läuft PK für immer weiter, ohne jemals eine Ausgabe zu produzieren.
Eingabe: −
Generiere ein Theorem von K
Für dieses Programm können wir dieselbe Größenüberlegung anstellen wie vorhin. Es ist
Das aktuell generierte Theorem sei T. Die Aufzählung soll so erfolgen, dass jedes Theorem von K irgendwann auftaucht.
|PK | = |K| + )log2 n* + c für eine Konstante c ∈ N. Wenn wir den Wert von n sehr groß wählen, dann gilt mit Sicherheit irgendwann die Beziehung |PK | < n Wie wird sich das Programm PK für solche Werte von n verhalten? Per Konstruktion wird es genau dann eine Zeichenkette s ausgeben, wenn mindestens eine der Formeln ϕn (s) innerhalb von K beweisbar ist. Inhaltlich besagt ϕn (s), dass die algorithmische Komplexität der Binärsequenz s größer ist als die Konstante n. Aber genau dies ist unmöglich, da wir s soeben mit einem Programm ausgegeben haben, das kürzer ist als n. Hieraus folgt, dass PK ab einem gewissen Wert von n keine Ausgabe mehr produzieren kann, falls der Kalkül K korrekt ist. Das heißt, dass in einem korrekten formalen System alle Aussagen der Form (6.6) ab einem gewissen Wert von n unbeweisbar sein müssen. Genau dies ist die Aussage des Chaitin’schen Unvollständigkeitssatzes: Satz 6.5 (Chaitin’scher Unvollständigkeitssatz) In einem korrekten formalen System sind alle Aussagen der Form κ(s) > n unbeweisbar, sobald n einen gewissen Wert übersteigt. Offensichtlich ist für jeden Wert n die Aussage κ(s) > n für gewisse Binärsequenzen s wahr. Damit folgt aus Satz 6.5, dass in jedem korrekten formalen System, das hinreichend ausdrucksstark ist, um Sätze der Form (6.6) zu formalisieren, wahre, aber unbeweisbare Sätze existieren.
Nein
T = φn (s)? Ja Extrahiere die Binärsequenz s
Ausgabe: s Abbildung 6.22: Das hier dargestellte Programm sucht nach einem Theorem mit der inhaltlichen Aussage κ(s) > n. Ist die Suche erfolgreich, so wird die Binärsequenz s ausgegeben, und das Programm angehalten. Ist der simulierte Kalkül K korrekt, so kann das Programm für große Werte von n keine Ausgabe mehr produzieren. Würde es dies dennoch tun, so wäre κ(s) < n. Gleichzeitig würde K ein Theorem mit der inhaltlichen Aussage κ(s) > n beweisen.
334
6 Algorithmische Informationstheorie
Aus der Unberechenbarkeit von Ω folgt noch ein weiteres Unvollständigkeitsresultat. Da sich nicht alle Bits von Ω systematisch ermitteln lassen, können die Aussagen der Form „Das i-te Bit von Ω ist 0“ oder
(6.8)
„Das i-te Bit von Ω ist 1“
(6.9)
in einem korrekten formalen System nicht für alle i ∈ N beweisbar sein. Gregory Chaitin gelang es, einen verblüffenden Zusammenhang zwischen Aussagen dieser Art und den Axiomen und Schlussregeln eines formalen Systems herzustellen. Er konnte zeigen, dass ein formales System K, dessen Theoreme sich mit einem Programm PK aufzählen und der Reihe nach ausgeben lassen, höchstens |PK | + 15328 Aussagen der Form (6.8) oder (6.9) beweisen kann [23]. Ein faszinierendes Ergebnis!
Wie ausdrucksstark muss ein formales System sein, um in den Sog des Chaitin’schen Unvollständigkeitssatzes zu geraten? Um diese Frage zu beantworten, bringen wir die umgangssprachliche Formulierung (6.6) zunächst in eine etwas formalere Form. (6.6) ist äquivalent zu der Behauptung, dass kein Programm P mit |P| ≤ n existiert, das s ausgibt. Eine entsprechende Formel hätte demnach die folgende Gestalt: ϕn (s) = ¬∃ x (program(x) ∧ |x| ≤ n ∧ output(x) = s)
(6.7)
Der Teilausdruck |x| ≤ n ist eine arithmetische Aussage, und die Teilformeln program(x) und output(x) drücken zusammen aus, dass x die Gödelnummer eines Programms ist, das die Ausgabe s produziert. In Abschnitt 5.4.2 haben wir am Beispiel der Turing-Maschine detailliert gezeigt, dass sich Aussagen dieser Art arithmetisieren lassen. Auch wenn hier noch viele technische Detailfragen zu klären sind, ist das Ergebnis längst sichtbar: Bereits so einfache Systeme wie die PeanoArithmetik sind stark genug, um Aussagen der Form (6.7) zu formalisieren. Damit erfüllt jedes formale System, das die nötigen Ausdrucksmittel enthält, um über die additiven und die multiplikativen Eigenschaften der natürlichen Zahlen zu sprechen, die Voraussetzungen des Chaitin’schen Unvollständigkeitssatzes, und wir können aus Satz 6.5 den folgenden Schluss ziehen: Korollar 6.1 Jedes korrekte formale System, das stark genug ist, um die PeanoArithmetik zu formalisieren, ist unvollständig.
Dies ist exakt die Formulierung der semantischen Variante des ersten Gödel’schen Unvollständigkeitssatzes aus Abschnitt 4.1. Anders als dort ist es uns in diesem Abschnitt jedoch gelungen, den Unvollständigkeitssatz auf verblüffend einfache Weise herzuleiten. Hierzu mussten wir lediglich auf einige elementare Eigenschaften der algorithmischen Komplexität zurückgreifen und einen geeigneten Zusammenhang zwischen formalen Systemen und Programmen herstellen. Die Überlegung zeigt, warum die algorithmische Informationstheorie heute einen so wichtigen Platz innerhalb der mathematischen Logik besetzt. Sie hat einen Weg aufgezeigt, auf dem wir die Aussage des ersten Gödel’schen Unvollständigkeitssatzes im Eiltempo erreichen können.
335
6.4 Übungsaufgaben
6.4
Übungsaufgaben
Mit ri bezeichnen wir die i-te Ziffer einer zufälligen Binärsequenz. In welchen der nachfolgend aufgelisteten Fälle ist die Sequenz s1 , s2 , s3 , . . . zufällig?
1 ri
a) si =
ri 1 ri e) si = 1 c) si =
falls i < 10 sonst falls i < 10 sonst falls i gerade sonst
rri ri ri d) si = 1 ri f) si = 1 b) si =
falls i gerade sonst falls i eine Primzahl ist sonst falls i eine Quadratzahl ist sonst
Benennen Sie, falls möglich, ein Beispiel für eine endlich lange Binärsequenz, die I
berechenbar und komprimierbar ist:
I
berechenbar, aber nicht komprimierbar ist:
I
unberechenbar, aber komprimierbar ist:
I
unberechenbar und nicht komprimierbar ist:
Benennen Sie, falls möglich, ein Beispiel für eine unendlich lange Binärsequenz, die I
berechenbar und komprimierbar ist:
I
berechenbar, aber nicht komprimierbar ist:
I
unberechenbar, aber komprimierbar ist:
I
unberechenbar und nicht komprimierbar ist:
Aufgabe 6.1 Webcode 6988
Aufgabe 6.2 Webcode 6125
336
Aufgabe 6.3 Webcode 6879
6 Algorithmische Informationstheorie
In dieser Aufgabe wollen wir die inhaltliche Aussage von Satz 6.2 auf die Probe stellen. Der Satz besagt, dass kein systematisches Verfahren existieren kann, das stets korrekt entscheidet, ob eine vorgelegte Binärsequenz s zufällig ist oder nicht. Das nachstehende Programm scheint aber genau dies zu leisten: Eingabe: Binärsequenz s
Wähle Q ∈ M M := M \ { Q }
M := Menge aller Programme, die signifikant kürzer sind als s
Output(Q) = s?
Nein
Nein
Ja Ausgabe: „ s ist nicht zufällig
M = ∅? Ja Ausgabe: „ s ist zufällig
Der Algorithmus basiert auf der folgenden Überlegung: Es existieren nur endlich viele Programme, die kürzer sind als die vorgelegte Binärsequenz s. Wäre diese Sequenz nicht zufällig, so muss sie von einem dieser Programme ausgegeben werden. Wir müssen also lediglich über die (endlich vielen) Programme iterieren, die signifikant kürzer sind als s, und die produzierte Ausgabe mit s vergleichen. Stimmen beide überein, so ist s keine Zufallssequenz. Wird s von keinem dieser Programme ausgegeben, dann liegt eine zufällige Sequenz vor. Offensichtlich steht das Ergebnis im Widerspruch zu Satz 6.2. Wo steckt der Fehler?
Aufgabe 6.4 Webcode 6788
In Kapitel 1 haben wir die Vermutung über die Existenz unendlich vieler Primzahlzwillinge diskutiert. In Worten las sie sich wie folgt: „Es existieren unendlich viele Zahlen n mit der Eigenschaft, dass n und n + 2 Primzahlen sind.“ Ließe sich die Vermutung beweisen, wenn wir die Haltewahrscheinlichkeit Ωn für beliebige Werte von n kennen würden?
Aufgabe 6.5 Webcode 6286
In Abschnitt 6.2 haben wir herausgearbeitet, dass die Bitfolge der Chaitin’schen Konstanten zufällig ist. Ob an einer bestimmten Bitposition von Ω eine 0 oder eine 1 vorkommt, ist damit völlig unabhängig von den Bits an anderen Positionen. Können wir trotzdem eine Aussage darüber treffen, wie viele Einsen und Nullen in einem Anfangsstück Ω[1 . . . n] für größere Werte von n enthalten sein müssen?
337
6.4 Übungsaufgaben
In den Untersuchungen zur algorithmischen Komplexität haben wir vorausgesetzt, dass die zugrunde gelegten Gödelisierungen präfixfrei sein müssen. Das bedeutet, dass die Gödelnummer eines Programms niemals mit der Gödelnummer eines anderen Programms beginnt. Diese Aufgabe soll klären, warum wir diese Voraussetzung benötigen. Betrachten Sie hierzu die folgenden beiden Entscheidungsbäume: 000
000
00
00 001
001
0
0 010
010
01
01 011
011
100
100
10
10 101
101
1
1 110
110
11
11 111
Terminierendes Programm
111 Nichtterminierendes Programm
Nicht die Gödelnummer eines Programms
I
Begründen Sie, warum die jeweils verwendeten Gödelisierungen nicht präfixfrei sind.
I
Berechnen Sie für jeden Entscheidungsbaum die Haltewahrscheinlichkeit Ω3 .
I
Wiederholen Sie die Berechnung mit der nachstehenden Formel, die wir in Abschnitt 6.2 hergeleitet haben. Was stellen Sie fest? Ωn =
∑
P hält, |P| ≤ n
1 2|P|
Aufgabe 6.6 Webcode 6799
7 Modelltheorie
„So fängt denn alle menschliche Erkenntnis mit Anschauungen an, geht von da zu Begriffen und endigt mit Ideen.“ Immanuel Kant [98]
In den vorangegangenen Kapiteln haben wir mehrfach herausgestellt, dass sich die Formeln eines Kalküls auf zwei Ebenen betrachten lassen. Die erste ist die syntaktische Ebene. Hier sind Formeln nichts weiter als Folgen von Symbolen über einem speziellen Zeichenvorrat, die sich durch die Anwendung von Schlussregeln in andere Formeln übersetzen lassen. Die zweite ist die semantische Ebene oder die Modellebene. Hier wird den Logiksymbolen eine Bedeutung zugewiesen und eine Formel hierdurch inhaltlich interpretierbar. Die Modelltheorie ist derjenige Teilbereich der mathematischen Logik, der sich mit den semantischen Eigenschaften von Formeln und Formelmengen beschäftigt. Von vorrangiger Bedeutung sind die folgenden Problemfelder: I
Modellkonstruktion Die Modellkonstruktion verfolgt das Ziel, für eine vorgelegte Formelmenge konstruktiv ein Modell zu erzeugen. Dabei ist der Nachweis der Existenz oftmals wichtiger als das Modell selbst. Der Grund dafür ist einfach: Hat eine Formelmenge ein Modell, so ist automatisch der Beweis erbracht, dass sie widerspruchsfrei ist; es ist dann nicht möglich, dass sie eine Formel ϕ zusammen mit ihrer Negation ¬ϕ enthält. Eine Anwendung in dieser Richtung ist uns bereits in Kapitel 1 begegnet, im Zusammenhang mit dem Hilbert’schen Widerspruchsfreiheitsbeweis der euklidischen Geometrie.
I
Modellanalyse Im Rahmen der Modellanalyse wird versucht, Formelmengen anhand der Anzahl und der Struktur ihrer Modelle zu klassifizieren. Typische Untersuchungen beschäftigen sich z. B. mit der Frage, ob
340
7 Modelltheorie
die Modelle einer Formelmenge allesamt einen endlichen oder einen unendlichen Individuenbereich aufweisen. Häufig wird nach Formelmengen gesucht, die kategorisch sind. Das bedeutet, dass sie ein Modell besitzen, das bis auf Isomorphie eindeutig bestimmt ist. Ein wichtiges Resultat in dieser Hinsicht ist der Isomorphiesatz von Dedekind. Dieser besagt, dass die natürlichen Zahlen bis auf Isomorphie eindeutig charakterisiert sind, wenn wir die Peano-Axiome in der Prädikatenlogik zweiter Stufe niederschreiben. I
1915
Leopold Löwenheim:
Viele Untersuchungen auf dem Gebiet der Modelltheorie sind Untersuchungen zur Axiomatisierbarkeit mathematischer Begriffe, etwa des Begriffs abzählbar. Hier geht es um die Frage, ob eine Formel gefunden werden kann, die genau unter denjenigen Interpretationen wahr ist, die einen abzählbaren Individuenbereich aufweisen. Manche Untersuchungen beschäftigen sich mit der prinzipiellen Axiomatisierbarkeit von Begriffen, d. h. mit der Frage, ob ein Begriff überhaupt innerhalb einer formalen Logik definiert werden kann. Andere versuchen zu klären, ob eine Axiomatisierung in ganz bestimmten Logiken möglich ist. Überlegungen dieser Art haben wir selbst schon angestellt. So haben wir in den Abschnitten 2.5 und 2.6 erkannt, dass weder der Begriff der Gleichheit noch der Begriff der Endlichkeit innerhalb der Prädikatenlogik erster Stufe definierbar ist.
Löwenheim beweist den Vorläufer des Satzes, den wir heute als den Satz von Löwenheim-Skolem bezeichnen. [112] 1920
Thoralf Skolem: Skolem entwickelt die Arbeit von Löwenheim weiter. Er formuliert und beweist den Satz von Löwenheim-Skolem. [166]
1929
Kurt Gödel: In seiner Dissertation formuliert und beweist Gödel sowohl den Vollständigkeitssatz als auch den Modellexistenzsatz. [62]
1930
Axiomatisierbarkeit
7.1
Meta-Resultate zur Prädikatenlogik
Getragen wird die Modelltheorie von vier Kernsätzen, die in der ersten Hälfte des zwanzigsten Jahrhunderts entdeckt wurden (Abbildung 7.1). Alle vier sind Meta-Resultate zur Prädikatenlogik erster Stufe.
Kurt Gödel: Gödel restrukturiert die Ergebnisse seiner Dissertation. Unter anderem formuliert und beweist er dabei den Kompaktheitssatz. [63]
Abbildung 7.1: Meilensteine der Modelltheorie
I
Vollständigkeitssatz Der Vollständigkeitssatz besagt, dass sich innerhalb der Prädikatenlogik erster Stufe alle allgemeingültigen PL1-Formeln aus den Axiomen ableiten lassen. Er wurde im Jahr 1929 von Kurt Gödel im Rahmen seiner Dissertation bewiesen und wird aus diesem Grund als der Gödel’sche Vollständigkeitssatz bezeichnet. Wir haben uns mit seiner inhaltlichen Aussage bereits ausgiebig in Abschnitt 2.4.2 beschäftigt und werden ihn deshalb in diesem Kapitel nur noch am Rande streifen.
7.1 Meta-Resultate zur Prädikatenlogik
341 Abbildung 7.2: Das Jahr 1915 markiert die Geburtsstunde der Modelltheorie. In diesem Jahr publizierte der deutsche Mathematiker Leopold Löwenheim den Vorläufer dessen, was wir heute als den Satz von Löwenheim-Skolem bezeichnen. Auch wenn die inhaltliche Aussage seines Satzes korrekt war, enthielt Löwenheims Beweis noch Fehler. Dem norwegischen Mathematiker Thoralf Skolem gelang es 1920, einen fehlerfreien Beweis zu liefern und die inhaltliche Aussage des Löwenheim’schen Satzes auf Formelmengen auszuweiten. Skolems Variante aus dem Jahr 1920 ist der Satz, den wir heute als den Satz von Löwenheim-Skolem bezeichnen. Später wurde dessen inhaltliche Aussage noch weiter verallgemeinert. Das Ergebnis ist der Satz von LöwenheimSkolem-Tarski, den wir in Abschnitt 7.1.3 genauer untersuchen werden.
I
Modellexistenzsatz Der Modellexistenzsatz stellt einen Zusammenhang zwischen der Widerspruchsfreiheit eines formalen Systems und der Existenz von Modellen her. Neben dem Vollständigkeitssatz ist es das zweite Kerntheorem, das die syntaktischen und die semantischen Eigenschaften eines formalen Systems in Beziehung setzt. Ausführlich behandeln werden wir den Modellexistenzsatz in Abschnitt 7.1.1.
I
Kompaktheitssatz Der Kompaktheits- oder Endlichkeitssatz ist Gegenstand von Abschnitt 7.1.2. Er besagt, dass eine unendliche Menge von Formeln der Prädikatenlogik erster Stufe genau dann erfüllbar ist, wenn jede ihrer endlichen Teilmengen erfüllbar ist. Wir werden sehen, dass wir mit dem Kompaktheitssatz ein wichtiges Instrument an die Hand bekommen, mit dem sich viele Negativresultate der Prädikatenlogik erster Stufe elegant herleiten lassen.
I
Sätze von Löwenheim-Skolem und Löwenheim-Skolem-Tarski Hat eine Formel der Prädikatenlogik erster Stufe ein unendliches Modell, so folgt aus dem Satz von Löwenheim-Skolem-Tarski, dass auch Modelle jeder anderen transfiniten Kardinalität existieren. Der Satz gibt Antworten auf wichtige Kardinalitäts- und Kategorizitätsfragen der Prädikatenlogik erster Stufe und ist zugleich der Quell
342
7 Modelltheorie
Abbildung 7.3: Drei der vier Kernsätze der Modelltheorie hat Kurt Gödel in einer Arbeit aus dem Jahr 1930 prägnant ausformuliert [63]. In seiner Publikation sind dies die Theoreme I, IX und X. Theorem I ist das Hauptergebnis seiner 1929 erschienenen Dissertation, die Vollständigkeit der Prädikatenlogik erster Stufe. Der Modellexistenzsatz ist Theorem IX, und der Kompaktheitssatz ist Theorem X. Auch wenn die Reihenfolge anderes suggeriert, hat Gödel zuerst den Kompaktheitssatz bewiesen und daraus den Modellexistenzsatz als Korollar erhalten [43]. Eine kleine Notiz am Rande: Das Wort Kompaktheit werden Sie in Gödels Arbeit an keiner Stelle finden. Der Begriff wurde erst in den Fünfzigerjahren von Alfred Tarski eingeführt.
scheinbarer Widersprüche. In Abschnitt 7.1.3 werden wir uns mit den inhaltlichen Aussagen der Löwenheim-Skolem-Sätze auseinandersetzen und danach einen Blick auf die Folgen und die vermeintlichen Paradoxien werfen, die sich aus ihnen ergeben.
Die Reihenfolge, in der wir die Kernsätze der Modelltheorie in diesem Kapitel diskutieren, entspricht nicht der Reihenfolge ihrer Entdeckung. Das historisch älteste Hauptergebnis ist der zuletzt genannte Satz, der Satz von Löwenheim-Skolem. In seiner ursprünglichen Formulierung wurde er von dem deutschen Mathematiker Leopold Löwenheim bereits im Jahr 1915 entdeckt (Abbildung 7.2) [16, 112]. Obwohl sein Beweis noch an mehreren Stellen fehlerhaft war, ist seine Arbeit von so großer Bedeutung, dass wir das Jahr 1915 mit Fug und Recht als das Geburtsjahr der Modelltheorie bezeichnen dürfen. 1920 bewies der norwegische Mathematiker Thoralf Skolem dann jenen Satz, den wir heute als den Satz von Löwenheim-Skolem bezeichnen. Skolem gelang es, die ursprüngliche Formulierung von Löwenheim zu verallgemeinern und dessen Ergebnis korrekt zu beweisen. Im Rahmen dieser Arbeit führte er auch die Skolem-Normalform ein, die heute zum Lehrstoff fast aller Logikvorlesungen gehört (z. B. [160]). In den Folgejahren ließ Skolem eine Reihe von Veröffentlichungen folgen, die zusätzliche Vereinfachungen seines Beweises enthalten [167, 168].
7.1 Meta-Resultate zur Prädikatenlogik
Die drei anderen Kernsätze wurden zum ersten Mal von Kurt Gödel ausdrücklich formuliert. In seiner Dissertation aus dem Jahr 1929 bewies Gödel den Vollständigkeitssatz und den Satz über die Modellexistenz widerspruchsfreier Formelmengen. 1930 publizierte er seine Ergebnisse dann im Monatsheft für Mathematik und Physik [63] (Abbildung 7.3). Im Vergleich zu seiner Dissertation hatte er die Beweise in seiner Arbeit aus dem Jahr 1930 erheblich umstrukturiert und um neue Theoreme ergänzt. Eine dieser Ergänzungen ist der Kompaktheitssatz, aus dem sich der Satz über die Modellexistenz als Korollar ergibt. In seiner Dissertation hatte er den Modellexistenzsatz noch direkt bewiesen. Dass wir von der historischen Reihenfolge in diesem Kapitel abweichen und den Satz von Löwenheim-Skolem erst in Abschnitt 7.1.3 präsentieren, hat einen triftigen Grund. Wir werden sehen, dass sich wichtige Teilaspekte des Satzes von Löwenheim-Skolem über den Kompaktheitssatz beweisen lassen und sich dieser elegant aus dem Modellexistenzsatz herleiten lässt. In der gewählten Reihenfolge wird klar zum Vorschein treten, wie die Sätze inhaltlich zusammenhängen. Ein Wort über die generelle Zielsetzung dieses Kapitels darf nicht fehlen. Anders als in den klassischen Lehrbüchern werden Sie hier keine ausführlichen Beweise für die angesprochenen Kernsätze vorfinden. Wenn überhaupt, so werden wir lediglich die Beweisideen grob skizzieren. Aus diesem Grund kann dieses Kapitel die klassische Literatur zur Modelltheorie nicht ersetzen – und will es auch gar nicht. Was uns in diesem Kapitel interessiert, sind keine technischen Beweise; es sind die inhaltlichen Aussagen der modelltheoretischen Kernsätze, ihre Zusammenhänge und die abermals verblüffenden Folgen für die Mathematik.
7.1.1
Modellexistenzsatz
In diesem Abschnitt werden wir zu der Feststellung gelangen, dass die syntaktische und die semantische Ebene eines formalen Systems nicht unabhängig voneinander sind. Um keine unnötigen Hürden aufzubauen, schicken wir zunächst ein paar sprachliche Vereinbarungen vorweg: Definition 7.1 (Modelle von Kalkülen) Sei K ein Kalkül und (U, I) eine Interpretation. I
Wir sagen, (U, I) ist ein Modell von K, wenn (U, I) ein Modell für jedes Theorem von K ist.
I
K heißt erfüllbar, wenn K mindestens ein Modell besitzt.
343
Sind drei der vier Kerntheoreme – gemeint sind die Sätze über die Vollständigkeit, die Kompaktheit und die Modellexistenz – das alleinige Werk von Kurt Gödel? Weder ein klares Ja noch ein klares Nein würden der historischen Entwicklung gerecht werden. Tatsächlich war Gödel der erste, der die drei Kernsätze in präziser Form ausformulierte. Die Argumentationslinie, die er in seinen Beweisen verwendete, war aber keinesfalls neu; sie findet sich fast vollständig in einer Arbeit von Skolem aus dem Jahr 1923 wieder [167]. Dort hatte der Norweger sowohl den Vollständigkeitssatz als auch den Modellexistenzsatz bewiesen, ohne sich dessen vollständig bewusst zu sein. Anders als Gödel unterschied Skolem in seinen Untersuchungen weniger rigide zwischen der syntaktischen und der semantischen Ebene, und genau hierin sehen einige Historiker die Ursache, warum Skolem die Tragweite seiner Ergebnisse schlicht nicht sah [43]. Rückblickend können wir sagen, dass der Weg durch Skolem geebnet wurde; doch es war Gödel, der ihn als erster bis zum Ende ging. Dies ist der Grund, warum der Modellexistenzsatz in der Literatur manchmal, und durchaus treffend, als das Skolem-Gödel-Theorem bezeichnet wird.
344
Ganz offensichtlich sind die natürlichen Zahlen, zusammen mit der gewöhnlichen Addition und Multiplikation, ein Modell für die Peano-Arithmetik. Nun hat die hier geführte Diskussion gezeigt, dass wir aus der Existenz eines Modells sofort auf die Widerspruchsfreiheit des zugrunde liegenden formalen Systems schließen können. Warum also hat Hilbert so lange nach einem Widerspruchsfreiheitsbeweis für die Arithmetik gesucht? Verantwortlich hierfür ist die Tatsache, dass wir die Widerspruchsfreiheit von PA mit einem semantischen Argument begründet haben und nicht mit einem formalen Beweis. Dass die PA-Axiome unter ihrer Standardinterpretation wahr sind, erschließt sich uns aus intuitiven Gründen. Jeder von uns hat von Kindesbeinen an gelernt, mit den natürlichen Zahlen zu rechnen. Würden wir aber tatsächlich versuchen, unsere intuitiven Argumente zu formalisieren, so müssten wir, bewusst oder unbewusst, auf Wissen und Schlussweisen der Mengenlehre zurückgreifen. Wir hätten die Widerspruchsfreiheit dann in einem System bewiesen, das PA als Teilmenge enthält, und damit wäre nichts gewonnen. Niemand, der ernsthaft die Widerspruchsfreiheit von PA in Frage stellt, würde einem Beweis vertrauen, der in ZF und damit in einem potenziell unsichereren System geführt ist.
7 Modelltheorie
Wir nehmen an, die Interpretation (U, I) sei ein Modell eines Kalküls K. Dann wissen wir, dass K widerspruchsfrei sein muss. Wäre nämlich für eine Formel ϕ sowohl die Formel selbst als auch ihre Negation ¬ϕ beweisbar, so erhielten wir einen unmittelbaren Widerspruch zur Definition der Modellrelation. Hierfür genügt es, uns die folgende Zeile aus Definition 2.16 in Erinnerung zu rufen: (U, I) |= (¬ϕ) ⇔ (U, I) |= ϕ
(7.1)
Nun wollen wir uns die umgekehrte Frage stellen und annehmen, K sei eine Theorie erster Stufe, d. h. ein formales System, das eine Reihe von Theorieaxiomen vorhält und über den logischen Schlussapparat der PL1 verfügt. Können wir aus der Widerspruchsfreiheit von K folgern, dass diese Theorie ein Modell besitzt? Die Antwort lautet Ja! Satz 7.1 (Modellexistenz, Gödel 1930) Sei K eine Theorie erster Ordnung. Dann gilt: I
K hat ein Modell ⇔ K ist widerspruchsfrei
Oder, was dasselbe ist: I
K ist erfüllbar ⇔ K ist widerspruchsfrei
Die Bedeutung des Modellexistenzsatzes ist weit größer, als es sein unscheinbarer Wortlaut vermuten lässt. Zum einen ist er ein wertvolles technisches Hilfsmittel, auf das in vielen Beweisen gern zurückgegriffen wird. Zum anderen hat er eine tiefgreifende philosophische Bedeutung. Zu Beginn des zwanzigsten Jahrhunderts vertraten viele Gegner der Formalisten die Meinung, dass die syntaktische Widerspruchsfreiheit einer Theorie nicht ausreicht, um sie als bedeutungstragend zu qualifizieren [132]. Der Modellexistenzsatz besagt aber genau das: Es ist möglich, jeder Theorie erster Stufe, in der niemals gleichzeitig eine Formel ϕ und ihre Negation ¬ϕ hergeleitet werden können, eine inhaltlich konsistente Bedeutung zu verleihen. Weiter oben haben wir erwähnt, dass der Modellexistenzsatz, zu Ehren seiner Entdecker, gern als das Skolem-Gödel-Theorem bezeichnet wird. Einen anderen Namen hat der US-amerikanische Mathematiker Abraham Robinson in einer Publikation aus den Jahr 1951 geprägt [149]. Dort nennt er ihn den erweiterten Vollständigkeitssatz. Gemeint ist tatsächlich der Gödel’sche Vollständigkeitssatz der Prädikatenlogik erster Stufe, ein Theorem, dessen inhaltliche Aussage eine völlig andere zu
345
7.1 Meta-Resultate zur Prädikatenlogik
sein scheint. Tatsächlich hängen beide Sätze viel enger zusammen, als es der erste Blick erwarten lässt. Sehen wir also genauer hin! Wir nehmen an, ϕ sei eine allgemeingültige Formel erster Stufe, die sich nicht aus den Axiomen herleiten lässt. Fügen wir der PL1 die Formel ¬ϕ als zusätzliches Axiom hinzu, so erhalten wir eine neue Theorie, die wir PL1¬ϕ nennen (Abbildung 7.4). Da ϕ per Annahme nicht innerhalb der PL1 bewiesen werden kann, ist PL1¬ϕ widerspruchsfrei. Nach Satz 7.1 hat PL1¬ϕ ein Modell, d. h., es existiert eine Interpretation (U , I ), in der sämtliche Theoreme von PL1¬ϕ wahre Aussagen sind. Insbesondere ist auch ¬ϕ in (U , I ) wahr. Auf der anderen Seite ist ϕ allgemeingültig. Das bedeutet, dass ϕ in allen möglichen Interpretationen wahr ist und damit insbesondere in (U , I ). Somit würde gleichzeitig (U , I ) |= ¬ϕ und (U , I ) |= ϕ gelten, im Widerspruch zu Formel (7.1). Damit müssen wir die Annahme, ϕ sei innerhalb der Prädikatenlogik erster Stufe unbeweisbar, wohl oder übel fallen lassen und erhalten den Gödel’schen Vollständigkeitssatz tatsächlich als Korollar zu Satz 7.1: Korollar 7.1 (Gödel’scher Vollständigkeitssatz, 1929) Die Prädikatenlogik erster Stufe ist vollständig. Jede allgemeingültige PL1-Formel lässt sich aus den Axiomen herleiten.
Gilt der Modellexistenzsatz auch für Theorien höherer Stufe? Die Antwort ist negativ: Die Modellexistenz ist eine exklusive Eigenschaft von Theorien erster Stufe. Der Grund hierfür ist leicht einzusehen. Gäbe es zu einer Theorie höherer Stufe bereits dann ein Modell, wenn sie widerspruchsfrei ist, so könnten wir die gleiche Argumentationskette wie eben anwenden und damit ihre Vollständigkeit beweisen. Wir wissen aber schon, dass bereits die Prädikatenlogik zweiter Stufe unvollständig ist; es bleiben dort immer allgemeingültige Formeln übrig, die nicht aus den Axiomen abgeleitet werden können. Dass der Modellexistenzsatz dort nicht gelten kann, ist also eine unmittelbare Konsequenz aus der Unvollständigkeit der Prädikatenlogiken höherer Stufe.
7.1.2
Kompaktheitssatz
M sei eine höchstens abzählbare Menge prädikatenlogischer Formeln erster Stufe. Wir nehmen an, M sei erfüllbar, d. h., es existiert eine Interpretation (U, I), unter der alle Formeln aus M wahre Aussagen sind.
Annahme: Es gibt eine allgemeingültige Formel φ, die nicht aus den Axiomen der PL1 abgeleitet werden kann.
PA + ¬ϕ ist widerspruchsfrei
(U, I) |= ϕ für alle (U, I)
Modellexistenzsatz
(U , I ) |= ¬ϕ für ein (U , I )
(U , I ) |= ϕ für dieses (U , I )
Widerspruch Abbildung 7.4: Der Gödel’sche Vollständigkeitssatz ist eine direkte Folge aus dem Modellexistenzsatz der Prädikatenlogik erster Stufe.
346
7 Modelltheorie
M ist erfüllbar (M hat ein Modell)
M
⇔ Endliche Teilmenge
Wir wollen nun versuchen, einen Zusammenhang zwischen der Menge M und ihren endlichen Teilmengen herzustellen. Ein offensichtliches Ergebnis ist dieses hier: Ist (U, I) ein Modell von M, so ist (U, I) auch ein Modell für jede endliche Teilmenge. Ungleich interessanter ist die umgekehrte Frage: Können wir aus dem Wissen, dass für jede endliche Teilmenge von M ein Modell existiert, darauf schließen, dass auch M ein Modell besitzt? Die Antwort liefert der Kompaktheitssatz (compactness theorem) der Prädikatenlogik erster Stufe (Abbildung 7.5):
Endliche Teilmenge
Satz 7.2 (Kompaktheitssatz, Gödel 1930) Sei M eine höchstens abzählbare Menge von PL1-Formeln. Es gilt:
M
I
Endliche Teilmenge
Oder, was dasselbe ist:
Jede endliche Teilmenge von M ist erfüllbar (Jede endliche Teilmenge von M hat ein Modell) Abbildung 7.5: Der Kompaktheitssatz besagt, dass eine höchstens abzählbare Menge von PL1-Formeln genau dann erfüllbar ist, wenn alle endlichen Teilmengen erfüllbar sind.
M hat ein Modell ⇔ Jede endliche Teilmenge von M hat ein Modell
I
M ist erfüllbar ⇔ Jede endliche Teilmenge von M ist erfüllbar
Der Kompaktheitssatz wird auch als Endlichkeitssatz bezeichnet.
Beweis: Die Richtung von links nach rechts ist trivial. Um die Richtung von rechts nach links zu zeigen, nehmen wir an, es gäbe tatsächlich eine unerfüllbare Menge M von PL1-Formeln, deren endliche Teilmengen allesamt erfüllbar sind. Da M unerfüllbar ist, gibt es für diese Menge kein Modell. Folgerichtig ist jede PL1-Formel eine logische Folgerung aus M, beispielsweise diese hier: ϕ := ∃ x (P(x) ∧ ¬P(x))
(7.2)
Für diese Formel gilt: I
ϕ ist unerfüllbar, da die Formel unter keiner Interpretation (U, I) zu einer wahren Aussage werden kann. Also hat ϕ keine Modelle.
I
ϕ lässt sich mit dem logischen Schlussapparat der PL1 aus der Menge M herleiten. Dies ist eine Konsequenz aus dem Gödel’schen Vollständigkeitssatz.
Wir wissen, dass eine Herleitung von ϕ nur endlich viele Beweisschritte umfassen kann, und deshalb können innerhalb des Beweises auch nur
347
7.1 Meta-Resultate zur Prädikatenlogik
Bereits für sich allein gesehen ist der Kompaktheitssatz ein wertvolles Ergebnis. Mit seiner Hilfe können wir den schwer zu fassenden Begriff der Unendlichkeit dieses Mal fest umgreifen. Noch spektakulärer sind aber die Schlüsse, die wir aus dem Kompaktheitssatz ziehen können. Unter anderem folgt aus ihm, dass sich der Begriff der Endlichkeit nicht innerhalb der PL1 definieren lässt. In Abschnitt 2.6.1 hatten wir dieses Ergebnis bereits vorweg genommen, aber erst jetzt sind wir in der Lage, eine solide Begründung dafür zu liefern. Gehen wir also davon aus, es gäbe es eine PL1-Formel ϕ
ψ1, ψ2, ψ3, … Jeder Beweis, der eine Formel φ aus einer unendlichen Menge M ableitet, ... Axiom Axiom Beweis für φ aus M
endlich viele Formeln aus der Menge M benutzt werden. Fassen wir alle benutzten Formeln, wie in Abbildung 7.6 gezeigt, zusammen, so erhalten wir eine endliche Teilmenge von M, aus der sich ein Widerspruch herleiten lässt. Entgegen unserer Annahme existiert also doch eine endliche Teilmenge, die kein Modell besitzt.
… ψ1 ∈ M … ψ2 ∈ M … ψn ∈ M …
Ohne Beschränkung der Allgemeinheit dürfen wir annehmen, dass die Symbole P1 , P2 , P3 , . . . nicht in ϕ
φ kann nur endlich viele Formeln aus M verwenden. Damit ist er auch ein Beweis, der φ aus einer endlichen Teilmenge von M ableitet. ψ1, ψ2, …, ψn
Kombinieren wir ϕ1 , . . . , ϕn konjunktiv miteinander, so erhalten wir mit Abbildung 7.6: Das Kernargument im Beweis des Kompaktheitssatzes
ϕ≥n := ϕ1 ∧ ϕ2 ∧ ϕ3 ∧ ϕ4 ∧ . . . ∧ ϕn eine Formel, die offensichtlich nur dann wahr sein kann, wenn der Individuenbereich mindestens n Elemente umfasst: (U, I) |= ϕ≥n ⇒ U enthält mindestens n Elemente
(7.3)
Als nächstes betrachten wir die Menge M := {ϕ
(7.4)
Jede endliche Teilmenge ist ganz offensichtlich erfüllbar. Um für sie ein Modell (U, I) zu konstruieren, suchen wir zunächst nach der Formel ϕ≥n mit dem größten Index n und nehmen anschließend n Elemente
348
7 Modelltheorie
v1 , . . . , vn in die Individuenmenge U auf. Interpretieren wir das Prädikatzeichen Pi als die Relation {vi }, so ist (U, I) ein Modell. Nach dem Kompaktheitssatz müsste dann auch M ein Modell besitzen, aber genau dies ist unmöglich. Jedes Modell von M müsste wegen ϕ
Malcevs Beitrag Eine unscheinbare, aber wertvolle Weiterentwicklung hat der Kompaktheitssatz durch den russischen Mathematiker Anatolij Ivanoviˇc Malcev erfahren. Im Jahr 1936 gelang ihm der Nachweis, dass sich die Voraussetzung, M sei eine höchstens abzählbare Menge, ersatzlos streichen lässt [77, 113, 114]. Eine verständliche Herleitung dieses Ergebnisses findet sich beispielsweise in der Dissertation von Leon Henkin aus dem Jahr 1947 [74]. Satz 7.3 (Kompaktheitssatz, Malcev 1936) Sei M eine Menge von Formeln der PL1. Dann gilt: M ist erfüllbar ⇔ Jede endliche Teilmenge von M ist erfüllbar
7.1 Meta-Resultate zur Prädikatenlogik
Der Satz von Malcev garantiert uns, dass die Kompaktheitseigenschaft selbst dann gilt, wenn M überabzählbar ist. Tatsächlich zeigte Malcev in seinem Beweis noch mehr. Er hatte, anders als wir, zu keiner Zeit verlangt, dass der Symbolvorrat einer Logik endlich sein muss. Malcevs Ergebnis gilt sogar für Mengen von Formeln, die aus einem überabzählbaren Symbolvorrat schöpfen. Wir hatten bisher immer einen endlichen Symbolvorrat gefordert, und aus der Sicht des Logikers gibt es hierfür gute Gründe. Niemand wird jemals in die Verlegenheit kommen, unendlich viele Symbole für die Niederschrift einer Formel zu benötigen. Wozu ist diese Verallgemeinerung dann überhaupt nötig? Im momentanen Licht der Diskussion wirkt sie wie eine Nebensächlichkeit, doch schon im nächsten Abschnitt werden wir die wahre Stärke des Malcev’schen Resultats erkennen. Wir werden zeigen, dass sich daraus eine wichtige Teilaussage des Satzes von Löwenheim-Skolem-Tarski ergibt, und zwar fast von selbst.
7.1.3
Satz von Löwenheim-Skolem
Der Satz von Löwenheim-Skolem ist neben dem Modellexistenzsatz, dem Vollständigkeitssatz und dem Kompaktheitssatz das vierte große Ergebnis der Modelltheorie. Seine historisch älteste Variante wurde im Jahr 1915 von dem deutschen Mathematiker Leopold Löwenheim formuliert [112]. In moderner Terminologie lautet sie folgendermaßen: Satz 7.4 (Löwenheim, 1915) Sei ϕ eine Formel der Prädikatenlogik erster Stufe. Dann gilt: I
ϕ hat ein Modell ⇒ ϕ hat ein Modell (U, I) mit |U| ≤ |N|
Der Satz von Löwenheim führt uns auf verblüffende Weise die Grenzen der PL1 vor Augen. Er schließt aus, dass wir innerhalb der Prädikatenlogik erster Stufe eine Formel formulieren können, die ausschließlich Modelle mit einem überabzählbaren Individuenbereich besitzt. Hat eine PL1-Formel überhaupt ein Modell, so existiert auch immer eines, das eine höchstens abzählbare Grundmenge aufweist. Im Jahr 1920 gelang es Thoralf Skolem, den Satz von Löwenheim zu verallgemeinern. Er sah, dass der Satz nicht nur für einzelne Formeln gilt, sondern gleichermaßen für endliche oder abzählbar unendliche Formelmengen. Als Ergebnis entstand jenes Theorem, das wir heute als die klassische Formulierung des Satzes von Löwenheim-Skolem ansehen:
349
In seiner Arbeit aus dem Jahr 1915 hat Löwenheim seinen berühmten Satz wie folgt formuliert: Satz 2: „Jede Fluchtzählgleichung ist bereits in einem abzählbaren Denkbereich nicht mehr für beliebige Werte der Relativkoeffizienten erfüllt.“ ( [112], Seite 450) Ein Denkbereich ist das, was wir heute als Interpretation bezeichnen, und Löwenheims Fluchtzählgleichungen sind Logikformeln erster Stufe, die nicht allgemeingültig sind, aber unter allen Interpretationen wahr werden, die eine endliche Individuenmenge aufweisen. Um zu sehen, dass sich aus Löwenheims Satz 2 tatsächlich die inhaltliche Aussage von Satz 7.4 ableiten lässt, bringen wir die Originalformulierung zunächst in eine zeitgemäßere Form: Satz 2’: „Jede Fluchtzählgleichung ist unter einer abzählbaren Interpretation falsch.“ Sei nun ϕ eine Formel, die alle Voraussetzungen von Satz 7.4 erfüllt (ϕ ist eine erfüllbare Formel der Prädikatenlogik erster Stufe). Hat ϕ ein endliches Modell, also ein Modell (U, I) mit |U| < |N|, so ist die Aussage von Satz 7.4 trivialerweise erfüllt. Hat ϕ kein endliches Modell, so muss ¬ϕ unter allen endlichen Interpretationen wahr sein. Kurzum: ¬ϕ ist das, was Löwenheim als Fluchtzählgleichung bezeichnet. Dann folgt aus Satz 2’, dass ¬ϕ unter mindestens einer abzählbaren Interpretation falsch ist. Diese Interpretation ist dann ein Modell für ϕ, und genau dies ist die Aussage unseres Satzes 7.4.
350
Dass wir Satz 7.6 heute als den Satz von LöwenheimSkolem-Tarski bezeichnen, wird seinen Namensgebern nur bedingt gerecht. Es ist historisch korrekt, die inhaltliche Aussage des LST-Theorems mit Alfred Tarski zu verbinden. Von ihm stammt die aufsteigende Komponente des LST-Theorems, also jener Teil, der uns auf die Existenz von Modellen mit höheren Kardinalitäten schließen lässt. Fragwürdig ist dagegen die Nennung von Thoralf Skolem. Dass wir den Satz heute unverhohlen mit seinem Namen verbinden, täuscht darüber hinweg, dass sich Skolem niemals mit ihm identifizieren konnte. Tatsächlich hat er die Existenz überabzählbarer Mengen zeitlebens abgelehnt und die aufsteigende Variante des LST-Theorems niemals als sinntragenden Satz der Mathematik akzeptiert. Bruno Poizat äußert sich in [133] wie folgt über die Problematik: „Legend has it that Thoralf Skolem, up until the end of his life, was scandalized by the association of his name to a result of this type, which he considered an absurdity, nondenumerable sets being, for him, fictions without real existence.“
7 Modelltheorie
Satz 7.5 (Satz von Löwenheim-Skolem, Skolem 1920) Sei M eine Menge von PL1-Formeln mit |M| ≤ |N|. Dann gilt: I
M hat ein Modell ⇒ M hat ein Modell (U, I) mit |U| ≤ |N|
In Wirklichkeit zeigte Skolem noch mehr. Er erkannte, dass sich das Modell (U, I) in Satz 7.5 als Untermodell wählen lässt. Das bedeutet, dass U eine Teilmenge der ursprünglichen Individuenmenge ist und die Interpretation der Prädikat- und Funktionssymbole für alle in U verbliebenen Elemente unverändert übernommen wird. Obwohl Skolem, anders als Löwenheim, ein fehlerfreier Beweis gelang, war seine Arbeit aus dem Jahr 1920 mit einem Wermutstropfen behaftet. Er erzielte sein Ergebnis mithilfe des Auswahlaxioms; gleichwohl war er davon überzeugt, dass ein Beweis auch ohne dieses fragwürdige Konstrukt der Mengenlehre gelingen müsse. Tatsächlich dauerte es nicht lange, bis seine Anstrengungen von Erfolg gekrönt waren, und so erschien bereits 1922 eine Variante, die das Auswahlaxiom nicht benötigt [167]. In den Folgejahren konnte die Aussage des Satzes von LöwenheimSkolem noch weiter verstärkt werden. Das wichtigste Ergebnis in dieser Richtung ist der Satz von Löwenheim-Skolem-Tarski, der gern auch als LST-Theorem bezeichnet wird. Skolem zufolge wurde er durch den polnisch-US-amerikanischen Mathematiker Alfred Tarski in einem Seminar im Jahr 1928 bewiesen, eine schriftliche Aufzeichnung darüber existiert leider nicht [43,169,183]. Der erste publizierte Beweis stammt von Malcev aus dem Jahr 1936. Satz 7.6 (Satz von Löwenheim-Skolem-Tarski) M sei eine Menge von PL1-Formeln, und λ , κ seien zwei beliebige transfinite Kardinalzahlen. Dann gilt: I
ϕ hat ein Modell mit |U| = λ ⇒ ϕ hat ein Modell mit |U| = κ
Die Aussage des Satzes von Löwenheim-Skolem-Tarski verblüfft abermals. Wissen wir, dass eine Menge M von PL1-Formeln irgendein unendliches Modell besitzt, so können wir eine beliebige transfinite Kardinalzahl κ wählen und aus dem Satz von Löwenheim-Skolem-Tarski sofort folgern, dass für M auch ein Modell der Kardinalität κ existiert. In den Abschnitten 7.2 und 7.3 werden wir erarbeiten, welch einschneidende Konsequenzen sich hieraus für die Mathematik ergeben.
351
7.1 Meta-Resultate zur Prädikatenlogik
Manchmal wird der Satz von Löwenheim-Skolem-Tarski in zwei Teilsätze zerlegt. Wir sprechen dann von einer absteigenden und einer aufsteigenden Variante (Abbildung 7.7):
Hat φ ein unendliches Modell, ...
⇓
Satz 7.7 (Absteigendes LST-Theorem) M sei eine Menge von PL1-Formeln, und λ , κ seien zwei beliebige transfinite Kardinalzahlen mit λ > κ. Dann gilt:
Satz 7.8 (Aufsteigendes LST-Theorem) M sei eine Menge von PL1-Formeln, und λ , κ seien zwei beliebige transfinite Kardinalzahlen mit λ < κ. Dann gilt:
Aufsteigendes LST-Theorem
In Worten besagt die absteigende Variante, dass wir aus der Existenz eines unendlichen Modells stets darauf schließen können, dass auch für alle kleineren unendlichen Kardinalitäten ein Modell existiert.
I
…
ϕ hat ein Modell mit |U| = λ ⇒ ϕ hat ein Modell mit |U| = κ
Kardinalitätssprung
Kardinalitätssprung
ϕ hat ein Modell mit |U| = λ ⇒ ϕ hat ein Modell mit |U| = κ
In Worten besagt die aufsteigende Variante, dass wir aus der Existenz eines unendlichen Modells stets darauf schließen können, dass auch für alle größeren Kardinalitäten ein Modell existiert. Insbesondere folgt aus der aufsteigenden Variante, dass es für jede PL1-Formel ϕ, die ein abzählbares Modell besitzt, immer auch ein überzählbares geben muss. Die aufsteigende Variante des LST-Theorems können wir elegant aus der absteigenden Variante und dem Kompaktheitssatz herleiten. Wie in Satz 7.8 verlangt, seien mit λ und κ zwei transfinite Kardinalzahlen mit λ < κ gegeben. Ferner sei ϕ eine PL1-Formel, die ein Modell (U, I) mit |U| = λ besitzt. Dann können wir in wenigen Schritten ein Modell (U , I ) mit |U | = κ erhalten. Zu allererst erweitern wir das Vokabular unserer Logik um |κ| neue Konstantensymbole. Anschließend drücken wir mit einer Reihe von PL1-Formeln aus, dass die neuen Symbole paarweise verschieden sind. Dies können wir mit |κ|2 Formeln erledigen, die wir mit ϕ zu einer Menge M vereinen. Ganz offensichtlich ist jede endliche Teilmenge von M erfüllbar, so dass wir aus dem Kompaktheitssatz folgern können, dass auch M ein Modell haben muss.
Absteigendes LST-Theorem
I
...so existieren Modelle jeder beliebigen transfiniten Kardinalität.
Kardinalitätssprung
Kardinalitätssprung
Abzählbares Modell Abbildung 7.7: Der Satz von LöwenheimSkolem-Tarski besagt, dass wir in der Prädikatenlogik erster Stufe aus der Existenz eines unendlichen Modells auf die Existenz von Modellen beliebiger transfiniter Kardinalität schließen können.
352
7 Modelltheorie
Beachten Sie, dass wir diesen Beweisschritt nicht mit der klassischen Variante des Kompaktheitssatzes legitimieren können, da M überabzählbar viele Formeln umfassen kann. Was wir an dieser Stelle benötigen, ist die von Malcev bewiesene Erweiterung aus dem Jahr 1936 (Satz 7.3). Sie besagt, dass der Kompaktheitssatz auch dann gilt, wenn wir überabzählbar viele Formeln über einem überabzählbaren Symbolvorrat betrachten. Aus dem Kompaktheitssatz wissen wir jetzt, dass M ein Modell besitzt, aber was können wir über dessen Kardinalität aussagen? Zunächst halten wir fest, dass M so konstruiert ist, dass jedes Modell zwingend eine Kardinalität ≥ κ haben muss. Jetzt folgt aus dem absteigenden LSTTheorem, dass für M auch ein Modell der Kardinalität κ existiert, und genau dies ist die Aussage des aufsteigenden LST-Theorems. Abschließend sei bemerkt, dass sich der Satz von Löwenheim-SkolemTarski in dem gleichen Sinne verstärken lässt wie Satz 7.5. Es lässt sich zeigen, dass die postulierten Modelle entweder als Untermodelle oder als Modellerweiterungen erhalten werden können. Wir werden diese Verstärkung hier nicht benötigen und haben das Theorem absichtlich in der leicht schwächeren, aber verständlicheren Formulierung präsentiert.
7.2
Nichtstandardmodelle von PA
Wie gewohnt gehen wir davon aus, dass die Peano-Arithmetik frei von Widersprüchen ist. Es soll also keine Formel ϕ existieren, die zusammen mit ihrer Negation ¬ϕ aus den Axiomen abgeleitet werden kann. Unter dieser Annahme sind die natürlichen Zahlen mit der gewöhnlichen Addition und Multiplikation ein (abzählbares) Modell von PA, das wir mit (N, {s, +, ×}) abkürzen. Wir hatten es das Standardmodell der Peano-Arithmetik genannt, da es den arithmetischen Formeln ihre zugedachte Bedeutung verleiht. Eine Interpretation, die alle PA-Axiome erfüllt, aber nicht isomorph zu den natürlichen Zahlen ist, heißt Nichtstandardmodell. Es ist ein Ziel der Axiomatisierung, diese ungebetenen Gäste fern zu halten; gleichwohl können wir uns mit dem bisher erworbenen Wissen leicht davon überzeugen, dass dies weder für PA noch für ZF gelingen kann. Die Existenz von Nichtstandardmodellen ist eine unausweichliche Folge aus dem Satz von Löwenheim-Skolem-Tarski und der Tatsache, dass sowohl die Peano-Arithmetik als auch die Zermelo-FraenkelMengenlehre Theorien erster Stufe sind.
7.2 Nichtstandardmodelle von PA
Es war also keinesfalls folgenlos, dass wir das Prinzip der vollständigen Induktion in Abschnitt 3.1.3 als Axiomenschema erster Stufe formuliert haben. Die Peano-Arithmetik verliert hierdurch die Eigenschaft, kategorisch zu sein. Im ersten Moment ist diese Nachricht schwer zu verdauen. Durch den Verzicht auf das Induktionsaxiom zweiter Stufe haben wir Geistermodelle ins Leben gerufen, deren Existenz durch den Satz von Löwenheim-Skolem-Tarski zweifelsfrei gesichert ist. Aber wie sind diese Modelle aufgebaut? Wie können sie von der Struktur der natürlichen Zahlen abweichen und dennoch mit sämtlichen PeanoAxiomen verträglich sein? Im nächsten Abschnitt werden wir versuchen, zwei dieser mysteriösen Strukturen aus der Dunkelheit zu locken. Zu viel Euphorie ist an dieser Stelle aber keinesfalls angebracht. Sie werden sehen, dass wir es hier mit sehr scheuen Wesen zu tun haben.
7.2.1
Abzählbare Nichtstandardmodelle
Die Existenz eines abzählbaren Nichtstandardmodells können wir mit wenig Aufwand aus dem Kompaktheitssatz und dem Satz von Löwenheim-Skolem-Tarski herleiten. Hierzu definieren wir zunächst eine Reihe von Formeln ϕn über die Beziehung ϕn := ∃ x (x > n) Vereinigen wir diese Formeln mit den PA-Axiomen zu einer Menge M := PA ∪ {ϕ0 , ϕ1 , ϕ2 , . . .} so ist jede endliche Teilmenge von M ganz offensichtlich erfüllbar, und wir können aus dem Kompaktheitssatz folgern, dass M ein Modell besitzt. So wie wir die Formeln ϕn konstruiert haben, muss der Individuenbereich unendlich viele Elemente umfassen, und damit gibt es nach dem Satz von Löwenheim-Skolem-Tarski auch ein abzählbares Modell. Da die Formeln ϕn alle gleichzeitig wahr sind, muss dort ein Element existieren, das größer ist als jede natürliche Zahl. Innerhalb von N können wir ein solches Element nicht finden. Das bedeutet, dass wir tatsächlich ein Modell vor uns haben, das nicht zur Standardinterpretation (N, {s, +, ×}) isomorph sein kann. Wir wollen versuchen, ein wenig mehr über die Struktur dieses Modells in Erfahrung zu bringen. Zunächst ist es offensichtlich, dass es auch hier ein kleinstes Element, die Null, geben muss und sich die natürlichen Zahlen kettenförmig daran anschließen. Die Struktur des Nichtstandardmodells beginnt demnach mit der Sequenz der natürlichen Zahlen.
353
354
7 Modelltheorie
I Erste Beobachtung
„Es existiert ein Element λ , das größer ist als alle natürlichen Zahlen.“
λ …
I Zweite Beobachtung
„Links und rechts von λ erstreckt sich ein Zahlenstrahl in das Unendliche. Also liegt λ auf einer Kopie von Z.“
λ … …
…
I Dritte Beobachtung
„Die Elemente 2λ , 3λ , . . . müssen sich auf separaten Kopien von Z befinden.“
λ ……
Daneben muss ein Element existieren, wir nennen es λ , das größer ist als alle natürlichen Zahlen (Abbildung 7.8 oben): λ >x
für alle x ∈ N
(7.5)
Die Peano-Axiome stellen sicher, dass die Null das einzige Element ist, das keinen Vorgänger hat. Das heißt, dass sich unendlich viele Elemente links von λ befinden müssen, die ihrerseits größer sind als alle natürlichen Zahlen. Genauso muss sich der Zahlenstrahl rechts von λ in das Unendliche erstrecken, da nach den Peano-Axiomen jede Zahl einen Nachfolger besitzt. Unser Nichtstandardmodell beginnt also mit der Struktur der natürlichen Zahlen N, gefolgt von einer Kopie von Z, auf der sich irgendwo unser Element λ befindet (Abbildung 7.8 Mitte). Damit ist die Struktur immer noch nicht vollständig beschrieben. Neben dem Element λ existiert auch das Element 2λ . Dieses kann aber nicht auf dem Zahlenstrahl von λ liegen, da es andernfalls durch endlich viele Nachfolgerschritte von λ aus erreichbar sein müsste. Für eine natürliche Zahl x ∈ N wäre dann λ + x = 2λ , und hieraus würde x = λ folgen, im Widerspruch zu Ungleichung (7.5). Das bedeutet, dass hinter dem Anfangsstück N unendlich viele Kopien von Z folgen müssten, auf denen sich irgendwo die Elemente λ , 2λ , 3λ , . . . befinden (Abbildung 7.8 unten).
…
2λ …
…
3λ …
…
Abbildung 7.8: Notwendige Eigenschaften eines abzählbaren Nichtstandardmodells der Peano-Arithmetik
Auch damit sind wir noch nicht am Ende. Wir betrachten das Element 3λ und nehmen an, es handele sich dabei um eine gerade Zahl. Ist sie ungerade, so wiederholen wir die Betrachtung für den direkten Nachfolger 3λ + 1. Gerade Zahlen lassen sich als die zweifache Summer einer anderen Zahl schreiben, d. h., es ist 3λ = 2κ. Das Element κ erfüllt offenbar die Bedingung λ < κ < 2λ und liegt damit irgendwo zwischen λ und 2λ . Aber wo befindet es sich genau? I
κ kann nicht auf dem Zahlenstrahl von λ liegen. Wäre dies der Fall, so wäre κ = λ + x für ein x ∈ N. Daraus folgte 2κ = 2λ + 2x = 3λ . Damit wäre 2x = λ , im Widerspruch zu Ungleichung (7.5).
I
κ kann nicht auf dem Zahlenstrahl von 2λ liegen. Wäre dies der Fall, so wäre κ + x = 2λ für ein x ∈ N. Daraus folgte 2κ + 2x = 3λ + 2x = 4λ . Damit wäre erneut 2x = λ , im Widerspruch zu Ungleichung (7.5).
Die Überlegung zeigt, dass zwischen dem Zahlenstrahl von λ und dem Zahlenstrahl von 2λ ein weiterer liegen muss. Wir können das Argument verallgemeinern und daraus schließen, dass sich zwischen zwei beliebigen Kopien von Z immer eine weitere befindet. Die Kopien von
355
7.2 Nichtstandardmodelle von PA
…
… … 25 16
…
6 4
…
λ
… 27 16
λ
…
λ
… …
0 1 2 3 4
26 16
λ
… … 5 4
… …
…
… 7 4
λ
…
λ
λ
… …
2λ
Abbildung 7.9: Ordnungsstruktur aller abzählbaren Nichtstandardmodelle der Peano-Arithmetik
Z bilden zusammen eine dichte Ordnung mit offenen Enden und besitzen damit exakt die gleiche Anordnung wie die rationalen Zahlen. Abbildung 7.9 fasst das Ergebnis unserer Überlegung zusammen. Die Struktur des Nichtstandardmodells beginnt mit den natürlichen Zahlen N, gefolgt von Q Kopien der ganzen Zahlen Z. Die hier herausgearbeiteten Merkmale sind notwendige Eigenschaften von abzählbaren Nichtstandardmodellen, in denen ein Element λ größer ist als alle natürlichen Zahlen. Tatsächlich lässt sich zeigen, dass in jedem Nichtstandardmodell der Peano-Arithmetik ein solches Element vorhanden ist und somit jedes Modell, das nicht isomorph zu den natürlichen Zahlen ist, die Struktur aus Abbildung 7.9 aufweist [99]. Jetzt müssen wir nur noch die Addition und die Multiplikation so definieren, dass sie sie nicht im Widerspruch zu den Peano-Axiomen stehen. Tatsächlich hat es nie jemand geschafft, eine konkrete Abbildungsvorschrift zu formulieren. Der Beweis, dass eine verträgliche Definition existiert, wird in der Literatur niemals konstruktiv geführt; die Existenz einer geeigneten Addition und Multiplikation wird dort stets gezeigt, ohne dass eine konkrete Berechnungsvorschrift angegeben wird. Heute wissen wir, dass ein konstruktiver Beweis gar nicht existieren kann. Dies ist das erstaunliche Ergebnis von Stanley Tennenbaum aus dem Jahr 1959 [99, 178]:
…
3λ
356
7 Modelltheorie
Satz 7.9 (Tennenbaum, 1959) Kein Nichtstandardmodell der Peano-Arithmetik ist berechenbar.
Konkret besagt der Satz von Tennenbaum, dass kein abzählbares Nichtstandardmodell existiert, in dem sowohl die Multiplikation als auch die Addition berechenbar sind. Damit stehen wir vor einem Dilemma. Einerseits wissen wir, dass ein abzählbares Standardmodell existiert; wir kennen seine Struktur und wissen, dass es eine Interpretation der Symbole ‚+‘ und ‚ב geben muss, die mit den Peano-Axiomen verträglich ist. Andererseits macht der Satz von Tennenbaum unmissverständlich klar, dass wir niemals in der Lage sein werden, die Addition und die Multiplikation präzise zu definieren. Jede konkrete Festlegung hätte zur Folge, dass wir die Summe und das Produkt zweier Elemente ausrechnen könnten, und genau dies ist nach Satz 7.9 nicht möglich. Nahe sind wir an die abzählbaren Nichtstandardmodelle herangekommen, doch der letzte Schritt bleibt uns offenbar verwehrt. Der Satz von Tennenbaum macht unmissverständlich klar, dass die Nichtstandardmodelle von einem Schleier umgeben sind, den unsere Blicke niemals vollständig durchdringen können. Ein faszinierendes Ergebnis.
I
Nachfolgeroperation X =(
x0 ,
7.2.2 x1 ,
s(X) = ( s(x0 ) , s(x1 ) , s(x2 ) , . . .) I
Addition X =( Y =(
x0 , y0 ,
x1 , y1 ,
x2 , . . .) y2 , . . .)
X +Y = ( x0 + y0 , x1 + y1 , x2 + y2 , . . .) I
Multiplikation X =( Y =(
x0 , y0 ,
x1 , y1 ,
Überabzählbare Nichtstandardmodelle
x2 , . . .)
x2 , . . .) y2 , . . .)
X ×Y = ( x0 × y0 , x1 × y1 , x2 × y2 , . . .) Abbildung 7.10: Komponentenweise Addition und Multiplikation von Zahlenfolgen
In Abschnitt 7.2.1 haben wir den Kompaktheitssatz und den Satz von Löwenheim-Skolem-Tarski verwendet, um die Existenz eines abzählbaren Nichtstandardmodells zu belegen. Der Satz von SkolemLöwenheim-Tarski besagt aber noch mehr. Aus ihm geht zusätzlich hervor, dass es für die Peano-Arithmetik nicht nur abzählbare, sondern auch überabzählbare Modelle geben muss. Wie ein solches Modell konstruiert werden kann, wollen wir in diesem Abschnitt in groben Zügen nachvollziehen. Die Grundbausteine, die wir in unserer Konstruktion verwenden, sind Folgen von natürlichen Zahlen. Formal sind sie Elemente der Menge NN und haben die Form (x0 , x1 , x2 , . . .) mit xi ∈ N. Die Nachfolgeroperation, die Addition und die Multiplikation definieren wir komponentenweise, wie in Abbildung 7.10 gezeigt.
357
7.2 Nichtstandardmodelle von PA
In der Menge aller Zahlenfolgen sind die natürlichen Zahlen vollständig enthalten, denn ganz offensichtlich ist die Menge N := {(x, x, x, . . .) | x ∈ N} mit den vereinbarten Rechenregeln isomorph zur Standardinterpretation (N, {s, +, ×}) (Abbildung 7.11). Es ist leicht einzusehen, dass die vereinbarten Arithmetikoperationen mit den Peano-Axiomen verträglich sind. Heißt das, die Menge der Zahlenfolgen, zusammen mit der komponentenweisen Addition und Multiplikation, ist bereits ein überabzählbares Modell von PA? Die Antwort ist Nein! Hätten wir tatsächlich ein Modell vor uns, so müssten auch alle Ordnungseigenschaften erfüllt sein, die sich aus den PeanoAxiomen herleiten lassen. Hierzu gehört beispielsweise die Trichotomieeigenschaft, die uns bereits im Zusammenhang mit den Ordinalzahlen begegnet ist:
Überabzählbare Menge aller Zahlenfolgen
(x0, x1, x2, …) (y0, y1, y2, …) (z0, z1, z2, …)
0 := (0,0,0, . . .) 1 := (1,1,1, . . .) 2 := (2,2,2, . . .) ... Abbildung 7.11: Einbettung von N in die Menge aller Zahlenfolgen
„Für alle X und Y gilt entweder X < Y oder X = Y oder X > Y “ Menge aller Zahlenfolgen
Für die beiden ungleichen Zahlenfolgen X := (1,0,0,0,0,0,0,0) und Y := (0,1,0,0,0,0,0,0)
(7.6) (7.7)
müsste also X < Y oder X > Y gelten. Im ersten Fall würde eine Folge Z mit X + Z = Y existieren, im zweiten Fall eine Folge Z mit X = Y + Z. Da unsere Zahlenfolgen aber niemals negative Werte enthalten, kann es ein Z mit den geforderten Eigenschaften nicht geben. Dieses Problem werden wir dadurch umgehen, dass zwei verschiedene Zahlenfolgen nicht zwangsläufig für zwei verschiedene Individuenelemente stehen müssen. Das bedeutet, dass die Grundmenge unseres überabzählbaren Nichtstandardmodells (U, I) nicht aus einzelnen Zahlenfolgen, sondern aus Äquivalenzklassen besteht (Abbildung 7.12): U := {[X] | X ∈ NN } Damit diese Konstruktion funktioniert, müssen wir die in Abbildung 7.10 vereinbarten Arithmetikoperationen auf die Menge der Äquivalenzklassen übertragen. Dies geschieht in der üblichen Weise: s([X]) := [s(X)] [X] + [Y ] := [X +Y ] [X] × [Y ] := [X ×Y ]
X1 = (•, •,…)
Y1 = (•, •,…) Y3 = (•, •,…) Y = (•, •,…) 2 X3 = (•, •,…)
X2 = (•, •,…) …
Äquivalenzklassenbildung
[ X ] = {X1, X2, X3, …} [ Y ] = {Y1, Y2, Y3, …} … Individuenbereich des überabzählbaren Nichtstandardmodells Abbildung 7.12: Durch Äquivalenzklassenbildung entsteht der Individuenbereich des überabzählbaren Nichtstandardmodells der Peano-Arithmetik.
358
7 Modelltheorie
Als nächstes müssen wir festlegen, nach welchen Regeln die Äquivalenzklassen gebildet werden. Dies wird indirekt geschehen, indem wir auf der Menge NN eine eigene Ordnung etablieren. Gilt für zwei Zahlenfolgen X und Y in unserer Ordnung die Beziehung X < Y oder X > Y , so weisen wir sie verschiedenen Äquivalenzklassen zu. Gilt dagegen weder X < Y noch X > Y , so sollen sie per Definition Repräsentanten derselben Klasse sein. Wir wollen nun an mehreren Beispielen überlegen, wie eine adäquate Ordnung auf der Menge der Zahlenfolgen aussehen könnte. Als erstes betrachten wir die Folge (1,2,3,4,5,6, . . .). Sie ist nur an endlich vielen Indexpositionen kleiner als eine Folge der Form (x, x, x, . . .), aber an unendlich vielen Indexpositionen größer. Intuitiv können wir sie als Repräsentanten einer Zahl auffassen, die größer ist als jede natürliche Zahl x ∈ N. Damit spielt sie eine ähnliche Rolle wie das Element λ , das uns bei der Konstruktion abzählbarer Nichtstandardmodelle begegnet ist. Aus der Folge (1,2,3,4,5,6, . . .) können wir durch die Addition einer natürlichen Zahl weitere gewinnen: 1 + (1,2,3,4, . . .) = (1 + 1,1 + 2,1 + 3,1 + 4, . . .) = (2,3,4,5, . . .) 2 + (1,2,3,4, . . .) = (2 + 1,2 + 2,2 + 3,2 + 4, . . .) = (3,4,5,6, . . .) 3 + (1,2,3,4, . . .) = (3 + 1,3 + 2,3 + 3,3 + 4, . . .) = (4,5,6,7, . . .) Die so erhaltenen Folgen sind an sämtlichen Indexpositionen größer als ihre Summanden und dürfen im intuitiven Sinne deshalb auch als größere Zahlen gelten. Multiplizieren wir die Folge (1,2,3,4,5,6, . . .) mit 2, so erhalten wir mit 2 × (1,2,3,4, . . .) = (2 × 1,2 × 2,2 × 3,2 × 4, . . .) = (2,4,6,8, . . .) eine Folge, die wiederum größer ist als alles, was wir durch die Addition einer natürlichen Zahl erhalten konnten. Ihre Ordnungseigenschaft erinnert an das Element 2 · λ aus dem vorangegangenen Abschnitt. Auch für dieses Element galt, dass es größer ist als alle Elemente der Form λ + x mit x ∈ N. Es scheint, als könnten wir auf Folgen von natürlichen Zahlen eine mit den Peano-Axiomen verträgliche Ordnung etablieren, die an jene der abzählbaren Nichtstandardmodelle erinnert. Wir wollen einen Schritt zurücktreten und unser bisheriges Vorgehen rekapitulieren. In den betrachteten Beispielen hatten zwei Zahlenfolgen X und Y die Beziehung X > Y genau dann erfüllt, wenn die Elemente von X ab einem gewissen Index größer waren als die Elemente von Y . Entsprechend galt die Beziehung X < Y , wenn die Elemente von X
359
7.2 Nichtstandardmodelle von PA
Die Art und Weise, wie die natürlichen Zahlen im überabzählbaren Individuenbereich des Nichtstandardmodells eingebettet sind, ist die gleiche, wie wir sie von der Konstruktion der komplexen Zahlen her kennen. Jede komplexe Zahl x + yi ∈ C können wir uns als Punkt der Gauß’schen Zahlenebene vorstellen, dessen Koordinaten durch den Realteil x und den Imaginärteil y gegeben sind.
y
Gauß'sche Zahlenebene –3 + 32 i
3 + 2i
2
len, und wir können gefahrlos sagen, die komplexen Zahlen auf der x-Achse sind die reellen Zahlen. Genauso sind wir bei der Konstruktion des überabzählbaren Nichtstandardmodells vorgegangen. Wir haben die Menge der natürlichen Zahlen N in derselben Art erweitert, wie sich die reellen Zahlen R zu den komplexen Zahlen C erweitern lassen. Die natürlichen Zahlen finden wir in der überabzählbaren Individuenmenge unseres Nichtstandardmodells in Form der Folgen (x, x, x, . . .) wieder, und genau wie im Falle der komplexen Zahlen sind diese unter der Addition und der Multiplikation abgeschlossen.
y 1
-3
-2
-1
2
1
3
x
5 2
– 32 i
-2
3 2
1
-1
+ z2
2
3
4
-1
5
x
z2 = 4 – i y Multiplikation
– 4 + 3i z2 = – 1 + 2i |z2| = √5
3
|
⋅z
2
-4
Angenommen, X und Y sind Folgen, die sich in einem endlichen Anfangsstück unterscheiden, aber ab einem gewissen Index gleich sind. Dann haben wir zwei unterschiedliche Zahlenfolgen vor uns, aber es gilt weder X < Y noch Y > X. Dieses Problem lösen wir, indem zwei Folgen, die sich nur an endlich vielen Indexpositionen unterscheiden, immer der gleichen Äquivalenzklasse zugeordnet
-3
2
z1 = 2 + 1i |z1| = √5 |
z1
ab einem gewissen Index kleiner waren als die Elemente von Y . Es ist leicht einzusehen, dass diese Festlegung noch nicht ausreicht, um eine adäquate Ordnung zu definieren. Zwei Probleme sind noch zu lösen:
I
z1
1
– 2i
Betrachten wir die komplexen Zahlen als Vektoren, so lassen sich die Addition und die Multiplikation geometrisch interpretieren. Die Summe zweier komplexer Zahlen können wir ausrechnen, indem wir die Vektoren der beiden Summanden addieren. Die Multiplikation lässt sich geometrisch deuten, wenn die komplexen Zahlen in polaren Koordinaten (r, α) dargestellt werden, wobei r die Vektorlänge und α der Winkel zur x-Achse ist. Das Produkt zweier komplexer Zahlen (r1 , α1 ) und (r2 , α2 ) ist dann der Vektor (r1 · r2 , α1 + α2 ). Betrachten wir ausschließlich diejenigen komplexen Zahlen, die auf der x-Achse liegen, so sind diese sowohl unter der Addition als auch unter der Multiplikation abgeschlossen. Diese Zahlen verhalten sich eins zu eins wie die reellen Zah-
5 + 2i
2
-1 –
Addition
z1 = 1 + 3i
3
-2
1 -1
1
2
x
360
7 Modelltheorie
I Beispiel 1
werden. Damit sind die Beispielfolgen (7.6) und (7.7) Repräsentanten der gleichen Zahl, in diesem Fall der Zahl Null.
1 , 2 , 3 , 4 , 5 , ... X = ( 0 , 1 , 2 , 3 , 4 , ...) Y = ( 2 , 2 , 2 , 2 , 2 , ...)
L = { 1 , 2 , 3 , 4 , 5 , ...} E = { 1 , 2 , 3 , 4 , 5 , ...} G = { 1 , 2 , 3 , 4 , 5 , ...} I Beispiel 2
I
Bisher haben wir in unsere Betrachtung ausschließlich konstante und monotone Folgen einbezogen. Hier war es intuitiv naheliegend, sie der Größe nach zu ordnen. Dass die Situation im Allgemeinen komplizierter ist, macht das folgende Beispiel deutlich: X := (1,0,1,0,1,0,1,0), Y := (0,1,0,1,0,1,0,1) Nach unserer bisherigen Auslegung gilt weder X < Y noch X > Y . Da X und Y an überhaupt keiner Indexposition übereinstimmen, wollen wir sie aber auf keinen Fall der gleichen Äquivalenzklasse zuordnen.
1 , 2 , 3 , 4 , 5 , ... X = ( 1 , 2 , 3 , 4 , 5 , ...) Y = ( 1 , 3 , 5 , 7 , 9 , ...)
Mit dem letzten Beispiel haben wir die Grenze des intuitiv Erkennbaren erreicht. Offensichtlich können wir mit keinem griffigen Argument mehr entscheiden, ob nun X oder Y die größere Zahlenfolge sein soll.
L = { 1 , 2 , 3 , 4 , 5 , ...} E = { 1 , 2 , 3 , 4 , 5 , ...}
Ultrafilterkonstruktion
G = { 1 , 2 , 3 , 4 , 5 , ...} I Beispiel 3
1 , 2 , 3 , 4 , 5 , ... X = ( 0 , 1 , 0 , 1 , 0 , ...) Y = ( 1 , 0 , 1 , 0 , 1 , ...)
L = { 1 , 2 , 3 , 4 , 5 , ...} E = { 1 , 2 , 3 , 4 , 5 , ...} G = { 1 , 2 , 3 , 4 , 5 , ...} Abbildung 7.13: Berechnung der Indexmengen L(X,Y ), E(X,Y ) und G(X,Y )
Ab jetzt schlagen wir einen systematischeren Weg ein und definieren mit L, E und G drei Indexmengen, die uns Auskunft über die komponentenweisen Größenverhältnisse zweier Zahlenfolgen liefern (vgl. [147]): L(X,Y ) := {i | xi < yi } E(X,Y ) := {i | xi = yi } G(X,Y ) := {i | xi > yi } xi ist das i-te Element der Folge X und yi das i-te Element der Folge Y . In den Mengen L(X,Y ), E(X,Y ) und G(X,Y ) sind demnach diejenigen Indexpositionen enthalten, an denen X kleiner Y , X gleich Y bzw. X größer Y ist (Abbildung 7.13). Zusätzlich denken wir uns mit F eine Menge von Indexmengen gegeben. Wir werden F im Sinne eines Orakels verwenden, das uns Auskunft über das Größenverhältnis zweier vorgelegter Zahlenfolgen X und Y geben wird. Konkret läuft die Befragung des Orakels nach drei einfachen Spielregeln ab (Abbildung 7.14): L(X,Y ) ∈ F
⇒
X
E(X,Y ) ∈ F G(X,Y ) ∈ F
⇒ ⇒
X =Y X >Y
361
7.2 Nichtstandardmodelle von PA
Um unser Orakel zu befragen, müssen wir lediglich die Indexmengen L(X,Y ), E(X,Y ) und G(X,Y ) ausrechnen. Anschließend können wir über einen einfachen Inklusionstest entscheiden, in welcher Ordnungsrelation X und Y zueinander stehen. Intuitiv betrachtet sind die Elemente der Orakelmenge F nichts anderes als Muster von signifikanten Indexpositionen. Sie legen fest, welche Positionen für den Vergleich zweier Zahlenfolgen eine Rolle spielen und welche nicht.
X = (1,2,3,...)
L := {i | xi < yi } E := {i | xi = yi } G := {i | xi > yi } Orakelmenge F
Natürlich ist nicht jede Menge F als Orakel geeignet, und es ist keinesfalls selbstverständlich, dass überhaupt eine solche Menge existiert. Aus diesem Grund wollen wir zunächst überlegen, welche Kriterien F notwendigerweise erfüllen muss. I
I
Sind X und Y zwei identische Folgen, so ist E(X,Y ) = N. Damit unsere Orakelmenge X und Y als gleich erkennt, muss N ein Element von F sein. Sind X und Y Folgen, die an keiner einzigen Position übereinstimmen, so ist E(X,Y ) = 0. / Da wir vermeiden wollen, dass X und Y in diesem Fall als gleich erkannt werden, darf die leere Menge nicht in F enthalten sein. 0/ ∈ F, N ∈ F X, Y und Z seien drei Folgen. Ferner sei M := E(X,Y ) und N := E(Y, Z). Sind M und N beide in F enthalten, so ist X = Y und Y = Z. Aufgrund der Transitivität der Gleichheit müssen wir von F fordern, dass sie auch X und Z als gleich klassifiziert. Über die Folgen X und Z lässt sich aber lediglich sagen, dass sie mindestens an den Indexpositionen M ∩ N übereinstimmen. Deshalb fordern wir, dass für je zwei Mengen M, N ∈ F auch die Schnittmenge M ∩ N in F enthalten sein muss. M, N ∈ F ⇒ M ∩ N ∈ F
I
Wir betrachten erneut zwei Folgen X, Y , die F als gleich klassifiziert, d. h., es ist E(X,Y ) ∈ F. Hat eine Folge Z eine noch bessere Übereinstimmung mit X, gilt also E(X, Z) ⊃ E(X,Y ), so soll die Orakelmenge F auch die Gleichheit zwischen X und Z feststellen. Das bedeutet, dass für jede Menge M ∈ F auch alle Obermengen in F enthalten sein müssen. M ∈ F, N ⊃ M ⇒ N ∈ F
I
Unsere Orakelmenge F kann nur dann funktionieren, wenn sie für zwei vorgelegte Zahlenfolgen X und Y immer eine Antwort liefert. Nehmen wir an, X und Y stimmen an keiner Indexposition überein, es gelte also E(X,Y ) = 0. / Da 0/ nicht in F enthalten sein darf, ist entweder L(X,Y ) oder G(X,Y ) ein Element von F. Dann ist G(X,Y )
Y = (1,1,1,...)
L∈F E∈F G∈F
X
X=Y
X>Y
Abbildung 7.14: Um zwei Elemente X und Y zu vergleichen, werden zunächst die Indexmengen L, E und G bestimmt. Anschließend wird die Orakelmenge F danach befragt, welche der drei Indexmengen in ihr enthalten ist. Der Ausgang des Inklusionstests bestimmt, ob X und Y gleich sind oder eine der Folgen größer ist als die andere.
362
7 Modelltheorie
aber die Komplementärmenge von L(X,Y ). Das heißt, dass für jede Menge M entweder M selbst oder ihr Komplement M in F vorkommen muss.
Mengenfilter I 0/ ∈ F, N ∈ F I M, N ∈ F ⇒ M ∩ N ∈ F I M ∈ F, N ⊃ M ⇒ N ∈ F
Ultrafilter
•
M ⊆ N ⇒ (M ∈ F ⇔ M ∈ F) Freie Ultrafilter • M ∈ F ⇒ |M| = |N|
Abbildung 7.15: Die verschiedenen Mengenfilter im Vergleich
M ⊆ N ⇒ (M ∈ F ⇔ M ∈ F) I
Wir wollen vermeiden, dass zwei Folgen X und Y als gleich, kleiner oder größer erkannt werden, wenn sie die Beziehungen xi = yi , xi < yi oder xi > yi lediglich für endlich viele Indizes i erfüllen. Das bedeutet, dass F ausschließlich unendlich große Indexmengen enthalten darf. M ∈ F ⇒ |M| = |N|
Alle geforderten Beziehungen sind notwendige Eigenschaften, die eine Orakelmenge F erfüllen muss. Die Frage, ob eine solche Menge überhaupt existiert, ist damit aber keineswegs beantwortet. Doch an dieser Stelle haben wir Glück! Unser Forderungskatalog beschreibt eine bekannte mathematische Struktur, die inzwischen gut untersucht ist. In der Terminologie der gewöhnlichen Mathematik heißt eine Menge, die die ersten drei Bedingungen erfüllt, ein Mengenfilter oder einfach nur Filter. Gilt zusätzlich die Komplementeigenschaft, so ist die Menge ein sogenannter Ultrafilter. Solche Filter zeichnen sich dadurch aus, dass sie nicht weiter verfeinert werden können, d. h., es unmöglich, sie um ein weiteres Element zu ergänzen, ohne die Filtereigenschaften zu verletzen. Wegen dieser Eigenschaft werden Ultrafilter auch gern als maximale Filter bezeichnet. Umfasst ein Ultrafilter ausschließlich unendliche Mengen, so sprechen wir von einem freien Ultrafilter (Abbildung 7.15). Die positive Nachricht ist, dass freie Ultrafilter tatsächlich existieren. Die von uns postulierte Orakelmenge F gibt es also wirklich, und es lässt sich beweisen, dass die hieraus resultierende Äquivalenzklassenstruktur zu einem überabzählbaren Nichtstandardmodell der Peano-Arithmetik führt [1, 99]. Die negative Nachricht ist, dass sich die Existenz freier Ultrafilter ausschließlich nichtkonstruktiv mithilfe des Auswahlaxioms beweisen lässt. Die Folgen, die sich hieraus ergeben, sind ernüchternd. Wir wissen, dass ein Ultrafilter F existiert, der die Menge NN so in Äquivalenzklassen unterteilt, dass ein überabzählbares Modell der PeanoArithmetik entsteht. Gleichwohl wissen wir, dass es niemals möglich sein wird, F explizit zu erzeugen. Die Nichtkonstruktivität der freien Ultrafilter sorgt dafür, dass wir uns dem Nichtstandardmodell nur zu einem gewissen Grad nähern können. Genau wie bei den abzählbaren Nichtstandardmodellen bleibt uns auch hier der letzte Schritt verwehrt.
363
7.3 Das Skolem-Paradoxon
ai 23 Mar
Thoralf Albert Skolem wurde am 23. Mai 1887 im südnorwegischen Sandsvaer geboren. Seine Schulausbildung beendete er 1905 im 70 km entfernten Kristiania, dem späteren Oslo. Im selben Jahr schrieb er sich an der dort ansässigen Universität als Mathematikstudent ein und beendete sein Studium 1913 mit dem Staatsexamen. Skolems wissenschaftliches Interesse ging weit über die Mathematik hinaus, und er publizierte seine ersten Forschungsarbeiten im Bereich der Physik. Nach mehreren Assistenztätigkeiten und einem Forschungssemester an der Universität in Göttingen nahm er 1918 eine Dozentenposition in Oslo an. Ursprünglich hatte Skolem nicht vor, den Doktorgrad zu erlangen, holte dies im Jahr 1926 aber dennoch nach. Zwischen 1930 bis 1938 bekleidete er eine Forschungsstelle im westnorwegischen Bergen. Im Jahr 1938 wurde Skolem von der Universität in Oslo schließlich zum Professor berufen, im Alter von 51 Jahren. Im Bereich der mathematischen Logik und der Mengenlehre hat Skolem Maßgebliches geleistet. Sein Name ist untrennbar mit dem Satz von Löwenheim-Skolem verbunden, ei-
23 M
1887 1963
7.3
nem der vier Kernsätze der Modelltheorie. In seinem Beweis führte er unter anderem eine wichtige Normalformdarstellung für Logikformeln ein, die wir heute als SkolemNormalform bezeichnen. Mittlerweile gehört sie zum Lehrstoff fast aller Logikvorlesungen. Auch die Argumentationslinie, der Gödel in den Beweisen des Kompaktheitssatzes und des Satzes über die Modellexistenz folgte, geht auf Skolem zurück. Auf dem Gebiet der Mengenlehre hat Skolem ebenfalls wichtige Beiträge geleistet. Er war der erste, der eine exakte prädikatenlogische Formulierung der ZermeloFraenkel-Mengenlehre entwickelte [168]. Genauso untrennbar ist sein Name mit dem Skolem-Paradoxon verbunden, einem vermeintlichen Widerspruch, der wertvolle Einsichten in die Prädikatenlogik erster Stufe liefert [167]. 1957 ging Skolem offiziell in den Ruhestand. Trotzdem besuchte er weiterhin zahlreiche Universitäten und behielt die meisten seiner offiziellen Ämter. Wie in seinem ganzen Leben war Skolem auch in hohem Alter ein aktiver Mann und sein wissenschaftlicher Schaffensdrang ungebrochen. Dementsprechend plötzlich und unerwartet schied er aus dem Leben. Thoralf Albert Skolem starb am 23. März 1963 im Alter von 75 Jahren.
Das Skolem-Paradoxon
1923 veröffentlichte der norwegische Mathematiker Thoralf Skolem eine Arbeit mit dem Titel „Einige Bemerkungen zur axiomatischen Begründung der Mengenlehre“ [167]. In dieser Arbeit wird dem Leser ein augenscheinlicher Widerspruch vor Augen geführt, der zu Beginn des zwanzigsten Jahrhunderts zu kontroversen Auseinandersetzungen in der Wissenschaftsgemeinde führte. Stein des Anstoßes war die zweite von insgesamt acht Bemerkungen über das axiomatische System der Zermelo-Mengenlehre. Skolem schreibt: „Ist das präzisierte Zermelo’sche Axiomensystem widerspruchsfrei, so muss es möglich sein, eine unendliche Reihe von Symbolen 1,2,3,. . . so einzuführen, dass diese einen Bereich B bilden, für welchen die Zermelo’schen Axiome alle gültig sind [. . . ]. Soweit mir bekannt, hat niemand auf diesen eigentümlichen und scheinbar paradoxalen Sachverhalt aufmerksam gemacht. Kraft der Axiome kann man die Existenz höherer Zahlklassen zeigen usw. Wie kann es dann sein, dass der ganze Bereich B sogar mithilfe der endlichen ganzen positiven Zahlen abgezählt werden kann?“
364
1
2
3
4
0
0
1
3
6
10
1
2
4
7
11
16
2
5
8
12
17
23
3
9
13
18
24
...
4
14
19
25
...
5
20
26
...
6
27 ...
y
...
0
...
x
7 Modelltheorie
... ...
...
Abbildung 7.16: Durch die festgelegte Ordnungsrelation werden die Elemente aus N2 in die dargestellte Reihenfolge gebracht.
Das Skolem-Paradoxon resultiert aus der Kombination zweier für sich allein betrachtet harmloser Tatsachen: I
In der Prädikatenlogik erster Stufe lässt sich eine Formel ϕSkolem mit der inhaltlichen Aussage konstruieren, der Individuenbereich enthalte überabzählbar viele Elemente. ϕSkolem besitzt ein überabzählbares Modell, das sich auf einfache Weise konstruieren lässt.
I
Aus dem Satz von Löwenheim-Skolem-Tarski folgt jetzt unmittelbar, dass ϕSkolem Modelle beliebiger transfiniter Kardinalitäten besitzt. Folgerichtig muss auch ein abzählbares Modell existieren.
Aber wie kann in einem abzählbaren Modell eine Formel wahr sein, die behauptet, der Individuenbereich sei überabzählbar? Eine wahrlich paradoxe Situation. So verstörend das Skolem-Paradoxon auch wirkt: Wir stehen ihm keinesfalls machtlos gegenüber. In den vorangegangenen Kapiteln haben wir unser mathematisch-logisches Instrumentarium weit genug geschärft, um den entstandenen Widerspruch aufzulösen. Bevor wir dies tun, wollen wir uns zunächst davon überzeugen, dass eine Formel ϕSkolem mit der zugedachten Bedeutung tatsächlich konstruiert werden kann. Danach werden wir den vermeintlichen Widerspruch aufklären und dem Skolem-Paradoxon seinen Schrecken nehmen. Für die Konstruktion der Formel ϕSkolem folgen wir der Idee aus [14]. Als Erstes vereinbaren wir auf der Menge der Zahlenpaare (x, y) mit x, y ∈ N eine Ordnungsrelation ‚<‘, die folgendermaßen festgelegt ist: x1 + y1 < x2 + y2 oder (x1 , y1 ) < (x2 , y2 ) :⇔ x1 + y1 = x2 + y2 und y1 < y2 Die so definierte Ordnung basiert auf der Idee, zwei Zahlenpaare (x1 , y1 ) und (x2 , y2 ) über ihre Komponentensummen zu vergleichen. Sind die Werte x1 + y1 und y1 + y2 unterschiedlich, so ist dasjenige Paar mit der kleineren Summe auch das kleinere Element. Nur wenn die Summen übereinstimmen, entscheiden die Elemente y1 und y2 über den Ausgang des Vergleichs. Auf diese Weise erhalten wir eine totale Ordnung auf der Menge N2 , die in Abbildung 7.16 aufgezeichnet ist. Die vereinbarte Ordnungsrelation ist eine alte Bekannte. Wir hatten sie bereits in Kapitel 1 verwendet, um die Gleichmächtigkeit der Mengen N und N2 zu beweisen (vgl. Abbildung 1.16). Dort hatten wir auch
365
7.3 Das Skolem-Paradoxon
5
...
3
...
4
...
5
20
26
33
41
50
60
...
y
↑
↑
↑
↑
↑
↑
..
0/
2
0/
...
0/
1
{1,3,5}
...
Wir vereinbaren zusätzlich, dass jeder Enumerator für eine Menge M per Definition auch ein Enumerator für jede Teilmenge von M ist. Mit anderen Worten: Wir fordern nicht, dass die durch EM beschriebenen Elemente exakt den Elementen von M entsprechen, sondern lediglich, dass jede in M enthaltene Menge in der Matrixdarstellung von EM irgendwo vorkommt. Somit ist neben EM beispielsweise auch die Menge
0
1
2
3
4
5
x
0
0
1
3
6
10
15
...
1
2
4
7
11
16
22
...
2
5
8
12
17
23
30
...
3
9
13
18
24
31
39
...
4
14
19
25
32
40
49
...
5
20
26
33
41
50
60
...
y
↑
↑
↑
↑
↑
↑
..
0/
Die Menge EM nennen wir einen Enumerator für M.
Abbildung 7.17: Matrixdarstellung der Menge {0, / {1,2,3}, {2,3,4}, {1,3,5}}
0/
(7.9)
EM = {2, 5, 6, 7, 8, 9, 13, 18, 19, 22, 24, 32, 33, 39, 49} ein Enumerator für M (Abbildung 7.19). Umgekehrt sind EM und EM gleichzeitig auch Enumeratoren für die Mengen
{{1,2,3}, {2,3,4}, {1, 3, 5}}, {{1,2,3}, {2,3,4}}, {{1,2,3}}, . . .
.
0/
Abbildung 7.18 zeigt die Matrix erneut, allerdings ist jetzt in jedem Feld (x, y) zusätzlich der Wert der Cantor’schen Paarungsfunktion πN (x, y) eingetragen. Die Zahlen sind der Schlüssel für den nächsten Schritt: Die Darstellung von M durch eine einzige Teilmenge der natürlichen Zahlen. Eine solche Menge EM können wir ganz einfach dadurch erhalten, dass wir für jedes markierte Feld (x, y) den Wert π(x, y) in EM aufnehmen. Für unsere Beispielmenge M ist
x
0
(7.8)
Für den Moment nehmen wir an, M sei höchstens abzählbar, d. h., die Menge sei entweder endlich oder sie habe die Kardinalität der natürlichen Zahlen. Dann lässt sich M in Form einer Matrix darstellen. Diese entsteht, indem wir jedem Element {x1 , x2 , x3 , . . .} ∈ M eine separate Spalte zuordnen und die Felder in den Zeilen x1 , x2 , x3 , . . . einfärben. Abbildung 7.17 demonstriert, wie eine solche Matrixdarstellung für unserer Beispielmenge aussehen kann.
EM = {2, 5, 7, 8, 9, 13, 18, 19, 33}
4
{1,3,5}
M := {0, / {1,2,3}, {2,3,4}, {1, 3, 5}}
3
{2,3,4}
Als nächstes betrachten wir eine Menge M ⊆ 2N , also eine Menge, deren Elemente Teilmengen der natürlichen Zahlen sind. M könnte beispielsweise so aussehen:
2
{2,3,4}
i=0
(x + y)(x + y + 1) 2
1
{1,2,3}
x+y
πN (x, y) = y + ∑ i = y +
0
{1,2,3}
gezeigt, dass sich die Position eines Elements (x, y) mithilfe einer geschlossenen Formel direkt ausrechnen lässt. Diese Überlegungen brachten die Cantor’sche Paarungsfunktion hervor, die über die nachstehende Formel gegeben ist:
EM = {2, 5, 7, 8, 9, 13, 18, 19, 33} Abbildung 7.18: Ein Enumerator für die Menge {0, / {1,2,3}, {2,3,4}, {1,3,5}}
.
366
7 Modelltheorie
x
0
0
1
3
6
10
15
...
1
2
4
7
11
16
22
...
2
5
8
12
17
23
30
...
3
9
13
18
24
31
39
...
4
14
19
25
32
40
49
...
5
20
26
33
41
50
60
...
y
↑
↑
↑
↑
↑
↑
..
{1,3,4}
5
0/
4
{0,3,4}
3
{1,3,5}
2
{2,3,4}
1
{1,2,3}
0
= {2, 5, 6, 7, 8, 9, 13, 18, EM 19, 22, 24, 32, 33, 39, 49}
Abbildung 7.19: Einer von vielen weiteren Enumeratoren für die Menge M = {0, / {1,2,3}, {2,3,4}, {1,3,5}}
Zwischen Enumeratoren und höchstens abzählbaren Mengen besteht ein enger Zusammenhang. Auf der einen Seite können wir für jede höchstens abzählbare Menge M ⊂ 2N einen Enumerator finden. Hierzu brauchen wir M lediglich in die Matrixdarstellung zu übersetzen und können den Enumerator dann direkt ablesen. Auf der anderen Seite sind Enumeratoren Teilmengen der natürlichen Zahlen und damit ihrerseits höchstens abzählbar. Wir halten fest: Satz 7.10 Eine Menge M ⊆ 2N hat einen Enumerator ⇔ |M| ≤ |N|
.
Als nächstes wollen wir den Begriff des Enumerators innerhalb der Prädikatenlogik erster Stufe formalisieren. Die dabei erarbeitete Formel wird behaupten, dass der Individuenbereich keinen Enumerator besitzt. Nach Satz 7.10 ist sie jene Formel, nach der wir suchen: Sie behauptet, der Individuenbereich sei überabzählbar. Der Ausgangspunkt für unsere Formalisierung ist die folgende umgangssprachliche Charakterisierung des Enumerators: „E ist ein Enumerator für den Individuenbereich U, wenn für jede Menge natürlicher Zahlen z ∈ U eine natürliche Zahl x mit der Eigenschaft existiert, dass eine natürliche Zahl y genau dann in z ist, wenn π(x, y) in E ist.“ Nun sei (U, I) eine Interpretation mit U = N ∪ 2N . Das bedeutet, dass wir im Individuenbereich alle natürlichen Zahlen sowie alle Teilmengen der natürlichen Zahlen wiederfinden. Ferner sei I so beschaffen, dass die Symbole ‚∈‘, S, N die folgende Bedeutung erhalten: (U, I) |= N(ξ ) :⇔ ξ ist eine natürliche Zahl (U, I) |= S(ξ ) :⇔ ξ ist eine Menge von natürlichen Zahlen (U, I) |= ξ ∈ ν :⇔ ξ ist ein Element von ν Ferner soll mit π ein zweistelliges Funktionszeichen existieren, das in (U, I) als die Cantor’sche Paarungsfunktion πN (x, y) interpretiert wird. (U, I) bezeichnen wir als Standardinterpretation, da sie den Symbolen ihre intendierte Bedeutung verleiht. Jetzt können wir die umgangssprachliche Charakterisierung des Enumerators ohne Mühe in eine Formel der Prädikatenlogik übersetzen:
367
7.3 Das Skolem-Paradoxon
„E ist ein Enumerator für den Individuenbereich U, wenn für jede Menge natürlicher Zahlen z ∈ U ∀ z (S(z) → ( eine natürliche Zahl x mit der Eigenschaft existiert, ∃ x (N(x) ∧ ( dass eine natürliche Zahl y ∀ y (N(y) → genau dann in z ist, wenn π(x, y) in E ist.“ (y ∈ z ↔ π(x, y) ∈ E)))))) Fordern wir jetzt noch, dass kein Enumerator für den Individuenbereich existiert, so sind wir am Ziel. Als Ergebnis erhalten wir die von uns gesuchte Formel ϕSkolem : ϕSkolem := ¬∃ w (S(w)∧ ∀ z (S(z) → (∃ x (N(x) ∧ (∀ y (N(y) → (y ∈ z ↔ π(x, y) ∈ w))))))) Offensichtlich ist ϕSkolem unter der oben konstruierten Interpretation (U, I) eine wahre Aussage. Sie ist deshalb wahr, weil der Individuenbereich U = N ∪ 2N überabzählbar ist, und genau dies haben wir mit ϕSkolem auch behauptet. Da ϕSkolem ein überabzählbares Modell besitzt, muss auch ein abzählbares existieren. Dies folgt unmittelbar aus dem Satz von LöwenheimSkolem und ist die Ursache des Skolem-Paradoxons. Der augenscheinliche Widerspruch klärt sich auf, wenn wir die inhaltliche Aussage von ϕSkolem in aller Präzision analysieren. Weiter oben hatten wir die Formel mit der folgenden Bedeutung assoziiert: ϕSkolem =
„Es existiert kein Enumerator für den Individuenbereich.“
(7.10)
Aber besitzt ϕSkolem diese Bedeutung wirklich? Die Antwort hängt davon ab, unter welcher Interpretation (U, I) wir sie betrachten. Schreiben wir ihre inhaltliche Aussage in aller Ausführlichkeit nieder, so lautet sie folgendermaßen: ϕSkolem =
„Innerhalb des Individuenbereichs existiert kein Enumerator für den Individuenbereich.“ (7.11)
In der festgelegten Standardinterpretation (N ∪ 2N , I) sind die Aussagen (7.10) und (7.11) äquivalent. Das liegt daran, dass der Individuenbereich alle Teilmengen der natürlichen Zahlen umfasst und hierdurch
368
7 Modelltheorie
5
x
0
0
1
3
6
10
15
...
1
2
4
7
11
16
22
...
2
5
8
12
17
23
30
...
3
9
13
18
24
31
39
...
4
14
19
25
32
40
49
...
5
20
26
33
41
50
60
...
y
↑
↑
↑
↑
↑
↑
auch sämtliche Enumeratoren einschließt. Unter der Standardinterpretation behauptet die Formel ϕSkolem also tatsächlich, der Individuenbereich U sei überabzählbar. Dies ändert sich, wenn wir ϕSkolem in einem Modell betrachten, dessen Individuenbereich nur noch eine abzählbare Auswahl an Enumeratoren umfasst. In einer solchen Interpretationen sind (7.10) und (7.11) nicht äquivalent, da ein Enumerator für den Individuenbereich existieren könnte, der selbst kein Element des Individuenbereichs ist. Das Modell wäre abzählbar und die Formel ϕSkolem trotzdem wahr.
Ein solches Modell lässt sich direkt aus der Standardinterpretation gewinnen. Wir erhalten es ganz einfach dadurch, dass wir die Individuen. . menge U durch die Menge .
{0,1,2,3,4,5}
{0,1,2,3,4}
4
{0,1,2,3}
3
{0,1,2}
2
{0,1}
1
{0}
0
EU = {0, 1, 3, 4, 6, 7, 10, 11, 12, . . .} Abbildung 7.20: Die Individuenmenge U ist abzählbar und besitzt nach Satz 7.10 einen Enumerator. Dieser ist selbst kein Element des Individuenbereichs und die Formel ϕSkolem daher eine wahre Aussage.
U := N ∪ {{0}, {0, 1}, {0, 1, 2}, {0, 1, 2, 3}, . . .} ersetzen. Die neue Individuenmenge U ist abzählbar, so dass wir sie als Matrix darstellen können. Wie diese aussieht, zeigt Abbildung 7.20. Als abzählbare Menge besitzt der neue Individuenbereich einen Enumerator, den wir aus der Matrixdarstellung ohne Mühe ablesen können. Es ist EU = {0, 1, 3, 4, 6, 7, 10, 11, 12, 15, 16, 17, . . . , } Der Enumerator EU ist kein Element von U und die Formel ϕSkolem deshalb wahr. Die Diskussion hat gezeigt, dass wir mit dem Skolem-Paradoxon kein Paradoxon im eigentlichen Sinne vor uns haben und der vermeintliche Widerspruch nur aus der Ferne sichtbar ist. Er löst sich auf, sobald wir die inhaltliche Aussage der Formel ϕSkolem korrekt formulieren. In seiner Veröffentlichung aus dem Jahr 1923 hatte Skolem nicht nur sein vermeintliches Paradoxon formuliert, sondern zugleich eine mathematisch einwandfreie Erklärung dafür geliefert. Zu keiner Zeit war daher zu befürchten, das Paradoxon könne das Gebäude der Mathematik in der gleichen Weise beschädigen wie einst die Russell’sche Antinomie. Dennoch müssen wir aus dem Skolem’schen Resultat eine bittere Lehre ziehen. Unverblümt führt es uns vor Augen, dass die Bedeutung mancher Formeln maßgeblich davon abhängig ist, über welchem Grundbereich wir ihre Symbole interpretieren; diese Formeln besitzen keine inhaltliche Bedeutung in einem absoluten Sinn. Skolem, der sich im Rahmen seiner Diskussion auf die Mengenlehre bezieht, nennt dieses Phänomen „eine Relativität der Mengenbegriffe, welche bei jeder konsequenten Axiomatik unvermeidbar ist.“ [167]
369
7.3 Das Skolem-Paradoxon
Zur damaligen Zeit führte Skolems Ergebnis zu kontroversen Diskussionen über die Sinnhaftigkeit der formalen Methode. Das von ihm entdeckte Wechselspiel zwischen der syntaktischen und der semantischen Ebene läuft unserer Intuition zuwider, und von mehreren wurde die Meinung vertreten, die Mathematik dürfe nicht auf einem Fundament errichtet werden, das zwar mathematisch widerspruchsfrei sei, aber gleichzeitig nicht die nötige Stabilität aufweise, um den Mengenbegriff in einem absoluten Sinn zu definieren. Zu den Kritikern gehörte auch Skolem selbst. Für ihn war das entdeckte Phänomen schwerwiegend genug, um die im Aufbau befindliche axiomatische Mengenlehre vollständig in Frage zu stellen. Seine Arbeit schloss er mit den folgenden Worten: „Das wichtigste Ergebnis oben ist die Relativität der Mengenbegriffe. In einem mündlichen Gespräch habe ich dies schon im Winter 1915–1916 Herrn Prof. F. Bernstein in Göttingen erzählt. Dass ich nicht früher etwas darüber publiziert habe, hat zwei Gründe: Erstens bin ich inzwischen mit anderen Problemen beschäftigt gewesen; zweitens glaubte ich, dass es so klar sei, dass diese Mengenaxiomatik keine befriedigende letzte Grundlage der Mathematik wäre, dass die Mathematiker größtenteils sich nicht so sehr darum kümmern würden. In der letzten Zeit habe ich aber zu meinem Erstaunen gesehen, dass sehr viele Mathematiker diese Axiome der Mengenlehre als die ideale Begründung der Mathematik betrachten; deshalb schien mir die Zeit gekommen, eine Kritik zu publizieren.“ Thoralf Skolem [167] Wie gehen wir heute mit Skolems Erbe um? Gegenwärtig wird nur noch wenig über die philosophische Bedeutung des Paradoxons diskutiert. Die meisten Mathematiker haben gelernt, mit ihm zu leben; sie sehen darin eher ein Phänomen als ein Problem, und so beschränken sich fast alle modernen Abhandlungen darauf, die mathematische Komponente zu behandeln und den vermeintlichen Widerspruch sauber aufzulösen. Aus diesem Blickwinkel wirken die Reaktionen, die Skolems Arbeit in der ersten Hälfte des zwanzigsten Jahrhunderts hervorrief, als übertrieben. Doch waren sie das wirklich? Vertreten wir vielleicht nur deswegen diese Meinung, weil philosophische Betrachtungen in der modernen Mathematik kaum noch eine Rolle spielen? Eine objektive Antwort ist schwer zu geben, denn bei einer Beurteilung dürfen wir eines nicht vergessen: Wir sind alle Kinder unserer Zeit.
Die Diskussion des SkolemParadoxons hat uns gelehrt, dass die inhaltliche Bedeutung der Formel ϕSkolem davon abhängt, über welchem Grundbereich wir ihre Symbole interpretieren; sie besitzt keine Bedeutung in einem absoluten Sinn. Dass wir dieses Phänomen nicht für jede Formel beobachten können, macht das folgende Beispiel deutlich: ϕ := ∃ x ∃ y (x = y) Inhaltlich besagt diese Formel, dass der Individuenbereich mindestens zwei verschiedene Elemente umfasst. ϕ besitzt diese Bedeutung tatsächlich in einem absoluten Sinn; ihre inhaltliche Aussage ist unter allen Interpretationen immer die gleiche. Wir müssen daher vorsichtig sein, um aus dem Paradoxon nicht die falschen Schlüsse zu ziehen. Es wäre falsch, Skolems Ergebnis so zu interpretieren, als sei die Bedeutung einer Formel immer eine relative. Wir lernen aus ihm lediglich, dass nicht jede Formel in einem absoluten Sinn bedeutungstragend ist.
370
7 Modelltheorie
7.4
Boolesche Modelle
Bisher hatten wir uns eine Interpretation stets als ein Tupel (U, I) vorgestellt, das neben einer nichtleeren Individuenmenge U eine Abbildungsvorschrift I enthält, die jedem Prädikatzeichen und jedem Funktionssymbol eine Relation oder eine Funktion über U zuordnet. Sind eine Interpretation (U, I) und eine Formel ϕ vorgelegt, so ist ϕ unter dieser Interpretation entweder wahr oder falsch. Im ersten Fall schreiben wir (U, I) |= ϕ und im zweiten Fall (U, I) |= ϕ. Damit können wir uns jede Interpretation als eine Abbildung vorstellen, die jeder Formel einen der beiden Wahrheitswerte + (wahr) und ⊥ (falsch) zuordnet. Bezeichnen wir den Funktionswert dieser Abbildung mit ϕ(U,I) , so können wir den Zusammenhang wie folgt beschreiben: + falls (U, I) |= ϕ (7.12) ϕ(U,I) := ⊥ falls (U, I) |= ϕ
Dana Scott (geb. 1932) [7] Abbildung 7.21: Dem US-Amerikaner Dana Scott verdanken wir wertvolle Beiträge auf dem Gebiet der mathematischen Logik und der theoretischen Informatik. Es ist Scotts Verdienst, dass wir heute einen vergleichsweise intuitiven Zugang zu Paul Cohens Beweis über die Unabhängigkeit der Kontinuumshypothese in Händen halten. 1972 wurde er für seine Arbeiten über boolesche Modelle mit dem Leroy P. Steele Prize ausgezeichnet. Seinen wohl größten Erfolg errang er im Bereich der theoretischen Informatik, als er 1959, zusammen mit Michael O. Rabin, das Konzept des nichtdeterministischen Automaten ersann [143]. Hierdurch ist eine völlig neue Denkrichtung entstanden, die sowohl die Berechenbarkeits- als auch die Komplexitätstheorie bis heute prägt. 1976 wurden Rabin und Scott für ihre bahnbrechende Arbeit mit dem Turing Award ausgezeichnet, der höchsten Auszeichnung im Bereich der theoretischen Informatik.
Wir können dieses Prinzip verallgemeinern, indem wir den Wertebereich von ϕ(U,I) nicht länger auf zwei Wahrheitswerte beschränken, sondern die Elemente einer beliebigen Booleschen Algebra zulassen. Auf diesem Weg gelangen wir zu neuartigen Interpretationen, die in der Literatur als boolesche Modelle (boolean valued models) bezeichnet werden. Eingeführt wurden sie Ende der Siebzigerjahre von Dana Scott (Abbildung 7.21), Robert Solovay und Petr Vopˇenka [162, 184]. Die ursprüngliche Idee hatte Solovay im Jahr 1965. Von Scott wurde sie zu jener Theorie weiterentwickelt, die ausführlich in der berühmten Publikation aus dem Jahr 1967 beschrieben ist [162]. Vopˇenka entwickelte seine Theorie unabhängig von den anderen, inhaltlich traf er aber denselben Kern. Die Theorie der booleschen Modelle wurde mit der Intention entwickelt, einen leichter verständlichen Zugang zu Paul Cohens ForcingMethode aus dem Jahr 1963 zu schaffen. Tatsächlich verbirgt sich in einem Forcing-Beweis die Konstruktion eines speziellen booleschen Modells, aus dem sich anschließend mehrere gewöhnliche Modelle gewinnen lassen. Gelingt die Konstruktion derart, dass alle Axiome eines formalen Systems in allen Modellen wahr, eine Formel ϕ dagegen in einem Modell wahr und in einem anderen Modell falsch ist, so wissen wir, dass weder ϕ noch ¬ϕ aus den Axiomen logisch gefolgert werden können. Heute ist die Konstruktion von booleschen Modellen zu einer Standardtechnik für das Führen von Unabhängigkeitsbeweisen geworden. Wie ein solcher Beweis im Einzelnen funktioniert, werden wir in den nächsten Abschnitten im Ansatz nachvollziehen.
371
7.4 Boolesche Modelle
I
I
Kommutativgesetze
(B1)
I
Distributivgesetze
(B2)
x,y = y,x
x , (y - z) = (x , y) - (x , z)
x-y = y-x
x - (y , z) = (x - y) , (x - z)
Neutrale Elemente
(B3)
I
Inverse Elemente
Es existieren +, ⊥ mit
Für alle x existiert ein
x,+ = x x-⊥ = x
x , x−1 = ⊥
7.4.1
(B4) x−1
mit
x - x−1 = +
Tabelle 7.1: Boolesche Algebren sind algebraische Strukturen, die Mitte des neunzehnten Jahrhunderts von dem britischen Mathematiker und Philosophen George Boole (Abbildung 7.22) entwickelt wurden [11, 12]. Im Jahr 1904 konnte der amerikanische Mathematiker Edward Vermilye Huntington zeigen, dass sich boolesche Algebren durch die Angabe von lediglich vier Gesetzen, den Huntington’schen Axiomen, eindeutig charakterisieren lassen [91].
Definition und Eigenschaften
Zuallererst wollen wir klären, was sich hinter dem Begriff der booleschen Algebra verbirgt. Hierzu denken wir uns eine nichtleere Menge V sowie zwei Operatoren ,, - der Form , : V ×V → V - : V ×V → V gegeben. Das Tripel (V, ,, -) nennen wir eine boolesche Algebra, wenn die vier Huntington’schen Axiome aus Tabelle 7.1 erfüllt sind. Achten Sie darauf, die Axiome nicht als Bestandteile eines Kalküls zu verstehen, sondern lediglich als mathematische Beziehungen, die von allen booleschen Algebren erfüllt werden müssen. Bevor wir uns mit der Theorie der booleschen Modelle auseinandersetzen, wollen wir die mathematische Struktur der booleschen Algebra an zwei prominenten Beispielen untersuchen. I
Mengenalgebra Für eine nichtleere, aber sonst beliebige Trägermenge T ist das Tripel (V, ,, -) mit V := 2T x , y := x ∩ y x - y := x ∪ y eine boolesche Algebra. Dass (V, ,, -) tatsächlich alle vier Huntington’schen Axiome erfüllt, können wir leicht nachprüfen. Die Gültigkeit der Kommutativgesetze liegt auf der Hand, genauso wie die
George Boole (1815 – 1864) Abbildung 7.22: Der britische Mathematiker und Philosoph George Boole zählt zu den einflussreichsten Logikern des neunzehnten Jahrhunderts. Mit seiner aus heutiger Sicht historischen Arbeit „The laws of thought“ publizierte er eines der Frühwerke der mathematischen Logik [11].
372
7 Modelltheorie
y∪z
x
x ∩ (y ∪ z)
x
x y
x
x
y
∩ z
y
z
x ∪ (y ∩ z)
x
y
=
z
y∩z
x
x y
∪
y
=
z
z
z
x y
=
=
x
x
x
y
∪
x
y
y
=
z
z x∩y
z
x∩z
∩
z
(x ∩ y) ∪ (x ∩ z)
x y
z x∪y
y
= x∪z
z (x ∪ y) ∩ (x ∪ z)
Abbildung 7.23: Veranschaulichung der Distributivgesetze anhand von Venn-Diagrammen
Existenz neutraler und inverser Elemente: ⊥ entspricht der leeren Menge 0, / + ist die Trägermenge T , und das inverse Element einer Menge x ist seine Komplementärmenge T \x. Die Gültigkeit der Distributivgesetze wird offensichtlich, wenn wir die Mengen in Form von Venn-Diagrammen darstellen (Abbildung 7.23).
T1 := {1}
{1}=
⊥
•
∅=⊥
Abbildung 7.24 veranschaulicht die Struktur der Mengenalgebra für die Fälle T1 = {1}, T2 = {1, 2} und T3 = {1, 2, 3}. Aus den grafischen Darstellungen geht hervor, dass die Elemente mit der Teilmengenrelation ‚⊂‘ eine partielle Ordnung bilden, die nach oben und unten durch ein maximales und ein minimales Element begrenzt wird. Ferner zeigen die Beispiele, welche Elemente die Rolle des Maximums und des Minimums übernehmen: Es sind die beiden neutralen Elemente + und ⊥. Eine derartige Ordnungsstruktur ist nicht nur in der Mengenalgebra, sondern in jeder booleschen Algebra vorhanden.
T2 := {1, 2}
{ 1, 2 } =
⊥
•
{1}
{2} ∅=⊥
T3 := {1, 2, 3}
I
{ 1, 2, 3 } = { 1, 2 } {1}
{ 1, 3 } {2}
⊥
•
{ 2, 3 } {3}
∅=⊥ Abbildung 7.24: Ordnungsstrukturen der ersten drei Mengenalgebren
Schaltalgebra Die Schaltalgebra basiert auf einer zweielementigen Grundmenge V = {0, 1} und der folgenden Operatorendefinition: 1 falls x = 1 und y = 1 x , y := 0 sonst 1 falls x = 1 oder y = 1 x - y := 0 sonst Aus praktischer Sicht ist die Schaltalgebra die wichtigste aller booleschen Algebren. Sie ist die mathematische Grundlage des digitalen
373
7.4 Boolesche Modelle
Schaltungsentwurfs und in diesem Sinne das theoretische Fundament der technischen Informatik [88]. Aus mathematischer Sicht können wir die Schaltalgebra als spezielle Mengenalgebra auffassen. Setzen wir 0 := 0/ und 1 := {a} für ein beliebiges Element a, so ist die Schaltalgebra isomorph zur Mengenalgebra (2{a} , ∩, ∪). Eine notwendige Eigenschaft, die alle booleschen Algebren erfüllen müssen, ist die Abgeschlossenheit der Operatoren ‚,‘ und ‚-‘. Verknüpfen wir zwei Elemente x, y ∈ V , so erhalten wir mit x , y und x - y stets ein Element aus V zurück. In der Mengenalgebra ist diese Eigenschaft sogar dann erfüllt, wenn wir unendlich viele Elemente miteinander verknüpfen. Daher können wir die Operatorendefinition gefahrlos auf beliebige Teilmengen M ⊆ V ausdehnen:
x :=
x∈M
x
(Infimum von M)
x
(Supremum von M)
{ 0, 2, 4, 6, … }, { 1, 3, 5, 7, … }, { 1, 2, 4, 8, 16, … }, { 2, 3, 5, 7, 11, … }
Endliche Teilmengen, z.B.:
Komplemente der endlichen Teilmengen, z.B:
{ 0 }, { 1 }, { 2 }, { 0, 1 }
{ 1, 2, 3, … }, { 0, 2, 3, … }, { 0, 1, 3, … }, { 2, 3, … }
x∈M
x∈M
"
!
Teilmengen der natürlichen Zahlen, z.B.:
x :=
|M| < |
|
x∈M
|M \
Die Struktur der Potenzmenge stellt hier sicher, dass sowohl das Supremum als auch das Infimum für jede beliebige Teilmenge M ⊆ V stets ein Element von V ist. Boolesche Algebren mit dieser Eigenschaft heißen vollständig. Alle booleschen Algebren mit einer endlichen Grundmenge V sind offensichtlich vollständig, genauso wie sämtliche Mengenalgebren. Unweigerlich drängt sich an dieser Stelle die Frage auf, ob überhaupt boolesche Algebren existieren, die unvollständig sind? Die Antwort lautet Ja! Eine solche Struktur können wir mit wenig Mühe aus der Mengenalgebra erhalten. Hierzu entfernen wir einige Elemente aus V so geschickt, dass die Huntington’schen Axiome immer noch erfüllt sind, aber nicht mehr jede Teilmenge ein Infimum oder ein Supremum besitzt. Das folgende Beispiel demonstriert, wie dies gelingen kann. Wir wählen die natürlichen Zahlen als Trägermenge und definieren V als V := {M ∈ 2N | |M| < |N|} ∪ {M ∈ 2N | |N \ M| < |N|} In Worten ist eine Teilmenge M der natürlichen Zahlen genau dann in V enthalten, wenn M oder ihr Komplement N\M endlich ist (Abbildung 7.25). Es lässt sich leicht nachprüfen, dass wir mit (V, ∩, ∪) immer noch eine boolesche Algebra vor uns haben. Die Elemente ⊥ = 0/ und + = N sind in V verblieben, und für jedes x ∈ V ist auch das inverse
|M| < | |M \
|<|
|<|
|
| |
Grundbereich Abbildung 7.25: Konstruktion des Grundbereichs einer unvollständigen booleschen Algebra
374
7 Modelltheorie Element x−1 immer noch ein Element von V . Ferner führen die Mengenoperationen , und - niemals aus der Menge V heraus, so dass alle vier Huntington’schen Axiome weiterhin erfüllt sind. Anders als die bisher betrachteten Algebren ist (V, ∩, ∪) aber nicht mehr vollständig. Beispielsweise ist M := {{0}, {2}, {4}, {6}, . . .} eine Teilmenge von V , das Supremum
x = {0, 2, 4, 6, . . .}
x∈M
aber nicht in V enthalten, da weder die Menge {0, 2, 4, 6, . . .} noch ihr Komplement {1, 3, 5, 7, . . .} endlich ist. Es sind ausschließlich die vollständigen booleschen Algebren, die für unsere Betrachtungen in diesem Abschnitt wichtig sind. Warum dies so ist, wird sich weiter unten fast von selbst begründen. Alle wichtigen Begriffe sind nun eingeführt. Damit ist es an der Zeit, den Begriff des booleschen Modells formal zu definieren:
Definition 7.2 (Boolesches Modell) Sei Σ = (VΣ , FΣ , PΣ ) eine prädikatenlogische Signatur. Ein boolesches Modell über Σ ist ein Tripel (B,U, I) mit den folgenden Eigenschaften: I
B ist eine vollständige boolesche Algebra (V, ,, -).
I
U ist eine beliebige nichtleere Menge.
I
I ist eine Abbildung, die
• jedem n-stelligen Funktionssymbol f ∈ FΣ eine Funktion I( f ) : U n → U und
• jedem n-stelligen Prädikatsymbol P ∈ PΣ eine Funktion I(P) : U n → V zuordnet.
Wie im zweiwertigen Fall bezeichnen wir die Menge U als Individuenbereich, Grundmenge oder Universum, und auch hier schließt die Festlegung 0-stellige Symbole ein. Konkret verbirgt sich hinter einem 0-stelligen Funktionssymbol ein einzelnes Element des Individuenbereichs (eine Konstante), und ein 0-stelliges Prädikatsymbol steht für einen atomaren Wahrheitswert.
375
7.4 Boolesche Modelle
Analog zum zweiwertigen Fall erweitern wir die Abbildung I induktiv auf variablenfreie Terme. Dies geschieht wie gewohnt: I( f (σ1 , . . . , σn )) := I( f )(I(σ1 ), . . . , I(σn )) Der Unterschied zwischen gewöhnlichen prädikatenlogischen Interpretationen und booleschen Modellen besteht darin, dass die Wahrheitswerte nicht länger aus einer zweielementigen Menge stammen müssen, sondern beliebige Elemente einer booleschen Algebra in Frage kommen. Im booleschen Fall ergibt es daher zunächst keinen Sinn, von wahren und von falschen Aussagen zu sprechen. Aus diesem Grund definieren wir die Semantik einer Formel jetzt nicht mehr über eine Modellrelation ‚|=‘, sondern, analog zu Gleichung 7.12, über eine Funktion ϕ(B,U,I) , die jeder geschlossenen Formel einen Wahrheitswert aus der Grundmenge der booleschen Algebra B zuweist. Definition 7.3 (Boolesche Semantik) ϕ und ψ seien geschlossene prädikatenlogische Formeln und (B,U, I) ein boolesches Modell. Die boolesche Semantik einer Formel ϕ ist durch die Modellfunktion ϕ(B,U,I) gegeben, die induktiv über dem Formelaufbau definiert ist: 1(B,U,I) := + 0(B,U,I) := ⊥ P(σ1 , . . . , σn )(B,U,I) := I(P)(I(σ1 ), . . . , I(σn )) ¬ϕ(B,U,I) := ϕ(B,U,I) −1 ϕ ∧ ψ(B,U,I) := ϕ(B,U,I) , ψ(B,U,I) ϕ ∨ ψ(B,U,I) := ϕ(B,U,I) - ψ(B,U,I) ϕ → ψ(B,U,I) := ϕ(B,U,I) −1 - ψ(B,U,I) ϕ ↔ ψ(B,U,I) := ϕ → ψ(B,U,I) , ψ → ϕ(B,U,I) ϕ ψ(B,U,I) := ϕ ↔ ψ(B,U,I) −1 ∀ ξ ϕ(B,U,I) := ϕ(B,U,I[ξ /u] ) u∈U
∃ ξ ϕ(B,U,I) :=
"
u∈U
ϕ(B,U,I[ξ /u] )
Im Fogenden schreiben wir nur noch ϕ anstatt ϕ(B,U,I) , falls klar ist, auf welches boolesche Modell wir vor uns beziehen.
376
7 Modelltheorie
ψ = + (für alle Axiome ψ) ϕ = + ϕ = ⊥
Boolesches Modell
Gewöhnliches Modell
Gewöhnliches Modell
(U1 , I1 ) |= ϕ
(U2 , I2 ) |= ϕ
Abbildung 7.26: Um die Unabhängigkeit einer Formel ϕ zu beweisen, wird ein boolesches Modell konstruiert, in dem alle Axiome wahr sind, ϕ dagegen weder wahr noch falsch ist. Im nächsten Schritt werden hieraus zwei gewöhnliche Modelle gewonnen. Die Konstruktion verläuft so, dass ϕ in einem dieser Modelle wahr und in dem anderen falsch ist. Damit ist der Beweis erbracht, dass aus den Axiomen weder ϕ noch ¬ϕ logisch gefolgert werden können.
Aus der Definition geht unmittelbar hervor, warum wir in unsere Betrachtung ausschließlich vollständige boolesche Algebren einbeziehen können. Nur so ist gewährleistet, dass ∀ ξ ϕ und ∃ ξ ϕ immer einen definierten Wert annehmen. Weiter oben wurde bereits darauf hingewiesen, dass wir im booleschen Fall nicht mehr ohne Weiteres von wahren und von falschen Formeln sprechen können. Eine Ausnahme liegt dann vor, wenn die Modellfunktion einen der Werte ⊥ oder + ergibt. Es ist legitim, + als wahr und ⊥ als falsch anzusehen, und dies wollen wir auch sprachlich zum Ausdruck bringen. Wir sagen, eine Formel ϕ ist im Modell (B,U, I) wahr, wenn sie die Beziehung ϕ = + erfüllt. Ferner bezeichnen wir (B,U, I) als Modell für eine Theorie T , wenn alle Theoreme von T in diesem Modell wahr sind.
7.4.2
Ein einfacher Unabhängigkeitsbeweis
In diesem Abschnitt wollen wir herausarbeiten, wie sich mit booleschen Modellen Unabhängigkeitsbeweise führen lassen. Als formales System wählen wir die Theorie PA-I, die Peano-Arithmetik ohne Induktionsaxiom, und betrachten die Formel ϕ := ∃ x s(x) = x
(7.13)
Inhaltlich besagt ϕ, dass eine natürliche Zahl existiert, die ihr eigener Nachfolger ist. Im Standardmodell der Peano-Arithmetik ist diese Aussage ganz offensichtlich falsch, und sie lässt sich in PA auch formal widerlegen. In der Theorie PA-I ist ϕ dagegen unentscheidbar. Das bedeutet, dass sich ohne das Induktionsaxiom weder ϕ noch ¬ϕ beweisen lassen. Mithilfe eines booleschen Modells sind wir in der Lage, diese Behauptung zu belegen. Wir führen den Unabhängigkeitsbeweis in zwei Schritten (Abbildung 7.26): I
Im ersten Schritt erstellen wir für die Theorie PA-I ein boolesches Modell (B,U, I). Es wird so gestaltet sein, dass alle Axiome von PA-I wahr und deren Negationen falsch sind. Ist ψ ein Axiom, so gilt in unserem Modell daher immer ψ = + und ¬ψ = ⊥. Ferner wird der Formel ϕ ein Wahrheitswert zugewiesen, der zwischen ⊥ und + liegt. Das bedeutet, dass ϕ in unserem booleschen Modell weder wahr noch falsch ist.
I
Im zweiten Schritt werden wir (B,U, I) in zwei gewöhnliche Modelle (U1 , I1 ) und (U2 , I2 ) von PA-I übersetzen. Die Konstruktion wird
377
7.4 Boolesche Modelle
so erfolgen, dass die Formel ϕ unter der Interpretation (U1 , I1 ) wahr und unter der Interpretation (U2 , I2 ) falsch ist. Hieraus folgt, dass ϕ unabhängig von den Axiomen sein muss und damit weder ϕ noch ¬ϕ innerhalb von PA-I bewiesen werden können. Wir wollen keine Zeit verlieren und umgehend mit der Konstruktion von (B,U, I) beginnen. Für B wählen wir die boolesche Algebra B := (V, ∩, ∪) mit V := 2{1,2} = {0, / {1}, {2}, {1, 2}} und legen die Individuenmenge U folgendermaßen fest:
0
2
...
3
...
4
...
= ((x1 , y1 ) · (x2 , y2 )) + (x1 , y1 )
(7.15) (7.16) (7.17)
(7.18)
Um die Semantik des Gleichheitsoperators zu definieren, nehmen wir an, σ und τ seien zwei Terme mit I(σ ) = (x1 , y1 ) und I(τ) = (x2 , y2 ). Wir legen fest: ⎧ {1, 2} falls x1 = x2 und y1 = y2 ⎪ ⎪ ⎪ ⎨{1} falls x1 = x2 und y1 = y2 σ = τ := ⎪ {2} falls x1 − x2 = y1 − y2 = 0, x1 = y1 ⎪ ⎪ ⎩ 0/ sonst
...
(x1 , y1 ) · (0,0) = (x1 · 0, y1 · 0) = (0, 0) (x1 , y1 ) · s((x2 , y2 )) = (x1 · (x2 + 1), y1 · (y2 + 1)) = (x1 · x2 + x1 , y1 · y2 + y1 )
(7.14)
...
s((0,0)) = (0 + 1, 0 + 1) = (1,1) (x1 , y1 ) + (0,0) = (x1 + 0, y1 + 0) = (x1 , y1 ) (x1 , y1 ) + s((x2 , y2 )) = (x1 + x2 + 1, y1 + y2 + 1) = s((x1 , y1 ) + (x2 , y2 ))
x
...
...
Mit dieser Vereinbarung gelten die folgenden Rechenregeln:
4
1
...
s((x1 , y1 )) := (x1 + 1, y1 + 1) (x1 , y1 ) + (x2 , y2 ) := (x1 + x2 , y1 + y2 ) (x1 , y1 ) · (x2 , y2 ) := (x1 · x2 , y1 · y2 )
3
...
...
Das Element (0,0) repräsentiert das Nullelement, es ist also I(0) = (0,0). Die Nachfolgerfunktion, die Addition und die Multiplikation interpretieren wir in unserem booleschen Modell wie folgt (Abbildung 7.27):
2
0
y
U := N × N
1
Abbildung 7.27: Struktur des booleschen Modells (B,U, I). Das Element (0,0) repräsentiert die Null, und die Pfeile markieren die Nachfolgerbeziehung.
378
I
7 Modelltheorie
σ = τ für den Fall I(σ ) = (3,2)
4
x
0
∅
{2}
∅
{1}
∅
...
1
∅
∅
{2} {1}
∅
...
2
∅
∅
∅ {1,2} ∅
...
3
∅
∅
∅
{1} {2}
...
∅
...
...
4
∅
∅
∅
{1}
y
...
3
...
2
...
1
...
0
Ordnen wir die Elemente aus U, wie wir es in Abbildung 7.27 getan hatten, zweidimensional an, so können wir der Gleichheitsrelation eine intuitive Bedeutung verleihen: I
Das Element {1} ist genau dann in σ = τ enthalten, wenn sich σ und τ in der gleichen Spalte befinden.
I
Das Element {2} ist genau dann in σ = τ enthalten, wenn σ und τ gleich sind oder sich auf der gleichen Diagonalen, aber nicht auf der Hauptdiagonalen, befinden.
Abbildung 7.28 demonstriert die Gleichheitsbeziehung an zwei konkreten Beispielen. Ganz offensichtlich gelten die folgenden Beziehungen, die wir weiter unten benötigen werden: σ = σ = {1, 2}
I
(7.19)
0 = s(σ ) = 0/ s(σ ) = s(τ) = σ = τ
σ = τ für den Fall I(σ ) = (2,2)
2
3
4
x
0
∅
∅
{1}
∅
∅
...
1
∅
∅
{1}
∅
∅
...
2
∅
∅ {1,2} ∅
∅
...
3
∅
∅ {1}
∅
∅
...
4
∅
∅ {1}
∅
∅
...
y
...
...
...
...
1
...
0
(7.20) (7.21)
Als nächstes werden wir nachweisen, dass (B,U, I) ein Modell von PA-I ist. Hierzu müssen wir zeigen, dass alle Theoreme von PA-I über die Modellfunktion ϕ auf den Wahrheitswert + = {1,2} abgebildet werden. Für die Logikaxiome ist dies leicht einzusehen, und ganz offensichtlich wird diese Eigenschaft durch die Schlussregeln erhalten. Genauer hinsehen müssen wir bei den Theorieaxiomen, schließlich sind sie die einzigen, in denen die speziellen Symbole ‚0‘, ‚s‘, ‚+‘ und ‚ב der Peano-Arithmetik überhaupt vorkommen. I
σ = τ → (σ = ρ → τ = ρ)
Axiom (S1) Für dieses Axiom ist
(S1) = σ = τ−1 ∪ σ = ρ−1 ∪ τ = ρ Dass der Ausdruck immer den Wert + annimmt, folgt aus der in Tabelle 7.2 vorgenommenen Fallunterscheidung. In den ersten beiden Spalten sind sämtliche Kombinationen der Teilausdrücke σ = τ und σ = ρ aufgelistet. Die dritte und die vierte Spalte enthalten die Werte σ = τ−1 und σ = ρ−1 . Die fünfte Spalte zeigt, welche Werte für den Teilausdruck τ = ρ in Frage kommen, und in der sechsten Spalte ist der Ergebniswert (S1) eingetragen.
Abbildung 7.28: Boolesche Semantik des Gleichheitsoperators
I
σ = τ → s(σ ) = s(τ)
Axiom (S2) (S2) = σ = τ
−1
∪ s(σ ) = s(τ)
= σ = τ−1 ∪ σ = τ = +
wegen (7.21)
379
7.4 Boolesche Modelle
σ = τ
σ = ρ
σ = τ−1
σ = ρ−1
τ = ρ
(S1)
0/ 0/ 0/ 0/ {1} {1} {1} {1} {2} {2} {2} {2} {1, 2} {1, 2} {1, 2} {1, 2}
0/ {1} {2} {1, 2} 0/ {1} {2} {1, 2} 0/ {1} {2} {1, 2} 0/ {1} {2} {1, 2}
{1, 2} {1, 2} {1, 2} {1, 2} {2} {2} {2} {2} {1} {1} {1} {1} 0/ 0/ 0/ 0/
{1, 2} {2} {1} 0/ {1, 2} {2} {1} 0/ {1, 2} {2} {1} 0/ {1, 2} {2} {1} 0/
0/ oder {1} oder {2} oder {1, 2} 0/ oder {2} 0/ oder {1} 0/ 0/ oder {2} {1} oder {1, 2} 0/ {1} 0/ oder {1} 0/ {2} oder {1, 2} {2} 0/ {1} {2} {1, 2}
{1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2} {1, 2}
Tabelle 7.2: Fallunterscheidung für das Axiom (S1). Für alle Kombinationen ist (S1) = {1, 2} = + und das Axiom damit in unserem booleschen Modell wahr. I
¬(0 = s(σ ))
Axiom (S3) (S3) = 0 = s(σ )
−1
= 0 / −1 = +
I
wegen (7.20) s(σ ) = s(τ) → σ = τ
Axiom (S4) (S4) = s(σ ) = s(τ) = σ = τ = +
I
−1
−1
∪ σ = τ
∪ σ = τ
Axiom (S5) (S5) = σ + 0 = σ = σ = σ = +
I
Axiom (S6) (S6) = σ + s(τ) = s(σ + τ) = s(σ + τ) = s(σ + τ) = +
wegen (7.21) σ +0 = σ wegen (7.15) wegen (7.19) σ + s(τ) = s(σ + τ) wegen (7.16) wegen (7.19)
380
7 Modelltheorie
I
σ ×0 = 0
Axiom (S7) (S7) = σ × 0 = 0 = 0 = 0 = +
I
wegen (7.17) wegen (7.19) σ × s(τ) = (σ × τ) + σ
Axiom (S8) (S8) = σ × s(τ) = (σ × τ) + σ = (σ × τ) + σ = (σ × τ) + σ = +
wegen (7.18) wegen (7.19)
Wir kommen jetzt zu unserem eigentlichen Vorhaben zurück: dem Beweis, dass die Formel ϕ := ∃ x s(x) = x innerhalb von PA-I unbeweisbar ist. Als erstes wollen wir uns davon überzeugen, dass ϕ in unserem Modell weder wahr noch falsch ist. Mit der gewählten Interpretation des Gleichheitszeichens erhalten wir ∃ x s(x) = x(B,U,I) =
u∈U
s(x) = x(B,U,I[x/u] ) = {2}
(7.22)
Als nächstes werden wir herausarbeiten, wie aus einem booleschen Modell (B,U, I) gewöhnliche prädikatenlogische Interpretationen (Ui , Ii ) gewonnen werden können. Die Transformation wollen wir so gestalten, dass die Wahrheit oder die Falschheit einer Aussage nicht zerstört wird; wahre Aussagen sollen wahr und falsche Aussagen falsch bleiben: I
Für alle Formeln ψ mit ψ(B,U,I) = + gilt (Ui , Ii ) |= ψ.
I
Für alle Formeln ψ mit ψ(B,U,I) = ⊥ gilt (Ui , Ii ) |= ψ.
Für die Formeln ψ mit ψ = {1} oder ψ = {2} wollen wir frei entscheiden können, ob sie in (Ui , Ii ) wahr oder falsch sind. Zu diesem Zweck definieren wir eine Menge Fi , die genau diejenigen Wahrheitswerte umfasst, die in (Ui , Ii ) zu wahren Aussagen führen sollen: ϕ ∈ Fi ⇔ (Ui , Ii ) |= ϕ
(7.23)
Die Menge Fi entscheidet maßgeblich über die Struktur des neuen Modells. Sie fixiert die Wahrheitswerte von allen Formeln, die im booleschen Modell weder wahr noch falsch sind.
381
7.4 Boolesche Modelle
An dieser Stelle kommt ein zentrales Ergebnis der booleschen Modelltheorie zum Tragen. Es besagt, dass die Konstruktion für die von uns gewählte boolesche Algebra genau dann funktioniert, wenn Fi ein Ultrafilter auf der Menge {1, 2} ist [28]. Ultrafilter sind uns aus Abschnitt 7.2.2 bestens bekannt, allerdings haben wir dort nur von Filtern auf den natürlichen Zahlen Gebrauch gemacht. Glücklicherweise können wir die Filterdefinitionen eins zu eins auf eine beliebige Menge M übertragen. Demnach ist eine Menge Fi ein Ultrafilter für M = {1, 2}, wenn sie die folgenden Eigenschaften erfüllt:
I Erster Ultrafilter
F1 = {{1, 2}, {1}}
{ 1, 2 } {1}
{2} ∅
I
0/ ∈ F, {1, 2} ∈ F
I
M, N ∈ F ⇒ M ∩ N ∈ F
I
M ∈ F, N ⊃ M ⇒ N ∈ F
I
M ⊆ {1, 2} ⇒ (M ∈ F ⇔ {1, 2} \ M ∈ F)
I Zweiter Ultrafilter
F2 = {{1, 2}, {2}}
{ 1, 2 }
Für die Menge {1, 2} existieren mit F1 = {{1, 2}, {1}} und F2 = {{1, 2}, {2}} genau zwei Ultrafilter (Abbildung 7.29). Mit einem Ultrafilter F können wir ein boolesches Modell in ein gewöhnliches Modell übersetzen, indem wir die Individuenelemente zu Äquivalenzklassen zusammenfassen. Welcher Klasse ein Element angehört, wird über die folgende Äquivalenzrelation festgelegt: x ∼F y ⇔ x = y(B,U,I[x/x,y/y] ) ∈ F Hierin sind x, y zwei beliebige Elemente aus dem Individuenbereich des booleschen Modells. Heben wir die Semantik der Symbole ‚0‘, ‚s‘, ‚+‘ und ‚ב in gewohnter Weise auf die Ebene der Äquivalenzklassen, so erhalten wir eine gewöhnliche prädikatenlogische Interpretation, die sogenannte Quotienteninterpretation (B,U, I)/F . Um unseren Unabhängigkeitsbeweis abzuschließen, müssen wir jetzt lediglich die Quotienten (B,U, I)/F1 und (B,U, I)/F2 bilden. Als Ergebnis erhalten wir zwei prädikatenlogische Interpretationen, die wegen (7.22) und (7.23) die folgenden Beziehungen erfüllen: (B,U, I)/F1 | = ∃ x s(x) = x (B,U, I)/F2 |= ∃ x s(x) = x
(7.24) (7.25)
So weit zur Theorie. Aber wie sehen diese Interpretationen konkret aus? Wir wissen im Moment lediglich, dass in einer von beiden ein Element existiert, das sein eigener Nachfolger ist, und in der anderen nicht. Abbildung 7.30 lüftet das Geheimnis und zeigt, dass die Beziehungen (7.24) und (7.25) in den jeweiligen Modellen tatsächlich gelten.
{1}
{2} ∅
Abbildung 7.29: Die beiden Ultrafilter der Menge {1, 2}
382
I
7 Modelltheorie
Quotienteninterpretation (B,U, I)/F1
0
1
2
3
4
I
x
0
...
1
...
2
...
3
...
4
...
(B,U, I)/F1 |= ∃ x s(x) = x I
...
...
...
...
...
y
...
Die Quotienteninterpretation (B,U, I)/F1 ist in der oberen Hälfte von Abbildung 7.30 zu sehen. Da der Ultrafilter F1 sowohl das Element {1} als auch das Element {1, 2} enthält, werden alle Elemente spaltenweise zu einer Äquivalenzklasse zusammengefasst. Das bedeutet, dass jede Spalte ein einzelnes Element repräsentiert. Ganz offensichtlich ist der Quotient (B,U, I)/F1 isomorph zur Standardinterpretation der Peano-Arithmetik, und in diesem Modell gibt es kein Element, das sein eigener Nachfolger ist. Die Quotienteninterpretation (B,U, I)/F2 ist in der unteren Hälfte von Abbildung 7.30 zu sehen. Hier finden wir auf der Hauptdiagonalen die Struktur der natürlichen Zahlen wieder, während alle anderen Diagonalen zu einem einzigen Element verschmolzen sind. Auch diese Interpretation ist ein Modell von PA-I, allerdings ist die Formel ∃ x s(x) = x jetzt tatsächlich wahr. Alle Elemente außerhalb der Hauptdiagonalen sind ihre eigenen Nachfolger. (B,U, I)/F2 |= ∃ x s(x) = x
I
Quotienteninterpretation (B,U, I)/F2
0
1
2
3
4
x
0
...
1
...
2
...
3
...
4
... ...
...
...
...
...
...
y
...
Abbildung 7.30: Vergleich der beiden Quotienteninterpretationen (B,U, I)/F1 und (B,U, I)/F2
Damit haben wir den Beweis in Händen, dass die Formel ϕ innerhalb von PA-I, der Peano-Arithmetik ohne Induktionsaxiom, nicht bewiesen werden kann. Sie ist keine logische Folgerung aus den Axiomen und damit innerhalb dieser Theorie unentscheidbar. Obwohl wir uns in diesem Abschnitt nur einen kleinen Schritt in die Welt der booleschen Modelle vorgewagt haben, wird die volle Eleganz der zugrunde liegenden Methodik sichtbar. Die Ultrafilterkonstruktion können wir als ein technisches Vehikel begreifen, mit dem sich die Wahrheit gewisser Formeln ϕ an- oder abschalten lässt. Gelingt die Konstruktion, so ist sichergestellt, dass ϕ unabhängig von den Axiomen ist und nicht innerhalb des betrachteten formalen Systems bewiesen werden kann. Einen ganz ähnlichen Ansatz hat Paul Cohen verfolgt, um die Unabhängigkeit der Kontinuumshypothese (CH) und des Auswahlaxioms (AC) zu zeigen. Mithilfe der eigens dafür entwickelten Forcing-Methode konnte er Quotientenmodelle für die ZermeloFraenkel-Mengenlehre generieren, in denen sich CH und AC in demselben Sinne an- und abschalten lassen wie unsere Formel ϕ in PA-I. Der voreilige Leser sei dennoch gewarnt. Eine entsprechende Konstruktion in der Mengenlehre durchzuführen, ist kompliziert und mit vielerlei technischen Schwierigkeiten behaftet. Unser zaghafter Vorstoß, den wir in die Theorie der booleschen Modelle gewagt haben, ist nicht mehr als ein erster Schritt zum Verständnis der historisch bedeutsamen Unabhängigkeitsbeweise. Derjenige, der die vollständige Route nicht scheut, findet in Paul Cohens Buch einen wertvollen Wegbegleiter [34].
383
7.5 Übungsaufgaben
7.5
Übungsaufgaben
In dieser Übungsaufgabe wollen wir die Prädikatenlogik erster Stufe verwenden, um gerichtete Graphen zu beschreiben. Hierzu fassen wir die Individuenmenge U einer Interpretation (U, I) als die Knotenmenge eines Graphen auf und legen über das zweistellige Prädikatzeichen E fest, ob zwischen zwei Knoten x und y eine Kante verläuft. Das folgende Beispiel verdeutlicht den Zusammenhang zwischen Interpretationen und Graphen: I
Interpretation (U, I)
I
Graph G
a
U := {a, b, c, d} I(E) := {(a, b), (b, a), (b, c), (c, b), (d, a), (d, c)}
b
d
c
Ferner sei die folgende Liste von prädikatenlogischen Formeln erster Stufe gegeben: ϕ1 := ¬E(a, b) ϕ2 := ¬∃ z1 (E(a, z1 ) ∧ E(z1 , b)) ϕ3 := ¬∃ z1 ∃ z2 (E(a, z1 ) ∧ E(z1 , z2 ) ∧ E(z2 , b)) . . . := . . . a und b sind Konstantensymbole. a) Welche intuitive Bedeutung besitzt die Formel ϕn ? b) Die Eigenschaft, ein zusammenhängender Graph zu sein, ist nicht innerhalb der Prädikatenlogik erster Stufe definierbar. Beweisen Sie diese Behauptung, indem Sie zeigen, dass keine PL1-Formel ϕ mit der folgenden Eigenschaft existiert: (U, I) |= ϕ ⇔ (U, I) beschreibt einen zusammenhängenden Graphen Hinweis: Ein Graph heißt zusammenhängend, wenn für zwei beliebig gewählte Knoten x und y stets ein Pfad von x nach y existiert. Ein Pfad von x nach y ist eine endliche Folge von Kanten, die x und y in der gewünschten Richtung miteinander verbinden.
Aufgabe 7.1 Webcode 7731
384
Aufgabe 7.2 Webcode 7145
7 Modelltheorie
K sei ein formales System, in dem sich arithmetische Aussagen ableiten lassen. Wir nehmen an, K erfüllt die folgende Eigenschaft: ϕ ⇔ |= ϕ I
Theoreme von K sind z. B. 1 + 1 = 3, ∃ x ∀ y x > y, ¬∃ y 1 + y = 2, . . .
I
Keine Theoreme von K sind z. B. 1 + 1 = 2, ∀ x ∃ y x ≤ y, ∃ y 1 + y = 2, . . .
K ist der perfekte Lügner, da genau diejenigen arithmetischen Formeln aus den Axiomen abgeleitet werden können, die im Standardmodell der Peano-Arithmetik falsch sind. a) Lassen sich die Symbole ‚s‘, ‚=‘, ‚+‘ und ‚ב so uminterpretieren, dass K ein Modell besitzt? b) Kann ein formales System mit der postulierten Eigenschaft überhaupt existieren?
Aufgabe 7.3 Webcode 7878
Sei ϕ eine Formel der Prädikatenlogik erster Stufe mit Gleichheit. Sind die folgenden Aussagen richtig oder falsch? Begründen Sie Ihre Antworten. a) Hat ϕ ein endliches Modell, dann hat ϕ auch ein unendliches Modell. b) Hat ϕ ein unendliches Modell, dann hat ϕ auch ein endliches Modell. c) Lassen sich a) oder b) mithilfe des Satzes von Löwenheim-Skolem-Tarski beantworten?
Aufgabe 7.4 Webcode 7000
Der Satz von Euklid besagt, dass es unendlich viele Primzahlen gibt. Hieraus folgt, dass keine natürliche Zahl x existieren kann, die von jeder Primzahl geteilt wird. Innerhalb der Peano-Arithmetik können wir den Sachverhalt folgendermaßen ausdrücken: ϕ := ¬∃ x ∀ y (prime(y) → y | x) Ganz offensichtlich ist die Formel ϕ im Standardmodell der Peano-Arithmetik eine wahre Aussage. Wie üblich nehmen wir an, die Peano-Arithmetik sei frei von Widersprüchen. I
Zeigen Sie, dass ϕ nicht innerhalb der Peano-Arithmetik bewiesen werden kann.
I
Ist die Unbeweisbarkeit von ϕ eine Folge des Gödel’schen Unvollständigkeitssatzes?
385
7.5 Übungsaufgaben
In der von uns gewählten Formulierung gilt der Modellexistenzsatz auch für die Prädikatenlogik mit Gleichheit. Beschränken wir uns auf die PL1 ohne Gleichheit, so können wir ihn sogar geringfügig verschärfen:
Aufgabe 7.5 Webcode 7304
Satz 7.11 (Modellexistenz der PL1 ohne Gleichheit) Sei K eine Theorie erster Ordnung. Dann gilt: I
K hat ein abzählbares Modell ⇔ K ist widerspruchsfrei
Der Unterschied ist unscheinbar, aber dennoch bemerkenswert: In der Prädikatenlogik ohne Gleichheit können wir aus der Widerspruchsfreiheit nicht nur die Existenz eines Modells, sondern die Existenz eines abzählbaren Modells folgern. a) Welche Konsequenzen ergeben sich hieraus für den Satz von Löwenheim-Skolem-Tarski? b) Zeigen Sie, dass die vorgenommene Verallgemeinerung nicht für die Prädikatenlogik mit Gleichheit gilt.
Sei M := {N ⊆ N | 1 ∈ N}
Aufgabe 7.6 Webcode 7837
a) Welche der folgenden Aussagen sind wahr? Welche sind falsch? Wahr I
M ist ein Filter.
I
M ist ein maximaler Filter.
I
M ist ein Ultrafilter.
I
M ist ein freier Ultrafilter.
Falsch
b) Sei F ein Ultrafilter. Was lässt sich über seine Elemente aussagen, wenn wir wissen, dass die Menge {1} in ihm enthalten ist?
386
Aufgabe 7.7 Webcode 7481
7 Modelltheorie
In dieser Aufgabe sind E1 und E2 zwei Enumeratoren mit E1 := {5, 8, 9, 18, 19, 25, 33} E2 := {8, 12, 19, 23, 24, 25, 31, 32, 39, 49, 60} a) Erzeugen Sie jeweils eine Matrixdarstellung von E1 und von E2 : 0
1
2
3
4
5
0
x
1
2
3
4
5
x
0
...
0
...
1
...
1
...
2
...
2
...
3
...
3
...
4
...
4
...
5 20 y
.. .
26
33
41
50
60
...
5 20
.. .
.. .
.. .
.. .
.. .
..
y
.
.. .
26
33
41
50
60
...
.. .
.. .
.. .
.. .
.. .
..
.
b) Für welche der folgenden Mengen ist E1 bzw. E2 ein Enumerator?
Aufgabe 7.8 Webcode 7988
/ {2, 3}, {2, 4}} M1 := {0,
M3 := {{2, 3}, {2, 4}}
M2 := {0, / {2, 3}, {2, 4}, {3, 4}, {3, 4, 5}}
M4 := {{2, 3}, {2, 4}, {3, 4}, {3, 4, 5}}
In Abschnitt 7.3 haben wir explizit festgelegt, dass ein Enumerator einer Menge M auch ein Enumerator für alle Teilmengen von M ist. Nehmen Sie für den Moment an, wir hätten auf die Teilmengenregel verzichtet. Dann wäre eine Menge E ∈ 2N genau dann ein Enumerator für eine Menge M ⊂ 2N , wenn M exakt diejenigen Mengen enthält, die in der Matrixdarstellung von E vorkommen. Die Menge E = {0, 4, 12, 24, 40, 60} wäre also ausschließlich ein Enumerator für die Menge M = {{0}, {1}, {2}, {3}, {4}, {5}}
387
0
1
2
3
4
5
x
0
0
1
3
6
10
15
...
1
2
4
7
11
16
22
...
2
5
8
12
17
23
30
...
3
9
13
18
24
31
39
...
4
14
19
25
32
40
49
...
5
20
26
33
41
50
60
...
y
↑
↑
↑
↑
↑
↑
..
{0}
{1}
{2}
{3}
{4}
{5}
7.5 Übungsaufgaben
.
Auf den ersten Blick scheint diese Definition unsere intuitive Vorstellung eines Enumerators besser zu erfassen als die ursprüngliche, und dennoch haben wir sie bewusst nicht verwendet. Welche Gründe könnte es hierfür geben?
a) Bildet das Tripel (20/ , ∩, ∪) eine boolesche Algebra? b) Zeigen Sie, dass keine boolesche Algebra (V, ,, -) existiert, die eine endliche Grundmenge V mit einer ungeraden Anzahl an Elementen besitzt.
Die nachfolgende Liste enthält eine Reihe von Gesetzmäßigkeiten, die in jeder booleschen Algebra gelten müssen. Zeigen Sie, dass sich alle Gesetze aus den vier Huntington’schen Axiomen ableiten lassen. I
Assoziativgesetze
I
x - (y - z) = (x - y) - z x , (y , z) = (x , y) , z I
Gesetze von De Morgan (x - y)−1 = x−1 , y−1 (x , y)−1 = x−1 - y−1
Idempotenzgesetze
I
x-x = x x,x = x I
Eliminationsgesetze x-+ = + x,⊥ = ⊥
Absorptionsgesetze x - (x , y) = x x , (x - y) = x
I
Doppelnegationsgesetz −1
(x−1 )
=x
Aufgabe 7.9 Webcode 7111
Aufgabe 7.10 Webcode 7573
388
Aufgabe 7.11 Webcode 7954
7 Modelltheorie
Sei (B,U, I) ein boolesches Modell einer Theorie T . Ferner sei ϕ ein Theorem von T . a) Ergänzen Sie die nachstehenden Gleichungen und begründen Sie Ihre Angaben. ϕ(B,U,I)
¬ϕ(B,U,I) =
=
b) Angenommen, die Theorie T sei negationsvollständig und ψ eine beliebige Formel in der Sprache von T . Was können Sie über den Wert ψ(B,U,I) aussagen?
Aufgabe 7.12 Webcode 7054
In Abschnitt 7.4.2 haben wir ein boolesches Modell für die Theorie PA-I, die PeanoArithmetik ohne Induktionsaxiom, erzeugt und damit die Unabhängigkeit der folgenden Formel bewiesen: ϕ := ∃ x s(x) = x
(7.26)
a) Wir wollen versuchen, den Beweis in einem einfacheren booleschen Modell zu wiederholen. In diesem Modell ist die Gleichheitsrelation folgendermaßen definiert: ⎧ {1, 2} falls x1 = x2 und y1 = y2 ⎪ ⎪ ⎪ ⎨{1} falls x1 = x2 und y1 = y2 σ = τ := ⎪ {2} falls x1 = x2 und y1 = y2 ⎪ ⎪ ⎩ 0/ falls x1 = x2 und y1 = y2 Unter dieser Interpretation des Gleichheitszeichens führt die Quotientenbildung zu dem folgenden Ergebnis:
0
1
2
3
4
x
0
1
2
3
4
x
0
...
0
...
1
...
1
...
2
...
2
...
3
...
3
...
4
...
4
... ...
...
...
...
y
...
...
...
...
...
...
y
389
7.5 Übungsaufgaben
Offenbar sind jetzt beide Quotienteninterpretationen isomorph zur Standardinterpretation der Peano-Arithmetik, und die Formel ϕ ist damit in beiden Modellen falsch. Warum hat der Unabhängigkeitsbeweis diesmal nicht funktioniert? b) Wir wollen versuchen, den Beweis zu retten, indem wir die Nachfolgerbeziehung in unserem booleschen Modell folgendermaßen interpretieren:
0
1
2
3
4
x
0
...
1
...
2
...
3
...
4
... ...
...
...
...
...
y
Jetzt führt die Quotientenbildung zu diesem Ergebnis:
0
1
2
3
4
x
0
1
2
3
4
x
0
...
0
...
1
...
1
...
2
...
2
...
3
...
3
...
4
...
4
... ...
...
...
...
y
...
...
...
...
...
...
y
Die linke Interpretation ist isomorph zur Standardinterpretation, die rechte nicht. Betrachten wir die rechte Interpretation genauer, so stellen wir fest, dass dort jedes Element sein eigener Nachfolger ist. Dies steht im Widerspruch zu ¬(0 = s(σ )), dem dritten Theorieaxiom der Peano-Arithmetik. Das Gesagte lässt nur einen Schluss zu: Entgegen unserer Erwartung ist die rechte Interpretation gar kein Modell von PA-I. Was ist bei der Quotientenbildung schief gegangen?
Literaturverzeichnis
[1]
Abian, A.: Nonstandard models for arithmetic and analysis. In: Studia Logica 33 (1974), Nr. 1, S. 11–22
Logic. Cambridge: Cambridge University Press, 1989 [15]
The Busy Beaver Game and the Meaning of Life. In: Brady, A. H.: The Universal Turing Machine: A Half Century Survey. Oxford: Oxford University Press, 1991, S. 259–277
[16]
Brady, G.: From Peirce to Skolem: A Neglected Chapter in the History of Logic. Amsterdam: Elsevier Scienceg, 2000 (Studies in the History and Philosophy of Mathematics)
[2]
Ackermann, W.: Zum Hilbert’schen Aufbau der reellen Zahlen. In: Mathematische Annalen 99 (1928), S. 118–133
[3]
Ackermann, W.: Zur Axiomatik der Mengenlehre. In: Mathematische Annalen 131 (1956), August, Nr. 4, S. 336–345
[4]
Aliprand, J.: The Unicode Standard Version 5.0. Boston, MA: Addison-Wesley, 2007
[17]
[5]
Amos, M.: Theoretical and Experimental DNA Computation. Berlin, Heidelberg, New York: Springer-Verlag, 2005
Burali-Forti, C.: Una questione sui numeri transfiniti. In: endiconti del Circolo Matematico di Palermo 11 (1897), S. 154–164
[18]
[6]
Baez, J.: This Week’s Finds in Mathematical Physics. http://math.ucr.edu/home/baez/ week236.html
Burger, E. B.; Tubbs, R.: Making Transcendence Transparent. Berlin, Heidelberg, New York: Springer-Verlag, 2004
[19]
[7]
Bauer, Andrej: Portraitphoto von Dana Scott. http://creativecommons.org/licenses/ by-sa/2.5/. – Creative Commons License 2.5, Typ: Attribution-ShareAlike
Cantor, G.: Über eine Eigenschaft des Inbegriffes aller reellen algebraischen Zahlen. In: Crelles Journal für Mathematik 77 (1874), S. 258–262
[20]
Cantor, G.: Über unendliche, lineare Punktmannigfaltigkeiten. 5. In: Mathematische Annalen 21 (1883), S. 545–591
[21]
Bernays, P.: A system of axiomatic set theory. II. In: Journal of Symbolic Logic 6 (1941)
Cantor, G.: Beiträge zur Begründung der transfiniten Mengenlehre. In: Mathematische Annalen 46 (1895), Nr. 4, S. 481–512
[22]
Boole, G.: The Mathematical Analysis of Logic, Being an Essay Toward a Calculus of Deductive Reasoning. Cambridge: Macmillan, 1847
Cantor, G.: Beiträge zur Begründung der transfiniten Mengenlehre (Zweiter Artikel). In: Mathematische Annalen 49 (1897), S. 207–246
[23]
Chaitin, G.: The Limits of Mathematics. Berlin, Heidelberg, New York: Springer-Verlag, 1998
[24]
Chaitin, G.: The Unknowable. Berlin, Heidelberg, New York: Springer-Verlag, 1999
[8]
[9] [10]
[11]
Bell, J. L.: Set Theory: Boolean-Valued Models and Independence Proofs in Set Theory. Oxford: Oxford University Press, 1985 (Oxford Logic Guides)
Boole, G.: An Investigation of the Laws of Thought. London: Walton and Maberley, 1854. – Nachgedruckt in [12]
[12]
Boole, G.; Corcoran, J.: The Laws of Thought (Reprint). New York: Prometheus Books, 2003
[25]
Chaitin, G.: Conversations with a Mathematician. Berlin, Heidelberg, New York: Springer-Verlag, 2002
[13]
Boolos, G. S.; Burgess, J. P.; Jeffrey, R. C.: Computability and Logic. Cambridge: Cambridge University Press, 2007
[26]
Chaitin, G.: Meta Maths: The Quest for Omega. London: Atlantic Books, 2007
[27]
[14]
Boolos, G. S.; Jeffrey, R. C.: Computability and
Chaitin, G. J.: On the Simplicity and Speed of Programs for Computing Infinite Sets of Natural
392
Literaturverzeichnis
Numbers. In: Journal of the ACM 16 (1969), Nr. 3, S. 407–422
Problem for Exponential Diophantine Equations. In: Annals of Mathematics 74 (1961), Nr. 3, S. 425–436
[28]
Chow, T. Y.: A beginner’s guide to forcing. In: Communicating Mathematics, Contemporary Mathematics 479 (2009), S. 25–40
[43]
Dawson, J. W.: The Compactness of First-Order Logic: From Gödel to Lindström. In: History and Philosophy of Logic 14 (1993), S. 15–37
[29]
Church, A.: A Note on the Entscheidungsproblem. In: Journal of Symbolic Logic 1 (1936), Nr. 1, S. 40–41
[44]
Dawson, J. W.: Kurt Gödel. Leben und Werk. Berlin, Heidelberg, New York: Springer-Verlag, 1999
[30]
Church, A.: An Unsolvable Problem of Elementary Number Theory. In: American Journal of Mathematics 58 (1936), Nr. 2, S. 345–363
[45]
Dedekind, R.: Was sind und was sollen die Zahlen? Braunschweig: Friedrich Vieweg und Sohn, 1888
[46]
[31]
Church, A.; Rosser, J. B.: Some properties of conversion. In: Transactions of the American Mathematical Society 39 (1936), S. 472–482
Deiser, O.: Einführung in die Mengenlehre. Berlin, Heidelberg, New York: Springer-Verlag, 2009
[47]
DePauli-Schimanovich, W.: Europolis. Bd. 5: Kurt Gödel und die Mathematische Logik. Linz: Trauner Verlag, 2005
[48]
Ebbinghaus, H.-D.; Flum, J.; Thomas, W.: Einführung in die mathematische Logik. Spektrum Akademischer Verlag, 1996
[49]
Engesser, H. (Hrsg.); Claus, V. (Hrsg.); Schwill, A. (Hrsg.): Duden Informatik. Mannheim: Dudenverlag, 1988
[50]
Fraenkel, A.: Zu den Grundlagen der Cantor-Zermeloschen Mengenlehre. In: Mathematische Annalen 86 (1922), S. 230–237
[51]
Frege, G.: Rezension von Georg Cantor: Zur Lehre vom Transfiniten. In: Zeitschrift für Philosophie und Philosophische Kritik 100 (1892), S. 269–272
[52]
Frege, G.: Grundgesetze der Arithmetik, Begriffsschriftlich abgeleitet. Bd. 2. Jena: Verlag Hermann Pohle, 1903
[53]
Frege, G.: Grundgesetze der Arithmetik. Bd. 1. Hildesheim: Verlag Olms, 1962
[54]
Frege, G.: Grundgesetze der Arithmetik. Bd. 2. Hildesheim: Verlag Olms, 1962
[55]
Frege, G.: Grundgesetze der Arithmetik, Begriffsschriftlich abgeleitet. Bd. 2. Darmstadt: Wissenschaftliche Buchgesellschaft, 1962
[56]
Frege, G.: Die Grundlagen der Arithmetik: Eine logisch-mathematische Untersuchung über den Begriff der Zahl. Ditzingen: Reclam, 1986
[57]
Frege, G.: Begriffsschrift und andere Aufsätze. Hildesheim: Verlag Olms, 2007
[58]
Galilei, Galileo: Two New Sciences. Madison, WI: University of Wisconsin Press, 1974
[32]
[33]
Cohen, P.: The Independence of the Continuum Hypothesis. In: Proceedings of the National Academy of Sciences of the United States of America Bd. 50. Washington, DC: National Academy of Sciences, 1963, S. 1143–1148 Cohen, P.: The Independence of the Continuum Hypothesis II. In: Proceedings of the National Academy of Sciences of the United States of America Bd. 51. Washington, DC: National Academy of Sciences, 1964, S. 105–110
[34]
Cohen, P.: Set Theory and the Continuum Hypothesis. New York: Benjamin, 1966
[35]
Corporation, Rand: A million random digits with 100,000 normal deviates. New York: Free Press, 1955
[36]
Dauben, J. W.: Georg Cantor and the Battle for Transfinite Set Theory. In: Proceedings of the 9th ACMS Conference, 1993, S. 1–22
[37]
Corrections to Turing’s Universal Computing Machine. In: Davies, D. W.: The Essential Turing. Oxford University Press, 2004, S. 97–101
[38]
Davis, M.: Arithmetical Problems and Recursively Enumerable Predicates. In: Journal of Symbolic Logic 18 (1953), S. 33–41
[39]
Davis, M.: Computability and Unsolvability. New York: McGraw-Hill, 1958
[40]
Davis, M.: The Undecidable. Mineola, NY: Dover Publications, 1965
[41]
Davis, M.: Mathematical logic and the origin of modern computers. (1987), S. 137–167
[42]
Davis, M.; Putnam, H.; Robinson, J.: The Decision
393
Literaturverzeichnis
[59]
Gardner, M.: The random number omega bids fair to hold the mysteries of the universe. In: Scientific American 241 (1979), December, S. 22–31
[60]
Gauß, C. F.: Brief Nr. 396 von C. F. Gauß an H. C. Schumacher. Göttingen, 12. Juli 1831
[61]
Gentzen, G.: Die Widerspruchsfreiheit der reinen Zahlentheorie. In: Mathematische Annalen 112 (1936), S. 493–565
(1947) [75]
Henkin, L. A.: The Completeness of the First-Order Functional Calculus. In: Journal of Symbolic Logic 14 (1949), S. 159–166
[76]
Henkin, L. A.: Completeness in the Theory of Types. In: Journal of Symbolic Logic 15 (1950), S. 81–91
[77]
Henkin, L. A.; Mostowski, A.: Review of Maltsev 1941 and 1956. In: Journal of Symbolic Logic 24 (1959), S. 55–57
[62]
Gödel, K.: Über die Vollständigkeit des Logikkalküls, Universität Wien, Diss., 1929
[78]
[63]
Gödel, K.: Die Vollständigkeit der Axiome des logischen Funktionenkalküls. In: Monatshefte für Mathematik 37 (1930), S. 349–360
Herken, R.: The Universal Turing Machine. A HalfCentury Survey: A Half-century Survey. Berlin, Heidelberg, New York: Springer-Verlag, 1995
[79]
[64]
Gödel, K.: Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme. In: Monatshefte für Mathematik und Physik 38 (1931), S. 173–198
Hermes, H.: Einführung in die mathematische Logik. Stuttgart: Teubner Verlag, 1963
[80]
Hilbert, D.: Grundlagen der Geometrie. Leipzig: Teubner Verlag, 1899
[81]
Hilbert, D.: Über das Unendliche. In: Mathematische Annalen 95 (1926), Nr. 1, S. 161–190
[82]
Hilbert, D.: Die Grundlagen der Mathematik. In: Abhandlungen aus dem mathematischen Seminar VI (1928), S. 80
[83]
Hilbert, D.: Radioansprache als Audiodatei. http: //math.sfsu.edu/smith/Documents/ HilbertRadio/HilbertRadio.mp3. Version: 1930
[65]
[66]
Gödel, K.: The consistency of the axiom of choice and of the generalized continuum-hypothesis. 24 (1938), S. 556–557 Gödel, K.: What is Cantor’s Continuum Problem? In: American Mathematical Monthly 54 (1947), S. 515–525
[67]
Gödel, K.: Collected Works 2. Publications 1938-1974. New York: Oxford University Press, 2001
[68]
Goodstein, R.: On the restricted ordinal theorem. In: Journal of Symbolic Logic 9 (1944), S. 33–41
[84]
Hilbert, D.: Die Hilbert’schen Probleme. Frankfurt: Verlag Harri Deutsch, 1998 (Ostwalds Klassiker)
[69]
Gostanian, R.: Constructible Models of Subsystems of ZF. In: Journal of Symbolic Logic 45 (1980), Nr. 2, S. 237–250
[85]
Hilbert, D.; Ackermann, W.: Grundzüge der theoretischen Logik. Berlin, Heidelberg: Springer-Verlag, 1928
[70]
Hardy, G. H.: Bertrand Russell and Trinity. Cambridge: Cambridge University Press, 1970
[86]
[71]
Hasenjäger, G.: Eine Bemerkung zu Henkins Beweis für die Vollstandigkeit des Prädikatenkalküls der Ersten Stufe. In: Journal of Symbolic Logic 18 (1953), Nr. 1, S. 42–48
Hilbert, D.; Bernays, P.: Die Grundlehren der mathematischen Wissenschaften in Einzeldarstellungen. Bd. 50: Grundlagen der Mathematik - Band II. 2.Aufl. Berlin, Heidelberg: Springer-Verlag, 1939
[87]
[72]
Heijenoort, J. van: From Frege to Gödel : A Source Book in Mathematical Logic, 1879-1931 (Source Books in the History of the Sciences). Cambridge, MA: Harvard University Press, 2002
Hilbert, D.; Hellinger, E.; Bernays, P.; Blumenthal, O.: Gesammelte Abhandlungen. Berlin, Heidelberg: Springer-Verlag, 1932
[88]
Hoffmann, D. W.: Grundlagen der Technischen Informatik. München: Hanser-Verlag, 2009. – 2. Auflage
[89]
Hoffmann, D. W.: Theoretische Informatik. München: Hanser-Verlag, 2009
[73]
Hemme, H.: 222 Knobeleien für jede Gelegenheit. Reinbek: Rowohlt Verlag, 2009
[74]
Henkin, L. A.: The Completeness of Formal Systems.
394
Literaturverzeichnis
[90]
Hofstadter, D. R.: Gödel, Escher, Bach: Ein endloses geflochtenes Band. Stuttgart: Klett-Cotta, 2006
[91]
Huntington, E. V.: Sets of Independent Postulates for the Algebra of Logic. In: Transactions of the American Mathematical Society 5 (1904), S. 288–309
[92]
Jacobs, K.: Portraitphoto von Kurt Gödel. http://creativecommons.org/licenses/ by-sa/2.0. – Creative Commons License 2.0, Typ: Attribution-ShareAlike
[93]
Jacobs, K.: Portraitphoto von Ernst Zermelo. http://creativecommons.org/licenses/ by-sa/2.0. Version: 1953. – Creative Commons License 2.0, Typ: Attribution-ShareAlike
[94]
Jones, J. P.; Matijaseviˇc, Y. V.: Register Machine Proof of the Theorem on Exponential Diophantine Representation of Enumerable Sets. In: Journal of Symbolic Logic 49 (1984), Nr. 3, S. 818–829
[95]
Jones, J. P.; Matijaseviˇc, Y. V.: Proof of Recursive Unsolvability of Hilbert’s Tenth Problem. In: The American Mathematical Monthly 98 (1991), Nr. 8, S. 689–709
[96]
[97]
Jones, J. P.; Sato, D.; Wada, H.; Wiens, D.: Diophantine Representation of the Set of Prime Numbers. In: The American Mathematical Monthly 83 (1976), S. 449–464 Kalmár, L.: Über die Axiomatisierbarkeit des Aussagenkalküls. In: Acta Scientiarum Mathematicarum 7 (1935), S. 222–243
[98]
Kant, I.: Kritik der reinen Vernunft. Teddington, Middlesex: Echo Library, 2006
[99]
Kaye, R.: Models of Peano arithmetic. Oxford: Oxford University Press, 1991 (Oxford Logic Guides)
[100] Kelley, J. L.: General Topology. New York: Van Nostrand Reinhold, 1955 [101] Kirby, L.; Paris, J.: Accessible independence results for Peano arithmetic. In: Bulletin of the London Mathematical Society 14 (1982), S. 725–731 [102] Kleene, S. C.: General recursive functions of natural numbers. In: Mathematische Annalen 112 (1936), S. 727–742 [103] Kleene, S. C.: Introduction to Metamathematics. Amsterdam: North Holland, 1952 (Bibliotheca Mathematica) [104] Kleene, S. C.: Mathematical Logic. Mineola, NY:
Dover Publications, 2002 [105] Knuth, D. E.: Mathematics and Computer Science: Coping with Finiteness. In: Science Magazine 194 (1976), Nr. 4271, S. 1235–1242 [106] Kolmogorov, A. N.: Three approaches to the quantitative definition of information. In: Problems in Information Transmission 1 (1965), S. 1–7 [107] Kuratowski, K.: Sur la notion d’ordre dans la théorie des ensembles. In: Fundamenta Mathematicae 2 (1921), S. 161–171 [108] Kuˇcera, A.; Slaman, T.: Randomness and Recursive Enumerability. In: SIAM Journal on Computing 31 (2001), Nr. 1, S. 199–211 [109] Leibniz, G. W.: Monadologie und andere metaphysische Schriften. Hamburg: Felix Meiner Verlag, 2002 [110] Löb, M. H.: Solution of a problem of Leon Henkin. In: Journal of Symbolic Logic 20 (1955), S. 115–118 [111] Löb, M. H.; Wainer, S. S.: Hierarchies of number theoretic functions I, II: A Correction. In: Archive for Mathematical Logic 14 (1970), S. 198–199 [112] Löwenheim, L.: Über Möglichkeiten im Relativkalkül. In: Mathematische Annalen 76 (1915), S. 447–470 [113] Maltsev, A.: Untersuchungen aus dem Gebiete der mathematischen Logik. In: Matematicheskii Sbornik 43 (1936), S. 323–336 [114] Maltsev, A.: Ob odnom obscem metode polucenia lokal’nyh teorem grupp. In: Ivanovskii Gosudarstvennyi Pedagogiceskii Institut, Ucenye zapiski, Fiziko-matematicheskie nauki 1 (1941), Nr. 1, S. 3–9 [115] Matijaseviˇc, Y. V.: Portraitphoto von Yuri Matijaseviˇc . http://creativecommons.org/ licenses/by/3.0. Version: 1969. – Creative Commons License 3.0, Typ: Attribution [116] Matijaseviˇc, Y. V.: Enumerable Sets are Diophantine. In: Soviet Mathematics Doklady 11 (1970), S. 354–358 [117] Mendelson, E.: Introduction to Mathematical Logic. 4th edition. Boca Raton, FL: Chapman & Hall, CRC Press, 1997 [118] Menzel, W.; Schmitt, P. H.: Formale Systeme. Vorlesungsskript Wintersemester 94/95. Universität Karlsruhe, 1994
395
Literaturverzeichnis
[119] Meschkowski, H.: Problemgeschichte der neueren Mathematik (1800–1950). Mannheim: B. I. Wissenschaftsverlag, 1978 [120] Minsky, M. L.: Recursive Unsolvability of Post’s Problem of ’Tag’ and Other Topics in the Theory of Turing Machines. In: Mathematische Annalen 74 (1961), Nr. 2, S. 437–455 [121] Minsky, M. L.: Computation: Finite and Infinite Machines. Englewood Cliffs, N. J.: Prentice Hall, 1967 (Prentice Hall Series in Automatic Computation)
[134] Pöppe, C.: Das Hotel Hilbert. In: Mandelbrot Dreidimensional 4 (2010), April [135] Post, E. L.: Recursively enumerable sets of positive integers and their decision problems. In: Bulletin of the American Mathematical Society 50 (1944), S. 284–316 [136] Post, E. L.: Recursive Unsolvability of a Problem of Thue. In: Journal of Symbolic Logic 12 (1947), Nr. 1, S. 1–11
[122] Morse, A. P.: A Theory of Sets. New York: Academic Press, 1965
[137] Péter, R.: Über den Zusammenhang der verschiedenen Begriffe der rekursiven Funktionen. In: Mathematische Annalen 110 (1934), S. 612–632
[123] Nagel, E.; Newman, J. R.: Der Gödel’sche Beweis. München, Wien: Oldenbourg-Verlag, 2006
[138] Péter, R.: Konstruktion nichtrekursiver Funktionen. In: Mathematische Annalen 111 (1935), S. 42–60
[124] Neumann, J. von: Zur Einführung der transfiniten Zahlen. In: Acta Litterarum ac Scientiarum Regiae Universitatis Hungaricae (1923)
[139] Péter, R.: Rekursive Funktionen. Berlin: Akademie-Verlag, 1957
[125] Neumann, J. von: Various techniques used in connection with random digits. In: Applied Mathematics Series (1951), Nr. 12, S. 36–38 [126] Brief an Ernst Zermelo vom 15. August 1923. In: Neumann, J. von: Problemgeschichte der neueren Mathematik (1800–1950). Mannheim: B. I. Wissenschaftsverlag, 1978
[140] Péter, R.: Deutsche Taschenbücher. Bd. 37: Das Spiel mit dem Unendlichen. Frankfurt: Verlag Harri Deutsch, 1984 [141] Quine, W. V. O.: New Foundations for Mathematical Logic. In: American Mathematical Monthly 44 (1937), S. 70–80 [142] Quine, W. V. O.: Mathematical Logic, Revised Edition. Harvard: Harvard University Press, 1981
[127] Neumann, J. von: First Draft of a Report on the EDVAC. In: IEEE Annals of the History of Computing 15 (1993), Nr. 4, S. 27–75
[143] Rabin, M.; Scott, D.: Finite automata and their decision problems. In: IBM Journal of Research and Development 3 (1959), S. 114–125
[128] Nielsen, M. A.; Chuang, I. L.: Quantum Computation and Quantum Information. Cambridge: Cambridge University Press, 2000 (Cambridge Series on Information & the Natural Sciences)
[144] Rado, T.: On Non-Computable Functions. In: The Bell System Technical Journal 41 (1962), Nr. 3, S. 877–884
[129] Noether, E. (Hrsg.); Cavailles, J. (Hrsg.): Actualités scientifiques et industrielles. Bd. 518: Briefwechsel Cantor-Dedekind. Paris: Hermann, 1937 [130] Oberschelp, A.: On Pairs and Tuples. In: Zeitschrift für Mathematische Logik und Grundlagen der Mathematik 37 (1991), S. 55–56 [131] Peano, G.: Arithmetices principia, nova methodo exposita. Bocca: Augustae Taurinorum, 1889 [132] Podnieks, K.: About Model Theory. http://www.ltn.lv/~podnieks/gt.html [133] Poizat, B.: A Course in Model Theory: An Introduction to Contemporary Mathematical Logic. Berlin, Heidelberg, New York: Springer-Verlag, 2000
[145] Ramsey, F. P.: On a Problem in Formal Logic. In: Proceedings of the London Mathematical Society 30 (1930), S. 264–286 [146] Reidemeister, K.: Hilbert Gedenkband. Berlin, Heidelberg, New York: Springer-Verlag, 1971 [147] Resag, J.: Die Grenzen der Berechenbarkeit. Unvollständigkeit und Zufall in der Mathematik. http://www.joerg-resag.de [148] Riesel, H.: Prime Numbers and Computer Methods for Factorization. Boston, MA: Birkhäuser-Verlag, 1994 [149] Robinson, A.: On the Metamathematics of Algebra. Amsterdam: North-Holland, 1951 [150] Rosser, J. B.: A mathematical logic without variables. In: Annals of Mathematics 36 (1935), S. 127–150
396
[151] Rosser, J. B.: Extensions of Some Theorems of Gödel and Church. In: Journal of Symbolic Logic 1 (1936), S. 87–91 [152] Rosser, J. B.: Many-valued logic. Amsterdam: North-Holland Publishing, 1952 [153] Rosser, J. B.: Logic for Mathematicians. New York: McGraw-Hill, 1953 [154] Rosser, J. B.: Simplified independence proofs: Boolean valued models of set theory. New York: Academic Press, 1969 [155] Rucker, R.: Infinity and the Mind. The Science and Philosophy of the Infinite. Basel: Birkhäuser-Verlag, 1982 [156] Russell, B.: Basic Writings of Bertrand Russell. London: Routledge, 1992 [157] The Philosophy of Logical Atomism. In: Russell, B.: The Collected Papers of Bertrand Russell. London: Routledge, 1993 [158] Russell, B.: Autobiography. London: Routledge, 1998 [159] Salerno, Joe: Portraitphoto von Leon Henkin. http://creativecommons.org/licenses/ by-sa/3.0. Version: 2007. – Creative Commons License 3.0, Typ: Attribution [160] Schöning, U.: Logik für Informatiker. Heidelberg: Spektrum Akademischer Verlag, 2000 [161] Schöning, U.: Theoretische Informatik – kurzgefasst. Heidelberg: Spektrum Akademischer Verlag, 2001 [162] Scott, D.: A proof of the independence of the continuum hypothesis. In: Mathematical Systems Theory 1 (1967), S. 89–111 [163] Sierpinski, W.: Sur une courbe dont tout point est un point de ramification. In: Comptes Rendus hebdomadaires des séances de l’Acadeémie des Sciences (1915), S. 302–305 [164] Sigmund, K.; Dawson, J.; Mühlberger, K.: Kurt Gödel: Das Album. Wiesbaden: Vieweg+Teubner Verlag, 2006 [165] Singh, S.: Fermats letzter Satz. München: Deutscher Taschenbuch Verlag, 2000 [166] Skolem, T.: Logisch-kombinatorische Untersuchungen über die Erfüllbarkeit und Beweisbarkeit mathematischen Sätze nebst einem Theoreme über dichte Mengen. In: Det Norske
Literaturverzeichnis
Videnskaps-Akademi 4 (1920), S. 1–36 [167] Einige Bemerkungen zur axiomatischen Begründung der Mengenlehre. In: Skolem, T.: Matematikerkongressen i Helsingfors den 4-7 Juli 1922. Helsinki: Akademiska Bokhandeln, 1923, S. 217–232 [168] Skolem, T.: Über einige Grundlagenfragen der Mathematik. In: Skrifter utgitt av Det Norske Videnskaps-Akademi i Oslo, I. Matematisk-naturvidenskapelig klasse 7 (1929), S. 1–49 [169] Skolem, T.: Über die Nichtcharakterisierbarkeit der Zahlenreihe mittels endlich oder abzählbar unendlich vieler Aussagen mit ausschließlich Zahlvariablen. In: Fundamenta Mathematicae 23 (1934), S. 150–161 [170] Smith, P.: An Introduction to Godel’s Theorems. Cambridge: Cambridge University Press, 2007 (Cambridge Introductions to Philosophy) [171] The incompleteness theorems. In: Smory´nski, C.: Handbook of Mathematical Logic. Amsterdam: North-Holland Publishing, 1977 [172] Smullyan, R. M.: Gödel’s Incompleteness Theorems. Oxford: Oxford University Press, 1992 (Oxford Logic Guides) [173] Socher, R.: Theoretische Grundlagen der Informatik. München: Hanser-Verlag, 2008 [174] Solomonoff, R. J.: A Preliminary Report on a General Theory of Inductive Inference. (1960), Februar, Nr. V-131 [175] Solomonoff, R. J.: A Formal Theory of Inductive Inference. Part I. In: Information and Control 7 (1964), March, Nr. 1, S. 1–22 [176] Solomonoff, R. J.: A Formal Theory of Inductive Inference. Part II. In: Information and Control 7 (1964), June, Nr. 2, S. 224–254 [177] St-Louis, Jerome: The Mandelbulb at 5 iterations. http://creativecommons.org/licenses/ by-sa/3.0. Version: 2009. – Creative Commons License 3.0, Typ: Attribution-Share Alike [178] Tennenbaum, S.: Non-archimedian models for arithmetic. In: Notices of the American Mathematical Society 6 (1959), S. 270 [179] Thue, A.: Probleme über Veränderungen von Zeichenreihen nach gegebenen Regeln. In: Skrifter
397
Literaturverzeichnis
utgit av Videnskapsselskapet i Kristiania I.10 (1914)
Philosophical Society 17 (1914), S. 387–390
[180] Turing, A. M.: On computable numbers with an application to the Entscheidungsproblem. In: Proceedings of the London Mathematical Society 2 (1936), Juli – September, Nr. 42, S. 230–265
[193] Wiener, N.: A Simplification of the Logic of Relations. In: Heijenoort, J. van (Hrsg.): From Frege to Gödel. Cambridge, MA: Harvard University Press, 1977, S. 224–227
[181] Turing, A. M.: On computable numbers with an application to the Entscheidungsproblem. A correction. In: Proceedings of the London Mathematical Society 2 (1937), Nr. 43, S. 544–546
[194] Wikipedia: Ordinal number. Public domain image. http://en.wikipedia.org/wiki/ Ordinal_number
[182] Turing, A. M.: Computing Machinery and Intelligence. In: Mind 59 (1950), S. 433–460
[195] Wiles, A.: Modular Elliptic Curves and Fermat’s last theorem. In: Annals of Mathematics 141 (1995), S. 443–551
[183] Vaught, R.: Model theory before 1945. In: Henkin, L. (Hrsg.): Proceedings of Symposia in Pure Mathematics Bd. 25, American Mathematical Society, 1974, S. 153–172
[196] Wolf, R. S.: The Carus Mathematical Mongraphs. Bd. 30: A Tour through Mathematical Logic. Washington, DC: Mathematical Association of America, 2005
[184] Vopˇenka, P.: General theory of ∇-models. In: Commentationes Mathematicae Universitatis Carolinae 8 (1967), S. 145–170
[197] Wolfram, S.: A New Kind of Science. Champaign, IL: Wolfram Media, Inc., 2002
[185] Wainer, S. S.: A classification of the ordinal recursive functions. In: Archive for Mathematical Logic 13 (1970), S. 136–153 [186] Wang, L.: The date of the Sunzi suanjing and the Chinese remainder theorem. In: Proceedings of the tenth international conference on history of science, 1962, S. 489–492
[198] Wußing, H.: 6000 Jahre Mathematik: Eine kulturgeschichtliche Zeitreise. Bd. Band 2: Von Euler bis zur Gegenwart. Berlin, Heidelberg, New York: Springer-Verlag, 2008 [199] Yong, L. L.; Se, A. T.: Fleeting Footsteps. Tracing the Conception of Arithmetic and Algebra in Ancient China. Singapore: World Scientific Publishing, 2004
[187] Weber, H.: Leopold Kronecker. In: Jahresbericht der Deutschen Mathematiker-Vereinigung 2 (1893), S. 19
[200] Yourgrau, P.: Gödel, Einstein und die Folgen: Vermächtnis einer ungewöhnlichen Freundschaft. München: C. H. Beck, 2005
[188] Weibel, P.: Der wichtigste Beitrag seit Aristoteles. Gespräch mit Karl Popper. In: Wissenschaft Aktuell 1 (1980), September. – In [47]
[201] Zermelo, E.: Beweis, dass jede Menge wohlgeordnet werden kann. In: Mathematische Annalen 59 (1904), S. 514–516
[189] Weisstein, E. W.: Goldbach Conjecture. From MathWorld – A Wolfram Web Ressource. http://mathworld.wolfram.com/ GoldbachConjecture.html
[202] Zermelo, E.: Untersuchungen über die Grundlagen der Mengenlehre. In: Mathematische Annalen 65 (1908), S. 261–281
[190] Weisstein, E. W.: Prime Diophantine Equations. From MathWorld – A Wolfram Web Ressource. http://mathworld.wolfram.com/ PrimeDiophantineEquations.html [191] Weisstein, E. W.: Twin Prime Conjecture. From MathWorld – A Wolfram Web Ressource. http://mathworld.wolfram.com/ TwinPrimeConjecture.html [192] Wiener, N.: A Simplification of the Logic of Relations. In: Proceedings of the Cambridge
[203] Zermelo, E.: Über Grenzzahlen und Mengenbereiche. In: Fundamenta Mathematicae 16 (1930), S. 29–47 [204] Zermelo, E.: Über Stufen der Quantifikation und die Logik des Unendlichen. In: Jahresbericht der Deutschen Mathematiker-Vereinigung 41 (1932), S. 85–88
Namensverzeichnis
A Abbe, Ernst, 28 Ackermann, Wilhelm F., 46, 83, 146, 208 Aristoteles, 26, 51
B Bennett, Charles, 322, 329 Bernays, Paul, 146, 175, 223, 226 Bernstein, Felix, 23, 369 Boole, George, 28, 371 Brouwer, Luitzen E. J., 45, 47 Burali-Forti, Cesare, 38, 176 Burgess, John P., 254
C Calude, Cristian, 330 Cantor, Georg, 14, 18, 23, 38, 158, 172, 175, 182, 183, 185, 190 Carnap, Rudolf, 47, 198 Cauchy, Augustin L., 13 Chaitin, Gregory, 313, 316, 334 Church, Alonzo, 36, 56, 59, 221, 261, 263 Cohen, Paul J., 63, 370, 382
D Dauben, Joseph, 18 Davies, Donald W., 255, 256 Davis, Martin, 59, 60, 289, 290 Dedekind, J. W. Richard, 13, 26, 34, 138, 340
Dinneen, Michael, 330 Diophantos von Alexandria, 7 Dirichlet, Peter Gustav, 127 Dummett, Michael, 45
E Eckert, J. Presper, 52 Einstein, Albert, 48 Euklid von Alexandria, 136, 231, 384 Euler, Leonhard, 4, 5, 11
Henkin, Leon Albert, 120, 121, 261, 348 Hermes, Hans, 87 Hermite, Charles, 11 Heyting, Arend, 45, 47 Hilbert, David, 32, 47, 83, 208, 223, 226, 289 Hofstadter, Douglas R., 197, 263 Huntington, Edward Vermilye, 371
J Jones, James P., 61, 260, 289, 290
F Fermat, Pierre de, 5, 6, 9 Fourier, Jean Baptiste, 13 Fraenkel, Abraham A. H., 42, 153 Frege, Gottlob, 27, 28, 32, 36 Furtwängler, Philipp, 48
G Galilei, Galileo, 26 Gardner, Martin, 322, 329 Gauß, J. Carl Friedrich, 13, 26, 359 Gentzen, Gerhard, 232 Gödel, Kurt, 46, 48, 61, 65, 146, 175, 197, 211, 217, 219, 223, 254, 340, 342, 343 Goldbach, Christian, 4 Goodstein, Reuben L., 53, 233 Gottlob Frege, 27
H Harrington, Leo Anthony, 53
K Kant, Immanuel, 339 Kelley, John L., 146 Kirby, Laurie, 53, 233, 239 Kleene, Stephen C., 45, 207, 221, 261 Knuth, Donald E., 238 Kolmogorov, Andrej, 313, 316 Kreisel, Georg, 237 Kripke, Saul Aaron, 145 Kronecker, Leopold, 13, 14, 32 Kuˇcera, Antonín, 330 Kummer, Ernst Eduard, 14 Kuratowski, Kazimierz, 163
L Lagrange, Joseph-Louis, 135, 291 Leibniz, Gottfried Wilhelm, 1 von Lindemann, C. L. Ferdinand, 12 Liouville, Joseph, 11, 19 Löb, Martin Hugo, 223, 238 Löwenheim, Leopold, 340–342, 349
400
Namensverzeichnis
M
R
T
Malcev, Anatolij I., 348, 350 Matijaseviˇc, Yuri W., 60, 260, 289, 290 Mauchly, John W., 52 Mendelsons, Elliott, 214 Minsky, Marvin L., 257 Morse, Anthony P., 146
Rabin, Michael Oser, 261, 370 Radó, Tibor, 239 Ramsey, Frank Plumpton, 53 Rice, Henry G., 272 Riemann, G. F. Bernhard, 13 Robinson, Abraham, 344 Robinson, Julia, 60, 289, 290 Rosser, J. Barkley, 201, 220, 221, 261 Russell, Bertrand A. W., 1, 36, 37, 38, 39, 52, 53, 145, 226, 261 Russell, Lord John, 37
Tarski, Alfred, 342, 350 Tennenbaum, Stanley, 355 Thue, Axel, 263 Turing, Alan M., 36, 54, 56, 58, 244, 254, 261
N Neumann, John von, 46–48, 62, 146, 170, 313 Nylander, Paul, 314
S
Paris, Jeffrey B., 53, 233, 239 Peano, Giuseppe, 34, 138 Péter, Rózsa, 207 Platek, Richard A., 145 Poizat, Bruno, 350 Popper, Karl, 51 Post, Emil Leon, 60, 255, 256 Presburger, Mojz˙ esz, 229 Putnam, Hilary W., 60, 289, 290
Schlick, Moritz, 48 Schröder, Ernst, 23 Scott, Dana S., 65, 261, 370 Shu, Chi-Kou, 330 Sierpi´nski, Wacław, 301 Skolem, Thoralf, 42, 340–343, 349, 350, 363, 368 Slaman, Theodore A., 330 Smith, Alex, 257 Smith, Peter, 214 Smullyan, Raymond M., 240, 261 Solomonoff, Ray, 313, 316 Solovay, Robert M., 65, 370
Quine, Willard Van Orman, 145
Vopˇenka, Petr, 65, 370
W
P
Q
V
Wainer, Stanley Scott, 238 Weierstraß, Karl T. W., 12–14 White, Daniel, 314 Whitehead, Alfred N., 37, 39, 145, 226, 261 Wiener, Norbert, 193 Wiles, Andrew, 5 Wolfram, Stephen, 250, 257
Z Zermelo, Ernst F. F., 42, 153, 161, 170, 198 Zi, Sun, 212 Zorn, Max August, 160
Lebensdaten Wilhelm Ackermann
1896 1815
1809
1800
Paul Bernays
1888
George Boole
1962 1977
1864
Luitzgen Brouwer 1881 1966 Cesare Burali-Forti 1861 1931 Georg Cantor 1845 1918 Alonzo Church 1903 1995 Paul Cohen 1934 2007 Richard Dedekind 1831 1916 Abraham Fraenkel 1891 1965 Gottlob Frege 1848 1925 Gerhard Gentzen 1909 1945 Kurt Gödel 1906 1978 Reuben Goodstein 1912 1985 Leon Henkin 1921 2006 David Hilbert 1862 1943 Stephen Kleene 1909 1994 Andrej Kolmogorov 1903 1987 Leopold Kronecker 1823 1891 Joseph Liouville 1882 Martin Löb 1921 2006 Leopold Löwenheim 1878 1957 Anatoly Malcev 1909 1967 John von Neumann 1903 1957 Giuseppe Peano 1858 1932 Emil Post 1897 1954 Rosza Peter 1905 1977 Mojzesz Presburger 1904 1943 Julia Robinson 1919 1985 Barkley Rosser 1907 1989 Bertrand Russell 1872 1970 Thoralf Skolem 1887 1963 Ray Solomonoff 1926 2009 Alfred Tarski 1901 1983 Alan Turing 1912 1954 Alfred Whitehead 1861 1947 Ernst Zermelo 1871 1953 1820
1840
1860
1880
1900
1920
1940
1960
1980
2000
2020
Sachwortverzeichnis
A Abschwächungsregel, 93 Absorptionsgesetz, 92, 387 Abzählbar, 18 höchstens, 18 Ackermann-Funktion, 208, 238 diagonalisierte, 238 Ackermann-Péter-Funktion, 208 Äquivalenz -operator, 87 aussagenlogische, 92 prädikatenlogische, 107 Aktuale Unendlichkeit, 25 Akzeptor, 306 Algebraische Zahl, 11 Algorithmische Information, 316 Informationstheorie, 313 Komplexität, 314 Algorithmus, 36, 60, 243 Allgemeine Kontinuumshypothese, 25 Allgemeines Halteproblem, 268 Allgemeingültigkeit, 76, 230 aussagenlogische, 90 prädikatenlogische, 107 Allquantor, 29 bedingter, 135, 147 Alphabet, 72 Antinomie Russell’sche, 38 Antisymmetrische Relation, 159 Antivalenzoperator, 87 Arithmetica, 6, 7 Arithmetische Formel, 132 Arithmetischer Term, 132 Arithmetisches Mittel, 10 Arithmetisierung
der Syntax, 202 Assoziativgesetz, 92, 387 Asymmetrische Relation, 157, 159 Atomare Formel, 87 Atomare Aussage, 87 Aufzählbarkeit, 266 Aussage atomare, 87 Aussagenlogik, 87 Kalkül, 93 Semantik, 87 Syntax, 87 Aussonderungsaxiom, 43, 151 Auswahlaxiom, 43, 44, 156, 382 Automat linearer, 250 zellulärer, 250, 307 Axiom, 71 der Aussonderung, 43, 151 der Auswahl, 43, 44, 156, 382 der Bestimmtheit, 43, 148 der Elementarmenge, 43 der Ersetzung, 42, 43, 153 der Extensionalität, 148 der Fundierung, 42, 43, 154 der Konstruktibilität, 62 der leeren Menge, 42, 148 der Paarung, 43, 149 der Potenzmenge, 43, 153 der Regularität, 154 der Separation, 37, 151 der Vereinigung, 43, 150 des Unendlichen, 43, 66, 151 logisches, 131 of choice, 43, 44, 156, 382 Theorie-, 131 Axiomatische Mengenlehre, 42, 145
Axiomatisierbarkeit, 340 endliche, 146 Axiome von Huntington, 371 von Peano, 34, 138 von Zermelo-Fraenkel, 148 Axiomenschema, 80
B b-adische Darstellung, 233 expandierte, 233 Bandalphabet von Turing-Maschinen, 244 Barbier-Paradoxon, 38, 201 Base bumping, 234 Basis, 233, 294 Begriffsschrift, 27 Berechenbarkeit, 6, 53 Grenzen der, 268 Berechnungsmodelle, 244 Beschreibungskomplexität, 316 Bestimmtheitsaxiom, 43, 148 β -Funktion Gödel’sche, 211, 286 Beweis, 74 -ebene, 164 -kalkül arithmetischer, 137 mengentheoretischer, 148 -prädikat, 223 Reduktions-, 270 Unabhängigkeits-, 376 Beweisbarkeit, 1 Beweisbarkeitsrelation, 75 Biber-Funktion, 239 Binäre Codierung, 248 Binomialkoeffizient, 301
404
Binomischer Lehrsatz, 303 Boolean valued model, 370 Boolesche Algebra, 370, 371 vollständige, 373 Boolesche Funktion, 89 Boolesches Modell, 65, 370, 374 Bottom-up-Verfahren, 84 Bounded quantifier theorem, 290 Burali-Forti-Paradoxon, 38, 176 Busy beaver function, 239
C Calculus ratiocinator, 2 Cantor’sche Normalform, 182 Paarungsfunktion, 16, 365 Capturable function, 214 relation, 214 Chaitin’sche Konstante, 176, 322, 327 Chaitin’scher Unvollständigkeitssatz, 313, 332 Characteristica universalis, 2 Charakteristische Funktion, 208, 264 partielle, 264 Chinesischer Restsatz, 212 Church’sche These, 261, 263 Codierung binäre, 247 unäre, 248 von Registermaschinen, 294 Colossus, 58 Compactness theorem, siehe Kompaktheitssatz Computing machine, 56 CSB-Theorem, 23
D Datenflussmatrix, 294 De Morgan’sche Regel, 92, 387 Denkbereich, 349 Derivability conditions, 223 Description number, 254 Diagonalfunktion
Sachwortverzeichnis
Ackermann’sche, 238 Diagonalisierung, 14, 20, 215, 238 Diophantisch repräsentierbar, 292 Diophantische Gleichung, 8, 289 exponentielle, 9, 289 Disjunktion, 87 Distributivgesetz, 92, 93, 371 DNA computing, 264 Dominanzaussage, 238 Doppelnegationsgesetz, 92, 387 Dreieck Pascal’sches, 301 Sierpinski-, 301
E Einbettung von PA in ZF, 170 Eingabewort, 247 Einstein, Albert, V Element inverses, 92, 371 neutrales, 92, 371 Elementarmengenaxiom, 43 Elementaroperatoren, 92 Eliminationsgesetz, 92, 387 Endlichkeit als Formel der PL2, 118 Endlichkeitssatz, siehe Kompaktheitssatz Engerer Funktionenkalkül, 46 Entscheidbarkeit, 45, 264 Entscheidungsproblem semantisches, 86 syntaktisches, 83 Entscheidungsverfahren, 59, 83, 84, 281 Bottom-up-, 84 Top-down-, 85 Enumerator, 365 Epsilon-Delta-Kriterium, 102 Erd˝os-Straus-Vermutung, 69 Erfüllbarkeit aussagenlogische, 90 eines Kalküls, 343 prädikatenlogische, 107 Ersetzungsaxiom, 42, 43, 153 Erster Unvollständigkeitssatz, 48, 198,
288, 334 Euklidische Geometrie, 33, 339 Eulersche Konstante, 11 Existenzquantor, 29 bedingter, 135, 147 Expressable relation, 214 Extensionalitätsaxiom, 148 Extensionalitätsprinzip, 148, 209
F Filter, 362 maximaler, 362 Finite Mittel, 45 First order logic, 116 First order theory, 131 Fixpunkteigenschaft, 182 Fluchtzählgleichung, 349 Folge Goodstein-, 233 Folgerung logische, 91 Forcing, 64, 370, 382 Formales System, 71 Formel -schema, 72 arithmetische, 132 atomare, 87 aussagenlogische, 87 bereinigte, 105 PA-, 132 prädikatenlogische, 104 ZF-, 147 Freie Variable, 102 Freier Ultrafilter, 362 Fundierungsaxiom, 42, 43, 154 Funktion, 103, 164 Ackermann-, 208, 238 diagonalisierte, 238 Ackermann-Péter-, 208 arithmetisch repräsentierbare, 209 Biber-, 239 boolesche, 89 charakteristische, 208, 264 partielle, 264 Goodstein-, 237
405
Sachwortverzeichnis
injektive, 117, 194 μ-rekursive, 207, 262 partielle, 164 primitiv-rekursive, 59, 207, 262 semantisch repräsentierbare, 210 surjektive, 117, 194 syntaktisch repräsentierbare, 241 totale, 164, 194, 237 Turing-berechenbare, 247 Funktionenkalkül engerer, 46 Funktions -definitionsschema, 121 -tabelle, 89 -variable, 116
einer Formel, 203 einer Turing-Maschine, 254 Goldbach’sche Vermutung, 3, 68, 192, 228 Goodstein -Folge, 233 -Funktion, 237 Satz von, 53, 233 Goto-Programm, 258 Grammatik, 263 Grenzzahl, 178 Grundlagenkrise, 36 Grundmenge, 105, 374 Grundsubstitution, 108
H G Gauß’sche Zahlenebene, 359 Gebundene Variable, 102 Generalisierungsregel, 108 Geometrie, 13, 231 elliptische, 231 euklidische, 33, 339 hyperbolische, 231 nichteuklidische, 231 geordnetes Paar, 162 Gesetz Absorptions-, 92, 387 Assoziativ-, 92, 387 Distributiv-, 92, 371 Doppelnegations-, 92, 387 Eliminations-, 92, 387 Idempotenz-, 92, 387 Kommutativ-, 92, 371 Gleichung diophantische, 8, 289 exponentiell diophantische, 9, 289 Gödel’scher Unvollständigkeitssatz, 197 erster, 48, 198, 288, 334 zweiter, 49, 223 Vollständigkeitssatz, 111, 340, 345 erweiterter, 344 Gödel-Rosser-Theorem, 223 Gödelisierung, 203 Gödelnummer
Halbordnung, 157 Halteproblem, 59, 268 allgemeines, 268 auf leerem Band, 270 Haltesequenz, 322 Haltewahrscheinlichkeit, 313, 324, 327 Henkin -Interpretation, 120 -Semantik, 121 Heptation, 233 Hexation, 233 Higher-order logic, 116 Hilbert-Programm, 44 Hilberts zehntes Problem, 289 Höchstens abzählbar, 18 Huntington’sche Axiome, 371 Hypothese Riemann’sche, 326
I Idempotenzgesetz, 92, 387 Implikation, 87 Individuenbereich, 102, 105, 374 Induktion transfinite, 187 vollständige, 187 vollständige, 137, 188 Induktionsaxiom, 137 Infimum, 373
Informationsgehalt, 313, 316 Informationstheorie algorithmische, 313 Initialkonfiguration, 246 Initialzustand von Turing-Maschinen, 245 Injektive Funktion, 117, 194 Instanz, 73 Instanziierung, 108 Instanziierungsregel, 38 Instruktionsmenge, 258 von Registermaschinen, 258 von Turing-Maschinen, 244 Interpretation aussagenlogische, 88 Henkin-, 120 prädikatenlogische, 105 Quotienten-, 381 Intuitionismus, 45 Inverse Elemente, 92, 371 Irreflexive Ordnung, 159 Relation, 157
K Kalkül, 71 aussagenlogischer, 93 korrekter, 76 λ -, 262 negationsvollständiger, 76 prädikatenlogischer, 108 vollständiger, 76 widerspruchsfreier, 76 Kardinalität, 14, 15, 191 Kardinalzahl, 22, 190 Kartesisches Produkt, 194 kategorisch, 340 Klasse, 146 Klassenzeichen, 215 Kleene-Rosser-Paradoxon, 221 Kolmogorov-Komplexität, 316 Kommutativgesetz, 92, 371 Kommutativität der Ordinalzahladdition, 180 der Ordinalzahlmultiplikation, 180 Kompaktheitssatz, 119, 341, 345
406
Sachwortverzeichnis
Komplexität, 313 algorithmische, 314 Kolmogorov, 316 Komplexitätstheorie, 243 Komprehensionsaxiom allgemeines, 37 Komprehensionsschemas, 121 Konfiguration von Turing-Maschinen, 246 Konjunktion, 29, 87 Konstante Chaitin’sche, 176, 322, 327 eulersche, 11 Konstruktibilitätsaxiom, 62 Konstruktible Menge, 62 Kontinuum, 7, 10 Kontinuumshypothese, 25, 382 allgemeine, 25 Kontraposition, 93 Kontrollflussmatrix, 294 Kopfzelle, 252 Kripke-Platek-Mengenlehre, 145
LST-Theorem, 350
M
L λ -Kalkül, 262 Lehrsatz binomischer, 303 Lemma von Zorn, 160 Limes-Ordinalzahl, 178 Lineare Ordnung, 157 Linearer Automat, 250 Liouville’sche Zahl, 11 Lisp, 261 Löwenheim-Skolem-Theorem, 349, 363 Logical axiom, 131 Logik Aussagen-, 87 erster Stufe, 116 höherer Stufe, 116 Prädikaten-, 102 symbolische, 28 Logische Folgerung, 91 Logisches Axiom, 131 Logizismus, 28, 30
341,
Mächtigkeit, 15, 191 Mannigfaltigkeit, 14 Maskierungsrelation, 293 Maximaler Filter, 362 Mehrband-Turing-Maschine, 249 Mehrspur-Turing-Maschine, 248 Menge, 145 konstruktible, 62 Null-, 43, 148 transitive, 172 Mengenfilter, 362 Mengenlehre axiomatische, 42, 145 Kripke-Platek-, 145 Morse-Kelley-, 146 Neumann-Bernays-Gödel-, 146 New-Foundations-, 145 Zermelo-, 42 Zermelo-Fraenkel-, 42, 147 Meta -Ebene, 72 -mathematik, 3 Minimalitätsprinzip, 187 Minimalitätsprinzip, 187 MIU-System, 263 Modell, 64, 74, 89, 106 -analyse, 339 -ebene, 339 -existenzsatz, 343 -funktion, 375 -konstruktion, 339 -relation, 75, 133 aussagenlogische, 89 prädikatenlogische, 106 -theorie, 339 boolesches, 65, 370, 374 eines Kalküls, 343 Nichtstandard-, 352 Modus ponens, 80, 93 Morse-Kelley-Mengenlehre, 146 μ-Operator, 262 μ-rekursive Funktion, 207, 262
N Nachbarschaftsfunktion von zellulären Automaten, 250 Nachfolgeroperation, 26 Natürliche Zahl, 137 als Menge, 170 Natural independence phenomenon, 233 NBG-Mengenlehre, 146 Negation, 87 Neutrale Elemente, 92, 371 New Foundations, 145 Nichtstandardmodell, 352 der Peano-Arithmetik, 352 abzählbares, 353 überabzählbares, 356 Normalform Cantor’sche, 182 Nullmenge, 43, 148
O Objektebene, 72 Octation, 233 ODER-Operator, 87 Operatorensystem vollständiges, 127 Ordinalzahl, 172, 174, 235 -nachfolger, 177 Limes-, 178 transfinite, 178 Ordnung, 157 Halb-, 157 irreflexive, 159 lineare, 157 reflexive, 159 totale, 157 Wohl-, 157, 184 Ordnungsisomorphie, 184 Ordnungstyp, 184, 185
P Paar geordnetes, 162 Paarungsaxiom, 43, 149 Paarungsfunktion
407
Sachwortverzeichnis
Cantor’sche, 16, 365 Paradoxon Barbier-, 38, 201 Burali-Forti-, 38, 176 Kleene-Rosser-, 221 Skolem-, 363 Parallelenpostulat, 231 Partielle Funktion, 164 Pascal’sches Dreieck, 301 Peano-Arithmetik, 132 Semantik, 133 Syntax, 132 Peano-Axiome, 34, 138 Pentation, 233 Pfeilnotation, 238 Pigeonhole principle, 127 Polare Koordinaten, 359 Potenzielle Unendlichkeit, 25 Potenzmengenaxiom, 43, 153 Prädikat, 103 -variable, 116 Prädikatenlogik, 102 dritter Stufe, 117 erster Stufe mit Gleichheit, 111 höherer Stufe, 116 Meta-Resultate, 340 mit Gleichheit, 112 Semantik, 103 Syntax, 103 zweiter Stufe, 116 Präfixfreiheit, 323 Presburger-Arithmetik, 229 Primitiv-rekursive Funktion, 59, 207, 262 Primitiv-rekursive Relation, 209 Primitive Rekursion, 207 Primzahlzwillinge, 4, 192, 336 Principia Mathematica, 39 Prinzip des zureichenden Grunds, 1 Produkt kartesisches, 194 von Ordinalzahlen, 180 Produktion, 263 Programm, 313 Goto-, 258 While-, 262 Proper axiom, 131
Pythagoreisches Tripel, 8
Q Quadratur des Kreises, 12 Quantenrechner, 264 Quantor, 29, 102 bedingter, 135, 147 Quotienteninterpretation, 381
R Ramsey-Theorem, 53 Rationale Zahl, 9 Reduktionsbeweis, 270 Reelle Zahl, 10 Reflexive Ordnung, 159 Relation, 128 Regel von De Morgan, 92, 387 Register -gleichungen, 297 -maschine, 61, 258, 274, 290 Codierung von, 294 -menge, 258 Regularitätsaxiom, 154 Rekursion primitive, 207 Rekursiv aufzählbar, 328 Relation, 164 antisymmetrische, 159 arithmetisch repräsentierbare, 209 asymmetrische, 157, 159 Beweisbarkeits-, 75 diophantisch repräsentierbare, 292 irreflexive, 157 linkskomparative, 128 Maskierungs-, 293 Modell-, 75, 133 primitiv rekursive, 209 rechtseindeutige, 164 reflexive, 128 semantisch repräsentierbare, 210 symmetrische, 128 syntaktisch repräsentierbare, 214 transitive, 157
Repräsentierbare Funktion arithmetisch, 209 semantisch, 210 syntaktisch, 241 Repräsentierbare Relation arithmetisch, 209 diophantisch, 292 semantisch, 210 syntaktisch, 214 Representable function, 214 Restsatz Chinesischer, 212 Rice Satz von, 271, 308 Riemann’sche Hypothese, 326 Ringinklusion, 154 Robinson-Arithmetik, 230 Rossers Trick, 220 Russell’sche Antinomie, 38
S Satz des Pythagoras, 8 Vier-Quadrate-, 135, 291 vom ausgeschlossenen Dritten, 45 von Cantor, 22 von Goodstein, 53, 233 von Löwenheim-Skolem, 341, 349, 363 von Rice, 271, 308 Schlussregel, 71 Second order theory, 131 Semantik, 74 der Aussagenlogik, 87 der Peano-Arithmetik, 133 der Prädikatenlogik, 103 Henkin-, 121 Standard-, 117 Semi-Thue-System, 263 Separationsaxiom, 37, 151 Sierpinski-Dreieck, 301 Skolem -Gödel-Theorem, 343, 344 -Normalform, 342, 363 -Paradoxon, 363
408
Sprache, 72 Standard -beschreibung von Turing-Maschinen, 253 -interpretation, 75, 134 -modell, 352 -semantik der PL2, 117 description, 253 Startkonfiguration, 246 Startzustand von Turing-Maschinen, 245 Stetigkeit, 102 Substitution kollisionsfreie, 108 Substitutionsaxiom der Gleichheit, 112 Subtraktion saturierte, 258 Supremum, 373 Surjektive Funktion, 117, 194 Symbolische Logik, 28 Syntax, 72 Arithmetisierung, 202 der Aussagenlogik, 87 der Peano-Arithmetik, 132 der Prädikatenlogik, 103 der ZF-Mengenlehre, 147
T Taniyama-Shimura-Vermutung, 5 Taubenschlagprinzip, 127 Tautologie aussagenlogische, 90 prädikatenlogische, 107 Teilformel, 87 Term arithmetischer, 132 prädikatenlogischer, 104 Termersetzungssystem, 263 Tertium non datur, 45 Tetration, 233 Theorem, 73, 74 CSB-, 23 Gödel-Rosser-, 223 Löwenheim-Skolem-, 341, 349,
Sachwortverzeichnis
363 LST-, 350 Ramsey-, 53 Skolem-Gödel-, 343, 344 Theorie, 131 axiomatisierbare, 131 erster Stufe, 120 Theorieaxiom, 131 These von Church, 261, 263 Top-down-Verfahren, 85 Totale Funktion, 164, 194, 237 Ordnung, 157 Transduktor, 259, 306 Transfinite Induktion, 187 Ordinalzahl, 178 Transitive Menge, 172 Relation, 157 Transzendente Zahl, 11 Trichotomieeigenschaft, 175, 357 Tripel pythagoreisches, 8 Trägermenge, 371 Turing-Maschine, 54, 244 einseitig beschränkte, 248 Erweiterungen, 248 indeterministische, 246 Mehrband-, 249 Mehrspur-, 248 universelle, 253 zelluläre, 250 Turing-Test, 58 Typentheorie, 145
U Überabzählbar, 18 Ultrafilter, 362, 381 freier, 362 Unabhängigkeitsbeweis, 376 Unabhängigkeitsphänomenen natürliches, 233 Unäre Codierung, 247 UND-Operator, 87
Unendlichkeit, 13 aktuale, 25 potenzielle, 25 Unendlichkeitsaxiom, 43, 66, 151 Unerfüllbarkeit aussagenlogische, 90 prädikatenlogische, 107 Ungebundene Variable, 102 Universelle Turing-Maschine, 253 Universum, 105, 374 Untermodell, 350 Unvollständigkeitssatz, 197 Chaitin’scher, 313, 332 Gödel’scher erster, 48, 198, 288, 334 zweiter, 49, 223 Missverständnisse, 228 Urelement, 146
V Variable, 87, 102, 147 freie, 102 Funktions-, 116 gebundene, 102 PL0- versus PL1-, 103 Prädikat-, 116 ungebundene, 102 Variablenbelegung, 88 Venn-Diagramm, 372 Vereinigungsaxiom, 43, 150 Vermutung Goldbach’sche, 3, 68, 192, 228 Primzahlzwillinge, 4, 192, 336 Taniyama-Shimura-, 5 von Erd˝os-Straus, 69 Vier-Quadrate-Satz, 135, 291 Vollständige Induktion, 187 Vollständigkeit, 44 semantische, 76 syntaktische, 76 Vollständigkeitssatz, 111, 340, 345 erweiterter, 344 Vollständige Induktion, 137, 188 Vollständiges Operatorensystem, 127 Von-Neumann-Architektur, 52
409
Sachwortverzeichnis
W
Z
Wahrheit, 1 Wahrheits -tabelle, 89 -tafel, 89 While-Programm, 262 Widerspruchsbeweis absoluter, 35 relativer, 35 Widerspruchsfreiheit, 44 Wiener Kreis, 48 wohlgeformt, 72 Wohlordnung, 157, 184
Zahl
X XOR-Operator, 87
algebraische, 11 als Menge, 170 eulersche, 11 Grenz-, 178 Kardinal-, 22, 190 Liouville’sche, 11 natürliche, 137 Ordinal-, 172, 174, 235 Limes-, 178 Nachfolger, 177 transfinite, 178 rationale, 9 reelle, 10 transzendente, 11 Zahlenebene Gauß’sche, 359 Zahlklasse, 183
Zehntes Problem von Hilbert, 289 Zelle, 250 Zellmenge, 250 Zelluläre Turing-Maschine, 250 Zellulärer Automat, 250, 307 Zermelo’sche Zahlenreihe, 170 Zermelo-Fraenkel -Axiome, 148 -Mengenlehre, 42, 147 with Choice, 44, 145, 156 Zermelo-Mengenlehre, 42 ZF-Mengenlehre, 42, 147 Zorn’sches Lemma, 160 Zustandsmenge von Turing-Maschinen, 244 von zellulären Automaten, 250 Zustandsübergangsfunktion von zellulären Automaten, 250 Zweiter Unvollständigkeitssatz, 49, 223