Springer-Lehrbuch
Peter Bundschuh
Einf¨uhrung in die Zahlentheorie Sechste, u¨ berarbeitete und aktualisierte Auflage
123
Prof. Dr. Peter Bundschuh Universit¨at K¨oln Mathematisches Institut Weyertal 86–90 50931 K¨oln
ISBN 978-3-540-76490-8
e-ISBN 978-3-540-76491-5
DOI 10.1007/978-3-540-76491-5 Springer-Lehrbuch ISSN 0937-7433 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet u¨ ber http://dnb.d-nb.de abrufbar.
Mathematics Subject Classification (2000): 11-01 © 2008, 2002, 1998, 1996, 1992, 1988 Springer-Verlag Berlin Heidelberg ¨ Dieses Werk ist urheberrechtlich gesch¨utzt. Die dadurch begr¨undeten Rechte, insbesondere die der Ubersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielf¨altigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielf¨altigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zul¨assig. Sie ist grunds¨atzlich verg¨utungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten waren und daher von jedermann benutzt werden d¨urften. Satz: Datenerstellung durch den Autor unter Verwendung eines Springer TEX-Makropakets Herstellung: LE-TEX Jelonek, Schmidt & V¨ockler GbR, Leipzig Umschlaggestaltung: WMXDesign GmbH, Heidelberg Gedruckt auf s¨aurefreiem Papier 987654321 springer.de
Vorwort zur Erstauflage
Untersuchungen verschiedener Eigenschaften nat¨ urlicher Zahlen geh¨ orten historisch zu den ¨altesten Besch¨aftigungen mit mathematischen Problemen u ¨berhaupt. So entstanden bereits im griechischen Altertum Mathematikb¨ ucher wie Euklids Elemente und Diophants Arithmetika, die sich teilweise oder ausschließlich mit der systematischen Behandlung ganzzahliger Fragestellungen befaßten. Mit dem ausgehenden Altertum schwand jedoch weitgehend das Interesse an der Mathematik insgesamt und wirklich starke, neue Impulse erhielt die Lehre von den ganzen Zahlen erst wieder im 17. und 18. Jahrhundert, vor allem durch Fermat und Euler. W¨ahrend die Nachwelt Fermats Ergebnisse noch m¨ uhsam seiner reichen Korrespondenz mit gebildeten Zeitgenossen entnehmen mußte, publizierte Euler seine Resultate zumeist in Zeitschriftenserien der Akademien, die einige große europ¨aische H¨ofe eingerichtet hatten. Die ersten umfassenden und systematischen Darstellungen dessen, was zu ihrer Zeit zum gesicherten Wissen in der Lehre von den ganzen Zahlen geh¨ orte, gaben dann um die Wende zum 19. Jahrhundert nahezu zeitgleich Legendre mit seinem Essai sur la Th´eorie des Nombres (1798) und Gauss mit seinen Disquisitiones Arithmeticae (1801). Vor allem das epochemachende Werk von Gauss mit seiner F¨ ulle von neuen und tiefliegenden Entdeckungen brachte die Zahlentheorie als selbst¨andige Teildisziplin der Gesamtmathematik erst eigentlich auf den Weg. In den seither verflossenen fast zweihundert Jahren hat sich die Zahlentheorie gewaltig weiterentwickelt und in verschiedene Richtungen verzweigt. Dementsprechend ist eine umfangreiche zahlentheoretische Literatur entstanden, vom einf¨ uhrenden Lehrbuch bis hin zur speziellen Monographie. Diese Situation n¨ otigt jedem neu hinzukommenden Autor eine Rechtfertigung f¨ ur sein Tun ab. So habe ich mir als Ziel gesetzt, die wichtigsten Grundlagen der Zahlentheorie in einer Weise zu pr¨asentieren, die die historische Entwicklung in st¨arkerem Maße als u ucksichtigt. Daneben wollte ich aufzeigen, wie sich ¨blich ber¨ bei der Behandlung mancher spezieller Probleme neue Teilgebiete der Zahlentheorie herausgebildet und selbst¨andig weiter entfaltet haben. Davon, daß dieser Prozeß bisweilen in intensiver Wechselwirkung mit anderen mathematischen Disziplinen ablief, zeugen etwa analytische Zahlentheorie und Funktionentheorie. Eine weitere Aufgabe der vorliegenden Darstellung ist die Heranf¨ uhrung des
VI
Vorwort
Lesers an das Studium vertiefender Literatur, die in den Text eingearbeitet und am Ende des Buches zusammengestellt ist. Behandelt wird in den ersten f¨ unf Kapiteln etwa der Stoff einer einsemestrigen vierst¨ undigen Einf¨ uhrungsvorlesung in die Zahlentheorie. Dabei ergeben sich schon an sehr fr¨ uhen Stellen neue Probleme, die in sp¨ ateren Kapiteln wieder aufgegriffen und vertieft werden. So werden z.B. bereits im ersten Kapitel u ¨ber Teilbarkeit arithmetische bzw. Primzahlfragen angeschnitten, die im f¨ unften und sechsten bzw. siebten fortgef¨ uhrt werden. Besonders in den beiden letztgenannten Kapiteln u ¨ber Transzendenz bzw. Primzahlen soll der Leser beispielhaft lernen, wie die Zahlentheorie sich zur L¨ osung ihrer Probleme bisweilen anderer mathematischer Disziplinen bedient. Beide Kapitel belegen eindrucksvoll die Leistungsf¨ahigkeit funktionentheoretischer Methoden im Einsatz bei zahlentheoretischen Fragestellungen, wobei im sechsten außerdem einige S¨atze aus der Algebra zum ben¨ otigten Instrumentarium geh¨oren. ¨ Das Inhaltsverzeichnis gestattet einen sehr detaillierten Uberblick u ¨ ber den behandelten Stoff. Dabei wird der eine Kenner dies, der andere jenes vermissen, etwa die Theorie der quadratischen Formen oder die Geometrie der Zahlen, um nur zwei Unterlassungen zu nennen, die in ihrer Gesamtheit von der auferlegten Beschr¨ankung des Buchumfangs herr¨ uhren. Aus demselben Grund sind ¨ außer kleineren Dingen, die gelegentlich “dem Leser zur Ubung u ¨berlassen” werden, auch keine Aufgaben eingearbeitet. In dieser Hinsicht muß der interessierte Leser auf einige im Literaturverzeichnis zusammengestellte B¨ ucher verwiesen werden. Was die Ausf¨ uhrlichkeit der Darstellung angeht, wird sie dem Kenner zu groß sein, w¨ahrend sie dem Anf¨anger in gewissen Passagen zu knapp erscheinen mag. Generell sollte das Buch, abgesehen von Kap. 1, §§ 5, 6, Kap. 6, §§ 4, 5 und Kap. 7, § 3, jedem interessierten Leser zug¨anglich sein, der in gymnasialer Oberstufe, universit¨aren Anf¨ angerkursen oder im Selbststudium die Sprache der modernen ¨ Mathematik erlernt und eine gewisse Ubung im Umgang mit mathematischen Sachverhalten und Schlußweisen erlangt hat. Ein Zitat 3.4.2 verweist auf Abschnitt 2 im Paragraphen 4 des Kapitels 3, Satz 3.4.2A auf den dort zu findenden Satz A. Innerhalb eines Kapitels bleibt bei Zitaten die Nummer dieses Kapitels weg, im gleichen Paragraphen eines Kapitels auch noch die Paragraphennummer; so wird mit Satz 2A bzw. Lemma 2 der Satz A bzw. das Lemma in Abschnitt 2 desselben Kapitels und Paragraphen zitiert. Schließlich deutet das Zeichen das Ende eines Beweises an. Aus der Reihe der konstruktiven Kritiker, die manche Verbesserung oder Erg¨anzung angeregt haben, sei Herr Dozent Dr. A. T. Peth¨ o besonders hervorgehoben. Nicht zuletzt hat er sich, ebenso wie Herr Dr. S. Eckmann, der M¨ uhe
Vorwort
VII
unterzogen, die erste Fassung des Manuskripts gewissenhaft durchzusehen; die endg¨ ultige Version wurde von Herrn cand. math. T. T¨ opfer vollst¨ andig gepr¨ uft. Allen drei Herren m¨ochte ich f¨ ur ihre Mithilfe bestens danken. Frau E. Stiehl–Sch¨ ondorfer besorgte das Schreibmaschinenmanuskript, Frau E. Lorenz nahm die Erfassung in TEX vor; beiden Damen gilt mein herzlicher Dank f¨ ur ihre sorgf¨altige Arbeit. Schließlich habe ich dem Springer-Verlag f¨ ur sein Entgegenkommen zu danken. K¨oln, im Juli 1987
P. Bundschuh
Vorwort zur zweiten Auflage Die vorliegende zweite Auflage der “Einf¨ uhrung in die Zahlentheorie” stellt eine korrigierte und, wo n¨otig, auf den neuesten Stand gebrachte Fassung der 1988 erschienenen Erstauflage dar. Auch das Literaturverzeichnis wurde — dem Geschmack des Verfassers gem¨aß — aktualisiert, wobei erneut keinerlei Vollst¨andigkeit angestrebt werden konnte. Danken m¨ochte ich dem Verlag f¨ ur sein freundliches Angebot, diese Zweitauflage meiner “Zahlentheorie” in seine Reihe “Springer-Lehrbuch” aufzunehmen. Schließlich habe ich Herrn Dipl.–Math. R. M¨ uller f¨ ur die Besorgung der reproduktionsf¨ahigen TEX–Vorlage der Zweitauflage ebenso zu danken wie meinem Sohn Ralf, ohne dessen stete Bereitschaft zur Computerunterst¨ utzung manche Tabelle nicht so z¨ ugig entstanden w¨are. K¨oln, im Dezember 1991
P. Bundschuh
Vorwort zur dritten Auflage Gegen¨ uber der zweiten Auflage mußte diese dritte erneut aktualisiert werden, nicht zuletzt wegen des inzwischen gelungenen Beweises der Fermatschen Vermutung. Auch waren einige weitere kleine Inkorrektheiten oder Druckfehler zu beseitigen, auf die ich zum Teil von Lesern der fr¨ uheren Auflagen hingewiesen wurde, denen ich f¨ ur ihre Kritik deshalb dankbar bin. F¨ ur die technische Herstellung des u ondorfer ¨ berarbeiteten Textes danke ich Frau E. Stiehl-Sch¨ und Herrn Dipl.-Math. B. Greuel sehr herzlich. K¨oln, im Juni 1996
P. Bundschuh
VIII
Vorwort
Vorwort zur vierten bis sechsten Auflage Auch f¨ ur diese Neuauflagen waren einige Passagen dem aktuellen Stand der Forschung anzupassen, etwa dort, wo Rekorde rasch fallen, wie bei den Mersenneschen Primzahlen oder bei der Dezimalbruchentwicklung so prominenter Zahlen wie π. Wieder habe ich einer Reihe von Lesern – meine Diktion schließt Leserinnen stets mit ein – f¨ ur Verbesserungsvorschl¨ age sehr zu danken ebenso wie Frau Stiehl-Sch¨ ondorfer und den Herren Dipl.-Math. B. Greuel und ¨ Dr. M. Welter f¨ ur ihre Mithilfe bei den jeweiligen Uberarbeitungen. K¨oln, Juni 1998, M¨arz 2002, August 2007
P. Bundschuh
Inhaltsverzeichnis
Kapitel 1. Teilbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
§ 1.
Fundamentalsatz der Arithmetik . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1. Nat¨ urliche und ganze Zahlen 2. Teiler 3. Primzahlen 4. Satz von Euklid 5. Der Fundamentalsatz der Arithmetik 6. Kanonische Primfaktorzerlegung 7. Teileranzahl- und Teilersummenfunktion 8. Vollkommene Zahlen 9. Irrationalit¨at 10. Anmerkung zum Eindeutigkeitsbeweis
§ 2.
Gr¨ oßter gemeinsamer Teiler, kleinstes gemeinsames Vielfaches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1. Gr¨oßter gemeinsamer Teiler (ggT) 2. Divisionsalgorithmus 3. Zwei Charakterisierungen des ggT 4. Idealtheoretische Deutung des ggT 5. Rechenregeln 6. Teilerfremdheit 7. Charakterisierung der Primzahlen 8. Nochmals: Eindeutigkeit im Fundamentalsatz 9. Euklidischer Algorithmus und ggT 10. Regelm¨aßiger Kettenbruch rationaler Zahlen 11. Kleinstes gemeinsames Vielfaches (kgV) 12. Zusammenhang zwischen ggT und kgV
§ 3.
Lineare diophantische Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . 27 1. Warum “diophantisch”? 2. L¨osbarkeitsbedingung 3. Der Fall zweier Unbestimmten 4. Spezielle L¨osung, numerisches Beispiel 5. Reduktion des allgemeinen Falls 6. Struktur der L¨ osungsgesamtheit
§ 4.
Zahlentheoretische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 1. Einige Definitionen 2. Multiplikative und additive Funktionen 3. Produktdarstellung unendlicher Reihen 4. Riemannsche Zetafunktion 5. Zweimal Euklids Satz 6. Faltung 7. Inverse bez¨ uglich Faltung 8. Die Gruppe der multiplikativen Funktionen 9. M¨ obiussche M¨ ufunktion 10. Weitere spezielle multiplikative Funktionen 11. Eulers Phifunktion und Verallgemeinerungen 12. Eine Aussage “im Mittel” 13. Wahrscheinlichkeit f¨ ur Teilerfremdheit 14. Historische Anmerkungen
X
Inhaltsverzeichnis
§ 5.
Teilbarkeit in Integrit¨ atsringen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 1. Teiler, Einheiten, Assoziiertheit 2. Die Begriffe ggT und kgV 3. Unzerlegbare Elemente, Primelemente 4. Faktorielle Ringe 5. Hauptidealringe 6. Euklidische Ringe 7. Polynome 8. Polynomringe u orpern ¨ber K¨ 9. Polynomringe u ¨ber faktoriellen Ringen
§ 6.
Algebraische Zahlk¨ orper, insbesondere quadratische . . . . . . 65 1. Algebraische Zahlen, Minimalpolynom 2. Konjugierte 3. Algebraische Zahlk¨ orper 4. Normen 5. Ganzheit 6. Quadratische Zahlk¨ orper 7. Deren Ganzheitsring 8. Einheiten quadratischer Zahlringe 9. Euklidische quadratische Zahlringe 10. Primzahlen als Summe zweier Quadrate 11. Dedekinds Beispiel
Kapitel 2. Kongruenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 § 1.
Lineare Kongruenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 1. Definition der Kongruenz, elementare Eigenschaften 2. FermatZahlen 3. K¨ urzungsregel 4. Vollst¨andige Restsysteme 5. Lineare Kongruenzen 6. Bruchschreibweise 7. Restklassenring 8. Prime Restklassengruppe 9. Historische Bemerkungen
§ 2.
Simultane lineare Kongruenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 1. Reduktion des Problems 2. Paarweise teilerfremde Moduln 3. Anwendungen, numerische Beispiele 4. Restklassenring als direkte Summe 5. Prime Restklassengruppe als direktes Produkt 6. Historische Bemerkungen
§ 3.
Die S¨ atze von Fermat, Euler und Wilson . . . . . . . . . . . . . . . . . . 94 1. Dirichlets Schubfachprinzip 2. Kongruenzverhalten von Potenzen 3. Der “kleine” Fermatsche Satz 4. Der Eulersche Satz 5. Numerische Anwendungen 6. Zusammengesetzt oder Primzahl? 7. Fermat–Euler und geheime Nachrichten¨ ubermittlung 8. Satz von Wilson 9. Anwendung auf eine quadratische Kongruenz
§ 4.
Polynomiale Kongruenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 ¨ 1. Problemstellung 2. Reduktion auf Primzahlpotenzmoduln 3. Uberlegungen zur weiteren Reduktion 4. Reduktion auf Primzahlmoduln 5. Polynomkongruenzen bei Primzahlmoduln 6. Ein Beispiel
Inhaltsverzeichnis
§ 5.
XI
Primitivwurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 1. Definition 2. Primitivwurzeln modulo Primzahlen 3. Tabellen f¨ ur Primitivwurzeln 4. Zu welchen Moduln sind Primitivwurzeln m¨ oglich? 5. Bestimmung aller Moduln mit Primitivwurzeln 6. Zweierpotenzen als Moduln 7. Basisdarstellung
Kapitel 3. Potenzreste, insbesondere quadratische Reste . . . . . . . 121 § 1.
Indexrechnung und Potenzreste . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 1. Indizes 2. Ein Beispiel 3. n–te Potenzreste, quadratische Reste und Nichtreste 4. Kriterium f¨ ur n–te Potenzreste 5. Folgerungen aus dem Kriterium 6. n–te Potenzreste, Modulzerlegung in Primzahlpotenzen
§ 2.
Quadratische Reste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 1. Quadratische Kongruenzen und quadratische Reste 2. Kriterium f¨ ur quadratische Reste 3. Das Legendre–Symbol 4. Eulers Kriterium 5. Gausssches Lemma 6. Quadratisches Reziprozit¨ atsgesetz, Erg¨ anzungss¨atze 7. Beweis des Reziprozit¨atsgesetzes 8. Ein numerisches Beispiel 9. Quadratische Nichtreste modulo Primzahlen 10. Primzahlen in arithmetischen Progressionen 11. Primfaktoren von Fermat–Zahlen 12. Mersenne–Primzahlen 13. Historisches zum Reziprozit¨ atsgesetz
§ 3.
Verteilung quadratischer Reste . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 1. Summen u ¨ber gewisse Legendre–Symbole 2. Paare sukzessiver quadratischer Reste 3. Tripel sukzessiver quadratischer Reste 4. Eigenschaften Jacobsthalscher Summen
Kapitel 4. Additive Probleme und diophantische Gleichungen . . 153 § 1.
Potenzsummen, insbesondere Quadratsummen . . . . . . . . . . . . 154 1. Primzahlen als Summe zweier Quadrate 2. Thues Lemma 3. Nat¨ urliche Zahlen als Summe zweier Quadrate 4. Nat¨ urliche Zahlen als Summe von vier Quadraten: Lagranges Satz 5. Nochmals Primzahlen als Summe zweier Quadrate 6. Summen dreier Quadrate 7. Warings Problem und Hilberts Satz 8. Anmerkungen u ¨ber Darstellungsanzahlen
XII
Inhaltsverzeichnis
§ 2.
Polynomiale diophantische Gleichungen . . . . . . . . . . . . . . . . . . . 167 1. Pythagor¨aische Tripel 2. Euklids Satz u aische Tripel ¨ ber pythagor¨ 3. Rationale Punkte auf Kurven zweiten Grades 4. Rationale Punkte gewisser Kurven dritten Grades 5. Resultate von Poincare, Mordell und Faltings 6. Pythagor¨aische Dreiecke quadratischer Kathetenl¨ angen 7. Fermats Vermutung 8. Weitere Entwicklung des Fermat–Problems (bis 1993) 9. L¨osung des Fermat–Problems
§ 3.
Die Pellsche Gleichung und Verwandtes . . . . . . . . . . . . . . . . . . . 185 1. Problemstellung 2. Der Dirichletsche Approximationssatz 3. Unendlich viele L¨osungen der Pell-Gleichung 4. L¨ osungsstruktur der Pell-Gleichung 5. Pythagor¨aische Dreiecke mit Kathetendifferenz Eins 6. Einheiten reell–quadratischer Zahlk¨orper 7. Ganze Punkte auf Kurven zweiten Grades 8. Anmerkungen dazu
Kapitel 5. Verschiedene Entwicklungen reeller Zahlen . . . . . . . . . . 200 § 1.
Die g–adische Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 1. Entwicklung nat¨ urlicher Zahlen 2. Teilbarkeitsregeln 3. Der gebrochene Teil reeller Zahlen 4. Entwicklung reeller Zahlen 5. Entwicklung rationaler Zahlen 6. Periodizit¨atseigenschaften der Ziffernfolge 7. Dezimalbruchentwicklungen 8. Rationale Zahlen mit gleichen Nennern 9. Eine Anwendung des Irrationalit¨atskriteriums 10. Existenz transzendenter Zahlen 11. Dezimalbruchentwicklung und Dichtung 12. Historische Anmerkungen
§ 2.
Die Cantorsche Entwicklung. Weitere Irrationalit¨ atskriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 1. Beschreibung der Entwicklung 2. Cantorsche Reihen und Irrationalit¨at 3. Verwandte Irrationalit¨atskriterien 4. Anwendungen
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung . . . . . . . . . . . . . . . . . 222 1. Der Kettenbruchalgorithmus 2. Konvergenz unendlicher Kettenbr¨ uche 3. Eindeutigkeit. Irrationalit¨at 4. Periodische Kettenbr¨ uche 5. Der Satz von Lagrange 6. Zur Minimall¨ osung der Pellschen Gleichung 7. Ann¨aherung reeller Zahlen durch rationale 8. Beste N¨ aherungen 9. Anmerkungen dazu 10. Approximation algebraischer Zahlen zweiten Grades durch rationale 11. Eine arithmetische Eigenschaft von e2/k 12. Kettenbruchentwicklung von e
Inhaltsverzeichnis
XIII
Kapitel 6. Transzendenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 § 1.
Entdeckung der Transzendenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 1. Historisches 2. Der Liouvillesche Approximationssatz 3. Konstruktion transzendenter Kettenbr¨ uche 4. Transzendente g–adische Reihen
§ 2.
Sch¨ arfere Approximationss¨ atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 1. Der Thue–Siegel–Rothsche Satz 2. Anwendungen auf Transzendenz 3. Thue–Gleichung und Roths Verallgemeinerung 4. Reduktion auf den Thue–Siegel–Rothschen Satz 5. Effektivit¨ atsfragen 6. Schmidts S¨atze u ¨ber simultane Approximation
§ 3.
Die S¨ atze von Hermite, Lindemann und Weierstraß . . . . . . . 257 1. Historisches 2. Hauptergebnisse von Hermite und Lindemann ¨ 3. Der Satz von Lindemann-Weierstrass 4. Zur Aquivalenz der vier Versionen
§ 4.
Die Methode von Hermite–Mahler . . . . . . . . . . . . . . . . . . . . . . . . 263 1. Vorbemerkungen 2. Ungleichungen f¨ ur algebraische Zahlen 3. Konstruktion geeigneter Exponentialpolynome 4. Eigenschaften dieser Exponentialpolynome 5. Eine Determinantenbetrachtung 6. Gewinnung einer nichtverschwindenden algebraischen Zahl 7. Untere Absch¨ atzung 8. Obere Absch¨atzung 9. Parameterwahl 10. Historische Anmerkung
§ 5.
Der Satz von Gel’fond–Schneider . . . . . . . . . . . . . . . . . . . . . . . . . 271 1. Hilberts siebtes Problem 2. Ein Schubfachschluß 3. Siegelsches Lemma 4. Hilfsfunktion f¨ ur Gel’fond-Schneider 5. Gewinnung einer zur Absch¨atzung geeigneten Zahl 6. Untere Absch¨ atzung 7. Obere Absch¨atzung 8. Parameterwahl 9. Ausblicke
Kapitel 7. Primzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282 § 1.
Elementare Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282 1. Darstellung von Primzahlen durch Polynome 2. Exponentielle Folgen von Primzahlen 3. Große L¨ ucken 4. Sieb des Eratosthenes, Primzahltafeln 5. Anzahlfunktion 6. Primzahlzwillinge 7. Die Goldbach– Probleme
XIV
Inhaltsverzeichnis
§ 2.
Anzahlfunktion: Tchebychefs S¨ atze . . . . . . . . . . . . . . . . . . . . . . . . 293 1. Vermutungen von Legendre und Gauss 2. Legendres Identit¨ at 3. Obere Absch¨atzung 4. Partielle Summation 5. Zwei asymptotische Ergebnisse von Mertens 6. Letzte Vorstufe des Primzahlsatzes
§ 3.
Der Primzahlsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 1. Riemanns Anstoß 2. Konvergenz einer Folge und Primzahlsatz 3. Die Reste der Zetareihe 4. Fortsetzung und Nullstellenfreiheit der ¨ Riemannschen Zetafunktion 5. Uber gewisse Dirichlet-Reihen 6. Die Existenz des Grenzwerts 7. Anwendung des Cauchy-Kriteriums 8. Konvergenzsatz 9. Mittelwert der M¨ obius-Funktion 10. Funktionalgleichung der Zetafunktion 11. Pole und Nullstellen der Zetafunktion 12. Riemannsche Vermutung 13. Schlußbemerkungen
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 Namen– und Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
Kapitel 1.
Teilbarkeit
Die ersten zwei Paragraphen dieses einf¨ uhrenden Kapitels entwickeln die Teilbarkeitstheorie im speziellen Integrit¨ atsring der ganzen Zahlen in einem Umfang, der bereits interessante Teile der “elementaren” Zahlentheorie zu begr¨ unden gestattet. Diese beiden Anfangsparagraphen besch¨aftigen sich mit dem multiplikativen Aufbau der ganzen Zahlen aus Primzahlen und gipfeln in zwei Beweisen f¨ ur den Fundamentalsatz der Arithmetik. Die in § 3 aufgeworfene und vollst¨andig behandelte Frage nach der L¨ osbarkeit linearer diophantischer Gleichungen und nach der genauen Struktur der L¨ osungsgesamtheit solcher Gleichungen kann als nat¨ urliche Verallgemeinerung der Frage nach Teilbarkeit zweier ganzer Zahlen verstanden werden. Die in diesem Paragraphen besprochene Problematik wird in Kap. 4 weitergef¨ uhrt und vertieft. Die als Anwendung des Fundamentalsatzes in § 1 eingef¨ uhrte Teileranzahlfunktion ebenso wie die Teilersummenfunktion sind erste Beispiele multiplikativer zahlentheoretischer Funktionen. Die wichtigsten derartigen Funktionen mit ihren wesentlichen Eigenschaften werden in § 4 aus dem Faltungsbegriff gewonnen, wie dies in moderneren Darstellungen u ¨blich geworden ist. Der eilige Leser kann § 4 ohne weiteres bei der ersten Lekt¨ ure u ¨bergehen, muß allerdings auf diesen Paragraphen jeweils dann zur¨ uckkommen, wenn er an sp¨ ateren Stellen des Buchs auf spezielle zahlentheoretische Funktionen st¨oßt, deren Eigenschaften er ben¨ otigt. So wird er bereits ab Kap. 2 die in 4.11 bereitgestellten Ergebnisse u ¨ber die Eulersche Phifunktion immer wieder brauchen. Dagegen wird er sich mit anderen Dingen, die zweckm¨ aßigerweise ebenfalls schon in § 4 vorbereitet sind, erst sp¨ater intensiver vertraut machen m¨ ussen. Die beiden letzten Paragraphen 5 und 6 dieses Anfangskapitels verfolgen haupts¨achlich zwei Ziele: Einerseits besch¨aftigen sie sich mit der Teilbarkeitstheorie beliebiger Integrit¨ atsringe. Dabei steht das Problem im Vordergrund, Bedingungen an solche Ringe zu finden, die garantieren, daß eine multiplikative Zerlegungsaussage analog zum Fundamentalsatz der Arithmetik gilt. Hierher geh¨ oren z.B. die Polynomringe u ¨ber K¨ orpern, die am Ende von § 5 studiert werden.
2
1. Teilbarkeit
Andererseits leiten diese u ¨ber zum zweiten Hauptziel, der Kl¨arung der wichtigsten Eigenschaften algebraischer Zahlen und algebraischer Zahlk¨orper in der ersten H¨alfte von § 6. Dort werden insbesondere s¨ amtliche algebraischen Grundlagen f¨ ur die Transzendenzuntersuchungen in Kap. 6 gelegt. Gegen Ende von § 6 wird die Problematik von § 5 aufgenommen, indem nun speziell die Integrit¨ atsringe der ganzen Zahlen besonders einfacher algebraischer, n¨ amlich quadratischer Zahlk¨ orper daraufhin untersucht werden, ob in ihnen ein Analogon zum Fundamentalsatz gilt. Die Paragraphen 5 und 6, die der Leser zun¨ achst u ¨berschlagen und zu denen er sp¨ater bei Bedarf zur¨ uckkehren kann, enthalten nahezu alle in diesem Buch ben¨ otigten Tatsachen aus der Algebra.
§ 1.
Fundamentalsatz der Arithmetik
1. Nat¨ urliche und ganze Zahlen. Mit N bzw. Z werden hier wie u ¨blich die Mengen der nat¨ urlichen Zahlen 1, 2, 3, ... bzw. der ganzen Zahlen ..., −1, 0, 1, 2, ... bezeichnet. In der Zahlentheorie nimmt man ihre axiomatische Einf¨ uhrung als bereits vollzogen hin und interessiert sich f¨ ur zahlreiche spezielle Eigenschaften, die diese Zahlen haben k¨ onnen. F¨ ur eine axiomatische Beschreibung der beiden genannten Mengen muß der Leser auf die einschl¨ agige Lehrbuchliteratur verwiesen werden. Nur der Bequemlichkeit halber sollen hier kurz die wichtigsten Eigenschaften nat¨ urlicher bzw. ganzer Zahlen zusammengestellt werden, soweit sie zu den in diesem Buch (meist stillschweigend) benutzten unmittelbaren Konsequenzen aus der axiomatischen Beschreibung zu rechnen sind. Die nat¨ urlichen Zahlen bilden eine Menge N, aus der ein mit 1 bezeichnetes Element hervorgehoben ist und auf der eine injektive Selbstabbildung S (“Nachfolgefunktion”) mit 1 ∈ S(N) definiert ist, so daß gilt: Wenn f¨ ur eine Teilmenge M ⊂ N die Bedingungen 1 ∈ M und S(M ) ⊂ M gelten, dann ist M = N. 0. Das letztgenannte Axiom ist eine mengentheoretische Fassung des wohlbekannten Prinzips der vollst¨ andigen Induktion. 1. Sodann wird eine Addition + und eine Multiplikation · in N definiert, f¨ ur die man s¨amtliche vertrauten Rechenregeln (Assoziativ- und Kommutativgesetze sowie Distributivgesetz) nachweisen kann. 2. Des weiteren werden auf N Relationen < bzw. ≤ in der u ¨blichen Weise eingef¨ uhrt: F¨ ur m, n ∈ N schreibt man m < n genau dann, wenn es ein q ∈ N mit m + q = n gibt; man schreibt m ≤ n genau dann, wenn m < n oder m = n zutrifft. Offenbar ist ≤ eine Ordnungsrelation: Die f¨ ur eine Ordnung charak-
§1.
Fundamentalsatz der Arithmetik
3
teristischen Eigenschaften (Reflexivit¨ at, Antisymmetrie, Transitivit¨at) k¨ onnen n¨ amlich f¨ ur ≤ leicht nachgewiesen werden. Auch ergeben sich die Monotonie der obigen Ordnungsrelation ≤ bez¨ uglich Addition und Multiplikation ebenso wie deren Linearit¨ at. 3. Schließlich ist jetzt das folgende, f¨ ur viele Beweise der Zahlentheorie u ¨beraus n¨ utzliche Prinzip des kleinsten Elements einfach zu zeigen: Jede nicht leere Teilmenge von N hat ein (eindeutig bestimmtes) kleinstes Element, d.h. aus M ⊂ N, M = ∅ folgt die Existenz (genau) eines m ∈ M mit m ≤ n f¨ ur alle n ∈ M. Bemerkungen. 1) Wie u ¨blich wird 2 := S(1), 3 := S(2) usw. geschrieben. 2) Andere gel¨ aufige Varianten des Induktionsprinzips wie z.B. die mit beliebigem Induktionsanfang oder diejenigen, welche f¨ ur den Induktionsschritt nicht nur die unmittelbar vorausgehende Aussage, sondern alle vorangehenden ausnutzt, werden ebenso angewandt. Aus der bez¨ uglich der Addition + kommutativen Halbgruppe N gewinnt man rein algebraisch (durch Bildung von Paaren nat¨ urlicher Zahlen) die additive Gruppe Z der ganzen Zahlen. Die urspr¨ unglich nur in N definierte Multiplikation · kann so auf Z fortgesetzt werden, daß Z bez¨ uglich seiner Addition und Multiplikation einen Integrit¨ atsring bildet, d.h. einen kommutativen, nullteilerfreien Ring mit Einselement. Schließlich l¨ aßt sich die Ordnungsrelation ≤ von N auf Z so erweitern, daß die oben genannten Linearit¨ ats- und Monotonieeigenschaften erhalten bleiben mit der alleinigen Maßgabe, daß aus , m, n ∈ Z und m ≤ n die Beziehung ·m ≤ ·n (das Multiplikationszeichen · wird sp¨ ater in der Regel weggelassen) nur noch bei 0 ≤ , d.h. bei ∈ N0 := N ∪ {0} folgt. In N bzw. Z definiert man erg¨ anzend n ≥ m (bzw. n > m) durch m ≤ n (bzw. m < n). Bequem ist auch die Einf¨ uhrung des Absolutbetrages durch |n| := n, falls n ∈ N0 bzw. |n| := −n, falls −n ∈ N0 . Bemerkung. 3) Sehr bald werden in diesem Buch rationale und reelle, etwas sp¨ater komplexe Zahlen auftreten. Auch die grundlegende Einf¨ uhrung der K¨ orper Q, IR bzw. C der rationalen, reellen bzw. komplexen Zahlen wird hier als anderweitig durchgef¨ uhrt betrachtet. Genauso werden elementare Funktionen wie Wurzel- oder Logarithmusfunktionen als bekannt vorausgesetzt.
2. Teiler. Sind m = 0 und n ganze Zahlen, so heißt n durch m teilbar, wenn es eine (und dann auch nur eine) ganze Zahl q mit n = mq gibt. Gleichbedeutend damit sind Sprechweisen wie: m ist ein Teiler von n, oder: n ist ein Vielfaches
4
1. Teilbarkeit
von m, oder: m geht in n auf. In Zeichen wird dies durch m|n ausgedr¨ uckt; m |n bedeutet die Negation dieser Aussage, besagt also, daß n nicht durch m teilbar ist. Es sei ausdr¨ ucklich betont, daß Teiler hier und im folgenden stets als von Null verschieden vorausgesetzt werden: Dies geschieht deshalb, weil die Gleichung n = 0 · q nur f¨ ur n = 0 bestehen kann, dann allerdings f¨ ur jedes ganze q. Aus der angegebenen Definition der Teilbarkeit in Z folgen einige leichte Rechenregeln, die sogleich als Satz zusammengestellt seien; dabei bedeuten lateinische Buchstaben, gleichg¨ ultig ob indiziert oder nicht, stets ganze Zahlen. Satz. (i)
F¨ ur jedes n = 0 gilt n|0 und n|n.
(ii)
Gilt m|n, so auch −m|n und m| − n.
(iii)
F¨ ur alle n gilt 1|n.
(iv)
Aus m|n und n = 0 folgt |m| ≤ |n|.
(v)
Aus n|1 folgt entweder n = 1 oder n = −1.
(vi)
Aus m|n und n|m folgt entweder n = m oder n = −m.
(vii)
Aus |m und m|n folgt |n.
(viii)
Bei = 0 sind m|n und m|n gleichbedeutend.
(ix)
Gelten m|n1 und m|n2 , so auch m|(1 n1 + 2 n2 ) bei beliebigen 1 , 2 .
(x)
Gelten m1 |n1 und m2 |n2 , so auch m1 m2 |n1 n2 .
Exemplarisch sei der Beweis f¨ ur die Regel (vii) gef¨ uhrt. Die dort gemachte Voraussetzung besagt, daß es ganze q1 , q2 gibt, so daß m = q1 und n = mq2 gelten. Daraus folgt n = (q1 q2 ) und dies bedeutet |n. Bemerkungen. 1) Folgerungen wie in (v) bzw. (vi) werden oftmals k¨ urzer als n = ±1 bzw. n = ±m notiert. 2) Die beiden Regeln (i) und (ii) beinhalten offenbar, daß man bei der Untersuchung der Frage, ob m|n oder m |n gilt, o.B.d.A. m und n als nat¨ urliche Zahlen voraussetzen darf.
3. Primzahlen. Regel (iv) des letzten Satzes besagt, daß jedes n ∈ N h¨ ochstens n verschiedene nat¨ urliche Teiler haben kann. Schreibt man τ (n) f¨ ur die Anzahl der verschiedenen nat¨ urlichen Teiler von n ∈ N, so ist stets τ (n) ≤ n. Nach Satz 2(iii) ist τ (n) ≥ 1, insbesondere τ (1) = 1. Die Teileranzahlfunktion τ wird in 7 und sp¨ ater in § 4 genauer untersucht.
§1.
Fundamentalsatz der Arithmetik
5
Kombiniert man die Regeln (i) und (iii) aus Satz 2, so erh¨ alt man τ (n) ≥ 2 f¨ ur jedes ganze n ≥ 2. Diejenigen n mit τ (n) = 2 bekommen nun einen speziellen Namen: Eine ganze Zahl n ≥ 2 heißt Primzahl, wenn 1 und n ihre einzigen positiven Teiler sind. Ist eine ganze Zahl n ≥ 2 nicht Primzahl, so heißt sie zusammengesetzt. Nach dieser Definition ist 1 keine Primzahl. Ein Grund, warum man die Definition heute stets so faßt, daß 1 nicht zu den Primzahlen rechnet, wird in Bemerkung 3 von 5 erl¨ autert. Die Folge der Primzahlen, der Gr¨ oße nach geordnet, beginnt also mit 2, 3, 5, 7, 11, 13, 17, 19, 23, . . .
.
Zur Kl¨ arung der Frage, ob die bisweilen mit IP bezeichnete Menge aller Primzahlen unendlich ist, beweist man zun¨ achst das Lemma. Der kleinste positive, von 1 verschiedene Teiler p(n) jeder ganzen Zahl n ≥ 2 ist Primzahl. Beweis. Nach Satz 2(i) hat n (≥ 2) mindestens einen von 1 verschiedenen positiven Teiler, n¨amlich n selbst. Die Menge aller derartigen Teiler ist also nicht leer und hat daher ein kleinstes Element (vgl. das in 1 explizit aufgef¨ uhrte “Prinzip”), welches p(n) genannt werde; es ist offenbar p(n) ≥ 2. W¨ are p(n) nicht Primzahl, so h¨ atte es einen von 1 und p(n) verschiedenen positiven Teiler t. Nach Satz 2(iv), (vii) w¨are t < p(n) bzw. t|n und in Verbindung mit t ≥ 2 w¨ urde dies der Definition von p(n) widersprechen. Die vor dem Lemma aufgeworfene Frage beantwortet der 4. Satz von Euklid.
Es gibt unendlich viele Primzahlen.
Beweis. Sind p0 , . . . , pr−1 ∈ IP paarweise verschieden, so definiert man die von 1 verschiedene Zahl n ∈ N durch (1)
n := 1 +
r−1
pρ
.
ρ=0
Nach Lemma 3 ist p(n) eine n teilende Primzahl. W¨ are p(n) gleich einem der pρ , so w¨ urde p(n)|1 gelten nach Satz 2(ix), was nicht geht. Man hat also pr := p(n) ∈ IP \ {p0 , . . . , pr−1 }.
6
1. Teilbarkeit
Der vorstehende Beweis liefert ein effektives Verfahren (man redet von einem Algorithmus) zur Gewinnung unendlicher Folgen (pr )r∈N0 paarweise verschiedener Primzahlen: Man startet mit beliebigem p0 ∈ IP, denkt sich die r paarweise verschieden p0 , . . . , pr−1 ∈ IP bereits erhalten, definiert nr durch die rechte Seite in (1) und setzt dann pr := p(nr ). Beginnt man etwa mit p0 := 2, so f¨ uhren die ersten Schritte dieses Verfahrens zur folgenden kleinen Tabelle:
r
0
1
2
3
4
5
6
7
nr
–
3
7
43
1807
23479
1244335
6221671
pr
2
3
7
43
13
53
5
6221671
Um hier zu entscheiden, ob 1807 Primzahl ist, braucht man keineswegs von allen Primzahlen √ p < 1807 festzustellen, ob sie 1807 teilen oder nicht. Es reicht, dies ur die Primzahlen unterhalb 43. Dies reduziert f¨ ur die p ≤ 1807 zu tun, also f¨ den Rechenaufwand ganz erheblich und man st¨ utzt sich dabei auf folgende Proposition. √ n gilt.
Eine ganze Zahl n ≥ 2 ist genau dann Primzahl, wenn p(n) >
√ Beweis. F¨ ur n ∈ IP ist p(n) = n > n. Ist n zusammengesetzt, so schreibt man n = mp(n); die nat¨ urliche Zahl m gen¨ ugt 1 < m < n und man hat p(m) ≥ p(n), also n ≥ p(m)p(n) ≥ p(n)2 . Bemerkungen. 1) Euklids Satz findet sich (im wesentlichen mit dem hier pr¨ asentierten Beweis) wie folgt in Buch IX, § 20 seiner Elemente (griechisch Στ oιχε˜ια) formuliert: “Es gibt mehr Primzahlen als jede vorgelegte Anzahl von Primzahlen.” 2) Weitere Beweise des Euklidschen Satzes finden sich in 4.5, 4.11 und 2.1.2. In Kap. 7 wird insbesondere die durch π(x) := #{p ∈ IP : p ≤ x} definierte, st¨ uckweise konstante, monoton wachsende Funktion π : IR → N0 eingehend untersucht. Sie beschreibt quantitativ die Verteilung der Primzahlen in der Menge der nat¨ urlichen Zahlen.
5. Der Fundamentalsatz der Arithmetik ist das Hauptergebnis dieses ersten Paragraphen und zeigt deutlich die große Bedeutung der Primzahlen f¨ ur den multiplikativen Aufbau der nat¨ urlichen Zahlen.
§1.
7
Fundamentalsatz der Arithmetik
Fundamentalsatz der Arithmetik. Jede von Eins verschiedene nat¨ urliche Zahl ist als Produkt endlich vieler Primzahlen darstellbar; diese Darstellung ist eindeutig, wenn man die in ihr vorkommenden Primzahlen der Gr¨ oße nach ordnet. Ohne eine solche Ordnung ist diese Darstellung also nur bis auf die Reihenfolge der eingehenden Primzahlen eindeutig. Existenzbeweis. Ist n Primzahl, so ist nichts weiter zu tun; insbesondere hat man damit den Induktionsanfang bei n = 2 erledigt. Sei nun n ∈ N, n > 2 und es werde die Existenz einer Zerlegung f¨ ur alle m ∈ {2, . . . , n − 1} vorausgesetzt. O.B.d.A. darf angenommen werden, daß n zusammengesetzt ist. Nach Lemma 3 ist p(n) Primzahl und es werde n = mp(n) geschrieben, woraus sich m ∈ {2, . . . , n − 1} ergibt. Nach Induktionsvoraussetzung hat man m=
r
pρ
ρ=1
mit gewissen pρ ∈ IP, was mit pr+1 := p(n) ∈ IP zu n =
r+1 ρ=1
pρ f¨ uhrt.
Eindeutigkeitsbeweis. Wird angenommen, die Menge der nat¨ urlichen Zahlen > 1 mit nicht eindeutiger Produktzerlegung sei nicht leer, so sei n ihr kleinstes Element. Schreibt man wieder n = mp(n), so ist dies eine Produktzerlegung von n, unter deren Faktoren die Primzahl p(n) vorkommt. Nach der u ¨ber n gemachten Annahme hat diese Zahl eine weitere Produktzerlegung n = sσ=1 qσ mit allen qσ ∈ IP, die nach Lemma 3 und nach Induktionsvoraussetzung s¨amtliche s gr¨ oßer als p(n) sein m¨ ussen. Setzt man∗) n := n − p(n) σ=2 qσ , so ist dies wegen (1)
n = (q1 − p(n))
s
qσ
σ=2
eine nat¨ urliche Zahl, die wegen p(n)|n und Satz 2(ix) durch p(n) teilbar ist. Weiter ist n < n und also ist n eindeutig in ein Produkt von Primzahlen zerlegbar, unter denen p(n) vorkommt. Aus (1) sieht man dann p(n)|(q1 −p(n)), also p(n)|q1 , was der Tatsache widerspricht, daß q1 ∈ IP, q1 > p(n) gilt. Offenbar liefert der obige Existenzbeweis f¨ ur die Produktzerlegung ein effektives Verfahren zur Gewinnung derselben: Will man ein n ∈ N mit n ≥ 2 in seine ∗)
Wie u ¨blich hat man unter leeren Produkten Eins zu verstehen; genauso hat man leere Summen stets als Null zu interpretieren.
8
1. Teilbarkeit
Primfaktoren (diese Redeweise hat sich f¨ ur die in der Zerlegung vorkommenden Primzahlen eingeb¨ urgert) zerlegen, so setzt man n0 := n und denkt sich die streng fallende Folge n0 > n1 > . . . > nr nat¨ urlicher Zahlen schon so gewonnen, daß f¨ ur ρ = 1, . . . , r gilt (2)
nρ =
nρ−1 p(nρ−1 )
nr ort man auf; andernfalls setzt man nr+1 := p(n . Insgesamt Ist nr = 1, so h¨ r) ist klar, daß das beschriebene Verfahren nach endlich vielen, etwa R Schritten sein Ende erreicht, d.h. es wird n0 > . . . > nR−1 > nR = 1 und es gilt (2) f¨ ur ρ = 1, ..., R. Letzteres zeigt n0 = nR R−1 p(n ), also ρ ρ=0
(3)
n=
R−1
p(nρ )
ρ=0
und dies ist die gesuchte Darstellung von n als Primzahlprodukt. Wegen p(nρ ) ≥ n 2 folgt aus (3) noch R ≤ log , eine Ungleichung, die es zu beurteilen gestattet, log 2 wie lange man bei gegebenem n schlimmstenfalls arbeiten muß, bis man die im Fundamentalsatz gesicherte Primfaktorzerlegung von n gefunden hat. Bemerkungen. 1) Der Fundamentalsatz der Arithmetik steht nicht explizit in Euklids Elementen, obwohl einige der Propositionen in Buch VII bzw. IX ihm nahezu ¨aquivalent sind. Auch in A.M. Legendres Essai sur la Th´eorie des Nombres tritt er noch nicht v¨ ollig pr¨ azisiert hervor. Seine erste klare Formulierung mit Beweis scheint von C.F. Gauss (Disquisitiones Arithmeticae, Art. 16) gegeben worden zu sein: “Theorema. Numerus compositus quicunque unico tantum modo in factores primos resolvi potest.”∗) 2) Der oben gef¨ uhrte Eindeutigkeitsbeweis geht auf E. Zermelo zur¨ uck, der ihn, so H. Hasse (J. Reine Angew. Math. 159, 3-12 (1928)), m¨ undlich an K. Hensel mitteilte. Zermelos Beweis ist hinsichtlich seiner Hilfsmittel sehr einfach, daf¨ ur in seiner Schlußweise recht kunstvoll. Ein weiterer Eindeutigkeitsbeweis, bei dem die Verh¨altnisse eher umgekehrt gelagert sind, wird in 2.8 gef¨ uhrt. 3) Die Aussage des Fundamentalsatzes wird oft ausnahmslos f¨ ur alle nat¨ urlichen Zahlen formuliert; dazu hat man lediglich noch die Zahl 1 als leeres Produkt darzustellen. W¨ urde man 1 zu den Primzahlen rechnen (vgl. 3), so w¨ urde die weitestm¨ogliche Eindeutigkeit der im Fundamentalsatz angesprochenen Zerlegungsaussage verloren gehen: Z.B. w¨ aren 2 · 3 und 1 · 2 · 3 zwei verschiedene Primfaktorzerlegungen der Zahl 6. ∗)
(“Satz. Jede beliebige zusammengesetzte Zahl kann nur auf eine Weise in Primfaktoren zerlegt werden.”)
§1.
Fundamentalsatz der Arithmetik
9
6. Kanonische Primfaktorzerlegung. Nat¨ urlich brauchen die in der Produktzerlegung von n gem¨aß Fundamentalsatz vorkommenden Primzahlen nicht verschieden zu sein; z.B. ist 72 = 2 · 2 · 2 · 3 · 3. F¨ ur solche F¨alle f¨ uhrt man eine k¨ urzere Schreibweise ein: Sind p1 , . . . , pk genau die paarweise verschiedenen, n teilenden Primzahlen und kommt pk genau ak -mal rechts in 5(3) vor, so schreibt man statt 5(3) (1)
n=
k
paκκ
κ=1
und nennt dies die kanonische (Primfaktor-) Zerlegung von n. Oft notiert man (1) auch in der Form (2) n= pνp (n) p
oder a¨hnlich, wobei das Produkt nun u ¨ber alle p ∈ IP erstreckt ist. Die Exponenten νp (n) ∈ N0 in (2), oft auch als Vielfachheit von p in n bezeichnet, sind Null f¨ ur alle p ∈ IP \ {p1 , . . . , pk }; ist p aber gleich einem der pκ aus (1), so ist unter νp (n) das entsprechende aκ aus (1) zu verstehen.
7. Teileranzahl- und Teilersummenfunktion. Hier soll zun¨ achst folgender Hilfssatz vorausgeschickt werden. ur Lemma. F¨ ur m, n ∈ N gilt: m teilt n genau dann, wenn νp (m) ≤ νp (n) f¨ alle p ∈ IP zutrifft. Beweis. Es ist m|n gleichwertig mit der Existenz eines ∈ N, f¨ ur das n = m gilt. Aus dieser Gleichung folgt mit 6(2) und dem Fundamentalsatz νp (n) = νp () + νp (m) f¨ ur alle p ∈ IP, wegen νp () ∈ N0 insbesondere νp (n) ≥ νp (m) f¨ ur alle p ∈ IP. Hat man jedoch diese letzte Tatsache, so sind die Differenzen δp := νp (n) − νp (m) nichtnegative ganze Zahlen ur alle p ∈ IP, aber h¨ ochstens f¨ endlich viele δp sind positiv. Deswegen ist p pδp ∈ N; bezeichnet man dieses Produkt mit , so gilt damit m = n. Hat man nun eine nat¨ urliche Zahl n mit der kanonischen Primfaktorzerlegung 6(1), so erh¨alt man nach obigem Lemma s¨amtliche positiven Teiler m von n in der Gestalt (1)
m=
k κ=1
κ pα κ
mit ακ ∈ {0, . . . , aκ } f¨ ur κ = 1, . . . , k.
10
1. Teilbarkeit
Insbesondere hat man damit f¨ ur die in 3 eingef¨ uhrte Teileranzahl eines gem¨ aß 6(1) (bzw. 6(2)) zerlegten n ∈ N τ (n) =
k
(1 + aκ )
(bzw. τ (n) =
(1 + νp (n))), p
κ=1
was u ¨brigens auch f¨ ur n = 1 gilt und genausogut geschrieben werden kann als (2)
τ (n) =
k
τ (paκκ )
(bzw. τ (n) =
τ (pνp (n) )).
p
κ=1
Bezeichnet jetzt σ(n) die Summe aller positiven Teiler von n ∈ N, und ist n wieder gem¨aß 6(1) zerlegt, so ist nach (1) αk 1 pα (3) σ(n) = 1 · . . . · pk , (α1 ,...,αk )
wobei rechts u ¨ber alle (α1 , . . . , αk ) ∈ {0, . . . , a1 }×. . .×{0, . . . , ak } zu summieren ist. Aus (3) ist σ(n) =
a1 α1 =0
...
ak
1 pα 1
· ... ·
k pα k
=
αk =0
aκ k
κ pα κ
κ=1 ακ =0
klar und dies kann wie vorher bei τ in die a¨quivalente Form (4)
σ(n) =
k κ=1
σ(paκκ )
(bzw. σ(n) =
σ(pνp (n) ))
p
gesetzt werden, welche ersichtlich auch f¨ ur n = 1 zutrifft. Bemerkung. Die soeben eingef¨ uhrte Teilersummenfunktion σ und die Teileranzahlfunktion τ sind erste Beispiele sogenannter zahlentheoretischer Funktionen, welche in § 4 intensiver studiert werden sollen.
8. Vollkommene Zahlen. In der Zahlenmystik des Pythagoras (um 550 v.Chr.) spielten nat¨ urliche Zahlen n, deren von n verschiedene nat¨ urliche Teiler sich zu n addieren, eine ausgezeichnete Rolle. Pythagoras und seine Schule nannten derartige Zahlen vollkommen. Der christliche Theologe und Philosoph Augustinus (354–430) begr¨ undete die Erschaffung der Welt in sechs Tagen damit, daß Gott die Vollkommenheit seines Werkes auch durch die Vollkommenheit der Zahl 6 zum Ausdruck bringen wollte. Ausgedr¨ uckt mit der in 7 eingef¨ uhrten Funktion σ heißt n ∈ N also genau dann ¨ vollkommen (oder perfekt), wenn σ(n) = 2n gilt. Uber gerade vollkommene Zahlen gibt abschließende Auskunft der folgende
§1.
Fundamentalsatz der Arithmetik
11
Satz. Bei n ∈ N und 2|n sind a¨quivalent: (i) n = 2k−1 (2k − 1) mit ganzem k ≥ 2 und 2k − 1 ∈ IP. (ii) n ist vollkommen. Beweis. Sei n wie in (i) gegeben und Mk := 2k − 1 gesetzt. Wegen 7(4) und Mk ∈ IP \ {2} ist σ(n) = σ(2k−1 )σ(Mk ) =
k−1
2κ (1 + Mk ) = (2k − 1)2k = 2n,
κ=0
also ist n vollkommen. Um die Umkehrung einzusehen, macht man zweckm¨ aßig den Ansatz (1)
n = 2k−1 m
mit ungeradem m ∈ N und ganzem k ≥ 2; wegen 2|n ist hier k = 1 unm¨ oglich. Mittels 7(4) folgt aus (1) und der Voraussetzung (ii) 2k m = 2n = σ(n) = σ(2k−1 )σ(m) = (2k − 1)σ(m). Nun denkt man sich in der letztendlich interessierenden Gleichung (2)
2k m = (2k − 1)σ(m)
f¨ ur die Zahl rechts die kanonische Primfaktorzerlegung hingeschrieben: Da diese eindeutig ist und da 2 |(2k − 1) gilt (d.h. 2k − 1 ungerade ist), muß die volle, in der linken Seite von (2) stehende Zweierpotenz 2k Teiler von σ(m) sein. Mit geeignetem ∈ N hat man somit (3)
σ(m) = 2k ,
m = (2k − 1).
W¨ are > 1, so h¨ atte m mindestens 1, , (2k −1) als verschiedene positive Teiler, was zu σ(m) ≥ 1 + + (2k − 1) > 2k f¨ uhren w¨ urde entgegen der ersten Gleichung in (3). Dort ist also = 1 und daher σ(m) = m + 1, weshalb m Primzahl sein muß; die zweite Gleichung von (3) zeigt schließlich 2k − 1 ∈ IP. Die einfachere Implikation (i) ⇒ (ii) des eben bewiesenen Satzes geht auf Euklid (Elemente IX, § 36) zur¨ uck, w¨ahrend (ii) ⇒ (i) erst 1747, rund zweitausend Jahre sp¨ater, von L. Euler (Opera Omnia Ser. 1, V, 353–365) hinzugef¨ ugt werden konnte. Die kleinsten geraden vollkommenen Zahlen sind die seit dem Altertum bekannten 6, 28, 496, 8128; in der Terminologie des Euklid–Eulerschen Satzes r¨ uhren diese her von k = 2, 3, 5, 7, die ihrerseits Primzahlen sind. Nach obigem Satz ist die Frage nach geraden vollkommenen Zahlen a¨quivalent mit derjenigen, f¨ ur welche ganzen k ≥ 2 die Zahl Mk = 2k −1 Primzahl ist. Eine hierf¨ ur notwendige Bedingung entnimmt man folgender
12 Proposition.
1. Teilbarkeit
F¨ ur k ∈ N gilt: Ist 2k − 1 Primzahl, so auch k.
Beweis. Man geht aus von folgender, bei m ∈ N g¨ ultigen Gleichung in zwei Unbestimmten (4)
X m − Y m = (X − Y )
m−1
X j Y m−1−j .
j=0
Ist jetzt k ∈ N zusammengesetzt, etwa k = m mit , m ∈ N \ {1}, so ersetzt alt man X bzw. Y in (4) durch 2 bzw. 1 und erh¨ Mk = M
m−1
2j ,
j=0
also M |Mk , aber M = 1, Mk wegen = 1, k. Damit ist Mk als zusammengesetzt erkannt. Andererseits gibt es sehr viele Primzahlen k, f¨ ur die 2k − 1 zusammengesetzt ist; derzeit sind genau 44 Primzahlen der Form 2k − 1 bekannt (vgl. hierzu 3.2.12). Nach dem Euklid–Eulerschen Satz kennt man heute also genau 44 gerade vollkommene Zahlen. Man wird sich nun fragen, was man u ¨ber ungerade vollkommene Zahlen weiß. In der Tat ist zur Zeit keine einzige bekannt und man vermutet, daß solche Zahlen nicht existieren. Das beste, was man in dieser Richtung bisher hat beweisen k¨ onnen, ist folgendes Resultat von P. Hagis Jr. (1980, angek¨ undigt 1975) bzw. E.Z. Chein (1979): Jede ungerade vollkommene Zahl hat in ihrer kanonischen Primfaktorzerlegung mindestens acht verschiedene Primzahlen. n
n
Bemerkungen. 1) Aus (4) m¨ oge der Leser (22 + 1)|(22 m + 1) f¨ ur m, n ∈ N0 , 2 |m folgern und daraus: Ist 2k + 1 Primzahl f¨ ur ein k ∈ N, so ist k eine Potenz von 2. Dies macht klar, wieso man Primzahlen der Form 2k + 1 sogleich in der n speziellen Form 22 + 1 sucht, vgl. 2.1.2 und 3.2.11. 2) Der in diesem Abschnitt vermittelte Einblick in die Problematik der vollkommenen Zahlen zeigt, wie rasch man in der Zahlentheorie zu offenen Fragestellungen vorstoßen kann, um deren L¨osung sich Mathematiker seit vielen Generationen bem¨ uhen. Dieser direkte, oft durch keinerlei Begriffsapparat erschwerte Zugang zu noch ungel¨ osten Problemen macht einen der Reize aus, den die Zahlentheorie immer wieder auf mathematische Laien wie auf erfahrene Mathematiker auszu¨ uben vermag.
9. Irrationalit¨ at. Im letzten Paragraphen von√Buch X seiner Elemente gab Euklid einen Beweis f¨ ur die Irrationalit¨ at von 2, den man u ¨blicherweise im
§1.
Fundamentalsatz der Arithmetik
13
schulischen Mathematikunterricht kennenlernt und der von der Aussage des Fundamentalsatzes abh¨angt. Hier wird dieses Irrationalit¨ atsresultat weitgehend verallgemeinert zu folgendem, auf Gauss zur¨ uckgehenden Satz. Jede rationale Nullstelle eines Polynoms X n +cn−1 X n−1 +. . .+c0 ∈ Z[X] ist ganz. Beweis. Es wird angenommen, das mit f (X) bezeichnete Polynom im Satz habe eine Nullstelle x ∈ Q \ Z. Dieses x hat eine Darstellung (1)
x=
a b
mit geeigneten a, b ∈ Z, die wegen x ∈ Z den Bedingungen a = 0, b > 1 gen¨ ugen. Unter allen derartigen Darstellungen von x sei (1) diejenige mit kleinstem b. Die Voraussetzung f ( ab ) = 0 ist a¨quivalent mit (2)
a = −b n
n−1
cj aj bn−1−j ,
j=0
wobei die Summe rechts eine ganze Zahl ist. Aufgrund des Fundamentalsatzes kann nun gesagt werden: Wegen b > 1 existiert eine in b aufgehende Primzahl p, die nach (2) in an aufgehen muß, wegen n ≥ 1 also auch in a. Damit sind dann a := ap und b := pb ganz und gen¨ ugen x = ab ebenso wie a = 0, b > 1; wegen b < b widerspricht dies aber der Minimalbedingung bei der Wahl von a, b in (1). √ Korollar. F¨ ur m, n ∈ N √ ist die positive reelle Zahl n m entweder ganz oder irrational. Insbesondere ist m irrational, wenn m keine Quadratzahl ist. Noch √ spezieller ist p1 · . . . · pk irrational, wenn die k ≥ 1 Primzahlen p1 , . . . , pk paarweise verschieden sind. Beweis. F¨ ur die erste Aussage wendet man den Satz an auf das Polynom√X n −m. F¨ u r die zweite beachtet man, daß aus der angenommenen Ganzheit von m, also √ m = mit einem ∈ N, die Gleichheit m = 2 folgt, welche m als Quadratzahl ausweist. Bemerkung. Wie man leicht sieht, sind bei x ∈ IR die beiden Aussagen “x ist irrational” und “die Zahlen 1, x sind u ¨ber Q linear unabh¨ angig” gleichbedeutend. Ein Resultat betreffend die lineare Unabh¨ angigkeit mehrerer reeller Zahlen u ¨ber Q, in dessen Beweis ebenfalls wesentlich der Fundamentalsatz eingeht, ist folgendes: Die reellen Zahlen log p, wo p s¨amtliche Primzahlen durchl¨auft, sind
14
1. Teilbarkeit
u ¨ber Q linear unabh¨ angig. Daher ist nach Euklids Satz 4 die Dimension von IR, aufgefaßt als Vektorraum u ¨ber Q, nicht endlich.
10. Anmerkung zum Eindeutigkeitsbeweis. Beim Nachweis des Fundamentalsatzes in 5 f¨allt auf, daß der Existenzbeweis f¨ ur die Produktzerlegung deutlich leichter f¨allt als der Eindeutigkeitsbeweis und lediglich auf die multiplikative Struktur der nat¨ urlichen Zahlen sowie auf den Begriff der Primzahl zur¨ uckgreift. Daß jeder Eindeutigkeitsbeweis im Fundamentalsatz dar¨ uber hinaus auch die additive Struktur der nat¨ urlichen Zahlen irgendwie ausn¨ utzen muß – in 5 geschah dies durch 5(1) und davor –, wird durch folgendes, im Prinzip auf D. Hilbert zur¨ uckgehende Beispiel klar. Man betrachtet die Teilmenge H := {3j + 1 : j ∈ N0 } von N und nennt deren Elemente vor¨ ubergehend H-Zahlen. Offenbar ist das Produkt zweier H-Zahlen wieder eine H-Zahl und so ist H eine Unterhalbgruppe der multiplikativen Halbgruppe N. Weiter bezeichnet man eine H-Zahl n = 1 als H-Primzahl, wenn 1 und n die einzigen in H gelegenen nat¨ urlichen Teiler von n sind. Die Folge der H-Primzahlen beginnt demnach mit (1)
4, 7, 10, 13, 19, 22, 25, . . . .
Genauso wie in 5 zeigt man induktiv leicht, daß jede von 1 verschiedene H-Zahl mindestens eine multiplikative Zerlegung in H-Primzahlen besitzt. Die einzige ¨ kleine Schwierigkeit dabei k¨ onnte in dieser Uberlegung liegen: Gilt m, n ∈ H n und m|n, so ist m ∈ H. Die Situation hinsichtlich der bloßen Existenz einer multiplikativen Zerlegung ist hier also v¨ ollig analog zu dem in 5 behandelten klassischen Fall. Wenn dort die Eindeutigkeit alleine aus der multiplikativen Struktur der nat¨ urlichen Zahlen und dem Begriff der Primzahl beweisbar w¨are, m¨ ußte sich dieser Beweis auf die H-Zahlen u ¨bertragen lassen. Nun gibt es aber H-Zahlen, die verschiedene Zerlegungen in H-Primzahlen besitzen. Ein Beispiel daf¨ ur bietet die H-Zahl 100, die sowohl als 4·25 wie als 10·10 geschrieben werden kann, wobei 4, 10, 25 tats¨ achlich H-Primzahlen sind, vgl. (1). Hinsichtlich der Addition zeigen nat¨ urliche bzw. H-Zahlen ja auch ein ganz unterschiedliches Verhalten: F¨ ur m, n ∈ N ist m + n ∈ N und m − n ∈ N, letzteres falls m > n; aber weder Summe noch Differenz zweier H-Zahlen ist wieder H-Zahl. Bemerkung. R.D. James und I. Niven (Proc. Amer. Math. Soc. 5, 834–838 (1954)) haben s¨amtliche multiplikativen Unterhalbgruppen des Typs Hk, := {kj + : j ∈ N0 } von N bestimmt, in denen die multiplikative Zerlegung in “Hk, -Primzahlen” eindeutig ist.
§ 2. § 2.
Gr¨ oßter gemeinsamer Teiler, kleinstes gemeinsames Vielfaches
15
Gr¨ oßter gemeinsamer Teiler, kleinstes gemeinsames Vielfaches
1. Gr¨ oßter gemeinsamer Teiler (ggT). Hier seien n1 , . . . , nk stets ganze Zahlen. Gefragt wird nach allen ganzen d = 0 mit d|n1 , . . . , d|nk , mit anderen Worten, nach den gemeinsamen Teilern aller n1 , . . . , nk . Ist d ein derartiger gemeinsamer Teiler, so hat −d nach Satz 1.2(ii) dieselbe Eigenschaft, weshalb in Zukunft die Beschr¨ ankung auf positive gemeinsame Teiler ausreicht, zu denen u ¨brigens die Eins nach Satz 1.2(iii) immer geh¨ ort. Weiter kann k¨ unftig vorausgesetzt werden, daß nicht alle n1 , . . . , nk Null sind; andernfalls liegt nach Satz 1.2(i) die triviale Situation vor, wo jede von Null verschiedene ganze Zahl gemeinsamer Teiler der n1 , . . . , nk ist. Nach Satz 1.2(iv) ist dann klar, daß jeder ugt positive gemeinsame Teiler d von n1 , . . . , nk der folgenden Ungleichung gen¨ (1)
d ≤ Min{|ni | : i = 1, . . . , k mit ni = 0}.
Aufgrund dieser Vorbemerkungen ist ersichtlich, daß bei ganzen, nicht s¨ amtlich verschwindenden n1 , . . . , nk die Menge aller positiven gemeinsamen Teiler nicht leer und (wegen (1)) endlich ist. Daher besitzt sie ein gr¨oßtes, im weiteren aß als gr¨ oßter gemeinsamer als (n1 , . . . , nk ) notiertes Element, das herkunftsgem¨ Teiler (kurz: ggT ; engl.: gcd f¨ ur greatest common divisor) der n1 , . . . , nk bezeichnet wird. Man ben¨ utzt traditionell f¨ ur den ggT die Schreibweise mit runden Klammern, wenn Verwechslungen mit anderen Verwendungen dieser Klammern nicht zu bef¨ urchten sind, etwa mit der u ¨blichen Notation von k-Tupeln wie z.B. in der Summationsbedingung von 1.7(3). Sollten sich beide Verwendungen im Text einmal zu nahe kommen, so wird der ggT deutlicher als ggT(n1 , . . . , nk ) bezeichnet. Grunds¨ atzlich kann man den ggT von n1 , . . . , nk , nicht alle Null, effektiv berechnen, indem man f¨ ur jeden (der endlich vielen) positiven Teiler der Zahl rechts in (1) pr¨ uft, ob er s¨ amtliche ni teilt. Von den gemeinsamen Teilern ist dann das Maximum zu nehmen. Doch ist dies Vorgehen weder elegant noch numerisch schnell, wenn die |ni | groß sind. Ein viel besseres Verfahren zur Berechnung des ggT wird sp¨ater in 9 vorgestellt. Bemerkungen. 1) Bei n1 ∈ Z \ {0} ist (n1 ) = |n1 |; dies ergibt Kombination von (i), (ii) und (iv) aus Satz 1.2. Daher ist der Fall k = 1 des ggT im weiteren zwar nicht auszuschließen, aber auch nicht sonderlich interessant. 2) Sind n1 , n2 , . . . unendlich viele ganze, nicht s¨amtlich verschwindende Zahlen, so kann deren ggT w¨ ortlich wie oben definiert werden. 2. Divisionsalgorithmus. In 3 sollen zwei Charakterisierungen des ggT gezeigt werden. Dabei erweist sich das Verfahren der Division mit Rest als u ¨beraus
16
1. Teilbarkeit
hilfreich, das auch bezeichnet wird als Divisionsalgorithmus. Zu jedem Paar (n, m) ganzer Zahlen mit m > 0 existiert genau ein Paar (a, b) ganzer Zahlen, so daß gilt (1)
n = am + b
und
0 ≤ b < m.
Beweis. Es werde die Menge aller nichtnegativen ganzen Zahlen der Form n−xm mit ganzem x betrachtet. Wegen n + |n|m ∈ N0 ist diese Menge nicht leer und enth¨ alt somit nach dem in 1.1 formulierten Prinzip ein kleinstes Element b := n−am mit geeignetem ganzem a. Da n−(a+1)m < 0 ist, hat man insgesamt 0 ≤ b < m wie behauptet. Ist (a , b ) ein Paar mit denselben Eigenschaften wie are hier b = b, (a, b), so gilt wegen (1) die Gleichung (a − a )m + (b − b ) = 0. W¨ so w¨are m ≤ |b − b | entgegen 0 ≤ b, b < m. Also ist b = b und damit a = a wegen m = 0. Das a bzw. b aus (1) nennt man bisweilen Quotient bzw. Rest bei der Division von n durch m. Das oben bewiesene Resultat bleibt w¨ ortlich unter der Voraussetzung m = 0 (statt m > 0) erhalten, wenn man 0 ≤ b < |m| in (1) schreibt. Hat ein Paar (m, n) ganzer Zahlen mit m = 0 die spezielle Eigenschaft, daß der Divisionsrest b in (1) verschwindet, so wurde diese Situation zu Anfang von 1.2 mit der Redeweise beschrieben, n sei durch m teilbar. Der Divisionsalgorithmus ist f¨ ur die Zahlentheorie ein sehr wichtiges Hilfsmittel, das auch sp¨ ater in diesem Buch immer wieder zum Zuge kommt (vgl. etwa in 2.1.4).
3. Zwei Charakterisierungen des ggT. Die erste Charakterisierung ist besonders von theoretischem Interesse und wird sich z.B. in 4 und 6 als wichtig erweisen, aber auch schon beim Beweis der zweiten Charakterisierung. Mit letzterer lassen sich viele Aussagen u ¨ber den ggT sehr bequem zeigen (vgl. etwa 5); ebenfalls ist sie von großer Bedeutung f¨ ur die Ausdehnung des ggT–Begriffs auf allgemeinere Ringe. Satz A. F¨ ur ganze n1 , . . . , nk , nicht alle Null, gilt k
(n1 , . . . , nk ) = Min{
i=1
ni xi : x1 , . . . , xk ∈ Z,
k
ni xi > 0}.
i=1
Beweis. Wegen ki=1 n2i > 0 ist hier die Menge L := {. . .} nicht leer und hat so nach dem in 1.1 formulierten Prinzip ein kleinstes Element, welches d genannt
§ 2.
Gr¨ oßter gemeinsamer Teiler, kleinstes gemeinsames Vielfaches
17
werden m¨oge. Daher gibt es ganze x1 , . . . , xk , die (1)
k
ni xi = d
i=1
gen¨ ugen. Ist d := (n1 , . . . , nk ), so gilt d|d wegen (1) und der induktiv auf k Summanden ausgedehnten Regel (ix) aus Satz 1.2. Nach (iv) desselben Satzes hat man somit d ≤ d und zum Beweis von Satz A braucht man jetzt noch d ≤ d. Bei festem j ∈ {1, . . . , k} wendet man dazu den Divisionsalgorithmus 2 an auf das Paar (nj , d ). Danach existieren ganze aj , bj mit (2)
nj = aj d + bj
und
0 ≤ bj < d ,
vgl. 2(1), was wegen (1) unmittelbar zu (3)
bj = nj − aj d = nj (1 − aj xj ) +
k i=1 i=j
ni (−aj xi ) =:
k
ni yij
i=1
mit ganzen yij f¨ uhrt. W¨ are bj > 0 f¨ ur ein j, so w¨are wegen (3) f¨ ur dieses j die k Summe i=1 ni yij in L gelegen, also mindestens gleich d entgegen bj < d , vgl. ur j = 1, . . . , k, also d |n1 , . . . , d |nk (2). Der erzielte Widerspruch zeigt bj = 0 f¨ wegen (2). Nach Definition von d ist schließlich d ≤ d wie gew¨ unscht. Die Beweismethode dieses Satzes liefert lediglich die Existenz ganzer x1 , . . . , xk , ugen, jedoch die (vgl. (1)) der Bedingung (n1 , . . . , nk ) = n1 x1 + . . . + nk xk gen¨ kein effektives Verfahren zur Bestimmung solcher x1 , . . . , xk , vgl. Ende von 1. Erst in 9 wird ein Verfahren pr¨ asentiert, das effektiv (und schnell) ist. Satz B. F¨ ur ganze n1 , . . . , nk , nicht alle Null, und ganzes d > 0 sind folgende Aussagen gleichwertig: (i)
d ist der ggT von n1 , . . . , nk .
(ii)
d|n1 , . . . , d|nk und aus d ∈ N, d |n1 , . . . , d |nk folgt d |d.
Beweis. Sei zun¨ achst (i) erf¨ ullt, also d = (n1 , . . . , nk ), was jedenfalls d|n1 , . . . , d|nk impliziert. Ist nun weiter d ∈ N ein gemeinsamer Teiler von n1 , . . . , nk , so gilt nach Satz A, vgl. (1), auch die Teilbarkeitsbedingung d |d aus (ii). Hat umgekehrt d die Eigenschaften aus (ii), so ist nach Satz 1.2(iv) die Ungleichung d ≤ d erf¨ ullt, weshalb d der gr¨ oßte gemeinsame Teiler der n1 , . . . , nk ist.
18
1. Teilbarkeit
Bemerkung. Der ggT ganzer n1 , . . . , nk , nicht alle Null, l¨ aßt sich nach Satz B beschreiben als derjenige positive Teiler aller n1 , . . . , nk , der von jedem anderen derartigen Teiler geteilt wird. Offenbar h¨ angt diese Charakterisierung des ggT nur vom Teilbarkeitsbegriff, nicht aber von der Ordnung in Z (vgl. 1.1) ab. Dieser Umstand ist von Bedeutung, wenn man den Begriff des ggT in allgemeineren Ringen einf¨ uhren will, in denen zwar keine Ordnungsrelation, wohl aber ein Teilbarkeitsbegriff erkl¨ art werden kann (vgl. 5.2). In 1 wurde bewußt der ggT f¨ ur Z in der Weise definiert, wie dieser Begriff historisch gewachsen ist und wie seine verbale Umschreibung den mathematischen Inhalt am unmittelbarsten erkennen l¨ aßt.
4. Idealtheoretische Deutung des ggT. Sind m1 , . . . , m irgendwelche ganze ur die Menge aller ganzen Zahlen Zahlen, so schreibt man m1 Z + . . . + m Z f¨ auft. In der Form j=1 mj xj , wobei der Vektor (x1 , . . . , x ) ganz Z durchl¨ der Sprechweise der Algebra ist m1 Z + . . . + m Z ein Ideal, genauer das von m1 , . . . , m erzeugte Ideal in Z. In dieser Terminologie l¨aßt sich der ggT wie folgt interpretieren (vgl. hierzu auch die Bemerkung 1 zu 5.6): Satz. Das von ganzen n1 , . . . , nk , nicht alle Null, erzeugte Ideal n1 Z+. . .+nk Z in Z stimmt u ¨berein mit dem Ideal (n1 , . . . , nk )Z in Z. Beweis. Man setzt J := n1 Z + . . . + nk Z und d := (n1 , . . . , nk ). Ist n ∈ J, so gilt n = ki=1 ni xi mit gewissen ganzen xi und daher hat man d|n nach Satz 1.2(ix), also n ∈ dZ und es bleibt noch die Inklusion dZ ⊂ J zu zeigen. Nach Satz 3A ist d = ki=1 ni xi bei geeigneter Wahl ganzer xi ; f¨ ur jedes ganze x ist also dx ∈ J, was die gew¨ unschte Inklusion beinhaltet.
5. Rechenregeln. Die folgenden Regeln (i) bis (v) ergeben sich unmittelbar aus der Definition des ggT, gegebenenfalls mit dessen Charakterisierung in Satz 3B; dies m¨oge dem Leser u ¨berlassen bleiben. Proposition. Seien n1 , . . . , nk ganze, nicht s¨amtlich verschwindende Zahlen und d ihr ggT. (i)
F¨ ur jede Permutation π der Indizes 1, . . . , k ist (nπ(1) , . . . , nπ(k)) = d.
(ii)
Bei k ≥ 2 und nk = 0 ist (n1 , . . . , nk−1 ) = d.
(iii)
Bei k ≥ 2 und nk−1 = nk ist (n1 , . . . , nk−1 ) = d.
(iv)
Es gilt (n1 , . . . , nk−1 , −nk ) = d.
§ 2. (v)
Gr¨ oßter gemeinsamer Teiler, kleinstes gemeinsames Vielfaches
Bei beliebigen ganzen x1 , . . . , xk−1 ist (n1 , . . . , nk−1 , nk +
k−1
19 ni xi ) = d.
i=1
(vi)
F¨ ur jedes ganze = 0 ist (n1 , . . . , nk ) = ||d.
(vii)
Es gilt ( nd1 , . . . , ndk ) = 1.
(viii)
Ist k ≥ 2 und sind n1 , . . . , nk−1 nicht alle Null, so gilt ((n1 , . . . , nk−1 ), nk ) = d.
Beweis. Zu (vi): Aus d|n1 , . . . , d|nk folgt d|n1 , . . . , d|nk , also d|e, wenn utzt. Somit ist insbesondere man e := (n1 , . . . , nk ) schreibt und Satz 3B ausn¨ e e e ganz. Die Definition von e impliziert e|n , . . . , e|n 1 k , was mit |n1 , . . . , |nk e aquivalent ist. Erneut Satz 3B ergibt dann |d, also das f¨ ¨ ur (vi) noch ben¨ otigte ¨ e|d. Ubrigens kann diese Regel genauso bequem mittels Satz 3A verifiziert werden. ur i = 1, . . . , k nach Voraussetzung ganz und nicht Zu (vii): Die Zahlen ndi sind f¨ alle Null; f sei ihr ggT. Nach (vi) ist dann df = (d nd1 , . . . , d ndk ); da dies gleich d ist, folgt f = 1. Zu (viii): Sei g := (n1 , . . . , nk−1 ) und h := (g, nk ). Wegen h|g, h|nk ist h|ni f¨ ur i = 1, . . . , k und also h|d nach Satz 3B. Nach demselben Ergebnis folgt aus d|g, d|nk auch d|h, insgesamt h = d wie in (viii) behauptet. Die Regeln (i) bis (v) besagen, daß sich der ggT von endlich vielen ganzen Zahlen nicht a¨ndert, wenn man ihre Reihenfolge beliebig modifiziert, wenn man Nullen bzw. gleiche Zahlen wegl¨ aßt oder hinzunimmt, wenn man sie durch ihre Absolutbetr¨ age ersetzt oder wenn man zu einer Zahl eine beliebige Linearkombination der u ¨brigen Zahlen mit ganzen Koeffizienten addiert. Regel (viii) reduziert das Problem der Bestimmung des ggT von k (≥ 2) ganzen Zahlen auf dasjenige, den ggT von zwei Zahlen zu ermitteln, die nicht beide Null sind.
6. Teilerfremdheit. Ganze Zahlen n1 , . . . , nk , nicht alle Null, heißen teilerfremd, wenn ihr ggT gleich Eins ist, d.h. wenn (n1 , . . . , nk ) = 1 gilt; eine solche Situation lag z.B. in Proposition 5(vii) vor. Man muß diesen Begriff jedoch sorgsam unterscheiden von folgendem: Ist k ≥ 2, so heißen die ganzen Zahlen n1 , . . . , nk , von denen h¨ ochstens eine verschwindet, paarweise teilerfremd, wenn (ni , nj ) = 1 f¨ ur alle i, j ∈ {1, ..., k} mit i = j gilt. Offenbar besagt “teilerfremd” und “paarweise teilerfremd” f¨ ur k = 2 dasselbe; f¨ ur k ≥ 3 ist die zweite Eigenschaft st¨ arker als die erste. So sind z.B. die drei Zahlen 6, 10, 15 zwar teilerfremd, jedoch nicht paarweise teilerfremd.
20 Satz.
1. Teilbarkeit
Seien m, m1 , m2 , n, n1 , n2 ganz und mm1 m2 = 0.
(i)
Ist m Teiler von n1 n2 und sind m, n1 teilerfremd, so ist m Teiler von n2 .
(ii)
Sind m1 , m2 teilerfremd und gehen beide in n auf, so geht auch ihr Produkt m1 m2 in n auf.
(iii)
Sind m, n1 , n2 teilerfremd, so gilt (n1 , m)(n2 , m) = (n1 n2 , m).
Beweis. Zu (i): Wegen (m, n1 ) = 1 existieren ganze x, y mit mx + n1 y = 1, was zu mn2 x + n1 n2 y = n2 f¨ uhrt. Wegen m|n1 n2 geht hier m in der linken Seite auf, also auch in n2 . Zu (ii): Nach Voraussetzung ist m2 |n, was wegen m1 |n genauso gut als m2 |m1 · mn1 geschrieben werden darf. Diese letzte Teilbarkeitsaussage und die utzt. Das Voraussetzung (m1 , m2 ) = 1 bedingen m2 | mn1 , wenn man (i) ausn¨ letztere ist mit m1 m2 |n ¨aquivalent. ur i = 1, 2 und d := (n1 n2 , m). Mit gewissen ganzen Zu (iii): Sei di := (ni , m) f¨ xi , yi ist di := ni xi + myi f¨ ur i = 1, 2, also d1 d2 = n1 n2 (x1 x2 ) + m(n1 x1 y2 + n2 x2 y1 + my1 y2 ), was d|d1 d2 liefert. Da di |d f¨ ur i = 1, 2 unmittelbar klar ist, folgt d1 d2 |d aus (ii), sobald (d1 , d2 ) = 1 eingesehen ist. Aus d := (d1 , d2 ) ergibt sich tats¨ achlich d |m, d |n1 , d |n2 , also d |(m, n1 , n2 ), weshalb d = 1 sein muß. Als f¨ ur die Anwendungen wichtigster Spezialfall von (iii) dieses Satzes (vgl. etwa die Beweise der S¨atze 2.1.8 bzw. 2.3.4) sei noch gesondert herausgestellt das schon von Euklid (Elemente VII, § 24) explizit formulierte Korollar. Sind m = 0, n1 , n2 ganz und sind m, ni teilerfremd f¨ ur i = 1, 2, so sind auch m, n1 n2 teilerfremd. Bemerkungen. 1) In (ii) des obigen Satzes br¨ auchte man die Teilerfremdheit von m1 , m2 selbstverst¨andlich nur bei n = 0 vorauszusetzen. Ein direktes Analogon zu (ii) f¨ ur k ≥ 3 teilerfremde Zahlen m1 , . . . , mk ist nicht zu erwarten: Die teilerfremden Zahlen 6, 10, 15, nicht aber ihr Produkt, teilen die Zahl 30. 2) Sind oben in (iii) insbesondere n1 , n2 teilerfremd, so gilt die dortige Gleichung und n1 , n2 verschwinden nicht beide. Bei n1 = 0, n2 = 0 gilt jene Gleichung genau f¨ ur m = ±1; trivialerweise gilt sie auch f¨ ur m = 0, wenn man (ohne Teilerfremdheitsvoraussetzung) dann n1 n2 = 0 verlangt.
7. Charakterisierung der Primzahlen. Eine solche kann nun leicht aus Satz 6(i) gewonnen werden, wenn man noch folgenden Hilfssatz beachtet, dessen Beweis dem Leser u ¨berlassen bleibt.
§ 2.
Gr¨ oßter gemeinsamer Teiler, kleinstes gemeinsames Vielfaches
21
Lemma. F¨ ur Primzahlen p und ganze n sind die Bedingungen (p, n) = 1 bzw. p |n ¨ aquivalent. Nun zum eigentlichen Anliegen dieses Abschnitts. Satz.
F¨ ur ganzes m ≥ 2 sind folgende Aussagen gleichbedeutend:
(i)
m ist Primzahl.
(ii)
Aus m|n1 n2 mit ganzen n1 , n2 folgt m|n1 oder m|n2 .
Beweis. Sei zuerst m ∈ IP, weiter m|n1 n2 mit ganzen n1 , n2 und m |n1 . Nach obigem Lemma ist die letzte Bedingung mit (m, n1 ) = 1 a¨quivalent, weshalb m|n2 nach Satz 6(i) gelten muß. Ist umgekehrt τ (m) ≥ 3 mit dem τ aus 1.3, urlichen, von 1 und m veralso m zusammengesetzt, so ist m = n1 n2 mit nat¨ schiedenen n1 , n2 , weshalb weder m|n1 noch m|n2 gelten kann. Somit trifft die Aussage (ii) hier nicht zu. Bemerkungen. 1) Die “interessante” Implikation (i) ⇒ (ii) dieses Satzes findet sich bei Euklid (Elemente VII, § 30) formuliert. 2) Die in 1.10 kurz diskutierten H-Primzahlen haben die Eigenschaft (ii) des obigen Satzes nicht: Zwar wird das Produkt der beiden H-Zahlen 4 und 25 von der H-Primzahl 10 geteilt, jedoch keine der beiden H-Zahlen selbst.
8. Nochmals: Eindeutigkeit im Fundamentalsatz. Wie bei dem in 1.5 gef¨ uhrten Eindeutigkeitsbeweis nach Zermelo sei n > 1 die kleinste nat¨ urliche Zahl mit nicht eindeutiger Produktzerlegung in Primzahlen. Mit gewissen Primzahlen pρ , qσ hat man also (1)
n = p1 · . . . · pr
und
n = q1 · . . . · qs .
Nun ist pr |n und somit pr |q1 · . . . · qs nach (1). Wegen (i) ⇒ (ii) von Satz 7 ist pr |q1 · . . . · qs−1 oder pr |qs . Induktiv f¨ uhrt dies zu pr |qσ f¨ ur mindestens ein σ ∈ {1, . . . , s} und o.B.d.A. sei etwa pr |qs , was sofort pr = qs bedeutet. Die nat¨ urliche Zahl pnr , die kleiner als n ist, h¨ atte dann aber nach (1) die beiden verschiedenen Primfaktorzerlegungen p1 · . . . · ps−1 und q1 · . . . · qs−1 , was der Wahl von n widerspricht. Daß auch dieser Eindeutigkeitsbeweis f¨ ur den Fundamentalsatz der Arithmetik die additive Struktur von N ausn¨ utzt (vgl. 1.10), wird klar, wenn man u ¨berlegt, daß die verwendete Implikation (i) ⇒ (ii) in Satz 7 via Satz 3A letztlich auf den Divisionsalgorithmus 2 zur¨ uckgreift.
22
1. Teilbarkeit
9. Euklidischer Algorithmus und ggT. Wie bereits in 1 und 3 angek¨ undigt, soll nun ein effektives Verfahren zur Berechnung des ggT zweier ganzer Zahlen angegeben werden, die nicht beide Null sind. Wie am Ende von 5 (implizit) festgestellt, ist man damit in der Lage, den ggT von k (≥ 2) ganzen Zahlen effektiv zu berechnen. In leichter Abwandlung der bisherigen Bezeichungsweise seien r0 , r1 die beiden ganzen Zahlen, deren ggT zu bestimmen ist. Nach (i) und (iv) der Proposition 5 darf o.B.d.A. r1 > 0 vorausgesetzt werden. Auf r0 , r1 wird nun der Divisionsalgorithmus 2 angewandt und es ergibt sich nach 2(1) r0 = a0 r1 + r2 und 0 ≤ r2 < r1 mit ganzen a0 , r2 . Ist r2 = 0, so stoppt man das Verfahren; ist r2 > 0, so wendet man den Divisionsalgorithmus erneut an, jetzt auf r1 , r2 : Mit ganzen a1 , r3 ist r1 = a1 r2 + r3
und
0 ≤ r3 < r2 .
Auf diese Weise kann man fortfahren. Da die Folge r1 , r2 , . . . nat¨ urlicher Zahlen, die bei den wiederholten Anwendungen des Divisionsalgorithmus als Reste auftreten, streng monoton f¨allt, muß nach endlich vielen, etwa j Schritten der Rest 0 erscheinen. Dann endet das Verfahren und man hat insgesamt folgende Gleichungen erhalten: ⎧ r0 ⎪ ⎪ ⎪ ⎪ ⎨ r1 (1)
⎪ ⎪ ⎪ ⎪ ⎩ rj−1 rj
= = .. .
a0 r1 + r2 a1 r2 + r3
= aj−1 rj + rj+1 = aj rj+1 .
Dabei sind alle ai , ri ganz und die ri gen¨ ugen u ¨berdies (2)
r1 > r2 > . . . > rj > rj+1 > 0.
Da mit (1) (3)
ri ri+2 rj = ai + (i = 0, . . . , j − 1, falls j ≥ 1), = aj ri+1 ri+1 rj+1
ri ¨quivalent ist, ist ai f¨ a ur i = 0, . . . , j die gr¨ oßte ganze, ri+1 nicht u ¨bertreffende Zahl; dazu hat man (2) zu beachten. Nach der zuletzt gegebenen Interpretation der ai kann somit auf die Ungleichungen a1 ≥ 1, . . . , aj−1 ≥ 1, aj ≥ 2 geschlossen werden, falls j ≥ 1 ist.
§ 2.
Gr¨ oßter gemeinsamer Teiler, kleinstes gemeinsames Vielfaches
23
Satz. Wendet man auf die ganzen Zahlen r0 , r1 mit r1 > 0 in der bei (1) beschriebenen Weise sukzessive den Divisionsalgorithmus an, so ist (r0 , r1 ) = rj+1 . Beweis. Definiert man d := (r0 , r1 ), so folgt d|r2 aus der ersten, dann d|r3 aus der zweiten usw., schließlich d|rj+1 aus der vorletzten Gleichung in (1). Andererseits folgt rj+1 |rj aus der letzten, rj+1 |rj−1 aus der vorletzten usw., endlich rj+1 |r1 aus der zweiten und rj+1 |r0 aus der ersten Gleichung (1). Nach Satz 3B gilt dann rj+1 |d, was zusammen mit d|rj+1 die Behauptung beweist. Bemerkungen. 1) Die wiederholte Anwendung des Divisionsalgorithmus zur Gewinnung der Gleichungen (1) bezeichnet man als euklidischen Algorithmus. In der Tat findet sich das Verfahren v¨ ollig allgemein beschrieben bei Euklid (Elemente VII, § 2). 2) Ein numerisches Beispiel zum euklidischen Algorithmus wird in 3.4 vorgef¨ uhrt anl¨ aßlich einer geringf¨ ugig weitergehenden Aufgabenstellung als sie hier mit der bloßen Ermittlung des ggT zweier ganzer Zahlen vorliegt.
10. Regelm¨ aßiger Kettenbruch rationaler Zahlen. Sofort an dieser Stelle soll die Gelegenheit ergriffen werden, um aus dem System 9(1) f¨ ur eine beliebige rationale Zahl rr01 mit ganzen r0 , r1 und r1 > 0 eine spezielle Darstellung zu gewinnen, die sich bereits hier aufdr¨angt und an die sp¨ ater in 5.3.1 angekn¨ upft wird. Dazu werden f¨ ur eine Folge X0 , X1 , . . . von Unbestimmten die Symbole [X0 ; X1 , . . . , Xi ], i = 0, 1, . . . rekursiv definiert durch die Festsetzungen (1) bzw. (2)
[X0 ] := X0
1 [X0 ; X1 , . . . , Xi ] := X0 ; X1 , . . . , Xi−2 , Xi−1 + Xi
f¨ ur i ≥ 1. Sind nun r0 , r1 wie oben und die a0 , . . . , aj dem System 9(1) entnommen, so wird
r0 ri f¨ ur i = 0, . . . , j (3) = a0 ; a1 , . . . , ai−1 , r1 ri+1 behauptet. Nach (1) ist dies f¨ ur i = 0 richtig. Ist j > 0 und (3) f¨ ur ein ganzes i mit 0 ≤ i < j bewiesen, so liefern (2), (3) und die (i + 1)–te Gleichung 9(3)
r0 ri+2 ri+1 = a0 ; a1 , . . . , ai−1 , ai + = a0 ; a1 , . . . , ai−1 , ai , r1 ri+1 ri+2
24
1. Teilbarkeit
und dies ist (3) f¨ ur i + 1 statt i. Wendet man (3) f¨ ur i = j an und beachtet die letzte Gleichung in 9(3), so erh¨ alt man f¨ ur die rationale Zahl rr01 die Darstellung r0 = [a0 ; a1 , . . . , aj ] . r1
(4)
Man sagt, man habe in (4) die rationale Zahl rr01 in einen endlichen regelm¨ aßigen (oder regul¨ aren) Kettenbruch entwickelt. Die im Kettenbruch rechts in (4) auftretenden ai heißen Elemente (oder auch Teilnenner) des Kettenbruchs. Die Feststellungen u ¨ber die ai im Anschluß an 9(3) zeigen: Bei j ≥ 1 sind a1 , . . . , aj nat¨ urliche Zahlen und u ¨berdies ist aj ≥ 2; die ganze Zahl a0 kann auch Null oder negativ ausfallen. Um an dieses unterschiedliche Verhalten von a0 und den ai mit i ≥ 1 zu erinnern, trennt man a0 von den u ¨brigen Elementen durch einen Strichpunkt ab. Bemerkung. Vorwiegend in der a¨lteren Literatur wurde der Kettenbruch rechts in (4) folgendermaßen expliziter notiert: 1
a0 +
1
a1 +
1
a2 + · · ·
1 aj−1 +
1 aj
Dies erkl¨art zwar die Bezeichnung “Kettenbruch”sehr gut, hat aber gegen¨ uber der von O.Perron [19], S. 27 eingef¨ uhrten einzeiligen Notation [a0 ; a1 , . . . , aj ] den evidenten Nachteil viel gr¨ oßeren Platzverbrauchs.
11. Kleinstes gemeinsames Vielfaches (kgV). Hier wird noch ein Begriff besprochen, der aus dem Schulunterricht im Zusammenhang mit der Auffindung des Hauptnenners mehrerer, in gek¨ urzter Form vorliegender rationaler Zahlen gel¨ aufig ist. Es seien n1 , . . . , nk stets ganze Zahlen, von denen keine Null ist. Man interessiert sich f¨ ur die gemeinsamen Vielfachen aller ur alle ganzen m mit k ni , also f¨ n1 |m, . . . , nk |m. Trivialerweise sind 0 und i=1 ni solche gemeinsame Vielfache. Ist m gemeinsames Vielfaches, so auch −m, weshalb man sich weiterhin auf positive gemeinsame Vielfache beschr¨ anken kann.
§ 2.
Gr¨ oßter gemeinsamer Teiler, kleinstes gemeinsames Vielfaches
25
Aufgrund dieser Vorbemerkung ist klar, daß die Menge der positiven gemeinsamen Vielfachen von n1 , . . . , nk nicht leer ist; ki=1 |ni | geh¨ort ja dazu. Diese Menge besitzt daher ein kleinstes Element, das herkunftsgem¨aß als kleinstes gemeinsames Vielfaches (kurz kgV; engl. lcm f¨ ur least common multiple) der n1 , . . . , nk bezeichnet wird. Ohne Verwechslungen mit anderen Verwendungen eckiger Klammern (wie z.B. in 10) zu riskieren, kann hier der Gepflogenheit gefolgt werden, das kgV von n1 , . . . , nk als [n1 , . . . , nk ] zu notieren; gelegentlich wird daf¨ ur deutlicher kgV(n1 , . . . , nk ) geschrieben. F¨ ur ganzes n1 = 0 ist [n1 ] = |n1 | sofort zu sehen, weshalb der Fall k = 1 hier wie in 1 beim ggT uninteressant ist. Das kgV kann in analoger Weise charakterisiert werden wie dies durch Satz 3B f¨ ur den ggT erledigt wurde: urliches m sind Satz. F¨ ur ganze, nicht verschwindende n1 , . . . , nk und nat¨ folgende Aussagen gleichwertig: (i)
m ist das kgV von n1 , . . . , nk .
(ii)
n1 |m, . . . , nk |m und aus m ∈ N, n1 |m , . . . , nk |m folgt m|m .
Beweis. Sei erst (i) erf¨ ullt, also m = [n1 , . . . , nk ], was n1 |m, . . . , nk |m impliziert. Sei weiterhin m ∈ N ein gemeinsames Vielfaches von n1 , . . . , nk . Wendet man auf m , m den Divisionsalgorithmus 2 an, so hat man mit ganzen a, b die Gleichung m = am + b sowie 0 ≤ b < m. Wegen ni |m und ni |m ist ni |b f¨ ur i = 1, . . . , k, weshalb b nach Definition von m Null sein muß. Das zeigt m|m . Die Umkehrung (ii) ⇒ (i) ist trivial einzusehen, da aus m|m sofort m ≤ m folgt. Das kgV ganzer n1 , . . . , nk , alle nicht Null, l¨ aßt sich somit beschreiben als dasjenige positive Vielfache aller n1 , . . . , nk , das jedes andere derartige Vielfache teilt. Der restliche Teil der Bemerkung in 3 zur (zweiten) Charakterisierung des ggT gilt hier w¨ortlich auch f¨ ur das kgV. Einige einfache Rechenregeln f¨ ur das kgV k¨ onnen vom Leser selbst, eventuell gest¨ utzt auf die im Satz gegebene Charakterisierung, bewiesen werden; sie seien hier zusammengefaßt als Proposition. kgV. (i )
Seien n1 , . . . , nk ganze, nichtverschwindende Zahlen und m ihr
F¨ ur jede Permutation π der Indizes 1, . . . , k ist [nπ(1) , . . . , nπ(k)] = m.
(ii )
(iii )
Bei k ≥ 2 und nk = 1 ist [n1 , . . . , nk−1 ] = m. Bei k ≥ 2 und nk−1 = nk ist [n1 , . . . , nk−1 ] = m.
26
1. Teilbarkeit
(iv ) Es gilt [n1 , . . . , nk−1 , −nk ] = m. ur jedes ganze l = 0 ist [n1 , . . . , nk ] = ||m. (vi ) F¨ (viii ) Bei k ≥ 2 ist [[n1 , . . . , nk−1 ], nk ] = m. Hier entspricht die Numerierung offenbar derjenigen f¨ ur die analogen Regeln u ¨ber den ggT in 5. ur i = 1, . . . , k nat¨ urliche Zahlen mit der kanonischen PrimfaktorSind nun ni f¨ zerlegung ni = p pνp (ni ) , vgl. 1.6(2), so best¨ atigt der Leser leicht die Richtigkeit von pMax(νp (n1 ),...,νp (nk )) . [n1 , . . . , nk ] = p
Eine analoge Formel gilt u ¨brigens f¨ ur den ggT (n1 , . . . , nk ) mit Min statt Max in den Exponenten rechts. Schließlich sei dem Leser der Beweis der folgenden idealtheoretischen Deutung des kgV u ¨berlassen: F¨ ur ganze, nichtverschwindende n1 , . . . , nk stimmt der Durchschnitt der Ideale ¨berein mit dem Ideal [n1 , . . . , nk ]Z in Z. n1 Z, . . . , nk Z in Z u
12. Zusammenhang zwischen ggT und kgV. Der Leser hat bemerkt, daß die Er¨ orterungen u ¨ber das kgV in 11 weitgehend parallel zu denjenigen u ¨ber den ggT verliefen. Es ist daher an der Zeit, den Zusammenhang zwischen beiden Begriffen aufzudecken. Hierzu dient folgender Satz A. Sind n1 , . . . , nk , n1 , . . . , nk und n ganze, von Null verschiedene Zahlen mit ni ni = n f¨ ur i = 1, . . . , k, so gilt (1)
[n1 , . . . , nk ](n1 , . . . , nk ) = |n|.
Insbesondere hat man f¨ ur beliebige ganze, von Null verschiedene Zahlen n1 ,n2 (2)
[n1 , n2 ](n1 , n2 ) = |n1 n2 |. n
Beweis. Mit d := (n1 , . . . , nk ) folgt ni di = nd f¨ ur i = 1, . . . , k nach Voraussetzung, weshalb die ganze Zahl nd gemeinsames Vielfaches von n1 , . . . , nk ist; nach Satz 11 geht also m := [n1 , . . . , nk ] in nd auf und f¨ ur (1) ist lediglich noch n|md einzusehen. Dazu definiert man ganze m1 , . . . , mk durch mi := nmi , was mit nmi = ni m f¨ ur i = 1, . . . , k gleichwertig ist. Nach Proposition 5(vi) ist |n|(m1 , . . . , mk ) = m(n1 , . . . , nk ) = md, was tats¨achlich n|md beinhaltet. Damit ist (1) gezeigt. Um (2) nachzuweisen, hat man (1) anzuwenden mit n1 := n2 , n2 := n1 und n := n1 n2 .
§ 3.
Lineare diophantische Gleichungen
27
Formel (2) f¨ uhrt das kgV zweier ganzer, von Null verschiedener Zahlen vollst¨andig auf den ggT dieser Zahlen zur¨ uck. In Verbindung mit Proposition 11(viii) ist damit die Bestimmung von [n1 , . . . , nk ] ganz allgemein auf die Berechnung gr¨ oßter gemeinsamer Teiler von zwei ganzen Zahlen reduziert. Einen a¨hnlich einfachen Zusammenhang zwischen ggT und kgV von n1 , . . . , nk wie im Falle k = 2 in Gestalt von Formel (2) hat man f¨ ur k ≥ 3 nicht. Der Leser kann aber f¨ ur von Null verschiedene ganze n1 , n2 , n3 durch geeignete Spezialisierung aus (1) gewinnen (n1 , n2 , n3 )[n1 n2 , n2 n3 , n3 n1 ] = |n1 n2 n3 | = [n1 , n2 , n3 ](n1 n2 , n2 n3 , n3 n1 ). Anl¨ aßlich der Definition des kgV in 11 wurde implizit festgestellt, daß stets [n1 , . . . , nk ] ≤ |n1 · . . . · nk | gilt. Abschließend soll charakterisiert werden, wann genau in dieser Ungleichung das Gleichheitszeichen eintritt. Satz B. F¨ ur k ≥ 2 ganze, von Null verschiedene Zahlen n1 , . . . , nk sind folgende Aussagen a¨quivalent: (i) n1 , . . . , nk sind paarweise teilerfremd. (ii) Es gilt [n1 , . . . , nk ] = |n1 · . . . · nk |. ur i = 1, . . . , k. Formel (1) Beweis. Man setze n := n1 · . . . · nk und ni := nni f¨ ¨ von Satz A zeigt die Aquivalenz von (ii) mit (n1 , . . . , nk ) = 1, was sich als zu (i) ¨ gleichwertig erweisen muß. Diese letzte Aquivalenz ist aber deswegen gegeben, weil aufgrund der obigen Definition ni = n1 · . . . · ni−1 · ni+1 · . . . · nk f¨ ur jede Primzahl p gilt: p geht in allen n1 , . . . , nk auf genau dann, wenn es in mindestens zweien der n1 , . . . , nk aufgeht.
§ 3.
Lineare diophantische Gleichungen
1. Warum “diophantisch”? Im letzten Paragraphen wurde verschiedentlich die Tragweite des Satzes 2.3A deutlich, der hier aus einem etwas anderen Blickwinkel betrachtet werden soll. Sind n¨ amlich a1 , . . . , ak ganze teilerfremde (nicht s¨ amtlich verschwindende) Zahlen, so beinhaltet der angesprochene Satz die Existenz ganzer x1 , . . . , xk mit (1)
a1 x1 + . . . + ak xk = 1.
Oder etwas anders gewandt: Die Gleichung (2)
a1 X1 + . . . + ak Xk = 1
28
1. Teilbarkeit
in den Unbestimmten X1 , . . . , Xk mit ganzen teilerfremden Koeffizienten a1 , . . . osbar, d.h. es gibt mindestens ein der Gleichung . . . , ak ist in ganzen Zahlen l¨ (1) gen¨ ugendes (x1 , . . . , xk ) ∈ Zk . Wenn man die L¨osbarkeit einer unbestimmten Gleichung wie (2) erst einmal gesichert hat, wird man sich als n¨achstes fragen, wieviele L¨osungen die betrachtete Gleichung hat, d.h. wieviele (1) gen¨ ugende (x1 , . . . , xk ) ∈ Zk es gibt. Und schließlich wird man sich noch weitergehend f¨ ur die Struktur der Menge aller L¨ osungen interessieren. Fragestellungen der hier angedeuteten Art werden, historisch belegt, seit u ¨ber zweieinhalb Jahrtausenden behandelt. So hat bereits Pythagoras bemerkt, die Gleichung 32 + 42 = 52 impliziere die geometrische Tatsache, daß jedes ebene Dreieck mit dem Seitenl¨angenverh¨ altnis 3 : 4 : 5 rechtwinklig ist. Deshalb suchte er nach anderen Quadratzahlen, die wie 52 Summe zweier Quadratzahlen sind, d.h. er suchte weitere L¨osungen in nat¨ urlichen Zahlen der Gleichung (3)
X12 + X22 = X32 .
Tats¨achlich schreibt man Pythagoras die Entdeckung zu, daß jedes Tripel (m, 12 (m2 − 1), 12 (m2 + 1)) mit ungeradem ganzem m ≥ 3 eine L¨osung von (3) in nat¨ urlichen Zahlen ist. Die L¨ osungen (8, 15, 17) und (12, 35, 37) von (3) belegen aber, daß in der L¨ osungsschar des Pythagoras keineswegs s¨amtliche L¨osungen von (3) in nat¨ urlichen Zahlen enthalten sind. Wie die Gesamtheit aller derartigen L¨ osungen von (3) aussieht, hat Euklid (Elemente X, §§ 28, 29) beschrieben; der Leser findet dies Resultat in 4.2.1–2. Pythagoras hat mit seiner Entdeckung der unendlich vielen L¨ osungen von (3) eine Entwicklung eingeleitet, die erst einige Jahrhunderte sp¨ater durch Diophant (um 250 n. Chr. ?) einen vorl¨ aufigen H¨ ohepunkt und Abschluß erreichte. Diophant lebte im ¨agyptischen Alexandria, jahrhundertelang dem wissenschaftlichen Zentrum der antiken Welt. Seine Lebensdaten sind recht unsicher und schwanken zwischen 100 v. Chr. und 350 n. Chr. Diese Grenzen ergeben sich indirekt einerseits aus Erw¨ahnungen a¨lterer Mathematiker in Diophants Arithmetika (Aριϑμητ ικ´ α), andererseits durch Zitierungen dieses Werks in der sp¨ateren Literatur. Die Arithmetika gilt als erste große, ausschließlich zahlentheoretischen Problemen gewidmete Abhandlung, deren Einfluß auf die Entwicklung der Zahlentheorie kaum zu u ¨bersch¨atzen ist. Dabei haben von den u ¨berlieferten Teilen dieses Werks diejenigen Untersuchungen Diophants bis heute die st¨arksten Impulse gegeben, die sich mit unbestimmten Gleichungen des Typs (4)
P (X1 , . . . , Xk ) = 0,
P ∈ Z[X1 , . . . , Xk ]
wie (2) oder (3) befaßten. Aus zahlreichen Beispielen solcher Gleichungen bis zum Gesamtgrad vier von P , die in der Arithmetika explizit vorgef¨ uhrt wur-
§ 3.
Lineare diophantische Gleichungen
29
den, ließen sich sehr allgemeine Methoden zur Gewinnung der L¨ osungen in ganzen (oder wie bei Diophant meistens in positiven) rationalen Zahlen herauspr¨ aparieren. Zwei der Diophantschen Methoden werden sp¨ ater in 4.2.3–4 vorgestellt; 4.2.5–8 vermitteln einen Eindruck vom Nachwirken Diophants bis in die Neuzeit. Diophant zu Ehren bezeichnet man jede unbestimmte Gleichung des Typs (4), f¨ ur die man arithmetisch charakterisierte L¨osungen (x1 , . . . , xk ) (also (x1 , . . . , xk ) aus Zk oder aus Q k oder a¨hnlich) sucht, als diophantische Gleichung, genauer als polynomiale diophantische Gleichung. Den Zusatz “polynomial” f¨ ugt man bei Gleichungen der Form (4) an, seit auch unbestimmte Gleichungen verst¨arkt behandelt werden, die nicht von der Form (4) sind. Weiter heißen die speziellen polynomialen Gleichungen des Typs (2) lineare diophantische Gleichungen, nat¨ urlich auch bei Ersetzung der Eins rechts in (2) durch irgendeine feste ganze Zahl. Bemerkung. Von den dreizehn B¨ uchern der Arithmetika schienen bis vor etwa dreißig Jahren lediglich sechs erhalten, s¨ amtliche wie das Original in griechischer ¨ Sprache. Selbstverst¨ andlich wurden Ubersetzungen und Kommentierungen seit Diophant auch in zahlreichen anderen Sprachen herausgegeben. Als deutsche ¨ Ubersetzung sei genannt Czwalina, A.: Arithmetik des Diophantos aus Alexandria, Vandenhoeck–Ruprecht, G¨ ottingen, 1952. Als ausgezeichnete Kommentierung von Diophants Werk und der Weiterentwicklung seiner Methoden kann dem Leser empfohlen werden Basmakova, I.G.: Diophant und diophantische Gleichungen, Birkh¨ auser, BaselStuttgart, 1974. Vor rund dreißig Jahren sind vier weitere B¨ ucher der Arithmetika aufgetaucht und zwar in arabischer Sprache. In ihrem Titel wiesen sie sich als B¨ ucher IV bis VII∗) aus: Sesiano, J.: Books IV to VII of Diophantus’ Arithmetica: In the Arabic Translation Attributed to Qust.ˆa Ibn Lˆ uqˆ a, Springer, New York, 1982.
2. L¨ osbarkeitsbedingung. Die Ergebnisse der vorangegangenen Paragraphen erlauben in diesem eine vollst¨andige Behandlung der 1(2) verallgemeinernden linearen diophantischen Gleichung (1) ∗)
a1 X1 + . . . + ak Xk = c
Im vorliegenden Buch ist die ¨altere Numerierung von I bis VI bei Zitaten der zuerst bekannten Diophant–B¨ ucher beibehalten.
30
1. Teilbarkeit
mit ganzen a1 , . . . , ak , c. Sind hier alle ai Null, so ist (1) f¨ ur c = 0 unl¨ osbar; ist osung von (1). Seien in aber auch noch c = 0, so ist jedes (x1 , . . . , xk ) ∈ Zk L¨ (1) also k¨ unftig nicht alle ai Null; dann liefert der folgende Satz eine notwendige und hinreichende Bedingung f¨ ur die L¨ osbarkeit von (1). Satz. F¨ ur ganze a1 , . . . , ak , c, nicht alle ai gleich Null, ist die diophantische Gleichung (1) genau dann l¨ osbar, wenn der ggT der a1 , . . . , ak in c aufgeht. Beweis. Ist (1) l¨ osbar, so gibt es ganze x1 , . . . , xk mit (2)
a1 x1 + . . . + ak xk = c.
Nach Satz 1.2(ix) wird dann c von d := (a1 , . . . , ak ) geteilt. Umgekehrt folgt aus Satz 2.3A die Existenz ganzer y1 , . . . , yk mit (3)
a1 y1 + . . . + ak yk = d.
Geht man nun von der Voraussetzung d|c aus, so gilt c = qd mit ganzem q; man setzt xi := qyi f¨ ur i = 1, . . . , k und sieht nach Multiplikation von (3) mit q, daß ost. (2) f¨ ur den Vektor (x1 , . . . , xk ) zutrifft, dieser also (1) l¨ Zur weiteren Behandlung der Gleichung (1) kann vorausgesetzt werden, daß ullt ist und daß die L¨ osbarkeitsbedingung (a1 , . . . , ak )|c des obigen Satzes erf¨ o.B.d.A. a1 · . . . · ak = 0 gilt. Im Fall k = 1 ist die ganze Zahl ac1 offenbar die einzige L¨osung von (1) und so kann man ab sofort noch k ≥ 2 verlangen. Die weitere Diskussion von (1) vollzieht sich nun so, daß in 3 und 4 der Fall k = 2 komplett erledigt wird. In 5 wird dann bewiesen, daß sich der Fall von mehr als zwei Unbestimmten in (1) auf den schon behandelten mit genau zwei Unbestimmten zur¨ uckf¨ uhren l¨ aßt.
3. Der Fall zweier Unbestimmten wird weiter reduziert durch folgenden Satz. Seien a, b, c ganze Zahlen mit ab = 0, der ggT d von a, b teile c und f¨ ur die ganzen Zahlen x0 , y0 gelte (1)
ax0 + by0 = d.
Dann hat die lineare diophantische Gleichung (2)
aX + bY = c
§ 3.
31
Lineare diophantische Gleichungen
genau die ganzzahligen L¨ osungen cx0 + bt cy0 − at (3) , d d mit ganzem t. Bemerkung. Unter den gemachten, v¨ ollig nat¨ urlichen Voraussetzungen u ¨ber a, b, c sind damit alle L¨osungen von (2) bekannt genau dann, wenn man ganze x0 , y0 gefunden hat, die (1) gen¨ ugen. Das letztgenannte Problem wird in 4 vollst¨ andig gel¨ost. Beweis. M¨ uhelos pr¨ uft man zun¨ achst, daß jedes in (3) genannte Paar (wegen d|a, b, c) ganzer Zahlen mit R¨ ucksicht auf (1) die Gleichung (2) l¨ ost. osung von (2), so erh¨alt man Ist nun umgekehrt (x, y) ∈ Z2 irgendeine L¨ a b (4) (x − x1 ) = − (y − y1 ), d d wenn man die ganzen Zahlen x1 bzw. y1 durch dc x0 bzw. dc y0 definiert und wieder (1) ber¨ ucksichtigt. Nach Proposition 2.5(vii) sind ad , db teilerfremd; wegen Satz 2.6(i) muß db in x − x1 aufgehen, d.h. es gibt ein ganzes t mit x − x1 = db t und nach (4) ist dann y − y1 = − ad t. Nach Definition von x1 , y1 sind die zuletzt erhaltenen Gleichungen ¨aquivalent mit x = cx0d+bt , y = cy0d−at .
4. Spezielle L¨ osung, numerisches Beispiel. Das in 3 offen gebliebene ullen, wird ganz Problem des effektiven Auffindens ganzer x0 , y0 , die 3(1) erf¨ explizit erledigt durch die Proposition. Seien a, b von Null verschiedene ganze Zahlen und d ihr ggT. Wendet man den euklidischen Algorithmus 2.9(1) an mit den Startwerten r0 := |a|, r1 := |b|, entnimmt man j und die a0 , . . . , aj−1 aus 2.9(1) und definiert damit rekursiv (1)
p0 := 0,
q0 := 1,
pi+1 := qi ,
qi+1 := pi − aj−1−i · qi
(0 ≤ i < j),
so gilt (2)
|a|pj + |b|qj = d,
d.h. x0 := pj sgn a, y0 := qj sgn b gen¨ ugen 3(1). Beweis. F¨ ur die r0 , . . . , rj+1 aus 2.9(1) sind die Gleichungen (3)
rj−i pi + rj+1−i qi = rj+1
(i = 0, . . . , j)
wegen (1) induktiv sofort klar. Da rj+1 = d nach Satz 2.9 mit R¨ ucksicht auf Proposition 2.5(iv) gilt, ist (3) im Spezialfall i = j mit (2) identisch.
32
1. Teilbarkeit
Korollar. Sind a, b, d wie in Satz 3, so k¨ onnen ganze, der Gleichung 3(1) gen¨ ugende x0 , y0 mittels euklidischem Algorithmus bestimmt werden. Beispiel. Es soll die Gleichung 9973X − 2137Y = 1
(4)
untersucht werden, die nach Satz 2 genau dann l¨ osbar ist, wenn die Koeffizienten 9973 und 2137 links in (4) teilerfremd sind. Um ihre Teilerfremdheit zu pr¨ ufen, wendet man den euklidischen Algorithmus 2.9(1) an, der hier wie folgt abl¨ auft:
(5)
9973 2137 1425 712
= 4 · 2137 = 1 · 1425 = 2 · 712 = 712 · 1
+ 1425 + 712 + 1
Die Koeffizienten links in (4) sind damit als teilerfremd erkannt (es sind sogar beides Primzahlen) und so hat (4) unendlich viele L¨ osungen, die man 3(3) entnehmen kann, sobald man eine spezielle L¨osung (x0 , y0 ) von (4) kennt. Dazu hat man laut obiger Proposition die j, a0 , . . . , aj−1 aus 2.9(1) im Spezialfall (5) festzustellen: Hier ist j = 3, a0 = 4, a1 = 1, a2 = 2 (und a3 = 712), was gem¨aß (1) zu p1 = 1, p2 = −2, p3 = 3 bzw. q1 = −2, q2 = 3, q3 = −14 f¨ uhrt. Also ist das Paar (x0 , y0 ) = (3, 14) eine spezielle L¨osung von (4), was nach Satz 3 die allgemeine L¨osung (3 + 2137t, 14 + 9973t), t ∈ Z, hat. Bemerkungen. 1) Gem¨ aß 2.10 hat sich hier ganz nebenbei der regelm¨aßige Kettenbruch der rationalen Zahlen 9973 2137 zu [4; 1, 2, 712] ergeben oder ausgeschrieben 9973 =4+ 2137
1 1+
1 2+
1 712
2) Selbstverst¨ andlich gibt es Situationen, wo man zur L¨ osung einer Gleichung des Typs 3(2) nicht erst den euklidischen Algorithmus ben¨ utzen wird, sondern wo genaues Hinsehen schon weiterhilft. So sieht man z.B. der Gleichung 7X + 10Y = 1 unmittelbar eine L¨osung (3, −2) an, weshalb ihre allgemeine L¨osung mit (3 + 10t, −2 − 7t), t ∈ Z, bereits hingeschrieben werden kann. 3) Merkw¨ urdigerweise findet sich die vollst¨andige Behandlung der Gleichung 3(2) schriftlich erst bei den indischen Astronomen Aryabhata und Brahmagupta (zwischen 500 und 600), deren Methode auf dem euklidischen Algorithmus basiert. Dies verwundert umso mehr, als z.B. die großen griechischen Mathematiker der Antike von Euklid bis Diophant viel schwierigere Gleichungen h¨oheren Grades komplett l¨ osen konnten, vgl. etwa 4.2.1 und 4.3.1.
§ 3.
Lineare diophantische Gleichungen
33
5. Reduktion des allgemeinen Falls. Bei ganzen a1 , . . . , ak , c wird hier die Gleichung 2(1), also (1)
a1 X1 + . . . + ak Xk = c
im Fall k ≥ 3 diskutiert unter den am Ende von 2 genannten Voraussetzungen a1 · . . . · ak = 0, ggT(a1 , . . . , ak )|c. Dazu wird mit a := ggT(ak−1 , ak ) neben (1) das folgende System von zwei linearen diophantischen Gleichungen in den k + 1 Unbestimmten X1 , . . . , Xk , Y betrachtet: (2)
a1 X1 + . . . + ak−2 Xk−2 + aY = c, ak−1 Xk−1 + ak Xk − aY = 0.
Sei nun x := (x1 , . . . , xk ) ∈ Zk eine L¨osung von (1) und es werde y definiert durch y := a1 (ak−1 xk−1 + ak xk ). Nach Definition von a ist auch y ganz und ersichtlich l¨ost der Vektor (x, y) := (x1 , . . . , xk , y) ∈ Zk+1 das System (2). Klar ist auch, daß die durch x → (x, y) definierte Abbildung der L¨ osungsmenge von (1) in die von (2) injektiv und surjektiv, also bijektiv ist. Damit kann man sicher sein, alle L¨osungen x ∈ Zk von (1) zu erhalten, wenn man alle L¨osungen (x, y) ∈ Zk+1 von (2) kennt. Dabei ist zu beachten, daß wiederholte Anwendung von Proposition 2.5(viii) zu ggT(a1 , . . . , ak−2 , a) = ggT(a1 , . . . , ak ) f¨ uhrt, weshalb die oben vorausgesetzte L¨ osbarkeitsbedingung f¨ ur (1) mit ggT(a1 , . . . , ak−2 , a)|c, also mit der nach Satz 2 notwendigen und hinreichenden L¨ osbarkeitsbedingung f¨ ur die erste Gleichung in (2) a¨quivalent ist. Die L¨osungen (x, y) von (2) bekommt man jetzt so: Die Induktionsvoraussetzung garantiert, daß man die erste Gleichung in (2) vollst¨ andig l¨ osen kann. Von jeder solchen L¨ osung (x1 , . . . , xk−2 , y) nimmt man die letzte Komponente y und behandelt damit via 3 und 4 die Gleichung (3)
ak−1 Xk−1 + ak Xk = ay.
6. Struktur der L¨ osungsgesamtheit. Die in 5 vorgenommene Reduktion gestattet nun eine vollst¨andige Beschreibung der L¨osungen von 5(1). Satz. Seien a1 , . . . , ak ganze, von Null verschiedene Zahlen, deren ggT die ganze Zahl c teilt. Dann hat die L¨ osungsmenge der diophantischen Gleichung 5(1) die Form p + Zq1 + . . . + Zqk−1 , wobei s¨amtliche qi ∈ Zk nur von a1 , . . . , ak abh¨ angen, w¨ ahrend p ∈ Zk außerdem von c abh¨ angt und (genau) bei c = 0
34
1. Teilbarkeit
¨ als Nullvektor w¨ ahlbar ist. Uberdies ist der Rang der aus den Zeilenvektoren q1 , . . . , qk−1 gebildeten Matrix maximal, also gleich k − 1. Beweis. (Induktion u ¨ber k). F¨ ur k = 1 ist die Aussage des Satzes trivial und f¨ ur k = 2 entnimmt man sie aus Satz 3. Sei nun k ≥ 3 und gezeigt, daß die L¨ osungsmenge linearer diophantischer Gleichungen in k − 1 Unbestimmten, insbesondere also der ersten Gleichung in 5(2) die Form p∗ +Zq∗1 +. . .+Zq∗k−2 hat, ¨brigen im Satz behaupteten Eigenschafwobei die p∗ , q∗1 , . . . , q∗k−2 ∈ Zk−1 die u ∗ ∗ ten bereits aufweisen m¨ogen. Mit p∗ = (p∗1 , . . . , p∗k−1 ) und q∗i = (qi1 , . . . , qi,k−1 ) f¨ ur i = 1, . . . , k − 2 gilt f¨ ur die allgemeine L¨osung (x1 , . . . , xk−2 , y) der ersten Gleichung in 5(2) somit (1)
xj = p∗j +
k−2
∗ qij ti
y = p∗k−1 +
(j = 1, . . . , k − 2),
i=1
k−2
∗ qi,k−1 ti .
i=1
∗ nur von a1 , .. Nach Induktionsvoraussetzung h¨ angen alle hier vorkommenden qij .., ak−2 und a = ggT(ak−1 , ak ), also nur von a1 , . . . , ak ab, bei c = 0 kann p∗j = 0 ∗ f¨ ur j = 1, . . . , k−1 gew¨ahlt werden und es ist Rang (qij )1≤i≤k−2,1≤j≤k−1 = k−2.
F¨ ur jedes feste y aus (1) hat man jetzt die Gleichung 5(3) anzusehen. Nach Satz 3 ist die allgemeine L¨osung (xk−1 , xk ) von 5(3) von der Form xk−1 = x0 y +
(2)
ak tk−1 , a
xk = y0 y −
ak−1 tk−1 , a
wobei tk−1 ganz Z durchl¨ auft und die x0 , y0 alleine von ak−1 , ak abh¨ angen, ugen und daher nicht beide verschwinden. der Gleichung ak−1 x0 + ak y0 = a gen¨ ¨ Substituiert man in (2) noch f¨ ur y aus (1), so findet man nach der Uberlegung aus 5 die allgemeine L¨osung x = (x1 , . . . , xk ) von 5(1) in der Form p + q1 t1 + . . . + qk−1 tk−1 , (t1 , . . . , tk−1 ) ∈ Zk−1 , mit ⎧ ∗ ∗ ∗ ∗ , . . . , qi,k−2 , x0 qi,k−1 , y0 qi,k−1 ) ⎨ qi := (qi1 (3)
⎩q
k−1
:= (0, . . . , 0, aak , − ak−1 a ),
f¨ ur i = 1, . . . , k − 2,
p := (p∗1 , . . . , p∗k−2 , x0 p∗k−1 , y0 p∗k−1 ).
Hieraus sind die Behauptungen des Satzes u ¨ber die p, q1 , . . . , qk−1 aufgrund der oben erw¨ ahnten Induktionsvoraussetzung und der Eigenschaften von x0 , y0 evident bis auf die Rangaussage. F¨ ur gewisse ganze τ1 , . . . , τk−1 sei k−1 i=1 τi qi = k−2 ∗ 0, d.h. τ q = 0 f¨ u r j = 1, . . . , k − 2 sowie i=1 i ij x0
k−2 i=1
∗ τi qi,k−1 + τk−1
ak = 0, a
y0
k−2 i=1
∗ τi qi,k−1 − τk−1
ak−1 = 0, a
§ 4.
Zahlentheoretische Funktionen
35
was ¨aquivalent ist mit k−2
∗ τi qi,k−1 = 0,
τk−1 = 0.
i=1
∗ Aus k−2 i=1 τi qi = 0 folgt τ1 = 0, . . . , τk−2 = 0 nach Induktionsvoraussetzung, womit auch die Rangaussage bewiesen ist. Die Aussage des “genau” im Satz ist trivial: Ist p als Nullvektor w¨ ahlbar, so muß dieser offenbar 5(1) l¨ osen, d.h. es muß c = 0 sein. Schließlich sei noch als Kurzfassung des Satzes formuliert Korollar. Unter den Voraussetzungen des Satzes bildet die L¨ osungsmenge von 5(1) einen (k − 1)-dimensionalen freien Z-Modul, der genau f¨ ur c = 0 sogar ein Z-Modul ist.
§ 4.
Zahlentheoretische Funktionen
1. Einige Definitionen. Jede Abbildung f : N → C bezeichnet man als zahlentheoretische Funktion. In der Sprache der Analysis ist dies nichts anderes als eine komplexwertige Folge, also ein Element aus C N ; nur schreibt man in der Zahlentheorie traditionell f (n) statt fn f¨ ur die Folgenglieder. Außerdem wird hier C N mit Z abgek¨ urzt. Als Beispiele zahlentheoretischer Funktionen, die bisher schon in nat¨ urlicher Weise im Rahmen der Teilbarkeitstheorie auftraten, seien genannt: Die Teileranzahlfunktion τ (in 1.3 und 1.7), die Teilersummenfunktion σ (in 1.7) und f¨ ur jede feste Primzahl p die Vielfachheit νp (in 1.6). In diesem Paragraphen werden folgende weiteren zahlentheoretischen Funktionen immer wieder vorkommen: a)
Die durch 0(n) := 0 f¨ ur alle nat¨ urlichen n definierte Funktion 0;
b)
die durch ε(1) := 1 und ε(n) := 0 f¨ ur alle ganzen n ≥ 2 definierte Funktion ε;
c)
die mit ι abgek¨ urzte Identit¨ at auf N und schließlich f¨ ur jedes reelle α die durch ια (n) := nα f¨ ur alle n ∈ N definierten Funktionen ια ; es ist insbesondere ι1 = ι und ι0 (n) = 1 f¨ ur alle n ∈ N.
36
1. Teilbarkeit
2. Multiplikative und additive Funktionen. Aufgrund der großen Allgemeinheit des Begriffs einer zahlentheoretischen Funktion ist plausibel, daß man im Rahmen der Zahlentheorie nicht an all diesen Funktionen gleichermaßen interessiert ist. Eine f¨ ur die Zahlentheorie besonders wichtige Teilmenge von Z, hier mit M abgek¨ urzt, besteht aus den multiplikativen Funktionen. Dabei heißt f ∈ Z multiplikativ, wenn (1)
f (n1 n2 ) = f (n1 )f (n2 )
f¨ ur alle teilerfremden n1 , n2 ∈ N
ankung “teilerfremd” zu, so gilt; trifft (1) f¨ ur alle n1 , n2 ∈ N ohne die Einschr¨ heißt f streng multiplikativ. Beispiele streng multiplikativer Funktionen sind 0, ε und s¨ amtliche ια mit α ∈ IR; daß weder τ noch σ streng multiplikativ sind, ist Spezialfall einer Feststellung in 10. Dagegen sind τ und σ beide multiplikativ, wie man 1.7(2) bzw. 1.7(4) in Verbindung mit (ii) der n¨ achsten Proposition entnimmt. Die Multiplikativit¨ at von τ , σ wird sich nochmals in 10 ergeben. Proposition. (i) F¨ ur jedes f ∈ M \ {0} gilt f (1) = 1. ¨ (ii) F¨ ur f ∈ Z gilt die Aquivalenz f pνp (n) f ∈ M ⇐⇒ f (n) =
f¨ ur alle n ∈ N.
p
Beweis. Zu (i): Wegen f (1) = f (1 · 1) = f (1)2 gem¨aß (1) ist entweder f (1) = 1 oder f (1) = 0. Die zweite Alternative w¨ urde f (n) = f (n · 1) = f (n)f (1) = 0 (erneut nach (1)) f¨ ur alle n ∈ N implizieren, also f = 0. Zu (ii): Ist f ∈ M , so folgt die behauptete Zerlegung von f (n), indem man (1) endlich oft auf die Produktzerlegung p pνp (n) von n anwendet und f (1) = 1 bei f = 0 beachtet, welch letzteres o.B.d.A. vorausgesetzt werden darf. Die Implikation “⇐” ist trivial. Teil (ii) der Proposition deckt einen Grund f¨ ur die Bedeutung der multiplikativen zahlentheoretischen Funktionen auf: Sie sind durch ihre Werte an den s¨ amtlichen Primzahlpotenzen bereits vollst¨andig festgelegt. Bemerkung. Gelegentlich sind auch sogenannte additive f ∈ Z in der Zahlentheorie von Bedeutung. Dabei heißt f ∈ Z additiv, wenn f (n1 n2 ) = f (n1 ) + f (n2 ) f¨ ur alle teilerfremden n1 , n2 ∈ N gilt; trifft dies ohne die Einschr¨ ankung “teilerfremd” zu, so heißt f streng additiv.
§ 4.
37
Zahlentheoretische Funktionen
Hier seien noch einige Kleinigkeiten u ¨ber additive Funktionen zusammengestellt, die sich der Leser selbst u ¨berlegen m¨oge: F¨ ur jede Primzahl p ist νp streng additiv. Die durch ω(n) := #{p ∈ IP : p|n} definierte Funktion ω ist additiv, jedoch nicht streng additiv. Ist f : N → IR+ (streng) multiplikativ, so ist offenbar die Zusammensetzung log ◦f (streng) additiv. F¨ ur additives f ∈ Z gilt stets f (1) = 0.
3. Produktdarstellung unendlicher Reihen. Dieser und der folgende Abschnitt stellen Hilfsmittel bereit, die vor allem in Kap. 7 zur genaueren Untersuchung der Primzahlverteilung unabdingbar sein werden. Sie werden aber auch schon in 5 und 12 mit Erfolg angewandt. Satz.
Ist f ∈ Z multiplikativ und ∞
(1)
∞
f (n) =
∞ p
n=1
f (n) absolut konvergent, so gilt
n=1
f (pν ).
ν=0
Oft n¨ utzlich ist noch folgendes Ergebnis, bei dem die Voraussetzungen leicht abgewandelt sind, dessen Beweis aber bis zu einem gewissen Punkt demjenigen des Satzes folgt. Proposition. Ist f ∈ Z reellwertig, nichtnegativ und multiplikativ und kon vergiert ν≥0 f (pν ) f¨ ur jede Primzahl p, so gilt f¨ ur alle reellen x
(2)
f (n) ≤
n≤x
∞
f (pν ).
p≤x ν=0
Beweise. O.B.d.A. sei f = 0. F¨ ur reelles x < 2 ist (2) trivial wegen f (1) = 1 und der Konvention u ¨ber leere Summen bzw. Produkte. Sei ab jetzt x ≥ 2 und seien ¨bersteigenden Primzahlen. Dann p1 , . . . , pk genau die verschiedenen, x nicht u ist (3)
p≤x ν≥0
f (pν ) =
∞ k f paκκ = κ=1 aκ =0
f pa1 1 · . . . · pakk ,
(a1 ,...,ak )∈Nk 0
wobei zuletzt die absolute Konvergenz der Reihen f (pν ) und die Multiplikativit¨ at von f ausgen¨ utzt wurde. Nach dem Fundamentalsatz der Arithmetik
38
1. Teilbarkeit
in 1.5 kommen rechts in (3) unter den pa1 1 · . . . · pakk alle nat¨ urlichen n ≤ x vor. Daraus folgt bereits (2); man braucht hierzu nur die Nichtnegativit¨ at aller f -Werte auszun¨ utzen. Um den Satz einzusehen, startet man erneut mit (3) und bemerkt, daß dort die Summe rechts die Form ∞
(4)
f (n) −
f (n)
n=1
¨ber die n ∈ N zu erstrecken hat. Dabei bedeutet , daß die Summation genau u ist, die von mindestens einer Primzahl, die gr¨ oßer als x ist, geteilt werden; erst recht sind also diese n gr¨ oßer als x. Gibt man sich nun ein ε ∈ IR+ beliebig vor, so gilt bei geeignetem x0 (ε) nach Voraussetzung die Ungleichung |f (n)| < ε f¨ ur alle x > x0 (ε). Kombination von (3) und (4) liefert (1). ¨ Bemerkung. Die Gleichung (1) ist nichts anderes als ein analytisches Aquivalent zum Fundamentalsatz der Arithmetik. Offenbar machen beide Beweise keinen Gebrauch von Euklids Satz 1.4; man beachte, daß die Summe in (4) leer w¨are, wenn es oberhalb x keine Primzahl mehr g¨ abe.
4. Riemannsche Zetafunktion. Bei n ∈ N und s ∈ C definiert man wie u ¨blich die komplexe Zahl n−s durch exp(−s log n), wobei log den reellen Logarithmus und (im weiteren) Re s den Realteil von s bedeutet. Satz. Ist g eine beschr¨ankte multiplikative zahlentheoretische Funktion, so definiert die Reihe ∞
(1)
g(n)n−s
n=1
in Re s > 1 eine holomorphe Funktion G mit der Produktentwicklung (2)
G(s) =
∞ p
g(pν )p−νs
in Re s > 1.
ν=0
Beweis. Die durch f (n) := g(n)n−s f¨ ur n ∈ N definierte Funktion f ∈ Z ist wegen g ∈ M multiplikativ. Wegen der Beschr¨ anktheit von g konvergiert die Reihe (1) in Re s > 1 absolut (man beachte |n−s | = n−Re s ) und kompakt gleichm¨aßig, definiert daher dort eine holomorphe Funktion G. Formel (2) folgt direkt aus 3(1).
§ 4.
39
Zahlentheoretische Funktionen
Von besonderer Bedeutung ist der Spezialfall g = ι0 des vorstehenden Satzes. Hier setzt man (3)
ζ(s) :=
∞
n−s
f¨ ur Re s > 1
n=1
und hat nach (2) f¨ ur dieselben s ∈ C die Produktformel (4)
ζ(s) =
(1 − p−s )−1 .
p
Dabei ist lediglich summiert worden.
ν≥0
p−νs f¨ ur jede Primzahl p als geometrische Reihe auf-
Die hier eingef¨ uhrte, in der Halbebene Re s > 1 holomorphe und (wegen (4)) nullstellenfreie Funktion ζ heißt Riemannsche Zetafunktion. Sie spielt beim Studium der Primzahlverteilung eine u ¨berragende Rolle (vgl. 7.3.1); daß sie mit den Primzahlen engstens zu tun hat, ist aus ihrer Produktdarstellung (4) evident.
5. Zweimal Euklids Satz u ¨ber die Existenz unendlich vieler Primzahlen. Eine mehr am¨ usante Beweisvariante. F¨ ur jedes ganze s ≥ 2 ist jeder Faktor rechts in 4(4) rational. Unter der Annahme, es g¨ abe nur endlich viele Primzahlen, w¨ are dann das Produkt rechts in 4(4) rational, also auch ζ(s). Nun ist aber die Irrationalit¨ a t (sogar Transzendenz) von ζ(2t) f¨ ur alle t ∈ N wohlbekannt: Z.B. ist ζ(2) = n−2 = 16 π 2 , allgemeiner ζ(2t) = rt π 2t mit gewissen rt ∈ Q + und so folgt Euklids Satz aus der Irrationalit¨at von π 2t f¨ ur alle t ∈ N, vgl. 6.3.2. F¨ ur die zweite Variante wird ein Teil des folgenden Hilfssatzes u ¨ber die Partialsummen der harmonischen Reihe ben¨otigt. Lemma.
F¨ ur alle nat¨ urlichen n gelten die Ungleichungen n 1 log(n + 1) < ≤ 1 + log n. m m=1
Beweis. Durch Vergleich der Summe mit
n+1 1
dt t
bzw.
n 1
dt t .
40
1. Teilbarkeit
Eine seri¨ose Beweisvariante. Ohne ein so unangemessen starkes Hilfsmittel wie ur Euklids Satz anzuwenden, wird nun Proposiz.B. die Irrationalit¨ at von π 2 f¨ tion 3 ausgen¨ utzt: Man nimmt dort f := ι−1 und erh¨ alt unter Ber¨ ucksichtigung der linken H¨ alfte des obigen Lemmas (1)
log x < log([x] + 1) <
1 1 (1 − )−1 ≤ n p
n≤x
p≤x
f¨ ur alle reellen x > 0. Da hier die linke Seite beliebig groß werden kann, muß dies auch f¨ ur das Produkt rechts gelten, d.h. dieses kann nicht von einer Stelle an konstant sein. Bemerkungen. 1) In der ersten Variante h¨ atte man auch s = 3 nehmen k¨ onnen; die Irrationalit¨ at von ζ(3) wurde von R. Apery (Ast´erisque 61, 11–13 (1979)) bewiesen. Bei ζ(5), ζ(7), ζ(9), . . . ist das Problem der Irrationalit¨ at noch offen; allerdings ist in den letzten Jahren, angestoßen durch T. Rivoal (C. R. Acad. Sci. Paris S´er. I Math. 331, 267–279 (2000)), neue “Bewegung” in diese Fragestellung gekommen. 2) Bei der ersten Variante ergibt sich die rein qualitative Aussage der Unendlichkeit der Menge IP durch Betrachtung der Funktion ζ an einer einzigen geeignet gew¨ahlten Stelle. Es ist plausibel, daß Informationen u ¨ber ζ(s) auf einer reichhaltigeren Menge von Punkten s der komplexen Ebene zu genaueren quantitativen Aussagen u ¨ber das Anwachsen der in 1.4 definierten Anzahlfunktion π(x) := #{p ∈ IP : p ≤ x} bei x → ∞ f¨ uhren wird. Dies wird sich in § 3 von Kap. 7 tats¨ achlich best¨atigen. 3) Eine derartige quantitative Aussage u ¨ber π(x) l¨ aßt sich u ¨brigens aus der zweiten Variante gewinnen: Beachtet man, daß p ≥ 2 f¨ ur alle p ∈ IP gilt, so ist das Produkt rechts in (1) h¨ ochstens gleich 2π(x) , so daß (1) unmittelbar zu log log x π(x) > log 2 f¨ ur alle reellen x > 1 f¨ uhrt. Verglichen etwa mit der in 7.2.3 angegebenen Absch¨atzung (4) ist dies allerdings ein sehr schwaches Ergebnis. ultige 4) Beachtet man die vom Leser zu verifizierende, f¨ ur alle reellen t ∈ [0, 12 ] g¨ log log x 1 −1 t Ungleichung (1 − t) ≤ 4 , so folgt aus (1) noch log 4 < p≤x p f¨ ur alle x > 1. Insbesondere divergieren also p (1 − p−1 )−1 und p p1 , was bereits Euler bekannt war, vgl. 14.
6. Faltung. In den Abschnitten 6 bis 11 werden die zahlentheoretischen Funktionen von einem relativ abstrakten, strukturellen Gesichtspunkt aus betrachtet. Dabei werden die Teilerfunktionen τ und σ in allgemeinere Zusammenh¨ange eingeordnet, bei deren Studium man einigen weiteren klassischen zahlentheoretischen Funktionen begegnen wird.
§ 4.
Zahlentheoretische Funktionen
41
F¨ ur f, g ∈ Z und κ ∈ C definiert man neue zahlentheoretische Funktionen f + g bzw. κ · f punktweise durch die Festsetzungen (f + g)(n) := f (n) + g(n)
bzw.
(κ · f )(n) := κf (n)
f¨ ur alle n ∈ N. Klar ist, daß Z, + eine abelsche Gruppe bildet, die durch die oben definierte skalare Multiplikation · zu einem C-Vektorraum wird. Eine weitere Verkn¨ upfung in Z, die in der Zahlentheorie von gr¨ oßter Bedeutung ist, wird nun folgendermaßen definiert: Bei f, g ∈ Z sei n (1) (f ∗ g)(n) := f ( )g(d) f¨ ur alle n ∈ N; d d|n
dabei bedeutet die Bedingung d|n stets, daß u ¨ber alle positiven Teiler d von n zu summieren ist, also 1 und n eingeschlossen. Die durch (1) eingef¨ uhrte zahlentheoretische Funktion f ∗ g heißt die Faltung von f mit g. Man beachte sogleich, daß sich die Summe rechts in (1) in die symmetrische Form f (c)g(d) (2) (c,d)∈N2 cd=n
setzen l¨aßt. Damit gestalten sich manche Rechnungen mit der Faltung zweier Funktionen bequemer; z.B. ist (iii) der folgenden Proposition dann evident. Proposition. F¨ ur beliebige f, g, h ∈ Z gilt (i) (f ∗ g) ∗ h = f ∗ (g ∗ h), (ii) f ∗ ε = f, (iii) f ∗ g = g ∗ f. Beweis. F¨ ur (i) arbeitet man bei n ∈ N die Summe Σ(n) := f (b)g(c)h(d) (b,c,d)∈N3 bcd=n
unter Beachtung von (1) und (2) zun¨ achst folgendermaßen um Σ(n) = h(d) f (b)g(c) = (f ∗ g)(a)h(d) (a,d)∈N2 ad=n
(b,c)∈N2 bc=a
(a,d)∈N2 ad=n
= ((f ∗ g) ∗ h)(n). Offensichtlich kann man genauso gut Σ(n) = (f ∗ (g ∗ h))(n) erhalten, was (i) beweist. Zu (ii): Berechnet man (f ∗ ε)(n) gem¨aß (1), so bleibt in der dortigen Summe wegen ε(d) = 0 f¨ ur d > 1 alleine der Summand f (n)ε(1) = f (n) zur¨ uck.
42
1. Teilbarkeit
Regel (i) macht Klammersetzung bei Faltung von beliebig (aber endlich) vielen zahlentheoretischen Funktionen u ¨berfl¨ ussig. Regel (iii) erlaubt es, von der Faltung von f und g zu sprechen. Insgesamt beinhaltet die Proposition, daß Z, ∗ eine kommutative Halbgruppe bildet; die Rolle des neutralen Elements spielt ε. Bez¨ uglich der beiden oben eingef¨ uhrten Verkn¨ upfungen + und ∗ gilt nun der Satz.
Z, +, ∗ ist ein Integrit¨ atsring.
Beweis. Nach den anf¨ anglichen Feststellungen u ¨ber Z, + und wegen der Proposition ist nur noch Distributivgesetz und Nullteilerfreiheit zu pr¨ ufen, wobei das erstere dem Leser u ¨berlassen sei. F¨ ur die Nullteilerfreiheit ist f ∗ g = 0 bei f, g ∈ Z \ {0} zu zeigen. ahlt mit f (c0 ) = 0, g(d0 ) = 0; Seien c0 bzw. d0 aus N jeweils kleinstm¨oglich gew¨ dann ist (f ∗ g)(c0 d0 ) = f (c0 )g(d0 ) = 0, also f ∗ g = 0. F¨ ur n = c0 d0 reduziert )g(d ), weil g(d) = 0 f¨ ur d < d0 und sich die Summe (1) n¨ a mlich auf f (c 0 0 c0 d0 c0 d0 f d = 0 f¨ ur d > d0 gilt (beachte hier d < c0 ).
7. Inverse bez¨ uglich Faltung. W¨ ahrend sich Z, ∗ in 6 als kommutative Halbgruppe herausstellte, kl¨ art der n¨achste Satz, genau wann ein f ∈ Z bez¨ uglich ∗ eine Inverse hat. Satz. F¨ ur f ∈ Z sind folgende Aussagen ¨aquivalent: (i) f (1) = 0. (ii) Es gibt ein g ∈ Z mit f ∗ g = ε. Bemerkung. F¨ ur g wie in (ii) gilt g(1) =
1 f (1) ,
also g(1) = 0.
Beweis. Sei zun¨ achst f (1) = 0; dann wird ein g wie in (ii) punktweise fol1 und hat damit gendermaßen rekursiv konstruiert. Man setzt erst g(1) := f (1) (f ∗ g)(1) = 1 (= ε(1)). Ist dann n > 1 und g(d) schon f¨ ur d = 1, . . . , n − 1 definiert, so setzt man g(n) := −
1 n f ( )g(d); f (1) d d|n d=n
nach 6(1) ist dies ja mit (f ∗ g)(n) = 0 (= ε(n)) a¨quivalent. Ist andererseits (ii) vorausgesetzt, so ist nach 6(1) insbesondere f (1)g(1) = 1, also f (1) = 0.
§ 4.
Zahlentheoretische Funktionen
43
Gen¨ ugt f ∈ Z der Bedingung f (1) = 0 und haben g, h ∈ Z die Eigenschaft f ∗ g = ε, f ∗ h = ε, so ist g = g ∗ ε = (g ∗ f ) ∗ h = ε ∗ h = h nach Proposition 6. Somit existiert zu jedem f ∈ Z mit f (1) = 0 bez¨ uglich ∗ genau eine Inverse in 1 Z, die u ¨blicherweise mit fˇ bezeichnet wird und f¨ ur die fˇ(1) = f (1) = 0 gilt. Der obige Satz legt die Einf¨ uhrung folgender Abk¨ urzung nahe: Z1 := {f ∈ Z : f (1) = 0}. Offenbar ist Z1 bez¨ uglich ∗ abgeschlossen; man hat ja nur (f ∗g)(1) = f (1)g(1) = 0 f¨ ur f, g ∈ Z1 zu beachten. Diese Beobachtung in Verbindung mit Proposition 6 und obigem Satz f¨ uhrt unmittelbar zum Korollar.
Z1 , ∗ ist eine abelsche Gruppe.
8. Die Gruppe der multiplikativen Funktionen. Vorausgeschickt sei hier das einfache Lemma. F¨ ur teilerfremde n1 , n2 ∈ N gelte d|n1 n2 mit einem d ∈ N. Dann gibt es ein eindeutig bestimmtes Paar (d1 , d2 ) nat¨ urlicher Zahlen mit d1 d2 = d, d1 |n1 , d2 |n2 , wobei außerdem d1 , d2 zueinander teilerfremd sind ebenso wie nd11 , n2 d2 . Beweis. Nach Lemma 1.7 ist νp (d) ≤ νp (n1 n2 ) f¨ ur alle p ∈ IP, insbesondere νp (d) = 0 f¨ ur p |n1 n2 . Bei p|n1 n2 ist nach Satz 2.7 genau ein νp (ni ) Null und man hat entweder νp (d) ≤ νp (n1 ), νp (n2 ) = 0 oder νp (d) ≤ νp (n2 ), νp (n1 ) = 0, also d= pνp (d) = pνp (d) · pνp (d) =: d1 · d2 . p|n1 n2
p|n1
p|n2
Aus der Definition ist di |ni f¨ ur i = 1, 2 klar. Haben d1 , d2 dieselben Eigenschaften wie d1 , d2 im Lemma, so folgt aus d1 d2 = d1 d2 wegen der Teilerfremdheit von d1 ,d2 und wegen Satz 2.6(i) die Bedingung d1 |d1 , also d1 = δd1 , d2 = δd2 mit ganzem δ > 0. Wegen der Teilerfremdheit von n1 , n2 muß δ = 1 gelten. Proposition. Die Menge M der multiplikativen zahlentheoretischen Funktionen ist bez¨ uglich Faltung abgeschlossen, ebenso die Menge M \ {0}. Beweis. Seien f, g ∈ M und n1 , n2 ∈ N zueinander teilerfremd. Dann ist nach 6(1), dem vorangestellten Lemma und der vorausgesetzten Multiplikativit¨ at von f, g
44
1. Teilbarkeit
(f ∗ g)(n1 n2 ) =
f
d|n1 n2
=
n n 1 2 g(d) = d
f
d1 |n1 d2 |n2
=
2
n1 d1
f 2
(d1 ,d2 )∈N d1 |n1 , d2 |n2
g(d1 )f
n2 d2
n1 n2 d1 d2
g(d2 ) =
g(d1 d2 )
2 j=1 dj |nj
f
nj dj
g(dj )
(f ∗ g)(nj ),
j=1
was f ∗ g ∈ M beweist. Sind insbesondere f, g ∈ M \ {0}, so ist f (1) = 1, g(1) = 1 nach Proposition 2(i) und somit (f ∗ g)(1) = f (1)g(1) = 1, also hat man f ∗ g ∈ M \ {0}. Wie soeben schon festgestellt, gilt f (1) = 1 f¨ ur f ∈ M \ {0}, insbesondere also ¨ber die Teilmenge M \ {0} von Z1 behauptet der f ∈ Z1 . Nun wird u Satz.
M \ {0}, ∗ ist eine Untergruppe der Gruppe Z1 , ∗.
Beweis. Wegen Korollar 7 und obiger Proposition bleibt nur noch zu zeigen, daß M \ {0} zu jedem Element f auch die Inverse fˇ enth¨ alt. Klar ist zun¨ achst f ∈ Z1 und also hat f nach 7 in Z1 die Inverse fˇ, die als in M enthalten erkannt werden muß. Dazu definiert man g ∈ Z verm¨oge (1) g(n) := fˇ pνp (n) . p|n
Offenbar ist g(1) = 1 und g ∈ M , also g ∈ M \ {0} und somit f ∗ g ∈ M \ {0} nach obiger Proposition. Wenn f ∗ g = ε nachgewiesen ist, folgt fˇ = g aus f ∗ fˇ = ε und somit fˇ ∈ M \ {0} wie gew¨ unscht. F¨ ur f ∗ g = ε reicht nach der Anmerkung am Ende von 2 der Nachweis, daß die beiden multiplikativen Funktionen f ∗ g und ε auf den Primzahlpotenzen u ¨bereinstimmen. Tats¨achlich ist f¨ ur alle j ∈ N0 , p ∈ IP nach (1) (f ∗ g)(pj ) =
j
f (pj−i )g(pi ) =
i=0
j
ˇ i ) = ε(pj ). f (pj−i )f(p
i=0
Ist f ∈ Z und ι0 gem¨aß 1 definiert, so heißt Sf := ι0 ∗ f die summatorische Funktion von f . Wegen ι0 (d) = 1 f¨ ur alle d ∈ N ist also nach 6(1) (Sf )(n) = f (d) f¨ ur alle n ∈ N, d|n
§ 4.
Zahlentheoretische Funktionen
45
was die Bezeichnungsweise verst¨andlich macht. Damit ergeben die bisherigen Schlußweisen noch folgendes Korollar.
¨ F¨ ur f ∈ Z gilt die Aquivalenz f ∈ M ⇐⇒ Sf ∈ M.
Beweis. Ist f ∈ M , so folgt aus ι0 ∈ M (vgl. 2) und obiger Proposition Sf = ι0 ∗ f ∈ M . Wegen ι0 ∈ M \ {0} und dem Satz ist ˇι0 ∈ M \ {0}; setzt man jetzt Sf ∈ M voraus, so ist f = ˇι0 ∗ (ι0 ∗ f ) = ˇι0 ∗ Sf ∈ M , wieder nach der Proposition. Bemerkung. Bei f ∈ Z gilt offenbar auch f ∈ M \ {0} ⇔ Sf ∈ M \ {0}.
9. M¨ obiussche M¨ ufunktion. Die im Beweis von Korollar 8 aufgetretene ¨blicherFunktion ˇι0 ist in der Zahlentheorie sehr wichtig; man bezeichnet sie u ¨ biussche M¨ weise mit μ und nennt sie die Mo ufunktion. Ihre wichtigsten Eigenschaften seien zusammengestellt als Satz.
¨ ¨ biussche Funktion μ hat man folgende Aussagen: Uber die Mo
(i)
μ ist multiplikativ.
(ii)
F¨ ur jede Prinzahl p und jedes ganze j ≥ 2 ist μ(p) = −1, μ(pj ) = 0. 1 f¨ ur n = 1, Es ist μ(d) = 0 f¨ ur alle ganzen n > 1. d|n
(iii) (iv)
Ist f eine zahlentheoretische Funktion und F ihre summatorische Funktion, so gilt f¨ ur alle nat¨ urlichen n n f (n) = μ( )F (d). d d|n
Beweis. Im Beweis von Korollar 8 wurde μ := ˇι0 ∈ M \ {0} erledigt, weshalb (i) gilt. Nach Proposition 2(i) ist insbesondere μ(1) = 1. Zu (ii): Wegen ε = μ ∗ ι0 und den Definitionen von ε bzw. ι0 ist mit 6(1) (1)
j i=0
μ(pi ) = ε(pj ) = 0
46
1. Teilbarkeit
f¨ ur alle j ∈ N, p ∈ IP. Wegen μ(1) = 1 ist μ(p) = −1, wenn man (1) mit j = 1 ur j = 2, 3, . . . aus (1), was zu μ(pj ) = 0 anwendet. Damit folgt ji=2 μ(pi ) = 0 f¨ f¨ ur die eben genannten j f¨ uhrt. (iii) ist eine ausf¨ uhrliche Version der Gleichung ι0 ∗ μ = ε. Zu (iv): Da F f¨ ur Sf steht, ist F = ι0 ∗ f nach Definition von Sf , also μ ∗ F = (μ ∗ ι0 ) ∗ f = ε ∗ f = f . Die Formel in (iv) besagt dasselbe wie μ ∗ F = f . Bemerkungen. 1) Kombination von (i) und (ii) des Satzes zeigt μ(N) = {−1, 0, 1}. 2) Eine ganze Zahl n heißt quadratfrei, wenn p2 |n f¨ ur alle Primzahlen p gilt. Danach ist 1 quadratfrei, 0 jedoch nicht. Der Leser m¨ oge sich f¨ ur n ∈ N die ¨ folgenden Aquivalenzen u ¨berlegen: n ist quadratfrei ⇔ (μ(n))2 = 1 ⇔ μ(n) = 0. ¨ biussche Umkehrformel. In ihr ist einer der 3) Die Formel in (iv) heißt Mo Gr¨ unde f¨ ur die zahlentheoretische Bedeutung der μ-Funktion zu sehen: Durch die Umkehrformel gelingt die R¨ uckgewinnung der urspr¨ unglichen Funktion aus ihrer summatorischen Funktion. 4) Nach Bemerkung 1 gilt mit M (x) := n≤x μ(n) trivialerweise die Ungleichung |M (x)| < x f¨ ur alle reellen x > 1. In einem Brief vom 11. Juli 1885 an C. Hermite k¨ undigte T.J. Stieltjes an, er habe einen Beweis daf¨ ur, daß |M (x)|x−1/2 bei x → ∞ beschr¨ankt bleibt; in Klammern f¨ ugte er an, man k¨ onne wohl 1 als Schranke nehmen. Da er keinen Beweis f¨ ur seine Behauptungen ver¨ offentlichte, diese aber f¨ ur die Untersuchungen der analytischen Eigenschaften der Riemannschen Zetafunktion aus 4 weitreichende Konsequenzen gehabt h¨ atten, besch¨aftigten sich Ende des vorigen Jahrhunderts viele Mathematiker mit der Funktion M (x). Insbesondere ver¨ offentlichte F. Mertens (Sitz.–Ber. Akad. Wiss. Wien IIa 106, 761–830 (1897)) eine Tabelle der Werte μ(n), M (n) f¨ ur n = 1, . . . , 10000, aufgrund deren er schloß, die Ungleichung (2)
|M (x)| < x1/2
f¨ ur x > 1
sei “sehr wahrscheinlich”. Diese als Mertenssche Vermutung in die Literatur eingegangene Behauptung wurde von A.M. Odlyzko und H.J.J. Te Riele (J. Reine Angew. Math. 357, 138–160 (1985)) widerlegt. Ihr indirekter Beweis liefert allerdings kein x0 , f¨ ur das (2) falsch ist; sie erwarten solche x0 nicht unterhalb 1020 . J. Pintz (Ast´erisque 147/148, 325–333 (1987)) hat die Existenz solcher x0 unterhalb exp(3, 21 · 1064 ) bewiesen.
§ 4.
Zahlentheoretische Funktionen
47
10. Weitere spezielle multiplikative Funktionen. Ist ια bei reellem α wie uhrlicher in 1 definiert, so setzt man nun σα := ι0 ∗ ια oder ausf¨ (1)
σα (n) :=
dα
f¨ ur n ∈ N.
d|n
Wegen ι0 , ια ∈ M \ {0} gilt σα ∈ M \ {0} nach Proposition 8. Wegen (σα (2))2 = (1 + 2α )2 = 1 + 2α+1 + 4α = 1 + 2α + 4α = σα (4) ist kein σα streng multiplikativ. Wie die folgende Formel lehrt, gehen σα und σ−α in einfacher Weise auseinander hervor: n α d−α = n−α = n−α (ια ∗ ι0 )(n) = n−α σα (n). σ−α (n) = d d|n
d|n
Insbesondere ist σ0 (n) = #{d ∈ N : d|n} = τ (n) f¨ ur alle n ∈ N, wenn man (1) mit α = 0 und die Definition von τ in 1.3 anwendet. Weiter ist σ1 (n) = d = σ(n) nach (1) und der Definition von σ in 1.7. Die Funktionen σα d|n verallgemeinern also die fr¨ uheren τ , σ. Weiter definiert man bei beliebigem reellem α die zahlentheoretische Funktion ψα implizit durch die Forderung Sψα = ια , d.h. ι0 ∗ ψα = ια .
(2)
¨ bius–Funktion ist dies mit Nach Definition der Mo ψα = μ ∗ ια
(3)
¨quivalent; insbesondere ist ψ0 = ε. Wegen μ, ια ∈ M \ {0} ist auch ψα ∈ a M \ {0} f¨ ur jedes α. Streng multiplikativ ist ψα genau dann, wenn α = 0 ist. Ausf¨ uhrlicher als in (2) bzw. (3) hat man (4)
d|n
ψα (d) = nα
bzw.
ψα (n) =
n μ dα d d|n
f¨ ur alle n ∈ N. Die Bedeutung der speziellen ψα mit α ∈ N wird in 11 vollst¨ andig aufgekl¨ art. Bemerkung. Multiplikative zahlentheoretische Funktionen treten bei ganz unterschiedlichen Fragestellungen in nat¨ urlicher Weise auf. So z.B. ψ1 (= ϕ1 =: ϕ, vgl. 11) in 2.3.4ff ebenso wie in Kap. 2, § 5 und Kap. 3, § 1, weiterhin ρf in 2.4.2ff, δ, Δ und σu in 4.1.8.
48
1. Teilbarkeit
11. Eulers Phifunktion und Verallgemeinerungen. Bei festem α ∈ N wird f¨ ur alle nat¨ urlichen n gesetzt (1)
ϕα (n) := #{(1 , . . . , α) ∈ {1, . . . , n}α : ggT(1 , . . . , α , n) = 1}.
Insbesondere ist ϕ1 (n) die Anzahl der nat¨ urlichen, n nicht u ¨bersteigenden Zahlen, die zu n teilerfremd sind; u ¨blicherweise schreibt man k¨ urzer ϕ := ϕ1 und bezeichnet dies als Eulersche Phifunktion. Die allgemeinen ϕα aus (1) scheinen erstmals von C. Jordan eingef¨ uhrt worden zu sein. ¨ Uber den Zusammenhang der ϕα mit den ψα aus 10(3) gibt Auskunft folgende Proposition.
ur alle nat¨ urlichen α. Es ist ϕα = ψα f¨
Beweis. Bei n ∈ N ist trivialerweise stets ggT(1 , . . . , α , n)|n. Es werde nun ein beliebiges d ∈ N mit d|n festgehalten. Hat der Vektor (2)
(1 , . . . , α) ∈ {1, . . . , n}α die Eigenschaft ggT(1 , . . . , α , n) = d
und definiert man ganze i durch i := d1 i f¨ ur i = 1, . . . , α, so hat der Vektor n α n (3) (1 , . . . , α ) ∈ {1, . . . , } die Eigenschaft ggT(1 , . . . , α , ) = 1, d d vgl. Proposition 2.5(vii). Gilt umgekehrt (3) f¨ ur einen Vektor (1 , . . . , α ) und ur i = 1, . . . , α, so gen¨ ugt der Vektor (1 , . . . , α ) den setzt man i := di f¨ Bedingungen (2). Die Anzahl der α–Tupel, die bei (3) gez¨ ahlt werden, ist ϕα nd n und daher ist d|n ϕα d die Anzahl aller (1 , . . . , α ) ∈ {1, . . . , n}α, also nα . Man hat also ϕα ∗ ι0 = ια gefunden, woraus mit 10(2) die Behauptung folgt. Die wichtigsten Eigenschaften der ϕα seien zusammengestellt als Satz. F¨ ur alle Jordanschen Verallgemeinerungen ϕα , α = 1, 2, . . . , der Eulerschen Funktion ϕ = ϕ1 hat man folgende Aussagen: (i) ϕα ist multiplikativ. (ii) F¨ ur jede urliche j ist ϕα (pj ) = p(j−1)α (pα − 1). Primzahl p und jedes nat¨ (iii) Es ist d|n ϕα (d) = nα f¨ ur alle nat¨ urlichen n. n α ur alle nat¨ urlichen n. (iv) Es ist d|n μ d d = ϕα (n) f¨ Beweis. Durch Kombination der Proposition und der Resultate in 10 folgen s¨amtliche vier Aussagen. F¨ ur (ii), (iii) und (iv) hat man insbesondere 10(4) auszun¨ utzen, wobei man (ii) so einsieht: ϕα (pj ) = ψα (pj ) =
j
μ(pj−i )piα = pjα − p(j−1)α .
i=0
Einige weitere Eigenschaften der ϕα sind bisweilen von Nutzen und hier zusammengefaßt.
§ 4.
Zahlentheoretische Funktionen
49
¨ Korollar. Uber die ϕα des obigen Satzes hat man: (i) F¨ ur alle nat¨ urlichen n gilt ϕα (n) = nα p|n (1 − p−α ). (ii) (iii) (iv)
F¨ ur alle nat¨ urlichen n gilt 1 ≤ ϕα (n) ≤ nα . ¨ Es gilt die Aquivalenz ϕα (n) = nα − 1 ⇔ n ∈ IP. ¨ Es gelten die Aquivalenzen 2 |ϕα (n) ⇔ n ∈ {1, 2} ⇔ ϕα (n) ist 1 oder 2α − 1.
Beweis. Kombination von (i) und (ii) des Satzes liefert (i), was dann auch (ii) sowie die Implikation ⇐ von (iii) nach sich zieht. Sei umgekehrt ϕα (n) = nα −1; wegen ϕα (1) = 1 ist sicher n > 1. W¨are n zusammengesetzt und etwa p eine in n aufgehende Primzahl, so w¨ urden mindestens die beiden verschiedenen α–Tupel (p, . . . , p) und (n, . . . , n) bei (1) nicht gez¨ ahlt, so daß ϕα (n) ≤ nα − 2 w¨are. Zu (iv): Sei 2 |ϕα (n). Ist n = 2j , so j ∈ {0, 1} wegen (ii) des Satzes; w¨ urde n von einer ungeraden Primzahl p geteilt, so w¨are (pα − 1)|ϕα (n) wegen (i) und (ii) des Satzes, also ϕα (n) gerade. Insgesamt ist n ∈ {1, 2}. Der Rest ist trivial einzusehen. Ein weiterer Beweis des Euklidschen Satzes 1.4. Es werde IP endlich, etwa IP = {p1 , . . . , pr } angenommen. Bildet man n := p1 · . . . · pr , so gilt n > 2 wegen 2, 3 ∈ IP. Andererseits ist f¨ ur jedes m ∈ {2, . . . , n} das in 1.3 eingef¨ uhrte p(m) eine Primzahl, d.h. aus {p1 , . . . , pr }, und so sind m, n nicht teilerfremd. Deswegen ist ϕ(n) = 1, was nach (iv) des Korollars zu n ≤ 2 ¨ aquivalent ist. Der erhaltene Widerspruch beweist Euklids Satz aufs neue.
12. Eine Aussage “im Mittel”. Um den n¨ achsten Satz ebenso wie asymptotische Aussagen an sp¨ateren Stellen bequem formulieren zu k¨ onnen, wird nun eine abk¨ urzende Schreibweise eingef¨ uhrt. Sind f , g reellwertige Funktionen einer Variablen, die f¨ ur alle gen¨ ugend großen reellen Argumentwerte definiert sind und ist u ¨berdies g positiv, so schreibt man (i)
f (x) = O(g(x)) bei x → ∞, falls schr¨ankt bleibt;
(ii)
f (x) = o(g(x)) bei x → ∞, falls lim
(iii)
f (x) ∼ g(x) bei x → ∞, falls lim
f (x) g(x)
bei diesem Grenz¨ ubergang be-
f (x) x→∞ g(x)
f (x) x→∞ g(x)
existiert und Null ist;
existiert und Eins ist.
Man liest (i) bzw. (ii) als “f (x) ist groß–oh bzw. klein–oh von g(x)”, (iii) als “f (x) ist asymptotisch gleich g(x)”. Klar ist, daß sowohl (ii) als auch (iii) einzeln (i) implizieren. Weiter ist evident, daß ∼ auf der Menge der f¨ ur alle großen
50
1. Teilbarkeit
¨ Argumente definierten, positivwertigen Funktionen eine Aquivalenzrelation definiert; daher sagt man auch “f (x) und g(x) sind asymptotisch gleich”. Die Notationen (i) und (ii) gehen auf P. Bachmann und E. Landau zur¨ uck, (iii) scheint systematisch zuerst von G.H. Hardy und J.E. Littlewood benutzt worden zu sein. Satz.
Es gilt
n≤x
ϕ(n) = 3π −2 x2 + O(x log x) bei x → ∞.
Beweis. Wegen 10(4) und Proposition 11, jeweils mit α = 1 angewandt, gilt f¨ ur N := [x] Φ(N ) : =
N
ϕ(n) =
μ(c)d =
n=1 (c,d)∈N2 cd=n
n=1
(1)
N
μ(c)d
(c,d)∈N2 cd≤N
N 1 N N μ(c) d= μ(c) +1 = 2 c=1 c c c=1 d=1 N N 1 N N 1 μ(c) = μ(c) −ϑ + 1 − ϑ =: N 2 + R(N ). 2 c=1 c c 2 c2 c=1 N
[N c ]
angig, Dabei sind die rationalen Zahlen ϑ := Nc − [ Nc ] zwar von N und c abh¨ aber stets aus dem Intervall [0, 1[. Wegen |μ(c)| ≤ 1, |1 − 2ϑ| ≤ 1, |ϑ(1 − ϑ)| ≤ 14 f¨ ur alle c, N ∈ N mit c ≤ N hat man f¨ ur das “Restglied” R(N ) 2|R(N )| = |N
N N N μ(c) 1 1 (1 − 2ϑ) − μ(c)ϑ(1 − ϑ)| ≤ N + N. c c 4 c=1 c=1 c=1
Damit f¨ uhrt die rechte H¨ alfte von Lemma 5 zu |R(N )| ≤
(2)
1 5 N log N + N. 2 8
Aus der Gleichungskette (1) folgt (3)
Φ(N ) −
∞ μ(c) 1 2 μ(c) 1 N = R(N ) − N 2 . 2 2 c 2 c2 c=1 c>N
Um die unendliche Reihe links in (3) auszuwerten, wendet man Satz 4 an mit g := μ (vgl. auch Bemerkung 1 in 9) und erh¨ alt f¨ ur ihren Wert p
(1 − p−2 ) =
1 = 6π −2 , ζ(2)
§ 4.
Zahlentheoretische Funktionen
51
wobei man noch Satz 9(ii) ebenso wie 4(4) beachtet hat. F¨ ur die Summe rechts in (3) gilt |
(4)
μ(c) 1 1 1 1 | < < − = . c2 c2 c−1 c N
c>N
c>N
c>N
Nach Definition von N ist Φ(N ) genau die Summe im Satz und aus (3) folgt mittels (2) und (4) |
ϕ(n) − 3π −2 x2 | ≤ 3π −2 |x2 − N 2 | +
n≤x
1 9 N log N + N 2 8
9 1 −2 ≤ 6π + x + x log x, 8 2
wenn man N = [x], also 0 ≤ x − N < 1 beachtet. Die letzte Ungleichungskette gibt nach der Bachmann–Landauschen Konvention (i) den Satz. Bemerkung. Der Satz besagt offenbar, daß die Werte von ϕ, u ¨ber einen “langen” Anfangsabschnitt {1, 2, . . . , N } der nat¨ urlichen Zahlen gemittelt, in der Gr¨ oßenordnung 3π −2 N liegen. Mit der hier gegebenen Genauigkeit O(x log x) des Restglieds wurde er zuerst bewiesen von Mertens (J. Reine Angew. Math. 77, 289– 291 (1874)). Selbstverst¨ andlich wurden auch andere zahlentheoretische Funktionen in analoger Weise auf ihre Gr¨ oßenordnung “im Mittel” untersucht, worauf hier jedoch nicht eingegangen werden kann.
13. Wahrscheinlichkeit f¨ ur Teilerfremdheit. Als Folgerung aus Satz 12 sei noch abgeleitet das Korollar. Die Wahrscheinlichkeit daf¨ ur, daß zwei zuf¨ allig gew¨ahlte nat¨ urliche Zahlen zueinander teilerfremd sind, betr¨agt 6π −2 = 0, 6079 . . . . Beweis. F¨ ur das in 12(1) eingef¨ uhrte Φ gilt nach Definition von ϕ in 11(1) Φ(N ) =
n N n=1
1 = #{(d, n) ∈ N2 : d ≤ n ≤ N, ggT(d, n) = 1}
d=1 (d,n)=1
=
1 (1 + #{(d, n) ∈ N2 : d, n ≤ N, ggT(d, n) = 1}). 2
52
1. Teilbarkeit
Mit Satz 12 folgt hieraus #{(d, n) ∈ N2 : d, n ≤ N, ggT(d, n) = 1} −→ 6π −2 #{(d, n) ∈ N2 : d, n ≤ N } bei N → ∞; im Nenner links steht ja genau N 2 . Bemerkung. Die Aussage des Korollars wurde gefunden von E. Cesaro (Mathesis 1, 184 (1881)) und 1883 von J.J. Sylvester (Collected Papers III, 672–676; IV, 84–87). Jedoch scheint sie schon 1849, wenn auch auf etwas anderem Wege, von P.G.L. Dirichlet (Werke II, 51-66) entdeckt worden zu sein.
14. Historische Anmerkungen. B. Riemann schlug 1859 in seiner ber¨ uhmt gewordenen Arbeit Ueber die Anzahl der Primzahlen unter einer gegebenen Gr¨ oße (Werke, 136–144) vor, das genaue Verhalten der in 1.4 eingef¨ uhrten Funktion π(x) f¨ ur große x durch Untersuchung der analytischen Eigenschaften der komplexen Funktion ζ in 4(3) zu studieren. Dieser Vorschlag erwies sich in der Folgezeit als u ¨beraus fruchtbar und f¨ uhrte 1896 zum Beweis des Primzahlsatzes agt die Funktion π(x) ∼ logx x , in dem Kap. 7 gipfeln wird. Riemann zu Ehren tr¨ 4(3) seinen Namen. Doch die Geschichte der Zetafunktion begann rund 125 Jahre vor Riemann. Sowohl P. Mengoli (Novae quadraturae arithmeticae, Bologna, 1650) als auch J. Wallis (Arithmetica infinitorum, Oxford, 1655) hatten das Problem gestellt, den Wert der Reihe n≥1 n−2 (also ζ(2)) zu berechnen. G.W. Leibniz ebenso wie die a¨lteren Bernoulli–Br¨ uder konnten ab 1670 nur N¨ aherungswerte angeben, die sp¨ater von D. Bernoulli und C. Goldbach (1728), J. Stirling (1730) und Euler (1731) sukzessive verbessert wurden. 1734 gelang dann Eu2 2t−1 ler der Nachweis von ζ(2) = π6 , allgemeiner von ζ(2t) = (−1)t−1 2(2t)! B2t π 2t f¨ ur alle t ∈ N mit den in 4.2.8 einzuf¨ uhrenden (rationalen) Bernoulli–Zahlen Bk (vgl. 5). Auf Euler (1737) geht auch die Entdeckung des Produkts 4(4) f¨ ur ζ(s) zur¨ uck; daher nennt man heute Produktentwicklungen des Typs 4(2) f¨ ur Reihen der Form 4(1) Euler–Produkte. Allerdings beschr¨ ankte sich Euler auf reelle s. Interessant ist, daß er 4(4) noch f¨ u r s = 1 anwandte und daraus auf die Divergenz von p (1 − p−1 )−1 und p p−1 schloß, vgl. Bemerkung 4 in 5. Ohne die Schreibweise ϕ(n) zu benutzen, f¨ uhrte Euler (Opera Omnia Ser. 1, II, 531–555) im Zusammenhang mit seiner Verallgemeinerung 2.3.4 des Satzes 2.3.3 von P. Fermat die Anzahl der zu n ∈ N teilerfremden nat¨ urlichen Zahlen ein, vgl. 11(1) f¨ ur α = 1. Sp¨ ater notierte er diese Anzahl als πn; das Symbol ϕ
§ 5.
Teilbarkeit in Integrit¨ atsringen
53
geht auf Gauss (Disquisitiones Arithmeticae, Art. 38) zur¨ uck, der ϕn schrieb. Euler selbst hatte die Eigenschaften (i) und (ii) in Satz 11 bzw. (i) in Korollar 11 f¨ ur die ϕ–Funktion entdeckt. Die Aussage (iii) von Satz 11 wurde f¨ ur α = 1 von Gauss (a.a.O., Art. 39) bewiesen, w¨ ahrend (iv) desselben Satzes 1856 von ¨ bius E. Betti gefunden wurde, nachdem 1831 die Funktion μ aus 9 von A.F. Mo (Werke IV, 591–613) definiert und systematisch untersucht worden war. Die in 6 bis 11 gegebene Einf¨ uhrung der zahlentheoretischen Funktionen scheint auf Originalarbeiten von E.T. Bell ab 1915 zur¨ uckzugehen, die er in seinem Buch Algebraic Arithmetic (AMS Coll. Publ. VII, New York, 1927) unter sehr allgemeinen, vereinheitlichenden Gesichtspunkten dargestellt hat.
§ 5.
Teilbarkeit in Integrit¨ atsringen
F¨ ur die in 1 bis 3 zu gebenden Definitionen gen¨ ugt es, R lediglich als kommutativen Ring mit vom Nullelement 0 verschiedenem Einselement 1 vorauszusetzen. In 4 bis 7 sei R u ¨berdies nullteilerfrei, also Integrit¨atsring. 1. Teiler, Einheiten, Assoziiertheit. Sind m, n ∈ R, m = 0, so heißt (in Verallgemeinerung von 1.2) n durch m teilbar, wenn es ein q ∈ R mit n = mq gibt. (Bei nullteilerfreiem R kann es h¨ ochstens ein derartiges q geben.) Ist n durch m teilbar, so notiert man dies als m|n (die Negation als m |n) und sagt, m sei ein Teiler von n; wie in 1.2 sind auch hier Teiler generell von Null verschieden. Weiter heißt jeder Teiler ε ∈ R\{0} von 1 eine Einheit; die Menge aller Einheiten von R wird mit E(R) bezeichnet und 1 ∈ E(R) ist klar. Man hat nun folgende Proposition. (i)
Zu jedem ε ∈ E(R) existiert genau ein ε ∈ E(R) mit εε = 1.
(ii)
Es ist E(R), · eine abelsche Gruppe.
Die Gruppe in (ii) heißt Einheitengruppe von R. Beweis. Zu (i): Wegen ε|1 existiert ein ε ∈ R mit εε = 1; ersichtlich ist ε = 0 und ε |1, also ε ∈ E(R). Hat ε dieselben Eigenschaften wie ε , so folgt aus εε = εε sofort ε = ε . Zu (ii) reicht es nach (i), die Abgeschlossenheit von E(R) bez¨ uglich der Multiplikation zu zeigen: Bei ε1 , ε2 ∈ E(R) existieren ε1 , ε2 ∈ E(R) mit ε1 ε1 = 1 = ε2 ε2 , weswegen auch (ε1 ε2 )(ε1 ε2 ) = 1 gilt, was ε1 ε2 = 0 und (ε1 ε2 )|1, also ε1 ε2 ∈ E(R) beinhaltet.
54
1. Teilbarkeit
Bemerkung. Aus Satz 1.2 gewinne der Leser E(Z) = {−1, 1}. Eine weitere Einheitengruppe ist in Bemerkung 3 zu 2.1.8 zu berechnen. Sind m, n ∈ R, so heißt m assoziiert zu n, wenn es ein ε ∈ E(R) mit εm = n gibt. Ist m assoziiert zu n, so schreibt man m ∼ n; die Negation hiervon wird als m ∼ n notiert. Man erkennt mit der Proposition unmittelbar, daß die Relation ¨ ∼ auf R eine Aquivalenzrelation definiert; daher wird man bei m ∼ n einfacher sagen, m und n seien (zueinander) assoziiert. ¨ Klar ist, daß eine der Aquivalenzklassen von R bez¨ uglich ∼ alleine aus dem Nullelement 0 von R besteht und daß eine weitere mit E(R) u ¨bereinstimmt. Hat man irgend zwei Elemente m, n aus einer von {0} verschiedenen Klasse, so teilen sich diese gegenseitig, d.h. (1)
m ∼ n =⇒ m|n, n|m.
Bei nullteilerfreiem R gilt in (1) auch die umgekehrte Implikation. Speziell sind ¨ {−n, n}, n = 1, 2, . . ., genau die von {0} verschiedenen Aquivalenzklassen von Z. ¨ Offenbar ist Teilbarkeit eine Eigenschaft, die sich jeweils auf ganze Aquivalenzklassen bez¨ uglich ∼ bezieht, d.h. m|n f¨ ur m, n ∈ R, m = 0 ist gleichwertig mit ur alle m , n ∈ R, m = 0, m ∼ m, n ∼ n. Um den nichttrivialen Teil m |n f¨ dieser Behauptung zu beweisen, st¨ utzt man sich auf (i) in der Proposition. In Z bedeutet dies: Zur Untersuchung der Teilbarkeit von ganzen Zahlen darf man sich auf deren Absolutbetr¨ age beschr¨anken; vgl. Bemerkung 2 zu 1.2.
2. Die Begriffe ggT und kgV. Seien n1 , . . . , nk ∈ R nicht alle Null; d ∈ R\{0} heißt ein ggT von n1 , . . . , nk genau dann, wenn gilt: d|n1 , . . . , d|nk und aus d ∈ R \ {0}, d |n1 , . . . , d |nk folgt d |d. Es m¨ogen jetzt n1 , . . . , nk ∈ R, nicht alle Null, einen ggT d ∈ R \ {0} besitzen. Nach Proposition 1(i) ist dann jedes d∗ ∈ R \ {0} mit d∗ ∼ d ein ggT von n1 , . . . , nk . Ist andererseits d∗ ∈ R \ {0} ein weiterer ggT von n1 , . . . , nk , so gelten nach Definition eines ggT (1)
d∗ |d
und
d|d∗ .
a) Ist insbesondere d ∈ E(R), so folgt d∗ ∈ E(R) aus (1) und man kann sagen: Haben n1 , . . . , nk ∈ R, nicht alle Null, u ¨berhaupt einen ggT und ist dieser eine Einheit, so ist die Menge aller ggT von n1 , . . . , nk gleich E(R); genau in diesem Falle nennt man n1 , . . . , nk zueinander teilerfremd.
§ 5.
Teilbarkeit in Integrit¨ atsringen
55
b) Wie nach 1(1) festgestellt, folgt bei nullteilerfreiem R aus (1) die Assoziiertheit von d, d∗ . Ist also R ein Integrit¨ atsring und sind n1 , . . . , nk ∈ R nicht alle Null, so ist ihr ggT, falls er u ¨berhaupt existiert, bis auf Assoziiertheit eindeutig ¨ bestimmt. Dann wird die Aquivalenzklasse unter ∼ aller ggT von n1 , . . . , nk mit (n1 , . . . , nk ) bezeichnet. Dies ist auch im Falle a) sinnvoll, wo man selbstverst¨andlich (n1 , . . . , nk ) = E(R) hat. Der Begriff eines ggT ist hier in einer Weise eingef¨ uhrt worden, wie dies durch den Charakterisierungssatz 2.3B in Verbindung mit der dortigen Bemerkung nahegelegt war. Analog l¨ aßt man sich nun von Satz 2.11 leiten, um in R ein kgV zu definieren. Seien n1 , . . . , nk ∈ R \ {0}; m ∈ R \ {0} heißt ein kgV von n1 , . . . , nk genau dann, wenn gilt: n1 |m, . . . , nk |m und aus m ∈ R \ {0}, n1 |m , . . . , nk |m folgt m|m . ¨ Ubertr¨ agt der Leser die obigen Betrachtungen zum ggT–Begriff bis hin zu (1) und die in b) daran anschließenden auf den kgV–Begriff, so wird er feststellen: Ist R ein Integrit¨ atsring und sind n1 , . . . , nk ∈ R \ {0}, so ist ihr kgV, falls es u ¨berhaupt existiert, bis auf Assoziiertheit eindeutig bestimmt; dann wird die ¨ Aquivalenzklasse unter ∼ aller kgV von n1 , . . . , nk mit [n1 , . . . , nk ] bezeichnet.
Bemerkung. In 6.11 wird sich zeigen, daß nicht in jedem Integrit¨atsring zu vorgegebenen Elementen ein ggT oder ein kgV existiert.
3. Unzerlegbare Elemente, Primelemente. Bei m, n ∈ R, m = 0 heißt m echter Teiler von n, falls m Teiler von n ist, der weder Einheit noch zu n assoziiert ist. Speziell ist m ∈ Z \ {0} echter Teiler von n ∈ Z genau dann, wenn m|n, m = ±1, m = ±n gilt. Sei nun n ∈ R weder Null noch Einheit; n heißt unzerlegbar (oder irreduzibel), wenn es keine echten Teiler hat, und andernfalls zerlegbar (oder reduzibel). Danach sind die unzerlegbaren Elemente von Z genau diejenigen Elemente aus Z \ {−1, 0, 1} der Form p oder −p mit p ∈ IP. Sei erneut n ∈ R weder Null noch Einheit; n heißt Primelement genau dann, wenn aus n|n1 n2 , n1 , n2 ∈ R stets n|n1 oder n|n2 folgt. Nach dem Charakterisierungssatz 2.7 sind die Primelemente von Z nichts anderes als die unzerlegbaren Elemente von Z. Die Tatsache, daß die beiden zuletzt eingef¨ uhrten Begriffe im Ring Z zusammenfallen, beruht auf einer speziellen Eigenschaft desselben, vgl. Satz 5A, Satz 6 und die Bemerkung 1 in 6.
56
1. Teilbarkeit
Stets jedoch hat man die nachfolgende Implikation.
Satz.
In Integrit¨atsringen ist jedes Primelement unzerlegbar.
Beweis. Ist R ein Integrit¨ atsring und n ∈ R ein Primelement, so ist n = 0 und n ∈ E(R). Sei n1 ∈ R \ {0} ein beliebiger Teiler von n; mit geeignetem n2 ∈ R \ {0} ist also (1)
n = n1 n2 .
Da n Primelement ist, folgt n|n1 oder n|n2 aus (1). Bei n|n1 folgt aus n1 |n die Assoziiertheit von n1 und n (vgl. nach 1(1)), bei n|n2 folgt aus n2 |n analog n2 ∼ n und somit n1 ∈ E(R) wegen (1). Jedenfalls ist n1 Einheit oder zu n assoziiert und so hat n keine echten Teiler, ist also unzerlegbar. In Satz 5A wird eine große, Z umfassende Klasse von Integrit¨atsringen angegeben, in denen die Umkehrung der Satzaussage ebenfalls gilt. Andererseits findet sich in 6.11 ein Ring, in dem nicht jedes unzerlegbare Element auch Primelement ist. F¨ ur die Untersuchungen in 4 wird noch ein Hilfssatz bereitgestellt, dessen Beweis sich am zweiten Beweis f¨ ur die Eindeutigkeitsaussage des Fundamentalsatzes der Arithmetik orientiert, vgl. 2.8. Lemma. Gilt f¨ ur r ≥ 1 Primelemente p1 , . . . , pr , f¨ ur s ≥ 1 unzerlegbare ur eine Einheit ε eines Integrit¨ atsrings die Gleichung Elemente q1 , . . . , qs und f¨ (2)
p1 · . . . · pr = εq1 · . . . · qs ,
so ist r = s und es gibt eine Permutation π der Zahlen 1, . . . , r mit qπ(ρ) ∼ pρ f¨ ur ρ = 1, . . . , r. Bemerkung. Unter den Voraussetzungen des Lemmas erweisen sich also auch die q’s als Primelemente. Beweis durch Induktion u ¨ber Min(r, s). Sei erst Min(r, s) = 1. Ist r = 1, so geht die linke Seite p1 von (2) in einem der q1 , . . . , qs auf, da p1 als Primelement die Einheit ε nicht teilen kann; nach K¨ urzen in Gleichung (2) durch p1 w¨ urde bei s ≥ 2 rechts ein qσ zur¨ uckbleiben, welches dann das Einselement des Integrit¨atsrings R teilen m¨ ußte entgegen qσ ∈ E(R). So ist s = 1 und (2) beinhaltet p1 ∼ q1 . Bei s = 1 besagt (2) soviel wie q1 = ε p1 · . . . · pr mit ε := ε−1 ∈ E(R); bei r ≥ 2
§ 5.
Teilbarkeit in Integrit¨ atsringen
57
h¨ atte q1 z.B. den echten Teiler p1 , was der Unzerlegbarkeit von q1 widerspricht. So ist r = 1 und wieder p1 ∼ q1 , was den Induktionsbeginn erledigt. Sei nun Min(r, s) ≥ 2 und die Behauptung f¨ ur Min(r, s) − 1 = Min(r − 1, s − 1) ur ein t ∈ {1, . . . , s}, da pr Primelement ist. bewiesen. Aus (2) folgt pr |qt f¨ Andererseits hat qt als unzerlegbares Element keine echten Teiler und so muß qt ∼ pr sein, d.h. qt = ε1 pr mit einem ε1 ∈ E(R). Danach ist (2) a¨quivalent zu (3)
p1 · . . . · pr−1 = ε q1 · . . . · qs−1
mit ε := εε1 ∈ E(R) und unzerlegbaren qσ := qσ , (σ = 1, . . . , t − 1), qσ := qσ+1 , (σ = t, . . . , s − 1). Auf (3) ist nun die Induktionsvoraussetzung anwendbar.
4. Faktorielle Ringe. Ein Integrit¨ atsring heißt faktorieller Ring, wenn sich jedes seiner von Null und den Einheiten verschiedenen Elemente als Produkt endlich vieler Primelemente darstellen l¨ aßt. In einem faktoriellen Ring ist die geforderte Produktdarstellung der Elemente nach Lemma 3 in Verbindung mit Satz 3 automatisch eindeutig bis auf die Reihenfolge der Faktoren und bis auf Assoziiertheit. In dem durch Lemma 3 v¨ ollig pr¨ azisierten Sinne wird im folgenden gesagt, eine Produktdarstellung sei im wesentlichen eindeutig. Damit kann behauptet werden der
Satz.
F¨ ur Integrit¨atsringe R sind folgende Aussagen ¨aquivalent:
(i)
R ist faktorieller Ring.
(ii)
Jedes von Null und den Einheiten verschiedene Element von R l¨ aßt sich im wesentlichen eindeutig als Produkt endlich vieler irreduzibler Elemente darstellen.
Beweis. (i) ⇒ (ii) folgt unmittelbar aus der Definition eines faktoriellen Rings sowie aus Lemma 3 und Satz 3. F¨ ur (ii) ⇒ (i) braucht lediglich eingesehen zu werden, daß unter der Voraussetzung (ii) jedes unzerlegbare Element von R bereits Primelement ist. Sei n ∈ R unzerlegbar und es gelte n|n1 n2 mit n1 , n2 ∈ R, o.B.d.A. beide von Null und Einheiten verschieden. Wegen (ii) lassen sich beide ni im wesentlichen eindeutig als Produkte endlich vieler unzerlegbarer Elemente q1,i , . . . , qs(i),i darstellen und das Produkt dieser s(1) + s(2) Elemente q ist eine Darstellung von n1 n2 , die ihrerseits im wesentlichen eindeutig ist. Weil n ein unzerlegbarer Teiler von n1 n2 ist, muß es zu einem der obigen q’s assoziiert sein und somit in einem der beiden ni aufgehen, womit n als Primelement erkannt ist.
58
1. Teilbarkeit
Bemerkungen. 1) Oft bezeichnet man einen faktoriellen Ring auch als ZPE–Ring (Ring mit Zerlegung in Primelemente eindeutig). Man beachte, daß faktorielle Ringe direkt dadurch definiert sind, daß in ihnen ein Analogon zum Fundamentalsatz 1.5 verlangt wird. 2) In faktoriellen Ringen haben endlich viele Elemente (unter den u ¨blichen Voraussetzungen u ¨ber ihr Nichtverschwinden) stets einen ggT und ein kgV. 3) E.D. Cashwell und C.J. Everett (Pacific J. Math. 9, 975–985 (1959)) haben bewiesen, daß der in Satz 4.6 untersuchte Integrit¨ atsring der zahlentheoretischen Funktionen faktoriell ist.
5. Hauptidealringe. Bekanntlich heißt eine nichtleere Teilmenge J eines kommutativen Rings R ein Ideal in R, falls gilt: (i) J, + ist Untergruppe von R, + , (ii) JR ⊂ J, wobei JR := {n · x : n ∈ J, x ∈ R}. {0} bzw. R sind offenbar Ideale in R, das Null– bzw. Einheitsideal in R. Sind n1 , . . . , nk ∈ R fest vorgegeben, so ist auch die Teilmenge k k n1 R + . . . + nk R := ni xi : (x1 , . . . , xk ) ∈ R i=1
von R ein Ideal in R, das von n1 , . . . , nk erzeugte Ideal, vgl. 2.4. Ein Ideal in R, das von einem einzigen Element von R erzeugt wird, heißt Hauptideal. Ein Integrit¨ atsring, in dem jedes Ideal schon Hauptideal ist, heißt Hauptidealring. Bevor nun die wichtigsten Ergebnisse u ¨ber Teilbarkeit in Hauptidealringen vorgestellt werden, wird noch ein einfacher Hilfssatz bereitgestellt. Lemma. F¨ ur Elemente a, b eines Integrit¨ atsrings R gilt (i) a ∼ b ⇔ aR = bR; bei b = 0 gelten außerdem (ii) b ist Teiler von a ⇔ aR ⊂ bR, (iii) b ist echter Teiler von a ⇔ aR ⊂ bR ⊂ R. =
=
Beweis. Zu (ii): b|a besagt a = bq mit geeignetem q ∈ R; ist nun x ∈ aR, so auch x ∈ bR, also aR ⊂ bR. Gilt nun diese Mengeninklusion, so ist a ∈ bR, d.h. a = bq mit einem q ∈ R, also b|a. ¨ Zu (i) darf o.B.d.A. a = 0, b = 0 vorausgesetzt werden (sonst gilt die Aquivalenz trivialerweise). Im Anschluß an 1(1) wurde a ∼ b ⇔ a|b, b|a festgestellt und
§ 5.
Teilbarkeit in Integrit¨ atsringen
59
nach (ii) sind letztere Teilbarkeitsbedingungen mit aR ⊃ bR, aR ⊂ bR, also aR = bR ¨ aquivalent. Kombination von (i) und (ii) liefert (iii) sofort.
Satz A. In Hauptidealringen ist jedes unzerlegbare Element auch Primelement. Beweis. Sei R Hauptidealring und sei n ∈ R ein unzerlegbarer Teiler von n1 n2 mit n1 , n2 ∈ R. Man betrachte das Ideal (1)
J := nR + n1 R
in R. Weil R Hauptidealring ist, wird J von einem d ∈ R erzeugt, was J = dR bedeutet; wegen 0 = n ∈ J ist d = 0. Aus (1) folgt dR ⊃ nR, also d|n nach (ii) im Lemma. Wegen seiner Unzerlegbarkeit hat n keinen echten Teiler, was zu d ∼ n oder d ∼ 1 (⇔ d ∈ E(R)) f¨ uhrt. Im ersten Fall ist nR = dR ⊃ n1 R wegen (1), also n|n1 nach dem Lemma. Im zweiten Fall ist R = nR+n1 R und daher hat man 1 = nx+n1 y bei geeigneter Wahl von x, y ∈ R, also n2 = n(n2 x)+(n1 n2 )y, uhrt. Somit ist n als Primelement erkannt. was wegen n|n1 n2 zu n|n2 f¨
Satz B. In einem Hauptidealring l¨ aßt sich jedes von Null und den Einheiten verschiedene Element als Produkt endlich vieler unzerlegbarer Elemente darstellen. Beweis. Ist R der betrachtete Hauptidealring, so sei M die Menge aller m ∈ R \ {0}, m ∈ E(R), so daß f¨ ur alle k ∈ N und f¨ ur alle k–Tupel (r1 , . . . , rk ) unzerlegbarer Elemente von R die Ungleichung r1 · . . . · rk = m gilt. Die Behauptung des Satzes ist offenbar mit M = ∅ gleichbedeutend. Nimmt man jetzt M = ∅ an, so gelingt die rekursive Konstruktion einer geeigneten Folge (mi ) ∈ M N0 : Man setzt m0 ∈ M beliebig fest. Ist dann i ≥ 0 und mi ∈ M bereits fixiert, so muß mi einen echten Teiler (etwa mi ) haben, weil es sonst schon selbst unzerlegbar w¨ are und daher M nicht angeh¨oren k¨ onnte. Mit geeignetem mi ∈ R ist also mi = mi mi und daher mi = 0, mi ∈ E(R), mi ∼ mi , weshalb auch mi echter Teiler von mi sein muß. Sicher ist nun mi ∈ M oder mi ∈ M , weil andernfalls mi mi = m ∈ M w¨are. Man w¨ahlt mi+1 beliebig in {mi , mi } ∩ M . Nach (iii) im Lemma und nach Konstruktion der Folge (mi ) gelten die Mengeninklusionen (2)
{0} = m0 R ⊂ m1 R ⊂ . . . ⊂ mi R ⊂ . . . , =
=
=
=
60
1. Teilbarkeit
wobei noch m0 = 0 beachtet ist. Definiert man schließlich (3)
J :=
mi R,
i∈N0
so ist ∅ = J ⊂ R klar und es wird behauptet, daß J ein Ideal in R ist. Dazu hat man (i), (ii) der Definition nachzuweisen: Sind m, n ∈ J, so gibt es i, j ∈ N0 mit m ∈ mi R, n ∈ mj R wegen (3); setzt man o.B.d.A. i ≤ j voraus, so ist auch m ∈ mj R nach (2), also m + n ∈ mj R und somit m + n ∈ J nach (3), was (i) beweist. Ist n ∈ J, x ∈ R, so folgt aus n ∈ mj R sofort nx ∈ mj R, also nx ∈ J mit (3), was auch (ii) beweist. Da R Hauptidealring ist, ist das Ideal J aus (3) ein Hauptideal, weshalb man J = mR bei geeignetem m ∈ J \ {0} hat. Wegen (3) gibt es ein i0 ∈ N0 mit m ∈ mi0 R, also mit mi0 |m oder a¨quivalent (J =)mR ⊂ mi0 R nach (ii) im Lemma. Andererseits beinhaltet (3) die Inklusion mi R ⊂ J f¨ ur alle i ∈ N0 und damit wegen (2) J ⊂ mi0 R ⊂ mi0 +1 R ⊂ J. =
Der hier erzielte Widerspruch zeigt die Unhaltbarkeit der Annahme M = ∅. Kombination der S¨ atze A und B ergibt unter Ber¨ ucksichtigung der Definition eines faktoriellen Rings in 4 unmittelbar den Satz C. Jeder Hauptidealring ist faktorieller Ring.
6. Euklidische Ringe. Wie kann man einem Integrit¨ atsring ansehen, ob er Hauptidealring ist? Um eine einigermaßen befriedigende Antwort auf diese Frage geben zu k¨ onnen, sei folgende Definition vorausgeschickt. Ein Integrit¨ atsring R heißt euklidischer Ring, wenn in R ein “Divisionsalgorithmus” und eine Abbildung G : R\{0} → N mit folgenden Eigenschaften existiert: Zu jedem Paar (n, m) ∈ R2 mit m = 0 gibt es ein Paar (a, b) ∈ R2 , so daß gilt (1)
n = am + b mit entweder b = 0 oder G(b) < G(m).
Die Abbildung G heißt Gradfunktion (oder euklidische Normfunktion). ¨ Uber euklidische Ringe hat man folgenden wichtigen Satz, der eine Antwort auf die eingangs gestellte Frage gibt.
§ 5.
Teilbarkeit in Integrit¨ atsringen
61
Satz. Jeder euklidische Ring ist Hauptidealring (und somit faktorieller Ring). Beweis. Sei R euklidischer Ring und J ein beliebiges Ideal in R, welches o.B.d.A. nicht das Nullideal {0} ist. Offenbar ist {G(x) : x ∈ J, x = 0} eine nichtleere Teilmenge von N, die somit ein kleinstes Element besitzt. Es werde m ∈ J, m = 0 mit minimalem G–Wert fixiert. Ist n ∈ J beliebig, so existieren Elemente a, b ∈ R, die den Bedingungen (1) gen¨ ugen; dabei ist sogar b ∈ J wegen m, n ∈ J, wenn man noch beide definierende Eigenschaften eines Ideals ausn¨ utzt. Bei b = 0 w¨are b wegen der letzten Bedingung in (1) ein Element von J \{0} mit kleinerem G–Wert als m, was nicht geht. So ist b = 0, also n = am oder n ∈ mR, was J ⊂ mR bedeutet. Da mR ⊂ J aus m ∈ J folgt, ist J = mR bewiesen und somit J als Hauptideal erkannt. Bemerkungen. 1) Wie in 2.2 nachgewiesen, ist Z ein euklidischer Ring; als Gradfunktion ist die durch G(x) := |x| f¨ ur x ∈ Z \ {0} festgelegte geeignet. Nach dem hier gezeigten Satz ist Z auch Hauptidealring, weswegen Satz 2.4 so formuliert werden kann: Das von n1 , . . . , nk ∈ Z, nicht alle Null, erzeugte Ideal in Z ist identisch mit dem von ggT(n1 , . . . , nk ) erzeugten Hauptideal. 2) In euklidischen Ringen kann ein ggT zweier Elemente, die nicht beide Null sind, analog wie in 2.9 durch mehrfache Anwendung des in (1) geforderten Divisionsalgorithmus ermittelt werden.
7. Polynome. Hier sei R Integrit¨atsring und k eine nat¨ urliche Zahl. Eine formale k-fache Summe (1)
f :=
a(i1 , . . . , ik )X1i1 · . . . · Xkik
i∈Nk0 mit allen a(i) := a(i1 , . . . , ik ) ∈ R, von denen h¨ ochstens endlich viele von Null verschieden sind, heißt Polynom in den k Unbestimmten X1 , . . . , Xk u ¨ber R, die a(i) heißen die Koeffizienten von f . Die Menge aller Polynome (1) u ¨ber R wird als R[X1 , . . . , Xk ] notiert. Ist f wie in (1) und (2)
g :=
b(i1 , . . . , ik )X1i1 · . . . · Xkik ∈ R[X1 , . . . , Xk ],
i∈Nk0 so heißt f gleich g (in Zeichen f = g), falls a(i) = b(i) f¨ ur alle i ∈ Nk0 gilt. Ist nicht f gleich g, so schreibt man f = g.
62
1. Teilbarkeit
Das Polynom f aus (1) heißt nichtkonstant, wenn a(i) = 0 f¨ ur mindestens ein i ∈ Nk0 \ {0}, andernfalls konstant; sind insbesondere alle a(i) Null, so heißt f das Nullpolynom, welches als 0 notiert wird. Bei f = 0 heißt ∂(f ) := Max{i1 + . . . + ik : i ∈ Nk0 , a(i) = 0}
(3)
der Gesamtgrad von f und ∂κ (f ) := Max{iκ : i ∈ Nk0 , a(i) = 0}
(4)
der Grad von f in Xκ , κ = 1, . . . , k. Hat man insbesondere ein Polynom f = 0 in einer Unbestimmten (die man X ohne Index schreibt), so fallen (3) und (4) zusammen und man spricht nur vom Grad von f und schreibt ∂(f ) f= ai X i . i=0
ochste Koeffizient) von f ; ist Dabei heißt a∂(f ) = 0 der Leitkoeffizient (oder h¨ dieser insbesondere gleich 1, so heißt f normiert. Zu f, g ∈ R[X1 , . . . , Xk ] wie in (1), (2) werden nun zwei neue formale k–fache Summen definiert gem¨ aß (5) f + g := c(i1 , . . . , ik )X1i1 · . . . · Xkik mit c(i) := a(i) + b(i) i∈Nk0 bzw. (6)
f · g :=
d(i1 , . . . , ik )X1i1 · . . . · Xkik mit d(i) :=
a(j)b(l),
j,l∈Nk0 j+l=i
i∈Nk0
jeweils f¨ ur alle i ∈ Nk0 . Nach Voraussetzung gibt es ein I ∈ N0 , so daß die a(i), ur dieselben i ist dann c(i) b(i) f¨ ur alle i ∈ Nk0 mit i1 + . . . + ik > I Null sind. F¨ Null und hieraus folgt insbesondere (7)
∂(f + g) ≤ Max(∂(f ), ∂(g))
f¨ ur alle f, g ∈ R[X1 , . . . , Xk ] \ {0} mit f + g = 0. Weiter ist auch d(i) Null f¨ ur ur diese gilt in jedem Summanden a(j)b(l) die i mit i1 + . . . + ik > 2I; denn f¨ ganz rechts in (6) eine der Bedingungen j1 + . . . + jk > I oder l1 + . . . + lk > I. Daher sind f + g, f · g ∈ R[X1 , . . . , Xk ]; sie heißen Summe bzw. Produkt von f und g. Man rechnet nun elementar nach, daß R[X1 , . . . , Xk ] bez¨ uglich der hier definierten Addition (die Inverse zu f wird −f geschrieben) und Multiplikation einen kommutativen Ring mit Einselement (der Eins von R) bildet; dieser heißt der Polynomring in k Unbestimmten u ¨ber R. Bisher hat man die Nullteilerfreiheit von R noch nicht ausgen¨ utzt; dies wird nun n¨ otig, wenn man noch die Nullteilerfreiheit des Polynomrings R[X1 , . . . , Xk ] haben m¨ ochte f¨ ur folgenden
§ 5.
Teilbarkeit in Integrit¨ atsringen
63
Satz. F¨ ur jedes k ∈ N ist der Polynomring in k Unbestimmten u ¨ber einem Integrit¨ atsring selbst wieder ein Integrit¨ atsring. Beweis. Man definiert zun¨ achst in Nk0 eine Relation , indem man f¨ ur i, i ∈ Nk0 schreibt i i (und sagt, i kommt nicht nach i ), falls aus i1 = i1 , . . . , iκ−1 = ur ein κ ∈ {1, . . . , k} folgt iκ < iκ . Weiter schreibt man i ≺ i iκ−1 , iκ = iκ f¨ (i kommt vor i ), falls i i , i = i gilt. Man sieht leicht, daß bzw. ≺ eine Ordnung bzw. strikte Ordnung sind, deren Linearit¨ at und deren Monotonie bez¨ uglich der Addition (in Nk0 ) sofort klar ist. Sei nun f bzw. g aus R[X1 , . . . , Xk ] \ {0} und sei J = (J1 , . . . , Jk ) bzw. L = (L1 , . . . , Lk ) das bez¨ uglich der eingef¨ uhrten Ordnung letzte j bzw. l aus Nk0 mit a(j) = 0 bzw. b(l) = 0. Nach (6) ist (8)
d(J + L) =
a(j)b(l) = a(J)b(L) = 0,
j,l∈Nk0 j+l=J+L also f · g = 0. Dabei ist folgendes beachtet: In der Summe in (8) brauchen nur solche j, l ber¨ ucksichtigt zu werden, f¨ ur die j J und l L gilt; ist jedoch j ≺ J, l L oder j J, l ≺ L, so ist j + l ≺ J + l J + L, also j + l ≺ J + L im ersten Fall und die letzte Beziehung folgt auch im zweiten. Daher war in (8) alleine der Summand mit j = J, l = L zu ber¨ ucksichtigen. Aus diesem Beweis ergibt sich als Korollar der Grad–Satz. Ist R Integrit¨atsring, so gilt f¨ ur f, g ∈ R[X] \ {0} erstens f · g ∈ R[X] \ {0} und zweitens ∂(f · g) = ∂(f ) + ∂(g). Man beachte, daß die Ordnung in Nk0 (die sogenannte lexikographische Ordnung) f¨ ur k = 1 nichts anderes ist als die in 1.1 eingef¨ uhrte Ordnung ≤ in N0 . Bemerkung. Der Leser weise E(R[X]) = E(R) f¨ ur Integrit¨atsringe R nach ebenso wie E(K) = K × f¨ ur K¨ orper K.
8. Polynome u ¨ ber K¨ orpern. F¨ ur K¨ orper K ist K[X] nach Satz 7 Integrit¨ atsring und in diesem hat man folgenden Divisionsalgorithmus. Ist K K¨ orper, so gibt es zu jedem Paar (f, g) mit f, g ∈ K[X], g = 0 genau ein Paar (q, r) mit q, r ∈ K[X], so daß f = qg + r und entweder r = 0 oder ∂(r) < ∂(g) gilt.
64
1. Teilbarkeit
Beweis. Ist entweder f = 0 oder ∂(f ) < ∂(g), so leisten offenbar q := 0, r := f und nur diese das Gew¨ unschte. Sei jetzt (n :=) ∂(f ) ≥ ∂(g) (=: m) und n m f = i=0 ai X i , g = j=0 bj X j mit an bm = 0. Wenn dann ein Paar (q, r) den des Satzes gen¨ ugt, ist q = 0 und Bedingungen ∂(q) = n − m, und mit q = n−m c X ist =0 (1)
r = f − qg =
n
Min(m,i)
ai −
i=0
bj ci−j X i
j=Max(0,i+m−n)
sowie (2)
ai =
m
bj ci−j
f¨ ur i = m, . . . , n.
j=Max(0,i+m−n)
Betrachtet man andererseits (2) als lineares inhomogenes System von n − m + 1 Gleichungen f¨ ur die n − m + 1 Unbekannten c0 , . . . , cn−m , so ist dieses eindeutig l¨ osbar, da die Elemente in der Hauptdiagonalen seiner quadratischen Koeffizientenmatrix ersichtlich alle gleich bm (= 0) sind. Bildet man dann q mit den gefundenen c wie oben und definiert damit r := f − qg, so folgt mit (2) aus der rechten Seite von (1), daß entweder r = 0 oder ∂(r) < m = ∂(g) gilt. F¨ ur den sp¨ ateren Gebrauch wird hieraus noch abgeleitet das Abspaltungslemma. Ist K K¨ orper, f ∈ K[X] und ist c ∈ K Nullstelle von f , so gilt f (X) = (X − c)q(X) mit eindeutig bestimmtem q ∈ K[X]; ist hier f = 0, so auch q = 0 und ∂(f ) = 1 + ∂(q). Beweis. Nach dem Divisionsalgorithmus ist f (X) = (X − c)q(X) + r(X) mit konstantem Polynom r, wobei r(X) = r(c) = f (c) = 0 ist. Nun kann man behaupten den Satz. F¨ ur Integrit¨atsringe R sind folgende Aussagen ¨aquivalent: (i) R ist K¨ orper. (ii) R[X] ist euklidischer Ring. (iii) R[X] ist Hauptidealring. Beweis. Ist (i) erf¨ ullt, so definiert man G(f ) := 2∂(f ) f¨ ur f ∈ R[X] \ {0} und hat damit in G eine Gradfunktion, f¨ ur die 6(1) gilt; damit trifft (ii) zu. Die
§ 6.
Algebraische Zahlk¨ orper, insbesondere quadratische
65
Implikation (ii) ⇒ (iii) entnimmt man Satz 6, w¨ ahrend der Nachweis von (iii) ⇒ (i) in diesem Buch nicht gef¨ uhrt werden soll.
9. Polynomringe u ¨ ber faktoriellen Ringen. Da Z kein K¨ orper ist, beinhaltet die hier nicht bewiesene Implikation (iii) ⇒ (i) von Satz 8 den folgenden Satz A. Der Polynomring Z[X] ist kein Hauptidealring. Hierf¨ ur soll ein von Satz 8 unabh¨ angiger direkter Beweis gegeben werden. Man betrachtet das von den Polynomen 2 und X erzeugte Ideal J in Z[X]. W¨ are J Hauptideal, so m¨ ußte es von einem d ∈ J \ {0} erzeugt werden, was d|2 (nach dem Grad–Satz 7 also die Konstanz von d), d|X und die Existenz von f, g ∈ Z[X] mit (1)
d = 2f (X) + Xg(X)
nach sich z¨oge. Wegen d|X bliebe nur d ∈ {−1, 1}, aber andererseits folgt d = 2f (0) aus (1), was 2|d bedeutet. Schließlich soll ohne Beweis noch folgendes Ergebnis mitgeteilt werden, das im Falle R = Z auf Gauss (Konsequenz des Satzes in Disquisitiones Arithmeticae, Art. 42) zur¨ uckgeht und das man allgemein in der Algebra zeigt. Satz B. F¨ ur Integrit¨atsringe R gilt: R ist faktorieller Ring genau dann, wenn R[X] faktorieller Ring ist. Bemerkungen. 1) Da Z faktorieller Ring ist, trifft dies auch f¨ ur Z[X] zu. Insbesondere ist Z[X] nach den S¨ atzen A, B ein Beispiel f¨ ur einen faktoriellen Ring, der kein Hauptidealring ist; Satz 5C ist also nicht umkehrbar. 2) Da Z faktoriell ist, ist Z[X1 ] faktoriell, also Z[X1 , X2 ] usw. Allgemein ist der ganzzahlige Polynomring Z[X1 , . . . , Xk ] faktorieller Ring f¨ ur alle nat¨ urlichen k.
§ 6.
Algebraische Zahlk¨ orper, insbesondere quadratische
1. Algebraische Zahlen, Minimalpolynom. Sei K|L irgendeine K¨ orpererweiterung. Man nennt α ∈ K algebraisch u ¨ber L, wenn es ein f ∈ L[X]\{0} gibt mit f (α) = 0; andernfalls heißt α transzendent u ¨ber L. Ist speziell L = Q und α ∈ C, so l¨ aßt man den Zusatz “¨ uber Q” meist weg: Man sagt in diesem Fall also,
66
1. Teilbarkeit
α sei algebraisch (bzw. transzendent), wenn es ein (bzw. kein) f ∈ Q[X] \ {0} gibt mit f (α) = 0; im ersten Fall ist ∂(f ) ∈ N klar. Selbstverst¨ andlich kann f hier bei Bedarf als ganzzahliges Polynom vorausgesetzt werden. Sei jetzt α ∈ C algebraisch und δ ∈ N minimal gew¨ahlt, so daß es ein f ∈ Q[X] \ {0} mit f (α) = 0, ∂(f ) = δ gibt. Hat g dieselben Eigenschaften wie f , so gilt nach dem Divisionsalgorithmus 5.8: Es ist f = qg + r mit q, r ∈ Q[X] und entweder r = 0 oder ∂(r) < ∂(g) = δ. Wegen f (α) = 0 = g(α) ist r(α) = 0 und nach Definition von δ ist r = 0, also f = qg, wobei q ∈ Q × nach dem Grad–Satz 5.7 gelten muß. Es gibt also genau ein normiertes Polynom fα kleinsten positiven Grades mit rationalen Koeffizienten, welches α annulliert; dies fα heißt das Minimalpolynom von α. Ebenso existiert genau ein α annullierendes Polynom Pα desselben Grades wie fα mit teilerfremden ganzen Koeffizienten und positivem Leitkoeffizienten; dieses Pα werde hier das ganzzahlige Minimalpolynom von α genannt. Offenbar ist Pα gleich fα mal dem Leitkoeffizienten von Pα . Der gemeinsame Grad von fα und Pα heißt der Grad von α, in Zeichen: ∂(α).
Satz. Das Minimalpolynom einer algebraischen Zahl ist (in Q[X]) irreduzibel. Bemerkung. Das Minimalpolynom fα ist Element des nach Satz 5.8 euklidischen Rings Q[X] und dort ist klar, was unter irreduziblen (oder unzerlegbaren) und Primelementen dieses Rings zu verstehen ist; nach Satz 5.5A besagen beide Begriffe hier dasselbe. Der Zusatz “in Q[X]” ist der Deutlichkeit halber beigef¨ ugt; in umfassenderen Polynomringen kann fα sehr wohl zerlegbar sein. Beweis. Wegen ∂(fα) ∈ N und der Bemerkung zu 5.7 ist fα keine Einheit von Q[X]. W¨ are fα zerlegbar, so g¨ abe es echte Teiler g, h ∈ Q[X] \ {0} von fα mit are fα = g · h und 0 < ∂(g), ∂(h) < ∂(fα ); wegen g(α)h(α) = fα (α) = 0 w¨ g(α) = 0 oder h(α) = 0, was nicht sein kann.
2. Konjugierte. Vorab wird bereitgestellt folgendes Lemma. (i)
Ist α Nullstelle eines g ∈ Q[X] \ {0}, so wird g vom Minimalpolynom fα von α geteilt.
(ii)
Ist α Nullstelle eines irreduziblen g ∈ Q[X], so sind fα und g zueinander assoziiert.
§ 6. (iii)
Algebraische Zahlk¨ orper, insbesondere quadratische
67
Irreduzible Polynome aus Q[X] mit einer gemeinsamen Nullstelle sind stets zueinander assoziiert.
Beweis. (i) Nach Voraussetzung ist α algebraisch und nach dem Divisionsalgorithmus 5.8 existieren q, r ∈ Q[X], so daß gilt g = qfα + r mit r = 0 oder ∂(r) < ∂(fα ). Wegen 0 = g(α) = r(α) muß r = 0 sein, also g = qfα . (ii) Ist g irreduzibel, so ist g = 0 und dann q = 0 wegen g = qfα , weshalb q ∈ Q × gelten muß, d.h. g ∼ fα nach der Bemerkung zu 5.7. (iii) Sind g1 , g2 ∈ Q[X] irreduzibel und ist α ∈ C eine gemeinsame Nullstelle, so gilt gi ∼ fα f¨ ur i = 1, 2 nach (ii); die Transitivit¨ at der Relation ∼ liefert die Behauptung. Ist jetzt α eine algebraische Zahl und δ := ∂(α) (= ∂(fα )), so hat fα in C genau δ Nullstellen α1 := α, α2 , . . . , αδ ; dies ist Inhalt des Fundamentalsatzes der Algebra. Als erste Folgerung aus dem Lemma wird ben¨otigt
Korollar. Sei α algebraisch, fα sein Minimalpolynom und α2 , . . . , αδ (falls δ := ∂(α) ≥ 2) dessen weitere Nullstellen. Dann ist fα das Minimalpolynom ur j = 2, . . . , δ. jedes α2 , . . . , αδ und somit ∂(αj ) = ∂(α) f¨ Beweis. Sei gj ∈ Q[X] das Minimalpolynom von αj f¨ ur j = 2, . . . , δ; nach Satz 1 sind gj und fα irreduzibel. Da beide αj als Nullstelle haben, ist gj = qj fα mit einem qj ∈ Q × nach (iii) im Lemma. Weil aber beide Polynome normiert sind, ur j = 2, . . . , δ. ist qj = 1, also gj = fα f¨ ¨ Uber die Nullstellen des Minimalpolynoms einer algebraischen Zahl gibt nun Auskunft der folgende Satz. Die Nullstellen des Minimalpolynoms einer algebraischen Zahl sind s¨amtliche einfach. Beweis. Sind α1 := α, α2 , . . . , αδ wie im Korollar und k¨ ame etwa β mehrfach unter den α’s vor, so w¨ are δ ≥ 2 und β Nullstelle von fα ebenso wie von dessen Ableitung fα ∈ Q[X] \ {0}. Nach dem Korollar ist fβ = fα und nach (i) des Lemmas wird fβ von fβ geteilt, was aus Gradgr¨ unden nicht geht. Die paarweise verschiedenen Nullstellen α1 := α, α2 , . . . , αδ einer algebraischen Zahl α des Grades δ := ∂(α) heißen die Konjugierten von α (bez¨ uglich Q).
68
1. Teilbarkeit
3. Algebraische Zahlk¨ orper. Die Menge aller komplexen algebraischen Zah¨ber symmetrische Funktionen len wird mit Q bezeichnet. Mit Hilfe des Satzes u beweist man in der Algebra leicht, daß aus α, β ∈ Q folgt α + β, α · β ∈ Q. Trivialerweise gilt bei β ∈ Q auch −β, β1 ∈ Q, letzteres bei β = 0, so daß sich insgesamt Q als K¨orper mit Q ⊂ Q ⊂ C erweist. Q heißt der algebraische Abschluß von Q in C. Gewisse Zwischenk¨orper von Q und Q werden vor allem in Kap. 6 ben¨ otigt aume aufgefaßt, endliund zwar diejenigen K¨ orper K, die u ¨ber Q, als Vektorr¨ che Dimension haben. Genau diese K¨orper K bezeichnet man als algebraische Zahlk¨ orper; ihre Dimension u ¨ber Q schreibt man als [K : Q] und bezeichnet sie als Grad von K. Man beachte aber, daß Q u ¨ber Q nicht von endlicher Dimension ist.
4. Normen. Sei α algebraisch und fα ∈ Q[X] sein Minimalpolynom. Sind α1 := α, α2 , . . . , αδ mit δ := ∂(α) die Konjugierten von α, so folgt aus fα (X) = (X − α1 ) · . . . · (X − αδ ) sofort (1)
δ
αj = (−1)δ fα (0).
j=1
Das Produkt links in (1) heißt die Norm von α (in Zeichen: N (α)), u ¨ber die folgendes notiert werden kann. Proposition. Die Norm einer algebraischen Zahl ist eine rationale Zahl, welche genau dann Null ist, wenn die algebraische Zahl Null ist. Beweis. Ist α die algebraische Zahl, so ist aus (1) die Rationalit¨ at von N (α) klar. Bei N (α) = 0 ist fα (0) = 0 und so wird fα (X) von X geteilt, was fα (X) = X wegen der Unzerlegbarkeit und der Normiertheit von fα nach sich zieht; daher ist α = 0. Es wird nun ein weiterer Normbegriff entwickelt, der mit dem obigen eng zusammenh¨angt, der aber eine zus¨atzliche Eigenschaft hat, die f¨ ur manche Zwecke sehr n¨ utzlich ist. Sei K ein algebraischer Zahlk¨ orper mit κ := [K : Q]. Nach dem aus der Algebra bekannten Satz vom primitiven Element existiert ein ϑ ∈ K mit ∂(ϑ) = κ, so daß sich jedes α ∈ K eindeutig darstellen l¨ aßt als α = a0 + a1 ϑ + . . . aκ−1 ϑκ−1 mit (2)
A := a0 + a1 X + . . . + aκ−1 X κ−1 ∈ Q[X].
§ 6.
Algebraische Zahlk¨ orper, insbesondere quadratische
69
Sind ϑ1 := ϑ, ϑ2 , . . . , ϑκ die verschiedenen Konjugierten von ϑ bez¨ uglich Q, so ur ι = 1, . . . , κ der Q–Isomorphismus von K = Q(ϑ) auf den konjugierten sei σι f¨ K¨ orper Q(ϑι ) mit der Zusatzeigenschaft σι (ϑ) = ϑι . Sei nun α ∈ K und fα , δ, α1 , . . . , αδ wie zu Anfang dieses Abschnitts. Wegen α = A(ϑ) mit A wie in (2) kommen alle komplexen Zahlen A(ϑι ) = σι (A(ϑ)) = ¨ber symmetrische σι (α), ι = 1, . . . , κ, unter den α1 , . . . , αδ vor. Nach dem Satz u Funktionen ist κ
(3)
(X − A(ϑι )) ∈ Q[X].
ι=1
Sei h1 (X) · . . . · ht (X) eine Zerlegung des Polynoms in (3) mit irreduziblen hτ ∈ Q[X]. Dann hat jedes hτ eine Nullstelle αj und nach Lemma 2(ii) in Verbindung mit Korollar 2 ist hτ zu fα assoziiert. Wegen der Normiertheit von fα ist somit κ
(4)
(X − A(ϑι )) = fα (X)t ,
ι=1
was zu κ = t · ∂(α) (= t · δ) f¨ uhrt. Nun beachtet man, daß sich aus (1) und (4) (5)
κ ι=1
A(ϑι ) =
∂(α)
κ/∂(α) αj
= (−1)κ fα (0)κ/∂(α)
j=1
ergibt. Aus (5) ist ersichtlich, daß das Produkt links bei festem algebraischem Zahlk¨ orper K alleine vom Element α ∈ K abh¨ angt, nicht jedoch von dem gew¨ahlten erzeugenden Element ϑ der Erweiterung K|Q. Die Zahl in (5) heißt Norm von α bez¨ uglich des K¨ orpers K, geschrieben als NK|Q (α). Kombination von (1) und (5) liefert unmittelbar den folgenden Zusammenhang zwischen beiden Normen (6)
NK|Q (α) = N (α)[K:Q]/∂(α) ,
was insbesondere NQ(α)|Q (α) = N (α) beinhaltet. Nun hat man den Satz. F¨ ur algebraische Zahlk¨ orper K und α, β ∈ K gilt: (i) NK|Q (α) ist rational; NK|Q (α) = 0 ⇔ α = 0. (ii) NK|Q (α · β) = NK|Q (α) · NK|Q (β). Beweis. W¨ ahrend sich (i) sofort aus der Proposition in Verbindung mit (6) ergibt, sieht man (ii) so: Seien B := b0 + . . . + bκ−1 X κ−1
bzw.
C := c0 + . . . + cκ−1 X κ−1
70
1. Teilbarkeit
aus Q[X], so daß β = B(ϑ) bzw. αβ = C(ϑ) die zu α = A(ϑ) analogen Darstellungen seien. Nach Definition von NK|Q ist dann NK|Q (αβ) =
κ ι=1
C(ϑι ) =
κ
(A(ϑι ) · B(ϑι )) = NK|Q (α) · NK|Q (β).
ι=1
Bemerkung. Die in (ii) zum Ausdruck kommende Multiplikativit¨ at von NK|Q ist f¨ ur manche Anwendungen (vgl. etwa 9) eine vorteilhafte Eigenschaft, die die zuerst eingef¨ uhrte Norm N nicht besitzt.
5. Ganzheit. Eine algebraische Zahl α heißt ganz, wenn fα ∈ Z[X] gilt. Der Deutlichkeit halber sagt man hier auch, α sei ganzalgebraisch; in diesem Zusammenhang nennt man die Elemente von Z ganzrational. In dieser neuen Terminologie kann Satz 1.9 so ausgesprochen werden: Jede ganzalgebraische Zahl, die rational ist, ist ganzrational. Offenbar fallen genau dann, wenn α ganzalgebraisch ist, Minimalpolynom fα und ganzzahliges Minimalpolynom Pα zusammen, vgl. 1. Erneut mit Hilfe des Satzes u ¨ber symmetrische Funktionen beweist man, daß mit α und β auch α + β und α · β ganzalgebraisch sind. Danach ist f¨ ur jeden Zwischenk¨ orper K von Q und Q, gleichg¨ ultig ob von endlichem Grad u ¨ber Q oder nicht, klar, daß OK := {α ∈ K : fα ∈ Z[X]} Integrit¨ atsring ist. Dieser heißt Ganzheitsring von K. Satz. (i) F¨ ur ganzalgebraische α ist N (α) ganzrational; dabei ist N (α) = 0 genau f¨ ur α = 0. Ist K ein algebraischer Zahlk¨ orper, so gilt f¨ ur α ∈ OK : ¨berdies gleich Null genau f¨ ur α = 0. (ii) Es ist NK|Q (α) ganzrational und u (iii) Genau dann ist α Einheit in OK , wenn NK|Q (α) und N (α) gleich 1 oder −1 sind. Beweis. Zu (i) und (ii): F¨ ur ganzes α sind fα (0) und damit nach 4(1) auch N (α) ganzrational; ist außerdem α ∈ OK , so ist NK|Q (α) ganzrational nach 4(6). Die Zusatzaussagen u ¨ber das Verschwinden von N (α) bzw. NK|Q (α) entnimmt man Proposition 4 bzw. Satz 4(i). Zu (iii): Bei α ∈ E(OK ) existiert α ∈ OK mit αα = 1, woraus man mit Satz 4(ii) erh¨ alt NK|Q (α)NK|Q (α ) = NK|Q (1) = 1. Unter Beachtung von (ii) heißt
§ 6.
Algebraische Zahlk¨ orper, insbesondere quadratische
71
dies NK|Q (α) ∈ {−1, 1} und wegen 4(6) auch N (α) ∈ {−1, 1}, wobei man noch ber¨ ucksichtigt hat, daß N (α) nach (i) ganzrational ist. Ist umgekehrt N (α) = uher ±1, so ist dies nach 4(1) mit ±α2 · . . . · αδ = α1 gleichbedeutend, wenn wie fr¨ δ = ∂(α) ist und α2 , . . . , αδ die von α1 verschiedenen Konjugierten von α1 := α bezeichnen. Nach Korollar 2 haben α2 , . . . , αδ das Minimalpolynom fα und sind somit genauso wie ihr Produkt ganzalgebraisch und so ist α1 ganzalgebraisch und in K. Also ist α1 ∈ OK und α als Einheit in OK erkannt. Bemerkung. Jeder Transzendenzbeweis verwendet in dieser oder jener Form folgende Konsequenz aus Teil (i) des Satzes: Die Norm einer nichtverschwindenden ganzen algebraischen Zahl ist absolut nicht kleiner als Eins. Man vergleiche etwa den Beweis von Lemma 6.4.2.
6. Quadratische Zahlk¨ orper. Dies sind genau die algebraischen Zahlk¨ orper ¨berdies K ⊂ IR, so heißt K reell–quadratisch, anK mit [K : Q] = 2. Ist u dernfalls imagin¨ ar–quadratisch. Ist α aus einem reell–quadratischen (bzw. imagin¨ ar–quadratischen) Zahlk¨ orper, jedoch nicht rational, so nennt man α eine reell– (bzw. imagin¨ ar–) quadratische Irrationalit¨ at (oder Irrationalzahl). Wie sehen nun die Elemente eines quadratischen Zahlk¨orpers K aus? Sei α ∈ K \ Q (also ∂(α) = 2) und Pα := rX 2 + sX + t sein ganzzahliges Minimalpolynom; ist r > 0. Wegen rα2 + sα + t = 0 ist α = √ insbesondere 2 2 −s ± s − 4rt /(2r), wo s − 4rt wegen α ∈ Q keine Quadratzahl ist. Man kann nun in eindeutiger Weise eine quadratfreie (vgl. Bemerkung 2 zu 4.9) Zahl d ∈ Z \ {1} und eine Zahl u ∈ Z \ {0} finden, so daß (1)
s2 − 4rt = du2
gilt, womit dann √ 1 (−s ± u d) 2r mit r, s, u ∈ Z, ru = 0 entsteht. Dabei ist α reell– bzw. imagin¨ ar–quadratisch genau dann, wenn d positiv bzw. negativ ist. (2)
α=
Ist α wie oben gew¨ahlt, so bilden 1, α eine ¨ber Q. Nach den √ Basis von K u ¨ Uberlegungen von soeben stellen auch 1, d eine derartige Basis dar; d ist ein √ Charakteristikum von K und man schreibt K = Q( d).
7. Deren Ganzheitsring. Wie sieht nun der Ganzheitsring Od := OQ(√d) des √ K¨ orpers Q( d) bei quadratfreiem d ∈ Z \ {1} aus? Die vollst¨andige Antwort gibt folgender
72
1. Teilbarkeit √
Satz. Ist d = 1 ganzrational und quadratfrei, so sind die Zahlen x+yz d mit √ teilerfremden ganzrationalen z > 0, x, y des quadratischen Zahlk¨ orpers Q( d) genau dann ganz, wenn entweder z = 1 oder z = 2, 2 |xy, 4|(d − 1) gilt. √ Beweis. Ist α ∈ Q( d) \ Q und Pα sein ganzzahliges Minimalpolynom wie in 6, so ist die Ganzheit√von α definitionsgem¨aß mit r = 1 a¨quivalent, nach 6(2) also mit α = 12 (−s ± u d), wobei u ¨berdies (1)
4|(s2 − du2 )
wegen 6(1) gelten muß. F¨ ur 4|(d − 2) und 4|(d −√3) erweist sich (1) mit 2|s, 2|u aquivalent, weshalb α dann von der Form x + y d mit ganzrationalen x, y ist. ¨ Ist 4|(d − 1), so ist (1) mit 4|(s2 − u2 ) und dies mit 2|(s − u) a¨quivalent; sind dann s, u beide gerade, so hat α dieselbe Form wie soeben. Oder aber es sind √ s, u beide ungerade; dann ist α von der Form 12 (x + y d) mit 2 |xy. Ist α ∈ Q ∩ Od , so ist α ∈ Z nach Satz 1.9 (vgl. auch Anfang von 5); dann ist α von der im Satz angegebenen Form, man kann dort x := α, y := 0, z := 1 w¨ahlen. √ √ Bemerkung. Bei z = 2 und ungeraden x, y ist 12 (x+y d) = 12 (x−y)+ 21 y(1+ d), wobei 12 (x − y) ∈ Z ist. Demnach ist √ Z + Z 1+2 d , falls 4|(d − 1) (2) Od = √ Z + Z d, falls 4|(d − 2) oder 4|(d − 3). Wegen der Quadratfreiheit von d kann der fehlende Fall 4|d selbstverst¨andlich nicht auftreten. Man kann u ¨brigens aus (2) leicht ablesen, daß Od ein Integrit¨ atsring ist; hier kommt man ohne den Satz u ¨ber symmetrische Funktionen aus (vgl. vor Satz 5).
8. Einheiten quadratischer Zahlringe. Hier¨ uber gibt abschließende Auskunft folgender Satz A. Ist d = 1 ganzrational und quadratfrei, so√ist ε Einheit in Od genau dann, wenn mit ganzrationalen x, y gilt: ε = 12 (x + y d), 2|(x − y), x2 − dy 2 = 4 √ oder x2 − dy 2 = −4, falls 4|(d − 1) bzw. ε = x + y d, x2 − dy 2 = 1 oder x2 − dy 2 = −1, falls 4 |(d − 1). Beweis. Nach Satz 5(iii) gilt ε ∈ E(Od ) genau dann, wenn NQ(√d)|Q (ε) = ±1 √ ist. Nach Definition im Anschluß an 4(5) ist diese Norm gleich 12 (x + y d)· √ √ √ 1 1 2 2 2 2 2 (x − y d) = 4 (x − dy ) im ersten bzw. gleich (x + y d) · (x − y d) = x − dy im zweiten Fall, woraus alle Behauptungen folgen.
§ 6.
Algebraische Zahlk¨ orper, insbesondere quadratische
73
Mit dieser Charakterisierung der Einheiten eines quadratischen Zahlrings Od kann nun leicht bewiesen werden Satz B. Ist d ∈ Z negativ und quadratfrei, so hat der Ganzheitsring des √ imagin¨ ar–quadratischen Zahlk¨ orpers Q( d) stets genau die beiden Einheiten 1 und −1; zu diesen treten √ im Fall d = −1 noch i und −i, im Fall d = −3 noch die vier Zahlen 12 (±1 ± −3) als Einheiten hinzu. Beweis. Daß bei d < 0 der Ausdruck x2 − dy 2 aus Satz A weder −4 noch −1 sein kann, ist klar. Bei d < −3 und quadratfrei ist x2 − dy 2 = 4 bzw. x2 − dy 2 = 1 offenbar gleichbedeutend damit, daß (x, y) gleich (±2, 0) bzw. (±1, 0) ist, was den ersten Teil der Behauptung liefert. Bei d = −3 hat man x2 + 3y 2 = 4 zu beachten und dies ist a¨quivalent mit (x, y) = (±2, 0), (±1, ±1), was zu den angegebenen sechs Einheiten f¨ uhrt. In den F¨ allen d = −1, −2 schließlich hat man x2 − dy 2 = 1 zu betrachten, was bei d = −2 mit (x, y) = (±1, 0) und bei d = −1 mit (x, y) = (±1, 0), (0, ±1) ¨aquivalent ist. Das Problem der Bestimmung aller Einheiten im Ganzheitsring reell–quadratischer Zahlk¨orper kann erst in 4.3.6 behandelt werden. Dort wird sich zeigen, daß im reell–quadratischen Fall stets unendlich viele Einheiten existieren, ganz im Gegensatz zum imagin¨ar–quadratischen Fall.
9. Euklidische quadratische Zahlringe. Die imagin¨ar–quadratischen Zahl√ k¨ orper Q( d), deren Ganzheitsringe euklidisch im Sinne von 5.6 sind, sind s¨amtliche bekannt. Man entnimmt sie folgendem Satz. Ist d eine√der Zahlen −11, −7, −3, −2, −1, 2, 3, 5, 13, so ist der Ganzheitsring von Q( d) euklidisch. Beweis. Offenbar muß man die Bedingung 5.6(1) f¨ ur einen euklidischen Ring √ sichern. Sei d ∈ Z \ {1} quadratfrei und η := 12 (1 + d) bei 4|(d − 1) bzw. √ η := d bei 4 |(d − 1) gesetzt. Sind ν, μ ∈ Od , μ = 0, so gilt mit gewissen a, b ∈ Q die Gleichung μν = a + bη. Mit eindeutig bestimmten B ∈ Z und t ∈] − 12 , 12 ] ∩ Q hat man b = B + t. Analog schreibt man a = A + s mit A ∈ Z, s ∈ Q, wobei man jetzt allerdings nach 4|(d − 1) bzw. 4 |(d − 1) unterscheidet: Im ersten Fall sorgt man f¨ ur s ∈] − 12 (1 + t), 12 (1 − t)], im zweiten f¨ ur s ∈] − 12 , 12 ]. ν In jedem Falle setzt man α := A + Bη ∈ Od und erh¨ alt μ = α + (s + tη) und hier ist das folgende β aus Od (1)
β := ν − αμ = μ(s + tη).
74
1. Teilbarkeit
Als Abbildung G : Od \ {0} → N im Sinne von 5.6 w¨ ahlt man die durch γ → |NQ(√d)|Q (γ)| gegebene, man beachte hierzu Satz 5(ii). Nach Satz 4(ii) folgt aus (1) G(β) = G(μ)|NQ(√d)|Q (s + tη)| =: G(μ)|Δ|, wo man nur noch nachzuweisen hat, daß |Δ| < 1 f¨ ur die genannten d gilt. Wegen (s + t − tη) f¨ ur 4|(d − 1) (2) Δ = NQ(√d)|Q (s + tη) = (s + tη) · (s − tη) f¨ ur 4 |(d − 1) kann gesagt werden: Ist 4|(d − 1) und −12 < d < 16, so gilt wegen (2) und η = leichter Rechnung −1 = −
1 2 (1
+
√ d) nach
t d 1 12 1 16 1 · < (s + )2 − t2 = Δ < + · = 1. 4 4 2 4 4 4 4
Die quadratfreien d = 1, die den beiden Bedingungen nach (2) gen¨ ugen, sind genau diese: −11, −7, −3, 5, 13. √ Ist 4 |(d − 1) und −3 < d < 4, so gilt mit (2) und η = d −1 = −4 ·
1 1 1 < s2 − dt2 = Δ < + 3 · = 1; 4 4 4
die quadratfreien d, die jetzt beiden genannten Bedingungen gen¨ ugen, sind genau diese: −2, −1, 2, 3. ¨ Bemerkung. Uber die neun im Satz genannten d hinaus ist der Ganzheitsring √ uglich der Norm (vgl. obigen Beweis), von Q( d) noch genau dann euklidisch bez¨ wenn d eine der folgenden zw¨ olf Zahlen ist (3)
6, 7, 11, 17, 19, 21, 29, 33, 37, 41, 57, 73.
Dieses Ergebnis wurde schrittweise von mehreren Mathematikern gesichert. Man vergleiche etwa H. Chatland und H. Davenport (Canad. J. Math. 2, 289 296 (1950)), beachte aber E.S. Barnes und H.P.F. Swinnerton–Dyer (Acta √ Math. 87, 259–323 (1952)), die nachwiesen, daß der Ganzheitsring von Q( 97) jedenfalls nicht bez¨ uglich der Norm euklidisch ist, wie dies fr¨ uher behauptet wor¨ den war. Uber reell-quadratische Zahlk¨ orper, deren Ganzheitsringe euklidisch bez¨ uglich einer beliebigen Gradfunktion im Sinne von 5.6 sind, liegen bisher keine ¨ ahnlich abschließende Resultate vor. √ ur die einundzwanzig d– Nach Satz 5.6 ist der Ganzheitsring Od von Q( d) f¨ Werte im Satz bzw. in (3) erst recht Hauptidealring. Die Frage, f¨ ur welche
§ 6.
Algebraische Zahlk¨ orper, insbesondere quadratische
75
negativen quadratfreien d der Ring Od Hauptidealring ist, geht auf Gauss (Disquisitiones Arithmeticae, Art. 303) zur¨ uck, der folgende neun angab (4)
−1, −2, −3, −7, −11, −19, −43, −67, −163.
A.a.O. schrieb Gauss∗) “nullum dubium esse videtur, quin series adscriptae revera abruptae sint” und fuhr sp¨ ater fort “demonstrationes autem rigorosae harum observationum perdifficiles esse videntur.” Tats¨achlich lieferte erst H.M. Stark (Michigan Math. J. 14, 1–27 (1967)) einen vollst¨ andigen ur, √ Beweis daf¨ daß der Ganzheitsring imagin¨ ar–quadratischer Zahlk¨ orper Q( d) genau dann Hauptidealring ist, wenn d eine der neun in (4) angegebenen Zahlen ist.
10. Primzahlen als Summe zweier Quadrate. Wenn wie u ¨blich i := √ −1 gesetzt ist, besagt Satz 9 insbesondere, daß der Ganzheitsring Z + Zi von Q(i) euklidisch ist. Diese Tatsache soll nun angewandt werden zum Nachweis folgender Proposition. Ist eine Primzahl als Summe zweier Quadratzahlen darstellbar, so ist diese Darstellung bis auf die Reihenfolge der Summanden eindeutig. Beweis. Sei p eine Primzahl und x2 + y 2 = p = x21 + y12 mit ganzrationalen x, y, x1 , y1 ; die letzte Gleichung ist mit (1)
(x + yi)(x − yi) = p = (x1 + y1 i)(x1 − y1 i)
¨quivalent. Alle vier Klammerausdr¨ a ucke m¨ ussen hier Primelemente in Z + Zi sein. Sicher ist n¨ amlich keiner Null oder eine Einheit, letzteres wegen Satz 8B: Gilt etwa x + yi = α · β mit α, β ∈ Z + Zi, so folgt aus α · β · (x − yi) = p wegen Satz 4(ii) NQ(i)|Q (α) · NQ(i)|Q (β) · (x2 + y 2 ) = p2 , also N... (α) · N... (β) = p, weshalb hier genau einer der Faktoren 1 ist; nach Satz 5(iii) ist genau eines der α, β Einheit. Da die Primelementzerlegung in Z + Zi im wesentlichen eindeutig ist, folgt aus (1) entweder x + yi = ε(x1 + y1 i), x1 − y1 i = ε(x − yi) oder x + yi = ε1 (x1 − y1 i), x1 + y1 i = ε1 (x − yi) mit Einheiten ε, ε1 , die nach Satz 8B gleich einer der Zahlen 1, −1, i, −i sein m¨ ussen. Ist z.B. ε = −i, so heißt dies x + yi = ollig analog k¨ onnen die restlichen −i(x1 +y1 i) = y1 −ix1 , also (x, y) = (y1 , −x1 ); v¨ F¨ alle diskutiert werden. ∗)
(“Es scheint außer Zweifel, daß die angegebenen Folgen tats¨ achlich abbrechen.” “Aber strenge Beweise dieser Feststellungen d¨ urften a¨ußerst schwierig sein.”)
76
1. Teilbarkeit
Bemerkungen. 1) Die hier angeschnittene Problematik wird in 3.3.4 und 4.1.1– 2 vertieft. Insbesondere wird in 4.1.1 vollst¨ andig gekl¨art, welche Primzahlen tats¨achlich als Summe zweier Quadratzahlen darstellbar sind. 2) Der hier betrachtete Ring Z + Zi, bisweilen auch Z[i] notiert, heißt Gaussscher Zahlring. In der Tat hat ihn zuerst Gauss 1807 untersucht und zur L¨osung arithmetischer Probleme benutzt. Seine diesbez¨ uglichen Ergebnisse hat er jedoch erst 1831 publiziert (Werke II, S. 93ff., S. 169ff.). Mit dem Schritt, zur Behandlung von Aufgaben im Ganzrationalen umfassendere Ringe wie den obigen heranzuziehen, hat Gauss auch als Wegbereiter der algebraischen Zahlentheorie zu gelten.
11. Dedekinds Beispiel. R. Dedekind (Gesammelte mathematische Werke √ −5 des imagin¨ ar– III, 278–281) hat gezeigt, daß der Ganzheitsring Z + Z √ quadratischen Zahlk¨ orpers Q( −5) nicht faktoriell ist. Dieser Ring wird kurz mit ID bezeichnet; nach Satz 8B hat er nur die beiden Einheiten 1 und −1. Proposition. (i) Ist β ∈ ID (echter) Teiler von α ∈ ID, so ist NQ(√−5)|Q (β) (echter) Teiler von NQ(√−5)|Q (α) in Z. √ (ii) Haben α, β ∈ ID dieselbe Norm bez¨ uglich Q( −5) und ist α = ±β, so gilt α |β, β |α. √ (iii) Die Norm bez¨ uglich Q( −5) jedes Elements von ID l¨ aßt bei Division durch 5 einen der Reste 0, 1 oder 4. Beweis. (i) Ist α = βγ mit einem γ ∈ ID, so folgt die Behauptung aus Satz 4(ii); man muß nur noch beachten, daß nach Satz 5(iii) √ Einheiten von ID dadurch charakterisiert sind, daß ihre Norm bez¨ uglich Q( −5) gleich 1 ist. (ii) Unter den gemachten Voraussetzungen ist zun¨achst αβ = 0. Haben nun α, β gleiche Normen und gilt etwa β|α, also α = βγ mit γ ∈ ID, so muß γ bez¨ uglich √ Q( −5) Norm 1 haben, also Einheit sein; dann gilt α = β oder α = −β. √ (iii) Hat α ∈ ID die Form x + y −5 mit x, y ∈ Z, so ist NQ(√−5)|Q (α) = x2 + 5y 2 ; da x2 bei Division durch 5 nur die Reste 0, 1 oder 4 lassen kann, ist die Behauptung klar. √ √ Nun wird behauptet, daß die Elemente 3, 2 + −5, 2 − −5 von ID unzerlegbar sind. uglich √ Jeder echte Teiler eines dieser drei Elemente (deren Normen bez¨ Q( −5) s¨amtliche 9 sind), m¨ ußte nach (i) die Norm 3 haben, was (iii) widerspricht. Nach (ii) ist außerdem klar, daß keines der drei Elemente in einem der
§ 6.
Algebraische Zahlk¨ orper, insbesondere quadratische
77
beiden anderen aufgehen kann. Wegen 3 · 3 = 9 = (2 +
√ √ −5) · (2 − −5)
hat also 9 ∈ ID zwei wesentlich verschiedene Produktzerlegungen in unzerlegbare √ Elemente.√Nach Satz 5.4√ist ID kein faktorieller Ring. Wegen (2 + −5)|3 · 3, aber (2 + −5) |3 ist 2 + −5 kein Primelement (obwohl unzerlegbar, vgl. Satz 5.3). √ Weiter haben die Zahlen 9 und 3(2 + −5) weder einen ggT noch ein kgV. √ Man setzt σ := 3, τ := 2 + −5. W¨are δ ∈ ID ein ggT von 3σ und 3τ (die beide Norm 81 haben), so m¨ ußte nach (i) die Norm von δ in 81 aufgehen. Da andererseits σ und τ (beide von der Norm 9) gemeinsame Teiler von 3σ und 3τ sind und somit auch δ teilen, muß die Norm von δ mit R¨ ucksicht auf (iii) gleich 9 oder 81 sein. Im ersten Fall sind die Normen von δ, σ, τ gleich; wegen σ|δ, τ |δ und (ii) ist σ = ±δ, τ = ±δ, also σ = ±τ , was offenbar falsch ist. Im zweiten Fall sind die Normen von δ, 3σ, 3τ gleich; wegen δ|3σ, δ|3τ und (ii) ist δ = ±3σ, δ = ±3τ und man erh¨ alt denselben Widerspruch wie im ersten Fall. Zum gleichen Widerspruch f¨ uhrt auch die Annahme, 3σ und 3τ h¨ atten ein μ ∈ ID als kgV; hier hat man lediglich davon Gebrauch zu machen, daß 9σ und 9τ gemeinsame Vielfache von 3σ, 3τ sind. Die Ausf¨ uhrung der Einzelheiten kann ¨ dem Leser als Ubung u ¨berlassen bleiben.
Kapitel 2.
Kongruenzen
Wie sich in Kap. 1 gezeigt hat, ist der Teilbarkeitsbegriff f¨ ur die Zahlentheorie fundamental. Die dort begonnenen Untersuchungen u ¨ber Teilbarkeit ganzer Zahlen werden jetzt fortgesetzt, allerdings aus einem anderen Blickwinkel und unter Verwendung des neuen Begriffs der Kongruenz. Obwohl ihrer urspr¨ unglichen Definition nach eine Aussage u ¨ber Teilbarkeit ganzer Zahlen, ist eine Kongruenzaussage mehr als nur eine n¨ utzliche Formulierung. Ihr Wert liegt haupts¨ achlich darin, daß man mit Kongruenzen bequem formal operieren kann, genauer gesagt, daß man mit ihnen weitgehend wie mit Gleichungen rechnen kann. Historisch wurde die Bedeutung des Kongruenzbegriffs f¨ ur die Zahlentheorie zuerst von Gauss voll erkannt, der ihn ganz an den Anfang seiner Disquisitiones Arithmeticae stellte. Daran anschließend hat er eine sehr weitgehende und reichhaltige Theorie der Kongruenzen entwickelt, die sofort allgemein akzeptiert und zu einem bleibenden Bestandteil der Zahlentheorie wurde. Die wichtigsten S¨ atze dieser Theorie kommen in Kap. 2 (und im gr¨ oßten Teil von Kap. 3) zur Darstellung. Einerseits werden dabei sehr viel a¨ltere, klassische Teilbarkeitsergebnisse nach dem Gaussschen Vorgang in der neuen Kongruenzensprache viel einfacher formuliert und bewiesen. Hierher geh¨ort der in § 2 zu besprechende, vor mindestens eineinhalb Jahrtausenden in China und Indien in speziellen Varianten bekannte chinesische Restsatz. Auch die in § 3 darzustellenden zentralen S¨ atze von Fermat, Euler und Wilson sind hier zu nennen. Diese finden z.B. bei Primzahltests Anwendung, in neuerer Zeit in der Theorie der geheimen Nachrichten¨ ubermittlung. Andererseits werden in Kap. 2 Resultate diskutiert, die zuerst von Gauss selbst entdeckt worden sind und die sich (in neuerer Terminologie) vorwiegend mit der Struktur der primen Restklassengruppen auseinandersetzen. Genau wann diese zyklisch sind, wird in § 5 vollst¨ andig gekl¨art. Dort wird auch der Spezialfall eines allgemeineren gruppentheoretischen Satzes bewiesen, wonach prime
§ 1.
Lineare Kongruenzen
79
Restklassengruppen stets isomorph dem direkten Produkt geeigneter zyklischer Gruppen von Primzahlpotenzordnung sind. § 1.
Lineare Kongruenzen
1. Definition der Kongruenz, elementare Eigenschaften. Seien m = 0, a, b ganze Zahlen. Man nennt a kongruent (zu) b modulo m genau dann, wenn m|(a − b) gilt; man schreibt dies als a ≡ b (mod m). Aus Satz 1.1.2(i), (ii), (ix) folgt insbesondere r) a ≡ a (mod m), s) a ≡ b (mod m) ⇒ b ≡ a (mod m), t) a ≡ b (mod m), b ≡ c (mod m) ⇒
a ≡ c (mod m).
¨ Hieraus sieht man bereits, daß die Relation kongruent modulo m eine Aquivalenzrelation auf Z ist. Damit zerlegt sie Z in disjunkte Klassen, die sogenannten Restklassen modulo m. Insbesondere kann man wegen der Symmetrieregel s) einfachere Sprechweisen einf¨ uhren, etwa “a und b sind modulo m kongruent” oder a¨hnlich; im Fall m |(a − b) sagt man, a und b seien modulo m inkongruent, und schreibt a ≡ b (mod m). Aus der gegebenen Kongruenzdefinition folgen einige leichte Rechenregeln, die nachfolgend zusammengestellt seien. Satz. (i) (ii) (iii) (iv)
Sind a, b, c, d und m = 0 ganz, so gilt a ≡ b (mod m), c ≡ d (mod m) ⇒ a + c ≡ b + d (mod m); a ≡ b (mod m), c ≡ d (mod m) ⇒ ac ≡ bd (mod m); a ≡ b (mod m) ⇒ ai ≡ bi (mod m) f¨ ur alle i ∈ N0 ; a ≡ b (mod m), f ∈ Z[X] ⇒ f (a) ≡ f (b) (mod m).
Sind u ¨berdies alle m1 , . . . , mk ganz und von Null verschieden und ist m := kgV(m1 , . . . , mk ), so gilt (v) a ≡ b (mod mκ ) f¨ ur κ = 1, . . . , k ⇔ a ≡ b (mod m). Beweis. Indem man Satz 1.1.2(ix) mit n1 := a − b, n2 := c − d, 1 := 1, 2 := 1 anwendet, erh¨ alt man (i). Erneut nach (ix) jenes Satzes folgt aus m|(a − b) bzw. m|(c − d) die G¨ ultigkeit von m|(ac − bc) bzw. m|(bc − bd), also m|(ac − bd). Unter Zuhilfenahme von (ii) gewinnt man (iii) durch vollst¨ andige Induktion nach i; (iv) folgt aus den drei ersten, schon bewiesenen Regeln unmittelbar. F¨ ur (v) u ¨berlegt man, daß mκ |(a − b) f¨ ur κ = 1, . . . , k nach dem Charakterisierungssatz 1.2.11 f¨ ur das kgV bereits m|(a − b) nach sich zieht; ist umgekehrt diese Teilbarkeitsbedingung erf¨ ullt, so folgt aus mκ |m mittels Satz 1.1.2(vii) die G¨ ultigkeit von mκ |(a − b) f¨ ur κ = 1, . . . , k.
80
2. Kongruenzen
Bemerkung. Die Kongruenzschreibweise wird hier zur bequemen Notation von Teilbarkeitsaussagen eingef¨ uhrt. Dementsprechend folgten die im obigen Satz zusammengestellten Rechenregeln f¨ ur Kongruenzen leicht aus den in Satz 1.1.2 aufgef¨ uhrten Regeln f¨ ur den Umgang mit Teilbarkeitsbeziehungen. Wie obiger Satz belegt, kann man mit Kongruenzen weitgehend so rechnen (d.h. addieren, subtrahieren und multiplizieren), wie man dies von Gleichungen her gew¨ ohnt ist. Wegen dieser starken Analogie hat Gauss das Zeichen ≡ f¨ ur kongruent in Anlehnung an das u ¨bliche Gleichheitszeichen gew¨ahlt, vgl. hierzu auch die historischen ¨ Bemerkungen in 9. Diese große formale Ahnlichkeit mit den Gleichungen macht die Kongruenz zu einem u ¨beraus vorteilhaften technischen Hilfsmittel, das sich im folgenden noch oft bew¨ ahren wird, dessen Wirksamkeit sogleich im n¨achsten Abschnitt – vor der weiteren Entwicklung der allgemeinen Theorie – an einem Beispiel demonstriert werden soll.
2. Fermat–Zahlen. Darunter versteht man die Zahlen n
Fn := 22 + 1,
n = 0, 1, . . . .
Die f¨ unf kleinsten sind 3, 5, 17, 257, 65537 und dies sind jeweils Primzahlen. Fermat sprach 1640 in einem Brief an B. Frenicle De Bessy die Vermutung aus, daß auch die weiteren Fn Primzahlen seien. Er r¨ aumte aber ein, keinen Beweis f¨ ur seine Behauptung zu besitzen, die wenig sp¨ater von M. Mersenne u ¨bernommen wurde. In einer Korrespondenz mit Euler w¨ahrend der Jahre 1729/30 lenkte Goldbach dessen Aufmerksamkeit auf Fermats erw¨ahnte Vermutung, die 1732 von Euler (Opera Omnia Ser. 1, II, 1–5) widerlegt werden konnte. Euler zeigte, daß F5 zusammengesetzt ist, genauer, daß es von der Primzahl 641 geteilt wird. Ohne Taschenrechner, daf¨ ur mit dem Hilfsmittel der Kongruenzen, geht dies wie folgt: Indem man zun¨ achst Satz 1(iv) mit f := (X − 1)4 anwendet, folgt aus 5 · 27 = 641 − 1 54 · 228 = (641 − 1)4 ≡ (−1)4 = 1 (mod 641). Andererseits ergibt sich aus 641 = 24 + 54 die Kongruenz 54 ≡ −24 (mod 641) und diese in die vorher erhaltene eingetragen f¨ uhrt zu 1 − F5 = −24 · 228 ≡ 1 (mod 641), was 641|F5 besagt. Tats¨achlich hat Euler mit F5 = 641 · 6700417 sogar die Primfaktorzerlegung von F5 gefunden. Der Leser wird sich mit Recht fragen, wieso man gerade darauf kommt, die Teilbarkeit von F5 durch 641 f¨ ur m¨ oglich zu halten (und dann zu beweisen); dies wird durch Satz 3.2.11 erkl¨ art werden.
§ 1.
Lineare Kongruenzen
81
In der Literatur finden sich mittlerweile eine ganze Reihe notwendiger und hinreichender Bedingungen daf¨ ur, daß Fn Primzahl ist. Allerdings ist bis heute noch keine Primzahl Fn mit n ≥ 5 gefunden worden; man vergleiche hierzu auch die in 3.2.11 mitgeteilten Resultate. Interessant ist aber, daß man die Fermat–Zahlen f¨ ur einen weiteren Beweis des Euklidschen Satzes 1.1.4 ben¨ utzen kann, der ebenfalls nur auf die Primzahldefinition und auf einige der Regeln aus Satz 1.1.2 zur¨ uckgreift. Euklids Satz ist eine direkte Konsequenz aus folgendem
Satz. F¨ ur voneinander verschiedene ganze, nichtnegative m und n sind Fm und Fn zueinander teilerfremd. n
Beweis. Man definiert Gn := 22 − 1 = Fn − 2 f¨ ur n = 0, 1, . . . und sieht sofort Fn Gn = Gn+1 f¨ ur dieselben n, was induktiv zu (1)
Gn
m−1
Fν = Gm
f¨ ur 0 ≤ n ≤ m
ν=n
f¨ uhrt. Sei jetzt d eine nat¨ urliche, Fm und Fn teilende Zahl und o.B.d.A. sei n < m. Nach (1) wird Gm von d geteilt und wegen Fm − Gm = 2 muß dann d in 2 aufgehen. Wegen der Ungeradheit aller Fermat–Zahlen muß d = 1 gelten.
Bemerkung. Die Fermat–Zahlen spielen z.B. auch in der Algebra eine gewisse Rolle, und zwar bei der Frage nach der Konstruierbarkeit des regul¨ aren h–Ecks bei gegebenem Umkreisradius allein mittels Zirkel und Lineal. Gauss (Disquisitiones Arithmeticae, Artt. 335–366) hat gezeigt, daß diese Konstruktion unter den genannten Nebenbedingungen genau dann durchf¨ uhrbar ist, wenn h die Form 2n0 Fn1 · . . . · Fnr hat mit n0 , . . . , nr ∈ N0 und paarweise verschiedeamtliche Fermat–Zahlen Fnρ Primzahlen sind; dabei nen n1 , . . . , nr , so daß s¨ ist r = 0 erlaubt. Einige historische Anmerkungen zu dieser Gaussschen Entdeckung folgen in 9.
3. K¨ urzungsregel. Regel (ii) von Satz 1 beinhaltet insbesondere: Wenn a ≡ b (mod m) gilt, so auch ac ≡ bc (mod m) bei beliebigem ganzem c. Daß die umgekehrte Schlußweise nicht immer richtig zu sein braucht, belegt folgendes Beispiel: Es ist zwar 9 · 5 = 45 ≡ 15 = 3 · 5 (mod 10), aber nicht 9 ≡ 3 (mod 10). Wieviel in dieser Richtung tats¨ achlich noch gesichert werden kann, entnimmt man folgender
82
2. Kongruenzen
¨ K¨ urzungsregel. F¨ ur ganze m = 0, a, b, c gilt die Aquivalenz ac ≡ bc (mod m) ⇔ a ≡ b (mod
m ). (c, m)
Beweis. Setzt man c := c/(c, m), m := m/(c, m), so sind c , m nach Proposition 1.2.5(vii) teilerfremd. Wegen ac ≡ bc (mod m) ⇔ m|(a − b)c ⇔ m |(a − b)c folgt dann m |(a − b) (⇔ a ≡ b (mod m )) aus der letzten Teilbarkeitsbedingung, wenn man Satz 1.2.6(i) investiert. Die umgekehrte Implikation der K¨ urzungsregel ist wegen m|(c, m) · (a − b) ⇒ m|c(a − b) trivial. Besonders herausgestellt sei noch der Fall der K¨ urzungsregel, wo m Primzahl ist. Korollar.
Ist p eine Primzahl, so gilt f¨ ur ganze a, b, c mit p |c ac ≡ bc (mod p) ⇔ a ≡ b (mod p).
4. Vollst¨ andige Restsysteme. Nach Satz 1.1.2(ii) sind die beiden Kongruenzen a ≡ b (mod m) und a ≡ b (mod − m) gleichbedeutend. Daher darf o.B.d.A. im folgenden stets der Modul m als nat¨ urliche Zahl vorausgesetzt werden. (Da zwei beliebige ganze Zahlen nach Satz 1.1.2(iii) modulo 1 stets kongruent sind, kann bei Bedarf noch o.B.d.A. m ≥ 2 angenommen werden.) Als n¨ achstes soll eine ¨aquivalente Formulierung des Kongruenzbegriffs gegeben werden. Sei f¨ ur ganze n1 , n2 n1 ≡ n2 (mod m).
(1)
Nach dem Divisionsalgorithmus 1.2.2 gibt es ganze a1 , b1 , a2 , b2 , so daß ni = ai m + bi
mit
0 ≤ bi < m
f¨ ur
i = 1, 2
gilt. Wegen (1) bedeutet dies m|(b1 − b2 ); wegen |b1 − b2 | < m und Satz 1.1.2(iv) muß b1 = b2 sein. Man hat also die
§ 1.
Lineare Kongruenzen
83
Proposition. Sind die ganzen Zahlen n1 , n2 modulo m kongruent, so lassen sie bei Division durch m (gem¨aß dem in 1.2.2 beschriebenen Algorithmus) dieselben Reste. Die Umkehrung gilt ebenfalls. Damit ist offenbar jede ganze Zahl zu genau einer Zahl der Menge Sm := {0, 1, . . . , m − 1} modulo m kongruent. Diesen Sachverhalt bringt man zum Ausdruck, indem man sagt, Sm sei das kleinste nichtnegative Restsystem modulo m. Allgemeiner heißt jede Menge von m ganzen Zahlen, die paarweise inkongruent modulo m sind, ein vollst¨ andiges Restsystem modulo m. Nach der in 1 gegebenen Erkl¨ arung ist ein solches System nichts anderes als ein vollst¨ andiges Repr¨asentantensystem der Restklassen modulo m. Neben Sm ist ein anderes spezielles vollst¨andiges Restsystem modulo m bisweilen im Gebrauch, das soge∗ nannte absolut kleinste Restsystem modulo m, das ist die Menge Sm der ganzen 1 1 Zahlen, die gr¨ oßer als − 2 m, aber kleiner oder gleich 2 m sind. Z.B. ist danach S5∗ = {−2, −1, 0, 1, 2} und S6∗ = {−2, −1, 0, 1, 2, 3}.
5. Lineare Kongruenzen. Sind a, c und m > 0 ganze Zahlen, so bezeichnet man (1)
aX ≡ c (mod m)
als lineare Kongruenz (in einer Unbestimmten X). Gen¨ ugt ein ganzes x der Bedingung ax ≡ c (mod m), so sagt man, x l¨ ose (1). Jedes ganze, zu x modulo m kongruente x∗ l¨ ost (1) ebenfalls; doch sind x, x∗ im Sinne des Kongruenzenrechnens als nicht wesentlich voneinander verschiedene L¨ osungen anzusehen. Die Eigenschaft, (1) zu l¨ osen oder nicht, ist also eine Eigenschaft, die einer ganzen Restklasse modulo m zukommt. Dementsprechend definiert man als L¨ osungsanzahl von (1) modulo m die Anzahl der modulo m inkongruenten ganzen x, die (1) l¨ osen; dies ist nichts anderes als die Anzahl der in einem festen vollst¨ andigen Restsystem modulo m enthaltenen L¨ osungen von (1). Im folgenden Satz wird die L¨ osungsanzahl von (1) modulo m bestimmt. Satz. Die Kongruenz (1) ist l¨osbar genau dann, wenn (a, m)|c gilt; in diesem Falle ist die L¨ osungsanzahl von (1) modulo m gleich (a, m). Sind insbesondere a, m teilerfremd, so ist (1) modulo m eindeutig l¨ osbar. Beweis. Ist (1) l¨ osbar, so gibt es ganze x, y, so daß ax + my = c gilt, woraus (a, m)|c nach Satz 1.3.2 folgt. Sei nun umgekehrt diese Teilbarkeitsbedingung erf¨ ullt. Mit a := a/(a, m), c := c/(a, m) und m := m/(a, m) sind a ,
84
2. Kongruenzen
m nach Proposition 1.2.5(vii) zueinander teilerfremd und somit gilt nach der K¨ urzungsregel bei ganzem x (2)
ax ≡ c (mod m) ⇔ a x ≡ c (mod m ).
Durchl¨ auft nun x ein vollst¨ andiges Restsystem modulo m , so tut dies auch das Produkt a x; denn dies sind ebenfalls m ganze Zahlen, die modulo m inkongruent sind: a x1 ≡ a x2 (mod m ) impliziert ja x1 ≡ x2 (mod m ), erneut nach der K¨ urzungsregel. Daher ist die Kongruenz rechts in (2) modulo m eindeutig l¨ osbar und die in Sm (vgl. 4) gelegene L¨ osung heiße x0 . Nun bestimmt man, genau welche der Zahlen x0 + tm , t ∈ Z, in Sm liegen. Offenbar sind dies exakt die folgenden: x0 , x0 + m , . . . , x0 + ((a, m) − 1)m . Nach (2) gen¨ ugen diese (1), womit der Satz bewiesen ist. Bemerkung. Ist a ganz und zum Modul m teilerfremd, so ist insbesondere die Kongruenz aX ≡ 1 (mod m) eindeutig modulo m l¨ osbar. Jedes ganze a mit aa ≡ 1 (mod m) geh¨ ort daher einer festen, durch a bestimmten Restklasse modulo m an und kann daher als die Inverse von a modulo m bezeichnet werden; offenbar ist jedes solche a zu m teilerfremd. Auch a X ≡ 1 (mod m) ist eindeutig modulo m l¨ osbar und jede ganze L¨osung liegt in derselben Restklasse modulo m wie das urspr¨ ungliche a. Zwei ganze Zahlen, a, a heißen zueinander reziprok modulo m, falls aa ≡ 1 (mod m) gilt.
6. Bruchschreibweise. Wie in Satz 5 gesehen, hat die Kongruenz 5(1) bei teilerfremden a, m genau eine L¨ osung modulo m, die man manchmal in der u ¨blichen Form eines Bruchs, also ac , aufschreibt. Damit werden aber nun nicht rationale Zahlen oder gar Kongruenzen zwischen solchen eingef¨ uhrt, sondern man muß sich – vor allem am Anfang – die Interpretation dieser symbolischen Schreibweise genau vor Augen halten. Wenn man dies tut, besteht der gewonnene Vorteil der Schreibweise darin, daß man mit ihrer Hilfe sehr bequem rechnen kann. Dies werde etwa an der Kongruenz 8X ≡ −1 (mod 13) verdeutlicht, deren L¨osung als −1 8 symbolisch hingeschrieben werden kann. Will man nun wissen, f¨ ur welches r ∈ S13 das Symbol −1 steht, geht man etwa so vor: 8 −1 2 · 13 − 1 ≡ = −5 (mod 13). 8 8 − 13
§ 1.
Lineare Kongruenzen
85
−1 8
ist also modulo 13 als 8 zu interpretieren. Wie hier die Durchf¨ uhrung der Rechnung zeigt, kann man also im “Z¨ahler” und “Nenner” beliebige Vielfache des Moduls (hier 13) addieren oder subtrahieren. Dies sieht man sofort ein, zur¨ uckgeht. Danach ist −5r ≡ wenn man auf die Bedeutung des Symbols −1 8 8r ≡ −1 ≡ 25 (mod 13) und in −5r ≡ 25 (mod 13) darf nach der K¨ urzungsregel durch −5 gek¨ urzt werden, was zu r ≡ −5 (mod 13) f¨ uhrt. Obwohl dies aus dem bisher Gesagten bereits klar ist, sei nochmals ausdr¨ ucklich keine absolute Bedeutung zudarauf hingewiesen, daß einem “Bruch” wie −1 8 kommt, sondern daß er stets relativ zu einem ganz bestimmten (zum “Nenner” teilerfremden) Modul interpretiert werden muß. So ist −1 8 z.B. modulo 11 als 4 zu interpretieren. Bemerkung. Am Ende von 1 wurde angemerkt, daß man mit Kongruenzen weitgehend wie mit Gleichungen rechnen kann, da man Kongruenzen (nach demselben Modul) zueinander addieren, voneinander subtrahieren und miteinander multiplizieren kann. Nun kann man noch hinzuf¨ ugen, daß man auch Divisionen wie gewohnt durchf¨ uhren kann, vorausgesetzt der Divisor ist zum Modul teilerfremd. Ist der Modul insbesondere eine Primzahl, so nimmt die soeben formulierte Ausnahmebedingung eine besonders einfache Form an: Bei Primzahlmoduln d¨ urfen auch Divisionen wie gewohnt ausgef¨ uhrt werden, vorausgesetzt, der Divisor ist nicht kongruent Null nach dem Modul.
7. Restklassenring. In diesem und dem folgenden Abschnitt werden die bisherigen Entwicklungen u ¨ber Kongruenzen vom algebraischen Standpunkt aus betrachtet. Ist m eine nat¨ urliche Zahl, so definiert man die (von m abh¨ angige) Abbildung ψ von Z in die Menge der Restklassen modulo m dadurch, daß man jedem a ∈ Z diejenige Restklasse ψ(a) zuordnet, der a angeh¨ort. Danach ist a ≡ a (mod m) ⇔ ψ(a) = ψ(a ) klar; nach den Feststellungen in 4 hat ψ(Z) genau m Elemente. In der Menge ψ(Z) aller Restklassen modulo m definiert man sodann zwei Verkn¨ upfungen + und · durch folgende Vorschriften: (1)
ψ(a) + ψ(b) := ψ(a + b)
bzw. ψ(a) · ψ(b) := ψ(ab)
f¨ ur alle a, b ∈ Z; dabei deutet das + in a + b auf die gew¨ ohnliche Addition in Z hin. Daß diese Definitionen sinnvoll sind, ist eine leichte Konsequenz aus Satz 1(i), (ii). Da die Abbildung ψ des Integrit¨ atsrings Z auf (ψ(Z), +, ·) nach (1) ein Homomorphismus ist, ist (ψ(Z), +, ·) ein kommutativer Ring, der Restklassenring modulo m heißt. Sein Null– bzw. Einselement ist ψ(0) bzw. ψ(1); genau dann ist ψ(0) = ψ(1), wenn m ≥ 2 ist. Man hat nun folgenden
86
2. Kongruenzen
Satz. Der Restklassenring modulo m ist genau dann ein K¨ orper, wenn m Primzahl ist.
Beweis. Der Fall m = 1 ist vorab behandelt; sei jetzt m ≥ 2. Ist m zusamoßer als 1 sind, so ist mengesetzt, also m = m1 m2 mit ganzen m1 , m2 , die gr¨ ψ(0) = ψ(m) = ψ(m1 ) · ψ(m2 ) nach (1). Wegen 0 < m1 , m2 < m ist weder ψ(m1 ) noch ψ(m2 ) gleich dem Nullelement des Restklassenrings modulo m und also hat dieser Nullteiler. Ist jedoch m eine Primzahl, so sind nach (1) die Gleichungen ψ(0) = ψ(m1 ) · ψ(m2 ) und ψ(0) = ψ(m1 m2 ) miteinander uhrt dies mit aquivalent und die letztere besagt m|m1 m2 . Da m Primzahl ist, f¨ ¨ ur eines der i = 1, 2 und so ist dem Charakterisierungs–Satz 1.2.7 zu m|mi f¨ ψ(mi ) = ψ(0) f¨ ur das entsprechende i. Der Restklassenring modulo m ist also f¨ ur Primzahlen nullteilerfrei, insgesamt also ein Integrit¨ atsring; da dieser endlich ist, ist er nach einem einfachen Ergebnis der Algebra ein K¨ orper. Man schreibt den Restklassenring modulo m als Zm oder als Z/mZ. Die letztere Notation erinnert besser daran, daß der hier diskutierte Restklassenring modulo m Spezialfall einer aus der Algebra wohlbekannten Begriffsbildung ist, n¨ amlich des Restklassenrings R/J eines kommutativen Rings R (hier Z) nach einem Ideal J ⊂ R (hier dem Hauptideal mZ).
8. Prime Restklassengruppe. Ist a eine ganze, zu m teilerfremde Zahl, so sind f¨ ur alle ganzen t auch m und a+tm zueinander teilerfremd nach Proposition 1.2.5(v). Die Eigenschaft einer ganzen Zahl, zum Modul m teilerfremd zu sein, kommt also sogleich der ganzen Restklasse modulo m zu, in der die Zahl liegt. Eine Restklasse modulo m, deren jedes Element zu m teilerfremd ist, heißt eine prime (oder auch teilerfremde) Restklasse modulo m. Um s¨amtliche verschiedenen primen Restklassen modulo m zu bestimmen, braucht man nur aus einem vollst¨ andigen Restsystem modulo m genau die zu m teilerfremden Zahlen herauszusuchen; diese m¨ ussen schon alle verschiedenen primen Restklassen modulo m repr¨ asentieren. Bedient man sich dabei am bequemsten des kleinsten nichtnegativen Restsystems Sm modulo m aus 4, so enth¨ alt dieses nach der Definition der Eulerschen Funktion ϕ in 1.4.11 genau ϕ(m) zu m teilerfremde Zahlen; damit gibt es genau ϕ(m) verschiedene prime Restklassen modulo m. Diese k¨onnen von jedem System von ϕ(m) paarweise modulo m inkongruenten, zu m teilerfremden ganzen Zahlen repr¨asentiert werden; jedes solche System heißt ein primes Restsystem modulo m. Z.B. bildet {1, 5, 7, 11} ein primes Restsystem modulo 12.
§ 1.
Lineare Kongruenzen
87
Satz. Die Menge der primen Restklassen modulo m bildet bez¨ uglich der in 7 erkl¨ arten Verkn¨ upfung · eine abelsche Gruppe, die sogenannte prime Restklassengruppe Z∗m modulo m. Beweis. Sind a, b ganz und zu m teilerfremd, so ist nach Korollar 1.2.6 auch ab zu m teilerfremd. Anders gesagt: Sind ψ(a), ψ(b) prime Restklassen modulo m, so ist nach der zweiten Definition von 7(1) auch ψ(a)·ψ(b) eine prime Restklasse modulo m. Daher ist die im Satz genannte Menge gegen¨ uber · abgeschlossen; außerdem gelten bez¨ uglich dieser Verkn¨ upfung Assoziativ– und Kommutativgesetz nach dem Beweis in 7. Sind weiter a, c ganz und zu m teilerfremd, so ist die nach Satz 5 modulo m eindeutig bestimmte L¨osung von 5(1) ebenfalls zu m teilerfremd. Dies ist gleichbedeutend damit, daß die Gleichung (1)
ψ(a) · Y = ψ(c)
unter den genannten Bedingungen eine eindeutige L¨osung hat, die wieder eine prime Restklasse modulo m ist, was den Satz beweist. Bemerkungen. 1) Wie gesehen ist die Ordnung der Gruppe Z∗m gleich ϕ(m). Im Falle eines Primzahlmoduls p ist diese Gruppe nichts anderes als Z× p , die multiplikative Gruppe des K¨ orpers Zp . 2) Jetzt kann auch die in der Bemerkung zu 5 vereinbarte Redeweise, jedes dortige a ∈ Z als die Inverse von a modulo m zu bezeichnen, voll akzeptiert werden: Gemeint ist damit jedes Element derjenigen primen Restklasse modulo m, die zu ψ(a) in Z∗m bez¨ uglich · invers ist. Man beachte, daß ψ(1) ersichtlich das Einselement der Gruppe Z∗m ist. ¨ 3) Der Leser m¨oge zur Ubung nachweisen, daß Z∗m genau die Einheitengruppe E(Zm ) des Restklassenrings Zm modulo m ist, falls m ≥ 2 gilt. 4) Es hat sich weitgehend eingeb¨ urgert, die Restklasse modulo m, der a ∈ Z angeh¨ort, mit a (anstelle von ψ(a)) zu notieren; 0, 1, . . . , m − 1 sind also s¨ amtliche verschiedenen Restklassen modulo m.
9. Historische Anmerkungen. Gauss beginnt seine Disquisitiones Arithmeticae mit der Erkl¨ arung “Si numerus a numerorum b, c differentiam metitur, b et c secundum a congrui dicuntur, sin minus incongrui: ipsum a modulum appellamus.” In Art. 2 f¨ ahrt er dann fort “numerorum congruentiam hoc signo, ≡, in postero denotabimus, modulum ubi opus erit in clausulis adiungentes.” In der Fußnote zu Art. 2 f¨ ugt er schließlich an: “Hoc signum propter magnam ana-
88
2. Kongruenzen
logiam quae inter aequalitatem atque congruentiam invenitur adoptavimus.”∗) Nach dieser Festlegung der Terminologie entwickelte Gauss a.a.O. sofort sehr weitgehend seine Theorie der Kongruenzen, die bald zu einem u ¨beraus wichtigen und bleibenden Bestandteil der Zahlentheorie werden sollte. Abgesehen vom Kongruenzenbegriff der Geometrie wurde hier, historisch erstmalig, rein formal ¨ mit einer Aquivalenzrelation operiert. Es soll jedoch nicht unerw¨ ahnt bleiben, daß sich der zahlentheoretische Begriff der Kongruenz – eben so bezeichnet – vor Gauss bereits ab 1730 in Briefen findet, die Goldbach an Euler geschrieben hat. Goldbach verwendet anstelle von ≡ das Symbol ; allerdings blieb bei ihm im Vergleich zu Gauss der Kongruenzkalk¨ ul noch ganz in den Anf¨angen stecken. Noch einige Worte zu der in der Bemerkung zu 2 angeschnittenen Frage nach der geometrischen Konstruierbarkeit des regul¨aren h–Ecks. Explizite geometrische Konstruktionsverfahren des regelm¨aßigen h–Ecks f¨ ur h = 3, 5, 15 (und damit auch f¨ ur Vielfache, die Potenzen von 2 sind) waren bereits den Griechen wohlbekannt; Beschreibungen finden sich z.B. bei Euklid (Elemente IV, §§ 2, 11, 16). Gauss f¨ uhrte a.a.O. seinen Konstruierbarkeitsbeweis rein algebraisch. In Art. 354 gab er exemplarisch s¨amtliche (quadratischen) Gleichungen an, die f¨ ur das regelm¨aßige 17–Eck nacheinander in geometrische Konstruktionen zu u ¨bersetzen blieben. Dieselbe Arbeit leisteten f¨ ur das regul¨are 257–Eck F.J. Richelot (J. Reine Angew. Math. 9, 1–26 (1832)) bzw. J. Hermes f¨ ur das regul¨ are 65537–Eck. Das in zehn Jahren entstandene, aber nie publizierte Werk von Hermes ist schwerer zug¨anglich und mit einem Hauch des Ungew¨ohnlichen behaftet: Das etwa 10000 handgeschriebene Seiten umfassende Manuskript wurde als Dissertation 1894 der Universit¨at K¨onigsberg in einem Koffer u ¨bergeben, der beide Weltkriege u ¨berstand und heute an der Universit¨ at G¨ ottingen verwahrt wird.
§ 2.
Simultane lineare Kongruenzen
1. Reduktion des Problems. Sind f¨ ur κ = 1, . . . , k die Zahlen a∗κ , c∗κ und m∗κ > 0 ganz, so wird nun in Verallgemeinerung von 1.5(1) ein System von k ∗)
(“Wenn die Zahl a in der Differenz der Zahlen b, c aufgeht, heißen b und c nach a kongruent, andernfalls inkongruent; a selbst nennen wir den Modul.” — “Die Kongruenz von Zahlen notieren wir im folgenden mit dem Symbol ≡; wenn n¨ otig, f¨ ugen wir den Modul in Klammern an.” — “Dieses Zeichen haben wir ¨ wegen der großen Ahnlichkeit gew¨ ahlt, die zwischen Gleichung und Kongruenz besteht.”)
§ 2.
Simultane lineare Kongruenzen
89
linearen Kongruenzen in einer Unbestimmten X betrachtet: (1)
a∗1 X ≡ c∗1 (mod m∗1 ), . . . , a∗k X ≡ c∗k (mod m∗k ).
Man interessiert sich daf¨ ur, ob es ganze x gibt, die gleichzeitig alle k linearen Kongruenzen in (1) l¨osen; daher spricht man bei (1) von einem System simultaner linearer Kongruenzen. Nach Satz 1.5 ist das System (1) sicher dann unl¨ osbar, wenn (a∗κ , m∗κ ) |c∗κ f¨ ur mindestens eines der κ gilt. Im weiteren sei daher (a∗κ , m∗κ )|c∗κ f¨ ur κ = 1, . . . , k vorausgesetzt. ur Schreibt man dann d∗κ := (a∗κ , m∗κ ), aκ := a∗κ /d∗κ , cκ := c∗κ /d∗κ , mκ := m∗κ /d∗κ f¨ κ = 1, . . . , k, so ist das System (1) nach der K¨ urzungsregel 1.3 a¨quivalent mit dem neuen System (2)
a1 X ≡ c1 (mod m1 ), . . . , ak X ≡ ck (mod mk ).
Dies bedeutet: Ein ganzes x l¨ ost (1) genau dann, wenn es (2) l¨ost. Im System (2) gilt (aκ , mκ ) = 1 f¨ ur κ = 1, . . . , k. Ist nun aκ ∈ Z im Sinne der Bemerkung zu 1.5 die Inverse von aκ modulo mκ , so geht die κ–te Kongruenz in (2) durch Multiplikation mit aκ u ¨ber in die aquivalente Kongruenz X ≡ aκ cκ (mod mκ ) und dies alles f¨ ¨ ur κ = 1, . . . , k. Demnach ist das System (2) gleichwertig mit folgendem neuen System (3)
X ≡ c1 (mod m1 ), . . . , X ≡ ck (mod mk )
wobei cκ := aκ cκ f¨ ur κ = 1, . . . , k gesetzt wurde. ¨ Die Aquivalenz der Systeme (2) und (3) gilt bei beliebigen m1 , . . . , mk ∈ N, nur daß in (2) f¨ ur κ = 1, . . . , k die Bedingung (aκ , mκ ) = 1 verlangt ist. In 2 werden beide Systeme vollst¨andig behandelt unter der f¨ ur viele Anwendungen ausreichenden Zusatzvoraussetzung, daß die Moduln m1 , . . . , mk paarweise teilerfremd sind.
2. Paarweise teilerfremde Moduln. Hauptziel ist hier ein Ergebnis, f¨ ur das sich in der Literatur eingeb¨ urgert hat die Bezeichnung Chinesischer Restsatz. Die nat¨ urlichen Zahlen m1 , . . . , mk seien paarweise teilerfremd und m sei ihr kgV. Sind f¨ ur κ = 1, . . . , k die cκ ganz, so hat das System 1(3) modulo m genau eine L¨ osung. Beweis. Es werde nκ := m/mκ gesetzt; nach Satz 1.2.12B ist nκ das Produkt der m1 , . . . , mκ−1 , mκ+1 , . . . , mk . H¨ atte nκ mit mκ einen Primfaktor p gemeinsam, so m¨ ußte p in einem mλ mit λ = κ aufgehen, entgegen der paarweisen
90
2. Kongruenzen
Teilerfremdheit der m1 , . . . , mk . Somit ist (mκ , nκ ) = 1 f¨ ur κ = 1, . . . , k; im Sinne der Bemerkung zu 1.5 sei nκ die Inverse von nκ modulo mκ , womit die ganze Zahl (1)
x :=
k
cκ nκ nκ
κ=1
gebildet werde. F¨ ur jedes feste λ ist damit x ≡ cλ +
k
cκ nκ nκ ≡ cλ (mod mλ )
κ=1 κ=λ
weil mλ |nκ f¨ ur jedes von λ verschiedene κ. Die Zahl x l¨ ost also das System 1(3). Sei y irgendeine ganze, 1(3) gen¨ ugende Zahl. Dann gilt mκ |(x − y) f¨ ur κ = 1, . . . , k, somit auch m|(x − y) nach dem Charakterisierungs–Satz 1.2.11 f¨ ur das kgV, was y ≡ x (mod m) bedeutet. Korollar. Sind die mκ und m wie im chinesichen Restsatz, sind die aκ , cκ ganz und gilt (aκ , mκ ) = 1 f¨ ur κ = 1, . . . , k, so hat das System 1(2) modulo m genau eine L¨ osung. Beweis. Unter den gemachten Voraussetzungen ist 1(2), wie in 1 gesehen, a¨quivalent zu 1(3), angewandt mit cκ := aκ cκ , wobei aκ die Inverse von aκ modulo mκ bedeutet. Auf dieses System 1(3) wendet man den chinesischen Restsatz an. Bemerkung. Unter den Voraussetzungen des chinesischen Restsatzes bedeutet nach Satz 1.2.12B kgV der mκ bzw. Produkt der mκ dasselbe.
3. Anwendungen, numerische Beispiele. Vom chinesischen Restsatz spricht man, da Fragestellungen, die auf Probleme des Typs 1(3) hinauslaufen, schriftlich u ¨berliefert scheinbar erstmals im Suan–ching ∗) des Chinesen Sun–Tsu auftauchten. Er stellt dort u.a. folgende Aufgabe: “Wir haben eine gewisse Anzahl von Dingen, wissen aber nicht genau wieviele. Wenn wir sie zu je drei z¨ ahlen, bleiben zwei u ¨brig. Wenn wir sie zu je f¨ unf z¨ ahlen, bleiben drei u ¨brig. Wenn wir sie zu je sieben z¨ahlen, bleiben zwei u ¨brig. Wieviele Dinge sind es?” Offenbar l¨ auft dies auf das simultane Kongruenzensystem X ≡ 2 (mod 3), ∗)
X ≡ 3 (mod 5),
(Handbuch der Arithmetik)
X ≡ 2 (mod 7)
§ 2.
Simultane lineare Kongruenzen
91
vom Typ 1(3) mit paarweise teilerfremden Moduln hinaus, deren kgV hier 105 ist. Die n1 , n2 , n3 bzw. ihre modulo m1 , m2 , m3 Inversen n1 , n2 , n3 aus dem Beweis des chinesischen Restsatzes sind hier 35, 21, 15 bzw. -1, 1, 1 (die letzteren nat¨ urlich nur modulo 3, 5, 7 eindeutig). Nach 2(1) ist 2 · 35 · (−1)+ 3·21·1+2·15·1 = 23 die modulo 105 eindeutige L¨ osung von Sun–Tsus Aufgabe. Als zweite Anwendung simultaner linearer Kongruenzen soll die (gew¨ ohnliche) lineare Kongruenz 1.5(1) unter der Bedingung (a, m) = 1 nochmals besprochen werden. Nach Satz 1.5 weiß man zwar, daß 1.5(1) modulo m eindeutig l¨ osbar ist. Jedoch ist f¨ ur das tats¨achliche Auffinden der L¨ osung durch die in 1.6 erl¨ auterte Bruchschreibweise nicht unbedingt viel gewonnen, vor allem dann nicht, wenn der Modul m und eventuell auch noch a und c “groß” sind. Hat m die kanonische Primfaktorzerlegung pb11 · . . . · pbkk , so ist 1.5(1) nach Satz 1.1(v) ¨aquivalent zum System aX ≡ c (mod pb11 ), . . . , aX ≡ c (mod pbkk )
(1)
wobei (a, pbκκ ) = 1 f¨ ur κ = 1, . . . , k gilt. Dieses System vom Typ 1(2) ist nach dem Korollar zum chinesischen Restsatz modulo m eindeutig l¨ osbar. Ist nun ein “großer” Modul m aus “vielen kleineren” Primzahlpotenzen pbκκ zusammengesetzt, so kann es ratsam sein, die modulo m eindeutige L¨osung von 1.5(1) durch L¨ osen von (1) zu ermitteln. Als Beispiel sei etwa die absolut kleinste Zahl gesucht, die die Kongruenz 883X ≡ −103 (mod 2275) l¨ ost. Wegen 2275 = 52 · 7 · 13 lautet (1) hier 883X ≡ −103 (mod 25), 883X ≡ −103 (mod 7), 883X ≡ −103 (mod 13) oder a¨quivalent 8X ≡ −3 (mod 25), X ≡ 2 (mod 7), −X ≡ 1 (mod 13). Dies ist nochmals gleichwertig mit X ≡ 9 (mod 25), X ≡ 2 (mod 7), X ≡ −1 (mod 13), einem System vom Typ 1(3) mit paarweise teilerfremden Moduln. Die nκ und nκ im Beweis des chinesischen Restsatzes ergeben sich hier zu 91, 325, 175 bzw. 11, -2, 11 und daher l¨ ost 9 · 91 · 11+ 2 · 325 · (−2)+ (−1) · 175 · 11 = 5784 das letzte Kongruenzensystem. Da die L¨osung modulo 2275 eindeutig ist (883 ist Primzahl), ist -1041 die gesuchte Zahl.
92
2. Kongruenzen
Ein a¨hnliches Beispiel mit demselben Modul ist 3X ≡ 11 (mod 2275). Hier k¨onnte man nat¨ urlich analog wie soeben verfahren; nur f¨ uhrt in diesem Fall trotz des “großen” Moduls die Bruchschreibweise aus 1.6 ungleich schneller zum 11+2275 = 762. Ziel: Die L¨osung modulo 2275 ist 11 3 ≡ 3 Es kommt also keinesfalls nur auf den Modul m an, sondern auch auf a und c, wie man die L¨osung von 1.5(1) am besten anpackt.
4. Restklassenring als direkte Summe. Sind G1 , . . . , Gk (multiplikativ geschriebene) Gruppen mit den Einselementen e1 , . . . , ek , so f¨ uhrt man im kartesiupfung schen Produkt G := G1 ×. . .×Gk eine (multiplikativ geschriebene) Verkn¨ · dadurch ein, daß man zwei Elementen (g1 , . . . , gk ), (g1 , . . . , gk ) von G das Element (g1 g1 , . . . , gk gk ) von G zuordnet. Offenbar ist (G, ·) eine Gruppe, das direkte Produkt von G1 , . . . , Gk . Das Einselement der neuen Gruppe ist (e1 , . . . , ek ); sie ist jedenfalls dann abelsch, wenn alle Gκ abelsch sind. Sind nun R1 , . . . , Rk Ringe, so betrachte man diese momentan als additive Gruppen und konstruiere daraus, wie soeben beschrieben, deren direkte Summe, welche R genannt werde; R ist bez¨ uglich der eingef¨ uhrten (komponentenweisen) Addition eine abelsche Gruppe. In R definiert man weiter eine (komponentenweise) Multiplikation, indem man zwei Elementen (r1 , . . . , rk ), (r1 , . . . , rk ) von R das Element (r1 r1 , . . . , rk rk ) von R zuordnet. Bez¨ uglich der erkl¨ arten Addition und Multiplikation erweist sich R als Ring; dieser wird als die direkte Summe der Ringe R1 , . . . , Rk bezeichnet, symbolisch R = R1 ⊕ . . . ⊕ Rk . Mit dem chinesischen Restsatz wird nun u ¨ber die Struktur von Zm bewiesen der Satz. Sei m ≥ 2 ganz und seien die m1 , . . . , mk ∈ N paarweise teilerfremd mit m1 · . . .· mk = m. Dann ist der Restklassenring modulo m isomorph zur direkten Summe der Restklassenringe modulo mκ (κ = 1, . . . , k). Beweis. Es werde R := Zm1 ⊕ . . . ⊕ Zmk gesetzt. Definiert man die Abbildungen ψκ : Z → Zmκ f¨ ur κ = 1, . . . , k analog zum Beginn von 1.7, so f¨ uhrt man nun Ψ : Z → R ein durch Ψ(a) := (ψ1 (a), . . . , ψk (a)). Die Surjektivit¨ at von Ψ ergibt sich aus dem chinesischen Restsatz: Denn sind a1 , . . . , ak ∈ Z beliebig vorgegeben, so ist das Kongruenzensystem X ≡ a1 (mod m1 ), . . . , X ≡ ak (mod mk ) vom Typ 1(3) l¨ osbar. Nach 1.7(1) erweist sich weiter Ψ als Ringhomomorphismus, dessen Kern noch zu bestimmen bleibt. Ersichtlich ist a ∈ Kern Ψ gleichbedeutend mit a ≡ 0 (mod mκ ) f¨ ur κ = 1, . . . , k und dieses mit a ∈ mZ. Der Kern von
§ 2.
Simultane lineare Kongruenzen
93
Ψ ist also das Ideal mZ in Z und nach einem aus der Algebra wohlbekannten Homomorphiesatz f¨ ur Ringe sind R und Z/mZ = Zm isomorph.
5. Prime Restklassengruppe als direktes Produkt. Hauptziel ist hier folgender Satz, der es gestattet, die Struktur der primen Restklassengruppe modulo m vollst¨ andig aufzudecken. Satz. Sind m, m1 , . . . , mk wie in Satz 4, so ist die prime Restklassengruppe modulo m isomorph zum direkten Produkt der primen Restklassengruppen modulo mκ (κ = 1, . . . , k). Dem Beweis wird vorausgeschickt das Lemma. Ist R die direkte Summe der kommutativen Ringe Rκ mit Einselement 1κ f¨ ur κ = 1, . . . , k, so ist die Einheitengruppe von R das direkte Produkt der Einheitengruppen aller Rκ . Beweis. Ein (r1 , . . . , rk ) ∈ R geh¨ort dann zur Einheitengruppe E(R) von R, wenn es ein (s1 , . . . , sk ) ∈ R gibt mit rκ sκ = 1κ f¨ ur κ = 1, . . . , k; dies ist mit rκ ∈ E(Rκ ) f¨ ur κ = 1, . . . , k ¨aquivalent und beweist E(R) = E(R1 ) × . . . × E(Rk ). Beweis des Satzes. Sei R := Zm1 ⊕. . .⊕Zmk und χ : R → Zm ein Isomorphismus gem¨aß Satz 4. Nun wird χ(r) ∈ Z∗m f¨ ur jedes r ∈ E(R) u ¨berlegt: Zu r := (r1 , . . . , rk ) ∈ E(R) gibt es ein s := (s1 , . . . , sk ) ∈ R mit rκ sκ = 1κ , weshalb χ(rs) = χ(11 , . . . , 1k ) = 1 ist, letzteres wegen der Isomorphieeigenschaft von χ (1 ist die Restklasse modulo m, in der 1 liegt; vgl. Bemerkung 4 zu 1.8). ankte Abbildung χ|E(R) von E(R) Damit ist χ(r) ∈ Z∗m klar und die eingeschr¨ auf Z∗m beh¨ alt die Isomorphieeigenschaft. Nach dem Lemma in Verbindung mit Bemerkung 3 zu 1.8 ist E(R) = Z∗m1 × . . . × Z∗mk . Wendet man den letzten Satz mit k = 2 an, so erh¨ alt man die bereits in Satz 1.4.11(i) festgestellte Multiplikativit¨ at der Eulerschen Funktion ϕ erneut: Korollar. Sind m1 , m2 ∈ N zueinander teilerfremd, so gilt ϕ(m1 m2 ) = ϕ(m1 )ϕ(m2 ). κ Bemerkung. Ist kκ=1 pα κ die kanonische Zerlegung eines ganzen m ≥ 2, so gilt nach dem hier gezeigten Satz Z∗m Z∗pα1 × . . . × Z∗pαk . 1
k
94
2. Kongruenzen
Die Struktur von Z∗m ist also vollst¨ andig bekannt, wenn die Struktur der Z∗pα bekannt ist; dies letztere Problem wird in 5.5 und 5.6 abschließend behandelt.
6. Historische Bemerkungen. Der zu Anfang von 3 erw¨ ahnte Sun–Tsu muß zwischen 200 und 470 gelebt haben. In seinem Handbuch gibt er u ¨brigens auch allgemeine Regeln zur Behandlung simultaner Kongruenzen (so die nach– Gausssche Terminologie) an. Der chinesische M¨onch und Astronom I–Hsing (682–727) dehnte diese Regeln weiter auf den Fall aus, wo die Moduln m1 , . . . , mk des Systems 1(3) nicht mehr notwendig paarweise teilerfremd sind. Die chinesische L¨osungsmethode — von K. Mahler (Math. Nachr. 18, 120–122 (1958)) in moderner Schreibweise erl¨autert — ist g¨ anzlich von derjenigen verschieden, die hier zum Beweis des Restsatzes verwendet wurde. Obiger Beweis des chinesischen Restsatzes, dessen Name inzwischen verst¨andlich geworden ist, geht auf Gauss (Disquisitiones Arithmeticae, Artt. 32–36) zur¨ uck; ohne Ben¨ utzung der Kongruenzenschreibweise hatte Euler simultane Probleme des Typs 1(3) schon fr¨ uher auf demselben Wege gel¨ost. Ganz interessant ist vielleicht noch, daß auch in Indien sp¨ atestens im 6. Jahrhundert vor allem Astronomen, besonders die schon in 1.3.4 erw¨ ahnten Aryabhata und Brahmagupta, simultane lineare Kongruenzen zu behandeln hatten. Die indische Methode daf¨ ur beruhte wesentlich auf dem euklidischen Algorithmus. Daß in China, Indien und im Mittelalter dann im byzantinischen Raum vor allem Astronomen simultane Kongruenzen zu l¨osen hatten, hat folgenden Grund: Zahlreiche Kalenderprobleme und Fragestellungen im Zusammenhang mit den Umlaufbahnen von Planeten und anderen Himmelsk¨ orpern f¨ uhren mathematisch (manchmal allerdings nur ann¨ ahernd) auf Systeme des Typs 1(3).
§ 3.
Die S¨ atze von Fermat, Euler und Wilson
1. Dirichlets Schubfachprinzip. Zun¨ achst wird eine ganz einfache Tatsache explizit erw¨ahnt, die in der Mathematik, insbesondere in der Zahlentheorie (auch in diesem Buch mehrfach), mit großem Erfolg angewandt werden kann. Satz. Sind M , N nicht leere Mengen, ist u ¨berdies N endlich und f : M → N eine Abbildung, so gilt: Ist #N < #M , so ist f nicht injektiv. Beweis. Zun¨ achst ist f (M ) in N enthalten und somit endlich. Ist f injektiv, so gibt es zu jedem n ∈ N h¨ ochstens ein m ∈ M mit f (m) = n. Also ist #N ≥ #M .
§ 3.
Die S¨ atze von Fermat, Euler und Wilson
95
Der hier festgestellte Sachverhalt wird u ¨blicherweise a¨quivalent, jedoch in bildlicher Sprache formuliert als Dirichletsches Schubfachprinzip. Bei einer Verteilung von mehr als n Dingen auf n Schubf¨ acher liegen in mindestens einem Fach mindestens zwei Dinge.
2. Kongruenzverhalten von Potenzen. Im weiteren sei m eine feste nat¨ urliche Zahl. F¨ ur ganzes a werde die Folge (ai )i=0,1,... betrachtet und man interessiert sich daf¨ ur, welche Reste die Glieder a0 , a1 , . . . dieser Folge bei Division durch m lassen. Da es nach 1.1 und 1.4 genau m verschiedene Restklassen modulo m gibt, ist nach Dirichlets Schubfachprinzip klar, daß es unter den m + 1 Zahlen a0 , . . . , am zwei geben muß, die modulo m zueinander kongruent sind. Es bezeichne h den kleinsten Exponenten, zu dem es ein k > h gibt, so daß (1)
ak ≡ ah (mod m)
gilt. Aus den vorigen Betrachtungen ist bereits 0 ≤ h < m klar; selbstverst¨ andlich h¨ angt h von a (und von m) ab. Bestimmt man nun noch k gr¨ oßer als h und minimal, so daß (1) zutrifft, so hat man weiter 0 ≤ h < k ≤ m, wobei auch k von a (und m) abh¨ angt. Wegen Satz 1.1(iii) ist klar, daß sich bei a1 ≡ a2 (mod m) die beiden Folgen (ai1 )i∈N0 bzw. (ai2 )i∈N0 modulo m nicht unterscheiden. Demnach sind die Zahlen h und k Invarianten der ganzen Restklasse modulo m, der das speziell betrachtete a angeh¨ort. Sind h und k wie oben fixiert, so folgt aus Satz 1.1(ii) unmittelbar, daß ai+(k−h) ≡ ai (mod m) genau f¨ ur die i ≥ h gelten muß. Man sagt in diesem Zusammenange k − h hang, die Folge (ai )i∈N0 sei modulo m periodisch mit der Periodenl¨ und der Vorperiodenl¨ ange h; bei h = 0 heißt die Folge modulo m reinperiodisch. Satz. F¨ ur ganze m > 0 und a gilt: (ai )i∈N0 ist modulo m reinperiodisch genau dann, wenn m, a teilerfremd sind. Beweis. Bei h = 0 folgt aus (1) unmittelbar (a, m) = 1. Ist umgekehrt (a, m) = 1 und wird h > 0 angenommen, so folgt aus (1) mit der K¨ urzungsregel 1.3 die Kongruenz ak−1 ≡ ah−1 (mod m), was der Definition von h widerspricht. Genau dann, wenn (a, m) = 1 ist, kann auch ai modulo m eindeutig f¨ ur negative ganze i definiert werden als die L¨ osung der Kongruenz a−i X ≡ 1 (mod m). In
96
2. Kongruenzen
diesem Fall kann sogar die zweifach unendliche Folge . . . , a−2 , a−1 , a0 , a1 , a2 , . . . modulo m betrachtet werden. Wie man leicht nachweist, gilt f¨ ur sie ai+k ≡ i a (mod m) bei beliebigem ganzem i. Wie das unterschiedliche Verhalten der Folge (ai ) modulo m erwarten l¨aßt, je nachdem, ob a und m teilerfremd sind oder nicht, wird man sich im weiteren besonders f¨ ur den Fall (a, m) = 1 interessieren. Hier bekommt die charakteristische Zahl k zun¨ achst einen Namen: Bei teilerfremden a und m heißt die kleinste nat¨ urliche Zahl k, f¨ ur die ak ≡ 1 (mod m) gilt, die Ordnung von a modulo m, in Zeichen ordm a. (In der a¨lteren Literatur nannte man dies k manchmal den Exponenten, zu dem a modulo m geh¨ort.)
3. Der “kleine” Fermatsche Satz. Zun¨ achst wird der Spezialfall betrachtet, wo m Primzahl ist; dazu dient folgendes Lemma. Ist p eine Primzahl, so geht p in den Binomialkoeffizienten j = 1, . . . , p − 1 auf. Beweis. Wegen j!
p j
Satz von Fermat.
= p · . . . · (p − j + 1) geht p in j!
p j
p j
f¨ ur
auf, aber nicht in j!.
Sei p eine Primzahl. Dann gilt ap ≡ a (mod p)
(1)
f¨ ur jedes ganze a; f¨ ur jedes ganze nicht durch p teilbare a gilt ap−1 ≡ 1 (mod p).
(2)
Beweis. Bei p |a folgt (2) mit der K¨ urzungsregel 1.3 aus (1). Nun ist (1) f¨ ur a = 0 richtig. Sei f¨ ur ein a ≥ 0 die Kongruenz (1) schon eingesehen; damit und aufgrund des Lemmas ist p p j a ≡ ap + 1 ≡ a + 1 (mod p). (a + 1) = j j=0 p
Insbesondere ist also (1) auf dem vollst¨andigen Restsystem Sp modulo p bewiesen und somit f¨ ur alle ganzen a.
§ 3.
Die S¨ atze von Fermat, Euler und Wilson
97
Bemerkungen. 1) Bereits um 500 v. Chr. scheinen chinesische Mathematiker gewußt zu haben, daß 2p − 2 f¨ ur jede Primzahl p durch p teilbar ist. In einem Brief vom 18. Oktober 1640 an Frenicle De Bessy teilte Fermat ohne Beweis das obige Resultat mit. Es ist u ¨blich geworden, dieses als “kleinen” Fermatschen Satz zu zitieren, da man den Terminus “Fermatscher Satz” einer anderen Behauptung Fermats vorbehalten m¨ochte, auf die in 4.2.7 eingegangen wird. 2) Der erste publizierte Beweis f¨ ur (1) findet sich in einem nachgelassenen Manuskript von Leibniz. Der oben gef¨ uhrte Beweis variiert den Ansatz von Leibniz, der f¨ ur nat¨ urliche a im wesentlichen so schloß: F¨ ur a Unbestimmte X1 , . . . , Xa liefert der Polynomiallehrsatz p! (3) (X1 + . . . + Xa )p = X1j1 · . . . · Xaja j ! . . . j ! 1 a j +...+j =p 1
a
wobei rechts u ¨ber alle a–Tupel (j1 , . . . , ja ) ganzer, nichtnegativer Zahlen der Summe p zu summieren ist. Setzt man in (3) f¨ ur X1 , . . . , Xa jeweils 1 ein, so ur die a verschiedenen a–Tupel, erscheint links ap . Die Summanden rechts sind 1 f¨ bei denen genau ein jα gleich p ist (und die restlichen daher verschwinden); f¨ ur p! alle anderen a–Tupel ist die ganze Zahl j1 !...j durch p teilbar. Somit erscheint a! rechts eine nat¨ urliche, zu a modulo p kongruente Zahl.
4. Der Eulersche Satz. Ein zweiter, wesentlich anderer Ansatz zum Nachweis von 3(2) geht auf J. Ivory (New Ser. Math. Repository 1, 6–8 (1806)) zur¨ uck, der den Vorteil besitzt, daß man mit ihm eine zu 3(2) analoge Formel bekommen kann, wenn der Modul nicht mehr notwendig Primzahl ist. Diese Verallgemeinerung der Fermatschen Kongruenz hat Euler (Opera Omnia Ser. 1, II, 531–555) entdeckt: Satz von Euler.
F¨ ur nat¨ urliche m und ganze, zu m teilerfremde a gilt aϕ(m) ≡ 1 (mod m).
Dabei bezeichnet ϕ die Eulersche Phi–Funktion aus 1.4.11. Beweis. Man setze s := ϕ(m) und fixiere {g1 , . . . , gs } als primes Restsystem modulo m. Wegen (a, m) = 1 ist auch (agσ , m) = 1 f¨ ur σ = 1, . . . , s nach Korollar 1.2.6; weiter ist agσ ≡ agσ (mod m) f¨ ur σ = σ nach der K¨ urzungsregel 1.3. Damit ist {ag1 , . . . , ags } ebenfalls ein primes Restsystem modulo m und so gibt es zu jedem Element des einen Restsystems genau ein modulo m kongruentes Element im anderen Restsystem. Also muß (ag1 ) · . . . · (ags ) ≡ g1 · . . . · gs (mod m) sein, woraus man wegen (g1 · . . . · gs , m) = 1 Eulers Kongruenz erh¨alt.
98
2. Kongruenzen
Offenbar enth¨ alt der Eulersche Satz den “kleinen” Fermatschen in der Form 3(2). Den ersteren bezeichnet man auch oft als “Satz von Fermat–Euler” oder “Satz von Euler–Fermat”, je nachdem, ob man die Anciennit¨ at der Entdeckung oder die gr¨ oßere Allgemeinheit der Aussage vornean stellen will. Eine erste Folgerung aus dem f¨ ur die Zahlentheorie u ¨beraus wichtigen Fermat– Eulerschen Satz ist das Korollar. Seien m > 0 und a ganz und zueinander teilerfremd. Ist a ≡ 1 (mod m) f¨ ur nat¨ urliches , so ist ein Vielfaches von ordm a; insbesondere wird ϕ(m) von ordm a geteilt. Beweis. Ist n¨amlich k := ordm a, so dividiere man mit Rest durch k, etwa = qk + r, 0 ≤ r < k. Dann ist nach Definition von ordm a am Ende von 2 1 ≡ a = (ak )q ar ≡ ar
(mod m)
woraus r = 0 wegen der Minimaleigenschaft von k folgt. Der Fermat-Eulersche Satz erledigt den Sonderfall = ϕ(m). Bemerkung. Aus den Betrachtungen in 2 hatte sich 0 < ordm a ≤ m bei (a, m) = 1 ergeben; das Korollar verbessert dies auf 0 < ordm a ≤ ϕ(m). Es gibt unendlich viele m, f¨ ur die bei geeignetem a mit (a, m) = 1 tats¨achlich ordm a = ϕ(m) gilt; genau mit dieser Problematik wird sich § 5 befassen.
5. Numerische Anwendungen. Bei der ersten Aufgabe zeigt sich, wie stark der Fermat–Eulersche Satz in gewissen Situationen das praktische Rechnen vereinfachen kann. Man interessiert sich f¨ ur die drei letzten Ziffern der Dezi9 maldarstellung von 99 : Zun¨ achst ist 9400 = 9ϕ(1000) ≡ 1 (mod 1000) und 99 = (80 + 1)4 · 9 ≡ (4 · 80 + 1) · 9 ≡ −79 · 9 ≡ 89 (mod 400). Daher ist modulo 1000 9 89 99 ≡ 989 = (10 − 1)89 ≡ − · 100 + 89 · 10 − 1 ≡ 400 − 110 − 1 = 289 2 9
und somit endet die Dezimaldarstellung von 99 mit den Ziffern 2, 8, 9. Bei der zweiten Aufgabe geht es um die lineare Kongruenz 1.5(1)
aX ≡ c (mod m).
§ 3.
Die S¨ atze von Fermat, Euler und Wilson
99
Im Fall (a, m) = 1 eine nat¨ urliche Zahl k mit ak ≡ 1 (mod m) zu kennen, ist von (im allgemeinen theoretischer) Bedeutung f¨ ur die L¨ osung von 1.5(1). Denn dann braucht man 1.5(1) nur mit ak−1 zu multiplizieren und findet ak−1 c als die L¨osung modulo m. Eulers Satz garantiert somit aϕ(m)−1 c als die L¨osung von 1.5(1). Nimmt man sich daraufhin etwa die in 2.3 behandelte Kongruenz 883X ≡ −103 (mod 2275) nochmals vor, so stellt man fest, daß ϕ(2275) = ϕ(25)ϕ(7)ϕ(13) = 20 · 6 · 12 = 1440 beachtlich groß ist und nicht viel gewonnen scheint, wenn man −8831439 · 103 als die L¨ osung modulo 2275 notiert. Da sich aufgrund des nachfolgenden Lemmas jedoch ord2275 883 = 20 ergibt, kann die L¨ osung der vorgelegten Kongruenz modulo 2275 auch in der Form −88319 · 103 aufgeschrieben werden. j Nun k¨ onnen die 8832 , j = 0, . . . , 4, rasch durch sukzessives Quadrieren zu 883, −636, −454, −909, 456 ermittelt werden, was wegen der Darstellung 20 + 21 +24 des Exponenten 19 die L¨ osung modulo 2275 als −103· 883· (−636) · 456 ≡ −1041 liefert, wie schon in 2.3 gesehen. Lemma. Seien m1 , . . . , mr ∈ N paarweise teilerfremd und m := m1 · . . . · mr . Dann gilt f¨ ur jedes ganze, zu m teilerfremde a ordm a = kgV(ordm1 a, . . . , ordmr a). Beweis. Setzt man k := ordm a und kρ := ordmρ a f¨ ur ρ = 1, . . . , r, so gilt: ak ≡ 1 (mod m) ⇒ ak ≡ 1 (mod mρ ) f¨ ur alle ρ, also kρ |k f¨ ur alle ρ nach Korollar 4, also K|k mit K := kgV(k1 , . . . , kr ). Andererseits ist akρ ≡ 1 (mod mρ ) f¨ ur alle ρ, also aK ≡ 1 (mod mρ ) f¨ ur dieselben ρ, was nach Satz 1.1(v) zu uhrt. Korollar 4 liefert k|K und damit die Behauptung. aK ≡ 1 (mod m) f¨ Wegen ord25 883 = 20, ord7 883 = 1, ord13 883 = 2 ist also ord2275 883 = 20, wie oben vorweggenommen wurde. Bemerkung. Das hier gezeigte Lemma kommt z.B. auch in 5.1.7 zur Anwendung.
6. Zusammengesetzt oder Primzahl? In diesem Abschnitt soll kurz darauf eingegangen werden, wie man mit Hilfe des “kleinen” Fermatschen Satzes entscheiden kann, ob eine vorgelegte ganze Zahl m > 1 zusammengesetzt oder Primzahl ist. Zun¨ achst erh¨ alt man aus dem Fermatschen Satz durch Kontraposition die
100
2. Kongruenzen
Proposition A. Zu nat¨ urlichem m gebe es ein ganzes a mit am ≡ a (mod m). Dann ist m zusammengesetzt. Tats¨achlich ist am modulo m sehr schnell berechenbar: Wie in 5 bildet man j dazu f¨ ur j = 0, 1, . . . die Potenzen a2 modulo m durch wiederholtes Quadrieren; die dabei anfallenden Reste multipliziert man modulo m, wie es die dyadische Entwicklung von m (vgl. 5.1.1) verlangt. Auf diese Weise hat G.A. Paxson (Math. Comp. 15, 420 (1961)) gezeigt, daß die Fermat–Zahl F13 wegen 3F13 ≡ 3 (mod F13 ) zusammengesetzt ist (vgl. 3.2.11). Die Umkehrung von Proposition A gilt jedoch nicht, so daß man auf diesem Wege noch kein Primzahlkriterium erh¨ alt; man hat n¨ amlich die (hier nicht zu beweisende) Proposition B. Es gibt zusammengesetzte ganze m > 1 mit am ≡ a (mod m) f¨ ur alle ganzen a. Beispiele f¨ ur solche m sind 561 = 3 · 11 · 17 und 1729 = 7 · 13 · 19. Derartige m heißen Carmichael–Zahlen; die Vermutung, daß es davon unendlich viele gibt, wurde von W. R. Alford, A. Granville und C. Pomerance (Ann. Math. (2) 139, 703–722 (1994)) bewiesen. Das “richtige” Gegenst¨ uck zum “kleinen” Fermatschen Satz hat E. Lucas (Th´eorie des Nombres, 1891) gefunden: Proposition C. Sei m ≥ 2 ganz und es gebe ein ganzes, zu m teilerfremdes a mit ordm a = m − 1. Dann ist m Primzahl. Beweis. Nach Korollar 4 ist (m − 1)|ϕ(m), was zu m − 1 ≤ ϕ(m) f¨ uhrt. Wegen m ≥ 2 ist andererseits ϕ(m) ≤ m − 1, also ϕ(m) = m − 1, weshalb m Primzahl sein muß. Bemerkung. Die Aussage von Proposition C ist f¨ ur die Praxis allerdings nicht sehr geeignet, denn bei großem m ist dieser Primzahltest vom algorithmischen Standpunkt aus viel zu langsam. In letzter Zeit sind eine ganze Reihe (auch algorithmisch schneller) Primzahltests entwickelt worden, wobei die Mehrzahl ganz wesentlich vom Fermat–Eulerschen Satz abh¨ angt. Hier ist vor allem die Methode von L.M. Adleman, C. Pomerance und R. Rumely (Ann. Math. (2) 117, 173–206 (1983)) zu nennen, die von H. Cohen und H.W. Lenstra Jr. (Math. Comp. 42, 297–330 (1984)) weiter verbessert wurde. Computerprogramme, die auf dieser Methode basieren, testen Zahlen mit 100 Dezimalstellen
§ 3.
Die S¨ atze von Fermat, Euler und Wilson
101
¨ in Sekundenschnelle auf Zusammengesetztheit. Einen sehr guten Uberblick u ¨ber die wichtigsten Primzahltests bis zum neuesten Stand erh¨alt der interessierte Leser z.B. durch J.D. Dixon (Amer. Math. Monthly 91, 333–352 (1984)), aber auch in den Monographien von E. Kranakis (Primality and Cryptography, Teubner, Stuttgart, and Wiley, Chichester etc., 1986), D.M. Bressoud (Factorization and Primality Testing, Springer, New York etc., 1989) oder R. Crandall und C. Pomerance (Prime Numbers. A Computational Perspective, Springer, New York etc., 2001 (2nd Ed. 2005)).
7. Fermat–Euler und geheime Nachrichten¨ ubermittlung. Wie zuletzt erw¨ahnt, hat man neuerdings u ¨beraus schnelle Methoden zur Entscheidung, ob eine vorgelegte nat¨ urliche Zahl m mit “vielen” Dezimalstellen Primzahl ist oder nicht. Erweist sich m als zusammengesetzt, so stellt sich das n¨achste Problem, seine kanonische Primfaktorzerlegung zu ermitteln. Die besten heute bekannten Algorithmen zur Herstellung dieser Zerlegung sind “sehr viel langsamer” als die oben genannten besten Primzahltests. Ist m etwa Produkt zweier verschiedener Primzahlen mit je 100 Dezimalstellen, so muß man f¨ ur die effektive Faktorzerlegung eine Rechenzeit in der Gr¨oßenordnung von 109 Jahren einplanen, selbst wenn man den derzeit (1987) besten Algorithmus und die schnellsten Computer verwendet. Diesen krassen Gegensatz zwischen schnellen Primzahltests und langsamer Faktorisierung nutzten R. Rivest, A. Shamir und L.M. Adleman, (Comm. ACM 21, 120–128 (1978)), um eine einfache und elegante Methode der geheimen Nachrichten¨ ubermittlung zu entwickeln, die im folgenden kurz beschrieben werden soll. Bemerkenswert ist, daß bei dieser Methode ¨ jeder Teilnehmer am genannten Ubermittlungssystem seinen Chiffrierschl¨ ussel (fast vollst¨ andig) o¨ffentlich zug¨anglich macht. Zun¨ achst w¨ahlt sich jeder Teilnehmer des Systems zwei verschiedene Primzahlen p, q mit 100 Dezimalstellen; es stehen mehr als 1097 solcher Primzahlen zur Verf¨ ugung. Die schnellen Primzahltests gestatten jedem Teilnehmer eine rasche Abwicklung seiner individuellen Suche. Sodann bildet er m := pq und w¨ ahlt des weiteren eine (nicht zu kleine) nat¨ urliche Zahl e unterhalb m, die zu ϕ(m) = (p − 1)(q − 1) teilerfremd ist. Wegen (e, ϕ(m)) = 1 kann er ganze x, y mit ex + ϕ(m)y = 1 nach Korollar 1.3.4 mit Hilfe des euklidischen Algorithmus bestimmen, von denen er nach Satz 1.3.3 außerdem x, −y ∈ N verlangen kann. W¨ ahrend er seine Zahlen p, q, ϕ(m), x, y geheim h¨alt, l¨ aßt der Teilnehmer im offentlichen Verzeichnis des Nachrichten¨ ¨ ubermittlungssystems (man denke etwa an ein Telefonbuch) seine charakteristischen Zahlen m und e abdrucken. Will nun ein Teilnehmer des Systems einem anderen eine Nachricht geheim u ¨bermitteln, so schl¨agt er die Zahlen m, e des Empf¨ angers im Verzeichnis nach. Sodann u ¨bersetzt der Absender seine in Buchstaben geschriebene Nachricht in
102
2. Kongruenzen
Zahlen gem¨aß A = 01, B = 02, . . . , Z = 26. Die so entstehende Ziffernfolge wird in Bl¨ ocke β1 , . . . , βn geeigneter, aber gleicher L¨ange zerlegt, wobei am Ende gegebenenfalls irgendwie aufgef¨ ullt wird. Nun wird γj gem¨aß βje ≡ γj (mod m) f¨ ur j = 1, . . . , n gebildet und der Absender schickt die Folge der Bl¨ ocke γ1 , . . . , γn u ¨ber das System an den Empf¨anger. Dieser entschl¨ usselt die ankommende Blockfolge γ1 , . . . , γn leicht, indem er mittels des nur ihm bekannten x (1)
1−ϕ(m)y
γjx ≡ βjex = βj
(q−1)|y| = βj βjp−1 (mod m)
f¨ ur j = 1, . . . , n bildet. Wird βj von p geteilt, so auch γj und es gilt γjx ≡ βj (mod p). Bei p |βj gilt βjp−1 ≡ 1(mod p) nach dem Fermatschen Satz; (1) f¨ uhrt dann auch in diesem Fall zu γjx ≡ βj (mod p). Ersetzung von p durch q ur j = 1, . . . , n und nach dieser Ermittlung ergibt schließlich γjx ≡ βj (mod m) f¨ der dechiffrierten Bl¨ocke β1 , . . . , βn kann der Empf¨ anger die Buchstabenfolge lesen. Ein von Absender und Empf¨ anger verschiedener Teilnehmer des Systems, den die u ¨bermittelte Nachricht unbefugt interessiert, kennt zwar m, e und die Blockfolge γ1 , . . . , γn ; zur Entschl¨ usselung ben¨otigt er aber ersichtlich x, an das er nur u ¨ber eine der drei Zahlen p, q, ϕ(m) herankommen kann. Die Berechnung einer dieser drei Zahlen l¨auft jedoch auf die Faktorisierung von m hinaus, welches 199 oder 200 Dezimalstellen hat und somit nach den Eingangsbemerkungen beim derzeitigen Stand der Dinge nicht in vern¨ unftiger Zeit in seine beiden Primfaktoren zu zerlegen ist. Bemerkung. Dem Leser, der in die hier angeschnittene Problematik weiter eindringen will, kann zum Selbststudium das bereits auf Seite 101 zitierte Buch von Kranakis ebenso empfohlen werden wie diejenigen von D.E.R. Denning (Cryptography and Data Security, Addison–Wesley, Reading/Mass. etc., 1982) und von N. Koblitz (A Course in Number Theory and Cryptography, Springer, New York etc., 1987). 8. Satz von Wilson. Eine ganze Zahl m > 1 ist Primzahl genau dann, wenn die Kongruenz (m − 1)! ≡ −1 (mod m) besteht. Beweis. Ist m zusammengesetzt, so geht die kleinste, m teilende Primzahl in (m − 1)! und in m auf und so kann die fragliche Kongruenz nicht gelten. Sei nun p := m eine Primzahl; weil die behauptete Kongruenz f¨ ur p = 2 erf¨ ullt ist, darf p k¨ unftig als ungerade vorausgesetzt werden. Da die Kongruenz a2 ≡ 1 (mod p) f¨ ur ganzes a genau dann gilt, wenn entweder a ≡ 1 (mod p) oder
§ 3.
103
Die S¨ atze von Fermat, Euler und Wilson
a ≡ −1 (mod p) zutrifft, kann man bei p ≥ 5 die Menge der Zahlen 2, 3, . . . , p−2 in 12 (p − 3) Paare zueinander modulo p reziproker Partner zerlegen, so daß 2 · 3 · . . . · (p − 2) ≡ 1 (mod p)
(1)
gilt. Nach der Konvention u ¨ber leere Produkte hat man (1) auch f¨ ur p = 3 und Multiplikation von (1) mit p − 1 liefert die behauptete Kongruenz. Bemerkung. Manuskripte von Leibniz zeigen, daß dieser den Wilsonschen Satz bereits vor 1683 gekannt haben muß. Publiziert wurde das Resultat offenbar zuerst von E. Waring (Meditationes Algebraicae, Cambridge, 1770), der es seinem Sch¨ uler J. Wilson zuschrieb. Erst J.L. Lagrange (Oeuvres III, 423–438) scheint dann 1771 wirklich einen Beweis f¨ ur den Wilsonschen Satz gefunden zu haben. Der angegebene Beweis geht auf Gauss (Disquisitiones Arithmeticae, Art. 77) zur¨ uck. 9. Anwendung auf eine quadratische Kongruenz. Der Satz von Wilson liefert ersichtlich eine notwendige und hinreichende Bedingung daf¨ ur, daß eine ganze Zahl m > 1 Primzahl ist. Er ist vor allem f¨ ur theoretische Untersuchungen von Bedeutung; eine erste Anwendung ist folgender Satz.
Sei p eine Primzahl. Die quadratische Kongruenz X 2 ≡ −1 (mod p)
(1)
ist l¨ osbar genau dann, wenn p ≡ 3 (mod 4) ist. Insbesondere hat (1) bei p = 2 die eindeutige L¨osung 1 modulo 2; bei p ≡ 1 (mod 4) hat (1) genau die modulo p−1 p verschiedenen L¨osungen ( p−1 2 )! und −( 2 )!. Beweis. Bei p = 2 wird (1) offenbar durch jede ungerade, aber keine gerade Zahl gel¨ ost. Ist p ≡ 1 (mod 4), so wird p − 1 !2 ≡ −1 (mod p) 2
(2)
behauptet, was dann die L¨ osbarkeit von (1) zeigt. Modulo p ist n¨ amlich nach Wilsons Satz −1 ≡ (p − 1)! =
p − 1 2
(p−1)/2
!
(p − j) ≡ (−1)(p−1)/2
j=1
wenn man zuletzt p ≡ 1 (mod 4) ber¨ ucksichtigt.
p − 1 2
!2 =
p − 1 2
!2
104
2. Kongruenzen
Wird umgekehrt (1) von einem ganzen x bei ungerader Primzahl p gel¨ ost, so gilt nach dem “kleinen” Fermatschen Satz 1 ≡ xp−1 = (x2 )(p−1)/2 ≡ (−1)(p−1)/2
(mod p).
Wegen p ≥ 3 muß hier die Zahl rechts gleich 1 sein, was p ≡ 1 (mod 4) nach sich zieht. Bemerkung. In (1) tritt erstmals eine polynomiale, nicht lineare Kongruenz auf; solche Kongruenzen werden ausf¨ uhrlich in § 4 behandelt.
§ 4.
Polynomiale Kongruenzen
1. Problemstellung. Sei m eine nat¨ urliche Zahl. In einer gegen¨ uber 1.5 leicht abgewandelten Schreibweise wurde dort das Polynom f := a0 + a1 X ∈ Z[X] betrachtet und nach Bedingungen an a0 , a1 (d.h. also an f ) und m gefragt, unter denen es ganze x gibt, die der Kongruenz f (x) ≡ 0 (mod m) gen¨ ugen. Im Falle der Existenz solcher x wurde in Satz 1.5 außerdem die Anzahl der modulo m inkongruenten derartigen x bestimmt. Diese Fragestellung wird nun deutlich verallgemeinert, indem man beliebige Polynome f ∈ Z[X] zul¨ aßt. Jedes ganze x mit f (x) ≡ 0 (mod m) heißt eine Wurzel von f modulo m. Nach Satz 1.1(iv) ist unmittelbar klar, daß mit x auch jedes ganze x eine Wurzel von f modulo m ist, welches in derselben Restklasse modulo m liegt wie x. Daher versteht man genau wie in 1.5 unter der L¨ osungsanzahl von f (X) ≡ 0
(1)
(mod m)
modulo m die Anzahl der modulo m inkongruenten ganzen x, die (1) l¨ osen; in Zeichen ρf (m). Klar ist danach ρf (m) ≤ m f¨ ur alle m ∈ N ebenso wie ρf (1) = 1, gleichg¨ ultig wie f ∈ Z[X] gew¨ahlt ist.
2. Reduktion auf Primzahlpotenzmoduln. Im folgenden Satz wird das Problem der L¨osung von 1(1) reduziert auf das Problem der L¨ osung der k polynomialen Kongruenzen f (X) ≡ 0
(1) f¨ ur κ = 1, . . . , k, wenn
k κ=1
mod paκκ
paκκ die kanonische Primfaktorzerlegung von m ist.
§ 4.
105
Polynomiale Kongruenzen
k Satz. Sei m = κ=1 paκκ ≥ 2 wie soeben und f ∈ Z[X]. Man erh¨ alt alle ur κ = Wurzeln x1 , . . . , xt (t := ρf (m)) von f modulo m, indem man zuerst f¨ (κ) (κ) aκ aκ 1, . . . , k alle Wurzeln x1 , . . . , xtκ (tκ := ρf (pκ )) von f modulo pκ bestimmt (1) (k) und anschließend f¨ ur jedes dann m¨ogliche k–Tupel (xτ1 , . . . , xτk ) das simultane System mod paκκ f¨ ur κ = 1, . . . , k (2) X ≡ x(κ) τκ mittels chinesischem Restsatz l¨ost. Insbesondere gilt ρf (m) = d.h. die zahlentheoretische Funktion ρf ist multiplikativ.
k κ=1
ρf paκκ ,
Beweis. Ist xτ eine L¨osung von 1(1), so l¨ ost xτ auch (1) f¨ ur jedes κ = 1, . . . , k. (1) (k) Deswegen existiert ein eindeutig bestimmtes k–Tupel (xτ1 , . . . , xτk ) mit 1 ≤ τκ ≤ tκ f¨ ur κ = 1, . . . , k, so daß xτ das simultane System (2) l¨ost. (1)
(k)
Geht man umgekehrt von einem k–Tupel (xτ1 , . . . , xτk ) aus, so ist das simultane System (2) vom Typ 2.1(3) und also nach dem chinesischen Restsatz 2.2 modulo m eindeutig l¨ osbar. Ist x diese L¨osung, so muß x f¨ ur jedes κ = 1, . . . , k die (κ) Kongruenz (1) l¨osen, da ja xτκ die dem Index κ entsprechende Kongruenz (1) l¨ ost. Also l¨ost x auch 1(1) und man hat x ≡ xτ (mod m) f¨ ur genau ein τ mit 1 ≤ τ ≤ t. Bemerkung. Der Beweis lehrte insbesondere die Gleichwertigkeit von t = 0 und ¨ tκ = 0 f¨ ur mindestens ein κ, d.h. die Aquivalenz von Unl¨ osbarkeit von 1(1) und von (1) f¨ ur wenigstens ein κ. Die Idee, 1(1) auf (1) zu reduzieren, findet sich u ¨brigens bereits in 2.3, vgl. dort Formel (1).
¨ 3. Uberlegungen zur weiteren Reduktion. In 4 wird das in 2 angefallene Problem der L¨ osung von 2(1) auf dasjenige zur¨ uckgef¨ uhrt, die Kongruenz osen. Diese Reduktion wird durch folgende Betrachtunf (X) ≡ 0 (mod pκ ) zu l¨ gen vorbereitet. Sei p eine Primzahl und a ≥ 2 ganz. Seien y1 , . . . , ys bzw. z1 , . . . , zt genau die inkongruenten Wurzeln von f ∈ Z[X] modulo pa−1 bzw. pa , wobei s = 0 oder ur jedes τ = 1, . . . , t, muß t = 0 m¨ oglich sind. Da aus pa |f (zτ ) folgt pa−1 |f (zτ ) f¨ jedes zτ modulo pa−1 kongruent genau einem yσ sein. Danach ist klar: Ist s ≥ 1 und sind alle inkongruenten Wurzeln y1 , . . . , ys von f modulo pa−1 bereits bekannt, so braucht man zur Auffindung der Wurzeln von f modulo pa lediglich f¨ ur jedes σ = 1, . . . , s die p modulo pa inkongruenten Zahlen (1)
yσ + xpa−1 ,
x ∈ {0, 1, . . . , p − 1}
106
2. Kongruenzen
zu bilden und nachzusehen, f¨ ur welche dieser x die Zahl (1) Wurzel von f modulo pa ist. Kann man nun x so bestimmen, daß (1) tats¨ achlich Wurzel von f modulo pa ist? Zur Beantwortung dieser Frage wird in 4 ein systematischer Weg aufgezeigt.
4. Reduktion auf Primzahlmoduln. Zun¨ achst sei daran erinnert, daß man f¨ ur f = i≥0 ai X i ∈ Z[X] die λ–te Ableitung definiert durch f (0) := f und ur λ ∈ N; selbstverst¨ andlich sind h¨ ochstens endlich f (λ) := i≥λ λ! λi ai X i−λ f¨ 1 (λ) viele der ai von Null verschieden. Ersichtlich gilt λ! f ∈ Z[X] f¨ ur λ ∈ N0 und u ¨berdies die (rein algebraisch beweisbare) Taylor–Formel f¨ ur Polynome (1)
f (X + Y ) =
1 f (λ) (X)Y λ ; λ!
λ≥0
dabei sind X, Y zwei Unbestimmte. Schreibt man noch wie u ¨blich f anstelle (1) von f f¨ ur die erste Ableitung von f , so kann man formulieren den Satz. Sei f ∈ Z[X], p eine Primzahl, a ≥ 2 eine ganze Zahl und die ganze Zahl y sei Wurzel von f modulo pa−1 . Dann gilt: (i) Ist p|f (y) und y nicht selbst Wurzel von f modulo pa , so hat f modulo pa keine Wurzel, die modulo pa−1 kongruent y ist. (ii) Ist p |f (y), so hat f modulo pa genau eine Wurzel z, die modulo pa−1 kongruent y ist; z ergibt sich dabei in der Form y + xpa−1 , wo x die modulo p eindeutige L¨ osung folgender linearen Kongruenz ist (2)
(iii)
f (y)X ≡ −
f (y) pa−1
(mod p).
Ist p|f (y) und y selbst schon Wurzel von f modulo pa , so hat f modulo pa genau p Wurzeln, die modulo pa−1 kongruent y sind; diese ergeben andiges Restsystem modulo p sich in der Form y + xpa−1 , wo x ein vollst¨ durchl¨ auft.
Beweis. Mittels (1) stellt man sofort fest, daß y + xpa−1 (vgl. 3(1)) Wurzel von f modulo pa ist genau dann, wenn modulo pa gilt (3)
0 ≡ f (y + xpa−1 ) =
1 f (λ) (y)xλ p(a−1)λ ≡ f (y) + f (y)xpa−1 . λ!
λ≥0
§ 4.
Polynomiale Kongruenzen
107
Dabei hat man (a − 1)λ ≥ a f¨ ur λ ≥ 2 beachtet, was wegen a ≥ 2 wahr (y) 1 (λ) ist; weiter ist die Ganzheit aller λ! f (y) ber¨ ucksichtigt. Nun ist pfa−1 nach Voraussetzung des Satzes ganz; die Kongruenz der Zahlen ganz links und ganz rechts in (3) modulo pa ist daher nach Satz 1.3 damit a¨quivalent, daß x die lineare Kongruenz (2) l¨ost. Nach Satz 1.5 ist diese aber genau dann l¨ osbar, wenn (f (y), p)|f (y)p1−a gilt, und in diesem Falle gibt es (f (y), p) modulo p inkongruente L¨ osungen. Die L¨osungsanzahl von (2) ist also 0 bzw. 1 bzw. p und zwar genau dann, wenn p|f (y), pa |f (y) bzw. p |f (y) bzw. p|f (y), pa |f (y) gilt. Nacheinander sind dies genau die F¨ alle (i), (ii), (iii) im Satz.
5. Polynomkongruenzen bei Primzahlmoduln. Zun¨ achst wird der Begriff der Kongruenz zwischen ganzen Zahlen ausgedehnt zum Begriff der Kongruenz zwischen Polynomen in einer Unbestimmten mit ganzzahligen Koeffizienten: F¨ ur Primzahlen p heißen f, g ∈ Z[X] kongruent modulo p (in Zeichen: f ≡ g (mod p) oder f (X) ≡ g(X) (mod p), Negation: f ≡ g (mod p)) genau dann, wenn ur alle ganzen i ≥ 0 gilt, wobei f = i≥0 ai X i , g = i≥0 bi X i ai ≡ bi (mod p) f¨ ist. Sei f wie soeben und 0 das Nullpolynom. Ist dann f ≡ 0 (mod p), d.h. sind nicht alle ai durch p teilbar, so heißt der gr¨ oßte Index i mit p |ai der Grad von f modulo p. Dieser wird als ∂(f ; p) notiert in Anlehnung an den (gew¨ ohnlichen) Grad eines Polynoms f , der in 1.5.7 durch ∂(f ) abgek¨ urzt wurde. Beispiel. Es werde das Polynom f := 21 + 3X 2 + 24X 3 betrachtet. Offenbar ist f ≡ 0 (mod p) genau dann, wenn p|(21, 3, 24), d.h. wenn p = 3 gilt. Weiter ist ∂(f ; 2) = 2 und ∂(f ; p) = 3 f¨ ur alle Primzahlen p > 3. Aus dem folgenden Satz wird ein Ergebnis u ¨ber die Anzahl der inkongruenten Wurzeln eines ganzzahligen Polynoms modulo einer Primzahl abgeleitet. Satz. Seien f ∈ Z[X], p eine Primzahl und f ≡ 0 (mod p). Sind die ganzen Zahlen x1 , . . . , xs paarweise inkongruente Wurzeln von f modulo p, so gilt (i) die Kongruenz f (X) ≡ gs (X) sσ=1 (X − xσ ) (mod p) mit einem gs ∈ Z[X], welches den Bedingungen gs ≡ 0 (mod p) und ∂(gs ; p) = ∂(f ; p) − s gen¨ ugt, (ii) die Ungleichung s ≤ ∂(f ; p). Korollar.
F¨ ur f , p wie im vorstehenden Satz gilt ρf (p) ≤ Min(p, ∂(f ; p)).
108
2. Kongruenzen
Beweis des Satzes. Ersichtlich ist (ii) eine Konsequenz von (i), man beachte ∂(gs ; p) ≥ 0. Die Aussage (i) wird durch Induktion nach s bewiesen. Bei s = 0 ist die Behauptung klar, man w¨ ahle einfach g0 := f . Sei jetzt ∂(f ; p) > 0 und es werde vorausgesetzt, daß (i) f¨ ur ein s ∈ {0, . . . , ∂(f ; p) − 1} schon eingesehen ist. Hat f dann noch eine zu den x1 , . . . , xs modulo p inkongruente Wurzel xs+1 , so gilt mit der Induktionsvoraussetzung 0 ≡ f (xs+1 ) ≡ gs (xs+1 )
s
(xs+1 − xσ ) (mod p).
σ=1
Da p keine der Differenzen xs+1 − xσ im Produkt teilt, ist xs+1 eine Wurzel ¯s+1 ∈ Zp von gs modulo p. Das letztere ist offenbar damit a¨quivalent, daß x (vgl. 1.7 und Bemerkung 4 zu 1.8) Nullstelle von g¯s ∈ Zp [X] \ {0} ist, wobei g¯s dadurch aus gs hervorgeht, daß man s¨ amtliche Koeffizienten von gs durch ihre Restklassen modulo p ersetzt. Das Abspaltungslemma 1.5.8, angewandt mit K := Zp , f := g¯s , c := x ¯s+1 , garantiert die Existenz eines g¯s+1 ∈ Zp [X] \ {0} mit (1)
g¯s (X) = (X − x ¯s+1 )¯ gs+1 (X)
und
∂(¯ gs ) = 1 + ∂(¯ gs+1 ).
W¨ ahlt man nun gs+1 ∈ Z[X], so daß sich bei Ersetzung seiner Koeffizienten durch ihre Restklassen modulo p gerade g¯s+1 ergibt, so ist modulo p gs+1 ≡ 0, gs (X) ≡ (X − xs+1 )gs+1 (X)
und
∂(gs ; p) = 1 + ∂(gs+1 ; p)
wegen (1). Damit ist (i) induktiv bewiesen. Bemerkung. Ist p eine Primzahl, so hat das Polynom X p−1 − 1 nach dem “kleinen” Fermatschen Satz 3.3 die paarweise inkongruenten Wurzeln 1, 2, . . . , p − 1 modulo p. Nach Teil (i) des obigen Satzes ist X p−1 − 1 ≡
p−1
(X − σ) (mod p)
σ=1
woraus in Gestalt von −1 ≡ (p − 1)! (mod p) der “nichttriviale” Teil des Wilsonschen Satzes 3.8 nochmals folgt.
6. Ein Beispiel. Hier soll eine Anwendung der Ergebnisse dieses Paragraphen gegeben werden. F¨ ur f := X 2 + 1 wurde in Satz 3.9 gezeigt: ρf (2) = 1 sowie ρf (p) gleich 2 bzw. 0, je nachdem, ob die ungerade Primzahl p kongruent 1 bzw. 3 modulo 4 ist.
§ 5.
Primitivwurzeln
109
Wegen ρf (4) = 0 ist ρf (2a ) = 0 f¨ ur alle ganzen a ≥ 2. Sei jetzt p ≡ 1 (mod 4). Dann ist nach Satz 3.9 und Satz 5(i) mit y := ( p−1 2 )! f ≡ (X − y)(X + y) (mod p). Wegen p |f (±y) = ±2y hat f modulo p2 genau eine Wurzel z1 bzw. z2 , die modulo p kongruent y bzw. −y ist, und also hat man ρf (p2 ) = 2. Dies ergibt sich aus Satz 4(ii). Wegen p |y ist p |z1 z2 und so kann man das letzte Argument erneut anwenden und erh¨ alt ρf (pa ) = 2 f¨ ur jedes a ≥ 1. Wegen der in Satz 2 festgestellten Multiplikativit¨ at von ρf kann nun gesagt werden: ρf (m) ist k positiv genau dann, wenn m = 2δ κ=1 paκκ gilt mit δ ∈ {0, 1}, k ∈ N0 und pκ ≡ 1 (mod 4) f¨ ur κ = 1, . . . , k, falls k > 0; dann ist ρf (m) = kκ=1 ρf (paκκ ) = 2k .
§ 5.
Primitivwurzeln
1. Definition. In diesem Paragraphen wird eine Problematik wieder aufgenommen und fortgef¨ uhrt, die bereits verschiedentlich in § 3 angeklungen ist. Begonnen wird mit der Ermittlung von ordm ai aus i und ordm a in folgender Proposition A. Seien m > 0 und a ganze, teilerfremde Zahlen und sei k := k ordm a. Dann gilt ordm ai = (i,k) f¨ ur alle ganzen i ≥ 0. Insbesondere sind genau i ur die (i, k) = 1 gilt. die a wieder von der Ordnung k modulo m, f¨ Beweis. Man setzt k(i) := ordm ai , weiß dann aik(i) ≡ 1 (mod m) und somit k k|ik(i) nach Korollar 3.4, also (i,k) |k(i). Andererseits ist wegen ak ≡ 1 (mod m) k nach demselben Korollar, was die auch aik/(i,k) ≡ 1 (mod m), also k(i)| (i,k) Behauptung beweist.
Nun wird folgende, auf Euler zur¨ uckgehende Definition gegeben: Seien m > 0 und a ganze, teilerfremde Zahlen; genau dann, wenn ordm a = ϕ(m) gilt, heißt a eine Primitivwurzel modulo m. Wenn also a Primitivwurzel modulo m ist, sind a, a2 , . . . , aϕ(m) paarweise inkongruent modulo m nach 3.2. Außerdem sind diese ϕ(m) Zahlen s¨ amtliche zu m teilerfremd und bilden somit in ihrer Gesamtheit ein primes Restsystem modulo m, vgl. 1.8. Hat man umgekehrt ein ganzes a, f¨ ur das a, a2 , . . . , aϕ(m) ein primes Restsystem modulo m bilden, so ist offenbar a eine Primitivwurzel modulo m. ¨ Die hier festgestellte Aquivalenz kann in der Sprache von 1.8 formuliert werden als
110
2. Kongruenzen
Proposition B. F¨ ur ganze Zahlen m > 0 sind gleichbedeutend: (i) Modulo m gibt es eine Primitivwurzel. (ii) Die prime Restklassengruppe modulo m ist zyklisch. Ohne die Frage nach der Existenz von Primitivwurzeln modulo einem vorgegebenen m schon jetzt zu kl¨aren, sagt Proposition C. Sei m > 0 ganz. Wenn es modulo m u ¨berhaupt Primitivwurzeln gibt, so existieren genau ϕ(ϕ(m)) paarweise modulo m inkongruente. Beweis. Sei a eine Primitivwurzel modulo m; dann ist ordm a = ϕ(m). Nach Proposition A sind genau die ai wieder Primitivwurzeln modulo m, f¨ ur die (i, ϕ(m)) = 1 gilt, was die Behauptung liefert. Ob es zu einem vorgegebenen nat¨ urlichen m u ¨berhaupt Primitivwurzeln gibt, ist im Moment noch eine offene Frage, die erst in 5 vollst¨ andig gekl¨art sein wird. Betrachtet man beispielsweise die F¨alle m gleich 14 bzw. 15, so ist ϕ(m) gleich 6 bzw. 8. Modulo 14 sind die Potenzen von 3 gleich 3, 9, −1, −3, −9, 1; somit ist 3 eine Primitivwurzel modulo 14 und wegen ϕ(ϕ(14)) = 2 muß es noch genau eine weitere geben, vgl. Proposition C. Es zeigt sich, daß diese 5 modulo 14 ist. Wegen ord15 1 = 1, ord15 a = 2 f¨ ur a ≡ −1, ±4 (mod 15) und ord15 a = 4 f¨ ur a ≡ ±2, ±7 (mod 15) gibt es modulo 15 keine Primitivwurzeln.
2. Primitivwurzeln modulo Primzahlen. Der hier zu zeigende Satz beinhaltet insbesondere, daß es Primitivwurzeln modulo jeder Primzahl gibt. Dies wurde von J.H. Lambert (Opera Mathematica II, 198–213) behauptet. Euler (Opera Omnia Ser. 1, III, 240–281) gab einen nicht ganz kompletten Beweis, w¨ahrend Gauss (Disquisitiones Arithmeticae, Artt. 52–55) mit einer Methode, die unten vorgef¨ uhrt wird, zeigen konnte Satz. Sei p eine Primzahl und d > 0 ein Teiler von p − 1. Dann existieren genau ϕ(d) modulo p inkongruente ganze Zahlen, die modulo p die Ordnung d haben. Insbesondere gibt es ϕ(p − 1) modulo p inkongruente Primitivwurzeln modulo p. Beweis. Sei n¨ amlich T ein primes Restsystem modulo p. F¨ ur alle t ∈ T ist (ordp t)|(p − 1) und f¨ ur ganzes d > 0 mit d|(p − 1) bezeichne ψ(d) die Anzahl der t ∈ T mit ordp t = d. Klar ist (1) ψ(d) = p − 1. d|(p−1)
§ 5.
Primitivwurzeln
111
Nun ist entweder ψ(d) = 0 oder es gibt ein t0 ∈ T mit ordp t0 = d; im zweiten Fall sind t0 , t20 , . . . , td0 paarweise inkongruent modulo p und sie sind Wurzeln von fd := X d − 1 modulo p. Andererseits kann fd nach Korollar 4.5 h¨ ochstens d modulo p inkongruente Wurzeln haben. Das heißt aber: Jede Wurzel von fd modulo p ist kongruent ti0 f¨ ur genau ein i ∈ {1, . . . , d}. Nun interessieren offenbar genau diejenigen i mit ordp ti0 = d. Nach Proposition 1A sind dies genau die zu d teilerfremden i ∈ {1, . . . , d} und davon gibt es ϕ(d) St¨ uck. Bei ψ(d) > 0 gilt also ψ(d) = ϕ(d), d.h. ϕ(d) ≥ ψ(d) f¨ ur alle positiven Teiler d von (p − 1). Aus Satz 1.4.11(iii) und (1) ergibt sich dann
p−1=
d|(p−1)
ϕ(d) ≥
ψ(d) = p − 1,
d|(p−1)
was ψ(d) = ϕ(d) nun f¨ ur alle positiven Teiler d von p − 1 impliziert.
Oftmals n¨ utzlich ist noch das als Nebenergebnis angefallene
Korollar. Ist p eine Primzahl und kennt man eine Primitivwurzel t0 modulo p, so sind die ϕ(p − 1) Potenzen ti0 mit zu p − 1 teilerfremdem i ∈ {1, . . . , p − 1} genau die s¨ amtlichen Primitivwurzeln modulo p.
Bemerkungen. 1) In der Bemerkung zu 3.4 wurde (in der in 1 eingef¨ uhrten Sprechweise) angek¨ undigt, daß es zu unendlich vielen m ∈ N Primitivwurzeln gibt. Dies ist nat¨ urlich im obigen Satz enthalten. 2) Mittels Proposition 1B kann f¨ ur Primzahlen p aus dem Hauptergebnis des gegenw¨artigen Abschnitts geschlossen werden: Die prime Restklassengruppe modulo p ist zyklisch. Anders ausgedr¨ uckt: Die multiplikative Gruppe Z× p des K¨ orpers Zp (vgl. 1.7) ist zyklisch. Dies ist Spezialfall eines allgemeineren Satzes aus der Algebra: Ist K ein K¨ orper, so ist jede endliche Untergruppe von K × zyklisch.
3. Tabellen f¨ ur Primitivwurzeln. Es sei eine kurze Tabelle f¨ ur die s¨ amtlichen ϕ(p − 1) Primitivwurzeln modulo der Primzahlen p < 50 angef¨ ugt.
112
2. Kongruenzen
p ϕ(p − 1) 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47
1 1 2 2 4 4 8 6 10 12 8 12 16 12 22
Primitivwurzeln modulo p 1 2 2,3 3,5 2,6,7,8 2,6,7,11 3,5,6,7,10,11,12,14 2,3,10,13,14,15 5,7,10,11,14,15,17,19,20,21 2,3,8,10,11,14,15,18,19,21,26,27 3,11,12,13,17,21,22,24 2,5,13,15,17,18,19,20,22,24,32,35 6,7,11,12,13,15,17,19,22,24,26,28,29,30,34,35 3,5,12,18,19,20,26,28,29,30,33,34 5,10,11,13,15,19,20,22,23,26,29,30,31,33,35,38,39,40,41,43,44,45
Es soll beispielsweise erkl¨art werden, wie hier die 22 Primitivwurzeln modulo 47 gefunden wurden. Nach Korollar 3.4 gilt ord47 a ∈ {1, 2, 23, 46} f¨ ur alle ganzen, nicht durch 47 teilbaren Zahlen a. Wegen 212 = 4096 = 47 · 87 + 7 ≡ 7 (mod 47) ist 224 ≡ 49 ≡ 2 (mod 47), also ord47 2 = 23. Weiter gilt wegen 35 ≡ 8 (mod 47), 311 ≡ 4 (mod 47) die Kongruenz 323 ≡ 1 (mod 47), was zu ord47 3 = 23 f¨ uhrt. Nach dem “kleinen” Fermat–Satz 3.3 ist 423 = 246 ≡ 1 (mod 47), also auch ord47 4 = 23 und als kleinste positive Primitivwurzel modulo 47 kommt erst 5 in Frage. Wegen 523 ≡ −1 (mod 47) ist tats¨achlich ord47 5 = 46, also 5 eine Primitivwurzel modulo 47. Nach Korollar 2 erh¨ alt man daraus leicht alle Primitivwurzeln modulo 47. Bei dem hier durchgef¨ uhrten Beispiel sieht es so aus, als h¨atte man zur Ermittlung einer ersten Primitivwurzel modulo 47 einfach die Zahlen 2, 3, 4, 5 nacheinander durchprobiert. Es gibt aber manche Hilfen, die das Probierverfahren oft abk¨ urzen; eine solche ist enthalten im Lemma. Sei m ∈ N und die ganzen Zahlen a1 , a2 seien zu m teilerfremd; weiter seien ordm a1 , ordm a2 zueinander teilerfremd. Dann gilt ordm a1 a2 = (ordm a1 )(ordm a2 ). Beweis. Ist k := ordm a1 a2 und ki := ordm ai f¨ ur i = 1, 2, so folgt aus aki i ≡ 1 (mod m) sofort aki 1 k2 ≡ 1 (mod m) f¨ ur i = 1, 2 und daraus (a1 a2 )k1 k2 ≡
§ 5.
Primitivwurzeln
113
1 (mod m), woraus man k|k1 k2 erh¨alt. Andererseits f¨ uhrt ak1 ak2 ≡ 1 (mod m) zu kk2 a1 ≡ 1 (mod m), also k1 |kk2 ; wegen (k1 , k2 ) = 1 bedeutet dies k1 |k. Analog folgt k2 |k und somit k1 k2 |k, erneut wegen (k1 , k2 ) = 1. Mit k = k1 k2 hat man die Behauptung. Aufgrund dieses Lemmas kann man schon in dem Moment eine Primitivwurzel modulo 47 angeben, wo man ord47 2 = 23 erkannt hat, also sofort nach dem ersten (Fehl–)Versuch, eine m¨oglichst kleine Primitivwurzel modulo 47 zu finden. Wegen ord47 (−1) = 2, ord47 2 = 23 ist n¨ amlich nach dem Lemma ord47 (−2) = 2 · 23 = 46 und so ist −2 ≡ 45 eine Primitivwurzel modulo 47. Dies ist die letzte in der p = 47 entsprechenden Zeile obiger Tabelle; auch aus ihr ergeben sich selbstverst¨andlich s¨ amtliche weiteren Primitivwurzeln derselben Zeile mittels Korollar 2. Nach diesem Korollar ist es einleuchtend, warum in den meisten Tafeln u ¨ber Primitivwurzeln, die man in der Literatur findet, meistens nur die kleinste positive Primitivwurzel modulo der Primzahlen p angegeben ist. Die erste umfangreichere solche Tafel f¨ ur p < 1000 findet sich bei C.G.J. Jacobi (Canon Arithmeticus, 1839; Neuausgabe: Akademie–Verlag, Berlin, 1956). Wesentlich weitreichender ist das Tafelwerk f¨ ur p ≤ 50021 von A.E. Western und J.C.P. Miller (Tables of Indices and Primitive Roots, University Press, Cambridge, 1968). Bemerkungen. 1) Ein Blick auf obige Tabelle suggeriert, daß f¨ ur jede Primzahl p = 3 das Produkt aller ϕ(p − 1) inkongruenten Primitivwurzeln modulo p ¨ kongruent 1 (mod p) ist; der Leser m¨oge dies als Ubung beweisen. 2) Betrachtet man obige Tabelle nicht “horizontal”, sondern “vertikal”, so hat E. Artin (Collected Papers, viii–x) im Jahre 1927 die Vermutung ge¨außert, daß jedes vorgegebene ganze a = −1, das keine Quadratzahl ist, Primitivwurzel modulo p f¨ ur unendlich viele Primzahlen p ist. Daß hier die Ausnahmen a = −1, 0 ganz nat¨ urlich sind, ist klar. Ist a eine positive Quadratzahl, etwa a = b2 , so ist (p−1)/2 a = bp−1 ≡ 1 (mod p) f¨ ur alle ungeraden Primzahlen p mit p |a; modulo aller gen¨ ugend großen p k¨ onnen diese a also sicher keine Primitivwurzeln sein. Einen bedeutenden Fortschritt in Richtung auf die noch offene Artinsche Vermutung hat C. Hooley (J. Reine Angew. Math. 225, 209–220 (1967)) erzielt, allerdings unter Annahme der Richtigkeit einer anderen derzeit unbewiesenen Hypothese. Ohne jede unbewiesene Voraussetzung konnte D.R. Heath-Brown (Quart. J. Math. Oxford (2) 37, 27–38 (1986)) ein u ¨beraus interessantes Resultat sichern, aus dem z.B. folgt, daß bis auf h¨ ochstens zwei Ausnahmen jede Primzahl a Primitivwurzel modulo p f¨ ur unendlich viele Primzahlen p ist. 4. Zu welchen Moduln sind Primitivwurzeln m¨ oglich? Um diese Frage m¨oglichst pr¨azise beantworten zu k¨onnen, sei vorausgeschickt folgendes
114
2. Kongruenzen
Lemma. Sind m1 , m2 ∈ N und a ∈ Z paarweise teilerfremd und ist ni ∈ N n2 ur i = 1, 2, so ist (nn11,n Vielfaches von ordm1 m2 a. Vielfaches von ordmi a f¨ 2) k2 Beweis. Bei ki := ordmi a, k := ordm1 m2 a gilt k = kgV(k1 , k2 ) = (kk11,k nach 2) Lemma 3.5 und Satz 1.2.12A. Weiter gilt ni = ki i f¨ ur i = 1, 2 mit geeignetem k2 i ∈ N nach Voraussetzung. Die Behauptung ist also mit (kk11,k | k1 k2 1 2 , d.h. 2 ) (k1 1 ,k2 2 ) mit (k1 1 , k2 2 )|1 2 (k1 , k2 ) a¨quivalent und letzteres ist direkt einsichtig.
Das soeben gezeigte Lemma gestattet es nun, die Moduln, zu denen es Primitivwurzeln geben kann, weitgehend einzuschr¨ anken. Proposition. Modulo m ∈ N existieren h¨ochstens dann Primitivwurzeln, wenn m gleich 1, 2, 4, pα , 2pα mit ungerader Primzahl p und nat¨ urlichem α ist. ur i = 1, 2 nach Beweis. F¨ ur a, m1 , m2 wie im Lemma gilt (ordmi a)|ϕ(mi ) f¨ Korollar 3.4. Unter Ber¨ ucksichtigung der Multiplikativit¨ at von ϕ (vgl. Satz ϕ(m1 m2 ) 1.4.11(i)) und der Teilerfremdheit von m1 , m2 ist (ϕ(m nach dem Lemma 1 ),ϕ(m2 )) Vielfaches von ordm1 m2 a. Dies bedeutet: Modulo solcher m ∈ N, die eine Zerlegung m = m1 m2 mit teilerfremden m1 , m2 ∈ N und (ϕ(m1 ), ϕ(m2 )) > 1 zulassen, kann es keine Primitivwurzeln geben. Es werde erst der Fall betrachtet, daß m von einer ungeraden Primzahl geteilt wird, etwa von p. Sei hier m = pα m mit m , α ∈ N, p |m ; wegen pα ≥ 3 und Korollar 1.4.11(iv) ist ϕ(pα ) gerade. Wenn also modulo m eine Primitivwurzel aßt nur m gleich 1 oder existiert, muß ϕ(m ) ungerade, also gleich 1 sein; dies l¨ 2 zu. Um den Fall m = 2α zu behandeln, wird behauptet, daß bei ungeradem ganzem u die Kongruenz (1)
u2
α−2
≡ 1 (mod 2α )
f¨ ur α = 3, 4, . . .
gilt. Zun¨ achst hat man u2 = (2v + 1)2 = 4v(v + 1) + 1 ≡ 1 (mod 8) mit ganzem v wegen der Ungeradheit von u; dies beweist (1) f¨ ur α = 3. Sei nun (1) schon f¨ ur ein α ≥ 3 als richtig erkannt; (1) ist a¨quivalent mit einer Gleichung α−2 u2 = 1 + 2α w bei geeignetem ganzem w. Durch Quadrieren folgt hieraus 2α−1 = 1 + 2α+1 w + 22α w2 ≡ 1 (mod 2α+1 ) und dies ist (1) f¨ ur α + 1 anstelle u von α. Wegen ϕ(2α ) = 2α−1 ist (ord2α u)| 21 ϕ(2α ) nach (1) f¨ ur α = 3, 4, . . . und jedes ungerade ganze u. Da jede Primitivwurzel modulo 2α , α > 2, ungerade sein m¨ ußte, kann es solche nach der zuletzt festgestellten Teilbarkeitsbeziehung nicht geben.
§ 5.
115
Primitivwurzeln
5. Bestimmung aller Moduln mit Primitivwurzeln. Die Aussage der letzten Proposition geht auf Gauss (Disquisitiones Arithmeticae, Art. 92) zur¨ uck. Implizit findet sich im gleichen Werk schon an fr¨ uherer Stelle, daß es zu den in der Proposition genannten Moduln tats¨ achlich Primitivwurzeln gibt. Damit ist auch klar, warum am Ende von 1 Primitivwurzeln modulo 14, jedoch nicht modulo 15 gefunden werden konnten. Um das volle Gausssche Ergebnis beweisen zu k¨onnen, ben¨ otigt man folgendes Lemma . Zu jeder Primzahl p gibt es eine Primitivwurzel a modulo p mit ap−1 ≡ 1 (mod p2 ). Beweis. Bei ganzem a1 und a2 := a1 + p gilt nach Lemma 3.3 (1)
ap2 =
p p j=0
j
aj1 pp−j ≡ ap1
(mod p2 ).
Nach dem “kleinen” Fermatschen Satz 3.3 ist apj = aj + bj p mit ganzem bj f¨ ur j = 1, 2; dies in (1) eingetragen f¨ uhrt unter Ber¨ ucksichtigung der K¨ urzungsregel 1.3 zur Kongruenz b2 ≡ b1 − 1 (mod p) und so ist h¨ ochstens eines der b1 , b2 durch p teilbar. Nun w¨ ahle man a1 als Primitivwurzel modulo p, was nach Satz 2 m¨oglich ist; a2 ist ebenfalls Primitivwurzel modulo p. Nach den Feststellungen u ¨ber die bj ist aber p2 |(apj − aj ) f¨ ur mindestens ein j.
Satz von Gauss. Modulo m ∈ N existieren genau dann Primitivwurzeln, wenn m gleich 1, 2, 4, pα , 2pα mit ungerader Primzahl p und nat¨ urlichem α ist. Beweis. Zun¨ achst sind 1, 1, 3 Primitivwurzeln modulo 1, 2, 4 in dieser Reihenfolge. F¨ ur den Rest des Beweises seien p, α wie im Satz. Sei a eine Primitivwurzel modulo pα ; dann gibt es auch eine ungerade Primiur a ˆ etwa die ungerade der beiden Zahlen a tivwurzel a ˆ modulo pα : Man nehme f¨ α und a+p und hat (ˆ a, 2pα ) = 1. F¨ ur k := ord2pα a ˆ gilt k|ϕ(2pα ) ⇔ k|(p−1)pα−1 k α nach Korollar 3.4; da a ˆ ≡ 1 (mod 2p ) die Kongruenz a ˆk ≡ 1 (mod pα ) impliα−1 ziert, ist (p−1)p |k, erneut nach Korollar 3.4. Man hat also k = (p−1)pα−1 = α ϕ(2p ) und so ist a ˆ Primitivwurzel modulo 2pα . Im folgenden muß lediglich noch gezeigt werden, daß es modulo pα Primitivwurzeln gibt. Dazu wird a dem vorausgeschickten Lemma gem¨aß gew¨ahlt und (2)
α−2
a(p−1)p
≡ 1 (mod pα )
116
2. Kongruenzen
f¨ ur α = 2, 3, . . . behauptet. W¨ ahrend (2) f¨ ur α = 2 mit dem Lemma erledigt ist, werde nun (2) f¨ ur ein α ≥ 2 als richtig vorausgesetzt. Unter Beachtung von ϕ(pα−1 ) = (p − 1)pα−2 folgt aus (2) mit dem Fermat–Eulerschen Satz 3.4 α−2
a(p−1)p
(3)
= 1 + bpα−1
mit ganzem, nicht durch p teilbarem b. Aus (3) ergibt sich durch Potenzieren (4)
α−1
a(p−1)p
= (1 + bpα−1 )p = 1 + bpα + cp2α−1
mit ganzem c wegen p| p2 , vgl. Lemma 3.3. Mit R¨ ucksicht auf 2α − 1 ≥ α + 1 f¨ ur α ≥ 2 und p |b beinhaltet (4) die Richtigkeit von (2) f¨ ur α + 1 anstelle von α. Ist a weiterhin dem Lemma gem¨aß gew¨ahlt, so ist es zu pα teilerfremd, und man kann := ordpα a definieren. Nach Korollar 3.4 ist |ϕ(pα ) = (p − 1)pα−1 . Andererseits folgt aus a ≡ 1 (modpα ) erst recht a ≡ 1 (mod p) und somit (p − 1)| wegen ordp a = p − 1. Damit muß = (p − 1)pβ mit einem β ∈ β {0, . . . , α − 1} gelten, d.h. a(p−1)p ≡ 1 (mod pα ). Wegen (2) ist hier β ≤ α − 2 unm¨ oglich und so bleibt nur β = α − 1, was ordpα a = = (p − 1)pα−1 = ϕ(pα ) beweist.
Bemerkung. Nach dem Gaussschen Satz und Proposition 1B ist die prime Restklassengruppe Z∗pα modulo pα f¨ ur nat¨ urliche α und Primzahlen p genau dann zyklisch, wenn nicht gleichzeitig p = 2 und α ≥ 3 gelten. Daher kann nach der Bemerkung zu 2.5 gesagt werden: ∗ κ Ist m ≥ 2 eine ganze Zahl mit der kanonischen Zerlegung kκ=1 pα κ , so ist Zm ακ isomorph zum direkten Produkt der primen Restklassengruppen modulo pκ f¨ ur κ = 1, . . . , k und diese letzteren sind s¨amtliche zyklisch, falls nur 8 |m gilt. Ist jedoch 8|m und etwa p1 = 2, so ist Z∗pα1 sicher nicht zyklisch. 1
Dennoch muß Z∗m auch in diesem Fall isomorph dem direkten Produkt geeigneter zyklischer Gruppen von Primzahlpotenzordnung sein; dies lehrt der Hauptsatz u ¨ber endliche abelsche Gruppen von G. Frobenius und L. Stickelberger (J. Reine Angew. Math. 86, 217–262 (1879)). F¨ ur die Darstellung von Z∗m bei 8|m als direktes Produkt zyklischer Gruppen reicht es offenbar nach den vorstehenden Er¨ orterungen, Z∗2α bei α ≥ 3 noch als direktes Produkt geeigneter zyklischer Gruppen von Primzahlpotenzordnung auszudr¨ ucken, was im folgenden Abschnitt geschehen soll.
§ 5.
117
Primitivwurzeln
6. Zweierpotenzen als Moduln. Dazu wird vorangestellt folgendes Lemma. Bei ungeradem ganzem u sind a¨quivalent: (i) ord2α u = 2α−2 f¨ ur alle α = 3, 4, . . . . (ii) u ≡ ±3 (mod 8). Beweis. In beiden F¨ allen u ≡ ±1 (mod 23 ) ist u2 ≡ 1 (mod 24 ) und daher α−3 ≡ 1 (mod 2α ) f¨ ur alle α ≥ 4, also (ord2α u)|2α−3 f¨ ur dieselben α induktiv u2 und die Gleichung in (i) kann hier nicht gelten. β
Sei nun u ≡ ±3 (mod 8). Dann ist u2 − 1 = 2β+2 vβ f¨ ur alle β ∈ N mit ur β = 1 ist dies n¨ amlich leicht ersichtlich und, wenn ungeradem ganzem vβ . F¨ β die Gleichung f¨ ur ein β ≥ 1 wahr ist, ist u2 + 1 = 2wβ mit wβ := 1 + 2β+1 vβ β+1 ungerade, also u2 − 1 = 2β+3 vβ wβ =: 2β+3 vβ+1 mit ungeradem vβ+1 . urlichem β ≤ α − 2 f¨ ur α ≥ 3. Andererseits Nach 4(1) gilt ord2α u = 2β mit nat¨ β ist nach der letzten Feststellung 2α |(u2 − 1) = 2β+2 vβ , also α ≤ β + 2 wegen ur α ≥ 3. der Ungeradheit von vβ . Daher ist ord2α u = 2β = 2α−2 f¨ Satz. Bei ganzem α ≥ 3 und u ≡ ±3 (mod 8) bilden die folgenden ϕ(2α ) = 2α−1 Zahlen ein primes Restsystem modulo 2α (1)
u, u2 , u3 , . . . , u2
α−2
, −u, −u2 , . . . , −u2
α−2
.
Beweis. Da u ungerade ist, sind offenbar alle 2α−1 Zahlen (1) zum Modul 2α teilerfremd. Wegen der Implikation (ii) ⇒ (i) des Lemmas sind die ersten 2α−2 Zahlen in (1) paarweise inkongruent modulo 2α ; dasselbe gilt f¨ ur die zweiten 2α−2 Zahlen in (1). Andererseits ist auch jede der ersten 2α−2 Zahlen in (1) zu jeder der zweiten teilerfremd: Denn w¨ are ui ≡ −uj (mod 2α ) f¨ ur 1 ≤ i, j ≤ 2α−2 , i−j α ≡ −1 (mod 2 ) nach der K¨ urzungsregel 1.3. o.B.d.A. mit j ≤ i, so w¨are u Daraus w¨ urde u2(i−j) ≡ 1 (mod 2α+1 ) folgen, also erneut nach dem Lemma 2α−1 |2(i − j), was wegen 0 ≤ i − j < 2α−2 zu i = j f¨ uhrt, damit zu 1 ≡ −1 (mod 2α ), was wegen α ≥ 3 nicht geht. Aus dem vorstehenden Satz ergibt sich unmittelbar das Korollar. Seien α ≥ 3 und u ≡ ±3 (mod 8) feste ganze Zahlen. Dann gibt es zu jedem ungeraden ganzen c ein modulo 2 bzw. 2α−2 eindeutig bestimmtes ganzes i0 bzw. i−1 , so daß gilt (2)
c ≡ (−1)i0 ui−1 (mod 2α ).
118
2. Kongruenzen
Die Bedeutung der Existenz von Primitivwurzeln modulo m liegt vor allem in folgender, in 1 erkannten Tatsache: Ist a eine feste Primitivwurzel modulo m, so gibt es zu jedem ganzen c mit (c, m) = 1 ein modulo ϕ(m) eindeutig bestimmtes ganzes i mit (3)
c ≡ ai (mod m).
Formel (2) hat als Analogon zu (3) im Falle des Moduls 2α , α ≥ 3, angesehen zu werden, zu dem es nach dem Gaussschen Satz keine Primitivwurzeln gibt. Bemerkung. Aus dem obigen Korollar folgt: Sind α ≥ 3 und u ≡ ±3 (mod 8) feste ganze Zahlen, so ist die prime Restklassengruppe Z∗2α modulo 2α direktes Produkt ihrer von den Restklassen −1 bzw. u ¯ modulo 2α erzeugten zyklischen Untergruppen der Primzahlpotenzordnung 2 bzw. 2α−2 . (Man vergleiche die Bemerkung zu 5 sowie zur Schreibweise die Bemerkung 4 zu 1.8.)
7. Basisdarstellung. Die Darstellungen 6(2) bzw. 6(3) f¨ ur zum Modul teilerfremde ganze Zahlen gelten nur f¨ ur sehr spezielle Moduln; der folgende Satz verallgemeinert diese Darstellungen auf beliebige nat¨ urliche Moduln. k κ Satz. Sei m eine nat¨ urliche Zahl mit der kanonischen Zerlegung κ=0 pα κ , wobei p0 := 2 vereinbart sei; dabei sind α0 und k ganz und nichtnegativ, jedoch κ seien α1 , . . . , αk positiv, falls k positiv ist. F¨ ur κ = 0, . . . , k sei qκ := pα κ gesetzt. uge den Kongruenzen Die ganze Zahl a0 gen¨ (1)
a0 ≡ −1 (mod q0 ),
a0 ≡ 1 (mod
m ) q0
und, falls k positiv ist, seien aκ feste Primitivwurzeln modulo qκ mit (2)
aκ ≡ 1 (mod
m ) qκ
f¨ ur κ = 1, . . . , k. Dann gilt f¨ ur jedes zu m teilerfremde ganze c (i) im Falle α0 ≤ 2: Es gibt genau ein (i0 , . . . , ik ) ∈ Nk+1 , iκ < ϕ(qκ ) f¨ ur 0 κ = 0, . . . , k mit (3)
(ii)
c ≡ ai00 · . . . · aikk (mod m); im Falle α0 ≥ 3: Es gibt genau ein (i−1 , i0 , . . . , ik ) ∈ Nk+2 , i−1 < 12 ϕ(q0 ), 0 i0 < 2 und iκ < ϕ(qκ ) f¨ ur κ = 1, . . . , k mit
§ 5. (4)
119
Primitivwurzeln
i
−1 i0 c ≡ a−1 a0 · . . . · aikk (mod m).
Dabei hat die ganze Zahl a−1 den Kongruenzen (5)
a−1 ≡ u (mod q0 ),
a−1 ≡ 1 (mod
m ) q0
zu gen¨ ugen, wenn die ganze Zahl u vorab gem¨ aß u ≡ ±3 (mod 8) fixiert wurde. Beweis. Zun¨ achst sind die Wahlen (1) bzw. (5), letzteres bei α0 ≥ 3, f¨ ur a0 bzw. a−1 nach dem chinesischen Restsatz 2.2 (sogar modulo m eindeutig) m¨oglich. Ist k ≥ 1, so gibt es nach dem Gaussschen Satz 5 f¨ ur jedes κ = 1, . . . , k eine Primitivwurzel aκ modulo qκ . Erneut nach dem chinesischen Restsatz ist das System m X ≡ aκ (mod qκ ), X ≡ 1 (mod ) qκ dann f¨ ur jedes κ = 1, . . . , k (modulo m eindeutig) l¨ osbar; jede derartige L¨ osung aκ ist wegen aκ ≡ aκ (mod qκ ) eine Primitivwurzel modulo qκ , die außerdem der Bedingung (2) gen¨ ugt. Wegen (c, m) = 1 ⇔ (c, qκ ) = 1 f¨ ur κ = 0, . . . , k existiert nach der Feststellung zu 6(3) genau ein iκ ∈ {0, . . . , ϕ(qκ ) − 1} mit (6)
c ≡ aiκκ (mod qκ );
ur κ = 0, . . . , k zu, bei α0 ≥ 3 lediglich f¨ ur κ = 1, . . . , k. bei α0 ≤ 2 trifft dies f¨ Sei erst α0 ≤ 2 und κ ∈ {0, . . . , k} fixiert. Nach (1) und (2) ist aλ ≡ 1 (mod qmλ ) f¨ ur λ = 0, . . . , k, also erst recht aλ ≡ 1 (mod qκ ) f¨ ur dieselben λ, aber λ = κ (man beachte qκ | qmλ ). Wegen (6) und der letzten Feststellung ist c ≡ ai00 · . . . · aikk (mod qκ ); da dies f¨ ur κ = 0, . . . , k zutrifft, ist die Existenz einer Darstellung (3) gesichert. Aus (7)
ai00 · . . . · aikk ≡ aj00 · . . . · ajkk (mod m)
mit iκ , jκ ∈ {0, . . . , ϕ(qκ ) − 1} f¨ ur κ = 0, . . . , k folgt dieselbe Kongruenz modulo qκ anstatt modulo m, wegen aλ ≡ 1 (mod qκ ) f¨ ur λ = κ also aiκκ ≡ ajκκ (mod qκ ), was nach den Feststellungen bei 6(3) zu iκ = jκ f¨ ur κ = 0, . . . , k f¨ uhrt.
120
2. Kongruenzen
Sei jetzt α0 ≥ 3 und κ ∈ {1, . . . , k} fixiert. Nach 6(2) ist mit i0 ∈ {0, 1}, i−1 ∈ {0, . . . , 12 ϕ(q0 ) − 1} wegen (1) und (5) i
−1 i0 c ≡ ui−1 (−1)i0 ≡ a−1 a0 (mod q0 )
ur κ = 1, . . . , k also wegen den aus (2) folgenden Kongruenzen aκ ≡ 1 (mod q0 ) f¨ i
−1 i0 c ≡ a−1 a0 · . . . · aikk (mod q0 ).
ur κ = 1, . . . , k anstatt modulo q0 ; man Dieselbe Kongruenz hat man modulo qκ f¨ braucht ja nur (6) und aλ ≡ 1 (mod qκ ) f¨ ur λ = −1, 0, . . . , k, λ = κ (f¨ ur λ = −1 vgl. (5)) zu beachten. Damit ist die Existenz einer Darstellung (4) gesichert mit oge sich den dort genannten Bedingungen an i−1 , . . . , ik . Deren Eindeutigkeit m¨ der Leser selbst u ¨berlegen, ausgehend von einer zu (7) analogen Kongruenz. Bemerkungen. 1) Ist α0 im vorstehenden Satz gleich 0 oder 1, so kann a0 gleich 1 gew¨ahlt werden, so daß der erste Faktor rechts in (3) nicht in Erscheinung tritt. 2) Ist allgemein eine multiplikativ geschriebene abelsche Gruppe G direktes Produkt zyklischer Untergruppen G1 , . . . , Gk von G und wird Gκ von gκ f¨ ur κ = 1, . . . , k erzeugt, so heißt {g1 , . . . , gk } eine Basis von G. Mittels einer solchen Basis l¨aßt sich jedes g ∈ G eindeutig in der Form (8)
g1i1 · . . . · gkik
ausdr¨ ucken; man nennt (8) die Basisdarstellung von g. Wendet man diese Begriffsbildung auf die prime Restklassengruppe Z∗m an, so wird man unter Beachtung der Bemerkungen zu 5 und 6 die Kongruenzen (3) und (4) im Satz als Basisdarstellung der zum Modul teilerfremden ganzen Zahlen bezeichnen. 3) Die Basisdarstellung (3) bzw. (4) ist von gr¨ oßter Bedeutung z.B. beim Beweis des Satzes 3.2.10 von Dirichlet u ¨ber Primzahlen in arithmetischen Progressionen, vgl. K. Prachar [20], S. 99ff.
Kapitel 3. Potenzreste, insbesondere quadratische Reste
In diesem Kapitel werden, wie schon im Vorwort zum letzten in Aussicht gestellt, die Untersuchungen u ¨ber Kongruenzen fortgef¨ uhrt. Wie erinnerlich wurde in § 4 von Kap. 2 eine Methode vorgestellt, die die Gewinnung s¨ amtlicher Wurzeln eines ganzzahligen Polynoms in einer Unbestimmten nach einem nat¨ urlichen Modul m auf die Ermittlung aller Wurzeln des Polynoms modulo aller in m aufgehenden Primzahlen reduziert. Jetzt sollen die spezielleren polynomialen Kongruenzen X n ≡ c (mod m) bei ganzem n ≥ 2 und zu m teilerfremdem, ganzem c genauer auf ihre L¨ osbarkeit untersucht werden. Dabei ist § 1 dem allgemeinen Fall gewidmet, w¨ ahrend der Spezialfall n = 2 einer sehr eingehenden Diskussion in § 2 unterzogen wird. Zentrales Ergebnis von § 2 ist das von Gauss gefundene quadratische Reziprozit¨atsgesetz mit seinen beiden Erg¨anzungss¨atzen, f¨ ur das Gauss selbst acht methodisch verschiedene Beweise geliefert hat. § 2 endet mit Anwendungen dieser S¨ atze auf die Fragen nach der Existenz unendlich vieler Primzahlen in gewissen arithmetischen Progressionen und nach der m¨oglichen Form von Primfaktoren von Fermat– bzw. Mersenne–Zahlen. Seit l¨ angerer Zeit spielen diejenigen Mersenne–Zahlen, die Primzahlen sind, in den aktuellen Primzahlrekordlisten eine f¨ uhrende Rolle. In § 3 schließlich wird noch die Problematik angeschnitten, wie sich bei ungerader Primzahl p die c ∈ {1, 2, . . . , p − 1} verteilen, f¨ ur die die Kongruenz X 2 ≡ c (mod p) l¨ osbar ist. Die Beantwortung dieser spezielleren Fragestellung wirft als Nebenergebnis ab, daß unter den Primzahlen p genau die p ≡ 3 (mod 4) als Summe zweier Quadratzahlen darstellbar sind. Dies leitet dann u ¨ber zu den anfangs von Kap. 4 zu besprechenden Problemen. § 1.
Indexrechnung und Potenzreste
1. Indizes. Sei m eine nat¨ urliche Zahl, so daß es nach dem Gaussschen Satz 2.5.5 eine Primitivwurzel a modulo m gibt. Wie in 2.5.6 festgestellt, gibt
122
3. Potenzreste, insbesondere quadratische Reste
es zu jedem ganzen c mit (c, m) = 1 genau ein i = i(c) ∈ {0, . . . , ϕ(m) − 1}, so daß ai ≡ c (mod m) gilt. Offenbar sind daher c ≡ c (mod m) und i(c) = i(c ) miteinander gleichwertig; i(c) ist also eine Invariante der ganzen, durch c repr¨ asentierten primem Restklasse modulo m, die selbstverst¨ andlich auch noch von der gew¨ ahlten Primitivwurzel a mod m abh¨ angt. Sind a, c wie hier beschrieben, so heißt i(c) der Index von c bez¨ uglich a, der als inda c notiert wird. In 2.5.1 wurde beispielsweise festgestellt, daß 3 und 5 die beiden Primitivwurzeln modulo 14 sind; nach diesem Modul sind 30 , 31 , . . . , 35 kongruent 1, 3, 9, 13, 11, 5 bzw. 50 , 51 , . . . , 55 kongruent 1, 5, 11, 13, 9, 3, jeweils in der angegebenen Reihenfolge. Man hat somit folgende kleine Tabelle c (mod 14)
1
3
5
9
11
13
ind3 c
0
1
5
2
4
3
ind5 c
0
5
1
4
2
3
Eine umfangreiche Indextabelle bez¨ uglich der zu den Primzahlpotenzen unterhalb 1000 geh¨ origen Primitivwurzeln findet sich bereits in dem in 2.5.3 erw¨ ahnten Canon Arithmeticus von Jacobi. Der Begriff des Index selbst wurde bei Primzahlmoduln von Gauss (Disquisitiones Arithmeticae, Art. 57ff.) eingef¨ uhrt. In der folgenden Proposition sind einige einfache Regeln f¨ ur das Rechnen mit Indizes zusammengestellt. Proposition. Gibt es modulo m ∈ N Primitivwurzeln, ist a (und auch a ˆ) eine solche und sind c1 , c2 , c ∈ Z zu m teilerfremd, so gilt modulo ϕ(m) (i) inda c1 c2 ≡ inda c1 + inda c2 , (ii) inda cn ≡ n inda c f¨ ur alle n ∈ N0 , (iii) inda 1 ≡ 0, inda a ≡ 1, (iv) indaˆ c ≡ (indaˆ a)(inda c), (v) (indaˆ a, ϕ(m)) = 1. Beweis. Ist n¨amlich ik := inda ck f¨ ur k = 1, 2, so bedeutet dies aik ≡ ck (mod m), i1 +i2 ind a c1 c2 also a ≡ c1 c2 ≡ a (mod m), woraus (i) folgt. Aus (i) ergibt sich induktiv bei (ck , m) = 1 f¨ ur k = 1, . . . , n inda
n k=1
ck ≡
n k=1
inda ck (mod ϕ(m))
§ 1.
Indexrechnung und Potenzreste
123
und (ii) folgt f¨ ur n ≥ 1 hieraus durch Spezialisierung. Die beiden Aussagen in (iii) sind klar; die erstere gibt (ii) auch f¨ ur n = 0. F¨ ur (iv) hat man zu beachten, daß a ˆindaˆ a ≡ a (mod m)
(1) gilt, was modulo m sofort zu
a ˆindaˆ c ≡ c ≡ ainda c ≡ a ˆ(indaˆ a)(inda c) f¨ uhrt; die Kongruenz der beiden Potenzen ganz außen gibt (iv). (indaˆ a, ϕ(m)), so folgt aus (1)
Ist d :=
1≡a ˆϕ(m)(indaˆ a)/d ≡ aϕ(m)/d (mod m); da a Primitivwurzel modulo m ist, muß d = 1 sein, und das ist (v). Bemerkungen. 1) Betrachtet man nochmals obiges Beispiel mit m = 14 und setzt a = 3, a ˆ = 5, so ist ind5 c ≡ 5 ind3 c ≡ −ind3 c (mod 6) f¨ ur (c, 14) = 1; dies zeigt gerade, wie die dritte Zeile der obigen Tabelle aus der zweiten hervorgeht. 2) Die Regeln der Proposition erinnern stark an die gel¨ aufigen Rechenregeln f¨ ur Logarithmen, z.B. (iv) an die Umrechnung von Logarithmen zu verschiedenen Basen. Weiter ist bei festen m und a die Abbildung inda der primen Restklassengruppe modulo m auf die additive Gruppe des Restklassenrings modulo ϕ(m) ein Isomorphismus; die Homomorphieeigenschaft von inda steht gerade in (i).
2. Ein Beispiel. Die in Proposition 1 zusammengestellten Regeln f¨ ur das Rechnen mit Indizes sollen nun benutzt werden, um an einem Beispiel zu zeigen, wie man damit gewisse Typen von polynomialen Kongruenzen behandeln kann. Sei etwa die Kongruenz (1)
9X 5 ≡ 11 (mod 14)
vorgelegt. Falls sie eine ganzzahlige L¨osung x besitzt, ist offenbar (x, 14) = 1. Weiter muß, wenn man etwa mit der Primitivwurzel 3 modulo 14 argumentiert, die Gleichung ind3 9x5 = ind3 11 gelten. Daraus folgt mittels (i), (ii) der Proposition ind3 9 + 5 ind3 x ≡ ind3 11 (mod 6); entnimmt man ind3 9, ind3 11 der Tabelle aus 1, so ist die letzte Kongruenz zu 5 ind3 x ≡ 2 (mod 6) ¨aquivalent, woraus ind3 x = 4 und x ≡ 11 (mod 14) folgt. Umgekehrt l¨ osen diese x die Kongruenz (1). Arbeitet man anstelle von 3 mit 5 als Primitivwurzel modulo 14, so ergibt sich dasselbe Endresultat, da sich alle Kongruenzen f¨ ur die Indizes bez¨ uglich 3
124
3. Potenzreste, insbesondere quadratische Reste
bzw. 5 nur um den zu ϕ(14) = 6 teilerfremden Faktor ind5 3 = 5 unterscheiden (vgl. (iv) und (v) der Proposition).
3. n–te Potenzreste, quadratische Reste und Nichtreste. Sind m, n ∈ N, c ∈ Z, so sollen im weiteren die speziellen polynomialen Kongruenzen (1)
X n ≡ c (mod m)
untersucht werden. Ist (c, m) = 1 und (1) l¨ osbar, so heißt c n–ter Potenzrest modulo m. Ist (c, m) = 1, so heißt c quadratischer Rest modulo m, falls (1) im Spezialfall n = 2 l¨ osbar ist; ist jedoch (1) unter denselben Bedingungen an c, m, n unl¨ osbar, so heißt c quadratischer Nichtrest modulo m. Die zu m nicht teilerfremden c werden hier nicht klassifiziert. Beispiel. Da 2(1) zu X 5 ≡ 9 (mod 14) ¨aquivalent ist, hat das Beispiel in 2 insbesondere gezeigt, daß 9 ein f¨ unfter Potenzrest modulo 14 ist.
4. Kriterium f¨ ur n–te Potenzreste. Der folgende Satz enth¨ alt ein einfaches Kriterium zur Entscheidung der L¨ osbarkeit von 3(1) im Falle solcher Moduln m, zu denen es Primitivwurzeln gibt. Satz. Seien m, n ∈ N, c ∈ Z, (c, m) = 1, d := (n, ϕ(m)) und modulo m gebe es eine Primitivwurzel. Dann sind folgende Aussagen ¨aquivalent: (i) c ist n–ter Potenzrest modulo m. (ii) Es ist cϕ(m)/d ≡ 1 (mod m). ur alle Primitivwurzeln a modulo m. (iii) d teilt inda c f¨ Trifft eine dieser Aussagen zu, so hat 3(1) genau d modulo m inkongruente L¨osungen. Beweis. (i) ⇒ (ii): Nach Voraussetzung gibt es ein 3(1) l¨osendes x ∈ Z und wegen (c, m) = 1 ist auch (x, m) = 1. Wegen n/d ∈ N hat man nach dem Fermat–Eulerschen Satz 2.3.4 cϕ(m)/d ≡ (xϕ(m) )n/d ≡ 1 (mod m). (ii) ⇒ (iii): Ist a irgendeine Primitivwurzel modulo m, so ergibt Proposition 1(ii), (iii) die Teilbarkeitsbeziehung ϕ(m)| ϕ(m) d inda c, also d|inda c. (iii) ⇒ (i): Sei a eine beliebige Primitivwurzel modulo m; nach Satz 2.1.5 ist die lineare Kongruenz nY ≡ inda c (mod ϕ(m)) l¨ osbar und besitzt genau d modulo
§ 1.
Indexrechnung und Potenzreste
125
ϕ(m) inkongruente L¨ osungen y1 , . . . , yd ∈ {0, . . . , ϕ(m) − 1}. Setzt man nun ullen xδ := ayδ , so sind die x1 , . . . , xd modulo m inkongruent und erf¨ xnδ = anyδ ≡ ainda c ≡ c (mod m). Somit hat 3(1) mindestens die modulo m inkongruenten L¨ osungen x1 , . . . , xd und (i) gilt. Erf¨ ullt umgekehrt ein ganzzahliges x die Kongruenz 3(1), so gilt nach Proposition 1(ii) n inda x ≡ inda c (mod ϕ(m)). ¨ Nach den vorherigen Uberlegungen muß dann aber inda x gleich einem der yδ sein, also x kongruent dem entsprechenden xδ modulo m. ¨ Bemerkung. F¨ ur Primzahlen m war die Aquivalenz von (i) und (ii) bereits Euler bekannt.
5. Folgerungen aus dem Kriterium. Aus Satz 4 werden in diesem und dem n¨ achsten Abschnitt einige interessante und wichtige Konsequenzen abgeleitet. Korollar A. Seien m, n ∈ N so gew¨ahlt, daß es modulo m Primitivwurzeln gibt und daß (n, ϕ(m)) = 1 gilt. Bilden dann x1 , . . . , xϕ(m) ein primes Restsystem modulo m, so gilt dies auch f¨ ur xn1 , . . . , xnϕ(m) . Beweis. Zun¨ achst sind alle xnj zu m teilerfremd, da dies f¨ ur die xj zutrifft. Wegen (n, ϕ(m)) = 1 und dem Fermat–Eulerschen Satz ist Bedingung (ii) von Satz 4 f¨ ur jedes zu m teilerfremde ganze c erf¨ ullt und daher ist 3(1) f¨ ur jedes dieser c modulo m eindeutig l¨ osbar, woraus die Behauptung folgt. ¨ Eine unmittelbare Konsequenz aus der Aquivalenz (i) ⇔ (iii) des Satzes 4 ist folgendes Korollar B. Gen¨ ugen m, n, c, d den Bedingungen von Satz 4, so gilt: c ist n–ter Potenzrest modulo m genau dann, wenn c bei beliebig gew¨ ahlter Primitivwurzel a modulo m einer der durch ajd , j = 1, . . . , ϕ(m)/d, bestimmten primen Restklassen modulo m angeh¨ort. Korollar C. Modulo einer ungeraden Primzahl p gibt es 12 (p − 1) quadratische Reste und ebensoviele quadratische Nichtreste.
126
3. Potenzreste, insbesondere quadratische Reste
Beweis. Sei c ganz und nicht durch p teilbar. Nach Korollar B ist c quadratischer Rest modulo p genau dann, wenn c modulo p kongruent einer der Zahlen a2 , a4 , . . . , ap−1 ist, a eine beliebig gew¨ahlte Primitivwurzel modulo p. Demnach ist c quadratischer Nichtrest modulo p genau f¨ ur c ≡ a, a3 , . . . , ap−2 (mod p). Bemerkung. Ist m wieder gleich einer ungeraden Primzahl p und ist n = 2, so hat man d = 2 in Satz 4 und f¨ ur c ≡ −1 (mod p) lautet die Kongruenz in (ii) jenes Satzes (−1)(p−1)/2 ≡ 1 (mod p), was mit p ≡ 1 (mod 4) a¨quivalent ist. Genau f¨ ur diese ungeraden p ist also die quadratische Kongruenz X 2 ≡ −1 (mod p) l¨ osbar. Damit hat man einen weiteren Beweis f¨ ur den wesentlichen Teil von Satz 2.3.9.
6. n-te Potenzreste, Modulzerlegung in Primzahlpotenzen. Wenn man s¨amtliche modulo m inkongruenten L¨ osungen von (1)
X n ≡ c (mod m)
explizit ermitteln will, so kann man dazu selbstverst¨ andlich das in den S¨ atzen 2.4.2 und 2.4.4 beschriebene Reduktionsverfahren auf das spezielle Polynom f = X n − c anwenden. Will man jedoch nur entscheiden, ob ein zu m teilerfremdes c ein n–ter Potenzrest ist oder nicht, so kann man daf¨ ur notwendige und hinreichende Bedingungen folgendem Satz entnehmen. κ Satz. Sind m, n ∈ N, c ∈ Z, (c, m) = 1 und ist 2α0 kκ=1 pα κ mit α0 ∈ N0 , α1 , . . . , αk ∈ N die kanonische Zerlegung von m, so ist das Bestehen folgender Kongruenzen notwendig und hinreichend daf¨ ur, daß c ein n–ter Potenzrest modulo m ist: (2)
cϕ(qκ )/(n,ϕ(qκ )) ≡ 1 (mod qκ )
κ f¨ ur κ = 0, . . . , k, falls α0 ≤ 2; dabei ist qκ := pα κ , p0 := 2. Ist jedoch α0 > 2, so ist (2) nur f¨ ur κ = 1, . . . , k zu fordern, daf¨ ur m¨ ussen aber zus¨ atzlich die beiden Kongruenzen
(3)
nI ≡ i (mod 2),
nJ ≡ j (mod 2α0 −2 )
l¨ osbar sein, wobei i bzw. j modulo 2 bzw. 2α0 −2 eindeutig bestimmt sind derart, daß bei festem u ≡ ±3 (mod 8) gilt (4)
c ≡ (−1)i uj (mod 2α0 ).
§ 2.
Quadratische Reste
127
Beweis. Offenbar ist c ein n–ter Potenzrest modulo m genau dann, wenn c ein n–ter Potenzrest modulo qκ f¨ ur κ = 0, . . . , k ist. Wegen (c, qκ ) = 1 und weil es Primitivwurzeln modulo qκ gibt, ist die letzte Bedingung nach Satz 4(ii) aquivalent mit (2) und zwar f¨ ¨ ur κ = 1, . . . , k stets, f¨ ur κ = 0 nur dann, wenn α0 ≤ 2, vgl. den Gaussschen Satz 2.5.5 u ¨ber die Existenz von Primitivwurzeln. utzen, um zu entscheiden, Ist aber α0 > 2, so kann man sich auf Korollar 2.5.6 st¨ ob das (nun sicher ungerade) c ein n–ter Potenzrest modulo 2α0 ist: Ist u wie im Satz vorgegeben, bestimmt man i, j gem¨aß (4) nach dem Korollar 2.5.6 und gen¨ ugt ein ganzes x der Kongruenz xn ≡ c (mod 2α0 ), so ist x ungerade und analog zu (4) darstellbar in der Form (5)
x ≡ (−1)I uJ
(mod 2α0 )
mit modulo 2 bzw. 2α0 −2 eindeutig bestimmten I, J. Daher m¨ ussen die beiden Kongruenzen (3) gelten. Sind umgekehrt die Kongruenzen (3) f¨ ur I, J l¨ osbar und definiert man x durch (5), so ist xn ≡ c (mod 2α0 ). Nach den letzten Feststellungen im Beweis ist ein ungerades c genau dann n–ter Potenzrest modulo 2α0 mit α0 > 2, wenn (3) f¨ ur I, J l¨ osbar ist. Daraus folgt die erste Aussage im nachstehenden Korollar. Seien n, α0 ∈ N, α0 > 2 und c ∈ Z ungerade. Ist n ungerade, so ist c ein n–ter Potenzrest modulo 2α0 . Sei jetzt n gerade. Ist c ≡ 1 (mod 8), so ist es nicht n–ter Potenzrest modulo 2α0 ; ist c ≡ 1 (mod 8), so ist es n–ter Potenzrest modulo 2α0 genau dann, wenn (n, 2α0−2 )|j f¨ ur j wie im Satz gilt. Beweis. Bei geradem n ist xn ≡ 1 (mod 8) f¨ ur jedes ungerade ganze x, weshalb bei c ≡ 1 (mod 8) sicher xn ≡ c modulo 8, erst recht also modulo 2α0 , f¨ ur alle genannten x gilt. Ist c ≡ 1 (mod 8), so sind in (4) beide i, j gerade und daher ist in (3) die erste Kongruenz (f¨ ur I) l¨ osbar; die zweite (f¨ ur J) ist l¨ osbar genau f¨ ur (n, 2α0−2 )|j. Bemerkung. Wegen (2, 2α0 −2 )|j kann aus der letzten Feststellung gefolgert werden: Eine ungerade ganze Zahl c ist quadratischer Rest bzw. Nichtrest modulo 2α0 , α0 > 2, je nachdem, ob c ≡ 1 bzw. ≡ 1 (mod 8) gilt.
§ 2.
Quadratische Reste
1. Quadratische Kongruenzen und quadratische Reste. W¨ ahrend im vorigen Paragraphen allgemein n–te Potenzreste behandelt wurden, wird in diesem der Spezialfall n = 2 genauer diskutiert. Es ist plausibel, daß in diesem
128
3. Potenzreste, insbesondere quadratische Reste
Fall der quadratischen Reste die Theorie weiter entwickelt ist als im allgemeinen Fall. Zun¨ achst jedoch soll in diesem ersten Abschnitt der Zusammenhang zwischen der Frage nach der Existenz von Wurzeln quadratischer Polynome nach Moduln und zwischen quadratischen Resten gekl¨ art werden. Sei dazu m ∈ N und f ∈ Z[Z], ∂(f ) = 2, etwa f (Z) = rZ 2 + sZ + t, wobei man o.B.d.A. r ∈ N voraussetzen darf. Quadratische Erg¨ anzung zeigt, daß osbar ist, wenn f (Z) ≡ 0 (mod m ) genau dann l¨ (2rZ + s)2 ≡ s2 − 4rt (mod 4rm ) l¨ osbar ist. Setzt man noch c := s2 − 4rt, m := 4rm , so hat man folgende Proposition A. L¨ost y ∈ Z die Kongruenz (1)
Y 2 ≡ c
(mod m )
und ist y ≡ s (mod 2r), so ist z := y−s 2r ganz und Wurzel von f modulo m . Ist umgekehrt ein ganzes z Wurzel von f modulo m , so l¨ ost y := 2rz + s die Kongruenz (1) und es ist y ≡ s (mod 2r).
In dem hier pr¨ azisierten Sinne ist die Frage nach der Existenz von Wurzeln von f modulo m ¨aquivalent mit der Frage nach der L¨ osbarkeit der speziellen quadratischen Kongruenz (1). Diese letzte Kongruenz ist vom Typ 1.6(1) mit n = 2; allerdings werden im allgemeinen c und m nicht teilerfremd sein. Wie man die Frage nach der L¨ osbarkeit von (1) dennoch auf den teilerfremden Fall reduzieren kann, soll nun besprochen werden. ist es bequem, noch Dazu folgende Definition zu vereinbaren: Ist d ∈ N, d = pνp (d) , so heißt p der p νp (d) ungerade
p
quadratfreie Kern von d. Beispielsweise ist 3 · 7 derquadratfreie Kern von 28 · 311 · 56 · 7. (Vorsicht! Manche Autoren nennen p den quadratfreien p νp (d)>0
Kern von d.) Proposition B. Sind c , m wie in Proposition A, ist b der quadratfreie Kern von d := (c , m ) und setzt man e := c /d, m := m /d, so gilt: Die Kongruenz (1) ist l¨ osbar genau dann, wenn (b, m) = 1 gilt und be quadratischer Rest modulo m ist. Beweis. Ist n¨amlich (1) l¨ osbar und y ∈ Z eine solche L¨osung, so gilt d|y 2 ; wegen der Definition von b ist d = a2 b bei geeignetem a ∈ N, also a|y. Setzt man
§ 2.
Quadratische Reste
129
x := y/a, so ist x2 ≡ be (mod bm) und also auch x2 ≡ be (mod m). Dabei ist (b, m) = 1, somit ebenfalls (be, m) = 1. Denn w¨ are p eine b und m teilende Primzahl, so w¨ are p|x und also wegen x2 ≡ be (mod bm) auch p2 |be; wegen p |e w¨are dann aber b durch p2 teilbar und somit nicht quadratfrei. Ist umgekehrt be quadratischer Rest modulo m und gilt (b, m) = 1, so gibt es ein ganzes x mit x2 ≡ be (mod m) und dazu auch ein ganzes y mit by ≡ x (mod m). Damit hat man by 2 ≡ e (mod m) und also (aby)2 ≡ de (mod dm), d.h. die Kongruenz (1) ist l¨ osbar.
2. Kriterium f¨ ur quadratische Reste. Die Frage, wann bei ganzen, zueinander teilerfremden m > 0 und c die Kongruenz (1)
X 2 ≡ c (mod m)
l¨ osbar ist oder nicht, wann also c quadratischer Rest oder Nichtrest modulo m ist, wird nun weiter untersucht. κ Satz. Seien m ∈ N, c ∈ Z, (c, m) = 1 und sei 2α0 kκ=1 pα κ wie in Satz 1.6 die kanonische Zerlegung von m. Es ist (1) l¨ osbar genau dann, wenn c quadratischer ur κ = 1, . . . , k ist und gilt Rest modulo pκ f¨ (2)
c≡1
mod 2Min(α0 ,3) .
ur Beweis. Es werde (1) von x ∈ Z gel¨ ost. Daher gilt x2 ≡ c (mod pκ ) f¨ κ = 1, . . . , k und im Falle α0 ≥ 1 ist c wegen (c, m) = 1 ungerade; dann ist wegen (1) auch x ungerade, also x2 ≡ 1 (mod 8) und man hat (2). F¨ ur die Umkehrung beachtet man folgendes: Ist α0 ≥ 3, so hat man c ≡ 1 (mod 8) nach (2); nach der Bemerkung am Ende von 1.6 ist c quadratischer Rest modulo 2α0 . Ist jedoch α0 gleich 0, 1 oder 2, so gilt c ≡ 1 (mod 2α0 ) nach (2) und so ist c auch hier quadratischer Rest modulo 2α0 . Da weiter c quadratischer Rest modulo pκ f¨ ur κ = 1, . . . , k ist, liefert die Implikation (i) ⇒ (ii) von Satz 1.4 die Kongruenzen c(pκ −1)/2 ≡ 1 (mod pκ ), was induktiv leicht ακ −1 κ zu c(pκ −1)pκ /2 ≡ 1 (mod pα uhrt. (Dies ist u ¨brigens wieder (2) in Satz κ ) f¨ 1.6.) Die Implikation (ii) ⇒(i) von Satz 1.4 zeigt nun, daß c quadratischer Rest κ modulo pα ur κ = 0, 1, . . . , k (p0 := 2) und man hat κ ist, insgesamt jetzt sogar f¨ die L¨ osbarkeit von (1). (Stillschweigend wurde hier der Gausssche Satz 2.5.5 ber¨ ucksichtigt: Modulo pκ , p2κ , . . . gibt es Primitivwurzeln, wenn κ = 1, . . . , k.)
130
3. Potenzreste, insbesondere quadratische Reste
Bemerkungen. 1) Die zuletzt bewiesene Tatsache, daß f¨ ur ungerade, c nicht teilende Primzahlen p aus der L¨ osbarkeit von X 2 ≡ c (mod p) diejenige von X 2 ≡ c (mod pα ) f¨ ur alle α ∈ N folgt, kann auch mit Satz 2.4.4 anstatt unter R¨ uckgriff auf Satz 1.4 eingesehen werden: Wendet man (ii) des erstgenannten Satzes n¨amlich mit f (X) := X 2 − c, a = 2 und einer Wurzel y1 von f modulo p an, so ist p |f (y1 ) = 2y1 und also hat f modulo p2 eine Wurzel y2 mit p |y2 . Induktiv stellt man fest, daß f modulo pα eine Wurzel yα mit p |yα hat, was wieder genau besagt, daß c quadratischer Rest modulo pα ist. 2) In den ersten Abschnitten dieses Paragraphen zeigte sich insbesondere, wie die L¨ osbarkeit quadratischer Kongruenzen zusammenh¨ angt mit der Frage, ob eine ganze Zahl quadratischer Rest oder Nichtrest modulo einer ungeraden Primzahl ist. In 6 (vgl. auch die Anwendungen in 8 bis 12) werden u ¨beraus wirkungsvolle Hilfsmittel zur Entscheidung dieser Frage vorgestellt; die Ausf¨ uhrungen in 3 bis 5 haben mehr vorbereitenden Charakter.
3. Das Legendre–Symbol. Ist c ganz, aber nicht durch die ungerade Primzahl p teilbar, so setzt man nach dem Vorgang von Legendre (Essai sur la Th´eorie des Nombres, 1798) c := p
1, −1,
falls c quadratischer Rest modulo p , falls c quadratischer Nichtrest modulo p .
Dieses ( pc ) heißt Legendre–Symbol; man liest es als c nach p. Eine erste Zusammenstellung wichtiger Eigenschaften des Legendre–Symbols findet sich im folgenden Satz.
F¨ ur c, c ∈ Z und Primzahlen p mit p |2cc gilt:
(i)
c ≡ c (mod p) ⇒ ( pc ) = ( cp ),
(ii)
( ccp ) = ( pc )( cp ),
(iii)
( pc ) = (−1)inda c f¨ ur alle Primitivwurzeln a modulo p,
(iv)
p−1 c=1
( pc ) = 0.
Beweis. (i): Nach Voraussetzung sind hier ja c, c gleichzeitig quadratischer Rest oder Nichtrest modulo p und so folgt die Behauptung direkt aus der Definition des Legendre–Symbols.
§ 2.
Quadratische Reste
131
(iii): Nach (i) ⇔ (iii) von Satz 1.4 ist ( pc ) = 1 genau dann, wenn inda c gerade ist (f¨ ur alle Primitivwurzeln a modulo p). (ii) ist nun wegen Proposition 1.1(i) und dem soeben gezeigten (iii) einsichtig, man beachte die Geradheit von ϕ(p) = p − 1. (iv) ist die Kurzfassung von Korollar 1.5C. Bemerkungen. 1) Regel (ii) wird bisweilen in der folgenden l¨ assigen Form zitiert: Rest mal Rest und Nichtrest mal Nichtrest ergibt Rest; Nichtrest mal Rest ergibt Nichtrest. Generell bringt die Einf¨ uhrung des Legendre–Symbols offenbar den Vorteil, daß man mit dem quadratischen Restverhalten ganzer Zahlen modulo ungerader Primzahlen richtiggehend rechnen kann. In diesem Zusammenhang sei darauf hingewiesen, daß noch Gauss in seinen Disquisitiones Arithmeticae cRp bzw. cN p notierte, wenn c quadratischer Rest bzw. Nichtrest modulo p ist. 2) Manchmal ist es zweckm¨aßig, das Legendre–Symbol ( pc ) unter der alleinigen Voraussetzung zu definieren, daß p eine ungerade Primzahl ist: F¨ ur p |c geschieht dies dann genau wie oben, w¨ ahrend man f¨ ur p|c zus¨atzlich ( pc ) := 0 festsetzt. Man pr¨ uft unmittelbar nach, daß (i) und (ii) des Satzes bei dieser erweiterten Definition g¨ ultig bleiben; dies trifft auch f¨ ur (iv) zu, wo jetzt die Summation u ¨ber c wahlweise von 0 bzw. von 1 bis p − 1 erstreckt ist.
4. Eulers Kriterium. Hier wird eine notwendige und hinreichende Bedingung daf¨ ur angegeben, daß eine ganze nicht durch die ungerade Primzahl p teilbare Zahl c quadratischer Rest modulo p ist. Dies Kriterium wurde von Euler (Opera Omnia Ser. 1, II, 493–518) mit Beweis um 1760 herum publiziert, nachdem er es schon gut zehn Jahre fr¨ uher angek¨ undigt hatte (Opera Omnia Ser. 1, II, 62–85). Satz. F¨ ur ganze c und ungerade Primzahlen p mit p |c gilt c(p−1)/2 ≡ ( pc ) (mod p). Beweis. Bei ( pc ) = 1 folgt aus (i) ⇒ (ii) von Satz 1.4 die Kongruenz c(p−1)/2 ≡ 1 (mod p), insgesamt also die behauptete Kongruenz. Ist ( pc ) = −1, so liefert (ii) ⇒ (i) des zitierten Satzes c(p−1)/2 ≡ 1 (mod p); da jedoch nach dem Fermat– Eulerschen Satz 2.3.4 gilt p|(cp−1 − 1) = (c(p−1)/2 + 1)(c(p−1)/2 − 1) , muß die Kongruenz c(p−1)/2 ≡ −1 (mod p) bestehen. Somit gilt die behauptete Kongruenz auch in diesem Fall.
132
3. Potenzreste, insbesondere quadratische Reste
In Art. 106 seiner Disquisitiones Arithmeticae stellt Gauss seinem eigenen Beweis des Eulerschen Kriteriums die Bemerkung voran, daß es “in praxi nullum fere usum habeat”, aber dennoch “propter simplicitatem atque generalitatem memoratu dignum est”. Warum es praktisch fast keinen Nutzen habe, erl¨autert er ein paar Zeilen sp¨ater: “ . . . quoties numeri examinandi mediocriter sunt magni, hoc criterium ob calculi immensitatem prorsus inutile erit.” Mittels dieses vor allem f¨ ur theoretische Zwecke geeigneten Kriteriums soll hier ein weiterer Beweis f¨ ur Satz 3(ii) gegeben werden: Sind n¨ amlich die dortigen Voraussetzungen erf¨ ullt, so ist nach Eulers Kriterium die Differenz ( ccp ) − ( pc )( cp ) eine durch p teilbare ganze Zahl; nach Definition des Legendre–Symbols ist diese Differenz aber gleich −2, 0 oder 2, woraus die Behauptung schon folgt. Bemerkung. Erweitert man die Definition des Legendre–Symbols wie in Bemerkung 2 zu 3 angegeben, so ist das Euler–Kriterium f¨ ur alle ganzen c g¨ ultig, wenn nur p eine ungerade Primzahl ist.
5. Gauss’sches Lemma. In diesem Abschnitt wird ein weiteres notwendiges und hinreichendes Kriterium f¨ ur quadratisches Restverhalten modulo ungerader Primzahlen vorgestellt, welches auf Gauss (Werke II, S. 4ff.) zur¨ uckgeht. Dies Kriterium wird dann in 7 zum Beweis des in 6 zu formulierenden zentralen Ergebnisses dieses Paragraphen benutzt. Folgende Bezeichnungsweise ist bei festem m ∈ N zweckm¨aßig: Jedem ganzen ∗ c werde dasjenige r aus dem absolut kleinsten Restsystem Sm modulo m (vgl. Ende von 2.1.4) zugeordnet, f¨ ur das r ≡ c (mod m) gilt; f¨ ur r werde ausf¨ uhrlicher rm (c) geschrieben. Dann hat man folgendes Gauss’sche Lemma. Ist c ganz, p eine ungerade, nicht in c aufgehende Primzahl und μp (c) := #{j ∈ N : j ≤ 12 (p − 1), rp (jc) < 0}, so gilt c = (−1)μp (c) . p Beweis. Gilt n¨ amlich |rp (jc)| = |rp (j c)| f¨ ur j, j ∈ {1, . . . , 12 (p − 1)}, so ist rp (jc) = rp (j c) oder rp (jc) = −rp (j c), also p|(j − j )c oder p|(j + j )c. Wegen 0 < j + j < p und p |c ist hier die zweite Alternative unm¨ oglich und man hat p|(j − j ), d.h. j = j . Mit R¨ ucksicht auf p |jc f¨ ur alle zugelassenen j sind s¨ amtliche |rp (jc)| aus {1, . . . , 12 (p − 1)} und so stimmen diese 12 (p − 1)
§ 2.
Quadratische Reste
133
Zahlen in irgendeiner Reihenfolge mit den Zahlen 1, . . . , 12 (p−1) u ¨berein. Wegen ur rp (jc) < 0 hat man, jeweils modulo p rp (jc) = −|rp (jc)| genau f¨ p − 1 (p−1)/2 ≡ !c 2
(p−1)/2
(p−1)/2
jc ≡ (−1)μp (c)
j=1
|rp (jc)| = (−1)μp (c)
j=1
p − 1 !, 2
uhrt dann zu ( pc ) ≡ (−1)μp (c) also c(p−1)/2 ≡ (−1)μp (c) . Das Euler–Kriterium 4 f¨ (mod p) und damit zur behaupteten Gleichung, da in der letzten Kongruenz beide Seiten nur der Werte 1 und −1 f¨ ahig sind. Bemerkung. Kombiniert man das Gausssche Lemma mit Satz 3(iii), so kann man bei p |2c sagen: F¨ ur alle Primitivwurzeln a modulo p sind inda c ≡ μp (c) at. (mod 2), d.h. inda c und μp (c) haben dieselbe Parit¨
6. Quadratisches Reziprozit¨ atsgesetz, Erg¨ anzungss¨ atze. Sind c und p wie zuletzt im Gaussschen Lemma vorausgesetzt, so soll nun das Legendre– Symbol ( pc ) berechnet werden; diese Aufgabe wird mit Hilfe der Ergebnisse der letzten drei Abschnitte entscheidend weiter reduziert. Ist n¨ amlich c ∈ N und (1)
2β0
qλβλ
λ=1
seine kanonische Zerlegung mit β0 ∈ N0 , β1 , . . . , β ∈ N und paarweise verschiedenen ungeraden Primzahlen q1 , . . . , q (alle = p), so gilt aufgrund der eventuell mehrfach angewandten Multiplikativit¨ atseigenschaft aus Satz 3(ii) (2)
qλ βλ c ( )= p p λ=0
mit q0 := 2. Ist aber −c ∈ N und (1) seine kanonische Zerlegung, so ist ( −c p ) = −1 c −1 2 ( p )( p ) gleich der rechten Seite von (2) und somit wegen ( p ) = 1 c −1 qλ βλ = . p p p λ=0
Daher reicht es, f¨ ur ungerade Primzahlen p die speziellen Legendre–Symbole q 2 ( −1 ), ( ) sowie ( ur ungerade, von p verschiedene Primzahlen q zu berechnen. p p p ) f¨ Den Wert der ersten beiden Symbole entnimmt man dem
134
3. Potenzreste, insbesondere quadratische Reste
1. bzw. 2. Erg¨ anzungssatz zum quadratischen Reziprozit¨ atsgesetz. F¨ ur ungerade Primzahlen p ist −1 = (−1)(p−1)/2 p
bzw.
2 2 = (−1)(p −1)/8 . p
Also ist −1 quadratischer Rest modulo p genau f¨ ur p ≡ 1 (mod 4); 2 ist quadratischer Rest modulo p genau f¨ ur p ≡ 1 oder 7 (mod 8). (p−1)/2 Beweis. Nach Eulers Kriterium 4 ist die Differenz ( −1 durch p ) − (−1) p teilbar; andererseits ist sie gleich −2, 0 oder 2 und dies gibt schon den ersten Erg¨anzungssatz. Wegen μp (−1) = 12 (p − 1) folgt dieser u ¨brigens auch sofort aus dem Gaussschen Lemma 5, welches sogleich erneut f¨ ur den zweiten Erg¨ anzungssatz angewandt wird.
Genau f¨ ur diejenigen j ∈ {1, . . . , 12 (p−1)} mit j < 14 p ist 0 < rp (2j) < 12 p, somit hat man − 12 p < rp (2j) < 0 genau f¨ ur die j mit 14 p < j ≤ 12 (p − 1), deren Anzahl das gesuchte μp (2) ist. Man best¨atigt leicht 1 (p − 1) f¨ ur p ≡ 1, 5 (mod 8), μp (2) = 41 (p + 1) f¨ ur p ≡ 3, 7 (mod 8), 4 weshalb μp (2) genau dann gerade ist, wenn p ≡ ±1 (mod 8) gilt. Dieselbe Eigenschaft hat offenbar 18 (p2 − 1) und damit liefert das Gausssche Lemma den zweiten Erg¨anzungssatz. Bemerkung. Der erste Erg¨ anzungssatz sagt u ¨ber ungerade Primzahlen p: Die Kongruenz X 2 ≡ −1 (mod p) ist genau f¨ ur p ≡ 1 (mod 4) l¨ osbar. Dies ist erneut der wesentliche Teil von Satz 2.3.9. Wie bereits weiter oben bemerkt, bleibt ( pq ) noch f¨ ur voneinander verschiedene ungerade Primzahlen p, q zu berechnen. Man kann nun aber nicht analog zu 2 ( −1 ur ( pq ) angeben, sondern lediglich p ) oder ( p ) einen geschlossenen Ausdruck f¨ p q f¨ ur das Produkt ( q )( p ). Dies geschieht in dem von Gauss 1796 entdeckten sogenannten Quadratischen Reziprozit¨ atsgesetz. rade Primzahlen p, q gilt
F¨ ur voneinander verschiedene unge-
p q = (−1)(p−1)(q−1)/4 . q p Ist also p oder q kongruent 1 modulo 4, so gilt ( pq ) = ( pq ); sind p und q beide kongruent 3 modulo 4, so hat man ( pq ) = −( pq ).
§ 2.
135
Quadratische Reste
Wie man dennoch ( pq ) mit Hilfe dieses Satzes ermitteln kann, wird in 8 anhand eines Beispiels erl¨autert.
7. Beweis des Reziprozit¨ atsgesetzes. Nach dem Gaussschen Lemma 5 ist das quadratische Reziprozit¨atsgesetz gleichwertig mit der Aussage (1)
2 |(μp (q) + μq (p)) ⇔ p ≡ q ≡ 3 (mod 4) ,
die hier gezeigt werden soll. Dazu sei definiert Ω := {(x, y) ∈ IR2+ : x <
p+1 q+1 2qx + p 2py + q , y< , y< , x< }; 2 2 2p 2q
Ω ist das Innere des (nachstehend im Fall p = 11, q = 7 skizzierten, schraffierten) Sechsecks ABCDEF .
q+1 uft man leicht Ist (x, y) ∈ Ω und setzt man x := p+1 2 − x, y := 2 − y, so pr¨ nach, daß auch (x , y ) ∈ Ω gilt: Aus (x, y) ∈ Ω folgt ja z.B.
2py + q p + 1 p 1 p + 1 p qx = − y− > − · = x . 2q 2 q 2 2 q p Weiter ist (x , y ) = (x, y) genau dann, wenn x = q+1 keit von ( p+1 4 , 4 ) ∈ Ω ist sofort einzusehen.
p+1 4 ,
y=
q+1 4
gilt; die Richtig-
136
3. Potenzreste, insbesondere quadratische Reste
Nennt man ganz allgemein (x, y) ∈ IR2 einen Gitterpunkt genau dann, wenn sogar (x, y) ∈ Z2 gilt, so werden nun die in Ω gelegenen Gitterpunkte abgez¨ahlt: q+1 ( p+1 4 , 4 ) ist Gitterpunkt genau dann, wenn die beiden Kongruenzen rechts q+1 in (1) gelten. Ist (x, y) ein in Ω gelegener, von ( p+1 4 , 4 ) verschiedener Git terpunkt, so hat (x , y ) dieselbe Eigenschaft; außerdem ist (x , y ) von (x, y) verschieden. Indem man nun die Gitterpunkte in Ω in naheliegender Weise zu Paaren zusammenfaßt, ist klar: #Ω ∩ Z2 ungerade
⇔ p ≡ q ≡ 3 (mod 4).
Wenn nun noch (2)
#Ω ∩ Z2 = μp (q) + μq (p)
gezeigt ist, ist (1) und somit das Reziprozit¨ atsgesetz bewiesen. Kein Gitterpunkt (x, y) ∈ Ω kann der Bedingung py = qx gen¨ ugen, d.h. auf der Geraden durch A := (0, 0) und G := ( 12 p, 12 q) liegen. Denn p|qx w¨ urde p|x implizieren; f¨ ur die nat¨ urliche Zahl x m¨ ußte also p ≤ x < 12 (p + 1) gelten, was unm¨ oglich ist. Nun wird die Anzahl der oberhalb der Geraden durch A und G gelegenen Gitterpunkte von Ω bestimmt. Es ist (x, y) genau dann ein solcher, wenn gilt: 1 x ∈ {1, . . . , (p − 1)}, 2
y ∈ Z,
qx 2qx + p
dabei ist die letzte Doppelungleichung mit − 12 p < qx − py < 0 ¨ aquivalent. In der vor dem Gaussschen Lemma 5 eingef¨ uhrten Terminologie bedeutet dies aber − 12 p < rp (qx) < 0. So ist die Anzahl der oberhalb der Geraden durch A und G gelegenen Gitterpunkte von Ω gleich der Anzahl aller x ∈ {1, . . . , 12 (p − 1)} mit rp (qx) < 0, also gleich μp (q). Analog ist die Anzahl der unterhalb dieser Geraden gelegenen Gitterpunkte von Ω gleich μq (p), womit (2) insgesamt bewiesen ist. Bemerkung. Der hier gegebene geometrische Beweis des quadratischen Reziprozit¨atsgesetzes geht zur¨ uck auf G. Eisenstein (Mathematische Werke I, 164– 166), selbst Sch¨ uler von Gauss. Weitere historische Bemerkungen zum Reziprozit¨ atsgesetz folgen in 13.
8. Ein numerisches Beispiel. Gauss beschließt Art. 146 seiner Disquisitiones Arithmeticae mit der L¨ osung folgender Aufgabe: “Quaeritur relatio
§ 2.
Quadratische Reste
137
numeri +453 ad 1236.” Er m¨ ochte also die Frage behandeln, ob die Kongruenz Y 2 ≡ 453 (mod 1236) l¨ osbar ist. Hier ist (453, 1236) = 3 und man sieht leicht, daß die vorgelegte Kongruenz mit folgender neuen a¨quivalent ist: 3X 2 ≡ 151 (mod 412). Wegen 2 · 412 = 3 · 275 − 1 ist 275 modulo 412 zu 3 invers und so ist die letzte Kongruenz weiterhin gleichwertig mit (1)
X 2 ≡ −87 (mod 412).
Diese Kongruenz ist von der Form 2(1) mit c = −87, m = 412 = 22 · 103, die zueinander teilerfremd sind. Nach Satz 2 ist (1) genau dann l¨ osbar, wenn −87 quadratischer Rest modulo 103 ist; −87 ≡ 1 (mod 4) ist ja erf¨ ullt. Man hat also noch das Legendre–Symbol ( −87 103 ) zu berechnen. −1 3 29 29 Nach Satz 3(ii) ist ( −87 ) = ( 103 )( 103 )( 103 ) = (−1)(−1)( 103 ), wenn man f¨ ur 103 3 103 1 ( 103 ) = −( 3 ) = −( 3 ) = −1 das Reziprozit¨ atsgesetz und Satz 3(i) investiert −1 und f¨ ur ( 103 ) = −1 den ersten Erg¨anzungssatz. Erneut nach dem Rezipro29 3·29+16 2 4 ) = ( 103 ) = ( 16 zit¨atsgesetz ist ( 103 29 ) = ( 29 29 ) = ( 29 ) = 1, wo nochmals Satz −87 3(i), (ii) zum Zuge kamen. Damit ist ( 103 ) zu 1 festgestellt, weshalb (1) und damit auch die Ausgangskongruenz l¨ osbar ist.
Offenbar wird (1) von einem x ∈ Z genau dann gel¨ ost, wenn dieses ungerade ist und x2 ≡ −87 (mod 103) gen¨ ugt, was offenbar mit x2 ≡ 16 (mod 103) oder eben x ≡ ±4 (mod 103) ¨aquivalent ist. Modulo 412 hat somit (1) genau die vier L¨ osungen ±99, ±107; dies f¨ uhrt modulo 1236 zu den s¨ amtlichen L¨ osungen ±297, ±321 von Y 2 ≡ 453. Tats¨achlich beschließt Gauss a.a.O. seine Ausf¨ uhrungen “... est autem revera 453 ≡ 2972 (mod 1236).” Bemerkung. Hier sollte insbesondere gezeigt werden, wie man ( pc ) unter Verwendung von Reziprozit¨ atsgesetz, Erg¨anzungss¨atzen und den Regeln in Satz 3(i), (ii) stets berechnen kann. Manchmal k¨ urzt eine umsichtige Beobachtung der spe103−87 ziellen Situation das Ganze erheblich ab. So ist z.B. oben ( −87 103 ) = ( 103 ) = 16 2 4 ( 103 ) = ( 103 ) = 1 und man kommt hier g¨ anzlich ohne Reziprozit¨ atsgesetz und 2 Erg¨ anzungss¨atze aus; ( 103 ) tritt ja nur in gerader Potenz auf.
9. Quadratische Nichtreste modulo Primzahlen. Ein erster Beitrag zu der in § 3 anzuschneidenden Frage nach der Verteilung quadratischer Reste und Nichtreste ist enthalten in Proposition A. Zu jeder Primzahl p > 3 mit p ≡ 3 (mod 4) gibt es eine √ nat¨ urliche Zahl unterhalb 2 p + 1, die quadratischer Nichtrest modulo p ist. Dies ist eine unmittelbare Folgerung aus
138
3. Potenzreste, insbesondere quadratische Reste
Proposition B. Zu jedem p wie in Proposition A gibt es eine Primzahl q ≤ √ 2[ p] + 1 mit q ≡ 3 (mod 4) und ( pq ) = −1. √ Beweis. Sei a := [ p]. Bei geradem a ist p − a2 ∈ N und p − a2 ≡ 3 (mod 4). Daher hat p − a2 nur ungerade Primfaktoren, insgesamt aber mindestens einen √ √ ≡ 3 (mod 4). Ist q ein solcher, so ist q ≤ p − a2 < p − ( p − 1)2 = 2 p − 1 und a2 ≡ p (mod q); d.h. p ist quadratischer Rest modulo q, also ( pq ) = 1 und somit wegen p ≡ q ≡ 3 (mod 4) nach dem quadratischen Reziprozit¨ atsgesetz ( pq ) = −1. Ab jetzt sei a ungerade. Ist p ≡ 7 (mod 8), so hat man p − a2 ≡ 7 − 1 = 6 (mod 8), also gilt 12 (p − a2 ) ≡ 3 (mod 4). Nun hat 12 (p − a2 ) einen Primfaktor q ≡ 3 (mod 4), mit dem man wie vorher zu Ende argumentiert. Ist p ≡ 3 (mod 8), so ist (a + 2)2 − p positiv ganz und kongruent 1 − 3 ≡ 6 (mod 8). Daher ist die nat¨ urliche Zahl 12 (a + 2)2 − p ≡ 3 (mod 4) und hat einen Primfaktor q der gew¨ unschten Art. Dabei hat man nur noch die in Aussicht gestellte obere Schranke f¨ ur q zu best¨atigen: Wegen der Irrationalit¨at √ √ von p (vgl. Korollar 1.1.9) ist in a ≤ p das Gleichheitszeichen unm¨oglich, also 2 gilt a ≤ p − 1. Da hier die linke Seite ungerade, die rechte gerade ist, kann noch √ genauer a2 ≤ p−2 gesagt werden, also q ≤ 12 (a2 +4a+4−p) ≤ 2a+1 = 2[ p]+1 wie behauptet. Bemerkungen. 1) Die Gr¨ oßenbeschr¨ ankung f¨ ur q in Proposition B kann man im allgemeinen nicht weiter verbessern. F¨ ur die Primzahlen p = 11, 83, 227 z.B. ist √ 2[ p] + 1 = 7, 19, 31 jeweils tats¨achlich die kleinste Primzahl ≡ 3 (mod 4), die quadratischer Nichtrest modulo p ist. 2) Die soeben aufgef¨ uhrten drei Primzahlen sind s¨ amtliche bei ungeradem a > 1 von der Form a2 + 2 (also ≡ 3 (mod 8)), wobei u ¨berdies a durch 3 teilbar sein muß, da andernfalls a2 + 2 gr¨ oßer als 3 und ein Vielfaches von 3 w¨are. Die Folge a2 + 2 mit durch 3 teilbarem ungeradem a beginnt mit 11,83, 227,433,731,1093,1523,2027,2603,3251, . . .. Die angegebenen zehn Zahlen sind alle, bis auf die f¨ unfte und neunte, Primzahlen. Es ist aber unbekannt, ob in dieser Folge unendlich viele Primzahlen vorkommen.
10. Primzahlen in arithmetischen Progressionen. Hier sollen einige einfache Illustrationen gegeben werden zum nachstehenden Satz von Dirichlet. Sind k, ∈ N zueinander teilerfremd, so gibt es unendlich viele Primzahlen p mit p ≡ (mod k).
§ 2.
Quadratische Reste
139
Die Richtigkeit dieses Satzes hat Euler 1775 im Spezialfall = 1 als Vermutung ausgesprochen, im allgemeinen Fall Legendre 1785, der auch einen Beweis versucht hat. Den ersten vollst¨ andigen Beweis konnte jedoch erst 1837 Dirichlet (Werke I, 313–342) liefern, dessen diesbez¨ ugliche Arbeit den Beginn der analytischen Zahlentheorie markiert. Offenbar ist die Teilerfremdheit von k und notwendig f¨ ur die Existenz unendlich vieler Primzahlen p ≡ (mod k). Ist n¨ amlich q eine k und teilende Primzahl, so gilt q|(kn + ) f¨ ur alle ganzen n; daher kann h¨ ochstens das kleinste positive ¨ dieser kn + eine Primzahl (und damit gleich q) sein. Uberdies darf o.B.d.A. ≤ k vorausgesetzt werden. Es sollen hier s¨amtliche Spezialf¨ alle k = 1, 2, 3, 4, 6 des Dirichletschen Satzes bewiesen werden. Ist k gleich 1 oder 2, so ist die Aussage im Satz identisch mit derjenigen des Euklidschen Satzes 1.1.4. Zur Behandlung der restlichen F¨ alle seien jeweils p1 , . . . , pr paarweise verschiedene Primzahlen ≡ (mod k); mit mehr oder weniger Geschick, je nach Unterfall, wird zu diesen eine ganze Zahl nr > so konstruiert, daß man zeigen kann: nr hat einen von p1 , . . . , pr verschiedenen Primfaktor pr+1 ≡ (mod k), womit man dann fertig ist. Sei zuerst k = 4; dann hat man = 1, 3 zu diskutieren. Im zweiten Unterfall folgt man dem Euklidschen Beweisgedanken in 1.1.4, indem man setzt (1)
nr := 4p1 · . . . · pr − 1.
Da hier nr ≡ 3 (mod 4) gilt, k¨ onnen dessen (s¨amtliche ungerade) Primfaktoren nicht alle ≡ 1 (mod 4) sein; somit hat nr einen Primfaktor pr+1 ≡ 3 (mod 4), der wegen (1) von p1 , . . . , pr verschieden ist. Im ersten Unterfall = 1 arbeitet man mit (2)
nr := (2p1 · . . . · pr )2 + 1.
Jeder Primfaktor pr+1 von nr ist wegen (2) von 2, p1 , . . . , pr verschieden und wegen (2) ist −1 quadratischer Rest modulo pr+1 . Nach dem ersten Erg¨anzungssatz ist (−1)(pr+1 −1)/2 = 1, also pr+1 ≡ 1 (mod 4). F¨ ur k = 6 ist = 1, 5 m¨oglich. Im zweiten Unterfall schließt man genau wie f¨ ur k = 4, = 3; dies kann dem Leser u ¨berlassen bleiben. Im ersten Unterfall = 1 arbeitet man hier mit (3)
nr := (2p1 · . . . · pr )2 + 3;
jeder Primfaktor pr+1 von nr ist wegen (3) von 2, 3, p1 , . . . , pr verschieden und wegen (3) ist −3 quadratischer Rest modulo pr+1 =: p, also ist ( −3 p ) = 1.
140
3. Potenzreste, insbesondere quadratische Reste
Benutzt man hier Satz 3(i), (ii), das quadratische Reziprozit¨atsgesetz und seinen ersten Erg¨anzungssatz, so ist 1=
p p −1 3 = (−1)(p−1)/2 (−1)(p−1)/2 = . p p 3 3
Aus p ≡ 2 (mod 3) w¨ urde ( p3 ) = ( 23 ) = −1 nach dem zweiten Erg¨anzungssatz folgen, also ist p ≡ 1 (mod 3), wegen der Ungeradheit von p = pr+1 also pr+1 ≡ 1 (mod 6). Schließlich sind bei k = 3 die Unterf¨ alle = 1, 2 m¨oglich. Da f¨ ur ungerade Primzahlen p die Kongruenzen p ≡ 1 bzw. 5 (mod 6) mit den Kongruenzen p ≡ 1 bzw. 2 (mod 3) a¨quivalent sind, werden diese F¨alle schon durch k = 6, = 1, 5 abgedeckt. Bemerkungen. 1) Die Fragestellung im Dirichletschen Satz kann man wie folgt verallgemeinern: Sei f ∈ Z[X] nicht konstant, in Z[X] irreduzibel, mit positivem Leitkoeffizienten und (∗): es gebe keine Primzahl, die alle f (n) mit n ∈ Z teilt. (Die Bedingung (∗) verlangt mindestens die Teilerfremdheit s¨amtlicher Koeffizienten von f , d.h. dessen Primitivit¨ at; bei ∂(f ) = 1 sind (∗) und die Primitivit¨ at von f offenbar ¨aquivalent.) Da die Folge (f (n))n=0,1,... ganzer Zahlen von einer Stelle an streng w¨achst, ist die Frage sinnvoll, ob es unendlich viele n ∈ N gibt, f¨ ur die f (n) Primzahl ist. Im Fall ∂(f ) = 1 beantwortet der Dirichletsche Satz die gestellte Frage positiv, w¨ahrend sie f¨ ur ∂(f ) ≥ 2 noch offen ist. Wenigstens konnte H.–E. Richert (1968) die Existenz unendlich vieler n ∈ N zeigen, f¨ ur die f (n) Produkt von h¨ ochstens ∂(f ) + 1 (nicht notwendig verschiedenen) Primzahlen ist; bei ∂(f ) = 2 kann man nach H. Iwaniec (1978) “Produkt dreier” durch “Produkt zweier” Primzahlen ersetzen. 2) Der Leser m¨oge sich klarmachen, daß die in Bemerkung 2 zu 9 offen gelassene Frage genau mit folgender a¨quivalent ist: Sei f das spezielle Polynom 36X 2 + 36X + 11 von der Art wie in Bemerkung 1; gibt es unendlich viele n ∈ N, f¨ ur die f (n) Primzahl ist?
11. Primfaktoren von Fermat–Zahlen. Lucas bewies 1877 mit Hilfe des zweiten Erg¨anzungssatzes aus 6 ein Ergebnis, welches die Form der m¨oglichen n Primfaktoren der in 2.1.2 eingef¨ uhrten Fermat–Zahlen Fn := 22 + 1 stark einschr¨ ankt. Satz. Teilt eine Primzahl p die Fermat–Zahl Fn mit n ≥ 2, so gilt p = 2n+2 k + 1 mit nat¨ urlichem k.
§ 2.
141
Quadratische Reste n
n+1
Beweis. Nach Voraussetzung ist 22 ≡ −1 (mod p), also 22 ≡ 1 (mod p) und somit gilt ordp 2 = 2n+1 . Nach Korollar 2.3.4 wird p − 1 von 2n+1 geteilt und wegen n ≥ 2 ist p ≡ 1 (mod 8). Nach dem zweiten Erg¨anzungssatz ist dann ( p2 ) = 1, d.h. es gilt x2 ≡ 2 (mod p) bei geeignetem ganzem, nicht durch n+2
n+1
p teilbarem x. Die letzte Kongruenz impliziert x2 ≡ 22 ≡ 1 (mod p), j urlichen j ≤ n + 2 sein muß. Aus x2 ≡ weshalb ordp x = 2 mit einem nat¨ j−1 2 (mod p) folgt dann 1 ≡ 22 (mod p), weshalb auch j ≥ n + 2 gelten muß. Nach Korollar 2.3.4 teilt ordp x (= 2n+2 ) die Zahl p − 1 wie behauptet. Die Aussage dieses Satzes liefert eines der wenigen bekannten theoretischen Hilfsmittel f¨ ur die Suche nach Primfaktoren von Fermat–Zahlen. Danach hat man die Primfaktoren von F5 in der arithmetischen Folge (128k+1)k=1,2,... zu suchen, die mit 129,257,385,513,641, . . . beginnt. Offensichtlich sind hier nur (F3 =)257 und 641 Primzahlen und wegen (F3 , F5 ) = 1, vgl. Satz 2.1.2, ist 641 die erachlich tut, wurde ste m¨ogliche Primzahl, die F5 teilen kann. Daß sie es tats¨ schon in 2.1.2 vorgef¨ uhrt; der dort angegebene zweite Primfaktor von F5 ist in ¨ Ubereinstimmung mit obigem Satz gleich 27 · 3 · 17449 + 1. ¨ Ahnlich konnten 1877 unabh¨ angig voneinander Lucas und J. Pervusin einen Primfaktor von F12 entdecken. Nach obigem Satz ist jeder solche von der Form dk := 214 k + 1. Wegen 5|(d1 , d6 ), 3|(d2 , d5 ), 13|d3 und d4 = F4 ist k = 7 die fr¨ uheste M¨ oglichkeit und in der Tat erweist sich d7 als F12 teilende Primzahl. Die Fn mit 5 ≤ n ≤ 32 sind zusammengesetzt, allerdings kennt man nur f¨ ur 5 ≤ n ≤ 11 die vollst¨ andige Faktorisierung von Fn ; bei n ∈ {14, 20, 22, 24} ist kein einziger Primfaktor von Fn bekannt. F33 ist derzeit die kleinste Fermat– Zahl, bei der man nicht weiß, ob sie prim oder zusammengesetzt ist.
12. Mersenne–Primzahlen. Wie in Proposition 1.1.8 gesehen, k¨ onnen h¨ ochur die p selbst stens solche Mersenne–Zahlen Mp := 2p − 1 Primzahlen sein, f¨ Primzahl ist. Mit Hilfe des zweiten Erg¨ anzungssatzes wird sogleich ein Ergebnis bewiesen, welches gewisse Mp sofort als zusammengesetzt erkennen l¨aßt. Satz A. Ist p eine Primzahl, so daß auch q := 2p + 1 Primzahl ist, so gilt q|Mp ⇔ q ≡ ±1 (mod 8) bzw. q|(Mp + 2) ⇔ q ≡ ±3 (mod 8). Beweis. Man hat q|Mp ⇔ 2(q−1)/2 ≡ 1 (mod q) ⇔ ( q2 ) ≡ 1 (mod q), letzteres nach dem Euler–Kriterium 4. Damit ist ( 2q ) = 1, was nach dem zweiten Erg¨anzungssatz mit q ≡ ±1 (mod 8) ¨aquivalent ist. Weiter gilt q|(Mp + 2) ⇔ 2(q−1)/2 ≡ −1 (mod q) ⇔ ( q2 ) = −1 ⇔ q ≡ ±3 (mod 8).
142
3. Potenzreste, insbesondere quadratische Reste
Korollar. Ist p ≡ 3 (mod 4) eine Primzahl, so daß auch q := 2p + 1 Primzahl ist, so wird Mp von q geteilt; bei p > 3 ist also Mp unter den vorstehenden Bedingungen zusammengesetzt. Beweis. Wegen p ≡ 3 (mod 4) ist q ≡ −1 (mod 8) und Satz A liefert die erste Behauptung. Weiter tritt in 2p + 1 ≤ 2p − 1 genau f¨ ur p = 3 Gleichheit ein. Es folgt noch ein Resultat u ¨ber die m¨ ogliche Form von Primfaktoren der Mp . Satz B. Sei p eine ungerade Primzahl und q ein Primfaktor von Mp . Dann gilt q ≡ 1 (mod 2p) und q ≡ ±1 (mod 8). Beweis. Nach Voraussetzung ist 2p ≡ 1 (mod q), also (ordq 2)|p. Da ordq 2 nicht gleich 1 ist, hat man ordq 2 = p. Nach dem “kleinen” Fermatschen Satz ist 2q−1 ≡ 1 (mod q), also p|(q − 1); wegen 2|(q − 1) hat man die erste Behauptung. Die ganze Zahl x := 2(p+1)/2 gen¨ ugt x2 − 2 = 2Mp ≡ 0 (mod q) und man hat 2 anzungssatz. ( q ) = 1; die zweite Behauptung folgt aus dem zweiten Erg¨
Aufgrund des Korollars ist Mp zusammengesetzt f¨ ur die Primzahlen p = 11, 23, 83, 131, 179, 191. Es gibt genau 54 Primzahlen ≡ 3 (mod 4) unterhalb 4000, f¨ ur die auch 2p + 1 Primzahl ist; die Anzahl aller Primzahlen unterhalb 4000 ist 550. Es ist allerdings offen, ob gleichzeitig 4k + 3 und 8k + 7 f¨ ur unendlich viele nat¨ urliche k Primzahlen sein k¨ onnen. Die Faktorzerlegung von M11 = 2047 findet man mittels Satz B leicht wie folgt: Jeder Primfaktor von M11 muß ≡ 1 (mod 22) und ≡ ±1 (mod 8) sein und die erste sich daraus ergebende M¨oglichkeit 23 teilt tats¨ achlich M11 ; man hat M11 = 23·89 und nat¨ urlich gen¨ ugt auch 89 den Kongruenzen des Satzes B. Diese Zerlegung wurde von Cataldi (1588) gefunden, der auch zeigte, daß M13 , M17 und M19 Primzahlen sind. F¨ ur M19 sei dies hier exemplarisch vorgef¨ uhrt. Die Voraussetzungen des Korollars sind hier nicht erf¨ ullt, so daß man Chancen hat, M19 als Primzahl nachzuweisen. Aufgrund von Satz B kommen als M19 teilende Primzahlen unterhalb 1/2 M19 (d.h. unterhalb 724) h¨ ochstens noch 191, 457 und 647 in Frage; daß M19 von diesen nicht geteilt wird, rechnet man schließlich direkt nach. In der folgenden Tabelle sind alle bisher bekannten 36 Mersenneschen Primzahlen Mp mit p > 31 aufgelistet; hinzu kommen die acht bis Euler bekannten mit p ∈ {2, 3, 5, 7, 13, 17, 19, 31}. Der zweiten Spalte entnimmt man die jeweilige Anzahl der Dezimalstellen von Mp . In der dritten werden die jeweiligen Entdecker ab 2001 nicht mehr aufgef¨ uhrt, zumal die Suche nach immer gr¨ oßeren
§ 2.
Quadratische Reste
143
Primzahlen Mp seit 1996 im Rahmen des weltweiten GIMPS–Projekts (Great Internet Mersenne Prime Search, http://www.mersenne.org) abl¨ auft. p 61 89 107 127 521 607 1279 2203 2281 3217 4253 4423 9689 9941 11213 19937 21701 23209 44497 86243 110503 132049 216091 756839 859433 1257787 1398269 2976221 3021377 6972593 13466917 20996011 24036583 25964951 30402457 32582657
Stellenanzahl
Entdecker (Jahr)
19 27 33 39 157 183 386 664 687 969 1281 1332 2917 2993 3376 6002 6533 6987 13395 25962 33265 39751 65050 227832 258716 378632 420921 895932 909526 2098960 4053946 6320430 7235733 7816230 9152052 9808358
Pervusin (1883) Fauquembergue, Powers (1911) “ “ (1914) Lucas (1876) Lehmer & Robinson (1952) “ “ “ “ Riesel (1957) Hurwitz & Selfridge (1961) “ Gillies (1963) “ “ Tuckerman (1971) Nickel & Noll (1978) “ Slowinski (1979) “ (1982) Colquitt & Welsh (1988) Slowinski (1983) “ (1985) Slowinski & Gage (1992) “ (1994) “ (1996) Armengaud & Woltman (1996) Spence & Woltman (1997) Clarkson & Woltman (1998) Hajratwala & Woltman (1999) Cameron & Woltman (2001) (2003) (2004) (2005) (2005) (2006)
144
3. Potenzreste, insbesondere quadratische Reste
Aus der umseitigen Tabelle kann der Leser gut die historische Entwicklung immer verbesserter Primzahltests einerseits und immer schnellerer Computer andererseits ablesen. Der Computerausdruck von M32582657 im Dezimalsystem w¨ urde etwa den 10000–fachen Platz ben¨ otigen wie der in 5.1.11 reproduzierte Ausdruck des Beginns der Dezimalbruchentwicklung der Zahl π, also mindestens 11 Exemplare des vorliegenden Buchs. Bemerkung. Aktuelle Primzahlrekorde geh¨ oren offenbar zu den wenigen Er¨ gebnissen mathematischer Forschung, die der Offentlichkeit in dieser oder jener Form regelm¨aßig zur Kenntnisnahme angeboten werden. So ging Mitte Februar 1985 durch die deutsche Presse, W. Keller in Hamburg habe mit 5 · 223473 + 1 die f¨ unftgr¨ oßte damals bekannte Primzahl (7067 Dezimalstellen) gefunden. Auch die Entdeckung von M216091 als seinerzeit gr¨oßte bekannte Primzahl wurde Mitte September 1985 in Presse und Rundfunk gemeldet und kommentiert. Die holl¨ andische Tageszeitung “Haarlems Dagblad” hatte am 5. Oktober 1983 den bald darauf entthronten Rekordinhaber M132049 in Dezimaldarstellung in voller L¨ ange abgedruckt. Gegen¨ uber der Tagespresse ungew¨ohnlicher ist das nachfolgend abgebildete, 1968 von der U.S.–Post in Urbana (Illinois) gew¨ahlte Informationsmedium.
Wenn hier schon die Problematik “Mathematik und ihre Publicity” angesprochen ist, so sollte trotz der generell d¨ urftigen Repr¨ asentanz nicht vergessen werden, daß sowohl die Schweizerische Nationalbank als (bis zur Euro-Einf¨ uhrung) auch die Deutsche Bundesbank mit Euler bzw. Gauss auf ihren 10 Franken– bzw. 10 Mark–Scheinen die bedeutendsten Mathematiker (und Zahlentheoretiker) des 18. bzw. 19. Jahrhunderts ehren bzw. ehrten. Dem tut die Tatsache kaum Abbruch, daß allerlei physikalisch–technische Skizzen und Apparaturen die R¨ uckseiten beider Scheine zieren: Solche mehr praktischen Dinge sind der Allgemeinheit eben viel leichter nahezubringen als noch so sch¨one Ergebnisse der abstrakten Mathematik.
§ 2.
Quadratische Reste
145
13. Historisches zum Reziprozit¨ atsgesetz. Die beiden Erg¨anzungss¨atze zum quadratischen Reziprozit¨ atsgesetz (hier kurz q.Rg.) waren bereits Fermat bekannt, aber erst Euler (Opera Omnia Ser. 1, II, 328–337) bzw. Lagrange (Oeuvres III, 695–795) lieferten Beweise f¨ ur den ersten bzw. zweiten. Das q.Rg. selbst scheint von Euler gefunden, von ihm etwa 1745 implizit ben¨ utzt, sp¨atestens aber 1772 (Opera Omnia Ser. 1, III, 497–512) erstmals klar ausgesprochen worden zu sein. Offenbar unabh¨ angig von Euler hat auch Legendre (Hist. Acad. Paris 1785, 465ff.) das q.Rg. entdeckt und zu zeigen versucht. Sein Beweisversuch hatte allerdings insofern eine in jener Zeit unbehebbare L¨ ucke, als er die Existenz unendlich vieler Primzahlen in gewissen arithmetischen Folgen voraussetzte, vgl. 10. In Legendres in 3 erw¨ahntem Essai ... (S. 186) findet sich dann die in 6 angegebene elegante, symmetrische Formulierung des q.Rg. mit Hilfe des von ihm eingef¨ uhrten Symbols ( pq ). Ebenfalls von Legendre stammt die in die sp¨ atere Literatur eingegangene Bezeichnung f¨ ur das Gesetz (“loi de r´eciprocit´e”), w¨ ahrend Gauss generell vom “theorema fundamentale” spricht. Gauss selbst hat als Achtzehnj¨ ahriger aus umfangreichem Beispielmaterial das q.Rg. herauspr¨ apariert, ganz unabh¨ angig von seinen Vorg¨ angern Euler und Legendre. Nach einem Jahr h¨artester Arbeit war ihm dann der erste kom¨ plette Beweis gelungen. Uber diese Phase seiner Forschungen schreibt er (Werke II, S. 4): “Adiicere liceat tantummodo, in confirmationem eorum, quae in art. praec. prolata sunt, quae ad meos conatus pertinent. In ipsum theorema proprio marte incideram anno 1795, dum omnium, quae in arithmetica sublimiori iam elaborata fuerant, penitus ignarus et a subsidiis literariis omnino praeclusus essem: sed per integrum annum me torsit, operamque enixissimam effugit, donec tandem demonstrationem in Sectione quarta operis illius traditam nactus essem.”∗) W¨ ahrend Gauss seinen ersten Beweis des q.Rg. (8. April 1796) mittels vollst¨ andiger Induktion und ganz im Rahmen der Theorie der quadratischen Reste f¨ uhrte, gab er bald darauf (27. Juni 1796) einen weiteren an, der sich auf seine Untersuchungen u ¨ber quadratische Formen st¨ utzte (Disquisitiones Arithmeticae, Art. 257ff.). Insgesamt lieferte Gauss selbst acht methodisch verschiedene Beweise f¨ ur das q.Rg., ein Zeichen f¨ ur die zentrale Bedeutung, die er diesem f¨ ur ∗)
(Es m¨ogen nur zur Best¨atigung dessen, was im vorigen Artikel gesagt wurde, einige Bemerkungen zu meinen Versuchen gestattet sein. Auf jenen Satz kam ich im M¨ arz 1795 selbst¨ andig. Damals waren mir alle schon erzielten Resultate der h¨ oheren Arithmetik v¨ollig unbekannt und zu den Hilfsmitteln der Literatur hatte ich keinerlei Zugang. Doch qu¨ alte mich jener Satz ein ganzes Jahr lang und entzog sich den angestrengtesten Bem¨ uhungen, bis mir endlich der im vierten Abschnitt jenes Werkes [Disquisitiones Arithmeticae, Art. 135ff.] aufgeschriebene Beweis gelang.)
146
3. Potenzreste, insbesondere quadratische Reste
die Zahlentheorie zumaß. In der Folgezeit sind zahlreiche weitere Beweise angegeben worden. Alleine 45 entfallen auf die Jahre zwischen 1796 und 1896. Diese Beweise sind chronologisch geordnet und mit der jeweils verwendeten Methode bei P. Bachmann (Niedere Zahlentheorie I, Teubner, Leipzig, 1902, S. 203/4) zitiert; davon operieren 28 mit dem Gaussschen Lemma 5 oder mit geeigneten Modifikationen. Bis heute sind deutlich u ¨ber 150 Beweise des q.Rg. publiziert worden; 1963 erschien eine Note mit dem Titel “The 152nd proof of the law of quadratic reciprocity” von M. Gerstenhaber (Amer. Math. Monthly 70, 397–398 (1963)). Parallel mit der Suche nach immer neuen Beweisvarianten f¨ ur das quadratische Rg. hat schon Gauss damit begonnen, analoge Reziprozit¨ atsgesetze f¨ ur Kongruenzen h¨ oheren als zweiten Grades aufzustellen. Den ersten Beweis f¨ ur das von Gauss 1825 gefundene biquadratische Rg. konnte Eisenstein 1844 liefern, der im gleichen Jahr das 1827 erstmals von Jacobi gezeigte kubische Rg. bewies. Um die Wende zum 20. Jahrhundert hat vor allem Hilbert diese Entwicklung entscheidend gef¨ordert und zwar sowohl durch einige bedeutende Arbeiten als auch dadurch, daß er die Frage nach m¨ oglichst weitgehender Verallgemeinerung des q.Rg. in den Katalog seiner “Mathematischen Probleme” aufnahm. Unter diesem Titel hielt Hilbert 1900 auf dem Internationalen Mathematiker– Kongreß in Paris seinen inzwischen ber¨ uhmt gewordenen Vortrag. Dort formulierte er insbesondere 23 seinerzeit offene Fragestellungen explizit, die die ganze damalige Mathematik umspannten und die er als Schl¨ usselprobleme f¨ ur weitere Fortschritte in den einzelnen mathematischen Teildisziplinen erachtete. ¨ Das “neunte Hilbertsche Problem” stellt unter der Uberschrift Beweis des allgemeinsten Reziprozit¨atsgesetzes im beliebigen Zahlk¨orper folgende Aufgabe: “F¨ ur einen beliebigen Zahlk¨ orper soll das Reziprozit¨ atsgesetz der –ten Potenzreste bewiesen werden, wenn eine ungerade Primzahl bedeutet und ferner, wenn eine Potenz von 2 oder eine Potenz einer ungeraden Primzahl ist. Die Aufstellung des Gesetzes sowie die wesentlichen Hilfsmittel zum Beweise desselben werden sich, wie ich glaube, ergeben, wenn man die von mir entwickelte Theorie des K¨orpers der –ten Einheitswurzeln und meine Theorie des relativ– quadratischen K¨orpers in geh¨ origer Weise verallgemeinert.” Dieses Problem wurde vor allem durch Arbeiten von T. Tagaki (1920/2), H. Hasse (1926), E. Artin (1928) und I.R. Safarevic (1948/50) gel¨ ost. Bemerkung. Den genannten Hilbertschen Vortrag findet man nebst hervorragender Kommentierungen u ¨ber den Anfang bzw. Mitte der 1970er Jahre aktuellen Stand der 23 Einzelprobleme in: Die Hilbertschen Probleme, Ostwalds Klassiker Band 252, Leipzig, 1971 bzw. Mathematical developments arising from Hilbert problems, Proc. Symp. Pure Math. 28 (1976).
§ 3.
147
Verteilung quadratischer Reste
Viele wertvolle Informationen zum q.Rg., zu seiner Behandlung von Gauss, zu seinen interessantesten Beweisvarianten ebenso wie zu den zuletzt diskutierten algebraischen Verallgemeinerungen entnimmt man dem zum 200. Geburtstag von Gauss erschienenen B¨andchen von H. Pieper (Variationen u ¨ber ein zahlentheoretisches Thema von Carl Friedrich Gauss, Birkh¨ auser, Basel–Stuttgart, 1978).
§ 3.
Verteilung quadratischer Reste
1. Summen u ¨ ber gewisse Legendre–Symbole. F¨ ur ungerade Primzahlen p und nat¨ urliche d < p interessiert nun die Anzahl der d–Tupel sukzessiver nat¨ urlicher Zahlen unterhalb p, die s¨amtlich quadratische Reste modulo p sind. ur 12 (p − 1) < d Schreibt man diese Anzahl als Qp (d), so ist offenbar Qp (d) = 0 f¨ wegen Korollar 1.5C. Uninteressant ist auch die aus demselben Grund geltende Gleichung Qp (1) = 12 (p − 1). In 2 wird Qp (2) ermittelt, in 3 dann Qp (3). F¨ ur die Durchf¨ uhrung dieses Programms ben¨otigt man zun¨achst folgendes Lemma.
Ist p eine ungerade Primzahl, so gilt bei ganzen a, b p−1 (t + a)(t + b) p − 1, falls a ≡ b (mod p) = Sp (a, b) := −1 sonst. p t=0
Bemerkung. Derartige Summen sind in diesem Paragraphen stets u ¨ber die im Sinne von Bemerkung 2 in 2.3 erweiterten Legendre–Symbole zu verstehen; sonst m¨ ußte man einen oder zwei t–Werte von der Summation ausschließen, was einfach unbequemer w¨ are. Beweis. Mit k := b − a ist (1)
Sp (a, b) =
p−1+a i=a
i(i + k) i(i + k) i(i + k) = = . p p p i=0 i=1 p−1
p−1
Dabei ist die Tatsache benutzt, daß in den beiden ersten Summen jeweils u ¨ber ein vollst¨ andiges Restsystem modulo p summiert wird, weiter ist ( p0 ) := 0 beachtet. Ist j(i) modulo p invers zu i ∈ {1, . . . , p − 1}, so durchlaufen i und j(i) gleichzeitig ein primes Restsystem modulo p. Daher kann die Summe rechts in (1) folgendermaßen umgearbeitet werden: (2)
Sp (a, b) =
p−1 j(i) 2 i(i + k) i=1
p
p
=
p−1 i=1
1 + j(i)k 1 + jk = . p p j=1 p−1
148
3. Potenzreste, insbesondere quadratische Reste
Nun ist a ≡ b (mod p) mit p|k ¨aquivalent und in diesem Fall sind alle in der Summe rechts in (2) vorkommenden Legendre–Symbole gleich ( p1 ) = 1, woraus der erste Teil des Lemmas folgt. F¨ ur p |k sind alle ganz rechts in (2) vorkommenden 1 + jk modulo p paarweise inkongruent und s¨amtliche inkongruent 1. Wegen Satz 2.3(iv) (vgl. die dortige Bemerkung 2) ist damit nach (2) 1 − = −1. p p p−1
Sp (a, b) =
=0
2. Paare sukzessiver quadratischer Reste. Hier soll der folgende, auf Gauss zur¨ uckgehende Satz bewiesen werden. Satz. F¨ ur ungerade Primzahlen p gibt es genau 14 (p − 4 + (−1)(p+1)/2 ) Paare aufeinanderfolgender quadratischer Reste modulo p, die u ¨berdies nat¨ urliche Zahlen unterhalb p sind. Beweis. Man sieht sofort, daß 14 (1 + ( pt ))(1 + ( t+1 p )) gleich 1 ist, falls t und t + 1 quadratische Reste modulo p sind, und gleich 0 sonst; dies gilt f¨ ur t = 1, . . . , p−2. Mit der Bezeichnung anfangs von 1 folgt daraus, wenn man noch Satz 2.3(iv), den ersten Erg¨anzungssatz aus 2.6 sowie Lemma 1 beachtet, 4Qp (2) =
p−2
1+
t=1
=p−2+
t + 1 t 1+ p p
p−2 t=1
p−1 p−1 t t t(t + 1) + + p p p t=2 t=0
= p − 2 − (−1)(p−1)/2 − 1 − 1. Daraus liest man die Behauptung ab. Beispiel. Nach dem Satz ist Q29 (2) = 6. Tats¨ achlich sind 1, 4, 5, 6, 7, 9, 13, 16, 20, 22, 23, 24, 25, 28 alle 14 quadratischen Reste modulo 29 in {1, . . . , 28} und f¨ ur Q29 (2) werden also genau die Paare (4, 5), (5, 6), (6, 7), (22, 23), (23, 24) und (24, 25) gez¨ahlt. Bemerkung. Der Beweis des Satzes legt nahe, daß man mit Leichtigkeit analog z.B. die Anzahl der Paare sukzessiver nat¨ urlicher Zahlen unterhalb p bestimmen kann, die beide quadratische Nichtreste modulo p sind (oder die beiden restlichen m¨oglichen Kombinationen von Resten und Nichtresten).
§ 3.
149
Verteilung quadratischer Reste
3. Tripel sukzessiver quadratischer Reste. Definiert man f¨ ur ungerade Primzahlen p und ganze t die sogenannten Jacobsthalschen Summen Tp (t) durch (1)
Tp (t) :=
p−1 c(c2 − t) , p c=1
so gilt der folgende Satz.
F¨ ur ungerade Primzahlen p existieren genau 1
8 (p + [ 81 p],
Qp (3) =
Tp (1) − 11 − 4(−1)(p−1)/4 ), falls p ≡ 1 (mod 4), falls p ≡ 3 (mod 4),
Tripel aufeinanderfolgender quadratischer Reste modulo p, die u ¨berdies nat¨ urliche Zahlen unterhalb p sind. Beweis. F¨ ur p = 3 ist die behauptete Formel richtig, da Tripel der genannten Art hier nicht auftreten k¨ onnen. Ist p ≥ 5, so sieht man v¨ollig analog zum Beweisbeginn in 2 c − 1 c c + 1 1+ 1+ p p p c=2 p − 1 p − 2 1 p − 1 1 2 =p−3− − − − − − p p p p p p (p − 1)(p − 2) 2 −1 + Sp (−1, 0) − + Sp (0, 1) − + Sp (−1, 1) − p p p + Tp (1).
8Qp (3) =
p−2
1+
Nach Lemma 1 sowie den beiden Erg¨ anzungss¨atzen aus 2.6 ist somit 2
8Qp (3) = p − 8 − 3(−1)(p−1)/2 − 3(−1)(p
−1)/8
2
− (−1)(p−1)/2+(p
−1)/8
+ Tp (1),
was f¨ ur p ≡ 1 (mod 4) direkt die Behauptung liefert. Ist p ≡ 3 (mod 4), so hat man nach dem folgenden Lemma 4(iii) 2
8Qp (3) = p − 5 − 2(−1)(p
−1)/8
=
p−3 p−7
f¨ ur p ≡ 3 (mod 8) f¨ ur p ≡ 7 (mod 8),
was auch in diesem Fall die Behauptung des Satzes ergibt.
150
3. Potenzreste, insbesondere quadratische Reste
Beispiel. Nach dem Satz ist Q29 (3) = 4 und in der Tat werden dabei genau die Tripel (4, 5, 6), (5, 6, 7), (22, 23, 24) und (23, 24, 25) gez¨ahlt, vgl. das Beispiel in 2. Dabei findet man T29 (1) = 10 relativ leicht aus Lemma 4(ii). Bemerkung. Bei der Anwendung der Formel des Satzes muß man im Fall p ≡ 1 (mod 4) generell Tp (1) berechnen. F¨ ur kleine p ist das ziemlich m¨ uhelos; man kann Lemma 4(ii) verwenden. F¨ ur große p wird man sich im allgemeinen mit einer Absch¨ atzung f¨ ur Tp (1) zufrieden geben, vgl. das folgende Korollar 4.
¨ 4. Eigenschaften Jacobsthalscher Summen. Uber die durch 3(1) eingef¨ uhrten Summen Tp (t) gibt folgender Hilfssatz die erforderlichen Ausk¨ unfte. Lemma. (i)
Es gilt Tp (0) = 0.
(ii)
F¨ ur ganze t ist Tp (t) = (1 + ( −1 p ))
(iii)
Bei p ≡ 3 (mod 4) ist Tp (t) = 0 f¨ ur alle ganzen t.
(iv)
F¨ ur ganze s,t ist Tp (s2 t) = ( ps )Tp (t).
(v)
Tp (t)2 ist konstant f¨ ur alle quadratischen Reste (bzw. Nichtreste) modulo p.
(vi)
Ist p ≡ 1 (mod 4) und t0 irgendein quadratischer Nichtrest modulo p, so gilt Tp (1)2 + Tp (t0 )2 = 4p.
(p−1)/2 c=1
2
( c(c p−t) ).
3
ur c = 1, . . . , p − 1 ¨ aquivalent mit Satz 2.3(iv). Beweis. (i) ist wegen ( cp ) = ( pc ) f¨ (ii) folgt direkt aus p−1
c(c2 − t)
c=(p+1)/2
p
(p−1)/2
=
d=1
−d(d2 − t) , p
wenn man c = p − d setzt und Satz 2.3(i), (ii) beachtet. ur p ≡ 3 (mod 4); (iii) folgt (iii) ergibt sich aus (ii) wegen ( −1 p ) = −1 genau f¨ aber auch aus (iv) mit s := −1. (iv) ist bei p|s klar wegen ( ps ) = 0, wegen (i) und der sich aus Satz 2.3(i) ergebenden Gleichung Tp (t) = Tp (t ) f¨ ur ganze, modulo p kongruente t, t . Ist
§ 3.
Verteilung quadratischer Reste
151
p |s, so durchl¨ auft mit c auch sc ein primes Restsystem modulo p und man entnimmt die Behauptung der folgenden Gleichung. p−1 s3 s sc((sc)2 − s2 t) p−1 d(d2 − s2 t) Tp (t) = Tp (t) = = = Tp (s2 t). p p p p c=1 d=1
F¨ ur (v) sei a eine feste Primitivwurzel modulo p. Nach Korollar 1.5B sind s¨amtliche quadratischen Reste bzw. Nichtreste modulo p kongruent a2 , a4 , . . . . . . , ap−1 bzw. a, a3 , . . . , ap−2 . Sind t1 , t2 entweder beides Reste oder beides Nichtreste modulo p, so ist t2 ≡ a2m t1 (mod p) mit geeignetem nat¨ urlichem m. m Wendet man (iv) mit s := am , t := t1 an, so ist Tp (t2 )2 = ( ap )2 Tp (t1 )2 = Tp (t1 )2 wie behauptet. (vi): Nach (i), (v) und den Definitionen von Sp (a, b) bzw. Tp (t) in 1 bzw. 3(1) ist p−1 p−1 p−1 p−1 c(c2 − t) d(d2 − t) Tp (t)2 = (Tp (1)2 + Tp (t0 )2 ) = 2 p p t=0 t=0 c,d=1
(1)
=
p−1
p−1 cd (t − c2 )(t − d2 )
p
c,d=1
=
p−1
cd
c,d=1
p
t=0
p
Sp (−c2 , −d2 ).
Wegen Lemma 1 ist hier die letzte Summe weiter gleich p−1 p−1 cd cd (2) (p − 1) − . p p c,d=1 p|(c2 −d2 )
c,d=1 p /| (c2 −d2 )
Nun ist p|(c2 − d2 ) gleichbedeutend damit, daß modulo p entweder d ≡ c oder d ≡ −c gilt; wegen p ≡ 1 (mod 4) und dem ersten Erg¨ anzungssatz ist in jedem c2 Fall ( cd ) = ( ) = 1 und so ist die erste Summe in (2) gleich 2(p − 1). Die zweite p p Summe in (2) ist unter Ber¨ ucksichtigung von Satz 2.3(ii), (iv) p−1 c c=1
p
p−1 d=1 d≡±c(p)
d p
=
p−1 c c=1
p
0−
p−1 c 2 c −c − = −2 = −2(p − 1). p p p c=1
Beachtet man die Gleichheit von (1) und (2) sowie die zuletzt gefundenen Werte der Summen in (2), so folgt p−1 (Tp (1)2 + Tp (t0 )2 ) = (p − 1)(2(p − 1) + 2) , 2 was unmittelbar zu (vi) f¨ uhrt.
152
3. Potenzreste, insbesondere quadratische Reste
√ Aus (vi) folgt jetzt |Tp (1)| ≤ 2 p bei p ≡ 1 (mod 4), was bei großem p nat¨ urlich viel besser ist als das sich aus 3(1) trivial mit Dreiecksungleichung ergebende |Tp (1)| ≤ p − 1. Damit kann man aus Satz 3 gewinnen das Korollar.
F¨ ur alle großen Primzahlen p gilt Qp (3) =
1 √ p + O( p). 8
Dies hat gegen¨ uber Satz 3 den Vorteil einer einheitlichen Formulierung, die u ¨berdies die maximale Gr¨oßenordnung des Anteils Tp (1) in Satz 4 in Evidenz setzt. Daf¨ ur aber hat man jetzt f¨ ur Qp (3) − 18 p nur noch eine Absch¨ atzung, jedoch keine Gleichheit mehr. Bemerkung. Nach 3(1) sind alle Tp (1) ganzzahlig und somit sind bei p ≡ unden beide gerade. 1 (mod 4) in (vi) des Lemmas Tp (1), Tp (t0 ) aus Kongruenzgr¨ Setzt man daher x := 12 Tp (1), y := 12 Tp (t0 ), so ist (x, y) eine ganzzahlige L¨ osung der diophantischen Gleichung (3)
X 2 + Y 2 = p.
Proposition 1.6.10 lehrt, daß man damit im wesentlichen alle ganzzahligen L¨ osungen von (3) kennt. An diese Gleichung wird in 4.1.1 unmittelbar angekn¨ upft.
Kapitel 4. Additive Probleme und diophantische Gleichungen
In § 1 dieses Kapitels werden einige additive Fragen studiert. Dabei werden zwei weitere Beweise f¨ ur das schon in 3.3.4 gezeigte Resultat u ¨ber die Darstellbarkeit von Primzahlen als Summe zweier Quadrate gegeben. Interessant sind hierbei die Beweismittel: Einmal wird der erste Erg¨ anzungssatz zum quadratischen Reziprozit¨ atsgesetz mit einem Dirichletschen Schubfachschluß kombiniert, das andere Mal wird auf das Prinzip des kleinsten Elements ¨ zur¨ uckgegriffen. Uberdies sind jeweils (wie u ¨brigens h¨ aufig in diesem Kapitel) Kongruenzbetrachtungen anzustellen. Im weiteren Verlauf des § 1 wird die Darstellbarkeit nat¨ urlicher Zahlen als Summe von zwei, drei oder vier Quadratzahlen untersucht, wobei ein Satz von Lagrange besagt, daß vier Quadrate zur Darstellung immer ausreichen. Wann man mit zwei bzw. drei Quadraten auskommt, kann genau charakterisiert werden. Auf die Anzahl der Darstellungen nat¨ urlicher Zahlen als Summe von zwei bzw. vier Quadraten wird ebenso eingegangen wie auf die Darstellbarkeit als Summe von k–ten Potenzen. In den Paragraphen 2 und 3 geht es erneut um die in § 3 von Kap. 1 erstmals angeschnittene Thematik der diophantischen Gleichungen. § 2 besch¨aftigt sich mit rationalen Punkten auf algebraischen Kurven. Dabei wird mit dem von Euklid v¨ ollig gel¨osten Problem der Bestimmung aller rechtwinkligen Dreiecke ganzzahliger Seitenl¨angen begonnen; hier ist X 2 + Y 2 = 1 die Gleichung der Kurve. Weiter wird die allgemeine Kurve zweiten Grades diskutiert ebenso wie die Diophantsche Sekanten– bzw. Tangentenmethode zur Behandlung von Kurven dritten oder vierten Grades. Zum Schluß dieses Paragraphen wird auf die ber¨ uhmte, inzwischen bewiesene Fermatsche Vermutung eingegangen. Gegenstand von § 3 ist die Pellsche Gleichung X 2 − dY 2 = 1 bei nat¨ urlichem, nicht quadratischem d. Mit einem Satz u ¨ber die Ann¨ aherung reeller irrationaler Zahlen durch rationale gelingt die v¨ ollige Kl¨ arung der Struktur der unendlich vielen ganzzahligen L¨osungen dieser Gleichung. Die dabei entwickelten Methoden sind auch geeignet zur Untersuchung der Einheiten reell–quadratischer
154
4. Additive Probleme und diophantische Gleichungen
Zahlk¨ orper und der ganzzahligen Punkte auf der allgemeinen algebraischen Kurve zweiten Grades.
§ 1.
Potenzsummen, insbesondere Quadratsummen
1. Primzahlen als Summe zweier Quadrate. In 3.3.4 wurde gezeigt, daß f¨ ur jede Primzahl p ≡ 1 (mod 4) die diophantische Gleichung (1)
X2 + Y 2 = p
ganzzahlig l¨ osbar ist. Dort wurde f¨ ur jedes solche p eine L¨ osung explizit angegeben; daß daraus sogar alle L¨ osungen von (1) konstruiert werden k¨ onnen, ist aus Proposition 1.6.10 bekannt, wird sich aber sogleich nochmals ergeben. Ist n¨ amlich (x, y) ∈ Z2 eine L¨osung von (1), so d¨ urfen o.B.d.A. x, y ∈ N angenommen werden und es ist x = y. So sind (x, y), (x, −y), (−x, y) und (−x, −y) (man faßt diese vier verschiedenen Paare bisweilen in der Kurzschreibweise (±x, ±y) zusammen) sowie die daraus durch Vertauschung von x und y entstehenden vier Paare insgesamt acht paarweise verschiedene L¨osungen von (1). Es wird sogleich bewiesen, daß mit diesen acht bereits s¨amtliche L¨osungen von (1) ersch¨ opft sind. Genau dann, wenn (1) l¨ osbar ist, sagt man, p sei als Summe zweier Quadratzahlen (oder k¨ urzer: zweier Quadrate) darstellbar. Die vier L¨ osungen (±x, ±y) von (1) entsprechen selbstverst¨andlich einer Darstellung von p als Summe der beiden Quadrate x2 , y 2 in dieser Reihenfolge. Man hat nun folgenden ¨ Satz. F¨ ur Primzahlen p gilt folgende Aquivalenz: (i) Es ist p ≡ 3 (mod 4). (ii) p ist als Summe zweier Quadrate darstellbar und die Darstellung ist, abgesehen von der Reihenfolge der Summanden, eindeutig. Beweis. Um den vorher diskutierten Fall p ≡ 1 (mod 4) zu Ende zu f¨ uhren, seien (x, y) und (u, v) L¨ osungen von (1) in nat¨ urlichen Zahlen. O.B.d.A. darf √ x < y und u < v vorausgesetzt werden und offenbar ist auch x, y, u, v < p sowie p |xyuv klar. Wegen x2 v 2 − y 2 u2 = (p − y 2 )v 2 − y 2 u2 = p(v 2 − y 2 ) folgt p|(xv − yu)(xv + yu). Ist p|(xv + yu), so ergibt sich aus 0 < xv + yu < √ 2( p)2 = 2p die Gleichung xv + yu = p. Die leicht durch Ausmultiplikation einsichtige Formel (2)
(x2 + y 2 )(u2 + v 2 ) = (xu − yv)2 + (xv + yu)2
§ 1.
Potenzsummen, insbesondere Quadratsummen
155
f¨ uhrt dann zu p2 = (xu − yv)2 + p2 , also xu = yv entgegen yv > xu. Es muß √ √ also p|(xv − yu) gelten und wegen −p = −( p)2 < xv − yu < ( p)2 = p heißt dies xv = yu. Die Teilerfremdheit von x und y impliziert x|u, etwa u = dx; dann muß auch v = dy gelten und p = u2 + v 2 = d2 (x2 + y 2 ) = d2 p ergibt d = 1 und somit u = x, v = y. F¨ ur p = 2 ist (1) ersichtlich l¨osbar mit genau den vier L¨ osungen (±1, ±1). F¨ ur p ≡ 3 (mod 4) ist (1) jedoch unl¨ osbar; denn das Quadrat einer ganzen Zahl ist kongruent 0 oder 1 modulo 4 und so ist f¨ ur x, y ∈ Z stets x2 + y 2 ≡ 3 (mod 4). Bemerkungen. 1) F¨ ur reelle x, y, u, v folgt der “Zwei–Quadrate–Satz” (2) aus der Produktregel |z| |w| = |zw| f¨ ur die komplexen Zahlen z = x + iy, w = u + iv. Dar¨ uberhinaus l¨ aßt sich (2) wie oben durch Nachrechnen in jedem kommutativen Ring einsehen. 2) Der vorstehend bewiesene Satz wird Fermat (1640) zugeschrieben, obwohl ihn A. Girard schon einige Jahre fr¨ uher gekannt zu haben scheint. W¨ ahrend Fermat in einem Brief an Mersenne behauptete, er habe einen Beweis f¨ ur die im Satz notierte Aussage (ohne den Zusatz u ¨ber die Eindeutigkeit), scheint aber der erste publizierte Beweis auf Euler (1754) zur¨ uckzugehen.
2. Thues Lemma. F¨ ur den “nichttrivialen” Teil von Satz 1, n¨ amlich die L¨osbarkeit von 1(1) im Falle p ≡ 1 (mod 4), soll hier ein zweiter Beweis angegeben werden; in 5 wird ein dritter hinzugef¨ ugt. Diese beiden Beweise sind viel einfacher, als wenn man sich auf das Resultat von E. Jacobsthal in 3.3.4 st¨ utzt. Die wesentlichen Hilfsmittel beim zweiten Beweis sind einerseits der erste Erg¨an– zungssatz zum quadratischen Reziprozit¨ atsgesetz (vgl. 3.2.6) und andererseits das bereits fr¨ uher formulierte und angewandte Dirichletsche Schubfachprinzip (vgl. 2.3.1). Mit letzterem beweist man leicht folgendes Lemma von Thue. Seien , m, u, v ∈ Z, 0 < u, v ≤ m < uv und (, m) = 1. Dann gibt es x, y ∈ N mit x < u und y < v, so daß y ≡ x oder y ≡ −x (mod m) gilt. Beweis. Man sieht sich die uv ganzen Zahlen ξ + η mit ξ ∈ {0, . . . , u − 1}, η ∈ {0, . . . , v − 1} an. Nach Voraussetzung sind dies mehr als m St¨ uck und nach dem Dirichletschen Schubfachprinzip muß es mindestens eine Restklasse modulo m geben, in die mindestens zwei der ξ + η, etwa ξ1 + η1 und ξ2 + η2 , hineinfallen. Es ist also (1)
(η2 − η1 ) ≡ ξ1 − ξ2
(mod m).
156
4. Additive Probleme und diophantische Gleichungen
Nun w¨ urde η2 = η1 die Teilbarkeitsbedingung m|(ξ2 − ξ1 ) implizieren und aus urde sich auch ξ2 = ξ1 ergeben. O.B.d.A. darf die Nume|ξ2 − ξ1 | < u ≤ m w¨ rierung also so angenommen werden, daß y := η2 − η1 > 0 ist; y < v ist damit klar. Aus x := |ξ1 − ξ2 | und (1) folgt, daß eine der Kongruenzen im Thueschen Lemma gelten muß. Ebenfalls einsichtig ist 0 < x < u, da aus x = 0 und (1) die Teilbarkeitsbeziehung m|y und also m|y (damit m ≤ y, entgegen y < v ≤ m) folgen w¨ urde; man beachte (, m) = 1. Zweiter Beweis f¨ ur die L¨ osbarkeit von 1(1) bei p ≡ 1 (mod 4). Nach dem ersten Erg¨anzungssatz zum quadratischen Reziprozit¨ atsgesetz ist −1 quadratischer Rest modulo p und so gibt es ein ∈ Z mit 2 ≡ −1 (mod p), insbesondere √ p |. Nun wendet man Thuees Lemma an mit m = p, u = v = [ p] + 1, welch √ letzteres wegen p ≥ 5 tats¨achlich p nicht u ¨bersteigt; weiter ist uv > ( p)2 = m √ erf¨ ullt. Nach dem Lemma gibt es x, y ∈ N mit x, y ≤ [ p], so daß y ≡ x √ √ oder y ≡ −x (mod p) gilt, also −y 2 ≡ 2 y 2 ≡ x2 (mod p). Wegen [ p] < p √ urliche Zahl kann sogar auf x, y < p geschlossen werden und daher ist die nat¨ x2 + y 2 einerseits durch p teilbar, andererseits kleiner als 2p; daher l¨ ost (x, y) die Gleichung 1(1).
3. Nat¨ urliche Zahlen als Summe zweier Quadrate. Bisher wurden Primzahlen bez¨ uglich ihrer Darstellbarkeit als Summe zweier Quadrate untersucht; nun soll dieselbe Frage f¨ ur beliebige nat¨ urliche Zahlen gekl¨art werden. Bei festem n ∈ N wird also nach der L¨ osbarkeit der diophantischen Gleichung (1)
X2 + Y 2 = n
gefragt. Sei (1) f¨ ur ein gewisses n l¨ osbar und (x, y) eine L¨ osung; diese heißt primitiv (oder eigentlich) bzw. imprimitiv (oder uneigentlich), wenn x und y oßten teilerfremd bzw. nicht teilerfremd sind. Klar ist d2 |n, wenn d den gr¨ gemeinsamen Teiler von x und y bezeichnet. Weiter ist einsichtig, daß (1) bei quadratfreiem n (speziell also f¨ ur Primzahlen n) h¨ ochstens primitive L¨ osungen besitzen kann. Als kleine Vorbereitung f¨ ur den n¨ achsten Satz ben¨otigt man folgende Proposition. Hat n ∈ N eine primitive Darstellung als Summe zweier Quadrate, d.h. hat (1) eine primitive L¨ osung, so hat n keinen Primfaktor ≡ 3 (mod 4). Beweis. Es m¨oge (x, y) ∈ Z2 die Gleichung (1) l¨ osen und x, y seien teilerfremd; p sei eine n teilende Primzahl. Aus x2 + y 2 ≡ 0 (mod p) folgt dann p |xy; ist y1 modulo p zu y invers, so gilt die Kongruenz (xy1 )2 + 1 ≡ 0 (mod p), d.h. −1 ist quadratischer Rest modulo p und so ist p ≡ 3 (mod 4).
§ 1.
Potenzsummen, insbesondere Quadratsummen
157
Nun k¨ onnen leicht alle n ∈ N bestimmt werden, f¨ ur die (1) l¨ osbar ist. Satz.
F¨ ur nat¨ urliche Zahlen n sind a¨quivalent:
(i)
Gleichung (1) ist l¨ osbar.
(ii)
F¨ ur jede Primzahl p ≡ 3 (mod 4) ist die Vielfachheit νp (n) gerade.
Beweis. Ist νp (n) f¨ ur alle Primzahlen p ≡ 3 (mod 4) gerade, so ist n0 :=
pνp (n) =
p≡3 (4)
pνp (n)/2
2
+ 02
p≡3 (4)
und somit ist (1) f¨ ur n0 l¨ osbar. Nach Satz 1 ist 1(1) auch f¨ ur alle Primzahlen p ≡ 3 (mod 4) l¨osbar und nun wendet man endlich oft folgende Regel an: Ist (1) f¨ ur n1 , n2 ∈ N l¨ osbar, so auch f¨ ur das Produkt n1 n2 ; denn x2 + y 2 = n1 , 2 2 u + v = n2 und 1(2) implizieren (xu − yv)2 + (xv + yu)2 = n1 n2 . Sei nun umgekehrt (1) l¨ osbar, (x, y) eine L¨ osung und d der gr¨ oßte gemeinsame Teiler von x und y. Dann sind x1 := x/d und y1 := y/d zueinander teilerfremd, ur n1 := n/d2 ∈ N die primitive L¨ osung (x1 , y1 ). es ist d2 |n und so besitzt (1) f¨ Nach der vorausgeschickten Proposition hat n/d2 keinen Primfaktor ≡ 3 (mod 4) und daher ist die Vielfachheit jeder solchen Primzahl in n gerade. Der hier gezeigte Satz beschreibt abschließend die Menge S der nat¨ urlichen Zahlen, die als Summe zweier Quadrate darstellbar sind. Offenbar ist S eine unendliche Menge, aber auch N \ S, letzteres z.B. deswegen, weil es unendlich viele Primzahlen ≡ 3 (mod 4) gibt (vgl. 3.2.10). Man weiß jedoch viel genauer, daß dieses Komplement von S bez¨ uglich N in folgendem Sinne “die meisten” nat¨ urlichen Zahlen enth¨ alt: Ist S(x) := #{n ∈ N : n ≤ x, n ∈ S} f¨ ur reelles x gesetzt, so gilt nach Landau [12], § 183 x S(x) ∼ c √ log x
bei x → ∞
mit einer gewissen reellen Konstanten c > 0. Nach Definition von ∼ in 1.4.12 beinhaltet dies limx→∞ S(x) urlichen Zahlen unterx = 0, d.h. der Anteil der nat¨ halb x, die Summe zweier Quadrate sind, an allen nat¨ urlichen Zahlen unterhalb x konvergiert gegen Null. In diesem Sinne lassen sich also “die wenigsten” nat¨ urlichen Zahlen als Summe zweier Quadrate schreiben. Es ist klar, daß sich die Chancen verbessern werden, jede nat¨ urliche Zahl als Summe von Quadraten darstellen zu k¨onnen, wenn man die Anzahl der zugelassenen Summanden erh¨oht. Dies Problem wird in 4 weiter verfolgt.
158
4. Additive Probleme und diophantische Gleichungen
4. Nat¨ urliche Zahlen als Summe von vier Quadraten: Lagranges Satz. Am Ende von 3 wurde festgestellt, daß eine nat¨ urliche Zahl im allgemeinen nicht als Summe zweier Quadrate geschrieben werden kann. Wie das Beispiel 7 = 22 + 12 + 12 + 12 zeigt, wird man auch mit drei Quadraten nicht immer auskommen. Jedoch hat 1770 Lagrange (Oeuvres III, 189–201) den ersten Beweis daf¨ ur publiziert, daß vier Quadrat–Summanden zur Darstellung jeder nat¨ urlichen Zahl ausreichend sind. Hauptziel dieses Abschnitts ist der Beweis eben dieses Ergebnisses: Satz von Lagrange. Jede nat¨ urliche Zahl ist als Summe von vier Quadraten darstellbar. Drei Jahre nach Lagrange hat Euler (Opera Omnia Ser. 1, III, 218–239) dessen Beweis deutlich vereinfacht. Hier wird im wesentlichen Eulers Weg nachvollzogen; dazu beginnt man mit folgendem Lemma A. Zu jeder Primzahl p gibt es ganze nichtnegative x, y mit x, y ≤ 12 p und x2 + y 2 + 1 ≡ 0 (mod p). Ist p ≡ 3 (mod 4), so kann hier y = 0 gew¨ahlt werden. Beweis. F¨ ur p = 2 nehme man x = 1, y = 0. F¨ ur p ≡ 1 (mod 4) ist X 2 ≡ −1 (mod p) l¨ osbar und man nehme x als die im absolut kleinsten Restsystem modulo p gelegene positive L¨osung. Ist p ≡ 3 (mod 4), so sei c die kleinste nat¨ urliche Zahl, die quadratischer Nichtrest modulo p ist; es ist c ≥ 2 und die nat¨ urliche Zahl c − 1 ist quadratischer Rest modulo p. Daher und wegen c 2 2 2 ( −c ) = ( −1 p p )( p ) = (−1) = 1 gibt es x, y ∈ Z, die x ≡ c − 1, y ≡ −c und also x2 + y 2 ≡ −1 (mod p) gen¨ ugen; die x, y k¨ onnen wieder positiv und im absolut kleinsten Restsystem modulo p gew¨ahlt werden wegen p |c(c − 1), d.h. p |xy. Legt man auf dem Zusatz u ¨ber p ≡ 3 (mod 4) keinen Wert, so kann man den Schluß mit dem Dirichletschen Schubfachprinzip anstelle des quadratischen Restverhaltens ziehen: F¨ ur ungerade p betrachtet man die beiden Mengen 1 {0, −12 , . . . , −( (p − 1))2 } 2
und
1 {1, 1 + 12 , . . . , 1 + ( (p − 1))2 } 2
von jeweils 12 (p + 1) modulo p inkongruenten Zahlen. Insgesamt hat man p + 1 ganze Zahlen, aber nur p Restklassen modulo p. Somit muß eine Zahl der ersten Menge zu einer gewissen Zahl der zweiten Menge modulo p kongruent sein und dies gibt die Behauptung, der man noch entnimmt:
§ 1.
Potenzsummen, insbesondere Quadratsummen
159
Lemma B. Zu jeder ungeraden Primzahl p gibt es x1 , x2 , x3 , x4 ∈ {0, . . . . . . , 12 (p − 1)} und h ∈ {1, . . . , p − 1}, so daß gilt x21 + x22 + x23 + x24 = hp. F¨ ur p ≡ 1 (mod 4) kann x3 = x4 = 0 gew¨ahlt werden. Beweis. Mit den x, y aus Lemma A w¨ahlt man x1 = x, x2 = 1, x3 = y, x4 = 0 und hat 0 < x21 + . . . + x24 < 4( 21 p)2 = p2 sowie p|(x21 + . . . + x24 ), woraus sich die Behauptung ergibt. Der entscheidende Schritt zum Beweis des Lagrangeschen Satzes ist enthalten in Lemma C. F¨ ur jede Primzahl p ist die diophantische Gleichung (1)
X12 + X22 + X32 + X42 = p
l¨ osbar. Beweis. F¨ ur p = 2 ist dies klar. Sei nun p = 2 fest und h0 = h0 (p) die kleinste nat¨ urliche Zahl, zu der es x1 , . . . , x4 ∈ Z gibt, die (2)
x21 + x22 + x23 + x24 = h0 p
gen¨ ugen. Die Existenz von h0 sowie die Ungleichung h0 < p sind aus Lemma B zu entnehmen; es bleibt jetzt noch h0 = 1 zu zeigen. W¨ are h0 gerade, so w¨aren alle, zwei oder keine der Zahlen xi ungerade und ihre Numerierung darf o.B.d.A. so vorausgesetzt werden, daß x1 − x2 und x3 − x4 gerade sind. Dann sind auch x1 + x2 , x3 + x4 gerade und man setzt z1 := 1 1 1 1 2 (x1 + x2 ), z2 := 2 (x1 − x2 ), z3 := 2 (x3 + x4 ), z4 := 2 (x3 − x4 ), was wegen (2) zu z12 + z22 + z32 + z42 = h0 p mit nat¨ urlichem h0 := 12 h0 < h0 f¨ uhrt. Dies seinerseits widerspricht der Minimaleigenschaft von h0 . Nun werde angenommen, h0 sei ungerade und mindestens gleich 3. Zu den xi in (2) k¨ onnen yi aus dem absolut kleinsten Restsystem modulo h0 so gew¨ahlt ur i = 1, . . . , 4 gilt. Nicht alle xi k¨ onnen durch h0 werden, daß yi ≡ xi (mod h0 ) f¨ teilbar sein (sonst w¨are h0 |p) und so sind nicht alle yi Null, also 0 < y12 +. . .+y42 < 4( 12 h0 )2 = h20 und y12 + . . . + y42 ≡ x21 + . . . + x24 ≡ 0 (mod h0 ). Daher ist (3)
y12 + y22 + y32 + y42 = h1 h0
160
4. Additive Probleme und diophantische Gleichungen
mit nat¨ urlichem h1 < h0 . Nun hat man die zu 1(2) analoge, auf Euler (1748) zur¨ uckgehende Formel 4 i=1
x2i
4
4 yi2 = xi yi )2 + (−x1 y2 + x2 y1 − x3 y4 + x4 y3 )2
i=1
i=1
+ (−x1 y3 + x3 y1 − x4 y2 + x2 y4 )2 + (−x1 y4 + x4 y1 − x2 y3 + x3 y2 )2 ,
(4)
die man wieder durch einfaches Ausrechnen best¨ atigen kann. Offenbar sind die drei letzten Klammern rechts in (4) jeweils durch h0 teilbar und wegen 4 i=1
xi yi ≡
4
x2i = h0 p ≡ 0 (mod h0 )
i=1
trifft dies auch f¨ ur die erste Klammer rechts in (4) zu. Schreibt man diese vier Klammern daher nacheinander als h0 u1 ,h0 u2 , h0 u3 , h0 u4 mit ganzen ui , so ergibt sich aus (2), (3), (4) h1 h20 p = h20 (u21 + u22 + u23 + u24 ). Nach K¨ urzen durch h20 erh¨alt man hieraus einen Widerspruch zu der bei (2) formulierten Minimaleigenschaft von h0 ; man beachte h1 < h0 . Beweis des Satzes von Lagrange. (4) besagt, daß das Produkt zweier nat¨ urlicher Zahlen, die beide als Summe von vier Quadraten darstellbar sind, selbst ebenfalls in dieser Weise darstellbar ist. Da nach Lemma C jede Primzahl als Summe von vier Quadraten darstellbar ist, hat man den gew¨ unschten Satz. Bemerkung. F¨ ur reelle x1 , . . . , x4 , y1 , . . . , y4 ergibt sich der “Vier–Quadrate– Satz” (4) aus der Produktregel |x| |y| = |xy| f¨ ur die Quaternionen x := x1 + x2 i + x3 j + x4 k, y := y1 + y2 i + y3 j + y4 k, wenn man gem¨ aß der Festsetzungen i2 = j 2 = k2 = −1, ij = k = −ji, jk = i = −kj, ki = j = −ik √ multipliziert und noch die Definition x ¯ := x1 − x2 i − x3 j − x4 k und |x| := x¯ x beachtet. Wie fr¨ uher 1(2) bleibt auch (4) in jedem kommutativen Ring g¨ ultig.
5. Nochmals Primzahlen als Summe zweier Quadrate. Sei jetzt p ≡ 1 (mod 4) und wie in 2 angek¨ undigt soll f¨ ur solche Primzahlen p hier ein dritter Beweis f¨ ur die L¨ osbarkeit von 1(1) gegeben werden, der eng mit demjenigen verwandt ist, der zuletzt zur L¨osbarkeit von 4(1) gef¨ uhrt hat:
§ 1.
Potenzsummen, insbesondere Quadratsummen
161
Man definiert g0 = g0 (p) als kleinste nat¨ urliche Zahl, zu der es x1 , x2 ∈ Z gibt, ugen; die Existenz von g0 und die Absch¨ atzung g0 < p die x21 + x22 = g0 p gen¨ sind aus demselben Grund wie in 4 bei h0 klar und es bleibt wieder g0 = 1 einzusehen. W¨are g0 gerade, so w¨aren beide oder kein xi ungerade, jedenfalls also sind x1 + x2 und x1 − x2 gerade und mit z1 , z2 wie in 4 ist z12 + z22 = g0 p mit nat¨ urlichem g0 := 12 g0 < g0 entgegen der Definition von g0 . Ist g0 ≥ 3 und ungerade, so definiere man y1 , y2 analog wie in 4. Nicht beide xi k¨ onnen durch g0 teilbar sein, da sonst g0 |p gelten m¨ ußte, und so sind nicht alle yi Null, also 0 < y12 + y22 < 2( 12 g0 )2 < g02 und y12 + y22 ≡ x21 + x22 ≡ 0 (mod g0 ), d.h. urlichem g1 < g0 . Nach 1(2) ist y12 + y22 = g1 g0 mit nat¨ g1 g02 p = (x1 y1 + x2 y2 )2 + (x1 y2 − x2 y1 )2 und hier sind beide Klammern durch g0 teilbar, die erste wegen x1 y1 + x2 y2 ≡ x21 + x22 = g0 p ≡ 0 (mod g0 ). Wie in 4 findet man ganze u1 , u2 , die u21 + u22 = g1 p gen¨ ugen, im Widerspruch zur Definition von g0 .
6. Summen dreier Quadrate. Bereits zu Anfang von 4 war zu erkennen, daß es gewisse nat¨ urliche Zahlen n gibt, f¨ ur die die Gleichung (1)
X12 + X22 + X32 = n
unl¨ osbar ist. Die n mit dieser Eigenschaft kann man wie folgt charakterisieren: Satz. Genau dann, wenn die nat¨ urliche Zahl n die Gestalt 4a u mit a, u ∈ N0 , u ≡ 7 (mod 8) hat, ist (1) unl¨ osbar. D.h. genau diese n sind nicht als Summe von drei Quadraten darstellbar; hier braucht man wirklich vier Summanden. Da Quadrate ganzer Zahlen ≡ 0, 1 oder 4 (mod 8) sind, ist die Summe dreier Quadrate ≡ 7 (mod 8). Ist also u ≡ 7 (mod 8), so ist (1a )
X12 + X22 + X32 = 4a u
bei a = 0 unl¨ osbar. Sei nun a ∈ N und die Unl¨ osbarkeit von (1a−1 ) bereits bekannt. Ist dann (1a ) l¨ osbar und (x1 , x2 , x3 ) ∈ Z3 eine solche L¨osung, so ist x21 + x22 + x23 modulo 4 kongruent der Anzahl der ungeraden xi , wegen (1a ) also kongruent Null. Alle xi sind demnach gerade und yi := 12 xi f¨ ur i = 1, 2, 3 f¨ uhrt zu y12 + y22 + y32 = 4a−1 u im Widerspruch zur Unl¨osbarkeit von (1a−1 ). Damit ist die leichtere Richtung des obigen Satzes bewiesen.
162
4. Additive Probleme und diophantische Gleichungen
Die schwierigere wurde erstmals von Legendre (1798) und Gauss (1801) erledigt, soll hier jedoch nicht ausgef¨ uhrt werden. Der interessierte Leser kann hierzu etwa Landau [13], Band I konsultieren.
7. Warings Problem und Hilberts Satz. In seinen Meditationes Algebraicae (1770, S. 203–204) schrieb Waring im selben Jahr, in dem Lagrange Satz 4 bewiesen hatte: “Omnis integer numerus vel est cubus; vel e duobus, tribus, 4, 5, 6, 7, 8, vel novem cubus compositus: est etiam quadratoquadratus; vel e duobus, tribus & c. usque ad novemdecim compositus & sic deinceps.” In der Ausgabe von 1782 ist auf Seite 349 hinzugef¨ ugt: “... consimilia etiam affirmari possunt (exceptis excipiendis) de eodem numero quantitatum earundem dimensionum.” Offenbar behauptete Waring also, allerdings ohne Angabe irgendeines Beweises, jede nat¨ urliche Zahl sei Summe von h¨ ochstens neun Kuben, von h¨ ochstens neunzehn Biquadraten usw. Man hat diese Feststellung sp¨ ater so als Waringsches Problem interpretiert: Zu jedem ganzen k ≥ 2 gibt es eine nat¨ urliche Zahl g derart, daß jedes n ∈ N als Summe von g ganzen nichtnegativen Zahlen darstellbar ist, die k–te Potenzen sind. Der Lagrangesche Satz in Verbindung mit Satz 6 lehrt, daß man f¨ ur k = 2 mit g = 4, aber keinem kleineren g auskommt. Historisch das n¨achste Resultat d¨ urfte von J. Liouville (1859) stammen, der f¨ ur k = 4 beweisen konnte, daß jedenfalls g = 53 ausreicht. Im Jahre 1909 gab es dann zwei bedeutende Fortschritte: A. Wieferich bewies, daß g = 9 (aber kein kleineres g) f¨ ur k = 3 ausreicht und Hilbert gelang die volle L¨ osung des Problems von Waring, indem er dessen Vermutung best¨ atigen konnte. Seither ist eine u ¨beraus umfangreiche Literatur, vor allem im Bereich der analytischen Zahlentheorie, entstanden, die sich mit dem Waring–Hilbertschen Ergebnis befaßt. Nachdem f¨ ur jedes k ≥ 2 die Existenz eines g mit den obigen Eigenschaften bewiesen war, war die n¨ achste interessierende Frage, f¨ ur jedes k ≥ 2 das kleinste ausreichende g tats¨achlich zu ermitteln; dieses werde hinfort wie u ¨blich g(k) genannt. Es ist plausibel, daß g(k) mit k anwachsen muß. Dies wird pr¨ azisiert in der folgenden Proposition.
F¨ ur jedes ganze k ≥ 2 ist g(k) ≥ 2k +
3 k − 2. 2
§ 1.
163
Potenzsummen, insbesondere Quadratsummen
Beweis. Man betrachte die nat¨ urlichen Zahlen 3 k nk := 2k − 1, 2 die kleiner als 3k sind. F¨ ur ihre Darstellung in der Form xk1 + . . . + xkg(k) m¨ ussen uck gleich 0, bk St¨ uck offenbar alle xi gleich 0, 1 oder 2 sein. Sind etwa ak St¨ gleich 1 und ck St¨ uck gleich 2, so ist nk = 2k ck + bk und also g(k) = ak + bk + ck ≥ bk + ck = nk − ck (2k − 1) ≥ nk − 3 = 2k + ( )k − 2 =: g ∗ (k), 2
3 k ( ) − 1 2k − 1 2
da ck < [( 32 )k ] bleiben muß. Bei kleinen Werten von k hat man folgende Unterschranken g ∗ (k) f¨ ur g(k) gem¨aß obiger Proposition: k ∗
g (k)
2
3
4
5
6
7
8
9
10
4
9
19
37
73
143
279
548
1079
Man vermutet, daß g(k) = g ∗ (k) f¨ ur k = 2, 3, . . . gilt. F¨ ur k = 2 bzw. 3 ist dies durch die Ergebnisse von Lagrange bzw. Wieferich best¨atigt, f¨ ur k = 4 durch R. Balasubramanian, J.–M. Deshouillers und F. Dress (1985) und f¨ ur k = 5 durch J.–R. Chen (1964). Ebenfalls 1964 konnte die fragliche Gleichheit f¨ ur alle k mit 400 < k ≤ 200 000 von R.M. Stemmler bewiesen werden, nachdem dies f¨ ur den Bereich 6 ≤ k ≤ 400 schon 1936 von L.E. Dickson erledigt worden war. 1990 konnten J.M. Kubina und M.C. Wunderlich die Gleichheit sogar bis 471 600 000 nachweisen. Auch im Bereich k > 471 600 000 hat man fast vollst¨ andige Klarheit: Mit einer Verfeinerung des Thue–Siegel–Rothschen Approximationssatzes 6.2.1 konnte Mahler 1957 nachweisen, daß g(k) > g ∗ (k) h¨ ochstens endlich oft m¨ oglich ist.
8. Anmerkungen u ¨ ber Darstellungsanzahlen. F¨ ur die Zwecke dieses Abschnitts werde (1)
rg (n) := #{(m1 , . . . , mg ) ∈ Zg : m21 + . . . + m2g = n}
bei ganzen g > 0 und n gesetzt. In den S¨atzen 3 bzw. 6 wurden die ganzen n > 0 mit r2 (n) > 0 bzw. r3 (n) > 0 charakterisiert, w¨ ahrend Lagranges Satz 4 nichts anderes als r4 (n) > 0 f¨ ur alle nat¨ urlichen n besagt.
164
4. Additive Probleme und diophantische Gleichungen
Hier soll noch ein m¨oglicher analytischer Zugang zu expliziten Formeln f¨ ur die Darstellungsanzahl rg (n) angedeutet werden. Zun¨achst ist aus (1) klar, daß die Gleichung (2)
zm
2
g =
∞
rg (n)z n
n=0
m∈Z
f¨ ur alle komplexen z mit |z| < 1 gilt. Setzt man f¨ ur dieselben z 2 zm , (3) Θ(z) := m∈Z
so kann man hoffen, aus (2) durch Koeffizientenvergleich rg (n) zu ermitteln, falls eine geeignete Reihenentwicklung von Θ(z)g gelingt. Tats¨achlich hat in dieser Richtung Jacobi die beiden Formeln (4)
Θ(z)2 = 1 + 4
∞ (−1) z 2+1 1 − z 2+1 =0
bzw. (5)
Θ(z)4 = 1 + 8
∞ =1
z 1 + (−z)
entdeckt und in einem Brief vom 9. September 1828 Legendre mitgeteilt. Beweise f¨ ur beide Formeln finden sich in § 40 von Jacobis ber¨ uhmten Fundamenta Nova Theoriae Functionum Ellipticarum (= Gesammelte Werke I, 49–239) aus dem Jahre 1829. Aus (4) folgt nun leicht mittels geometrischer Reihe in |z| < 1 (6)
Θ(z)2 = 1 + 4
∞ ∞
(−1) z (2+1)m = 1 + 4
=0 m=1
mit (7)
δ(n) :=
∞
δ(n)z n
n=1
(−1)(d−1)/2
d|n d ungerade
f¨ ur n ∈ N. F¨ ur dieselben n ergibt sich aus (2), (3) und (6) (8)
r2 (n) = 4δ(n).
Die vollst¨ andige Berechnung von r2 (n) mittels (8) wird vorbereitet durch folgendes
§ 1. Lemma. kativ.
165
Potenzsummen, insbesondere Quadratsummen
Die durch (7) definierte zahlentheoretische Funktion δ ist multipli-
Beweis. Seien n1 , n2 ∈ N zueinander teilerfremd. Jedes ungerade d ∈ N mit d|n1 n2 l¨ aßt sich dann eindeutig in der Form d = d1 d2 mit d1 |n1 , d2 |n2 und 2 |d1 , 2 |d2 schreiben, was zu
δ(n1 n2 ) =
(−1)(d1 d2 −1)/2 =
d1 |n1 , d2 |n2 d1 ,d2 ungerade
2
j=1
dj |nj dj ungerade
(−1)(dj −1)/2
= δ(n1 )δ(n2 ) f¨ uhrt; man beachte dabei, daß 0 ≡ (d1 − 1)(d2 − 1) = (d1 d2 − 1) − (d1 + d2 − 2) (mod 4) a¨quivalent ist mit 12 (d1 d2 − 1) ≡ 12 (d1 − 1) + 12 (d2 − 1) (mod 2). Dies Lemma f¨ uhrt jetzt leicht zum Satz von Gauss.
F¨ ur nat¨ urliche n gilt
⎧ falls 2 |νp (n) f¨ ur eine Primzahl p ≡ 3 (mod 4), ⎨ 0, r2 (n) = 4 (1 + νp (n)) sonst. ⎩ p≡1 (4)
Beweis. F¨ ur ungerade Primzahlen p und ν ∈ N0 ist nach (7)
δ(pν ) =
ν μ=0
μ
(−1)(p
−1)/2
⎧ ⎨ 1 + ν, = 1, ⎩ 0,
falls p ≡ 1 (mod 4), falls p ≡ 3 (mod 4) und 2|ν, falls p ≡ 3 (mod 4) und 2 |ν;
weiter gilt δ(2ν ) = 1 f¨ ur alle ν ∈ N0 . Die Behauptung ergibt sich jetzt aus (8) mit Hilfe des Lemmas. Bemerkungen. 1) Die obige Formel f¨ ur r2 (n) findet sich wohl erstmals bei Gauss (Disquisitiones Arithmeticae, Art. 182), der an gleicher Stelle (Artt. 291, 292) f¨ ur r3 (n) einen geschlossenen Ausdruck angegeben hat. 2) Reihen des Typs n≥1 an z n /(1 − z n ), wie sie rechts in (4) auftreten, heißen u ¨brigens Lambertsche Reihen. Sie sind f¨ ur die analytische Zahlentheorie von gewisser Bedeutung.
166
4. Additive Probleme und diophantische Gleichungen
Um als n¨achstes f¨ ur r4 (n) eine Formel bequem aufschreiben zu k¨onnen, ist die Einf¨ uhrung der folgenden, durch d σu (n) := d|n d ungerade
f¨ ur alle ganzen n > 0 definierten (offenbar multiplikativen) zahlentheoretischen Funktion zweckm¨aßig. Damit gilt der F¨ ur jedes nat¨ urliche n gilt r4 (n) = 8(2 + (−1)n )σu (n).
Satz von Jacobi.
Beweis. Nach (2), (3) und (5) gilt in |z| < 1 ∞ ∞ ∞ n r4 (n)z = 1 + 8 (−1)(+1)m z (m+1) n=0
(9)
=1+8
=1+8
=1 m=0 ∞
(−1)(+1)(m+1) z m
,m=1 ∞
Δ(n)z n
n=1
mit (10)
Δ(n) :=
(−1)(+1)((n/)+1) . |n
Bei ungeradem n folgt hieraus Δ(n) = |n = σ(n) = σu (n) mit der in 1.1.7 eingef¨ uhrten Teilersummenfunktion σ, also r4 (n) = 8Δ(n) = 8σu (n) wegen (9), was hier die Behauptung des Jacobischen Satzes beweist. Ist n > 0 gerade, etwa n = 2i k mit i, k ∈ N, 2 |k, so l¨aßt sich jeder Teiler von n rechts in (10) eindeutig in der Form = 2ι κ mit ι ∈ {0, . . . , i}, κ ∈ N, κ|k schreiben. Automatisch sind κ und κk ungerade und (10) liefert Δ(n) =
i ι i−ι (−1)(2 κ+1)(2 (k/κ)+1) 2ι κ ι=0 κ|k
=
i ι i−ι (−1)(2 +1)(2 +1) 2ι κ . ι=0
κ|k
F¨ ur 0 < ι < i ist hier der Exponent von −1 ungerade, w¨ahrend er f¨ ur ι = 0 und ι = i gerade ist. Dies f¨ uhrt zu Δ(n) = (2i − 2i−1 − . . . − 2 + 1)σ(k) = 3σ(k) = 3σu (n), also wegen (9) zu r4 (n) = 8Δ(n) = 24σu (n), was auch in diesem Fall Jacobis Formel beweist.
§ 2.
Polynomiale diophantische Gleichungen
167
Bemerkung. 3) Zum Schluß sei darauf hingewiesen, daß die in 7 angesprochenen Ergebnisse ebenfalls quantitative Verfeinerungen folgender Art zulassen: Ist bei ganzem k ≥ 2 die nat¨ urliche Zahl g (in Abh¨ angigkeit von k) gen¨ ugend groß, so kann man mit analytischen Hilfsmitteln f¨ ur die Anzahl der Darstellungen aller “großen” nat¨ urlichen Zahlen als Summe von g nat¨ urlichen Zahlen, die ihrerseits k–te Potenzen sind, eine asymptotische Formel angeben. Der Leser sei diesbez¨ uglich auf R.C. Vaughan [30] verwiesen.
§ 2.
Polynomiale diophantische Gleichungen
1. Pythagor¨ aische Tripel. Bei der Frage nach rechtwinkligen Dreiecken mit ganzzahligen Seitenl¨angen st¨ oßt man auf die diophantische Gleichung (1)
X 2 + Y 2 = Z2.
Mindestens bis in die babylonische Mathematik l¨ aßt sich dieses Problem zur¨ uckverfolgen. Pythagoras soll bereits die unendlich vielen L¨osungstripel (2)
(2k + 1, 2k2 + 2k, 2k2 + 2k + 1),
k = 1, 2, 3, . . . ,
von (1) in nat¨ urlichen Zahlen gekannt haben. Diese Folge beginnt mit (3, 4, 5), (5, 12, 13), (7, 24, 25), . . .. Hauptziel des n¨achsten Abschnitts ist die Ermittlung aller L¨ osungen (x, y, z) ∈ Z3 von (1). Dazu ist es aber sinnvoll, zun¨achst einige leichte Reduktionen durchzuf¨ uhren. Erst einmal darf o.B.d.A. xyz = 0 vorausgesetzt werden: Ist n¨amlich z = 0, so ist (0, 0, 0) die einzige L¨osung von (1); ist z = 0, aber xy = 0, so sind (±z, 0, z) und (0, ±z, z) die einzigen L¨osungen. Sei im weiteren xyz = 0. Das Tripel (x, y, z) l¨ ost (1) genau dann, wenn die acht Tripel (±x, ±y, ±z) die Gleichung (1) l¨ osen. Genau eines dieser Tripel hat lauter positive Komponenten. So darf o.B.d.A. x, y, z ∈ N vorausgesetzt werden und jede L¨ osung (x, y, z) ∈ N3 von (1) heißt ein pythagor¨ aisches Tripel. Ist (x, y, z) ein pythagor¨ aisches Tripel und d ∈ N, so ist offenbar auch (dx, dy, dz) ein pythagor¨ aisches Tripel; hat man umgekehrt ein pythagor¨ aisches Tripel (x , y , z ) und ist d der gr¨ oßte gemeinsame Teiler der Komponenten x , y , z , so ist (x /d, y /d, z /d) ein pythagor¨ aisches Tripel mit zueinander teilerfremden Komponenten. L¨ osungen (x, y, z) von (1) mit teilerfremden Komponenten nennt man primitiv. Es reicht also, alle primitiven pythagor¨ aischen Tripel zu bestimmen, d.h. alle (1) l¨ osenden (x, y, z) ∈ N3 mit paarweise teilerfremden Komponenten. Die Teilerfremdheit schlechthin und die paarweise Teilerfremdheit sind hier wegen der speziellen Gestalt von (1) tats¨achlich ¨aquivalent: Offenbar folgt stets die
168
4. Additive Probleme und diophantische Gleichungen
erstere aus der letzteren. Sind umgekehrt irgend zwei der Zahlen x, y, z nicht zueinander teilerfremd, so sei p eine beide teilende Primzahl; wegen (1) teilt p (sogar p2 ) das Quadrat der dritten Zahl, also diese selbst und damit sind x, y, z nicht zueinander teilerfremd. Sei nun (x, y, z) ein primitives pythagor¨ aisches Tripel. Von den x, y ist genau eines gerade (und k¨ unftig sei dies o.B.d.A. y): Wegen der paarweisen Teilerfremdheit k¨ onnen nicht beide gerade sein; w¨aren sie jedoch beide ungerade, so h¨ atte man x2 + y 2 ≡ 2 (mod 4), aber z 2 ≡ 2 (mod 4).
2. Euklids Satz u ¨ ber pythagor¨ aische Tripel. Nach den zuletzt vorgenommenen Reduktionen kann das abschließende Ergebnis formuliert werden, welches auf Euklid (Elemente X, §§ 28, 29) zur¨ uckgeht: Satz. Alle primitiven pythagor¨ aischen Tripel (x, y, z) mit geradem y sind durch folgende Parameterdarstellung gegeben (1)
x = a2 − b2 ,
y = 2ab,
z = a2 + b2
mit teilerfremden nat¨ urlichen a, b, so daß die Differenz a−b positiv und ungerade ist. Die eine Richtung des Beweises wird vorbereitet durch das noch ¨ofter zu ben¨ utzende Lemma. Gilt j n = gh mit g, h, j, n ∈ N und sind g, h teilerfremd, so existieren teilerfremde g1 , h1 ∈ N, so daß g = g1n , h = hn1 gilt. Beweis. Ist j=
k κ=1
paκκ =
k κ=1 pκ |g
paκκ ·
k
paκκ =: g1 · h1 ,
κ=1 pκ |h
so hat man nach Voraussetzung g1n hn1 = gh. Da g und hn1 zueinander teilerfremd sind, ist hn1 |h nach Satz 1.2.6(i), also h = dhn1 und daher g1n = dg mit d ∈ N. Ist p eine d teilende Primzahl, so gilt p|h und p|g1 , also p|g, was d = 1 impliziert. Beweis des Euklidschen Satzes. Hierzu u ¨berlegt man erst, daß die durch (1) gegebenen (x, y, z) primitive pythagor¨ aische Tripel sind. Dabei ist die Primitivit¨ at folgendermaßen ersichtlich: Sei p eine x und z teilende Primzahl; dann ist p = 2 und p|2a2 , p|2b2 , also p|a und p|b entgegen der vorausgesetzten Teilerfremdheit von a, b.
§ 2.
Polynomiale diophantische Gleichungen
169
Sei nun umgekehrt (x, y, z) ein primitives pythagor¨ aisches Tripel mit geradem y. Da x und z beide ungerade sein m¨ ussen, sind z + x und z − x gerade. Man setzt y1 := 12 y, g := 12 (z + x), h := 12 (z − x) und hat y12 = gh wegen 1(1). W¨are p ein gemeinsamer Primfaktor der nat¨ urlichen Zahlen g, h, so w¨are p|(g +h), p|(g −h), also w¨ urden x und z von p geteilt entgegen ihrer vorausgesetzten Teilerfremdheit. Nach dem bereitgestellten Lemma ist mit teilerfremden a, b ∈ N: g = a2 , h = b2 , woraus sich x und z bereits wie in (1) ergeben. Aus y 2 = 4y12 = (2ab)2 folgt y = 2ab, aus x > 0 folgt a > b und aus 2 |x ergibt sich 2 |(a − b) wie behauptet.
Bemerkung. Die Abbildung der Menge aller Paare (a, b) mit den in Euklids Satz genannten Eigenschaften auf die Menge aller primitiven pythagor¨ aischen Tripel (x, y, z) mit 2|y, die durch (1) beschrieben wird, ist u ¨brigens bijektiv: Aus (a21 − b21 , 2a1 b1 , a21 + b21 ) = (a22 − b22 , 2a2 b2 , a22 + b22 ) mit ai , bi wie in Euklids Satz folgt n¨ amlich a21 + b21 = a22 + b22 , a21 − b21 = a22 − b22 , somit a21 = a22 , b21 = b22 und daraus a1 = a2 , b1 = b2 wegen ai , bi ∈ N. ¨ Ubrigens entsprechen die von Pythagoras angegebenen L¨ osungstripel 1(2) der Gleichung 1(1) genau den Paaren (a, b) mit a = k + 1, b = k (k = 1, 2, . . .) in Euklids Satz.
3. Rationale Punkte auf Kurven zweiten Grades. Wie bereits erw¨ahnt war die vollst¨ andige L¨ osung der diophantischen Gleichung 1(1) in nat¨ urlichen Zahlen schon Euklid bekannt. Hier soll dieselbe Problemstellung zun¨achst in aquivalenter Weise umformuliert und anschließend verallgemeinert werden. ¨ Hat man eine L¨ osung (x, y, z) ∈ Z3 mit z = 0 der Gleichung X2 + Y 2 − Z2 = 0
1(1) und setzt man u := Gleichung (1)
x z,
v :=
y z,
so ist (u, v) ∈ Q 2 eine rationale L¨ osung der
U 2 + V 2 − 1 = 0.
Umgekehrt kann man selbstverst¨ andlich von jeder rationalen L¨ osung (u, v) von (1) zu einer L¨ osung (x, y, z) mit z = 0 von 1(1) in ganzen Zahlen u ¨bergehen. Man betrachtet nun allgemeiner Polynome zweiten Grades in zwei Unbestimmten mit rationalen Koeffizienten (2)
f (U, V ) := c00 + 2c01 U + 2c02 V + c11 U 2 + 2c12 U V + c22 V 2 ∈ Q[U, V ],
170
4. Additive Probleme und diophantische Gleichungen
bei denen die symmetrische Matrix ⎛
c00 ⎝ c01 c02
(3)
c01 c11 c12
⎞ c02 c12 ⎠ c22
maximalen Rang haben m¨oge. Daher verschwinden insbesondere nicht alle c11 , c12 , c22 und so ist f vom Gesamtgrad 2; ferner ist f u ¨ber Q irreduzibel. Geometrisch bestimmt die Menge der (u, v) ∈ IR2 mit f (u, v) = 0 im IR2 eine algebraische Kurve zweiten Grades, die nach den gemachten Voraussetzungen nicht zerf¨ allt. Genauer kann gesagt werden: Haben alle Eigenwerte von (3) dasselbe Vorzeichen, so ist die Kurve ohne reellen Punkt; andernfalls stellt sie eine Hyperbel, Parabel bzw. Ellipse (d.h. einen nicht zerfallenden Kegelschnitt) dar je nachdem, ob c212 − c11 c22 gr¨ oßer, gleich bzw. kleiner als Null ist. Jedes uhrten geometrischen (u, v) ∈ Q 2 mit f (u, v) = 0 nennt man in der hier eingef¨ Sprechweise einen rationalen Punkt auf der vorgelegten algebraischen Kurve. Bei der Behandlung mehrerer Probleme (z.B. 8, 9, 16, 17) des zweiten Buchs seiner Arithmetika hat Diophant eine Methode vorgestellt, die es gestattet, aus einem einzigen rationalen Punkt der vorgegebenen Kurve sofort s¨ amtliche zu gewinnnen. Mit seiner Methode l¨aßt sich der folgende Satz beweisen. Satz. Sei f gem¨aß (2) vorgelegt, der Rang der Matrix (3) sei maximal und die diophantische Gleichung f (U, V ) = 0 habe eine rationale L¨ osung (u0 , v0 ). Dann hat sie bereits unendlich viele solche L¨osungen und beide Komponenten s¨amtlicher rationaler L¨ osungen dieser Gleichung ergeben sich als Werte gewisser rationaler Funktionen einer Unbestimmten mit rationalen, nur von f , u0 , v0 abh¨ angigen Koeffizienten an rationalen Argumentstellen. Beweis. Die Taylor–Entwicklung von f um (u0 , v0 ) erh¨ alt man unter Beachtung von f (u0 , v0 ) = 0 rein algebraisch zu (4)
f (U, V ) = 2d1 (U − u0 ) + 2d2 (V − v0 ) + c11 (U − u0 )2 + 2c12 (U − u0 )(V − v0 ) + c22 (V − v0 )2
mit den Festsetzungen (5)
d1 := c01 + c11 u0 + c12 v0 ,
d2 := c02 + c12 u0 + c22 v0 .
Hier k¨onnen d1 , d2 nicht beide verschwinden; wegen f (u0 , v0 ) = 0 w¨ are sonst auch noch c00 + c01 u0 + c02 v0 gleich Null im Gegensatz zur Rangvoraussetzung u ¨ber die Matrix (3). Nun w¨ahlt man sich, Diophant folgend, ein beliebiges
§ 2.
Polynomiale diophantische Gleichungen
171
rationales k mit c11 k2 + 2c12 k + c22 = 0 (hierdurch werden h¨ ochstens zwei k– Werte ausgeschlossen) und bestimmt dazu t(k) gem¨aß (6)
t(k) :=
−2(d1 k + d2 ) . c11 k2 + 2c12 k + c22
Aus (4) sieht man direkt, daß f (u(k), v(k)) = 0 wird f¨ ur (7)
u(k) := u0 + kt(k)
v(k) := v0 + t(k).
Wegen der Rationalit¨at der cij , u0 , v0 ist nach (5) und (6) auch t(k) rational f¨ ur jedes oben zugelassene rationale k. Nun ist u(k) = u(k ), v(k) = v(k ) gleichbedeutend mit t(k) = t(k ), kt(k) = k t(k ). Ist t(k) = 0, so folgt daraus schon k = k ; ist t(k) = 0, so auch t(k ) = 0 und in diesem Fall muß d1 = 0 sein wegen der Bemerkung nach (5) und aus d1 k + d2 = 0, d1 k + d2 = 0 folgt erneut k = k . Damit ist die erste H¨alfte der Behauptung bewiesen. urde sich Nimmt man im Falle c11 = 0 an, es sei auch c01 + c12 v0 = 0, so w¨ d1 = 0 aus (5) ergeben und damit aus (4) f (U, V ) = (V − v0 )(2d2 + 2c12 (U − u0 ) + c22 (V − v0 )) entgegen der Irreduzibilit¨ at von f u ¨ber Q. F¨ ur c11 = 0 ist also d1 = 0, weshalb aus f (u, v0 ) = (u − u0 )(2d1 + c11 (u − u0 )) = 0 folgt u = u0 , falls c11 = 0, bzw. u = u0 oder u = u0 − 2d1 /c11 , falls c11 = 0. Jedenfalls hat man außer den in (7) erfaßten rationalen L¨osungen (u(k), v(k)) der vorgelegten diophantischen Gleichung gegebenenfalls noch die eine weitere (u0 − 2d1 /c11 , v0 ), falls c11 = 0. Sei jetzt umgekehrt (u, v) ein beliebiger rationaler Punkt der Kurve, o.B.d.A. mit v = v0 . Setzt man t := v − v0 und dann k := (u − u0 )/t, so sind t = 0 und k rational und (4) in Verbindung mit f (u, v) = 0 besagt (8)
2(d1 k + d2 ) + (c11 k2 + 2c12 k + c22 )t = 0.
W¨ are nun c11 k2 + 2c12 k + c22 = 0, so auch d1 k + d2 = 0 und (8) w¨ urde f¨ ur jedes reelle t∗ (statt t) gelten. Dies hieße aber, daß jeder Punkt (u∗ , v ∗ ) der Geraden u∗ − u0 = kt∗ , v ∗ − v0 = t∗ wegen (4) der Gleichung f (u∗ , v ∗ ) = 0 gen¨ ugen m¨ ußte, was nicht geht. Aus (8) folgt daher t = t(k) mit dem t(k) aus (6). Bemerkungen. 1) Geometrisch bedeutet der in (7) zum Ausdruck kommende Diophantsche Ansatz u = u0 +kt, v = v0 +t offenbar, daß man den vorgelegten Kegelschnitt mit allen “rationalen” Geraden der Form u−u0 = k(v −v0 ), k ∈ Q, durch den bekannten rationalen Kurvenpunkt (u0 , v0 ) zum Schnitt bringt; dabei bleibt dann die Gerade v = v0 noch gesondert zu untersuchen. Die im
172
4. Additive Probleme und diophantische Gleichungen
allgemeinen anfallenden, von (u0 , v0 ) verschiedenen Schnittpunkte der jeweiligen Geraden durch (u0 , v0 ) mit dem Kegelschnitt sind weitere rationale Punkte desselben.
2) Wendet man den Satz speziell auf Gleichung (1) an, so sind −c00 = c11 = c22 = 1, alle anderen cij = 0. Arbeitet man etwa mit (u0 , v0 ) = (−1, 0), so wird d1 = −1, d2 = 0 und (6), (7) f¨ uhren zu 2k k2 − 1 v(k) = 2 . k2 + 1 k +1 Wegen c11 = 0 erh¨alt man noch (u0 − 2d1 /c11 , v0 ) = (1, 0) als weiteren Kurvenpunkt. W¨ ahlt man noch a, b wie in Satz 2 und setzt damit k := a/b, so wird der gem¨aß (9) gebildete Punkt gleich ((a2 − b2 )/(a2 + b2 ), 2ab/(a2 + b2 )), also gleich (x/z, y/z) wie in 2(1). (9)
u(k) =
4. Rationale Punkte gewisser Kurven dritten Grades. Sei jetzt f ∈ Q[U, V ] irreduzibel u ¨ber Q und tats¨ achlich von beiden Unbestimmten abh¨ angig; in 3(2) war dies wegen der Rangforderung an die Matrix 3(3) automatisch erf¨ ullt. Im IR2 wird dann durch die Gleichung f (u, v) = 0 eine algebraische Kurve definiert; unter deren Grad versteht man den Gesamtgrad von f , und der Begriff eines rationalen Punktes dieser Kurve wird wie in 3 gefaßt. W¨ ahrend die Frage nach den rationalen Punkten einer algebraischen Kurve ersten bzw. zweiten Grades in 1.3.3 bzw. 3 abgehandelt wurde, sollen hier zwei Methoden pr¨ asentiert werden, mit denen man aus einem oder zwei bekannten rationalen Punkten einer Kurve dritten Grades im allgemeinen einen neuen derartigen Punkt gewinnen kann. Diese Methoden werden bisweilen C.G. Bachet (auch Euler oder Cauchy) zugeschrieben, der sie 1621 erstmalig auf die Gleichung (1)
V 2 = U3 + k
§ 2.
Polynomiale diophantische Gleichungen
173
im Falle k = −2 angewandt haben soll. In der Tat hat Bachet in jenem ¨ Jahr eine Neuausgabe von griechischem Original und lateinischer Ubersetzung einschließlich einer ausf¨ uhrlichen Kommentierung der Diophantschen Arithmetika besorgt, in deren viertem bzw. sechstem Buch bei einigen Problemen u ¨ ber Kurven dritten Grades (z.B. 24,26 bzw. 18,19) sich beide Methoden zumindest implizit finden. Um technische Komplikationen zu vermeiden, werden beide anhand der speziellen, durch (1) mit rationalem k festgelegten algebraischen Kurve erl¨autert, die eine sehr typische vom dritten Grade ist, vgl. 5. Die Tangentenmethode. Ist (u0 , v0 ) ∈ Q 2 ein Punkt der durch (1) gegebenen 3u2 ur v0 = 0 die Gleichung der Tangente in diesem Kurve, so ist v−v0 = 2v00 (u−u0 ) f¨ Punkt an die Kurve. Schneidet man diese Tangente mit der Kurve, so muß jeder Schnittpunkt (u, v) außer der Tangentengleichung die Gleichung v 2 −v02 = u3 −u30 erf¨ ullen, was sich nach kurzer Rechnung als ¨aquivalent mit (u − u0 )2 (u − u1 ) = 0 erweist, wobei u1 := u0 (u30 − 8k)/(4v02 ) gesetzt ist. F¨ ur u1 = u0 hat man in (u1 , v1 ) mit v1 := v0 + 3u20 (u1 − u0 )/(2v0 ) einen neuen rationalen Kurvenpunkt gefunden. Dabei ist u1 = u0 gleichbedeutend mit u30 = −4k, d.h. mit der Tatsache, daß (u0 , v0 ) nicht Wendepunkt der Kurve ist. Beispiel zur Tangentenmethode. Betrachtet man Bachets Gleichung (1) mit k = −2, so ist offenbar (3, 5) eine rationale L¨osung, aus der sich mit der so383 eben beschriebenen Tangentenmethode ( 129 osung 100 , 1000 ) als weitere rationale L¨ einstellt, die tats¨achlich von Bachet angegeben wurde.
174
4. Additive Probleme und diophantische Gleichungen
Die Sekantenmethode. Sind (u0 , v0 ), (u1 , v1 ) ∈ Q 2 zwei Punkte der durch (1) gegebenen Kurve mit u0 = u1 , so ist v = pu + q mit p :=
v1 − v0 , u1 − u0
q :=
u1 v0 − u0 v1 u1 − u0
die Gleichung der Sekante durch die beiden vorgegebenen Kurvenpunkte. Schneidet man diese Sekante mit der Kurve, so muß jeder Schnittpunkt (u, v) außer der Sekantengleichung die Gleichung v 2 = u3 +k erf¨ ullen, was mit dem Bestehen von u3 − p2 u2 − 2pqu + k − q 2 = 0 ugen, hat sie eine weitere ¨quivalent ist. Da aber u0 , u1 dieser Gleichung gen¨ a Wurzel u2 , die nach Vietas Satz aus u0 + u1 + u2 = p2 gewonnen werden kann. Setzt man noch v2 := pu2 + q, so hat man in (u2 , v2 ) einen rationalen Kurvenpunkt gefunden, der genau dann von den beiden Ausgangspunkten verschieden ist, wenn die Sekante nicht gleichzeitig Tangente in einem der Ausgangspunkte ist. Beispiel zur Sekantenmethode. Gleichung (1) hat f¨ ur k = 1 offenbar die drei rationalen L¨osungen (−1, 0), (0, 1) und (0, −1). Wendet man hier auf die ersten beiden die Sekantenmethode an, so erh¨ alt man (2, 3) als neue L¨osung; wegen der speziellen Form (1) ist damit auch (2, −3) L¨ osung. Bemerkungen. 1) Es erscheint ganz plausibel zu erwarten, daß man durch sukzessive Anwendung von Tangenten- und Sekantenmethode aus einer oder zwei rationalen L¨osungen von (1) bei festem rationalem k = 0 im allgemeinen unendlich viele verschiedene rationale L¨osungen gewinnen kann. Im Anschluß an Bachet behauptete Fermat dies u ¨ber Gleichung (1) bei k = −2, allerdings ohne Angabe eines Beweises. Erst 1930 konnte R. Fueter dies beweisen, der f¨ ur ganzes k = 0, welches sich nach Division durch die gr¨oßte darin als Faktor enthaltene sechste Potenz nicht auf 1 oder −432 reduziert, zeigte: Hat (1) eine rationale L¨ osung (u0 , v0 ) mit u0 v0 = 0, so gibt es deren unendlich viele. F¨ ur k = −432 gibt es nur die beiden rationalen L¨osungen (12, ±36) und f¨ ur k = 1 gibt es keine weiteren rationalen L¨ osungen als die f¨ unf im Beispiel zur ¨ Sekantenmethode angegebenen. Ubrigens wurde das soeben zitierte, den Fall k = 1 betreffende Resultat bereits 1738 von Euler mit Hilfe der in 6 zu besprechenden Fermatschen Deszendenzmethode bewiesen. Erw¨ahnt sei noch, daß es auch gewisse k–Werte gibt (z.B. k = 7), f¨ ur die (1) rational unl¨ osbar ist. 2) Was die ganzzahligen L¨osungen von (1) bei ganzem k = 0 betrifft, so hat A. Thue 1917 mit Hilfe seines in 6.2.1 angesprochenen Approximationssatzes die Endlichkeit der L¨ osungsanzahl sichern k¨ onnen. Eine explizite, alleine von k abh¨ angige obere Schranke f¨ ur |u|, |v| hat A. Baker 1968 gefunden, wenn
§ 2.
Polynomiale diophantische Gleichungen
175
(u, v) ∈ Z2 Gleichung (1) l¨ ost. Sein diesbez¨ ugliches Ergebnis st¨ utzt sich auf seine in b) von 6.5.9 angedeuteten quantitativen Linearformens¨atze. 3) F¨ ur weitere Einzelheiten u ¨ber Gleichung (1), die in der Theorie der diophantischen Gleichungen 350 Jahre lang immer wieder eine bedeutende Rolle gespielt hat, kann der interessierte Leser auf L.J. Mordell [16], Kap. 26, verwiesen werden.
5. Resultate von Poincar´ e, Mordell und Faltings. Es fragt sich nun, unter welchen Bedingungen die in 3 bzw. 4 beschriebenen Verfahren geeignet sind, alle rationalen Punkte auf einer algebraischen Kurve, wie diese zu Anfang von 4 erkl¨ art wurde, zu bestimmen. Um hier die entscheidenden Ergebnisse wenigstens formulieren zu k¨ onnen, muß man erst eine ad¨aquate Einteilung der Kurven vornehmen; ihre Klassifikation nach dem Grad erweist sich jedenfalls als nicht ganz angemessen. Hat man ein u ¨ber C irreduzibles Polynom f ∈ C[U, V ], welches o.B.d.A. von V tats¨achlich abh¨ angt, so wird durch die Gleichung f (u, v) = 0 implizit eine (komplexwertige) algebraische Funktion v der komplexen Variablen u definiert. In der Funktionentheorie f¨ uhrt man den Begriff der Riemannschen Fl¨ache Φf dieser Funktion ein. Ist mf der Grad von f bez¨ uglich V , so ist mf die Anzahl der Bl¨atter von Φf . Sind e1 , . . . , ef s¨amtliche paarweise verschiedenen Verzweiˆ := C ∪ {∞} und h¨ gungspunkte von Φf in C angen f¨ ur λ = 1, . . . , f in eλ genau atter zusammen, so kann man das Geschlecht gf von Φf definieren durch ελ Bl¨ (1)
gf := 1 − mf +
f 1 (ελ − 1). 2 λ=1
Stets erweist sich gf als ganze nichtnegative Zahl. Ist nun eine algebraische Kurve wie zu Anfang von 4 definiert, so versteht man unter ihrem Geschlecht die soeben eingef¨ uhrte Zahl gf . Ist mf = 1, so f = 0 ur λ = 1, 2, also erneut und gf = 0. Ist mf = 2, so ist f = 2 und ελ = 2 f¨ gf = 0. Die durch 4(1) definierte algebraische Kurve ist vom Geschlecht 1, falls k = 0. Es ist n¨ amlich mf = 2 und also sind alle ελ gleich 2; weiter ist f = 4, ein eλ ist ∞ und die u ¨brigen drei sind die verschiedenen komplexen Nullstellen des Polynoms U 3 + k. (Im Fall k = 0 ergibt sich hier das Geschlecht 0.) W¨ ahrend der Begriff des Geschlechts bereits um die Mitte des 19. Jahrhunderts von Riemann eingef¨ uhrt wurde, hat erst H. Poincare 1901 seine Bedeutung f¨ ur die Frage nach den rationalen Punkten einer algebraischen Kurve voll erkannt. Poincare hat damals (implizit) gezeigt, daß die Diophantsche Methode aus 3 zur Bestimmung aller rationalen Punkte einer beliebigen algebraischen Kurve
176
4. Additive Probleme und diophantische Gleichungen
vom Geschlecht Null f¨ uhrt, wenn man nur einen einzigen rationalen Kurven¨ punkt kennt. Uberdies hat man in diesem Fall eine rationale Parameterdarstellung f¨ ur beide Komponenten s¨ amtlicher rationaler Punkte, wie dies im Spezialfall von Satz 3 zum Ausdruck kam. Um dieses Poincaresche Ergebnis verst¨andlich zu machen, sei folgendes festgeachlich stellt: Hat man f, g ∈ Q(U, V ), die jeweils von beiden Unbestimmten tats¨ abh¨ angen und gibt es ϕ, ψ ∈ Q(X, Y ), so daß g(X, Y ) = f (ϕ(X, Y ), ψ(X, Y )) ist, so entsprechen den rationalen Punkten der durch g(x, y) = 0 definierten algebraischen Kurve rationale Punkte der durch f (u, v) = 0 gegebenen Kurve, wenn man einmal von h¨ ochstens endlich vielen Ausnahmepunkten absieht. Sind die obigen ϕ, ψ zus¨atzlich so beschaffen, daß es ϕ1 , ψ1 ∈ Q(U, V ) gibt mit X = ϕ1 (ϕ(X, Y ), ψ(X, Y )), Y = ψ1 (ϕ(X, Y ), ψ(X, Y )), so ist f (U, V ) = g(ϕ1 (U, V ), ψ1 (U, V )) und den rationalen Punkten von f (u, v) = 0 entsprechen umgekehrt auch rationale Punkte von g(x, y) = 0. Gibt es nun ϕ, ψ, ϕ1 , ψ1 der beschriebenen Art, so nennt man die beiden in Frage stehenden algebraischen Kurven birational a¨quivalent. Es ist eine Tatsache, daß birational a¨quivalente algebraische Kurven gleiches Geschlecht haben. Dagegen gibt es durchaus birational nicht a¨quivalente Kurven gleichen Geschlechts. Poincare hatte seinerzeit bewiesen, daß jede algebraische Kurve vom Geschlecht Null und vom Grad m ≥ 3 zu einer Kurve vom Grad m − 2 birational aquivalent ist. Dies erst macht Poincares oben zitierte, das Geschlecht Null ¨ betreffende Resultate voll einsichtig, da sich hier alles auf Kurven vom Grad 1 oder 2 reduziert. Ist das Geschlecht der algebraischen Kurve positiv, so geht die Eigenschaft ihrer rationalen Punkte, eine rationale Parameterdarstellung obiger Art zu besitzen, verloren. Immerhin konnte Poincare noch zeigen, daß im Falle des Geschlechts Eins die in 4 besprochene Diophantsche Tangenten– bzw. Sekantenmethode zur Bestimmung rationaler Kurvenpunkte aus “wenigen” vorgegebenen angewandt werden kann. Kurven des Geschlechts Eins mit mindestens einem rationalen Punkt erweisen sich n¨ amlich als birational a¨quivalent zu einer Kurve dritten Grades, die durch eine Gleichung des Typs (2)
V 2 = U 3 + aU + b
mit a, b ∈ Q
festgelegt wird, wobei das Polynom in U rechts ohne mehrfache Nullstelle ist. Daher war Gleichung 4(1) bei k = 0 ein sehr typisches Beispiel einer algebraischen Kurve vom Geschlecht Eins.
§ 2.
Polynomiale diophantische Gleichungen
177
Die Punkte der durch (2) festgelegten Kurve lassen sich, wie bereits erw¨ ahnt, zwar nicht mehr rational parametrisieren; daf¨ ur ist jedoch eine Parameterdarstellung mit Hilfe meromorpher transzendenter Funktionen m¨ oglich, am einfachsten mittels der Weierstrassschen elliptischen ℘–Funktion und deren Ableitung. Daher nennt man generell algebraische Kurven vom Geschlecht Eins elliptisch; bei Geschlecht gr¨oßer als Eins haben sich Sonderbezeichnungen nicht eingeb¨ urgert, w¨ ahrend man bei Geschlecht Null heute von rationalen Kurven spricht. ¨ Uber elliptische Kurven hatte Poincare (indirekt) die Vermutung ausgesprochen, daß man ihre s¨ amtlichen rationalen Punkte stets aus endlich vielen unter ihnen durch sukzessive Anwendung der Sekanten– und Tangentenmethode konstruieren kann. Diese Vermutung wurde von Mordell 1922 mit der bereits in Bemerkung 1 zu 4 angesprochenen Deszendenzmethode bewiesen. In derselben Arbeit sprach Mordell seinerseits die Vermutung aus, daß jede algebraische, nicht rationale oder elliptische Kurve h¨ ochstens endlich viele rationale Punkte hat. Dies konnte 1983 von G. Faltings gezeigt werden, der f¨ ur seine diesbez¨ uglichen (wesentlich weitergehenden) Untersuchungen auf dem Internationalen Mathematiker–Kongreß in Berkeley 1986 eine Fields–Medaille erhielt. Bemerkungen. 1) Jacobi hatte schon 1834 das Eulersche Additionstheorem f¨ ur elliptische Integrale zur Definition einer “Addition” von Punkten einer elliptischen Kurve herangezogen. Aber erst Poincare hat erkannt, daß der Jacobische analytische Ansatz aufs engste mit der geometrischen Sekanten– Tangenten–Methode des Diophant zusammenh¨angt. F¨ ur genauere Details hierzu muß der interessierte Leser etwa auf S.Lang (Elliptic Functions, AddisonWesley, Reading etc., 1973) verwiesen werden. 2) Daß jede algebraische, nicht rationale Kurve h¨ ochstens endlich viele ganzzahlige Punkte hat, wurde bereits 1929 von C.L. Siegel gezeigt.
6. Pythagor¨ aische Dreiecke quadratischer Kathetenl¨ angen. Hier wird ein Resultat u ¨ber pythagor¨ aische Dreiecke gewonnen, dessen Beweis methodisch etwas Neues bringen wird. Proposition. Es gibt keine pythagor¨ aischen Dreiecke, deren beide Katheten L¨ angen haben, die Quadratzahlen sind. Dies ist eine unmittelbare Folgerung aus dem nachstehenden, auf Euler (1738) zur¨ uckgehenden
178 Satz.
4. Additive Probleme und diophantische Gleichungen
Die diophantische Gleichung X4 + Y 4 = Z2
(1) ist nichttrivial unl¨ osbar.
Dies bedeutet, daß es kein (1) gen¨ ugendes Tripel (x, y, z) ∈ Z3 mit xyz = 0 gibt. Als weitere Konsequenz dieses Satzes sei angef¨ uhrt das Korollar.
Die einzigen rationalen Punkte der elliptischen Kurve
(2)
V 2 = U4 + 1
sind (0, 1) und (0, −1). Beweis. W¨ are n¨amlich (u, v) ∈ Q 2 mit u = 0 ein Punkt auf der durch (2) definierten algebraischen Kurve vom Geschlecht Eins, so sei y ∈ N so gew¨ahlt, daß x := uy und z := vy ganz sind. Offenbar l¨ost (x, y, z) dann (1) nichttrivial, denn uv = 0 impliziert xyz = 0. Bemerkung. Daß weder mittels Sekanten– noch Tangentenmethode aus den beiden rationalen Punkten (0, 1), (0, −1) von (2) neue rationale Punkte zu erhalten sind, lehrt ein Blick auf die nachstehende Skizze.
Beweis des Satzes. Es werde angenommen, Gleichung (1) sei nichttrivial l¨osbar und (x0 , y0 , z0 ) ∈ Z3 sei eine ihrer L¨osungen mit x0 y0 z0 = 0. Da alle Exponenten in (1) gerade sind, sind gleichzeitig alle acht Tripel (±x0 , ±y0 , ±z0 )
§ 2.
Polynomiale diophantische Gleichungen
179
nichttriviale L¨ osungen von (1) und genau eines dieser Tripel hat lauter positive Komponenten. O.B.d.A. darf x0 , y0 , z0 ∈ N vorausgesetzt werden. Ziel ist nun die Konstruktion einer weiteren nichttrivialen L¨ osung (x1 , y1 , z1 ) von (1) in nat¨ urlichen Zahlen mit z1 < z0 . Ist die L¨ osung (x0 , y0 , z0 ) nicht primitiv, so sei p eine alle Komponenten teilende x40 + yˆ04 ) = zˆ02 , Primzahl. Mit x ˆ0 := x0 /p, yˆ0 := y0 /p, zˆ0 := z0 /p erh¨alt man p2 (ˆ woraus man p|ˆ z0 sieht. Offenbar ist (x1 , y1 , z1 ) := (ˆ x0 , yˆ0 , zˆ0 /p) eine nichttriviale L¨osung von (1) in nat¨ urlichen Zahlen mit z1 = zˆ0 /p = z0 /p2 < z0 . Ist die urspr¨ ungliche L¨osung (x0 , y0 , z0 ) von (1) jedoch primitiv, so ist (x20 , y02 , z0 ) 3 ¨ ∈ N wegen (1) ein primitives pythagor¨ aisches Tripel. Nach den Uberlegungen am Ende von 1 ist genau eine der Zahlen x0 , y0 gerade und o.B.d.A. sei dies y0 . Nach Euklids Satz 2 gilt dann mit teilerfremden a, b ∈ N, a > b und ungerader Summe a + b x20 = a2 − b2 ,
y02 = 2ab,
z0 = a2 + b2 .
Bei geradem a w¨are b ungerade, also x20 ≡ 3 (mod 4), was nicht geht. So ist a ungerade und b gerade sowie x20 + b2 = a2 . Daher ist (x0 , b, a) ein primitives pythagor¨ aisches Tripel mit gerader Mittelkomponente und erneut liefert Euklids Satz x0 = c2 − d2 , b = 2cd, a = c2 + d2 mit teilerfremden c, d ∈ N, c > d, 2 |(c + d). Da a und b teilerfremd sind, sind c, d, c2 +d2 sogar paarweise teilerfremd. Wegen ( 21 y0 )2 = cd(c2 +d2 ) und Lemma 2 ergibt sich daraus c = x21 ,
d = y12 ,
c2 + d2 = z12
mit (paarweise teilerfremden) x1 , y1 , z1 ∈ N, die offenbar x41 +y14 = z12 und wegen ullen. Damit ist in z1 ≤ z12 = c2 + d2 = a < a2 < a2 + b2 = z0 auch z1 < z0 erf¨ jedem Fall das oben gesteckte Ziel erreicht. Die Annahme der Existenz einer nichttrivialen L¨ osung (x0 , y0 , z0 ) von (1) in nat¨ urlichen Zahlen f¨ uhrt somit zur Konstruktion einer unendlichen Folge ((xk , yk , zk ))k=0,1,... nichttrivialer L¨ osungen von (1) in nat¨ urlichen Zahlen, die u ¨berdies der Bedingung z0 > z1 > . . . > zk > . . . > 0 gen¨ ugen, welch letzteres unm¨oglich ist.
7. Fermats Vermutung. In seinem Exemplar von Bachets bereits in 4 ¨ erw¨ahnter Ubersetzung von Diophants Arithmetika fand man folgende Bemerkung von Fermat aus der Zeit zwischen 1631 und 1637 als Randnotiz neben
180
4. Additive Probleme und diophantische Gleichungen
Problem 8 (“Ein gegebenes Quadrat soll in eine Summe zweier Quadrate zerlegt werden”) des zweiten Buches: “Cubum in duos cubos aut quadrato-quadratum in duos quadrato-quadratos et generaliter nullam in infinitum, ultra quadratum, potestam in duas ejusdem nominis fas est dividere. Cujus rei demonstrationem mirabilem sane detexi, hanc marginis exiguitas non caperet.” Diese Fermatsche Bemerkung l¨auft also darauf hinaus, daß die diophantische Gleichung (1)
Xn + Y n = Zn
f¨ ur kein nat¨ urliches n ≥ 3 nichttrivial l¨ osbar ist, d.h. daß es kein (1) gen¨ ugendes Tripel (x, y, z) ∈ Z3 mit xyz = 0 gibt. Leider hinterließ Fermat seiner Nachwelt den “f¨ urwahr wunderbaren Beweis dieser Tatsache”, den er “entdeckt hatte”, nicht, da “der schmale Rand diesen nicht fassen w¨ urde”. Fermats Randnotiz ging in die sp¨ atere Literatur als Fermatsche Vermutung ein; manche Autoren sprechen auch vom großen Fermatschen Satz (in der englisch–sprachigen Literatur praktisch ausschließlich Fermat’s last theorem) in Abgrenzung zum “kleinen” Fermatschen Satz, der in 2.3.3 diskutiert wurde. In einem Brief an P. De Carcavi (1659) hat Fermat eine neue Methode ausf¨ uhrlich beschrieben, mit der er seine eigene Randnotiz neben Problem 20 im sechsten Buch von Diophants Arithmetika beweisen konnte, daß es n¨amlich kein pythagor¨ aisches Dreieck geben w¨ urde, dessen Fl¨ ache eine Quadratzahl sei. Offenbar ist diese Behauptung mit der nichttrivialen Unl¨ osbarkeit der Gleichung (2)
X4 − Y 4 = Z2
aquivalent. Fermat vermerkt in seinem Brief: “Da die Methoden in der Lite¨ ratur f¨ ur den Beweis so schwieriger S¨atze nicht ausreichen, fand ich schließlich einen ganz und gar einzigartigen Weg. Ich nannte diese Beweismethode la descente infinie . . . ” Diese Schlußweise, mit der im vorigen Abschnitt die nichttriviale Unl¨ osbarkeit von 6(1) gezeigt wurde, ist heute als Fermatsche Deszendenzmethode bekannt und f¨ ur die Untersuchung zahlreicher Fragen u ¨ber diophantische Gleichungen unersetzlich. Wie am Ende von 6 gesehen, beruht sie einfach auf dem in 1.1.1 erw¨ahnten Prinzip des kleinsten Elements. Sowohl aus dem Fermatschen Resultat u ¨ber (2) wie aus dem Eulerschen u ¨ber 6(1) erh¨alt man die folgende
§ 2.
Polynomiale diophantische Gleichungen
181
Proposition A. Die Fermat–Gleichung (1) zum Exponenten n > 0 ist unl¨ osbar, falls n Vielfaches von 4 ist. Bemerkung. “L¨osbar” bzw. “unl¨ osbar” bedeutet f¨ ur den Rest dieses Paragraphen stets “nichttrivial l¨ osbar” bzw. “nichttrivial unl¨ osbar”. Beweis. Es sei n = 4m mit einem m ∈ N und es werde angenommen, (1) habe f¨ ur solche n eine nichttriviale L¨ osung (x, y, z). Ersichtlich w¨ are dann (xm , y m , z 2m ) eine nichttriviale L¨ osung von 6(1) entgegen dem Eulerschen Satz 6. Folgende leichte Reduktion der Fermat–Vermutung kann noch vorgenommen werden: Proposition B. Zum Beweis der Fermatschen Vermutung reicht es, die Unl¨ osbarkeit der Fermat–Gleichung (1) f¨ ur jeden Exponenten zu zeigen, der eine ungerade Primzahl ist. Beweis. Sei n ≥ 3 eine nat¨ urliche Zahl. Der Fall 4|n wurde bereits durch Proposition A erledigt. Ist n nicht Vielfaches von 4, so wird es von mindestens einer ungeraden Primzahl p geteilt und mit m := n/p kann gesagt werden: L¨ ost m m (x0 , y0 , z0 ) die Fermat–Gleichung (1) zum Exponenten n, so l¨ost (xm , y , z 0 0 0 ) die Fermat–Gleichung zum Exponenten p.
8. Weitere Entwicklung des Fermat–Problems (bis 1993). Die Unl¨ osbarkeit der Fermat-Gleichung (1)
Xp + Y p = Zp
f¨ ur die Primzahl p = 3 wurde zwischen 1753 und 1770 von Euler gezeigt und 1770 publiziert (vgl. Vollst¨andige Anleitung zur Algebra = Opera Omnia, Ser. 1, I, 1–498, hier insbesondere 484–489). Eine kleine L¨ ucke in seinem Beweis konnte Legendre 1830 schließen. Den Exponenten p = 5 haben dann unabh¨ angig voneinander zwischen 1825 und 1828 Dirichlet und Legendre erledigt. Daß zun¨ achst die beiden kleinsten ungeraden Primzahlen behandelt werden konnten, hat algebraisch–arithmetische Gr¨ unde: Der Satz u ¨ber die eindeutige Primfaktorzerlegung (vgl. 1.1.5) im Unterring Z der ganzen Zahlen des K¨ orpers Q spielte mehr oder weniger explizit (vgl. etwa Beweis von Lemma 2) bei der Behandlung der Fermat–Gleichung zu den Exponenten 2 bzw. 4 (vgl. die S¨ atze 2 bzw. 6) eine entscheidende Rolle. Wie in 1.5.5–6 gesehen, hat√man analog im Unterring der ganzen Zahlen der quadratischen Zahlk¨ orper Q( −3)
182
4. Additive Probleme und diophantische Gleichungen
√ und Q( 5) den Satz von der eindeutigen Zerlegbarkeit in Primelemente, da hier die genannten Unterringe euklidisch sind (vgl. Satz 1.6.9). Um 1843 herum soll E.E. Kummer eine Arbeit an Dirichlet eingereicht haben, in der vermeintlich die Unl¨ osbarkeit von (1) f¨ ur jede Primzahl p > 2 und damit nach Proposition 7B die Richtigkeit der Fermatschen Vermutung bewiesen wurde. Dirichlet fand aber bei der Durchsicht, daß Kummer bei seinem “Beweis” den Satz von der eindeutigen Primelementzerlegung im Ring der ganzen Zahlen gewisser vom jeweils betrachteten p abh¨ angigen algebraischen Zahlk¨ orper als g¨ ultig hingenommen hatte. So jedenfalls soll diese Geschichte nach einer Erz¨ahlung von Hensel (1910), der einzigen Quelle, abgelaufen sein; man vergleiche dazu H.M. Edwards [3], Kap.4.1. Fest steht jedenfalls, daß sich Kummer seit jener Zeit intensiv dem Studium der Teilbarkeitsgesetze in speziellen algebraischen Zahlk¨ orpern, den sogenannten Kreisteilungsk¨orpern, widmete. Obwohl es Kummer trotz aller Bem¨ uhungen nicht gelungen ist, die Unl¨ osbarkeit von (1) f¨ ur alle Primzahlen p > 2 zu beweisen, hat er u ¨beraus wichtige Ergebnisse zum Fermat–Problem erzielt und der sp¨ateren Entwicklung entscheidende Impulse gegeben. Kummer selbst hat gegen 1850 beweisen k¨onnen, daß (1) f¨ ur alle sogenannten regul¨ aren Primzahlen p unl¨ osbar ist. Seine urspr¨ ungliche Regularit¨ atsdefinition verlangt f¨ ur eine Reproduktion an dieser Stelle zu viele algebraische Vorkenntnisse. Er zeigte aber, daß eine Primzahl p > 2 genau dann regul¨ ar ist, wenn p keinen Z¨ahler der (rationalen) Bernoulli–Zahlen B2 , B4 , . . . , Bp−3 (in ihrer gek¨ urzten Darstellung) teilt. Dabei sind die Bernoulli–Zahlen u ¨ber die im Kreis |z| < 2π der komplexen Ebene konvergente Taylor–Entwicklung der Funktion ezz−1 gem¨aß ∞ z zk B = k ez − 1 k! k=0
definiert. Als k–te Ableitung von ezz−1 an der Stelle 0 ist Bk rational; insbeson1 1 1 5 dere gilt B0 = 1, B1 = − 12 , B2 = 16 , B4 = − 30 , B6 = 42 , B8 = − 30 , B10 = 66 , 691 7 3617 B12 = − 2730 , B14 = 6 , B16 = − 510 und Bk = 0 f¨ ur alle ungeraden k ≥ 3. Wendet man dieses Kummersche Kriterium an, so erkennt man die Regularit¨ at der Primzahlen 3, 5, 7, 11, 13, 17 und 19. Unterhalb 100 sind lediglich die Primzahlen 37, 59 und 67 nicht regul¨ ar (kurz: irregul¨ ar). Seit Kummer vermutet man, daß es unendlich viele regul¨ are Primzahlen gibt, ein Problem, das bis heute offen ist. Dagegen weiß man seit K.L. Jensen (1915), daß es unendlich viele irregul¨ are Primzahlen gibt. ¨ Uber das oben zitierte Kummer–Kriterium via Bernoulli–Zahlen hinaus sind heute zahlreiche Ergebnisse bekannt, die die Entscheidung, ob (1) f¨ ur ein p > 2 l¨ osbar ist, mit anderen, mehr oder weniger leicht nachpr¨ ufbaren Eigenschaften
§ 2.
Polynomiale diophantische Gleichungen
183
von p in Zusammenhang bringen. Mit derartigen Kriterien ist es J. Buhler, ¨nkyla ¨ (Math. Comp. 61, 151–153 R. Crandall, R. Ernvall und T. Metsa (1993)) gelungen, unter Computereinsatz zu zeigen, daß (1) f¨ ur alle ungeraden Primzahlen p < 4 · 106 unl¨ osbar ist. Bemerkungen. 1) Nach der anfangs von 3 beschriebenen Vorgehensweise ist klar, daß sich L¨ osungen (x, y, z) ∈ Z3 mit z = 0 der Fermat–Gleichung 7(1) und rationale Punkte (u, v) der durch (4)
V n = 1 − Un
definierten algebraischen Kurve gegenseitig entsprechen. Nach 5(1) ist die “Fermat–Kurve” (4) vom Geschlecht 12 (n − 1)(n − 2), also im Fall n = 3 elliptisch. Es ist nun ganz leicht nachzurechnen, daß (4) f¨ ur n = 3 und 4(1) f¨ ur k = −432, also Y 2 = X 3 −432, in dem in 4 erkl¨ arten Sinne birational a¨quivalent sind. Dazu zeigt man, daß die Transformationen U = (Y − 36)/(Y + 36), V = 3X/(Y + 36) ¨ bzw. X = 12V /(1 − U ), Y = 36(1 + U )/(1 − U ) die Uberg¨ ange von der einen zur anderen Gleichung vermitteln. Nun kl¨ art sich auch auf, wieso Gleichung 4(1) f¨ ur k = −432 lediglich zwei rationale L¨ osungen hat, vgl. Bemerkung 1 zu 4. 2) Da die Fermat–Kurve (4) f¨ ur n ≥ 4 ein Geschlecht gr¨oßer als Eins hat, liefert der Satz von Faltings am Schluß von 5 die Endlichkeit der Anzahl ihrer rationalen Punkte. Anders ausgedr¨ uckt: F¨ ur jedes n ≥ 4 ist die Anzahl der primitiven L¨ osungen (x, y, z) ∈ Z3 der Fermat–Gleichung 7(1) endlich. 3) Dem Leser, der sich u ¨ber Entwicklung und Stand bis 1919 des Fermat– Problems genauer informieren m¨ochte, sei das Buch von P. Bachmann (Das Fermatproblem in seiner bisherigen Entwicklung (Nachdruck), Springer, Berlin ¨ etc., 1976) genannt. Dieses enth¨alt eine hervorragende Ubersicht u ¨ber alle wichtigen Resultate zur Fermat–Vermutung, die bis zum Erscheinungsjahr 1919 der Originalausgabe gefunden wurden. Aus der neueren Literatur seien die beiden Werke von Edwards [3] und P. Ribenboim [23] besonders empfohlen.
9. L¨ osung des Fermat–Problems. Auf einer kleineren Spezialtagung u ¨ber algebraische Zahlentheorie in Cambridge (England) hielt A. Wiles am 21., 22. und 23. Juni 1993 drei zusammenh¨ angende Vortr¨ age u ¨ber “Modular forms, elliptic curves and Galois representations”. Nichts im Titel deutete auf Querverbindungen zum Fermat–Problem hin. Am Ende seines dritten Vortrags schrieb Wiles als Folgerung aus wesentlich allgemeineren S¨ atzen ein quod erat demonstrandum hinter den Fermatschen Satz. Stunden sp¨ ater verbreitete sich bereits die Nachricht von diesem Ereignis durch Faxe und Electronic Mails u ¨ber die ganze mathematische Welt. Schon am 24. Juni berichtete “The New York Times” auf Seite 1 u ¨ber diese Sensation. Was war geschehen?
184
4. Additive Probleme und diophantische Gleichungen
Die Vorarbeiten, die schlußendlich zum Erfolg f¨ uhrten, begannen 1955, als Y. Taniyama eine (hier nicht wiederzugebende) Vermutung elliptische Kurven u ¨ber ater durch Forschungen von G. Q betreffend formulierte, die wenige Jahre sp¨ Shimura und A. Weil weiter pr¨azisiert wurde. Aber fast drei Jahrzehnte lang ahnte niemand, daß diese Dinge irgendwie mit dem Fermat–Problem zu tun haben k¨ onnten. Erst 1986 stellte G. Frey eine u ¨berraschende Beziehung zwischen diesem Problem und der Shimura–Taniyama–Weil–Vermutung her und 1987 konnte K. Ribet beweisen, daß aus der Richtigkeit der Shimura–Taniyama– Weil–Vermutung diejenige der Fermat-Vermutung folgt. Seit Bekanntwerden dieses Zusammenhangs hat Wiles an einem Beweis der Shimura–Taniyama– Weil–Vermutung gearbeitet, wenigstens f¨ ur elliptische Kurven speziellen Typs, die auch schon f¨ ur die Fermat–Vermutung ausreichen w¨ urden. Nach der großen Sensation im Juni 1993 gab es bereits zwei Monate sp¨ater erste Ger¨ uchte und Spekulationen u ¨ber L¨ ucken im noch nicht publizierten Beweis von Wiles: Nachdem sich sogar die Weltpresse (z.B. “Le Monde” vom 2. Dezember 1993:“Le th´eor`eme de Fermat fait de la r´esistance”) dieser Schwierigkeiten annahm, wandte sich Wiles selbst am 4. Dezember 1993 mit einem e–mail an ¨ die mathematische Offentlichkeit: “However the final calculation . . . is not yet complete as it stands. I believe that I will be able to finish this in the near future using the ideas explained in my Cambridge lectures.” W¨ ahrend der ersten H¨alfte des Jahres 1994 flossen die Neuigkeiten zum Fermat– Problem dann relativ sp¨ arlich. Es war aber nur nat¨ urlich, daß Wiles zu einem Hauptvortrag auf dem Z¨ uricher Internationalen Mathematiker–Kongreß im August desselben Jahres eingeladen wurde. Der Titel seines Vortrags, des letzten des gesamten Kongresses, ließ alle M¨oglichkeiten offen. Tats¨achlich stellte er dort unmißverst¨ andlich klar, was er bis dato zeigen konnte, daß jedoch die hartn¨ ackigste L¨ ucke in seinem Beweis noch immer nicht geschlossen sei. Nur wenige Wochen sp¨ater, am 25. Oktober 1994, machte Wiles dann zwei Manuskripte der Fachwelt zug¨ anglich, in denen die oben angesprochene L¨ ucke zwar nicht beseitigt, wohl aber unter Mithilfe seines Sch¨ ulers R. Taylor unter R¨ uckgriff auf einen fr¨ uheren Ansatz umgangen wurde. Die beiden hier angesprochenen Arbeiten von Wiles bzw. Taylor und Wiles sind in Ann. Math. (2) 142, 443–551 bzw. 553–572 (1995) publiziert. Zusammengenommen enthalten sie weit mehr als einen von den f¨ uhrenden Spezialisten inzwischen als stichhaltig akzeptierten Beweis der Fermat–Vermutung, n¨ amlich einen Beweis der Shimura–Taniyama–Weil–Vermutung f¨ ur sogenannte semistabile elliptische Kurven u ¨ber Q. Nach L¨osung des u ¨ber 350 Jahre alten Fermat–Problems, mit dem so viele Generationen hervorragender Zahlentheoretiker vergeblich gerungen haben, ist es verst¨andlich, daß ein breiteres mathematisches Publikum den Wunsch hat,
§ 3.
Die Pellsche Gleichung und Verwandtes
185
sich die grundlegenden Ideen der Beweisf¨ uhrung nicht m¨ uhsam aus den 130 Seiten der beiden Originalarbeiten herausholen zu m¨ ussen, sondern sich in kurzen ¨ Ubersichtsartikeln informieren zu k¨ onnen. Als solche seien z.B. die vorz¨ uglichen Aufs¨ atze von Faltings (DMV– Mitteilungen 2/1995, S. 6–8) und Wiles (Proc. ICM Z¨ urich 1994, Vol. 1, Birkh¨ auser, Basel–Boston–Berlin, 1995, pp. 243–245) genannt.
§ 3.
Die Pellsche Gleichung und Verwandtes
1. Problemstellung. Als Pellsche Gleichung bezeichnet man die diophantische Gleichung in zwei Unbestimmten (1)
X 2 − dY 2 = 1,
wobei d = 0 als fest vorgegebene ganze Zahl gedacht ist. Offenbar sind (1, 0) und (−1, 0) stets L¨osungen von (1) – man bezeichnet sie als die trivialen L¨ osungen von (1) – und bei d ≤ −2 gibt es auch keine weiteren. Bei d = −1 kommen zu den beiden trivialen noch die beiden L¨ osungen (0, 1), (0, −1) hinzu. Recht uninteressant ist weiterhin der Fall eines quadratischen d: Ist n¨ amlich d = e2 mit ganzem e = 0, so l¨ ost (x, y) ∈ Z2 Gleichung (1) genau dann, wenn (x + ey)(x − ey) = 1 gilt, d.h. wenn gleichzeitig entweder x + ey = 1, x − ey = 1 oder x + ey = −1, x − ey = −1 gelten. Unschwer erkennt man hieraus, daß (1) im Falle eines quadratischen d = 0 alleine die beiden trivialen L¨ osungen hat. Zur¨ uck bleibt somit das Problem, die L¨ osbarkeit der Pellschen Gleichung (1) bei d ∈ N, d kein Quadrat, zu untersuchen. In dieser Allgemeinheit scheint das Problem von Fermat gestellt worden zu sein, der 1657 in einem Brief an Frenicle behauptete, (1) habe unter den soeben angegebenen Bedingungen an d stets unendlich viele ganzzahlige L¨ osungen (x, y). Nach einer Bemerkung Eulers ist diese Frage wohl zuerst von J. Pell im 17. Jahrhundert mit einigem Erfolg angegriffen worden. Es gibt jedoch auch Mathematikhistoriker, die einen wirklichen Beitrag Pells zur Theorie der Gleichung (1) bezweifeln. Fest steht, daß erst Lagrange um 1766 die volle L¨osung des Problems gelang, indem er zeigte, daß (1) unter den u ¨ber d zuletzt gemachten Voraussetzungen unendlich viele L¨ osungen besitzt, und indem er u ¨berdies die Struktur dieser L¨ osungsgesamtheit vollst¨ andig aufkl¨ arte. Der Darstellung der genannten Lagrangeschen Resultate sind die Abschnitte 3 und 4 gewidmet. Schließlich sei noch angemerkt, daß historisch die Besch¨aftigung mit der Gleichung (1) f¨ ur spezielle, kleine d etwa bis 400 v. Chr. zur¨ uckreicht. Um √ diese Zeit tauchten in Indien und Griechenland rationale N¨ aherungen xy f¨ ur 2 auf, 577 deren Z¨ ahler und Nenner der Gleichung (1) f¨ ur d = 2 gen¨ ugen, etwa 17 12 und 408 .
186
4. Additive Probleme und diophantische Gleichungen
Bei Euklid (Elemente II, § 10) findet sich im Prinzip – allerdings geometrisch eingekleidet – ein rekursives Verfahren zur Bestimmung s¨amtlicher L¨ osungen von (1) bei d = 2 in nat¨ urlichen Zahlen. Die bedeutenden griechischen Mathematiker der alexandrinischen Zeit (ca. 300 – 200 v. Chr. ) wagten sich gelegentlich auch f¨ ur große d–Werte an Gleichung (1) heran. So soll Archimedes dem Eratosthenes das ber¨ uhmte “Rinderproblem” gestellt haben, in dem unter einer ganzen Reihe von Nebenbedingungen Anzahlen verschiedenfarbiger K¨ uhe und Stiere gesucht waren (vgl. Dickson [G 2] II, S. 342ff.). Immerhin lief dieses Problem auf die Bestimmung nichttrivialer L¨ osungen von (1) f¨ ur d = 2 · 3 · 7 · 11 · 29 · 353 = 4 729 494 hinaus. ¨ Ubrigens hat dieses Rinderproblem den Dichter G.E. Lessing (1773) zu einem griechischen Epigramm in 24 Versen angeregt.
2. Der Dirichletsche Approximationssatz. Wie in 1 erw¨ahnt, wurden in der Antike L¨ osungen der Pellschen Gleichung 1(1) in nat¨ urlichen Zahlen zur Berechnung √ guter rationaler Ann¨ aherungen an gewisse quadratische Irrationalit¨ aten wie 2 benutzt. Um die in 1 in Aussicht gestellten Lagrangeschen Ergebnisse zu erhalten, ¨ber die √ stellt man heute meist umgekehrt ein Resultat u Approximation von d durch rationale Zahlen an den Anfang und gewinnt hieraus dann s¨ amtliche L¨osungen der Pellschen Gleichung. Dieser Weg wird auch hier beschritten. Die ben¨ otigte Approximationsaussage entnimmt man dabei dem Dirichletschen Approximationssatz. Sei α ∈ IR, ω ∈ N, ω ≥ 2. Dann existieren p, q ∈ Z mit 1 ≤ q < ω und |αq − p| ≤ ω1 . Ist α irrational, so existieren unendlich viele verschiedene teilerfremde p, q ∈ Z, q > 0, f¨ ur die |αq − p| < 1q gilt. Beweis. F¨ ur den ersten Teil des Satzes betrachte man die ω + 1 im Einheitsintervall [0, 1] gelegenen Zahlen 1 und∗) {αx} mit x ∈ {0, . . . , ω − 1} und die j ω Teilintervalle [ j−1 ange ω1 . Es existiert ω , ω ], j = 1, . . . , ω, von [0, 1] der L¨ mindestens ein derartiges Teilintervall, in das wenigstens zwei der ω + 1 oben genannten Zahlen fallen. Sind dies zwei Zahlen des Typs {αx}, etwa {αx1 } und {αx2 }, wobei o.B.d.A. x1 < x2 gelten m¨oge, so setzt man q := x2 − x1 , ullt. Fallen jedoch 1 und p := [αx2 ] − [αx1 ] und hat damit alle Forderungen erf¨ eine Zahl des Typs {αx} ins gleiche Teilintervall, so ist x > 0, da die Zahl 0 ∗)
F¨ ur reelles z wird {z} := z −[z] gesetzt; {z} heißt der gebrochene Teil von z. Weiter bedeutet z := Min({z}, 1−{z}) den Abstand von z zur n¨ achstgelegenen ganzen Zahl.
§ 3.
Die Pellsche Gleichung und Verwandtes
187
wegen ω ≥ 2 nicht in diesem Teilintervall liegen kann. In diesem Fall setzt man q := x, p := [αx]+1 und hat damit erneut alle Forderungen f¨ ur die erste Aussage im Approximationssatz erf¨ ullt. Zu jedem ω = 2, 3, . . . existiert also ein Paar (p(ω), q(ω)) ∈ Z × N mit 1 , q(ω) < ω; ω dabei d¨ urfen p(ω), q(ω) offenbar als teilerfremd vorausgesetzt werden. K¨amen nun unter den Paaren (p(ω), q(ω)), ω = 2, 3, . . ., nur endlich viele verschiedene vor, so g¨ abe es ein (p0 , q0 ) ∈ Z × N mit p(ω) = p0 , q(ω) = q0 f¨ ur unendlich viele ω und f¨ ur diese ω m¨ ußte |αq0 − p0 | ≤ ω1 nach (1) gelten, woraus mit α = p0 /q0 die Rationalit¨ at von α folgen w¨ urde entgegen der Zusatzvoraussetzung f¨ ur den zweiten Teil des Satzes. Aus (1) folgt |αq(ω) − p(ω)| < 1/q(ω) f¨ ur ω = 2, 3, . . . und somit ist auch der zweite Teil bewiesen. (1)
|αq(ω) − p(ω)| ≤
Bemerkungen. 1) Dirichlet (Werke I, 635–638) hat urspr¨ unglich einen wesentlich allgemeineren, sich auf simultane Approximationen beziehenden Satz angegeben. 2) Der zweite Teil des Dirichletschen Approximationssatzes kann erg¨ anzt werden zu einem notwendigen und hinreichenden Irrationalit¨ atskriterium. Eine reelle Zahl α ist genau dann irrational, wenn die Ungleichung |αq − p| < 1/q unendlich viele verschiedene teilerfremde L¨osungen (p, q) ∈ Z × N besitzt. Beweis. Ist α irrational, so ist bereits alles erledigt; diesen Teil erh¨alt man u ¨brigens auch mittels Kettenbruchtheorie, vgl. den Beginn von 5.3.6. Sei umgekehrt α rational, etwa α = a/b mit teilerfremden a, b ∈ Z, b > 0. Die Ungleichung im Kriterium ist dann mit |qa − pb| < b/q gleichbedeutend. Hier verschwindet die linke Seite f¨ ur teilerfremde p, q ∈ Z, q > 0 genau f¨ ur p = a, q = b und so folgt aus der letzten Ungleichung bei (p, q) = (a, b) direkt q < b und daraus |p| < 1 + |a|. Bei rationalem α hat die Ungleichung im Kriterium also nur endlich viele teilerfremde L¨osungen (p, q). 3) Aus dem ersten Teil des Dirichletschen Approximationssatzes folgt Thues Lemma (vgl. 1.2) ohne nochmalige Verwendung des Schubfachprinzips: Man wendet den Approximationssatz n¨ amlich an mit α := /m, ω := v (wegen 0 < u ≤ m < uv ist 1 < v); somit gibt es ganze p, q mit 1 ≤ q < v und |q − pm| ≤ m/v < u. Sicher ist q = pm, da sonst m|q wegen (, m) = 1 gelten m¨ ußte; dann w¨ are aber m ≤ q < v ≤ m, was nicht geht. Nun leisten x := |q − pm|, y := q das in Thues Lemma Gew¨ unschte: Da y − pm entweder x oder −x ist, ist auch ±x ≡ y (mod m) klar.
188
4. Additive Probleme und diophantische Gleichungen
Diese Bemerkung macht verst¨andlich, wieso gelegentlich (vgl. etwa Hardy– Wright [6]) der Dirichletsche Approximationssatz zum Beweis von Satz 1.1 verwandt wird.
3. Unendlich viele L¨ osungen der Pell–Gleichung. Wie bereits in 1 in Aussicht gestellt, soll nun bewiesen werden der Satz. (1)
Ist d ∈ N kein Quadrat, so hat die Pellsche Gleichung X 2 − dY 2 = 1
unendlich viele L¨ osungen. √ achst, daß dies α nach Korollar Beweis. Man setzt α := d und bemerkt zun¨ 1.1.9 irrational ist. Nach dem zweiten Teil des Dirichletschen Approximationssatzes gibt es unendlich viele verschiedene (x, y) ∈ Z × N mit teilerfremden x, y und (2)
|x − αy| <
1 . y
¨ Ubrigens sind hier auch die x positiv; denn bei x ≤ 0 w¨are (2) zu (|x| + αy)y < 1 aquivalent und die letztere Ungleichung ist ersichtlich unm¨ ¨ oglich. Offenbar gilt f¨ ur diese (x, y) weiterhin (3)
0 < |x2 − dy 2 | = |x − αy|(x + αy) <
x + α < 2α + 1. y
Denn aus (2) ist xy < α + y −2 ≤ α + 1 sofort klar und x2 = dy 2 ist unm¨ oglich. Wegen (3) gibt es ein ganzes k mit 0 < |k| < 2α + 1, so daß f¨ ur unendlich viele verschiedene (x, y) wie oben die Gleichung (4)
x2 − dy 2 = k
erf¨ ullt ist. Nach dem Dirichletschen Schubfachprinzip 2.3.1 gibt es ξ, η ∈ {0, . . . , |k| − 1}, so daß gleichzeitig (5)
x ≡ ξ,
y≡η
(mod k)
f¨ ur unendlich viele der (4) gen¨ ugenden (x, y) ∈ N2 gilt. Seien (x1 , y1 ), (x2 , y2 ) zwei verschiedene solche Paare; damit gewinnt man (6)
(x1 − αy1 )(x2 + αy2 ) = (x1 x2 − dy1 y2 ) + α(x1 y2 − x2 y1 )
§ 3.
Die Pellsche Gleichung und Verwandtes
189
und wegen (4) und (5) x1 x2 − dy1 y2 ≡ ξ 2 − dη 2 ≡ 0,
x1 y2 − x2 y1 ≡ 0 (mod k).
Definiert man im Anschluß hieran u, v ∈ Z verm¨oge ku := x1 x2 − dy1 y2 ,
kv := x1 y2 − x2 y1 ,
so wird (6) zu (6 )
(x1 − αy1 )(x2 + αy2 ) = k(u + αv)
und analog gilt (6 )
(x1 + αy1 )(x2 − αy2 ) = k(u − αv).
ullen, liefert Multiplikation von (6 ) und Da (x1 , y1 ) und (x2 , y2 ) beide (4) erf¨ (6 ) und anschließende Division durch k2 die Gleichung (7)
u2 − dv 2 = 1.
Sicher ist hier uv = 0; denn v = 0 hieße x1 y2 = x2 y1 und Positivit¨ at sowie Teilerfremdheit der xi , yi w¨ urde x2 = x1 , y2 = y1 implizieren entgegen der vorausgesetzten Verschiedenheit von (x1 , y1 ) und (x2 , y2 ). F¨ ur genau eines der vier Paare (±u, ±v) sind beide Komponenten positiv und wegen (7) l¨ osen alle vier Paare die Pellsche Gleichung (1) in nichttrivialer Weise. Man weiß also, daß die Menge P := {(x, y) ∈ N2 : x2 − dy 2 = 1} nicht leer ist. F¨ ur (x, y) ∈ P ist x + αy > 1 und somit sind die Zahlen n (x + αy)n = xn−2ν dν y 2ν 2ν 0≤ν≤n/2 n (8) +α xn−2ν−1 dν y 2ν+1 2ν + 1 0≤ν
=: xn + αyn
(n = 1, 2, . . .)
paarweise verschieden, also auch die Paare (xn , yn ) ∈ N2 . Wegen (8 )
(x − αy)n = xn − αyn
f¨ ur n = 1, 2, . . . ,
(8) und (x, y) ∈ P ist x2n − dyn2 = (x2 − dy 2 )n = 1, also sind alle (xn , yn ) aus P und der Satz ist bewiesen.
190
4. Additive Probleme und diophantische Gleichungen
Eine in 7 ben¨ otigte Konsequenz des obigen Satzes ist folgendes Korollar. Ist d ∈ N kein Quadrat und ρ ∈ Z, ρ = 0, so hat (1) unendlich viele L¨osungen (x, y) ∈ N2 mit x ≡ 1, y ≡ 0 (mod ρ). Beweis. Man wendet den obigen Satz an auf die Pell–Gleichung X 2 − d Y 2 = 1 mit d := dρ2 , was positiv ganz, aber kein Quadrat ist: (x , y ) ∈ N2 l¨ ost diese genau dann, wenn (x , |ρ|y ) ∈ N2 Gleichung (1) l¨ ost. Daher hat (1) jedenfalls unendlich viele verschiedene L¨osungen (ˆ x, yˆ) ∈ N2 mit yˆ ≡ 0 (mod ρ) und daher 2 x ˆ ≡ 1 (mod ρ) wegen (1). L¨ost (ˆ x, yˆ) ∈ N2 Gleichung (1) und setzt man 2 2 x := x ˆ + dˆ y , y := 2ˆ xyˆ, so ist (x, y) aus N2 und l¨ ost wegen x2 + dˆ y 2 )2 − 4dˆ x2 yˆ2 = (ˆ x2 − dˆ y 2 )2 = 1 x2 − dy 2 = (ˆ Gleichung (1); weiter entsprechen verschiedenen (ˆ x, yˆ) auch verschiedene (x, y). Damit hat man unendlich viele verschiedene L¨ osungen (x, y) ∈ N2 von (1) mit y = 2ˆ xyˆ ≡ 0,
x=x ˆ2 + dˆ y2 ≡ 1
(mod ρ).
4. L¨ osungsstruktur der Pell–Gleichung. Unter Ab¨ anderung der Bezeichnungsweise aus 3 werde nun y1 ∈ N minimal so gew¨ahlt, daß es dazu ein x1 ∈ N ur jedes (x, y) ∈ P ist dann x21 = 1 +dy12 ≤ 1+dy 2 = x2 , gibt mit (x1 , y1 ) ∈ P. F¨ also auch x1 ≤ x und (x1 , y1 ) heißt die Minimall¨ osung der Pellschen Gleichung. Klar ist: Alle (xn , yn ), die analog zu 3(8) gem¨aß (1)
xn + αyn = (x1 + αy1 )n ,
n = 1, 2, . . . ,
gebildet werden, geh¨ oren zu P. Der folgende Satz besagt, daß es andere (x, y) ∈ P als die soeben beschriebenen (xn , yn ) nicht gibt. Satz. S¨ amtliche L¨osungen der Pell–Gleichung 3(1) in nat¨ urlichen Zahlen sind gegeben durch 1 (x1 +αy1 )n −(x1 −αy1 )n , 2α √ osung von 3(1) und α := d. hier bedeutet (x1 , y1 ) die Minimall¨ x=
1 (x1 +αy1 )n +(x1 −αy1 )n , 2
y=
n ∈ N;
Beweis. Ist (x, y) ∈ P, so ist 1 < x1 + αy1 ≤ x + αy wegen y1 ≤ y und dem vorhin daraus gefolgerten x1 ≤ x. Daher ist f¨ ur genau ein n ∈ N (x1 + αy1 )n ≤ x + αy < (x1 + αy1 )n+1 ,
§ 3.
Die Pellsche Gleichung und Verwandtes
191
was wegen 0 < x1 − αy1 zu (2)
1 ≤ (x + αy)(x1 − αy1 )n < x1 + αy1
¨quivalent ist. Wegen 3(8 ) und (1) ist (x1 − αy1 )n = xn − αyn und mit u := a xxn − dyyn , v := yxn − xyn folgt 1 ≤ u + αv < x1 + αy1 aus (2). Wegen (x, y), (xn , yn ) ∈ P ist u2 − dv 2 = (u + αv)(u − αv) = (x + αy)(xn − αyn )(x − αy)(xn + αyn ) = 1 klar und ebenso v ∈ N0 : Denn bei v < 0 m¨ ußte 1 ≤ u + αv < u − αv sein, was nicht geht. Die Ungleichung v ≥ 0 bedeutet xn ≥ xyn /y, was zu u ≥ uhrt. W¨ are nun v ≥ 1, so m¨ ußte bereits v ≥ y1 (und (x2 −dy 2 )yn /y = yn /y > 0 f¨ damit u ≥ x1 ) nach Definition der Minimall¨ osung gelten, also u+αv ≥ x1 +αy1 . unden wie nach 3(7) folgt Daher ist v = 0, d.h. yxn = xyn und aus denselben Gr¨ daraus (3)
x = xn ,
y = yn ;
denn jedes 3(1) gen¨ ugende Paar ganzer Zahlen hat automatisch teilerfremde Komponenten. Aus (1) und xn − αyn = (x1 − αy1 )n folgt mit (3) sofort die Behauptung. Nach den bisherigen Erl¨ auterungen ist bei nicht quadratischem d ∈ N klar, daß die Pell–Gleichung genau die folgenden L¨ osungen besitzt: Die beiden trivialen (±1, 0) und f¨ ur jedes (x, y) ∈ P die vier Paare (±x, ±y). Offenbar reduziert obiger Satz das Problem der L¨ osung der Pell–Gleichung 3(1) unter den u ¨ber d gemachten Voraussetzungen einzig und allein darauf, die zugeh¨orige Minimall¨ osung aufzufinden. Prinzipiell l¨ aßt sich diese stets wie folgt gewinnen: Man betrachte die Zahlen 1 + dy 2 f¨ ur y = 1, 2, . . .; das kleinste y1 , f¨ ur welches 1+dy12 ein Quadrat wird, etwa x21 , f¨ uhrt zwangsl¨aufig zur Minimall¨ osung. osung von Ist z.B. d = 3, so wird y1 = 1, x1 = 2 und (2, 1) ist die Minimall¨ X 2 − 3Y 2 = 1. Dieses Probierverfahren zur Gewinnung der Minimall¨ osung kann, abh¨ angig von d, ziemlich lange dauern; zum Beispiel lautet im Falle der Primzahl d = 98597 die Minimall¨ osung (197193, 628), vgl. 5.3.6. Einen stets gangbaren und systematischen Weg zur Auffindung der Minimall¨ osung hat Euler mit Hilfe der Theorie der regelm¨aßigen Kettenbr¨ uche aufgezeigt, worauf in 5.3.6 eingegangen wird.
5. Pythagor¨ aische Dreiecke mit Kathetendifferenz Eins. Als Anwendung der Ergebnisse u ¨ber die Pell–Gleichung sollen hier alle pythagor¨ aischen Dreiecke bestimmt werden, deren Kathetenl¨angen sich um Eins unterscheiden.
192
4. Additive Probleme und diophantische Gleichungen
Offenbar geht es um die Ermittlung aller (x, y, z) ∈ N3 mit x2 + y 2 = z 2 und |x − y| = 1. Wegen der letzten Bedingung sind alle sich hier ergebenden pythagor¨ aischen Tripel primitiv und es darf o.B.d.A. x < y (hier also y = x+1) vorausgesetzt werden. Somit interessieren alle Paare (x, z) ∈ N2 mit 2x2 + 2x + 1 = z 2 oder a¨quivalent (2x + 1)2 − 2z 2 = −1 und man hat die diophantische Gleichung X 2 − 2Y 2 = −1
(1)
zu studieren und alle ihre L¨ osungen in nat¨ urlichen Zahlen zu finden. Dies wiederum soll sofort etwas allgemeiner durchgef¨ uhrt werden, indem die Gleichung X 2 − dY 2 = −1
(2)
untersucht wird. W¨ ahrend jedoch die Pell–Gleichung 3(1) f¨ ur nicht quadratisches d ∈ N nach Satz 3 stets unendlich viele L¨osungen hat, kann (2) unter denselben Voraussetzungen unl¨osbar sein: Ist d etwa durch 4 oder durch eine Primzahl ≡ 3 (mod 4) teilbar, so ist (2) unl¨ osbar. Im ersten Fall folgt dies aus x2 ≡ 3 (mod 4) f¨ ur alle ganzen x. Ist im zweiten Fall p ≡ 3 (mod 4) eine in d aufgehende Primzahl, so gilt x2 ≡ −1 (mod p) nach dem ersten Erg¨anzungssatz zum quadratischen Reziprozit¨ atsgesetz (vgl. 3.2.6) und also auch x2 − dy 2 = −1 ¨ f¨ ur alle ganzen x, y. Ubrigens findet sich ein notwendiges und hinreichendes L¨ osbarkeitskriterium f¨ ur (2) mittels Kettenbruchtheorie bei Perron [19], § 26. ¨ Uber Gleichung (2) gibt Auskunft der folgende Satz. Sei d ∈ N kein Quadrat. Ist (ξ, η) ∈ Z2 eine feste L¨osung von (2), so erh¨alt man in der Form (ξx − dηy, ηx − ξy) jede L¨osung von (2), wenn (x, y) alle L¨ osungen der zugeh¨origen Pell–Gleichung 3(1) durchl¨ auft. Beweis. Man betrachtet die (von (ξ, η) abh¨ angige) Abbildung ϕ : (x, y) → (ξx − dηy, ηx − ξy) der Menge aller L¨osungen von osungen von (2). Wie √ 3(1) in die Menge aller L¨ in 3(6) ist n¨ amlich mit α := d (x − αy)(ξ + αη) = (ξx − dηy) + α(ηx − ξy);
(3)
ersetzt man hierin α durch −α und multipliziert dann die neu entstandene Gleichung mit (3), so wird 1 · (−1) = (x2 − dy 2 )(ξ 2 − dη 2 ) = (ξx − dηy)2 − d(ηx − ξy)2 . Ist nun (u, v) ∈ Z2 vorgegeben, so kann man das lineare Gleichungssystem ξx − dηy = u, 2
2
ηx − ξy = v
wegen dη −ξ = 1 nach x, y aufl¨ osen und erh¨ alt x = −uξ +dηv, y = −ηu+ξv ∈ Z. L¨ ost (u, v) Gleichung (2), so l¨ ost (x, y) Gleichung 3(1). Somit ist ϕ surjektiv; die Injektivit¨ at von ϕ ist klar.
§ 3.
193
Die Pellsche Gleichung und Verwandtes
Ersichtlich l¨ ost (1, 1) Gleichung (1), so daß sich nach dem soeben gezeigten Satz alle L¨ osungen von (1) in der Form (x − 2y, x − y) ergeben, wenn (x, y) alle L¨ osungen der zu (1) geh¨ origen Pell–Gleichung X 2 − 2Y 2 = 1
(4)
durchl¨ auft. Da (3, 2) √ die Minimall¨ osung alt man aus Satz 4, wenn √ von (4) ist, erh¨ man noch β := 3 + 2 2, γ := 3 − 2 2 setzt: Die (xn , yn ) mit (5)
xn =
1 n (β + γ n ), 2
1 yn = √ (β n − γ n ) (n = 0, 1, . . .) 2 2
sind genau die (4) gen¨ ugenden Paare mit nichtnegativen Komponenten. Da β und γ die beiden Wurzeln des Polynoms X 2 − 6X + 1 sind, gilt ur n = 0, 1, . . . β n+2 − 6β n+1 + β n = 0 und γ n+2 − 6γ n+1 + γ n = 0 f¨ und so gen¨ ugen die xn wegen (5) der Rekursion xn+2 = 6xn+1 − xn
(6)
(n = 0, 1, . . .)
mit den Anfangswerten x0 = 1, x1 = 3. Derselben Rekursion gehorchen die yn , allerdings mit den Anfangswerten y0 = 0, y1 = 2. Man hat also nachstehende kleine Tabelle f¨ ur den Beginn dieser beiden Folgen: n
0
1
2
3
4
5
6
7
8
9
xn
1
3
17
99
577
3363
19601
114243
665857
3880899
yn
0
2
12
70
408
2378
13860
80782
470832
2744210
Da (7)
yn < xn < 2yn
f¨ ur n = 1, 2, . . .
gilt, hat f¨ ur alle diese n von den vier verschiedenen Paaren (xn + 2yn , xn + yn ), (xn − 2yn , xn − yn ), (−xn + 2yn , −xn + yn ), (−xn − 2yn , −xn − yn ) jeweils genau das erste beide Komponenten positiv; f¨ ur n = 0 sind die beiden ersten Paare gleich (1, 1), die beiden letzten (−1, −1). Damit kann gesagt werden: Alle L¨osungen von (1) in nat¨ urlichen Zahlen sind von der Form (xn +2yn , xn +yn ) =: (un , vn ) f¨ ur n = 0, 1, . . . . Diese un , vn kann man wiederum
194
4. Additive Probleme und diophantische Gleichungen
rekursiv bestimmen: Da die xn , yn n¨ amlich derselben linearen homogenen Reur kursion (6) gen¨ ugen, muß dies auch f¨ ur die un , vn zutreffen, d.h. man hat f¨ n = 0, 1, . . . un+2 = 6un+1 − un
bzw.
vn+2 = 6vn+1 − vn
mit den Anfangswerten u0 = 1, u1 = 7; v0 = 1, v1 = 5. Die ersten un bzw. vn entnimmt man der zweiten bzw. f¨ unften Zeile der nachfolgenden Tabelle; nach den Ausf¨ uhrungen vor (1) erscheinen in den drei letzten Zeilen der n–ten Spalte f¨ ur n = 1, 2, . . . die Komponenten x, y, z der neun kleinsten pythagor¨ aischen Tripel (x, y, z) mit y = x + 1. n
0 1
2
3
4
5
6
7
8
9
un
1 7 41 239 1393 8119 47321 275807 1607521 9369319
1 (un 2
− 1) 0 3 20 119
696 4059 23660 137903
803760 4684659
1 2 (un
+ 1) 1 4 21 120
697 4060 23661 137904
803761 4684660
vn
1 5 29 169
985 5741 33461 195025 1136689 6625109
Bemerkungen. 1)√ Wegen β > 1 > γ > 0 entnimmt √ man (5) die Relation limn→∞ xn /yn = 2 und in der Tat weicht x9 /y9 von 2 um weniger als 6·10−14 ab. Die beiden Br¨ uche x2 /y2 und x4 /y√4 wurden, wie in 1 erw¨ ahnt, bereits vor etwa 2500 Jahren als N¨aherungen f¨ ur 2 verwendet. In der Sprache von 5.3.2 √ uche sind die xn /yn nichts anderes als die√oberhalb 2 gelegenen N¨aherungsbr¨ des regelm¨aßigen Kettenbruchs von 2. 2) In (6) ist der Leser zweigliedrigen linearen homogenen Rekursionen begegnet. Das historich ¨alteste Beispiel einer derartigen Rekursion ist wohl die durch F0 := 0
F1 := 1 und
Fn+2 := Fn+1 + Fn
f¨ ur n ≥ 0
definierte Fibonacci–Folge 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, . . .. L. Pisano ∗) , genannt Fibonacci (kurz f¨ ur filius Bonacci), hat in seinem Liber Abaci (1202) folgendes Problem gestellt. Jemand setzt ein neugeborenes Kaninchenpaar in einen Stall. Nach w Wochen ist es fortpflanzungsf¨ ahig und nach weiteren w Wochen wird ein junges Kaninchenpaar geworfen. Das Leben des jungen Paares ∗)
Seine Geburtsstadt Pisa ehrte Fibonacci mit einer monumentalen Marmorskulptur, die sich unter denen zahlreicher weiterer Honoratioren im Camposanto auf der weltber¨ uhmten Piazza dei Miracoli findet, und zwar in der dem Eingang diagonal gegen¨ uberliegenden Ecke.
§ 3.
Die Pellsche Gleichung und Verwandtes
195
verl¨ auft genau wie das des ¨alteren, welch letzteres wieder nach w Wochen ein drittes Kaninchenpaar hervorbringt usw. Man u ¨berlegt sich leicht, daß nach n · w Wochen Fn Kaninchenpaare im Stall sind (falls kein Kaninchen eingeht). ¨ Die Bedeutung des Liber Abaci beruht allerdings weniger auf der Uberlieferung dieser Aufgabe als vielmehr auf der Tatsache, daß dies eines der wenigen einflußreichen mittelalterlichen Mathematikb¨ ucher war, welches der indisch–arabischen Ziffernschreibweise (vgl. 5.1.12) in Europa zum Durchbruch verhalf.
6. Einheiten reell–quadratischer Zahlk¨ orper. Wie bei quadratfreiem gan√ zem d = 1 der Ganzheitsring Od des quadratischen Zahlk¨ orpers Q( d) aussieht, wurde in Satz 1.6.7 ermittelt. Anschließend wurden in Satz 1.6.8A die Einheiten in Od wie folgt charakterisiert: Bei d ≡ 2, 3 (mod √ 4) ist ε ∈ Od genau dann Einheit, wenn das Paar (x, y) ∈ Z2 in ε = x + y d eine der beiden folgenden Gleichungen l¨ ost. (1a, b)
X 2 − dY 2 = 1,
X 2 − dY 2 = −1.
Ist dagegen√d ≡ 1 (mod 4), so ist ε ∈ Od genau dann Einheit, wenn (x, y) in ugt und eine der beiden Gleichungen ε = 12 (x+y d) der Bedingung 2|(x−y) gen¨ (2a, b)
X 2 − dY 2 = 4,
X 2 − dY 2 = −4
l¨ ost. Hieraus ergibt sich unmittelbar folgender Satz. Bei quadratfreiem ganzem d ≥ 2√f¨ uhren die L¨ osungen (x, y) der Pell– Gleichung (1a) stets zu Einheiten x + y d des reell–quadratischen Zahlk¨ orpers √ Q( d). Bei d ≡ 1 (mod 4) oder d ≡ 2 (mod 8) k¨ o nnen zus¨ a tzlich die L¨ o sungen √ (x, y) von (1b) zu weiteren Einheiten x + y d f¨ uhren; ist schließlich d ≡ 5 (mod 8), so k¨ onnen noch√die L¨ osungen (x, y) mit 2 |xy von (2a) oder (2b) Einheiten der Form 12 (x + y d) liefern. Beweis. Daß (1b) f¨ ur d ≡ 3 (mod 4) unl¨ osbar ist, wurde schon vor Satz 5 gekl¨art; denn dann muß d einen Primfaktor ≡ 3 (mod 4) enthalten. H¨ atte man bei d ≡ 6 (mod 8) eine L¨ osung (x, y) von (1b), so w¨ are x ungerade, also urde. Gibt es dy 2 = x2 + 1 ≡ 2 (mod 8), was 3y 2 ≡ 1 (mod 4) implizieren w¨ eine L¨osung (x, y) mit 2 |xy von (2a) oder (2b), so gilt 1 − d ≡ 4 (mod 8), also d ≡ 5 (mod 8). W¨ ahrend Satz 1.6.8B gezeigt hat, daß imagin¨ ar–quadratische Zahlk¨ orper stets endlich viele, im allgemeinen sogar nur die beiden trivialen Einheiten 1 und −1 besitzen, verhalten sich reell–quadratische Zahlk¨orper in dieser Hinsicht anders:
196
4. Additive Probleme und diophantische Gleichungen
Korollar.
Jeder reell–quadratische Zahlk¨orper hat unendlich viele Einheiten.
Bemerkung. Ist d ∈ N quadratfrei und d ≡ 3, 6 oder 7 (mod 8), √ so r¨ uhren nach obigem Satz die Einheiten des reell-quadratischen Zahlk¨ orpers Q( d) alleine von den L¨ osungen der Pell–Gleichung (1a) her. In den F¨ allen d ≡ 1, 2, 5 (mod 8) kann (1b) l¨ osbar bzw. unl¨osbar sein; Beispiele daf¨ ur sind 17, 2, 5 bzw. 33, 42, 21. Im Fall d ≡ 5 (mod 8) kann (2b) in ungeraden Zahlen l¨ osbar (z.B. f¨ ur d = 13) oder unl¨ osbar (z.B. d = 21) sein; im gleichen Fall ist (2a) in ungeraden Zahlen l¨ osbar z.B. f¨ ur d = 21 und unl¨ osbar f¨ ur d = 37. Dabei sieht man die L¨ osbarkeitsaussagen jeweils mit Hilfe eines leichten Beispiels; f¨ ur die Unl¨ osbarkeitsbehauptungen beachtet man 3|d (vgl. 5) außer f¨ ur (2a) bei d = 37. F¨ ur die Unl¨ osbarkeit von X 2 − 37Y 2 = 4 in ungeraden Zahlen konsultiere man Perron [19], § 26 oder die Tabelle bei A. Cayley (Mathematical Papers IV, 40–42). Nach obigem Satz√ k¨ onnen lediglich im Fall d ∈ N, d ≡ 5 (mod 8) und quadratfrei, osungen der Gleichungen (2a) oder (2b) Einheiten von Q( d) von ungeraden L¨ herr¨ uhren. Man kann sich fragen, ob f¨ ur (2)
X 2 − dY 2 = a,
a ∈ {4, −4}
ein zu Satz 5 analoges Ergebnis gezeigt werden kann derart, daß man aus einer einzigen L¨osung (ξ, η) von (2) in ungeraden Zahlen mit Hilfe aller L¨ osungen der zugeh¨ origen Pell–Gleichung (1a) s¨amtliche ungeraden L¨ osungen von (2) gewinnen kann. Dies ist in folgendem Sinne “genau zur H¨ alfte” richtig: Proposition. Sei d ∈ N, d ≡ 5 (mod 8) und (ξ, η) ∈ Z2 eine feste L¨osung von (2) mit 2 |ξη. Dann hat jedes Paar aus (3)
{(ξx − dηy, ηx − ξy) : (x, y) ∈ Z2 , x2 − dy 2 = 1}
ungerade Komponenten und l¨ ost (2). Ist umgekehrt (ˆ x, yˆ) mit 2 |ˆ xyˆ irgendeine L¨osung von (2), so kommt von den beiden L¨osungen (ˆ x, yˆ), (ˆ x, −ˆ y ) (bzw. von (ˆ x, yˆ), (−ˆ x, yˆ)) von (2) genau eine in der Menge (3) vor. ¨ Der Beweis kann dem Leser zur Ubung u ¨berlassen bleiben.
7. Ganze Punkte auf Kurven zweiten Grades. In den letzten vier Abschnitten wurden verschiedentlich Fragen der Art behandelt, wann es zu festen a, d ∈ Z \ {0} ganzzahlige (x, y) gibt, die das spezielle Polynom X 2 − dY 2 − a in zwei Unbestimmten annullieren. Es ist naheliegend, dieselbe Frage allgemeiner f¨ ur (1)
f (X, Y ) := c00 + 2c01 X + 2c02 Y + c11 X 2 + 2c12 XY + c22 Y 2 ∈ Z[X, Y ]
§ 3.
Die Pellsche Gleichung und Verwandtes
197
(vgl. 2.3(2)) zu untersuchen, wenn wieder die symmetrische Matrix 2.3(3) ⎛ ⎞ c00 c01 c02 C := ⎝ c01 c11 c12 ⎠ c02 c12 c22 maximalen Rang hat. Durch diese Rangforderung bleiben gewisse Ausartungsf¨ alle beiseite, f¨ ur die das Problem der Bestimmung aller ganzzahligen L¨ osungen von (2)
f (X, Y ) = 0
prinzipiell bereits in 1.3.3–4 erledigt wurde. Man definiert jetzt (3)
d := c212 − c11 c22 , := c01 c22 − c12 c02 ,
e := c201 − c00 c11 , m := c02 c11 − c01 c12
und diskutiert vorab den Fall d = 0, in welchem m = 0 wegen der Rangforderung gelten muß. Sicher ist hier (c11 , c22 ) = (0, 0), da andernfalls wegen (3) auch c12 = 0, also Rang C < 3 sein m¨ ußte. Ist etwa o.B.d.A. c11 = 0, so ist (2) ersichtlich gleichbedeutend mit (c01 + c11 X + c12 Y )2 = e − 2mY . Ist die Kongruenz Z 2 ≡ e (mod 2m) unl¨ osbar, so ist (2) unl¨ osbar; ist diese Kongruenz jedoch l¨ osbar, so ur die c11 |(z − c01 − c12 y) f¨ uhren genau diejenigen (z, y) ∈ Z2 mit z 2 = e − 2my, f¨ gilt, zu einem (2) l¨ osenden Paar (x, y) ∈ Z2 . Ab jetzt sei d = 0 und α := /d, β := m/d gesetzt; diese rationalen Zahlen sind genau so gew¨ahlt, daß der Gradient von f im Punkt (α, β) verschwindet. Daher schreibt sich (1) jetzt als (4)
f (X, Y ) = f (α, β) + c11 (X − α)2 + 2c12 (X − α)(Y − β) + c22 (Y − β)2 .
Nach Wahl von α, β ist f (α, β) = c00 + c01 α + c02 β =
1 1 (c00 d + c01 + c02 m) = − det C; d d
dabei sieht man die letzte Gleichung leicht durch Laplace–Entwicklung von det C nach erster Zeile oder Spalte. Somit ist (2) wegen (4) ¨aquivalent zur diophantischen Gleichung (5)
c11 (dX − )2 + 2c12 (dX − )(dY − m) + c22 (dY − m)2 = d · det C,
wobei die rechte Seite nicht verschwindet.
198
4. Additive Probleme und diophantische Gleichungen
Bei c11 = 0 hat (8) h¨ ochstens endlich viele L¨osungen. Ist n¨amlich (x, y) ∈ Z2 eine solche, so gilt dy −m = t und 2c12 (dx−)+c22 t = d(det C)/t, wo t ∈ Z\{0} einer der endlich vielen Teiler von d· det C sein muß; man beachte c12 = 0 wegen d = 0 und (3). F¨ ur c11 = 0 sind (2) und (5) gleichbedeutend mit (6)
(dY − m)2 − d(c01 + c11 X + c12 Y )2 = −c11 det C.
Ist jetzt d entweder negativ oder ein positives Quadrat, so hat (2) wieder h¨ ochstens endlich viele L¨osungen. Mit dem nun noch ausstehenden interessantesten Fall besch¨aftigt sich folgender Satz. In (1) sei det C = 0 und c212 − c11 c22 sei positiv, aber kein Quadrat. L¨ost (ξ, η) ∈ Z2 Gleichung (2), so lassen sich daraus unendlich viele verschiedene ganzzahlige L¨ osungen von (1) konstruieren. Beweis. Man setzt (7)
ξ1 := dη − m, η1 := c01 + c11 ξ + c12 η, b := −c11 det C (= 0)
und kann wegen f (ξ, η) = 0 und (6) sagen, daß (ξ1 , η1 ) ∈ Z2 die diophantische Gleichung U 2 − dV 2 = b
(8)
l¨ ost. Ist nun (u, v) eine beliebige L¨osung der zu (8) geh¨ origen Pell–Gleichung, so l¨osen analog zu 5 und 6 auch alle paarweise verschiedenen (ξ1 u − dη1 v, η1 u − ξ1 v) die Gleichung (8). Nach Korollar 3 gelten f¨ ur unendlich viele dieser (u, v) die simultanen Kongruenzen (9)
u ≡ 1,
v≡0
(mod c11 d);
c11 = 0 trifft ja zu, da d andernfalls ein positives Quadrat w¨ are. Mit diesen (u, v) ist wegen (7) und (9) modulo c11 d ξ1 u − dη1 v ≡ dη − m,
η1 u − ξ1 v ≡ η1 = c01 + c11 ξ + c12 η.
Die erste dieser Kongruenzen bedeutet, daß es ein ganzes y mit (10)
ξ1 u − dη1 v = dy − m
und
y ≡ η (mod c11 )
gibt. Die zweite Kongruenz besagt, daß man (zu diesem y) auch noch ein ganzes x finden kann, so daß folgende Gleichung besteht (11)
η1 u − ξ1 v = c01 + c11 x + c12 y.
Verschiedenen (u, v) entsprechen offenbar verschiedene (x, y) und wegen (7), (8), (10), (11) l¨ osen alle (x, y) die Gleichungen (6) und (2).
§ 3.
Die Pellsche Gleichung und Verwandtes
199
Bemerkung. Die ab 3 untersuchten Gleichungen X 2 − dY 2 = a waren stets von dem im Satz behandelten Typ.
8. Anmerkungen dazu. 1) Hat 7(2) unendlich viele L¨ osungen, so wird man diese im allgemeinen nicht alle auf dem Wege aus einer einzigen gewinnen k¨ onnen, der im Beweis von Satz 7 (und auch schon in 5) eingeschlagen wurde. Dies belegt z.B. Proposition 6. Man kann jedoch zeigen – und darauf deutet die genannte Proposition ebenfalls schon hin –, daß man unter den Voraussetzungen des letzten Satzes endlich viele verschiedene “Grundl¨osungen” (ξj , ηj ) von 7(2) finden kann derart, daß man daraus auf dem oben angesprochenen Weg tats¨achlich alle L¨osungen von 7(2) erh¨ alt. 2) Schreibt man U, V statt dX −, dY −m in 7(5), so ist 7(5) ¨aquivalent mit dem Problem der Darstellung der unter den Voraussetzungen des letzten Satzes von Null verschiedenen ganzen Zahl d det C durch die nicht ausgeartete indefinite bin¨ are quadratische Form c11 U 2 + 2c12 U V + c22 V 2 . In dieser Auffassung wurde das Problem von Gauss (Disquisitiones Arithmeticae, insbesondere Artt. 299, 300) vollst¨ andig gel¨ost. Die sogenannte Reduktionstheorie liefert ein System von Grundl¨ osungen, wie sie in der vorigen Bemerkung angesprochen wurden. Hier soll allerdings auf die Theorie der quadratischen Formen nicht n¨ aher eingegangen werden; der interessierte Leser sei in diesem Punkt z.B. verwiesen auf die elementare Einf¨ uhrung in Scholz/Schoeneberg (Einf¨ uhrung in die Zahlentheorie, 5. Aufl., de Gruyter, Berlin–New York, 1973). 3) In 1.3.3 hat man gesehen, daß die Komponenten der unendlich vielen L¨ osungen einer linearen diophantischen Gleichung c0 +c1 X +c2 Y = 0 mit (c1 , c2 ) = (0, 0) gewissen arithmetischen Folgen angeh¨oren, wenn die Gleichung u ¨berhaupt l¨ osbar ist. Nach den S¨atzen 4 und 5 und nach Anmerkung 1 kann man sagen, daß die Komponenten der L¨osungen der quadratischen Gleichung 7(2) bei det C = 0 und d positiv, aber kein Quadrat, gewissen verallgemeinerten geometrischen Folgen angeh¨oren, wenn 7(2) u ¨berhaupt l¨ osbar ist; vgl. dazu die Formel f¨ ur die L¨ osungen der Pell–Gleichung in Satz 4. Im quadratischen Fall sind die L¨ osungen, wenn u ¨berhaupt vorhanden, also wesentlich seltener als im linearen. Dieser Trend setzt sich tats¨achlich fort: In 6.2.3 wird sich zeigen, daß polynomiale diophantische Gleichungen mindestens dritten Grades in zwei Unbestimmten im allgemeinen h¨ ochstens noch endlich viele L¨osungen haben.
Kapitel 5. Verschiedene Entwicklungen reeller Zahlen
W¨ ahrend bisher in diesem Buch die Untersuchung ganzer Zahlen weitgehend im Vordergrund stand, verlagert sich nun der Schwerpunkt der Thematik hin zu den reellen Zahlen. Insbesondere wird dabei die g–adische Entwicklung reeller Zahlen als Verallgemeinerung der gel¨ aufigen Dezimalbruchentwicklung behandelt ebenso wie die regelm¨aßige Kettenbruchentwicklung. Beide Darstellungen haben sich historisch bei dem Bem¨ uhen herausgebildet, reelle Irrationalzahlen m¨oglichst gut durch rationale Zahlen anzun¨ ahern. Zus¨atzlich erf¨ ullen dabei die Kettenbr¨ uche die Forderung guter Approximation selbst bei Verwendung relativ kleiner, geeignet gew¨ ahlter Nenner; dagegen sind die g–adischen Br¨ uche vor allem f¨ ur das praktische Rechnen von Vorteil, w¨ ahrend bei ihnen das Verh¨ altnis von erzielter Approximationsg¨ ute zur Gr¨oße der verwendeten Nenner viel ung¨ unstiger ausf¨ allt. In § 1 wird insbesondere die Rationalit¨ at einer reellen Zahl durch die Periodizit¨at ihrer g–adischen Entwicklung charakterisiert. Auch die feineren Periodizit¨atseigenschaften der g–adischen Entwicklung rationaler Zahlen werden dort vollst¨ andig aufgedeckt. § 2 bringt die auf Cantor zur¨ uckgehende Verallgemeinerung der g–adischen Entwicklung reeller Zahlen und f¨ ugt auf diesem Wege den in 1.1.9, 4.3.2 und in § 1 gefundenen Irrationalit¨ atskriterien weitere hinzu. W¨ ahrend der euklidische Algorithmus bereits in 1.2.10 den regelm¨aßigen Kettenbruch einer rationalen Zahl lieferte, wird der allgemeine Fall reeller Zahlen in § 3 behandelt. Insbesondere l¨ aßt sich die Tatsache, daß eine reelle Zahl algebraisch vom Grade 1 (also rational) bzw. 2 ist, jeweils durch Eigenschaften ihrer Kettenbruchentwicklung charakterisieren. Damit zeigt sich am Ende, daß die Eulersche Zahl e eine nichtquadratische Irrationalzahl ist; dies leitet dann zu den arithmetischen Untersuchungen in Kap. 6 u ¨ber.
§ 1. § 1.
Die g –adische Entwicklung
201
Die g–adische Entwicklung
In diesem Paragraphen sei g ≥ 2 stets eine feste nat¨ urliche Zahl und Sg das in 2.1.4 eingef¨ uhrte kleinste nichtnegative Restsystem {0, 1, . . . , g − 1} modulo g. 1. Entwicklung nat¨ urlicher Zahlen. M¨ ochte man eine bestimmte nat¨ urliche Zahl identifizieren, z.B. um sie schriftlich zu u ¨ bermitteln, so bedient man sich u ¨blicherweise ihrer dezimalen (auch dekadischen)∗) Darstellung. So wurde dem Leser in 1.1.8 die viertkleinste vollkommene Zahl in der Form 8128 mitgeteilt, was eine Kurzschreibweise ist f¨ ur 8 · 103 + 1 · 102 + 2 · 101 + 8 · 100 . Diese Art der Darstellung nat¨ urlicher Zahlen wird nun verallgemeinert zu folgendem Satz.
Jede nat¨ urliche Zahl n hat eine eindeutige Darstellung der Form
(1)
n=
k
ai g i
i=0
mit a0 , . . . , ak ∈ Sg und ak = 0. Beweis. Um die Existenz einer Summendarstellung des Typs (1) f¨ ur n zu zeigen, setzt man erst ν0 := n und wendet dann folgendes sukzessive Konstruktionsprinzip an: Sei j ∈ N0 und seien ganze ν0 , . . . , νj , a0 , . . . , aj−1 schon so erhalten, daß sie den Bedingungen (2)
νi = νi+1 g + ai ,
0 ≤ ai < g ≤ νi
f¨ ur i = 0, . . . , j − 1 gen¨ ugen. Sicher ist dann νi /g ≥ νi+1 > 0 f¨ ur i = 0, . . . , j − 1, also ν0 g −j ≥ ν1 g −(j−1) ≥ . . . ≥ νj > 0. Ist nun νj ≥ g, so wendet man auf das Paar (νj , g) den Divisionsalgorithmus 1.2.2 an und erh¨ alt (2) f¨ ur i = j mit ganzen νj+1 , aj . Ist jedoch νj < g, so setzt man aj := νj und h¨ ort auf; in diesem Fall ist 0 < aj < g. Wegen ν0 g −j ≥ νj muß hier die zweite Alternative eintreten, sobald j gr¨ oßer als log n ist. Sie trete nach genau k (≥ 0) Schritten ein. Dann hat man also (2) f¨ ur log g i = 0, . . . , k − 1 und u ¨berdies 0 < ak := νk < g. Daraus sieht man induktiv f¨ ur j = 0, . . . , k j−1 ν0 = νj g j + ai g i , i=0
woraus man (1) speziell f¨ ur j = k erh¨alt; u ¨berdies haben die ai die behaupteten Eigenschaften. ∗)
Abgeleitet vom lateinischen decem (bzw. griechischen δ´ εκα) f¨ ur zehn.
202
5. Verschiedene Entwicklungen reeller Zahlen
Um noch die Eindeutigkeit der Darstellung (1) einzusehen, beachte man, daß (1) und die Eigenschaften der ai die Ungleichungen g k ≤ n < g k+1 implizieren; n deshalb ist k die gr¨oßte ganze, log ¨bersteigende Zahl und somit eindeutig log g nicht u festgelegt. Hat man nun eine weitere Darstellung f¨ ur n, etwa n=
k
ai g i
i=0
mit
a0 , . . . , ak
∈
Sg , ak
= 0, so folgt aus k (ai − ai )g i = 0
(3)
i=0
a0
− a0 durch g, welche wegen |a0 − a0 | < g zu a0 = a0 die Teilbarkeit von f¨ uhrt. Ber¨ ucksichtigt man dies in (3), so erweist sich (a1 − a1 )g als durch g 2 teilbar, d.h. a1 − a1 als durch g teilbar usw. Induktiv findet man ai = ai f¨ ur i = 0, . . . , k. Die Darstellung (1) heißt die g–adische Darstellung von n, die ai heißen die n Ziffern dieser Darstellung, 1 + k = 1 + [ log log g ] ihre Stellenzahl. Die Zahl g, nach der entwickelt wird, heißt Basis der Darstellung. Weiter heißen ki=0 ai k i bzw. i=0 (−1) ai in Verallgemeinerung zweier schon aus dem Schulunterricht bekannter Begriffe g–adische Quersumme bzw. alternierende g–adische Quersumme von n. Bemerkung. Im Fall g = 2 spricht man von dualer (auch bin¨ arer oder dyadischer) Darstellung.
2. Teilbarkeitsregeln. Der Leser wird sich an die bekannten, den Fall g = 10 betreffenden Teilbarkeitsregeln nat¨ urlicher Zahlen durch 3, 9 bzw. 11 erinnern. Diese Regeln werden verallgemeinert in folgendem Satz. Ist d ein beliebiger Teiler von g − 1, so gilt: Dann und nur dann ist n durch d teilbar, wenn die g–adische Quersumme von n durch d teilbar ist. F¨ ur beliebige Teiler d von g + 1 hat man: n ist genau dann durch d teilbar, wenn dies f¨ ur seine alternierende g–adische Quersumme zutrifft. Beweis. Die Behauptungen ergeben sich direkt aus n=
k i=0
k i ai (g − 1) + 1 ≡ ai i=0
(mod g − 1)
§ 1. bzw. n=
k
Die g –adische Entwicklung
k i ai (g + 1) − 1 ≡ (−1)i ai
i=0
203
(mod g + 1).
i=0
Insbesondere ist also 3 bzw. 9 ein Teiler von n genau dann, wenn 3 bzw. 9 die (dezimale) Quersumme von n teilt; weiter ist 11 ein Teiler von n genau dann, wenn 11 in der alternierenden (dezimalen) Quersumme von n aufgeht. Der Vorteil derartiger Kriterien besteht offenbar darin, daß sie die Frage nach der Teilbarkeit einer nat¨ urlichen Zahl n durch ein d reduzieren auf die Frage, ob die absolut genommen viel kleinere g–adische Quersumme bzw. alternierende Quersumme von n durch d teilbar ist f¨ ur ein ganzes g ≥ 2, welches d|(g − 1) bzw. d|(g + 1) gen¨ ugt. Beispielsweise ist die dezimal als 91813843 notierte nat¨ urliche Zahl n0 nicht durch 3 (also erst recht nicht durch 9) teilbar, weil ihre (dezimale) Quersumme gleich 37 ist; ihre alternierende (dezimale) Quersumme ist −11 und so ist n0 durch 11 teilbar. Bei der Entscheidung der Teilbarkeit der Zahl n0 durch 7 hilft der hier gezeigte Satz offenbar nicht, da 7 weder in 10 − 1 noch in 10 + 1 aufgeht. Dagegen hat man f¨ ur die Teilbarkeit durch 7 folgendes Kriterium 7|
k i=0
ai 10i
⇔ 7|
(−1)j (a3j + 3a3j+1 + 2a3j+2 ) , j≥0
¨ dessen Beweis dem Leser als Ubung u ¨berlassen sei. Die Summe rechts ist gleich andlich kann 39 f¨ ur obiges n0 , welches somit nicht durch 7 teilbar ist. Selbstverst¨ man eine Vielzahl derartiger Kriterien angeben, worauf hier jedoch nicht weiter eingegangen werden soll.
3. Der gebrochene Teil reeller Zahlen. , jedoch nicht Sind c1 , c2 , . . . ∈ Sg −i < alle gleich g − 1, so definiert die Reihe i≥1 ci g −i wegen 0 ≤ i≥1 ci g −i (g − 1) i≥1 g = 1 eine reelle Zahl des halboffenen Intervalls [0, 1[. Daß auch umgekehrt jedes reelle α ∈ [0, 1[ eine Reihendarstellung obiger Art besitzt, die u ¨berdies unter einer geringf¨ ugigen Zusatzforderung an die ci eindeutig ist, beinhaltet folgender Satz. (1)
Jedes reelle α ∈ [0, 1[ hat genau eine Entwicklung der Gestalt α=
∞ i=1
ci g −i
204
5. Verschiedene Entwicklungen reeller Zahlen
mit allen c1 , c2 , . . . ∈ Sg , von denen unendlich viele ungleich g − 1 sind; dabei ergeben sich die ci rekursiv aus (2)
α1 := α und ci := [αi g], αi+1 := {αi g}
f¨ ur i ∈ N.
Es sei hier an die in 4.3.2 eingef¨ uhrte Bezeichnung {z} := z − [z] f¨ ur den gebrochenen Teil einer reellen Zahl z erinnert. Beweis f¨ ur die Existenz. Nach (2) ist αi als gebrochener Teil einer reellen Zahl nichtnegativ, aber kleiner als 1, also 0 ≤ αi g < g und somit ci ∈ Sg f¨ ur jedes i ≥ 1. Daß unendlich viele dieser ci ungleich g − 1 sind, sieht man so: Aus (2) folgt f¨ ur j ≥ 1 die Gleichung αj = cj g −1 + αj+1 g −1 und daraus induktiv (3)
αj =
j+k−1
ci g j−1−i + αj+k g −k
i=j
f¨ ur alle ganzen j ≥ 1, k ≥ 0. G¨ abe es nun ein ganzes j ≥ 1 mit ci =g − 1 f¨ ur alle i ≥ j, so w¨ urde (3) durch Grenz¨ ubergang k → ∞ zu αj = (g − 1) t≥1 g −t = 1 f¨ uhren, was 0 ≤ αj < 1 widerspricht. Wendet man nun (3) an mit j = 1, so bekommt man k α= ci g −i + αk+1 g −k , i=1
woraus man (1) bei k → ∞ erh¨alt. Zur Eindeutigkeit : Hat man neben (1) eine weitere Darstellung (4)
α=
∞
ci g −i
i=1
c1 , c2 , . . .
von α mit ∈ Sg , aber unendlich oft = g − 1, so wird ci = ci f¨ ur alle i ≥ 1 behauptet. Nimmt man an, dies treffe nicht zu, so sei j ≥ 1 der kleinste Index mit cj = cj . Aus (1) und (4) folgt dann 1 ≤ |cj − cj | = | (ci − ci )g j−i | ≤
i>j
i>j
|ci − ci |g j−i ≤ (g − 1)
g −t = 1,
t≥1
weshalb insbesondere |ci − ci | = g − 1 f¨ ur alle i > j gelten muß und u ¨berdies m¨ ussen entweder alle ci − ci mit i > j positiv sein oder negativ. Dann ist ci = g − 1, ci = 0 f¨ ur alle i > j oder ci = 0, ci = g − 1 f¨ ur dieselben i, was der Voraussetzung widerspricht, daß von den ci bzw. ci jeweils unendlich viele von g − 1 verschieden sein sollten.
§ 1.
Die g –adische Entwicklung
205
Bemerkung. W¨ urde man die soeben wiederholte Zusatzforderung an die ci , ci nicht stellen, so w¨ are obiger Eindeutigkeitsbeweis genau dann undurchf¨ uhrbar, wenn bei geeignetem ∈ N die Gleichungen c1 = c1 , . . . , c−1 = c−1 und (o.B.d.A.) c = c − 1 (also c ≥ 1) sowie ci = g − 1, ci = 0 f¨ ur i > bestehen w¨ urden. Dann ist die durch (1) dargestellte Zahl
(5)
ci g −i
i=1
rational und diese h¨ atte tats¨achlich (man beachte c ≥ 1) die zweite Entwicklung −1
ci g −i + (c − 1)g − +
i=1
∞
(g − 1)g −i .
i=+1
4. Entwicklung reeller Zahlen. W¨ ahrend in Satz 3 nur reelle Zahlen des Intervalls [0, 1[ behandelt wurden, erh¨ alt man aus dem dortigen Ergebnis direkt den Satz. (1)
Jede reelle Zahl α hat genau eine Darstellung der Form α = [α] +
∞
ci g −i
i=1
mit allen c1 , c2 , . . . ∈ Sg , von denen unendlich viele ungleich g − 1 sind. Dabei ergeben sich die ci rekursiv aus (2)
α1 := {α} und ci := [αi g], αi+1 := {αi g} f¨ ur i ∈ N.
Wenigstens dann, wenn α ≥ 0 ist, kann man auch noch die Ausnahmestellung von [α] rechts in (1) beseitigen: Man schreibt n¨ amlich gem¨aß 1 eindeutig (3)
[α] =
k
ai g i
i=0
mit geeigneten k ∈ N0 und a0 , . . . , ak ∈ Sg , ak > 0, falls α ≥ 1 gilt, bzw. mit k = 0, a0 = 0 im Fall 0 ≤ α < 1. Dann hat man aus (1) und (3) f¨ ur die reelle Zahl α ≥ 0 die eindeutige Darstellung (4)
α=
∞ i=−k
ci g −i
206
5. Verschiedene Entwicklungen reeller Zahlen
mit k ∈ N0 und ci := a−i f¨ ur −k ≤ i ≤ 0, w¨ ahrend die ci mit i ≥ 1 aus (1) u ¨bernommen sind. Auch in (4) sind alle c−k , . . . , c0 , c1 , . . . ∈ Sg , aber unendlich oft von g − 1 verschieden. Die unter den erw¨ahnten Bedingungen an die ci eindeutige Darstellung (1) bzw. (4) der reellen Zahl α nennt man deren g–adische Entwicklung (nach fallenden Potenzen), die Koeffizienten ci heißen die g–Ziffern, kurz Ziffern dieser Entwicklung. Die Entwicklung nennt man abbrechend, wenn wie etwa in 3(5) h¨ ochstens endlich viele Ziffern von Null verschieden sind. In Anlehnung an den historisch und f¨ ur die Praxis besonders bedeutsamen Spezialfall g = 10 (wo man regelm¨aßig von der Dezimalbruchentwicklung einer Zahl spricht und nicht von “10–adischer Entwicklung nach fallenden Potenzen”) schreibt man die rechte Seite von (4) oft auch in der Form c−k . . . c0 , c1 c2 . . . ci . . .
(5)
bzw. c−k . . . c0 , c1 . . . c . Dabei ist letzteres u ¨blich, wenn die g–adische Entwicklung abbricht und c die letzte nichtverschwindende Ziffer mit positivem Index ist, vgl. 3(5). Die Zahl g, nach der man entwickelt hat, bleibt bei der Schreibweise (5) zwar unerw¨ ahnt, ist aber der jeweils vorab getroffenen Konvention zweifelsfrei zu entnehmen. Bemerkung. Zur Abtrennung der Ziffern von ganzem und gebrochenem Teil einer nichtnegativen reellen Zahl scheint das Komma (oder im angloamerikanischen Sprachraum der Punkt) etwa um 1600 erstmals von J. Napier (auch Neper geschrieben) bei Dezimalbruchentwicklungen verwendet worden zu sein.
5. Entwicklung rationaler Zahlen. Sind a, b teilerfremde ganze Zahlen mit b > 0, so sind die Ziffern der g–adischen Entwicklung der rationalen Zahl ab nach Satz 4, insbesondere nach 4(2), rekursiv zu ermitteln aus (1)
a α1 := { } und ci := [αi g], αi+1 := {αi g} b
f¨ ur i ≥ 1.
Setzt man noch (2)
bi := αi b,
so ist bi ∈ Sb f¨ ur alle i ≥ 1 aus (1) leicht einzusehen. Daher muß es ganze s, t mit 1 ≤ s < t geben, f¨ ur die bs = bt , also auch αs = αt zutrifft. Wegen (1) gilt dann αs+i = αt+i f¨ ur alle i ≥ 0 und somit cs+i = ct+i f¨ ur dieselben i. Damit ist bewiesen der folgende
§ 1.
Die g –adische Entwicklung
207
Satz. Die Ziffernfolge der g–adischen Entwicklung jeder rationalen Zahl ist periodisch. Bemerkung. 1) Wegen αi g = ci + αi+1 gen¨ ugen die in (2) erkl¨ arten bi ∈ Sb der Rekursion (3)
a b1 = { }b, b
f¨ ur i ∈ N.
bi g = ci b + bi+1
Dies l¨aßt folgende Interpretation zu: Hat man a, b wie oben und definiert nun alt c1 , b2 b1 durch die erste Gleichung in (3), so gilt b1 ∈ Sb und man erh¨ durch Anwendung des Divisionsalgorithmus 1.2.2 auf b1 g, b, vgl. (3). Hierbei ergibt sich b2 ∈ Sb und daraus c1 ∈ Sg nach (3) und man gewinnt induktiv die unendliche Folge b1 , b2 , . . . ∈ Sb ebenso wie die Ziffernfolge c1 , c2 , . . . ∈ Sg der g–adischen Entwicklung der rationalen Zahl ab . Die obige Folge (ci ) heißt (analog zu 2.3.2) periodisch, da es ein p ∈ N und ein ∈ N0 gibt derart, daß (4)
ci+p = ci
f¨ ur alle ganzen i > gilt. Das minimale p ∈ N, f¨ ur das (4) f¨ ur alle großen i gilt, heißt die Periodenl¨ ange der Folge. Hat die Folge die Periodenl¨ ange p, so heißt das minimale ∈ N0 , so daß (4) f¨ ur alle i > zutrifft, die Vorperiodenl¨ ange der Folge. Bei = 0 heißt (ci ) reinperiodisch, bei ≥ 1 gemischtperiodisch. Bevor in 6 f¨ ur jede rationale Zahl Vorperioden– und Periodenl¨ ange der Ziffernfolge ihrer g–adischen Entwicklung v¨ ollig explizit bestimmt werden, sei die Aussage des obigen Satzes noch erg¨anzt zu folgendem Irrationalit¨ atskriterium. Eine reelle Zahl ist genau dann rational, wenn die Ziffernfolge ihrer g–adischen Entwicklung periodisch ist. Beweis. Ist die g–adische Ziffernfolge (ci )i≥1 eines reellen α periodisch, d.h. gilt f¨ ur die ci in 4(1) die Gleichung (4) f¨ ur alle i > , so ist {α} =
ci g −i + g −
i=1
(5) =
∞
g −jp
j=0
1 g (g p
− 1)
p (g − 1)
p
ck+ g −k
k=1 i=1
ci g −i +
p
ck+ g p−k ,
k=1
was die Rationalit¨ at von α zeigt. Dies zusammen mit dem Satz liefert die Aussage des Kriteriums.
208
5. Verschiedene Entwicklungen reeller Zahlen
Dieses Kriterium wird in 9 zu einem Irrationalit¨atsbeweis angewandt. Generell ist die entscheidende H¨ urde f¨ ur seine Anwendungsf¨ ahigkeit offenbar die Tatsache, daß f¨ ur mindestens ein ganzes g ≥ 2 die g–adische Entwicklung der zu untersuchenden Zahl bekannt sein muß, d.h. man muß die entsprechende g–Ziffernfolge (ci ) explizit kennen. Bemerkung. 2) In Anlehnung an den Spezialfall g = 10 bringt man die Tatsache, daß die Ziffernfolge einer rationalen Zahl aus [0, 1[ Vorperiodenl¨ ange und Periodenl¨ ange p hat, durch die Schreibweise 0, c1 . . . c c+1 · · · c+p zum Ausdruck, vgl. 4(5). Den (eventuell fehlenden) Ziffernblock c1 . . . c nennt man die Vorperiode, den Block c+1 . . . c+p die Periode.
6. Periodizit¨ atseigenschaften der Ziffernfolge. Im folgenden Satz zeigt sich, daß Vorperioden– und Periodenl¨ ange der g–Ziffernfolge einer gek¨ urzten angen. rationalen Zahl ab nur von b und g, nicht jedoch von a abh¨ Satz. Seien a, b teilerfremde ganze Zahlen mit b > 0; sei b∗ der gr¨ oßte positive, zu g teilerfremde Teiler von b und sei b∗∗ := bb∗ . Dann ist die Ziffernfolge der g–adischen Entwicklung der rationalen Zahl ab periodisch mit der Periodenl¨ ange ordb∗ g und der Vorperiodenl¨ ange Min{μ ∈ N0 : b∗∗ |g μ }. Diese Entwicklung ist abbrechend genau dann, wenn b∗ = 1 gilt, d.h. wenn jeder Primfaktor von b in g aufgeht. uhrte Ordnung von g Es sei daran erinnert, daß hier ordb∗ g die in 2.3.2 eingef¨ modulo b∗ bedeutet, also das kleinste q ∈ N mit g q ≡ 1 (mod b∗ ). Beweis. Nach Satz 5 ist die g–adische Ziffernfolge (ci )i≥1 von ab periodisch; bzw. p seien die Vorperioden– bzw. Periodenl¨ ange. Bei geeigneten ganzen A, B ist nach 5(5) a a A B = + p = p , b b g (g − 1) g (g − 1) woraus wegen (a, b) = 1 die Bedingung b|g (g p − 1) folgt, also b∗ |(g p − 1) und b∗∗ |g . Mit den Festsetzungen (1)
q := ordb∗ g,
m := Min{μ ∈ N0 : b∗∗ |g μ }
folgt daraus m ≤ und q ≤ p. Andererseits besagt (1) erstens b∗ |(g q − 1), zweitens b∗∗ |g m , insgesamt also b|g m (g q − 1) und so ist { ab }g m (g q − 1) ∈ N0 . Nach dem Divisionsalgorithmus 1.2.2 existieren ganze u, v mit a (2) { }g m (g q − 1) = u(g q − 1) + v b
§ 1.
Die g –adische Entwicklung
209
und 0 ≤ v < g q − 1, was dann 0 ≤ u < g m nach sich zieht. Wegen Satz 1 gelten mit u1 , . . . , um , v1 , . . . , vq ∈ Sg die Gleichungen (3)
u = um + um−1 g + . . . + u1 g m−1 ,
v = vq + vq−1 g + . . . + v1 g q−1 ,
wobei nicht alle v1 , . . . , vq gleich g − 1 sind, man beachte v < g q − 1. Eintragen der Darstellungen (3) f¨ ur u, v in (2) f¨ uhrt zu a { } = ug −m + v(1 − g −q )−1 g −m−q b q m ∞ ∞ = ui g −i + g −m vj g −j g −kq = di g −i , i=1
j=1
k=0
i=1
wobei (4)
di := ui (1 ≤ i ≤ m),
dm+jq+k := vk (j ∈ N0 , 1 ≤ k ≤ q)
gesetzt ist. Danach sind alle di (i ≥ 1) aus Sg , jedoch gilt di = g − 1 unendlich oft, weil v1 , . . . , vq nicht alle gleich g − 1 sind. So ist [ ab ] + i≥1 di g −i die g– ange adische Entwicklung von ab , deren Ziffernfolge (di ) nach (4) eine Periodenl¨ h¨ ochstens q und eine Vorperiodenl¨ ange h¨ ochstens m hat. Dies besagt p ≤ q und ≤ m, insgesamt also p = q, = m. Die g–adische Entwicklung von ab ist abbrechend genau dann, wenn { ab } = −i mit geeignetem ∈ N0 gilt; dies letztere ist mit ab = gA bei gei=1 ci g eignetem ganzem A ¨aquivalent, was wegen (a, b) = 1 wiederum mit b|g gleichwertig ist. Aus b|g folgt offenbar b∗ = 1; ist umgekehrt b∗ = 1, so hat man b = b∗∗ |g m = g , also b|g . Dabei wurde die Definition von m in (1) ben¨ utzt ebenso wie die bereits eingesehene Gleichung m = . Bemerkungen. 1) Bei b∗ > 1 sind zwei F¨ alle m¨oglich: Erstens b∗ = b > 1, ∗∗ b = 1, was = 0, also die Reinperiodizit¨ at der Ziffernfolge bedeutet. Zweitens 1 < b∗ , b∗∗ < b; hier ist > 0 und somit die Ziffernfolge gemischtperiodisch. In beiden F¨ allen gilt aber bei p = 1: Alle Ziffern nach Ablauf der Vorperiode sind gleich einer festen Zahl aus {1, . . . , g − 2}. 2) Ist speziell (b, g) = 1, also b∗ = b, b∗∗ = 1, und ist außerdem g eine Primitivwurzel modulo b, so ist p = ordb g = ϕ(b). Z.B. ist 10 eine Primitivwurzel modulo 7 und so f¨ allt bei g = 10 und rationalen Zahlen der Form a7 mit a ∈ Z, 7 |a die Ziffernfolge stets reinperiodisch mit der Periodenl¨ ange ϕ(7) = 6 aus.
7. Dezimalbruchentwicklungen. Die stets periodische Dezimalbruchentwicklung einer rationalen Zahl ab in gek¨ urzter Darstellung (d.h. mit teilerfemden
210
5. Verschiedene Entwicklungen reeller Zahlen
a, b) bricht nach Satz 6 genau dann ab, wenn b h¨ ochstens die Primfaktoren 2 und 5 besitzt. Weiter ist sie reinperiodisch genau dann, wenn b∗∗ = 1, b∗ = b ist, d.h. wenn 2 |b und 5 |b gilt, und hier ist die Periodenl¨ ange gleich der Ordnung von 10 modulo b, insbesondere also ein Teiler von ϕ(b). Die Zahl ab hat eine reinperiodische Dezimalbruchentwicklung der Periodenl¨ ange ϕ(b) genau dann, wenn 10 eine Primitivwurzel modulo b ist. Der nachfolgenden kleinen Tabelle entnimmt man, daß 1, 7, 17, 19, 23, 29 s¨ amtliche nat¨ urliche b unterhalb 30 sind, modulo derer 10 Primitivwurzel ist. b
1
3
7
9
11
13
17
19
21
23
27
29
ϕ(b)
1
2
6
6
10
12
16
18
12
22
18
28
ordb 10
1
1
6
1
2
6
16
18
6
22
3
28
Bei der Herstellung solcher Tabellen kann man sich f¨ ur die dritte Zeile der Tatsache bedienen, daß bei paarweise teilerfremden b1 , b2 , 10 nach Lemma 2.3.5 gilt: ordb1 b2 10 = kgV(ordb1 10, ordb2 10). In der vorstehenden Tabelle liest man in der letzten Zeile die Periodenl¨ ange der (reinperiodischen) Dezimalbruchentwicklung von gek¨ urzten ab , b wie in der 1 1 ersten Zeile, ab. Z.B. haben die rationalen Zahlen 17 , 13 , 21 s¨amtliche eine reinperiodische Dezimalbruchentwicklung der Periodenl¨ ange 6, n¨ amlich 0, 142857; 3 3 bzw. 29 treten die Peri0, 076923; 0, 047619. Bei der Entwicklung von 17 odenl¨ angen 16 bzw. 28 auf und man hat die Dezimalbr¨ uche 0, 1764705882352941 bzw. 0, 1034482758620689655172413793. Nach Satz 6 hat ein gek¨ urztes ab genau dann eine nicht abbrechende gemischtperiodische Dezimalbruchentwicklung, wenn unter den Primfaktoren von b mindestens einer aus {2, 5} und mindestens einer aus IP \ {2, 5} vorkommt. Die nachfolgende kleine Tabelle enth¨alt alle die Zahl 30 nicht u ¨bersteigenden nat¨ urlichen b mit dieser Eigenschaft; außerdem sind die jeweils zur vollst¨andigen Kl¨ arung oder Periodizit¨ atsverh¨altnisse der Dezimalbruchentwicklungen gek¨ urzter ab ben¨ tigten Angaben gemacht:
b
6
12
14
15
18
22
24
26
28
30
b∗
3
3
7
3
9
11
3
13
7
3
ordb∗ 10
1
1
6
1
1
2
1
6
6
1
2
4
2
5
2
2
8
2
4
10
1
2
1
1
1
1
3
1
2
1
b∗∗ ∗∗
Min{μ ∈ N0 : b |10 } μ
§ 1.
Die g –adische Entwicklung
211
Der dritten bzw. f¨ unften Zeile entnimmt man die Perioden– bzw. Vorperi1 1 odenl¨ angen. Z.B. ist bei 12 und bei 28 die Vorperiodenl¨ ange 2, w¨ ahrend die Periodenl¨ angen 1 und 6 sind; die Dezimalbruchentwicklungen lauten hier 0, 083 und 0, 03571428.
8. Rationale Zahlen mit gleichen Nennern. Der Leser wird bereits im fr¨ uhen Schulunterricht folgende Bemerkung gemacht haben, wenn er dort Dezimalbruchentwicklungen zu u ¨ben hatte: 17 = 0, 142857; 27 = 0, 285714; 3 4 5 6 anomen 7 = 0, 428571; 7 = 0, 571428; 7 = 0, 714285; 7 = 0, 857142. Dies Ph¨ wird vollst¨ andig gekl¨art im nachfolgenden Satz. Sei p eine nicht in g aufgehende Primzahl, modulo der g Primitivwurzel ist. Dann haben die rationalen Zahlen ap (a = 1, . . . , p − 1) reinperiodische g–adische Entwicklungen der Periodenl¨ ange p − 1 und ihre Perioden gehen auseinander durch zyklische Vertauschung hervor. Beweis. Man startet den Algorithmus 5(3) mit a = 1, b = p und erh¨ alt zun¨ achst b1 = 1. Da jedes bi (i ≥ 1) sowohl ci als auch bi+1 eindeutig bestimmt und da nach Satz 6 die Periodenl¨ ange der reinperiodischen Entwicklung von 1p bereits als p − 1 feststeht, m¨ ussen b1 , . . . , bp−1 paarweise verschieden und = 0 sein, urde n¨ amlich ein bi = 0 sein, so w¨aren w¨ahrend bp wieder gleich b1 = 1 ist. W¨ auch ci = bi+1 = 0 nach 5(3) und 1p h¨ atte eine abbrechende Entwicklung; w¨are bp = b1 , so m¨ ußte bp ∈ {b2 , . . . , bp−1 } sein und dann w¨ are die Periodenl¨ ange kleiner als p − 1. Die ersten p − 1 Gleichungen rechts in 5(3) lauten daher (1)
b1 g = c1 p + b2 , . . . , bi g = ci p + bi+1 , . . . , bp−1 g = cp−1 p + b1 .
Startet man in 5(3) nun mit b = p und beliebigem a ∈ {2, . . . , p − 1}, so wird dort b1 = a und a ist gleich genau einem der in (1) anfallenden b2 , . . . , bp−1 , etwa gleich bi . Dann ist klar, daß 0, ci . . . cp−1 c1 . . . ci−1 die g–adische Entwicklung von ap sein muß.
9. Eine Anwendung des Irrationalit¨ atskriteriums. Man definiert α0 durch die Dezimalbruchentwicklung 0, 1234567891011 . . ., die dadurch entsteht, daß man hinter dem Komma nacheinander die gem¨ aß Satz 1 dezimal dargestellten nat¨ urlichen Zahlen hinschreibt. Pr¨ aziser und allgemeiner gefaßt sieht dies n so aus: Es ist s(n) := 1 + [ log log g ] die Stellenzahl der g–adischen Darstellung von n gem¨aß 1. Diese Darstellung selbst m¨oge
s(n)−1
i=0
ai (n)g i
212
5. Verschiedene Entwicklungen reeller Zahlen
lauten, wobei also die a0 (n), a1 (n), . . . , as(n)−1 (n) die Ziffern (die letzte ist hier = 0) in der Darstellung von n nach Satz 1 sind. Setzt man dann (3)
α(g) :=
∞ s(n)−1 n=1
n ai (n)g i g − m=1 s(m) ,
i=0
so ist gerade α(10) = α0 und allgemein wird behauptet die Proposition.
Die in (3) definierte reelle Zahl α(g) ist irrational.
Beweis. Man u ¨berlegt sich, daß in der Ziffernfolge der g–adischen Entwicklung von α(g) beliebig lange Folgen sukzessiver Nullen vorkommen, daß die Entwicklung aber nicht abbricht: Ist n¨ amlich n von der Form g N , so ist s(g N ) = N + 1 N N N und a0 (g ) = . . . = aN−1 (g ) = 0, aN (g ) = 1. In i≥1 ci g −i ist also ci = 1 g N −1 ur i = 1 + T (N ), . . . , N + T (N ) f¨ ur i = 1 + m=1 s(m) =: T (N ), aber ci = 0 f¨ und so hat man N sukzessive Nullen und N kann dabei beliebig groß gew¨ahlt werden. Bemerkung. Mahler hat 1937 sogar die Transzendenz aller α(g) gezeigt, vgl. Bemerkung zu 6.2.2.
10. Existenz transzendenter Zahlen. Hier soll Satz 3 noch ben¨ utzt werden, um zu zeigen, daß es transzendente reelle Zahlen gibt. Das daf¨ ur verwendete Argument geht auf eine Idee von G.Cantor (Gesammelte Abhandlungen, 115– 118) aus dem Jahre 1874 zur¨ uck: Man zeigt, daß es u ¨berabz¨ahlbar viele reelle Zahlen gibt, wovon nur abz¨ ahlbar viele algebraisch sein k¨ onnen. Vorab sei daran erinnert, daß man eine Menge genau dann abz¨ ahlbar nennt, wenn sie sich bijektiv auf die Menge N (oder N0 ) abbilden l¨ aßt. Ist eine Menge weder endlich noch abz¨ ahlbar, so heißt sie u ¨berabz¨ahlbar. Damit formuliert man Satz A. Die Menge IR aller reeller Zahlen (und damit jede IR umfassende ¨berabz¨ahlbar. Menge, z.B. C) ist u ¨ Beweis. Es reicht, die Uberabz¨ ahlbarkeit einer geeigneten Teilmenge von IR zu beweisen, etwa diejenige des halboffenen Intervalls [0, 1[. Man nimmt an, diese letztere Menge sei abz¨ahlbar und r1 , r2 , . . . sei eine Abz¨ahlung von ihr. Sodann fixiert man ein beliebiges ganzes g ≥ 3 und schreibt jedes rn gem¨aß Satz 3 in seiner g–adischen Entwicklung rn =
∞ i=1
ci (n)g −i
f¨ ur n = 1, 2, . . . ,
§ 1.
Die g –adische Entwicklung
213
wobei man 0 ≤ rn < 1 f¨ ur alle n ≥ 1 beachtet hat. Nun definiert man eine neue Ziffernfolge c1 , c2 , . . . durch die Festsetzung (1)
ci :=
1, 0,
falls ci (i) = 1, falls ci (i) = 1,
i = 1, 2, . . . .
Hier sind sogar alle c1 , c2 , . . . ∈ {0, . . . , g − 2} und so geh¨ort die durch die Reihe −i definierte reelle Zahl r sicher zum Intervall [0, 1[ , d.h. mit geeigi≥1 ci g netem m ∈ N ist r = rm . Die Eindeutigkeit der g–adischen Entwicklung zeigt dann ci = ci (m) f¨ ur alle i ∈ N, insbesondere ci = ci (i) entgegen (1). F¨ ur das n¨ achste Ergebnis werden folgende Vorbemerkungen ¨ber Polynome und u i algebraische Zahlen ben¨ o tigt. F¨ u r P ∈ C[X], etwa P = a i X , wird L(P ) := |ai | gesetzt; ist außerdem P = 0 und ∂(P ) der Grad von P , so sei s(P ) = L(P ) + ∂(P ) geschrieben. F¨ ur P ∈ Z[X], P = 0 ist dann s(P ) ∈ N klar. Weiter bezeichne W (P ) f¨ ur P ∈ C[X], P = 0 die Menge der verschiedenen komplexen Wurzeln von P ; als Konsequenz des Abspaltungslemmas 1.5.8 ist die Absch¨ atzung #W (P ) ≤ ∂(P ) klar. Nun gilt folgender Satz B. Die Menge aller komplexen algebraischen Zahlen ist abz¨ahlbar. Beweis. Klar ist, daß es zu jedem vorgegebenen s ∈ N nur eine endliche (von s abh¨ angige) Anzahl von P ∈ Z[X], P = 0 mit s(P ) = s geben kann. Daher ist die Menge aller P ∈ Z[X] abz¨ ahlbar. Die im Satz genannte Menge ist aber gerade die Vereinigung der W (P ) u ¨ber die abz¨ ahlbar vielen P ∈ Z[X] mit P = 0 und ist somit bekanntlich selbst abz¨ ahlbar. Durch Kombination der S¨ atze A und B erh¨ alt man unmittelbar Korollar A. Es gibt u ¨berabz¨ahlbar viele transzendente reelle Zahlen. Wie man aus den vorstehenden Argumentationen ersehen konnte, ist der Cantorsche Beweis f¨ ur die Existenz transzendenter Zahlen nicht konstruktiv. In diesem Zusammenhang ist zu bemerken, daß bereits 30 Jahre vor Cantor im Jahre 1844 Liouville einen konstruktiven Existenzbeweis gef¨ uhrt hat, der in 6.1.2ff. gebracht wird. Da abz¨ahlbare Teilmengen von IR bzw. C jeweils Lebesgue–Maß Null haben, folgt aus Satz B noch als Versch¨arfung von Korollar A
214
5. Verschiedene Entwicklungen reeller Zahlen
Korollar B. Im Sinne des Lebesgue–Maßes ist fast jede reelle bzw. komplexe Zahl transzendent. So einfach diese maßtheoretische Aussage zu erhalten ist, so schwer ist es doch in aller Regel, die Transzendenz “in der Natur vorkommender” Zahlen zu beweisen. Einen gewissen Eindruck wird man davon in Kapitel 6 erhalten.
11. Dezimalbruchentwicklung und Dichtung. Wie schon am Ende von 5 erw¨ahnt, ben¨ otigt man zur Kl¨arung gewisser Fragen (z.B. f¨ ur Irrationalit¨ atsbeweise mittels Kriterium 5) m¨oglichst umfassende Kenntnisse u ¨ber die g–adische Entwicklung reeller Zahlen f¨ ur mindestens ein ganzes g ≥ 2. Hier aber beginnen die heute noch weitestgehend offenen Probleme. Vielleicht die naheliegendste Frage ist die nach der effektiven Angabe der g–adischen Entwicklung (f¨ ur wenigstens ein g ≥ 2) gewisser “in der Natur vorkommender” reeller Zahlen. Darunter seien Zahlen verstanden, die bei manchen Problemen √ 2, e, π oder die in der Mathematik in nat¨ urlicher Weise auftreten wie z.B. Eulersche Konstante γ := limn→∞ ( nν=1 ν1 − log n). Bei den erstgenannten Zahlen ist zwar die Irrationalit¨ at bekannt (vgl. 1.1.9, 2.2, 6.3.2), die bei γ auch noch offen ist, jedoch kennt man in keinem Fall eine g–adische Entwicklung. Selbstverst¨ andlich hat man im √ Zeitalter der immer leistungsf¨ ahigeren Computer versucht, f¨ ur Zahlen wie 2, e, π mehr und mehr Stellen der entsprechenden Dezimalbruchentwicklungen zu berechnen, vielleicht in der (bisher unerf¨ ullt gebliebenen) Hoffnung, doch einmal in einem Einzelfall eine “einfache” Gesetzm¨aßigkeit experimentell entdecken und dann beweisen zu k¨onnen. Bei solchen numerischen Rechnungen sucht man stets zun¨achst eine geeignete Darstellung der zu entwickelnden Zahl durch einen gen¨ ugend rasch konvergenten √ Grenzprozeß. Im Fall 2 bzw. e kann man sich z.B. der Entwicklung in einen sogenannten regelm¨ aßigen Kettenbruch bedienen (vgl. 3.4 und 3.12). Hier seien noch√die derzeit g¨ ultigen Rekorde f¨ ur die gesicherten Dezimalstellen–Anzahlen bei 2, e, π mitgeteilt: √ 2 2 · 1011 Stellen S. Kondo (2006) e 1011 Stellen S. Kondo, S. Pagliarulo (2007) π 12, 4 · 1011 Stellen Y. Kanada (2002). F¨ ur π beginnt der Computer–Ausdruck wie oben auf Seite 215 angegeben. Erg¨ anzend sei auch auf die Versuche hingewiesen, die in verschiedenen Sprachen unternommen wurden, Merkverse zu ersinnen, um den Beginn der Dezimalbruchentwicklung von π mnemotechnisch zu verschl¨ usseln, vgl. etwa H. Tietze (Gel¨oste und ungel¨oste mathematische Probleme aus alter und neuer Zeit, Bie-
§ 1.
Die g –adische Entwicklung
215
derstein, M¨ unchen, 1949). Bei solchen Merkversen hat man jedes Wort durch die Anzahl seiner Buchstaben zu ersetzen. Allerdings bildet die 32. Ziffer nach ¨ dem Komma jeder derartigen dichterischen Ubung, unabh¨ angig von der Sprache, eine ganz nat¨ urliche Grenze. Der nebenstehend abgebildete Entwurf der Sonderbriefmarke zum Internationalen Mathematiker–Kongreß 1998 in Berlin zeigt (unter anderem) immer l¨angere Ziffernbl¨ ocke vom Anfang der Entwicklung von π, kreisrund angeordnet. Vielleicht Symbolik f¨ ur ein vollbesetztes aufsteigendes Auditorium?
12. Historische Anmerkungen. Das Prinzip der g–adischen Entwicklung von (rationalen) Zahlen nach fallenden Potenzen war bereits im Altertum gel¨ aufig. Insbesondere haben die Sumerer ab dem dritten vorchristlichen Jahrtausend und dann die nachfolgenden semitischen Babylonier beim praktischen Rechnen das Sexagesimalsystem (also g = 60) verwendet. So findet sich z.B. ein Keilschrifttext (etwa 2000 v. Chr.; Yale Babylonian Collection 7289), in dem das Verh¨ altnis von Diagonalen– zu Seitenl¨ ange eines Quadrats (hier aus der Keilschrift umgeschrieben) zu 1 24 51 10, also 1 + 24 · 60−1 + 51 · 60−2 + 10 · 60−3 = 30547 21600 angegeben wurde.√Dies entspricht einer dezimal geschriebenen Approximation 1, 4142129 . . . f¨ ur 2, die immerhin auf f¨ unf Nachkommaziffern korrekt ist.
216
5. Verschiedene Entwicklungen reeller Zahlen
W¨ ahrend sich das Sexagesimalsystem in der Astronomie aller Kulturv¨olker halten konnte — man denke etwa an die Minuten–Sekunden–Einteilung von Grad oder Stunde —, wurde es aus den u ¨brigen Naturwissenschaften und der Mathematik zwischen 1000 und 1500 durch das Dezimalsystem langsam verdr¨ angt. Einer der Gr¨ unde hierf¨ ur war die Verbreitung der praktischen zehn Symbole 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 u ¨ber die ganze (arabische) Welt von Indien, wo die letzten neun urspr¨ unglich herkamen (die Null stammt aus Griechenland) u ¨ber Kleinasien, Nordafrika und S¨ udeuropa. Eine der ersten systematischen Darstellungen ¨ der Dezimalbr¨ uche gab S. Stevin (De Thiende, 1585). Ubrigens findet der Leser eine faszinierende Schilderung dieses hier angesprochenen Teils der Mathematikgeschichte bei B.L. Van Der Waerden (Erwachende Wissenschaft, 2. Aufl., Birkh¨ auser, Basel–Stuttgart, 1966). Die erste einigermaßen ersch¨opfende neuzeitliche Darstellung der Theorie der allgemeinen g–adischen Entwicklung scheint von O. Stolz (Vorlesungen u ¨ber allgemeine Arithmetik, Teubner, Leipzig, 1886) zu stammen. Schließlich sei noch auf das Dualsystem (also g = 2) hingewiesen, das sich in Ans¨ atzen bereits bei australischen Eingeborenen vor vielen Jahrhunderten findet. Vor rund 300 Jahren hat dann insbesondere Leibniz dieses System ausf¨ uhrlich untersucht, welches f¨ ur die heutigen Computer wegen seiner einfachen Eigenschaften (z.B. kommt es mit zwei Ziffern aus) außerordentliche Bedeutung erlangt hat.
§ 2.
Die Cantorsche Entwicklung. Weitere Irrationalit¨ atskriterien
In diesem Paragraphen sei stets (gi )i≥1 eine unendliche Folge ganzer Zahlen, ur alle i ∈ N0 s¨amtliche nicht kleiner als 2; mit diesen werde Pi := g1 · . . . · gi f¨ gesetzt.
1. Beschreibung der Entwicklung. Cantor (Gesammelte Abhandlungen, 35–42) hat 1869 den in 1.4 beschriebenen Algorithmus zur Gewinnung der g– adischen Entwicklung einer reellen Zahl verallgemeinert. Diese Verallgemeinerung soll hier kurz dargestellt werden; in 2 wird dann das zugeh¨ orige notwendige und hinreichende Irrationalit¨ atskriterium nebst Anwendungen pr¨ asentiert. Ist α ∈ IR beliebig, so l¨auft der Cantorsche Algorithmus wie folgt ab: Man schreibe analog zu 1.4(2) zun¨achst (1)
α1 := {α}.
Sei weiter k ≥ 1 und seien α1 , . . . , αk ∈ IR; c1 , . . . , ck−1 ∈ Z bereits so bestimmt,
§ 2.
Die Cantorsche Entwicklung. Weitere Irrationalit¨ atskriterien
217
daß sie den Bedingungen (2)
αi gi = ci + αi+1
f¨ ur i = 1, . . . , k − 1 sowie 0 ≤ αi < 1
(3)
f¨ ur i = 1, . . . , k gen¨ ugen. (3) f¨ uhrt insbesondere zu ci ∈ Sgi f¨ ur i = 1, . . . , k − 1. Nun definiert man (4)
ck := [αk gk ],
αk+1 := {αk gk }
und hat somit (2) bzw. (3) (einschließlich ck ∈ Sgk ) auch f¨ ur i = k bzw. i = k+1. Nun kann man behaupten den
Satz. lung
Jede reelle Zahl α hat die eindeutig bestimmte Cantorsche Entwickα = [α] +
∞
ci Pi−1 ,
i=1
wobei die ci aus (1) und (4) rekursiv zu ermitteln sind und den Bedingungen ur alle i ∈ N, jedoch unendlich oft von gi − 1 verschieden, ci ∈ {0, . . . , gi − 1} f¨ gen¨ ugen. W¨ ahlt man hier alle g1 , g2 , . . . gleich ein und demselben ganzen g ≥ 2, so reduziert sich der behauptete Satz auf Satz 1.4. Beweis. Zun¨ achst sieht man induktiv aus (1) und (2) (5)
α = [α] +
n
ci Pi−1 + αn+1 Pn−1
f¨ ur n = 0, 1, . . . . .
i=1
Wegen (3) und der Voraussetzung gj ≥ 2 ist hier der nichtnegative letzte Summand rechts kleiner als 2−n , so daß man aus (5) durch Grenz¨ ubergang sofort eine Entwicklung f¨ ur α der im Satz gew¨ unschten Art erh¨ alt, wenn man noch ausschalten kann, daß bei geeignetem n f¨ ur alle i > n die Gleichheit ci = gi − 1 eintritt. In diesem Falle w¨are n¨ amlich −1 (6) ci Pi−1 = Pi−1 − Pi−1 = Pn−1 , i>n
i>n
i>n
218
5. Verschiedene Entwicklungen reeller Zahlen
was wegen (5) mit αn+1 = 1 a¨quivalent w¨ are; dies aber widerspricht (3). Hat ur α, so sei bereits man eine weitere Cantorsche Entwicklung c + i≥1 ci Pi−1 f¨ c = [α], c1 = c1 , . . . , cn−1 = cn−1 als richtig erkannt. Ben¨ utzt man diese Gleichungen, so erh¨ alt man durch Gleichsetzen der beiden Reihen f¨ ur α nach Multiplikation mit Pn und bei Beachtung von (6) |cn − cn | = |
i i (ci − ci ) gj−1 | < (gi − 1) gj−1 = 1. i>n
j=n+1
i>n
j=n+1
Hier muß die strenge Ungleichheit gelten, weil sonst entweder ci − ci = gi − 1 f¨ ur alle i > n oder ci − ci = 1 − gi f¨ ur dieselben i gelten m¨ ußte; somit hat man cn = cn , also die Eindeutigkeit der Cantorschen Entwicklung.
2. Cantorsche Reihen und Irrationalit¨ at. Basierend auf der Cantorschen Entwicklung wird nun ein weiteres notwendiges und hinreichendes Kriterium f¨ ur die Irrationalit¨ at reeller Zahlen angegeben. Irrationalit¨ atskriterium. Sei die Folge (gi )i≥1 so beschaffen, daß es zu jeder Primzahl p unendlich viele j gibt mit p|gj . Eine reelle Zahl α ist genau dann irrational, wenn f¨ ur ihre Cantorsche Entwicklung gem¨aß Satz 1 unendlich viele ci von Null verschieden sind. Beweis. Sei zuerst α rational, etwa gleich a/b mit a ∈ Z, b ∈ N. Nach der gegen¨ uber Satz 1 neu hinzugekommenen Voraussetzung u ¨ber die gj gibt es ein ur α = a/b gem¨aß 1 n ∈ N0 , so daß b|Pn gilt. Die Cantorsche Entwicklung f¨ f¨ uhrt nach Multiplikation mit Pn zu n i n a ci gj = ci gj−1 . { }Pn − b i=1 j=i+1 i>n j=n+1
Die Summe rechts ist nicht negativ; wegen ci ≤ gi − 1 und 1(6) ist diese Summe aber kleiner als 1, da unendlich oft ci < gi − 1 gelten muß. Auf der linken Seite steht offensichtlich eine ganze Zahl, die somit gleich 0 sein muß. Daraus wiederum folgt ci = 0 f¨ ur alle i > n wie behauptet. Die umgekehrte Richtung ist trivial. Dies Irrationalit¨atskriterium eignet sich besonders gut f¨ ur Anwendungen, bei denen man z.B. gj = j + 1 f¨ ur alle j ∈ N zu nehmen w¨ unscht, wo die gestellte Zusatzbedingung ersichtlich erf¨ ullt ist. ur alle i ∈ N, Sind c0 ∈ Z, ci ∈ {0, . . . , i} f¨ jedoch unendlich oft ci = i, so ist i≥1 ci−1 /i! irrational, falls unendlich viele ci von Null verschieden sind. Daraus ergibt sich mit der Wahl ci := 1 f¨ ur alle i ≥ 0 die Irrationalit¨ at von e − 1, also die
§ 2.
Die Cantorsche Entwicklung. Weitere Irrationalit¨ atskriterien
219
Proposition A. Die Zahl e ist irrational. Die Irrationalit¨ at von e wurde erstmals 1767 von Lambert mit Hilfe einer Kettenbruchentwicklung bewiesen; vgl. hierzu auch 3.11. Proposition B. Bezeichnet τ bzw. ϕ die in 1.1.3 bzw. 1.4.11 eingef¨ uhrte Teileranzahlfunktion bzw. Eulersche Phi-Funktion, so sind i≥1 τ (i)i!−1 und −1 irrational. i≥1 ϕ(i)i! Beweis. F¨ ur i ≥ 3 ist offenbar 1 ≤ τ (i) ≤ i − 1; denn dann ist i − 1 eine nat¨ urliche Zahl gr¨ oßer als 1, die i nicht teilen kann. Nun setzt man f¨ ur die erste Reihe ci−1 := τ (i) f¨ ur i ≥ 3 und etwa c0 := 0, c1 := 0; f¨ ur jede Primzahl i > 3 ist ci−1 = 2 < i − 1. Zur Behandlung der zweiten Reihe beachtet man 1 ≤ ϕ(i) ≤ i − 1 f¨ ur i ≥ 2 und setzt ci−1 := ϕ(i) f¨ ur diese i und c0 := ϕ(1) = 1. Um ci−1 < i − 1 f¨ ur unendlich viele i zu erhalten, bemerkt man, daß nach Korollar 1.4.11(iii) in der Ungleichung ϕ(i) ≤ i−1 (i ≥ 2) Gleichheit genau dann eintritt, wenn i Primzahl ist. Wegen σ(i) ≥ i + 1 f¨ ur alle i ≥ 2 kann auf dem hier gezeigten Wege die Irra tionalit¨ at der Reihe i≥1 σ(i)i!−1 nicht erhalten werden, wobei σ die in 1.1.7 eingef¨ uhrte Teilersummenfunktion bedeutet. Allerdings ist die Irrationalit¨ at dieser Reihe auf etwas anderem Wege bewiesen worden. Auch die Irrationalit¨ at von e2 = i≥0 2i i!−1 ist hier nicht zu haben.
3. Verwandte Irrationalit¨ atskriterien. Aus der F¨ ulle der zum Hauptergebnis aus 2 verwandten Reihenkriterien f¨ ur Irrationalit¨ at sei noch eines herausgegriffen: Satz. Sei g1 ≤ g2 ≤ . . . und (ci )i=1,2,... eine beschr¨ankte Folge ganzer Zahlen, von denen unendlich viele nicht Null sein sollen; es werde gesetzt α :=
∞
ci Pi−1 .
i=1
Wenn (gi )i=1,2,... unbeschr¨ankt ist, ist α irrational. Bemerkung. Es kann α auch dann irrational sein, wenn (gi ) beschr¨ ankt ist: Man braucht ja nur alle gi gleich einem festen g zu nehmen und dann eine nichtperiodische Folge (ci ) mit allen ci ∈ Sg .
220
5. Verschiedene Entwicklungen reeller Zahlen
Beweis. Sei |ci | ≤ c f¨ ur alle i ≥ 1 und es werde angenommen, α sei rational, etwa gleich a/b. Dann gilt f¨ ur alle n ∈ N0
(1)
i n a bPn | − ci Pi−1 | = b| ci gj−1 | b i=1 i>n j=n+1
≤
bc
gn+1
i>n
21+n−i =
2bc . gn+1
Wird nun N ∈ N so fixiert, daß gN+1 > 2bc ist, so gilt gn+1 > 2bc f¨ ur alle allt. Da die linke Seite in (1) ganzzahlig ist, muß also f¨ ur n ≥ N , da (gi ) nicht f¨ alle n ≥ N n a = ci Pi−1 b i=1 zutreffen, also ci = 0 f¨ ur alle i > N , was einer Voraussetzung u ¨ber (ci ) widerspricht. Sind unter den zun¨ achst genannten Voraussetzungen u ¨ber die gi alle ci gleich, so erh¨alt man erneut ein notwendiges und hinreichendes Irrationalit¨ atskriterium aus obigem Satz. Korollar. Gilt g1 ≤ g2 ≤ . . ., so ist die Beschr¨anktheit der Folge (gi ) notwendig und hinreichend f¨ ur die Rationalit¨ at von α :=
∞
Pi−1 .
i=1
Beweis. Die eine Richtung folgt durch Spezialisierung aus obigem Satz. Ist umgekehrt (gi ) beschr¨ ankt, so gibt es ein n ∈ N, so daß 2 ≤ g1 ≤ . . . ≤ gn = gn+1 = . . . =: g gilt. Dann ist
α−
n−1 i=1
∞ Pi−1 Pn−1 = g n−i−1 = (g − 1)−1 , i=n
also α rational.
4. Anwendungen. W¨ ahlt man wieder gi := i + 1 f¨ ur alle i ∈ N, so erh¨ alt man aus dem vorstehenden Korollar erneut die Irrationalit¨ at von e. Im wesentlichen auf diesem Wege hat J.B. Fourier 1815 diese arithmetische Aussage bewiesen.
§ 2.
Die Cantorsche Entwicklung. Weitere Irrationalit¨ atskriterien
221
Die n¨ achste Anwendung des Korollars bezieht sich auf die in 2.1.2 eingef¨ uhrten n Fermat–Zahlen Fn := 22 + 1, n = 0, 1, . . ., sowie auf die dort ebenfalls betrachteten Zahlen Gn := Fn − 2, die der unten ben¨ otigten Beziehung 2.1.2(1)
Gk
i−1
f¨ ur 0 ≤ k ≤ i
Fj = Gi
j=k
gen¨ ugen. Proposition A. Beide Reihen
i≥0
Fi−1 ,
i≥0
G−1 sind irrational. i
Beweis. Wegen G0 = 1 und 2.1.2(1) ist G :=
∞
G−1 i
=1+
i=0
∞ i
−1 Fj−1 ;
i=1 j=1
auf die Reihe rechts wendet man nun das Korollar mit gi := Fi−1 f¨ ur i ∈ N an und erh¨ alt direkt G ∈ Q. Aus 2.1.2(1) folgt auch Gi = Fi−1 Gi−1 und somit −1 2G−1 = G−1 ur alle i ∈ N, also i i−1 − Fi−1 f¨ F :=
∞
Fi−1 = G − 2(G − 1) = 2 − G,
i=0
woraus die Irrationalit¨at von F folgt. ¨ Ubrigens hat Mahler 1929/30 eine analytische Methode entwickelt, deren Hauptresultate die Transzendenz von F und G bei weitem umfassen. F¨ ur die Gewinnung des letzten Ergebnisses dieses Paragraphen ist es bequem, sich direkt auf Satz 3 zu st¨ utzen. W¨ ahrend die bloße Aussage der Irrationalit¨ at von e ¨ aquivalent ist damit, daß es kein P ∈ Z[X], P = 0, ∂(P ) ≤ 1 gibt mit P (e) = 0, geht Proposition B noch einen Schritt weiter: Proposition B. Es gibt kein P ∈ Z[X], P = 0, ∂(P ) ≤ 2 mit P (e) = 0, d.h. e ist weder rational noch eine quadratische Irrationalit¨at. Im Rahmen der Theorie der regelm¨aßigen Kettenbr¨ uche wird hierf¨ ur in 3.11 ein weiterer Beweis gegeben; in Kapitel 6 wird dann sogar die Transzendenz von e bewiesen.
222
5. Verschiedene Entwicklungen reeller Zahlen
Beweis. Angenommen, es g¨abe nicht s¨ amtlich verschwindende a0 , a1 , a2 ∈ Z, so daß a0 + a1 e + a2 e2 = 0 oder gleichbedeutend (1)
a0 e−1 + a2 e = −a1
gilt; sicher ist dann (a0 , a2 ) = (0, 0). Gleichung (1) besagt gerade (2)
∞ a0 (−1)i + a2 = −a1 − 2a2 . i! i=2
ur i = 1, 2, . . ., beachtet (ci , ci+1 ) = Nimmt man gi := i+1, ci := a0 (−1)i+1 +a2 f¨ (0, 0) f¨ ur dieselben i wegen (a0 , a2 ) = (0, 0), so ist die linke Seite von (2) nach Satz 3 irrational und so erweist sich die anfangs gemachte Annahme als falsch.
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
1. Der Kettenbruchalgorithmus. In 1.2.10 wurde im Anschluß an den euklidischen Algorithmus die Entwicklung einer rationalen Zahl r0 /r1 mit r0 , r1 ∈ Z, aßigen Kettenbruch r1 > 0 in einen endlichen regelm¨ (1)
[a0 ; a1 , . . . , aj ]
besprochen. Dabei gen¨ ugten die Elemente (oft auch Teilnenner) ai dieses Kettenbruchs stets den Bedingungen a0 ∈ Z; a1 , . . . , aj ∈ N; aj ≥ 2. Wegen aj = (aj − 1) + 11 ist aber klar, daß man (1) genausogut als (2)
[a0 ; a1 , . . . , aj−1 , aj − 1, 1]
schreiben kann, wobei die Eigenschaft erhalten bleibt, daß alle nach dem Strichpunkt aufgef¨ uhrten Elemente nat¨ urliche Zahlen sind. Auf diese M¨ oglichkeit, eine rationale Zahl auf (mindestens) zwei Weisen in einen endlichen Kettenbruch zu entwickeln, wird in 3 zur¨ uckzukommen sein. Zun¨ achst stellt man fest, daß der Algorithmus 1.2.9(1) mit der Bezeichnung αi := ri /ri+1 (i = 0, . . . , j) a¨quivalent ist zu −1 −1 α0 = a0 + α−1 1 , α1 = a1 + α2 , . . . , αj−1 = aj−1 + αj , αj = aj
mit α1 , . . . , αj > 1, vgl. auch 1.2.9(3). Dabei gilt, wie bereits seinerzeit bemerkt, in der jetzigen Terminologie ai = [αi ] f¨ ur i = 0, . . . , j bzw. αi+1 = {αi }−1 f¨ ur i = 0, . . . , j − 1.
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
223
In dieser Form ist der Algorithmus auch zur Anwendung auf irrationale α ∈ IR geeignet: Man setzt α0 := α, a0 := [α0 ], hat 0 < {α0 } < 1 wegen α0 ∈ Q und setzt damit weiter α1 := {α0 }−1 ; es ist a0 ∈ Z, α0 = a0 + α−1 1 , α1 > 1, α1 ∈ Q. Nun setzt man voraus, es sei i ≥ 1 und man habe bereits αj = aj + α−1 ur j = 0, . . . , i − 1 j+1 f¨ (3)
a0 ∈ Z, a1 , . . . , ai−1 ∈ N und αj > 1, αj ∈ Q f¨ ur j = 1, . . . , i
gewonnen. Definiert man dann ai := [αi ], so ist {αi } aus ]0, 1[ und irrational, oßer als 1 und irrational und gen¨ ugt der Gleichung also ist αi+1 := {αi }−1 gr¨ αi = ai + α−1 ur alle i ∈ N best¨atigt und hat i+1 . Induktiv hat man somit (3) f¨ u ¨berdies (4)
α = [a0 ; a1 , . . . , ai−1 , αi ]
f¨ ur i = 0, 1, . . . .
Wegen der obigen Festsetzung α0 := α und der Konvention 1.2.10(1) ist (4) f¨ ur i = 0 richtig. Ist (4) f¨ ur ein i ≥ 0 in Ordnung, so tr¨ agt man in (4) f¨ ur αi aus (3) ai + α−1 alt man gerade (4) f¨ ur i + 1 anstelle von i. i+1 ein; mittels 1.2.10(2) erh¨ Der beschriebene Algorithmus ordnet jedem vorgegebenen α ∈ IR \ Q eine wohlbestimmte unendliche Folge a0 , a1 , a2 , . . . ganzer Zahlen zu, wobei die a1 , a2 , . . . s¨amtliche positiv sind, oder genauer gesagt den unendlichen regelm¨ aßigen Kettenbruch [a0 ; a1 , . . . , ai , . . .]. Es sei hier sogleich angemerkt, daß der Zusatz “regelm¨aßig” im weiteren stets unterdr¨ uckt wird, weil andersartige Kettenbr¨ uche in diesem Buch nicht diskutiert werden.
2. Konvergenz unendlicher Kettenbr¨ uche. Zun¨ achst muß die Konvergenz solcher Kettenbr¨ uche untersucht werden. Sei also ganz allgemein eine endliche oder unendliche Folge a0 , a1 , . . . , ak (, . . .) ganzer Zahlen mit a0 ∈ Z, a1 , . . . ∈ N vorgegeben und es werde verabredet, daß ak ihr letztes Glied sein soll, wenn sie endlich ist. Zu ihr definiert man zwei neue Folgen (pi ), (qi ), im endlichen Fall nur f¨ ur i ≤ k, gem¨aß den Rekursionsformeln (1)
p−2 := 0, q−2 := 1,
p−1 := 1,
pi := ai pi−1 + pi−2 ,
q−1 := 0,
qi := ai qi−1 + qi−2
f¨ ur i = 0, 1, . . . , k(, . . .). Daraus sieht man pi ∈ Z, qi ∈ N f¨ ur alle in Frage kommenden i ≥ 0. Genauer ist q0 = 1, qi ≥ qi−1 + qi−2 f¨ ur i ≥ 1, was induktiv qi ≥ i f¨ ur i ≥ 1 liefert. Insbesondere ist (qi ) unbeschr¨ ankt, wenn die vorgegebene Folge (ai ) unendlich ist. Mit den so eingef¨ uhrten pi , qi hat man das
224
5. Verschiedene Entwicklungen reeller Zahlen
Lemma A. F¨ ur alle in Frage kommenden i ≥ 0 ist mit einer Unbestimmten X pi−1 X + pi−2 [a0 ; a1 , . . . , ai−1 , X] = . qi−1 X + qi−2 Beweis. F¨ ur i = 0 hat man (1) und die Konvention 1.2.10(1) zu beachten. Ist die zu beweisende Gleichung f¨ ur i ≥ 0 richtig, so f¨ uhrt 1.2.10(2) und (1) zu [a0 ; a1 , . . . , ai , X] = [a0 ; a1 , . . . , ai−1 , ai + =
pi−1 (ai + qi−1 (ai +
1 X) 1 X)
+ pi−2 + qi−2
1 ] X pi X + pi−1 = . qi X + qi−1
Indem man nun ai f¨ ur X einsetzt und erneut (1) beachtet, folgt aus Lemma A pi Ai := [a0 ; a1 , . . . , ai ] = qi f¨ ur i ≥ 0 (und gegebenenfalls i ≤ k). Ai heißt der i–te N¨aherungsbruch des (eventuell endlichen) Kettenbruchs [a0 ; a1 , . . . , ak , . . .]; pi bzw. qi heißt der i–te N¨ aherungsz¨ahler bzw. –nenner dieses Kettenbruchs. Als weiteres technisches Hilfsmittel f¨ ur die Konvergenzuntersuchung unendlicher Kettenbr¨ uche ist n¨ utzlich das folgende Lemma B. F¨ ur i ≥ −1 ist (2)
pi−1 qi − pi qi−1 = (−1)i ;
insbesondere gilt (pi , qi ) = 1 f¨ ur i ≥ −2 sowie (3)
Ai−1 − Ai =
(−1)i qi−1 qi
f¨ ur i ≥ 1.
F¨ ur i ≥ 0 ist (4)
pi−2 qi − pi qi−2 = (−1)i−1 ai
und daher (5)
Ai − Ai−2 =
(−1)i ai qi−2 qi
f¨ ur i ≥ 2,
jeweils gegebenenfalls nur f¨ ur i ≤ k. Beweis. (2) ist nach (1) f¨ ur i = −1 richtig und aus der Richtigkeit f¨ ur ein i ≥ −1 folgt nach (1) und der Induktionsannahme pi qi+1 − pi+1 qi = pi (ai+1 qi + qi−1 ) − (ai+1 pi + pi−1 )qi = pi qi−1 − pi−1 qi = (−1)i+1 . (2) und (3) sind a¨quivalent. V¨ ollig analog beweist man (4) und damit (5).
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
225
Proposition. Die (gegebenenfalls endlichen) Folgen A0 , A2 , . . . bzw. A1 , A3 , . . . sind streng monoton wachsend bzw. fallend und jedes Glied der ersten Folge ist kleiner als jedes Glied der zweiten Folge. Beweis. Bei geradem i ≥ 2 folgt n¨ amlich Ai > Ai−2 aus (5), bei ungeradem i ≥ 3 jedoch Ai < Ai−2 . Werden mit s, t ∈ N0 nun A2s , A2t+1 miteinander verglichen, so gilt bei s ≤ t die Ungleichung A2s ≤ A2t < A2t+1 nach (3) f¨ ur i = 2t + 1; bei s > t ist A2s < A2s+1 < A2t+1 nach dem bereits vorher Festgestellten. Nun stehen alle Hilfsmittel bereit f¨ ur den Konvergenzsatz. Ist ein unendlicher Kettenbruch [a0 ; a1 , a2 , . . .] mit a0 ∈ Z und allen a1 , a2 , . . . ∈ N vorgelegt, so konvergiert die unendliche Folge (Ai )i=0,1,... der N¨ aherungsbr¨ uche dieses Kettenbruchs; ist α ∈ IR der Grenzwert, so hat man u ¨berdies A0 < A2 < . . . < α < . . . < A3 < A1 und α ∈ Q. Bemerkung. Unter dem Wert von [a0 ; a1 , a2 , . . .] versteht man den Grenzwert α und schreibt direkt [a0 ; a1 , . . .] = α. Beweis. Nach vorstehender Proposition ist die Folge A0 , A2 , . . . monoton wachsend und (etwa durch A1 ) nach oben beschr¨ankt, also konvergent, etwa gegen α . Analog ist A1 , A3 , . . . gegen ein reelles α ≥ α konvergent. Weiter ist −1 −1 0 ≤ α − α < A2s−1 − A2s = q2s−1 q2s ≤
1 (2s − 1)2s
f¨ ur alle s ≥ 1 wegen (3) und qi ≥ i f¨ ur i ≥ 1. Der letzten Ungleichung entnimmt man α = α =: α. urde α = Ai f¨ ur alle i ≥ 0 gelten, also nach (3) W¨ are α ∈ Q, etwa α = ab , so w¨ 1 1 ≤ |α − Ai | < |Ai+1 − Ai | = . bqi qi qi+1 Dies w¨ urde aber qi+1 < b f¨ ur alle i ≥ 0 implizieren, w¨ahrend doch die Folge (qi ) unbeschr¨ ankt ist.
3. Eindeutigkeit. Irrationalit¨ at. Der folgende Satz enth¨ alt offenbar wieder ein notwendiges und hinreichendes Kriterium f¨ ur die Irrationalit¨ at einer reellen Zahl.
226
5. Verschiedene Entwicklungen reeller Zahlen
Satz. Jedes α ∈ IR l¨ aßt sich in eindeutiger Weise in einen Kettenbruch entwikkeln und dieser ist endlich genau dann, wenn α rational ist. Dabei hat man im endlichen Fall zu verbieten, daß das letzte Element gleich Eins ist, falls es einen positiven Index hat. Beweis. Daran, daß sich eine rationale Zahl auf mindestens eine Weise in einen (endlich ausfallenden) Kettenbruch entwickeln l¨aßt, wurde in 1 erinnert. F¨ ur α ∈ Q gilt nach 1(3) und 1(4) die Gleichung α = [a0 ; a1 , . . . , ai , αi+1 ] mit irrationalen ur i ≥ 0. Nach Lemma 2A ist α = (pi αi+1 + pi−1 )/(qi αi+1 + qi−1 ) f¨ ur αi+1 > 1 f¨ i ≥ 0, also f¨ ur dieselben i (1)
α−
pi qi (pi αi+1 + pi−1 ) − pi (qi αi+1 + qi−1 ) (−1)i = = , qi qi (qi αi+1 + qi−1 ) qi (qi αi+1 + qi−1 )
woraus insbesondere |α − Ai | < qi−2 folgt, also α = limi→∞ Ai und dieser letzte Grenzwert ist nach dem Konvergenzsatz 2 gleich α. Der in der zweiten H¨alfte von 1 beschriebene Algorithmus liefert somit tats¨achlich eine Entwicklung des irrationalen α in einen unendlichen Kettenbruch. Zur Eindeutigkeit der Kettenbruchentwicklung nimmt man nun an, α ∈ IR habe zwei Entwicklungen, (2)
[a0 ; a1 , . . .] = α = [a0 ; a1 , . . .].
Diese sind nach dem Bisherigen entweder beide endlich oder beide unendlich. ur j = 0, . . . , i − 1 eingesehen (vorausgesetzt Ist nun i ≥ 0 und bereits aj = aj f¨ wird dabei im endlichen Fall selbstverst¨ andlich, daß beide Kettenbr¨ uche in (2) mindestens i + 1 Elemente haben), so gilt nach Lemma A und (2) mit den Bezeichnungen αi := [ai ; ai+1 , . . .], αi := [ai ; ai+1 , . . .]: pi−1 αi + pi−2 pi−1 αi + pi−2 = [a0 ; . . . , ai−1 , αi ] = α = [a0 ; . . . , ai−1 , αi ] = , qi−1 αi + qi−2 qi−1 αi + qi−2 uche unendlich, so woraus αi = αi wegen 2(2) folgt. Sind in (2) beide Kettenbr¨ bedeutet dies ai + 1/αi+1 = ai + 1/αi+1 , also |ai − ai | = |1/αi+1 − 1/αi+1 | < 1 wegen αi+1 , αi+1 > 1 und somit ai = ai . Dieselbe Schlußfolgerung kann gezogen werden, wenn in (2) zwei endliche Kettenbr¨ uche mit jeweils mindestens i + 2 Gliedern stehen; dabei ist ganz wesentlich zu beachten, daß keiner der beiden Kettenbr¨ uche nach der getroffenen Konvention mit einem Element 1 enden darf. Haben beide endliche Kettenbr¨ uche die L¨ange i + 1, so ist ai = αi = αi = ai ; hat einer, etwa der rechts in (2), die L¨ ange i + 1, der andere aber mindestens die L¨ ange i + 2, so ist ai − ai = α−1 ∈]0, 1[ wegen αi+1 > 1. Dies widerspricht i+1 der Ganzzahligkeit von ai , ai und auch hier hat man wieder ausgenutzt, daß ein endlicher Kettenbruch nicht auf 1 enden darf.
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
227
√ 4. √Periodische Kettenbr¨ uche. Satz von Euler. Da z.B. die Zahlen 2 und 1 2 ( 5 + 1) nach 1.1.9 irrational sind, haben sie nach dem letzten Satz unendliche Kettenbruchentwicklungen, welche zun¨ achst bestimmt werden sollen. √ √ √ Ausgehend von der Gleichung ( 2 − 1)( 2 + 1) = 1 findet man 2 = 1 + 1+1√2 ; √ tr¨ agt √ man hier rechts√im Nenner f¨ ur 2 erneut die gesamte rechte Seite ein, so √ folgt 2 = [1; 2, 1 + 2] und induktiv kommt man zu 2 = [1; 2, 2, 2, . . .]. √ √ √ Analog beachtet man 12 ( 5 − 1) = ( 12 ( 5 + 1))−1 , um aus 12 ( 5 + 1) = 1 + √ √ √ √ 1 1 1 1 2 ( 5−1) zu schließen 2 ( 5+1) = [1; 2 ( 5+1)], also 2 ( 5+1) = [1; 1, 1, 1, . . .]. √ 1 Offenbar ist 2 ( 5 + 1) (bis auf einen ganzzahligen Summanden) diejenige reelle Irrationalzahl mit den kleinstm¨ oglichen Elementen. √ F¨ ur die Zwecke von 6 wird nun in Verallgemeinerung des obigen Beispiels 2 behauptet: Proposition.
F¨ ur D ∈ N gilt (1 + D2 )1/2 = [D; 2D, 2D, . . .].
Beweis. Setzt man α := [2D; 2D, 2D, . . .], so ist α = 2D + α−1 und die positive Irrationalzahl α gen¨ ugt der quadratischen Gleichung α2 − 2Dα − 1 = 0. Deren einzige positive Wurzel ist D +(1 +D2 )1/2 , woraus bereits die Behauptung folgt.
Selbstverst¨ andlich wird man einen unendlichen Kettenbruch (1)
[a0 ; a1 , a2 , . . .]
urlicher Zahlen periodisch ist. periodisch nennen, wenn die Folge a1 , a2 , . . . nat¨ Die Begriffe Vorperiodenl¨ ange () und Periodenl¨ ange (hier h statt p), Vorperiode, Periode werden aus 1.5 u ¨bernommen. Ist insbesondere a+1 , . . . , a+h die Periode und a1 , . . . , a die (bei = 0 fehlende) Vorperiode von (1), so schreibt man (1) als [a0 ; a1 , . . . , a , a+1 , . . . , a+h ] in Anlehnung an die entsprechende Bezeichnungsweise in 1.5 bei g–adischen Entwicklungen. Die bisher betrachte√ √ ten Zahlen 2, 12 ( 5 + 1), (1 + D2 )1/2 haben s¨amtliche periodische Kettenbruchentwicklungen, wie gesehen n¨ amlich [1; 2], [1; 1], [D; 2D]. Durch den Satz von Lagrange in 5 wird diese Beobachtung in einen allgemeineren Rahmen gestellt; jener Satz ist die Umkehrung des folgenden (einfacheren) Satzes von Euler (Opera Omnia Ser. 1, XIV, 187–215) aus dem Jahre 1737: Satz von Euler. Ein unendlicher periodischer Kettenbruch definiert eine reell–quadratische Irrationalzahl.
228
5. Verschiedene Entwicklungen reeller Zahlen
Beweis. Sei (1) periodisch und α der Wert dieses Kettenbruchs. Mit αi := ur i ≥ 0 (also α0 := α) hat man mittels Lemma 2A [ai ; ai+1 , . . .] f¨ (2)
α = [a0 ; a1 , . . . , ai−1 , αi ] =
pi−1 αi + pi−2 qi−1 αi + qi−2
f¨ ur i ≥ 0.
F¨ ur dieselben i erh¨alt man hieraus (3)
αi =
pi−2 − qi−2 α ; qi−1 α − pi−1
ur alle i > impliziert nat¨ urlich der Nenner verschwindet dabei nicht. ai+h = ai f¨ αi+h = αi f¨ ur dieselben i, woraus sich mit (3) ergibt (4)
pi−2 − αqi−2 pi+h−2 − αqi+h−2 = αqi+h−1 − pi+h−1 αqi−1 − pi−1
f¨ ur i > .
Setzt man Ri := qi+h−1 qi−2 − qi+h−2 qi−1 , Si := pi+h−2 qi−1 + pi−1 qi+h−2 − pi−2 qi+h−1 − pi+h−1 qi−2 , Ti := pi+h−1 pi−2 − pi−1 pi+h−2 , so gen¨ ugt α wegen (4) der quadratischen Gleichung Ri α2 +Si α+Ti = 0 f¨ ur i > . ur i > und Dem sogleich nachgeschobenen Lemma entnimmt man Ri = 0 f¨ somit ist α algebraisch von einem Grad h¨ochstens 2; wegen der Unendlichkeit seines Kettenbruchs ist α ∈ Q, also sein Grad tats¨achlich genau 2. Lemma.
F¨ ur verschiedene j, k ∈ N0 gilt qj qk−1 = qj−1 qk .
Wendet man das Lemma an mit j := i − 1, k := i + h − 1, so sind diese beiden ≥ 0 f¨ ur i > 0 und außerdem wegen h ≥ 1 voneinander verschieden; also ist Ri = 0 f¨ ur i > 0. Beweis des Lemmas. Sei o.B.d.A. k > j ≥ 0. F¨ ur j = 0 ist qj−1 qk = 0, aber qj qk−1 = 0. Sei also bereits k > j ≥ 1; dann sind alle im Lemma vorkommenden q’s nicht Null. Wegen (qi−1 , qi ) = 1, vgl. 2(2), folgt aus der Annahme qj qk−1 = qj−1 qk , daß qj |qk gelten muß, also qk = gqj und damit auch qk−1 = gqj−1 mit einem g ∈ N. Wegen (qk−1 , qk ) = g(qj−1 , qj ) muß g = 1 sein, also qk−1 = qj−1 , qk = qj . Andererseits ist aber wegen k ≥ 2: qk ≥ qk−1 + qk−2 > qk−1 ≥ qj .
5. Der Satz von Lagrange. Die Umkehrung des Eulerschen Satzes 4 geht auf Lagrange (Oeuvres II, 581–652) zur¨ uck; sie lautet
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
229
Satz von Lagrange. Jede reell–quadratische Irrationalzahl hat einen unendlichen periodischen Kettenbruch. Beweis. Sei α ∈ IR algebraisch vom Grade 2 und sei 4(1) sein (nach Satz 3 unendlicher) Kettenbruch. Nach Voraussetzung gibt es ein P := RX 2 +SX+T ∈ Z[X], P = 0, mit α als Wurzel. Wegen α ∈ IR \ Q muß R = 0 gelten und die Diskriminante S 2 − 4RT von P muß positiv sein, jedoch keine Quadratzahl. Nach 4(2) ist R(pi−1 αi + pi−2 )2 + S(pi−1 αi + pi−2 )(qi−1 αi + qi−2 ) + T (qi−1 αi + qi−2 )2 = 0 f¨ ur alle i ≥ 0 und mit den Bezeichnungen (1)
2 Ri∗ := Rp2i−1 + Spi−1 qi−1 + T qi−1 , ∗ Si := 2Rpi−1 pi−2 + S(pi−1 qi−2 + pi−2 qi−1 ) + 2T qi−1 qi−2 , ∗ Ti∗ := Ri−1
bedeutet dies: αi ist Wurzel von Pi := Ri∗ X 2 +Si∗ X +Ti∗ ∈ Z[X] f¨ ur i = 0, 1, . . .. Wegen der leicht nachzupr¨ ufenden Matrizengleichung ∗ pi−1 qi−1 2R S pi−1 pi−2 2Ri Si∗ = Si∗ 2Ti∗ pi−2 qi−2 S 2T qi−1 qi−2 ¨ zu den entsprechenden Determinanten und bei Beachtung ist nach Ubergang von 2(2) (2)
Si∗2 − 4Ri∗ Ti∗ = S 2 − 4RT
f¨ ur alle i ≥ 0.
Sch¨ atzt man in 3(1) f¨ ur i − 1 statt i ab, so erh¨ alt man |qi−1 α − pi−1 | = (qi−1 αi + qi−2 )−1 < (qi−1 ai + qi−2 )−1 = qi−1 f¨ ur i ≥ 1, also mit einem ϑi ∈ IR, 0 < |ϑi | < 1: pi−1 = αqi−1 + ϑi qi−1
f¨ ur i ≥ 0.
Tr¨ agt man dies in der rechten Seite der ersten Gleichung von (1) ein, so folgt 2 Ri∗ = P (α)qi−1 + (2Rα + S)ϑi qi−1 qi−1 + Rϑ2i qi−2 .
P (α) = 0 f¨ uhrt unmittelbar zu |Ri∗ | ≤ |2Rα + S| + |R| f¨ ur alle i ≥ 0, d.h. (Ri∗ ) ∗ und damit nach (1) auch (Ti ) erweist sich als beschr¨ankte Folge ganzer Zahlen. Wegen (2) trifft dasselbe nun f¨ ur (Si∗ ) zu, und so muß es ein (R∗ , S ∗ , T ∗ ) ∈ Z3 ∗2 ∗ ∗ 2 mit S − 4R T = S − 4RT geben, so daß f¨ ur unendlich viele Indizes i gilt: Ri∗ = R∗ , Si∗ = S ∗ , Ti∗ = T ∗ . Da S 2 − 4RT kein Quadrat ist, gilt R∗ T ∗ = 0 und also hat das Polynom P ∗ := R∗ X 2 + S ∗ X + T ∗ zwei verschiedene reelle irrationale Wurzeln. Andererseits ist P ∗ (αi ) = 0 unendlich oft und so existieren j, k ∈ N0 mit j < k und αk = αj , d.h. [ak ; ak+1 , . . .] = [aj ; aj+1 , . . .]. Nach der Eindeutigkeitsaussage von Satz 3 ist dann mit h := k − j ∈ N ai+h = ai
f¨ ur alle i ≥ j
und α hat somit eine periodische Kettenbruchentwicklung.
230
5. Verschiedene Entwicklungen reeller Zahlen
Mit Satz 3 und den S¨ atzen von Euler und Lagrange scheint sich f¨ ur algebraische α ∈ IR eine Serie von Charakterisierungen durch Eigenschaften ihrer Kettenbruchentwicklung anzubahnen: α ist vom Grade 1 genau dann, wenn sein Kettenbruch endlich ist; α ist vom Grade 2 genau dann, wenn sein Kettenbruch unendlich und periodisch ist. Hier jedoch endet bereits die Serie nach heutiger Kenntnis der Dinge: Man kennt z.B. keine Charakterisierung des Grades 3 durch Kettenbrucheigenschaften, ja man kennt f¨ ur kein algebraisches α ∈ IR mit Grad ≥ 3 den Kettenbruch. Insbesondere weiß man nicht, ob es darunter welche gibt, f¨ ur die die Folge der Kettenbruchelemente z.B. unbeschr¨ankt ist.
6. Zur Minimall¨ osung der Pellschen Gleichung. In 4.3.3 wurde gezeigt, daß die Pellsche Gleichung (1)
X 2 − dY 2 = 1
bei nicht quadratischem d ∈ N unendlich viele L¨ osungen hat. Der Beweis dort begann (vgl. 4.3.3(2)) mit einer Anwendung des zweiten Teils des Dirichletschen Approximationssatzes 4.3.2. Es sei hier zun¨ achst bemerkt, daß jene zweite Teilaussage des Dirichletschen Approximationssatzes genausogut aus der in diesem Paragraphen entwickelten Kettenbruchtheorie ableitbar ist. Sind n¨ amlich pi , qi der i–te N¨aherungsz¨ahler bzw. –nenner des Kettenbruchs von α, so folgt aus 3(1) unmittelbar durch Absch¨ atzung |qi α − pi | < 1/qi f¨ ur alle i ≥ 0 und nach Lemma 2 sind pi , qi teilerfremd f¨ ur jedes solche i. Ferner wurde in 4.3.4 das Problem der vollst¨ andigen L¨osung von (1) auf das Problem der Auffindung der Minimall¨ osung von (1) zur¨ uckgespielt. Am Ende von 4.3.4 wurde dann ein Probierverfahren zur Auffindung dieser Minimall¨ osung angegeben und ein systematischer Weg via Kettenbruchtheorie zur Erledigung dieser Aufgabe in Aussicht gestellt. Dieser Weg soll hier zun¨ achst f¨ ur die speziellen d ∈ N der Form d = 1 + D2 , D ∈ N dargelegt werden, die dann automatisch keine Quadrate sind. Behauptet wird Satz A. Ist d := 1 + D2 , D ∈ N, und ist pi bzw.√qi der i–te N¨aherungsz¨ ahler bzw. –nenner der Kettenbruchentwicklung von d, so ist (p1 , q1 ) die Mini¨ mall¨ osung der Pellschen Gleichung (1). Uberdies sind (p2k−1 , q2k−1 )k=1,2,... alle L¨ osungen von (1) in N2 . Dieser Satz kl¨art auch das am Ende von 4.3.4 angegebene Beispiel der Primzahl d = 98597 auf: Es ist n¨ amlich d = 1 + 3142 , also pq11 = [314; 628] = 197193 nach 628 Proposition 4 und somit ist (197193, 628) nach Satz A die Minimall¨ osung der entsprechenden Gleichung (1) wie in 4.3.4 in Aussicht gestellt.
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
231
Beweis von Satz A. Wenn f¨ ur diesen Beweis stets d f¨ ur 1 + D2 steht, wird zun¨ achst behauptet (2) (3)
p2i − dqi2 = (−1)i+1
f¨ ur i ≥ −1,
pi−1 pi − dqi−1 qi = (−1)i D
f¨ ur i ≥ 0.
F¨ ur i = −1, 0 ist (2) und f¨ ur i = 0 ist (3) richtig nach 2(1) und p0 = a0 , q0 = 1; ur i ≥ 1 wegen Proposition 4 gilt. Sei man beachte, daß a0 = D, ai = 2D f¨ nun i ≥ 0 und (2), (3) f¨ ur dieses i schon als richtig erkannt. Dann ist unter Beachtung von (2), (3) f¨ ur i + 1 2 p2i+1 − dqi+1 = (2Dpi + pi−1 )2 − d(2Dqi + qi−1 )2 2 = 4D2 (p2i − dqi2 ) + 4D(pi−1 pi − dqi−1 qi ) + (p2i−1 − dqi−1 )
= (−1)i+1 (4D2 − 4D2 − 1) = (−1)i+2 , was (2) f¨ ur i + 1 beweist. Dabei hat man 2(1) ben¨ utzt, wie auch in der n¨ achsten Formelzeile, die zu (3) f¨ ur i + 1 f¨ uhrt: pi pi+1 − dqi qi+1 = pi (2Dpi + pi−1 ) − dqi (2Dqi + qi−1 ) = 2D(p2i − dqi2 ) + (pi pi−1 − dqi qi−1 ) = (−1)i+1 (2D − D) = (−1)i+1 D. Aus (2) sieht man bereits, daß alle (pi , qi ) ∈ N2 mit ungeradem i ≥ 1 die Pellsche Gleichung (1) bei d = 1 + D2 l¨ osen. Ist (x1 , y1 ) deren Minimall¨osung, so ist bei geeignetem n ∈ N nach Satz 4.3.4 [n/2]
(4)
p1 =
ν=0
n xn−2ν y12ν (1 + D2 )ν ; 2ν 1
wegen x21 ≡ 0, 1, aber 2 + D2 ≡ 2, 3 (mod 4) ist y1 = 1, also y1 ≥ 2 und damit w¨ urde aus (4) und der Annahme n ≥ 2 folgen n n−2 2 n p1 ≥ x1 + x y1 (1 + D2 ) > 4(1 + D2 ), 2 1 was p1 = 2D2 + 1 widerspricht, vgl. 2(1). Damit ist n = 1, also p1 = x1 nach (4) und schließlich (p1 , q1 ) die Minimall¨ osung.
232
5. Verschiedene Entwicklungen reeller Zahlen
Ist weiter k ≥ 0, so folgt aus 2(1), aus (2) f¨ ur i = 2k − 1, aus (3) und 2(2) f¨ ur i = 2k sowie schließlich aus q1 = 2D √ √ √ dq2k+1 √ = 2D(p2k + dq2k )(p2k−1 − dq2k−1 ) + 1 p2k−1 + dq2k−1 = 2D((p2k−1 p2k − dq2k−1 q2k ) √ + d(p2k−1 q2k − p2k q2k−1 )) + 1 √ = 2D(D + d) + 1 √ = p1 + dq1 . p2k+1 +
√ √ Induktiv folgt hieraus p2k−1 + dq2k−1 = (p1 + dq1 )k f¨ ur k ≥ 1 und nun erh¨ alt man aus 4.3.4 direkt xk = p2k−1 , yk = q2k−1 f¨ ur k ≥ 1, wo (xk , yk ) die in Satz 4.3.4 aufgef¨ uhrten s¨ amtlichen L¨osungen von (1) in N2 sind, wobei jetzt k statt n geschrieben ist. Wie man bei beliebigem, nicht quadratischem d ∈ N vorgeht, entnimmt man den ausf¨ uhrlichen Darlegungen bei Perron [19], §§ 24–26. Die Beweismethode in diesem allgemeinen Fall ist grunds¨atzlich a¨hnlich zu der f¨ ur Satz A, wenngleich technisch deutlich aufwendiger; das Ergebnis sei hier ohne Beweis mitgeteilt als Satz B. Ist d ∈ N kein Quadrat und bezeichnen √ pi , qi den i-ten N¨aherungsz¨ahler, –nenner der Kettenbruchentwicklung von d, deren Periodenl¨ ange h sei, osung so gilt mit m := 12 (3 − (−1)h ): Das Paar (pmh−1 , qmh−1 ) ist die Minimall¨ von (1) und (pmhk−1 , qmhk−1 )k=1,2,... sind s¨ amtliche L¨osungen von (1) in N2 . Offenbar ist m gleich 1 bzw. 2, wenn h gerade bzw. ungerade ist. In Satz A ist insbesondere h = 1. Teilweise wurde Satz B um 1766 herum von Lagrange gefunden; einen vollst¨ andigen Beweis hat aber erst Legendre einige Jahrzehnte sp¨ ater liefern k¨ onnen. Satz B macht besonders sch¨on deutlich, was die Kettenbruchtheorie bei der Untersuchung gewisser diophantischer Gleichungen zu leisten imstande ist.
7. Ann¨ aherung reeller Zahlen durch rationale. Aus 3(1) folgt f¨ ur die N¨ aherungsbr¨ uche pq00 , . . . , pqkk , . . . von α (wobei diese Folge f¨ ur α ∈ Q mit pqkk enden m¨oge) (1)
qi−1 (qi+1 + qi )−1 < |α −
pi −1 | = qi−1 (αi+1 qi + qi−1 )−1 ≤ qi−1 qi+1 , qi
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
233
jedenfalls solange i < k im Falle rationaler α gilt und rechts tritt Gleichheit ein genau f¨ ur α ∈ Q, i = k − 1. Ungleichung (1) bietet eine L¨ osung der in der Praxis oft wichtigen Aufgabe an, eine vorgegebene reelle Zahl α durch rationale Zahlen anzun¨ ahern und den dabei begangenen Approximationsfehler sehr genau zu kontrollieren: Dabei approximiert man hier das vorgegebene α speziell durch die N¨ aherungsbr¨ uche der Kettenbruchentwicklung von α. Die Frage dr¨ angt sich nun nat¨ urlich auf, ob man die oben angesprochene Aufgabe nicht besser durch andere rationale Zahlen als die N¨ aherungsbr¨ uche der zu approximierenden Zahl l¨ osen sollte. In diesem und dem folgenden Abschnitt soll sie in pr¨ azisere Form gefaßt und dann gel¨ ost werden. Dabei werden die Resultate in 8 glatter, wenn man die Ann¨aherung von α durch rationale ab nicht wie in (1) durch |α − ab |, sondern durch |bα − a| mißt, was sogleich geschehen wird. Der nun zu formulierende Hilfssatz enth¨ alt die wichtigsten Mittel, die f¨ ur den Vergleich der Approximation reeller Zahlen durch beliebige rationale Zahlen bzw. durch N¨ aherungsbr¨ uche ben¨otigt werden.
Lemma. (i)
ur alle c ∈ Z, d ∈ N die Ungleichung |qk α − pk | ≤ Bei α ∈ Q hat man f¨ |dα − c| mit Gleichheit genau f¨ ur dc = pqkk (= α).
(ii)
ur α ∈ Q, so hat man f¨ ur alle c ∈ Z, d ∈ N mit d < qk die Gilt qk > 1 f¨ Ungleichung |qk−1 α − pk−1 | ≤ |dα − c| mit Gleichheit genau dann, wenn (c, d) gleich (pk−1 , qk−1 ) bzw. (pk − pk−1 , qk − qk−1 ) ist.
(iii)
Ist α ∈ Q, 0 ≤ i ≤ k − 2, bzw. α ∈ IR \ Q, i ≥ 0, jedoch nicht gleichzeitig i = 0, a1 = 1, so hat man f¨ ur alle c ∈ Z, d ∈ N mit d < qi+1 die ur c = pi , d = qi . Ungleichung |qi α − pi | ≤ |dα − c| mit Gleichheit genau f¨
Bemerkung. Im Fall (ii) ist k ≥ 1 und qk = ak qk−1 + qk−2 ≥ 2qk−1 nach 2(1) und also gen¨ ugen die voneinander verschiedenen Paare (c, d) = (pk−1 , qk−1 ), (pk − pk−1 , qk − qk−1 ) beide der Bedingung 0 < d < qk . Daß u ¨brigens f¨ ur diese beiden Paare in der Ungleichung von (ii) die Gleichheit eintritt, ist wegen qk α = pk einfach zu sehen. Der erste Unterfall in (iii) kann offenbar nur bei k ≥ 2 eintreten; weiter gilt stets qi ≤ qi+1 mit Gleichheit genau f¨ ur (ai+1 − 1)qi + qi−1 = 0, d.h. f¨ ur i = 0, a1 = 1, was in (iii) gerade ausgeschlossen wurde. Unter den Bedingungen von (iii) ist also qi < qi+1 und so kommt hier (pi , qi ) unter den zugelassenen Paaren (c, d) vor.
234
5. Verschiedene Entwicklungen reeller Zahlen
Beweis des Lemmas. W¨ ahrend (i) trivial ist, gewinnt man (ii) und (iii) folgendermaßen. Man betrachtet das System linearer Gleichungen (2)
pi X + pi+1 Y = c,
qi X + qi+1 Y = d,
welches nach 2(2) die Determinante (−1)i+1 hat und also seine L¨osung (x, y) in Z2 . Dabei ist x = 0, weil sonst qi+1 |d aus der zweiten Gleichung (2) folgen w¨ urde, entgegen der einheitlichen Voraussetzung d < qi+1 , wenn man f¨ ur (ii) das Bisherige mit i = k − 1 anwendet. In diesem letztgenannten Fall folgt aus (2) die Gleichung x(qk−1 α − pk−1 ) = pk−1 = α die gew¨ unschte Ungleichung dα − c. Bei |x| ≥ 2 hat man wegen qk−1 |dα−c| > |qk−1 α−pk−1 |. Wegen (2) und 2(2) ist |x| = 1 a¨quivalent zu cqk −dpk = ε mit einem ε ∈ {1, −1}. Diese diophantische Gleichung vom Typ 1.3.3(2) hat nach Satz 1.3.3 genau die L¨osungen (3)
(εc0 + tpk , εd0 + tqk ),
t ∈ Z,
wobei (c0 , d0 ) ∈ Z2 nach 1.3.3(1) gem¨aß c0 qk − d0 pk = 1 zu w¨ ahlen ist, etwa ¨brigens die Bedingung ab = 0 c0 = (−1)k pk−1 , d0 = (−1)k qk−1 nach 2(2). Daß u in Satz 1.3.3 hier erf¨ ullt ist, folgt aus pk = 0; denn aus pk = 0 w¨ urde qk = 1 folgen, also k = 1 (vgl. Bemerkung) und somit a1 = 1, was nicht geht, da das letzte Element des Kettenbruchs einer rationalen, nicht ganzen Zahl stets gr¨oßer als 1 ist. |dα − c| = |qk−1 α − pk−1 | tritt also nach (3) genau f¨ ur die Paare (c, d) der Form (4)
c = ε pk−1 + tpk ,
d = ε qk−1 + tqk
ein, wobei ε ∈ {1, −1}, t ∈ Z so zu w¨ahlen sind, daß 0 < d < qk gilt. Diese letzte Bedingung f¨ uhrt zu t = 0, ε = 1 bzw. t = 1, ε = −1 und so f¨ uhrt (4) zu den beiden in (ii) genannten Paaren (c, d). Im Falle (iii) ist f¨ ur eventuelle (c, d) der Form (λpi , λqi ), λ = 2, 3, . . ., wegen qi α = pi die strenge Ungleichung klar. Sei jetzt also (c, d) von allen (λpi , λqi ), λ = 1, 2, 3, . . ., verschieden, d.h. dc = pqii . Dann gen¨ ugt die L¨osung (x, y) von pi (2) der Bedingung xy < 0. Denn y = 0 w¨ urde zu qi = dc f¨ uhren und xy > 0 w¨are mit x, y > 0 oder x, y < 0 a¨quivalent, was wegen 0 < d < qi+1 beides der zweiten Gleichung in (2) widerspricht. Da qi α − pi und qi+1 α − pi+1 nach 3(1) verschiedenes Vorzeichen haben – man beachte, daß sie auch bei α ∈ Q wegen i ≤ k − 2 beide nicht verschwinden –, folgt aus xy < 0, daß x(qi α − pi ) und y(qi+1 α − pi+1 ) gleiches Vorzeichen haben und so wird nach (2) |dα − c| = |x(qi α − pi ) + y(qi+1 α − pi+1 )| = |x| |qi α − pi | + |y| |qi+1 α − pi+1 | > |qi α − pi |.
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
235
8. Beste N¨ aherungen. Man nennt eine rationale Zahl ab mit a ∈ Z, b ∈ N eine beste N¨aherung f¨ ur α ∈ IR, wenn f¨ ur alle c ∈ Z, d ∈ N mit dc = ab und d ≤ b gilt: |dα − c| > |bα − a|. Mit diesem Begriff kann man behaupten Satz A. Jede beste N¨aherung f¨ ur α ∈ IR ist ein N¨ aherungsbruch von α. Beweis. Es sei ab = pq00 , . . . , pqkk , . . ., wo bei α ∈ Q dieselbe Verabredung wie zu Anfang von 7 getroffen sei. Ist α ∈ Q und qk ≤ b, so nehme c = pk , d = qk ; man erh¨alt damit dc = ab , d ≤ b und 0 = |qk α − pk | = |dα − c| < |bα − a| und so ist ab keine beste N¨aherung f¨ ur α. Sei nun entweder α ∈ IR \ Q oder α ∈ Q habe qk > b. Man fixiert i gem¨aß qi ≤ b < qi+1 und erh¨ alt i < k und 1 < qi+1 = ai+1 qi + qi−1 , also entweder i ≥ 1 oder i = 0, a1 > 1. Nach (ii) und (iii) von Lemma 7 ist |qi α−pi | ≤ |bα−a| wegen b < qi+1 ; w¨ahlt man hier c = pi , d = qi , so ist dc = ab , d ≤ b, |dα − c| ≤ |bα − a| erf¨ ullt und ab ist wieder keine beste N¨aherung f¨ ur α. Das n¨ achste Ergebnis zeigt, daß sich Satz A in weitest m¨ oglichem Maße umkehren l¨ aßt. Satz B. Jeder N¨aherungsbruch von α ∈ IR ist eine beste N¨aherung f¨ ur α, wenn man f¨ ur die α der Form [a0 ; 2], [a0 ; 1, a2, . . . , ak ] mit einem k ≥ 2 bzw. [a0 ; 1, a2 , . . .] von den N¨ aherungsbr¨ uchen nullter Ordnung absieht. In diesen Ausnahmef¨ allen ist der nullte N¨ aherungsbruch tats¨ achlich keine beste N¨aherung f¨ ur α. Beweis. Ist pqii ein N¨ aherungsbruch von α (mit i ≥ 1 in den Ausnahmef¨ allen), so ist f¨ ur alle c ∈ Z, d ∈ N mit dc = pqii , d ≤ qi die Ungleichung |dα − c| > |qi α − pi | zu zeigen. Ist α ∈ Q, so ist dies bei i = k nach Lemma 7(i) in Ordnung. Da im Falle α ∈ Q nicht gleichzeitig k = 1 und ak = 2 gilt, ist qk − qk−1 > qk−1 und so gilt hier das Gew¨ unschte f¨ ur i = k − 1 nach (ii) des Lemmas. Da im Falle α ∈ Q, 0 ≤ i ≤ k − 2 bzw. α ∈ IR \ Q, i ≥ 0 nicht gleichzeitig i = 0, a1 = 1 gilt, folgt jetzt das Gew¨ unschte aus Lemma 7(iii). Im ersten Ausnahmefall α = a0 + 12 ist p0 = a0 , q0 = 1, p1 = 2a0 + 1, q1 = 2, also |q0 α − p0 | = |(q1 − q0 )α − (p1 − p0 )| (= 12 ) nach (ii) und so ist hier pq00 keine beste N¨aherung f¨ ur α. Im zweiten und dritten Ausnahmefall ist α − a0 > p2 −1 −1 − a = (1 + a ) ≥ 12 f¨ ur α ∈ Q bzw. α ∈ Q, k ≥ 3; bei α ∈ Q, k = 2 0 2 q2 p2 −1 ist hier α − a0 = q2 − a0 = (1 + a−1 ≥ 23 wegen a2 ≥ 2. Insgesamt ist in 2 )
236
5. Verschiedene Entwicklungen reeller Zahlen
den letztgenannten Ausnahmef¨allen α − a0 > 12 oder also α − a0 > (a0 + 1) − α ur α ist. (> 0), was zeigt, daß hier erneut pq00 keine beste N¨aherung f¨ Unter Verwendung der in der Fußnote zu 4.3.2 eingef¨ uhrten Bezeichnung · f¨ ur den Abstand zur n¨ achsten ganzen Zahl soll aus Satz B noch gefolgert werden die Proposition. F¨ ur jedes reelle α gilt q0 α ≥ q1 α > . . . > qk α > . . ., wobei diese Ungleichungskette im Falle α ∈ Q, α = pqkk mit dem Gliede qk α = 0 abbricht. Dabei tritt an der einzig m¨ oglichen Stelle Gleichheit ein genau dann, wenn das erste Kettenbruchelement a1 von α gleich 1 ist, was im Falle α ∈ Q nur bei k ≥ 2 vorkommen kann. ur rationales Beweis. Sei α ∈ Z, etwa α = [a0 ; a1 , . . . , ak , . . .] mit einem k ≥ 1 f¨ ur i ≥ 1 eine beste N¨aherung f¨ ur α und so hat man wegen α. Nach Satz B ist pqii f¨ i−1 qi−1 ≤ qi , pqi−1 = pqii die Ungleichung |qi−1 α − pi−1 | > |qi α − pi |; ebensoleicht sieht man |q0 α − (p0 + 1)| ≥ |q1 α − p1 | mit Gleichheit genau dann, wenn a1 = 1 gilt. Dies liefert die Ungleichungskette (1)
Min(|q0 α − p0 |, |q0 α − p0 − 1|) ≥ |q1 α − p1 | > . . . > |qk α − pk | > . . . ,
die gegebenenfalls nach dem (k + 1)–tem Glied abbricht. Nach 7(1) ist mit αi+1 wie in 4 1 |qi α − pi | = (qi αi+1 + qi−1 )−1 ≤ (αi+1 + 1)−1 < 2 f¨ ur i ≥ 1, wenn i < k im Falle eines rationalen α erf¨ ullt ist; daher gilt |qi α−pi | = ur i ≥ 1 stets. Da das Minimum links in (1) gleich q0 α ist, folgt daraus qi α f¨ die Behauptung der Proposition. Die zuletzt bewiesenen S¨atze A und B zeigen, daß — abgesehen von gewissen seltenen, vollst¨andig zu charakterisierenden Ausnahmen — die besten N¨ aherungen f¨ ur eine reelle Zahl α genau deren N¨ aherungsbr¨ uche sind.
9. Anmerkungen dazu. Ist ab eine beste N¨aherung f¨ ur α, so ist nach der anfangs von 8 gegebenen Definition |α − ab | < db |α − dc |, a fortiori also |α − ab | < |α − dc | f¨ ur alle rationalen dc = ab mit d ≤ b. Dies kann man unter Beachtung von Satz 8B in einer f¨ ur das numerische Rechnen sehr wichtigen Weise interpretieren: Ersetzt man α durch seinen i–ten N¨aherungsbruch pqii , i ≥ 1, so ist der dabei begangene Fehler absolut kleiner, als wenn man α durch irgendeine andere rationale Zahl mit Nenner h¨ ochstens qi ersetzt.
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
237
Es sei an dieser Stelle angemerkt, daß die Kettenbruchentwicklung der Zahl π bisher unbekannt ist. Sie beginnt mit [3; 7, 15, 1, 292, . . .] und daher sind 333 355 103993 3, 22 unf N¨ aherungsbr¨ uche von π. W¨ ahrend in 7 , 106 , 113 , 33102 , . . . die ersten f¨ China bereits vor u ¨ber 1500 Jahren 355 als N¨ a herungswert f¨ u r π auftrat, scheint 113 sich etwa gleichzeitig im Abendland, ausgehend von den r¨ omischen Agrimensoren, die Zahl 22 aherung an π verbreitet zu haben. Nach den 7 als sehr gute Ann¨ S¨ atzen 8A und 8B sind die besten N¨ aherungen f¨ ur π genau die N¨ aherungsbr¨ uche von π. So wird klar, warum man keine rationale Zahl mit Nenner unterhalb 8 finden konnte, die die Zahl π so gut approximiert wie eben 22 7 . Bereits 1685 hat Wallis in seinem Tractatus de Algebra unter Benutzung der ersten Ziffern der Dezimalbruchentwicklung von π die ersten 34 Kettenbruchelemente von π berechnet. Seit 2003 sind vom Kettenbruch von π mehr als 108 Anfangselemente bekannt (E.W. Weisstein, http://mathworld.wolfram.com/ PiContinuedFraction.html). Das in 8 besprochene Problem der m¨ oglichst guten Ann¨aherung beliebiger reeller Zahlen durch rationale Zahlen m¨ oglichst kleiner Nenner war historisch sogar die entscheidende Triebfeder zur Entdeckung und Untersuchung des Kalk¨ uls der regelm¨aßigen Kettenbr¨ uche. Wie man n¨ amlich seinen Opuscula Posthuma, Descriptio Automati Planetarii (1703) entnimmt, wurde C. Huygens auf dieses Problem bei der Herstellung eines Zahnradmodells des Sonnensystems gef¨ uhrt. Dabei mußte er die Anzahlen der Z¨ahne in seinem Modell so w¨ahlen, daß ihr Quotient f¨ ur zwei gekoppelte Zahnr¨ader (d.h. der Quotient der Umlaufzeiten dieser beiden R¨ ader) den Quotienten α der Umlaufzeiten der beiden darzustellenden Planeten m¨ oglichst gut ann¨ aherte. Aus technischen Gr¨ unden sollten gleichzeitig die Anzahlen der Z¨ ahne nicht zu groß werden.
10. Approximation algebraischer Zahlen zweiten Grades durch rationale. Die Ann¨ aherung einer beliebigen Zahl α durch solche rationale, die speziell N¨aherungsbr¨ uche sind, wird durch 3(1) kontrolliert. F¨ ur Zahlen α mit geeigneten Voraussetzungen u ¨ber ihre Kettenbruchentwicklung (oder besser noch: Kenntnis derselben) kann durch Kombination von 3(1) mit Lemma 7 die Ann¨ aherung durch beliebige rationale Zahlen angegriffen werden. Ein Beispiel dieser Art liefert der Satz. Ist f¨ ur reelle irrationale α = [a0 ; a1 , a2 , . . .] die Folge (ai )i=1,2,... durch A (≥ 1) beschr¨ankt, so gilt f¨ ur alle p ∈ Z, q ∈ N die Ungleichung p |α − | > (A + 2)−1 q −2 . q Beweis. Sei ein Paar (p, q) wie im Satz beliebig vorgegeben. Man definiere i in
238
5. Verschiedene Entwicklungen reeller Zahlen
eindeutiger Weise durch die Forderung qi ≤ q < qi+1 : es ist daher i ≥ 0 und sogar i ≥ 1, falls a1 = 1 ist. Daher ist nach Lemma 7(iii) und wegen qi−1 ≤ qi |qα − p| ≥ |qi α − pi | > ((ai+1 + 1)qi + qi−1 )−1 ≥ (A + 2)−1 qi−1 , woraus mit qi ≤ q die Behauptung folgt. Bemerkung. F¨ ur die im Satz behandelten α gibt es also eine nur von α abh¨ angige Konstante c(α) > 0, so daß |α− pq | > c(α)q −2 f¨ ur alle rationalen pq gilt. Andererseits hat |α − pq | < q −2 f¨ ur jedes irrationale α unendlich viele rationale L¨ osungen p und so ist die obige Aussage bis auf den Wert von c(α) bestm¨ o glich. q Ein Ergebnis aus der sogenannten metrischen Kettenbruchtheorie besagt, daß f¨ ur fast alle reellen α (im Sinne des Lebesgue–Maßes in IR) die Folge (ai (α))i=1,2,... unbeschr¨ ankt ist, wobei α = [a0 (α); a1 (α), . . .]. Obschon also die Voraussetzung u ¨ber α im obigen Satz fast nie zutrifft, geh¨ort doch eine wichtige Klasse reeller Zahlen sicher zur Ausnahmemenge, nach dem Lagrangeschen Satz 5 n¨ amlich alle reell–quadratischen Zahlen, da ja die Periodizit¨ at der Folge (ai ) deren Beschr¨anktheit impliziert. Somit hat man folgendes Korollar. Zu jeder algebraischen Zahl α zweiten Grades gibt es eine Konstante c(α) > 0, so daß f¨ ur alle rationalen pq gilt p |α − | > c(α)q −2 . q F¨ ur reelle α der genannten Art wurde dies bereits oben gefolgert. Ist α ∈ C \ IR, was im Korollar ja vorkommen kann, so ist trivialerweise und ohne jede arithmetische Voraussetzung an α p |α − | ≥ | Im α| ≥ c(α)q −2 q f¨ ur alle p, q und mit c(α) := | Im α| > 0. Bemerkung. Dies Korollar wird in 6.1.2 durch den Satz von Liouville verallgemeinert.
11. Eine arithmetische Eigenschaft von e2/k . Bisher wurden Kettenbruchentwicklungen nur f¨ ur gewisse reelle algebraische Zahlen h¨ochstens zweiten
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
239
Grades hier explizit angegeben. In 12 soll nun noch diejenige von e abgeleitet werden, eine etwas schwierigere Aufgabe. Dazu betrachtet man vorbereitend f¨ ur n = 0, 1, . . . die folgenden positiven reellen Zahlen 1 1 n 1 1 n+1 (1) ξn := x (1 − x)n e2x/k dx, ηn := x (1 − x)n e2x/k dx n! 0 n! 0 mit fixiertem k ∈ N. Das erste Ziel ist die Herleitung einer zweigliedrigen Rekursionsformel f¨ ur die ξn ; die ηn sind lediglich bequeme Hilfsgr¨oßen. Indem man auf das erste Integral in (1) zun¨ achst partielle Integration anwendet, findet man f¨ ur n ≥ 1 1 2 n!ξn = n (2x − 1)xn−1 (1 − x)n−1 e2x/k dx = n!(2ηn−1 − ξn−1 ), k 0 also 2 f¨ ur n ≥ 1. (2) ξn + ξn−1 = 2ηn−1 k V¨ ollig analog erh¨ alt man aus dem zweiten Integral in (1) durch partielle Integration 2 (2n + 1)ξn = ηn−1 − ηn f¨ ur n ≥ 1. k Eliminiert man hieraus die η’s mittels (2), so bekommt man 2 k (3) (n ≥ 1) ξn+1 + (2n + 1)kξn = ξn−1 k 2 oder a¨quivalent f¨ ur dieselben n kξn−1 2ξn+1 (3 ) = (2n + 1)k + . 2ξn kξn Weiter erh¨alt man aus (1) k 2 2/k k k (4) ξ0 = (e2/k − 1), η0 = e2/k − (e − 1), 2 2 2 was mittels (2), angewandt f¨ ur n = 1, direkt zu k 2 2/k (5) ξ1 = (e + 1 − k(e2/k − 1)) 2 f¨ uhrt. Aus (4) und (5) folgt (e2/k + 1)/(e2/k − 1) = k + (2ξ1 )/(kξ0 ) oder in Kettenbruchschreibweise (e2/k + 1)/(e2/k − 1) = [k; (kξ0 )/(2ξ1 )]. Wendet man hier rechts (3 ) mit n = 1 an, so wird (e2/k + 1)/(e2/k − 1) = [k; 3k, (kξ1)/(2ξ2 )] und schließlich folgt mittels (3 ) induktiv e2/k + 1 = [k; 3k, 5k, 7k, . . .] e2/k − 1 Hieraus kann geschlossen werden auf die (6)
f¨ ur k ∈ N.
240
5. Verschiedene Entwicklungen reeller Zahlen
Proposition Die Zahl e2/k ist f¨ ur kein ganzes k = 0 algebraisch von einem Grade h¨ ochstens zwei. Bemerkung. F¨ ur k = 2 wurde dies bereits in Proposition 2.4B eingesehen. z+1 Beweis. Bei k ∈ N werde z := e2/k und y := z−1 gesetzt. G¨abe es ein nichttriy+1 3 2 are dies wegen z = y−1 mit viales Tripel (a, b, c) ∈ Z mit az + bz + c = 0, so w¨ ∗ 2 ∗ ∗ ∗ ∗ ∗ aquivalent. a y + b y + c = 0, a := a + b + c, b := 2(a − c), c := a − b + c ¨ Nach (6), Satz 3 und dem Lagrangeschen Satz 5 ist y nicht algebraisch von einem Grade h¨ochstens zwei und also folgt a∗ = b∗ = c∗ = 0, was seinerseits zu a = b = c = 0 f¨ uhrt, entgegen der gemachten Annahme. Das Additionstheorem der Exponentialfunktion erlaubt es schließlich, den Fall −k ∈ N auf den soeben abgeschlossenen zur¨ uckzuspielen.
12. Kettenbruchentwicklung von e. F¨ ur k = 2 ergibt sich aus 11(6) e+1 = [2; 6, 10, 14, . . .]. e−1
(1)
Die beiden Kettenbr¨ uche 11(6), (1) sind von Euler 1737 gefunden worden. Es liegt nun nahe zu versuchen, aus 11(6) den Kettenbruch f¨ ur e2/k selbst zu ermitteln. Euler gelang dies 1737 f¨ ur gerade k; der Fall ungerader k konnte erst um die Wende zum 20. Jahrhundert von K.F. Sundman (f¨ ur k = 1) und schließlich Stieltjes (f¨ ur k = 1, 3, 5, . . .) erledigt werden. Die beiden hier unterschiedenen F¨ alle f¨ ur k sind bei Perron [19], Band I, §§ 31, 32 ausf¨ uhrlich dargestellt. Hier soll lediglich noch der Fall k = 2 behandelt werden; d.h. aus (1) soll die Kettenbruchentwicklung f¨ ur e abgeleitet werden. Dazu wird die Eulersche Verfahrensweise angewandt: Durch explizite Berechnung gen¨ ugend vieler Anfangsglieder der Elementenfolge des Kettenbruchs von e hat er diesen erraten und seine Vermutung anschließend mit Hilfe von (1) bewiesen. Behauptet wird (2)
e = [2; 1, 2, 1, 1, 4, 1, 1, 6, 1, . . .].
Zum Beweis setzt man ai := 4i + 2 (i = 0, 1, . . .) und bezeichnet mit pi bzw. qi e+1 die N¨ aherungsz¨ ahler bzw. –nenner des Kettenbruchs [a0 ; a1 , a2 , . . .] = e−1 , vgl. (1). Weiter definiert man (3)
a0 := 2
sowie a3j−2 := 1, a3j−1 := 2j, a3j := 1
(j ≥ 1)
§ 3.
Die regelm¨ aßige Kettenbruchentwicklung
241
und e := [a0 ; a1 , . . .]. Dieser letzte Kettenbruch habe die N¨ aherungsz¨ahler bzw. ur den Beweis von (2) –nenner pi , qi . Wegen (3) und der Definition von e ist f¨ e = e zu zeigen. Kernpunkt dieses Beweises ist die Best¨atigung der Formeln (4)
p3j+1 = pj + qj ,
q3j+1 = pj − qj
f¨ ur j ≥ 0.
Wegen der leicht zu verifizierenden Gleichungen p0 = 2, q0 = 1, p1 = 13, q1 = 6, p1 = 3, q1 = 1, p4 = 19, q4 = 7 gelten (4) f¨ ur j = 0, 1. Sei j ≥ 2 und (4) bereits f¨ ur j − 2 und j − 1 als richtig erkannt. Aus den Rekursionsformeln 2(1) f¨ ur die gestrichenen p’s folgt unter Beachtung von (3) p3j−3 =
p3j−4 + p3j−5 ,
p3j−2 =
p3j−3 + p3j−4 ,
p3j−1 = 2jp3j−2 + p3j−3 , p3j
=
p3j+1 =
p3j−1 + p3j−2 , p3j
+ p3j−1 .
Multipliziert man hier die erste,...,f¨ unfte Gleichung mit 1, −1, 2, 1, 1 und addiert anschließend alles, so erh¨alt man unter Ber¨ ucksichtigung der Induktionsvoraussetzung p3j+1 = (4j + 2)p3j−2 + p3j−5 = (4j + 2)(pj−1 + qj−1 ) + (pj−2 + qj−2 ) = {(4j + 2)pj−1 + pj−2 } + {(4j + 2)qj−1 + qj−2 } = pj + qj . Dabei wurden zuletzt auch die Formeln 2(1) f¨ ur die ungestrichenen p, q ausgen¨ utzt. Somit hat man die erste Behauptung in (4) und die zweite folgt ganz analog. Nach (4) ist p3j+1 = lim e = lim j→∞ q3j+1 j→∞
pj qj pj qj
+1 −1
=
e+1 e−1 e+1 e−1
+1 −1
= e.
Bemerkung. Die Herleitung der arithmetischen Aussagen in diesem und dem letzten Abschnitt benutzte sowohl das Additionstheorem wie die Differentialgleichung der Exponentialfunktion, letztere bei den partiellen Integrationen nach 11(1). Beide Eigenschaften werden wieder eine entscheidende Rolle spielen, wenn in Kap. 6, §§ 3–5 mit analytischen Methoden gewisse mit der Exponentialfunktion zusammenh¨ angende komplexe Zahlen auf Transzendenz untersucht werden. Dort werden sich insbesondere alle Zahlen e2/k , k ∈ Z \ {0}, und damit die in 11(6) als transzendent erweisen. (Vgl. hierzu auch die Anmerkung am Ende von 5 u ¨ber Kettenbr¨ uche algebraischer Zahlen mindestens dritten Grades.)
Kapitel 6. Transzendenz
Hier werden die in Kap. 5 begonnenen arithmetischen Untersuchungen vertieft, indem nicht mehr nur nach Irrationalit¨ at, sondern viel weitergehend nach Transzendenz reeller (und nun auch komplexer) Zahlen gefragt wird. Die ersten beiden Paragraphen bringen dabei die sogenannten Approximationsmethoden. Liouville hat n¨ amlich 1844 entdeckt, daß sich algebraische Zahlen durch rationale nicht zu gut ann¨ ahern lassen. Sein Ergebnis wird zur Konstruktion transzendenter reeller Zahlen in Form geeigneter Kettenbr¨ uche oder g-adischer Reihen benutzt. Sodann werden die sukzessiven Versch¨arfungen des Liouvilleschen Satzes durch Thue, Siegel, Roth und Schmidt diskutiert. Aus diesen Versch¨arfungen werden Folgerungen u ¨ber die Endlichkeit der L¨osungsanzahl gewisser diophantischer Gleichungen gezogen, wobei auch auf Effektivit¨atsfragen eingegangen wird. Die letzten drei Paragraphen sind den analytischen Transzendenzmethoden gewidmet. Dabei werden zun¨ achst in den §§ 3 und 4 die S¨ atze von Hermite, Lindemann und Weierstrass im wesentlichen mit Hermites Methode bewiesen. § 5 bringt den Satz von Gel’fond und Schneider nach der Methode des erstgenannten Autors.
§ 1.
Entdeckung der Transzendenz
1. Historisches. Wie schon in 1.1.9 erw¨ ahnt, war bereits den Griechen die Existenz von (reellen) Zahlen bekannt, die nicht rational sind. Alle ihnen gel¨ aufigen Beispiele f¨ ur solche Zahlen waren jedoch – in moderner Terminologie ausgedr¨ uckt – algebraisch. Die ersten Zahlen, f¨ ur die die Irrationalit¨ at gezeigt werden konnte und die sich (wenn auch erst rund 140 Jahre sp¨ ater) als transzendent erwiesen – wieder in moderner Terminologie –, waren die Zahlen e2/k , k ∈ Z \ {0}. Wie in 5.3.11 gesehen, konnte n¨amlich Euler hier den Irrationalit¨ atsbeweis u ¨ber die regelm¨aßige Kettenbruchentwicklung f¨ uhren.
§ 1.
Entdeckung der Transzendenz
243
Der Begriff der Transzendenz hat sich offenbar w¨ ahrend des 18. Jahrhunderts ganz allm¨ ahlich herausgebildet in dem Maße, wie sich damals die Algebra entwickelt hat. Das Wort transzendent wurde schon 1704 von Leibniz ben¨ utzt (omnem rationem transcendunt), doch scheint selbst Euler noch keine strenge Definition einer transzendenten Zahl besessen zu haben. Gleichwohl hielt er die Existenz solcher Zahlen f¨ ur gesichert, wie man § 105 des ersten Teils seiner Introductio in Analysin Infinitorum (Opera Omnia Ser. 1, VIII; deutscher Nachdruck: Einleitung in die Analysis des Unendlichen, Springer, Berlin etc., 1983) aus dem Jahre 1748 entnehmen kann. Dort behauptete er zum Beispiel, daß bei positivem rationalem a = 1 und nat¨ urlichem b, das keine Quadratzahl √ ist, die Zahl a b nicht nur nicht rational sei, sondern nicht einmal mehr “irrational”. Im heutigen Sprachgebrauch schien er damit die Vermutung aussprechen √ zu wollen, daß a b unter den genannten Bedingungen transzendent sei. Knapp drei Jahrzehnte sp¨ ater, 1775, a¨ußerte dann Euler (Opera Omnia Ser. 1, IV, 136-145) die Meinung, auch die Zahl π sei “irrational”. Bereits 1761 hatte Lambert (Opera Mathematica II, 112–159) einen Euler seinerzeit anscheinend verborgen gebliebenen Beweis f¨ ur die Irrationalit¨ at (im heutigen Sinne) von π gefunden. Lamberts Aufsatz erwies sich jedoch nicht nur wegen des Irrationalit¨ atsbeweises f¨ ur π als wichtig. Vielmehr sprach er dort (§§ 89-91) klar die Vermutung aus, π sei transzendent, und brachte dies in Zusammenhang mit der Unm¨ oglichkeit der Quadratur des Kreises, ein von den Griechen u ¨berkommenes Problem, das jahrhundertelang zu mathematischen Forschungen motiviert hatte. Diese bemerkenswerte Passage lautet bei Lambert: “Dans ce cas, la longueur de l’arc sera une quantit´e transcendante, ce qui veut dire irr´eductible `a quelque quantit´e rationnelle ou radicale, et par l` a elle n’admet aucune construction g´eom´etrique.” Legendre gab 1794 einen weiteren Irrationalit¨ atsbeweis f¨ ur π und f¨ ugte noch einen solchen f¨ ur π 2 hinzu. Er a¨ußerte dann am Ende seiner Untersuchungen die Vermutung, π sei transzendent. Diese wurde jetzt aber nicht mehr in den etwas vagen Worten “irr´eductible `a quelque quantit´e rationnelle ou radicale” von Lambert formuliert, sondern klar und eindeutig in moderner Terminologie: “Il est probable que le nombre π n’est mˆeme pas compris dans les irrationnelles alg´ebriques, c’est-`a-dire, qu’il ne peut ˆetre la racine d’une ´equation alg´ebrique d’un nombre fini de termes dont les coefficients sont rationnels: Mais il paraˆıt tr`es difficile de d´emontrer rigoureusement cette proposition.” W¨ ahrend sich also zu Beginn des 19. Jahrhunderts bei den f¨ uhrenden Arithmetikern der Begriff der Transzendenz einer Zahl gekl¨art hatte, blieb die Frage nach der Existenz solcher Zahlen noch bis 1844 offen. Kurz vorher war es P. Wantzel (J. Math. Pures et Appl. (1) 2, 366-372 (1837)) gelungen, die oben zitierte Behauptung von Lambert u ¨ber den Zusammenhang zwischen Transzendenz von
244
6. Transzendenz
π und Unm¨ oglichkeit der Kreisquadratur streng zu beweisen. Wegen des großen Interesses an diesem ber¨ uhmten geometrischen Problem war damit die Vermutung von Euler, Lambert und Legendre u ¨ber die Transzendenz von π in den Blickpunkt der Mathematiker, vor allem der Zahlentheoretiker ger¨ uckt. Die Existenz transzendenter Zahlen (vgl. auch 5.1.10) konnte erstmals 1844 ¨ von Liouville gesichert werden. Seine entsprechenden Uberlegungen trug er am 13. Mai 1844 auf der Sitzung der Acad´emie des Sciences in Paris vor und vereinfachte sie eine Woche sp¨ater (C. R. Acad. Sci. Paris 18, 883-885, 910911 (1844)). Eine ausf¨ uhrliche Darstellung seines Ergebnisses und einige Anwendungen auf Kettenbr¨ uche bzw. g–adische Reihen findet man in seinem ber¨ uhmten Artikel “Sur les classes tr`es ´etendues de quantit´es dont la valeur n’est ni alg´ebrique ni mˆeme r´eductible `a des irrationnelles alg´ebriques” (J. Math. Pures et Appl. (1) 16, 133-142 (1851)).
2. Der Liouvillesche Approximationssatz besagt, daß sich algebraische Zahlen nicht zu gut durch rationale ann¨ ahern lassen. Er beinhaltet also eine notwendige Bedingung f¨ ur die Algebraizit¨ at einer Zahl, die sich somit unmittelbar als hinreichende Bedingung f¨ ur Transzendenz formulieren l¨ aßt. Liouvillescher Approximationssatz. Zu jedem algebraischen α ∈ C existiert ein effektiv angebbares c = c(α) > 0, so daß f¨ ur alle p, q ∈ Z mit q > 0 und pq = α gilt p |α − | ≥ c(α)q −∂(α) . q Es sei daran erinnert, daß hier ∂(α) den in 1.6.1 definierten Grad von α bedeutet. Beweis. Ist Pα := ad X d + ... + a0 ∈ Z[X] das in 1.6.1 erkl¨ arte ganzzahlige Minimalpolynom von α und d := ∂(α), so hat man Pα ( pq ) = 0 nach Satz 1.6.1 in Verbindung mit Korollar 1.6.2. Deswegen ist klar, daß in p q d Pα ( ) = ad pd + ad−1 pd−1 q + ... + a0 q d q die rechte Seite nicht verschwinden kann, die wegen ihrer Ganzzahligkeit somit absolut mindestens 1 ist. Wegen p p p ai (αi − ( )i ) −Pα ( ) = Pα (α) − Pα ( ) = q q q i=1 d
(1)
p p p = (α − ) ai (αi−1 + αi−2 + ... + ( )i−1 ) q i=1 q q d
§ 1.
Entdeckung der Transzendenz
245
kann man nun wenigstens f¨ ur diejenigen p, q mit 0 < |α − pq | < 1 sagen, daß p | q | < 1 + |α| und also nach (1) auch (2)
d i−1 p p |ai | |α|j (1 + |α|)i−1−j q −d ≤ | − Pα ( )| ≤ |α − | q q i=1 j=0
gilt. Dabei ist der Faktor rechts bei |α − pq | eine reelle Zahl nicht kleiner als 1 genannt sei. Diejenigen p, q mit 1, die alleine von α abh¨ angt und etwa c(α) p 0 < |α − q | < 1 gen¨ ugen damit der Absch¨atzung c(α)q −d ≤ |α − pq |, und f¨ ur die p p −d p, q mit |α − q | ≥ 1 ist a fortiori |α − q | ≥ q . Wegen d = ∂(α) ist damit die Liouvillesche Ungleichung bewiesen; man beachte c(α) ≤ 1. Bemerkung. Wie schon am Ende von 5.3.10 dargelegt, ist auch die Liouville– Ungleichung nur f¨ ur reelle algebraische α interessant. F¨ ur derartige α mit ∂(α) = 2 ist die Aussage des Liouvilleschen Approximationssatzes identisch mit der des Korollars 5.3.10, das sich mit Kettenbruchmethoden ergab. F¨ ur die letztgenannten α ist die Approximationsaussage bestm¨oglich (bis auf den Wert von c(α)); denn nach dem Dirichletschen Approximationssatz 4.3.2 oder nach 5.3.7 hat die Ungleichung |α − pq | < q −2 unendlich viele L¨ osungen (p, q) ∈ Z × N. Weiter ist die in Liouvilles Satz enthaltene Approximationsaussage f¨ ur algebraische α mit ∂(α) = 1 (d.h. rationale α) bestm¨oglich. Ist n¨amlich α = ab mit teilerfremden (a, b) ∈ Z × N, so hat nach den S¨ atzen 1.3.2 und 1.3.3 die lineare diophantische Gleichung aX − bY = 1 unendlich viele L¨ osungen (x, y) ∈ Z2 mit 1 x = 0. Setzt man damit q := |x|, p := y(sgn x), so gilt |α − pq | = | ab − pq | = bq f¨ ur diese unendlich vielen (p, q).
3. Konstruktion transzendenter Kettenbr¨ uche. Sein erstes Beispiel einer transzendenten Zahl konstruierte Liouville in Form eines unendlichen Kettenbruchs α = [a0 ; a1 , a2 , ...]. Nach Satz 5.3.3 sind solche α jedenfalls irrational und f¨ ur seine N¨aherungsbr¨ uche pqii gilt nach 5.3.7(1) die Absch¨ atzung pi −1 −2 |α − qi | < ai+1 qi f¨ ur i = 0, 1, ... . Setzt man voraus, α sei algebraisch, so folgt aus dem Liouvilleschen Satz die Existenz eines c(α) > 0, so daß insbesondere −∂(α) |α − pqii | ≥ c(α)qi f¨ ur i = 0, 1, ... gilt. Kombiniert man beide erhaltenen Ungleichungen miteinander, so sieht man (1)
ai+1 < c(α)−1 qi
∂(α)−2
f¨ ur i = 0, 1, ... .
Ist hier ∂(α) = 2, d.h. α eine reell–quadratische Irrationalzahl, so erweist sich a1 , a2 , ... als beschr¨ankte Folge, ein Ergebnis, das selbstverst¨ andlich durch den Lagrangeschen Satz 5.3.5 deutlich u ¨bertroffen wird.
246
6. Transzendenz
Um nun transzendente Zahlen α in Form von Kettenbr¨ uchen [a0 ; a1 , ..., ] tats¨ achlich zu konstruieren, braucht man offenbar nur f¨ ur das Erf¨ ulltsein der Bedingung lim
(2)
i→∞
log ai+1 =∞ log qi
zu sorgen. Denn dann gibt es zu jedem δ ∈ IR+ unendlich viele i mit ai+1 ≥ qiδ , was in Verbindung mit (1) und der Annahme, α sei algebraisch, die Ungleichung δ ≤ ∂(α) − 2 erzwingt. Andererseits kann δ beliebig groß gew¨ ahlt werden. Nach den Rekursionsformeln 5.3.2(1) f¨ ur die N¨ aherungsnenner ist qi = ai qi−1 +qi−2 ≤ (ai + 1)qi−1 , also induktiv (3)
qi ≤
i
(aj + 1)
f¨ ur i = 0, 1, ... .
j=1
ur alle i = 1, 2, ..., so folgt aus (3) Ist nun g ∈ N, g ≥ 2 und w¨ ahlt man ai := g i! f¨ log qi ≤ i log 2 + (log g)
i
j! ≤ i + i!(log g)
j=1
wenn nur i gen¨ ugend groß ist; dabei hat man
i k
i−1
k! k=0
1 i ≤ 3(log g)i!, k
≥ 1 und anschließend
k!−1
k≥0
= e < 3 verwendet. Diese Absch¨atzung f¨ ur log qi zeigt, daß hier (2) erf¨ ullt ist. Also definieren alle Kettenbr¨ uche [a0 ; g 1!, g 2! , ..., g i!, ...] transzendente Zahlen. angigkeit von An der Bedingung (2) erkennt man ohne weiteres, daß ai+1 in Abh¨ ur qi verantwortlich) f¨ ur gen¨ ugend den a1 , ..., ai (gem¨aß 5.3.2(1) sind genau diese f¨ viele i gen¨ ugend groß sein muß. Dies bedeutet, daß der Kettenbruch gen¨ ugend rasch konvergieren muß, will man seine Transzendenz mittels Liouvilles Satz beweisen.
4. Transzendente g–adische Reihen. Hier sollen transzendente reelle Zahlen in Form geeigneter g–adischer Reihen nach fallenden Potenzen eines festen ganzen g ≥ 2 konstruiert werden. Dazu setzt man zun¨achst voraus, h:N → N sei streng monoton wachsend und gen¨ uge der “L¨ uckenbedingung” lim h(j + j→∞
1)/h(j) > 1; die unendliche Folge γ1 , γ2 , ... ∈ {0, habe unendlich viele ..., g − 1} −h(j) γ g jedenfalls irratiovon Null verschiedene Glieder. Dann ist α := ∞ j=1 j nal; dies sieht man ¨ahnlich wie in 5.1.9 mit dem Irrationalit¨ atskriterium 5.1.5, da die Ziffernfolge seiner g–adischen Entwicklung aufgrund der von h geforderten L¨ uckenbedingung nicht periodisch sein kann. Setzt man nun f¨ ur n = 1, 2, ... (1)
pn :=
n j=1
γj g h(n)−h(j) ,
qn := g h(n) ,
§ 1.
Entdeckung der Transzendenz
247
so ist (2)
0<α−
n ∞ g−1 pn γj g − 1 −i =α− ≤ ≤ g = g 1−h(n+1) . h(j) h(j) h(n+1) qn g g g j=1 j>n i=0
Ist nun α algebraisch, so hat man nach dem Liouvilleschen Approximationssatz bei geeignetem c(α) > 0 f¨ ur dieselben n wegen (1) (3)
α−
pn ≥ c(α)g −∂(α)h(n) ; qn
Kombination von (2) und (3) zeigt dann, daß limn→∞ h(n + 1)/h(n) ≤ ∂(α) gelten muß. Umgekehrt gewendet liefert dies die Proposition. Ist g ∈ N, g ≥ 2, sind in der Folge (γj )j=1,2,... mit allen γj ∈ {0, ..., g − 1} unendlich viele Glieder von Null verschieden und gen¨ ugt die streng monoton wachsende Funktion h:N → N der L¨ uckenbedingung lim h(j + 1)/h(j) = ∞,
j→∞
−h(j) so definiert die g–adische Reihe ∞ eine transzendente Zahl. Z.B. j=1 γj g ∞ −j! transzendent. sind alle j=1 γj g Bemerkungen. 1) Beispiele vom Typ γj 10−j! f¨ ur transzendente Zahlen f¨ uhrte Liouville bereits in seiner ersten Note 1844 auf. Dort findet sich auch die u ¨berraschende Anmerkung: “Je crois me souvenir qu’on trouve un th´eor`eme de ce genre dans une lettre de Goldbach a` Euler; mais je ne sache pas que la d´emonstration en ait jamais ´et´e donn´ee.” ¨ 2) Mit den auf Cantor zur¨ uckgehenden Uberlegungen in 5.1.10, die dort zum Beweis von Satz A gef¨ uhrt haben, kann man leicht einsehen, daß es sogar u ¨berabz¨ahlbar viele transzendente Zahlen des Typs γj 10−j! gibt. In diesem Zusammenhang ist auch interessant, daß die Menge derjenigen reellen Zahlen, deren Transzendenz man aufgrund des Liouvilleschen Approximationssatzes erkennen kann, vom Lebesgueschen Maß Null ist. j 3) Ist k ∈ N, k ≥ 2 und sind g und die γj wie in der Proposition, so ist γj g −k nicht algebraisch von einem Grad kleiner als k. Dies gibt die Betrachtung nach (3) noch her, aber mehr die Transzendenz; dazu konvergieren diese Reihen nicht gegen¨ uber den γj g −j! schon zu langsam. (Man k¨ onnte aber nat¨ urlich auch sagen, der Liouvillesche Approximationssatz ist daf¨ ur zu schwach, vgl. § 2.)
248 § 2.
6. Transzendenz
Sch¨ arfere Approximationss¨ atze
1. Der Thue–Siegel–Rothsche Satz. Hier wird die Schilderung der historischen Entwicklung der Transzendenzmethoden und ihrer Ergebnisse in der zweiten H¨alfte des 19. Jahrhunderts zun¨ achst unterbrochen. W¨ ahrend dieser Programmpunkt im n¨ achsten Paragraphen nachgeholt werden wird, soll erst u ¨ber Versch¨arfungen des Liouvilleschen Approximationssatzes berichtet werden. Dazu definiert man f¨ ur festes ganzes d ≥ 2 die reelle Zahl K(d) als das Infimum aller reellen κ, so daß f¨ ur jedes reelle algebraische α mit ∂(α) = d die Ungleichung (1)
p |α − | < q −κ q
h¨ ochstens endlich viele L¨osungen (p, q) ∈ Z × N hat. Da (1) f¨ ur κ = 2 nach 4.3.2 oder 5.3.7 unendlich viele derartige L¨ osungen hat, ist klar, daß man K(d) ≥ 2 f¨ ur d = 2, 3, . . . hat. Andererseits ist K(d) ≤ d f¨ ur dieselben d. Denn w¨ are K(d) > d f¨ ur ein solches d, so w¨ahle man ε ∈ IR+ so klein, daß auch noch osungen K(d) > d + ε erf¨ ullt ist. Dann hat |α − pq | < q −d−ε unendlich viele L¨ p −d (p, q) wie bei (1), f¨ ur die aber |α − q | ≥ c(α)q nach dem Liouvilleschen Satz gelten muß, also q ε < c(α)−1 , was nur f¨ ur endlich viele q ∈ N sein kann. Wegen |p| − |α|q ≤ |αq − p| < q 1−d−ε ≤ 1 k¨onnen dann zu jedem dieser endlich vielen q auch nur endlich viele p ∈ Z geh¨oren. Damit hat man 2 ≤ K(d) ≤ d f¨ ur alle d = 2, 3, . . ., insbesondere K(2) = 2. F¨ ur d ≥ 3 stellt sich jedoch die Frage der weiteren Versch¨arfung der oberen Schranke f¨ ur K(d). Den ersten großen Durchbruch in dieser Richtung erzielte Thue (Selected Mathematical Papers, 232–253) im Jahre 1909, der K(d) ≤ 12 d + 1 beweisen konnte. Zw¨olf Jahre sp¨ater stieß C.L. Siegel (Gesammelte Abhandlungen I, 6–46) in neue Bereiche vor, indem er die Thuesche Schranke auf √ ucken konnte; bei großem d ist der Gewinn geK(d) ≤ 2 d − 1 herunterdr¨ gen¨ uber Thue betr¨ achtlich. Nach einer ganzen Reihe von geringf¨ ugigen weiteren Verbesserungen bewies erst K.F. Roth (Mathematika 2, 1–20 (1955)) die von Siegel ausgesprochene Vermutung K(d) = 2 f¨ ur alle d = 2, 3, . . .. F¨ ur diese Leistung wurde Roth auf dem Internationalen Mathematiker–Kongreß in Edinburgh 1958 mit einer Fields–Medaille ausgezeichnet. Das Rothsche Ergebnis, dessen Beweis hier nicht gegeben werden kann, wird in a¨quivalenter Weise formuliert und seiner Entstehungsgeschichte wegen zitiert als Satz von Thue–Siegel–Roth. Zu jeder algebraischen Irrationalzahl α und zu jedem κ > 2 existiert eine Konstante c(α, κ) > 0, so daß f¨ ur alle (p, q) ∈ Z×N
§ 2.
Sch¨ arfere Approximationss¨ atze
249
gilt (2)
p |α − | ≥ c(α, κ)q −κ . q
Denn nach Roths Resultat in der zuerst gegebenen Fassung gilt bei beliebigem κ > 2 wegen (1) die Ungleichung |α − pq | ≥ q −κ f¨ ur alle (p, q) bis auf h¨ ochstens endlich viele und diese m¨ oglichen Ausnahmen f¨ uhren dann zum Faktor c(α, κ) rechts in (2). Wenn umgekehrt (2) f¨ ur alle (p, q) erf¨ ullt ist, zeigt man ebenso leicht, daß |α − pq | < q −κ bei κ > κ nur endlich oft gelten kann, und so erh¨ alt man Roths Ergebnis in der zuerst zitierten Version zur¨ uck. 2. Anwendungen auf Transzendenz. Da der Thue–Siegel–Rothsche Approximationssatz f¨ ur reell–algebraische α mit ∂(α) ≥ 3 wesentlich sch¨arfer als der Liouvillesche aus 1.2 ist, wird man von ihm neue Anwendungen erwarten. So bekommt man z.B. als Versch¨arfung der Proposition 1.4 die daß die L¨ uckenbeProposition A. Sind g, (γj ), h wie in Proposition 1.4, nur−h(j) dingung jetzt limj→∞ h(j+1)/h(j) > 2 laute, so ist ∞ γ g transzendent. j j=1 −kj γ g mit ganzen k ≥ 3 transzendent. Z.B. sind alle ∞ j j=1 Beweis. Man u ¨bernimmt 1.4(1) und 1.4(2), ersetzt jedoch 1.4(3) nach der Annahme, α := γj g −h(j) sei algebraisch, gem¨aß 1(2) durch die Rothsche Ungleichung pn α− ≥ c(α, κ)g −κh(n) . qn Kombination dieser unteren Absch¨ atzung f¨ ur α − pqnn mit der oberen aus 1.4(2) f¨ uhrt nach Logarithmieren zu limn→∞ h(n + 1)/h(n) ≤ κ. Da κ aber im Thue– Siegel–Rothschen Satz beliebig oberhalb 2 gew¨ahlt werden kann, hat man den gew¨ unschten Konflikt mit der neuen L¨ uckenbedingung erreicht. Zu der in der Proposition genannten Anwendung vergleiche man Bemerkung 3 in 1.4. ∞ j Bemerkungen. 1) Die Transzendenz der Reihe j=1 γj g −2 kann offenbar nicht mehr aus dem Thue–Siegel–Rothschen Satz in der vorliegenden Form geschlossen werden. Es gelang jedoch der Nachweis einer Variante, bei der 1(2) schon bei beliebigem κ > 1 gilt, aber nur noch f¨ ur alle (p, q) ∈ Z × N, bei denen q nur Primfaktoren aus einer festen endlichen Menge hat. Diese Version kann nat¨ urlich auf die (pn , qn ) aus 1.4(1) angewandt werden. Einen Beweis der zitierten Variante, die den Thue–Siegel–Rothschen Satz 1 umfaßt, findet der Leser etwa bei T. Schneider [27]. 2) Dieselbe Variante gestattet u ¨brigens auch den Nachweis der Transzendenz des in 5.1.9 erw¨ ahnten Mahlerschen Dezimalbruchs 0, 12345 . . ., ja aller dortigen α(g).
250
6. Transzendenz
Proposition B. Sind g, (γj ), h wie in Proposition A, nur daß die L¨ ucken(h(j + 1) − 2h(j)) = ∞ abgeschw¨ a cht sei. Dann bedingung jetzt auf lim j→∞ −h(j) definieren die Reihen γ g transzendente reelle Zahlen, f¨ u r die die j j≥1 Folge der Kettenbruchelemente unbeschr¨ a nkt ist. Insbesondere trifft dies f¨ ur −j! −kj g und g f¨ ur k = 3, 4, . . . zu. Beweis. Daß die L¨ uckenbedingung in Proposition A die hier verlangte impliziert, ist klar; daß die Umkehrung nicht gilt, zeigt h(j) := 2j j. Die Transzendenz der Reihen ergibt sich aus der in obiger Bemerkung 1 zitierten Version des Thue– Siegel–Rothschen Satzes. Ist α := j≥1 γj g −h(j) = [a0 ; a1 , a2 , . . .], so sieht man die Unbeschr¨ anktheit von (ai )i≥1 wie folgt: Man ordne jedem j ∈ N mit g h(j) ≥ a1 das kleinste i = i(j) ∈ N0 zu, so daß g h(j) < qi+1 gilt; dann ist qi ≤ g h(j) und i ≥ 1. (Denn i = 0 w¨ urde g h(j) < q1 = a1 implizieren; nat¨ urlich ist qi bzw. pi der i–te N¨aherungsnenner bzw. –z¨ ahler des Kettenbruchs von α.) Damit ist Lemma 5.3.7(iii) anwendbar und man hat, in Verbindung mit 5.3.7(1), f¨ ur alle (c, d) ∈ Z × N mit d < qi+1 wegen αi+1 := [ai+1 ; ai+2 , . . .] die Ungleichungskette (1)
c qi−1 (ai+1 + 2)−1 < (αi+1 qi + qi−1 )−1 = |qi α − pi | ≤ d|α − |. d
Wendet man dies an mit c := jk=1 γk g h(j)−h(k) , d := g h(j) , vgl. 1.4(1) nach ¨ leichter Anderung der Bezeichnungsweise, so liefern 1.4(2) und (1) qi−1 (ai+1 + 2)−1 < g h(j)+1−h(j+1) , also wegen qi ≤ g h(j) g h(j+1)−2h(j)−1 < ai(j)+1 + 2. Die L¨ uckenbedingung an h hat dann die Unbeschr¨ anktheit von (ai ) zur Folge.
Bemerkungen. 3) Seit 1979 sind einige Originalarbeiten erschienen, in denen die Kettenbruchentwicklung von Reihen der Form j≥1 g −h(j) mit h : N → N und dj := h(j + 1) − 2h(j) ≥ 0 f¨ ur alle gen¨ ugend großen j explizit angegeben werden konnte. Hierher geh¨oren insbesonderedie in Proposition B genannten j Beispiele, aber auch die dort fehlende Reihe j≥1 g −2 , bei der die Folge der Kettenbruchelemente tats¨achlich beschr¨ankt ist. Als ein Beispiel sei vorgestellt j≥1
j
2−2 = [0; 3, 6, 4, 4, 2, 4, 6, 4, 2, 6, 4, 2, 4, 4, 6, . . .],
§ 2.
Sch¨ arfere Approximationss¨ atze
251
wobei alle a2 , a3 , . . . ∈ {2, 4, 6} nach einem explizit angebbaren (sicher nicht ¨ periodischen) Muster auftreten. Ubrigens ist die Folge der Kettenbruchelemente ankt ist, vgl. etwa J.O. Shallit (J. Number stets beschr¨ankt, wenn (dj ) beschr¨ Theory 11, 209–217 (1979); 14, 228–231 (1982)). 4) Die Zahlen in 3) geh¨ oren zu den ganz seltenen Beispielen von reellen (transzendenten) Irrationalzahlen, f¨ ur die man sowohl die g–adische Entwicklung (wenigstens f¨ ur das in der Definition durch die Reihe verwendete g) als auch die regelm¨aßige Kettenbruchentwicklung kennt. Das erste solche Beispiel fand wohl ¨ hmer (Math. Ann. 96, 367–377 (1927)). P.E. Bo
3. Thue–Gleichung und Roths Verallgemeinerung. Die wichtigsten Anwendungen der Verbesserungen, die vor allem Thue, Siegel und Roth am Liouvilleschen Satz angebracht haben, liegen sicher viel mehr im Bereich der diophantischen Gleichungen als der Transzendenz. Daher soll im n¨ achsten Abschnitt gezeigt werden, wie man aus dem Approximationssatz 1 ableiten kann folgenden Satz von Roth u ¨ ber diophantische Gleichungen. Sei f ∈ Z[Z], vom Grad d ≥ 3, u ¨ber Q irreduzibel und es werde F (X, Y ) := Y d f ( X Y ) gesetzt; G ∈ Z[X, Y ] habe einen Gesamtgrad h¨ ochstens d−3. Dann hat die diophantische Gleichung (1)
F (X, Y ) = G(X, Y )
h¨ ochstens endlich viele L¨osungen in Z2 . Hierin enthalten ist folgendes Resultat u ¨ber die sogenannte Thuesche Gleichung, welche Thue 1909 aus seiner in 1 zitierten Versch¨arfung des Liouvilleschen Satzes abgeleitet hat. Die Thue–Gleichung ist gerade der Spezialfall eines konstanten Polynoms G von Roths Gleichung (1). Korollar. Gen¨ ugen f , d und F den Bedingungen des vorstehenden Satzes und ist m ∈ Z beliebig, so hat die Thue–Gleichung (2)
F (X, Y ) = m
h¨ ochstens endlich viele L¨osungen in Z2 . Beispiel. Ist p ≥ 5 eine Primzahl, so hat die diophantische Gleichung X p−1 + X p−2 Y + . . . + Y p−1 = G(X, Y )
252
6. Transzendenz
nach dem Rothschen Satz h¨ochstens endlich viele L¨osungen in Z2 , wenn der Gesamtgrad von G ∈ Z[X, Y ] h¨ ochstens p − 4 ist. Dies ergibt sich aus der ¨ber Q, die man am einfachsten aus Irreduzibilit¨ at von Z p−1 + Z p−2 + . . . + 1 u dem Eisensteinschen Kriterium ableitet. Bemerkung. Die Pell–Gleichung X 2 − DY 2 = 1 hat, wie in 4.3.3 gesehen, in Z2 unendlich viele verschiedene L¨osungen und ist wegen der Irreduzibilit¨ at von Z 2 − D, D ∈ N kein Quadrat, vom Typ der Thue–Gleichung (2), allerdings mit d = 2. Dies zeigt, daß die Bedingung d ≥ 3 bei der Thue–Gleichung im allgemeinen nicht weiter abgeschw¨acht werden kann.
4. Reduktion auf den Thue–Siegel–Rothschen Satz. Zun¨ achst u ¨berlegt sich der Leser leicht, daß es zum Beweis der Endlichkeit der L¨osungsanzahl von 3(1) ausreicht, nur solche L¨ osungen von 3(1) zu beachten, f¨ ur die gilt (1)
y>0
|x| ≤ y.
und
Ist jetzt
G(X, Y ) =
mk X k Y
und
M :=
k,≥0 k+≤g
|mk |,
k,≥0 k+≤g
so hat man f¨ ur jede (1) gen¨ ugende L¨ osung (x, y) von 3(1) die Absch¨ atzung |G(x, y)| ≤ M y g .
(2) Gilt nun f¨ ur f die Zerlegung (3)
f (Z) = a ·
d
(Z − ζj ),
a ∈ Z \ {0},
j=1
mit algebraischen ζj , die nach Korollar 1.6.2 wegen der Irreduzibilit¨ at von f paarweise verschieden und s¨amtliche vom Grade d (≥ 3) sind, so gilt wegen (2) f¨ ur jede (1) gen¨ ugende L¨ osung (x, y) von 3(1) (4)
d j=1
|x − ζj y| ≤ |a|
d
|x − ζj y| ≤ M y g .
j=1
F¨ ur jedes der gerade genannten (x, y) gilt daher |x − ζj y| ≤ M 1/d y g/d f¨ ur mindestens ein j ∈ {1, . . . , d}.
§ 2.
253
Sch¨ arfere Approximationss¨ atze
Macht man nun die Annahme, 3(1) h¨ atte unendlich viele (1) gen¨ ugende L¨osungen (x, y), so w¨ urde es also mindestens einen Index I ∈ {1, . . . , d} geben, f¨ ur den die Ungleichung |x − ζI y| ≤ M 1/d y g/d noch immer f¨ ur unendlich viele der vorigen (x, y) ∈ Z × N gilt. Bei j = I ist f¨ ur dieselben (x, y) (5)
|x − ζj y| = |(ζI − ζj )y + (x − ζI y)| ≥ c1 y − M 1/d y g/d ≥
1 c1 y 2
mit c1 := Mini=j |ζi − ζj | > 0, wenn man noch y ≥ ( c21 )d/(d−g) M 1/(d−g) =: c2 M 1/(d−g) verlangt und g < d beachtet. (Im Rothschen Satz ist sogar g ≤ d − 3 vorausgesetzt, was im Moment aber noch nicht voll ausgenutzt zu werden braucht.) Wegen (4) und (5) ist f¨ ur unendlich viele (1) und (6)
y ≥ c2 M 1/(d−g)
gen¨ ugende L¨osungen (x, y) von 3(1) 1 ( c1 y)d−1 |x − ζI y| ≤ M y g , 2 also (7)
|ζI −
(2/c1 )d−1 M x |≤ . y y d−g
Nach dem Thue–Siegel–Rothschen Satz 1 ist jedoch f¨ ur alle (x, y) ∈ Z × N (8)
|ζI −
c(ζI , κ) x |≥ , y yκ
wobei κ fest ist (und gr¨oßer als 2). Kombination von (7) und (8) zeigt (9)
y d−g−κ ≤
(2/c1 )d−1 M, c(ζI , κ)
immer noch f¨ ur unendlich viele verschiedene y ∈ N. Ist d > g + κ, so hat man die Annahme im Anschluß an (4) zu einem Widerspruch gef¨ uhrt. Da Roth g ≤ d − 3 voraussetzt und κ = 2 + ε mit ε ∈]0, 1[ nehmen kann, ist g + κ ≤ d − 1 + ε < d bei seinen Voraussetzungen u ¨ber G erf¨ ullt.
254
6. Transzendenz
Bemerkung. Da Thue mit κ = 12 d + 1 + ε aus seinem Approximationssatz auskommen mußte, hatte er g < 12 d − 1 vorauszusetzen; in den F¨allen d = 3, 4 zwang dies dazu, konstante Polynome G zu nehmen, wie dies im Korollar geschehen ist. Offenbar ist g + κ < d mit dem Liouvilleschen Satz u ¨berhaupt nicht einzurichten, da nach ihm keine bessere Wahl als κ = d m¨oglich ist.
5. Effektivit¨ atsfragen. Die in 4 durchgef¨ uhrte Reduktion des Satzes 3 von Roth u ¨ber diophantische Gleichungen auf seinen Approximationssatz 1 hat nebenbei ergeben (vgl. 4(1) und 4(9)), daß jede L¨ osung (x, y) ∈ Z2 der diophantischen Gleichung 3(1) bei g + κ < d der Absch¨ atzung (1)
|x|, |y| ≤ ( Min c(ζj , κ))−1/(d−g−κ) ( 1≤j≤d
2 (d−1)/(d−g−κ) 1/(d−g−κ) ) M c1
gen¨ ugt, wobei d/(d − g) < (d − 1)/(d − g − κ) beachtet wurde ebenso wie die Tatsache, daß o.B.d.A. c1 ≤ 2 und c(ζj , κ) ≤ 1 f¨ ur alle j = 1, . . . , d vorausgesetzt werden darf. Hier ist c1 alleine vom Polynom f im Rothschen Satz abh¨ angig und effektiv angebbar. Da g ≥ 0 bei G = 0 ist, mußte zur Befriedigung der Bedingung g + κ < d das κ kleiner als d gew¨ahlt werden, was mit dem (effektiven) Liouvilleschen Approximationssatz unm¨ oglich ist. Die sch¨arferen Approximationss¨ atze von Thue, Siegel und Roth gestatten dann zwar immer kleinere Wahlen von κ im Intervall ]2, d[ , jedoch waren ihre Beweise prinzipiell ineffektiv, d.h. die in 1(2) eingehende Konstante c(α, κ) und damit der erste Faktor rechts in (1) sind nicht effektiv angebbar. Somit besagt (1) zwar die Endlichkeit der Anzahl der L¨ osungen von 3(1); es gelingt auf diesem Wege aber nicht, zu vorgegebener Gleichung 3(1) eine nur von dieser abh¨ angige Schranke S > 0 explizit zu bestimmen, so daß |x|, |y| ≤ S f¨ ur alle ihre L¨ osungen (x, y) gilt, und damit einen L¨osungsalgorithmus f¨ ur 3(1) zu erhalten. In dieser Richtung konnte man aber entscheidende Fortschritte erzielen, nachdem A. Baker 1966/8 seine neue analytische Methode publiziert hatte, zu der in 5.9 noch einige Worte gesagt werden sollen. Nach Vorarbeiten von Baker hat N.I. Fel’dman (Izv. Akad. Nauk SSSR, Ser. Mat. 35, 973–990 (1971)) mit dessen (effektiver) Methode bewiesen die Proposition. Zu jeder algebraischen Zahl α mit ∂(α) ≥ 3 gibt es effektiv angebbare, nur von α abh¨ angige positive Konstanten c(α), λ(α), so daß f¨ ur alle (p, q) ∈ Z × N gilt p |α − | ≥ c(α)q λ(α)−∂(α) . q Verwendet man dieses Resultat in 4 anstelle des Thue–Siegel–Rothschen
§ 2.
Sch¨ arfere Approximationss¨ atze
255
Satzes, so kann man dort κ := d − λ mit λ := Min1≤j≤d λ(ζj ) w¨ahlen und erh¨ alt d − g − κ = λ − g. Da λ > 0 im allgemeinen sehr klein ausf¨allt, hat man zur Erf¨ ullung von d > g + κ sogleich g = 0 zu nehmen, d.h. man wird auf die Thue–Gleichung 3(2) beschr¨ ankt. Die rechte Seite in (1) wird dann mit den sich aus der Proposition ergebenden effektiven c(ζj ) ∈]0, 1] und dem m aus 3(2) zu 2 ( Min c(ζj ))−1/λ ( )(d−1)/λ |m|1/λ =: c|m|1/λ . 1≤j≤d c1 Damit hat man folgende Versch¨ arfung von Korollar 3 gewonnen. Satz. Sei f ∈ Z[Z], vom Grade d ≥ 3, u ¨ber Q irreduzibel und es werde F (X, Y ) := Y d f ( X ) gesetzt. Dann gibt es effektiv angebbare, nur von f Y abh¨ angige positive Konstanten c und μ, so daß jede L¨ osung (x, y) ∈ Z2 der Thue–Gleichung F (X, Y ) = m (m ∈ Z) der Bedingung |x|, |y| ≤ c|m|μ gen¨ ugt. Bemerkung. Das zehnte der in 3.2.13 angesprochenen Hilbertschen Probleme ¨ stellte unter der Uberschrift Entscheidung der L¨ osbarkeit einer diophantischen Gleichung folgende Aufgabe: “Eine diophantische Gleichung mit irgendwelchen Unbekannten und mit ganzen rationalen Zahlenkoeffizienten sei vorgelegt: Man soll ein Verfahren angeben, nach welchem sich mittels einer endlichen Anzahl von Operationen entscheiden l¨ aßt, ob die Gleichung in ganzen rationalen Zahlen l¨ osbar ist.” Versteht man unter dem von Hilbert gew¨ unschten “Verfahren” einen Algorithmus in heute pr¨ azisiertem Sinne, so k¨onnte man sein zehntes Problem folgendermaßen formulieren: Existiert ein Algorithmus, der f¨ ur ein gegebenes Polynom P ∈ Z[X1 , . . . , Xn ] stets eine Entscheidung liefert, ob die Gleichung P (X1 , . . . , Xn ) = 0 eine L¨osung in Zn hat oder nicht? Anfang 1970 hat YU.V. Matijasevic (Dokl. Akad. Nauk SSSR 191, 279–282 (1970)) dieses Problem negativ entschieden. Dem widerspricht nat¨ urlich nicht, daß man f¨ ur spezielle polynomiale Gleichungen, wie etwa nach dem letzten Satz f¨ ur die Thue–Gleichung, einen Algorithmus besitzt, wie ihn sich Hilbert gew¨ unscht hat.
6. Schmidts S¨ atze u ¨ ber simultane Approximation. Die letzten Abschnitte sollten einen kleinen Einblick in die vielf¨ altigen Konsequenzen des Thue– Siegel–Rothschen Satzes 1 geben, der die mit Liouville 110 Jahre vorher begonnenen Untersuchungen der Approximation einer algebraischen Zahl durch rationale zu einem gewissen Abschluß gebracht hatte. Dieser Bericht w¨are aber nicht vollst¨ andig, w¨ urde man die fundamentalen Arbeiten von W.M. Schmidt
256
6. Transzendenz
u ¨ber simultane Approximation algebraischer Zahlen unerw¨ ahnt lassen. Zwei seiner wichtigsten Ergebnisse k¨onnen unter der gemeinsamen Voraussetzung (die ¨ber auch f¨ ur die Korollare A und B gilt), daß 1, α1 , . . . , αn reelle algebraische, u Q linear unabh¨ angige Zahlen sind und daß ε eine beliebige positive reelle Zahl ist, wie folgt formuliert werden: Satz A von Schmidt.
Es gibt h¨ ochstens endlich viele q ∈ N mit
(1)
q 1+ε α1 q · . . . · αn q < 1.
Satz B von Schmidt.
Es gibt h¨ ochstens endlich viele (q1 , . . . , qn ) ∈ Zn mit
(2)
0 < |q1 · . . . · qn |1+ε α1 q1 + . . . + αn qn < 1.
Korollar A. Es gibt h¨ ochstens endlich viele (p1 , . . . , pn , q) ∈ Zn × N mit (3)
|αi −
1 pi | < q −1− n −ε q
f¨ ur i = 1, . . . , n.
Korollar B. Es gibt h¨ ochstens endlich viele (p, q1 , . . . , qn ) ∈ Zn+1 mit 0 und (4)
qi2 >
( Max |qi |)n+ε |α1 q1 + . . . + αn qn − p| < 1. 1≤i≤n
¨ Als leichte Ubung m¨ oge der Leser Korollar A (bzw. B) aus Satz A (bzw. B) ableiten. Bemerkungen. 1) Wie aus dem in Bemerkung 1 zu 4.3.2 angesprochenen allgemeinen Dirichletschen Approximationssatz hervorgeht, sind alle vier Resultate von Schmidt bestm¨oglich bis auf das jeweilige ε in den Exponenten. 2) Im Falle n = 1 reduzieren sich alle vier Resultate auf den (Thue-Siegel-) Rothschen Satz in der Version bei 1(1) mit κ = 2+ε. Beide S¨atze von Schmidt sind Konsequenzen seines “Teilraumsatzes”, den man z.B. in seiner Monographie [26] findet. Zum Beweis wurden den von Roth entwickelten Ideen zahlreiche neue hinzugef¨ ugt, vornehmlich aus der sogenannten Geometrie der Zahlen.
§ 3.
Die S¨ atze von Hermite, Lindemann und Weierstraß
257
3) Die Schmidtschen S¨ atze fanden bisher Anwendungen auf Transzendenzfragen ebenso wie auf diophantische Gleichungen. Das letztere — sicher weit bedeutendere — Anwendungsgebiet beinhaltet geeignete Verallgemeinerungen der Thue–Gleichung 3(2).
§ 3.
Die S¨ atze von Hermite, Lindemann und Weierstraß
1. Historisches. Wie im ersten Paragraphen gesehen, wurde 1844 die bis dahin offene Frage nach der Existenz transzendenter reeller Zahlen in konstruktiver Weise positiv entschieden. Mit dem Liouvilleschen Approximationssatz ebenso wie mit seinen Versch¨arfungen und Verallgemeinerungen von Thue, Siegel, Roth und Schmidt gelang es bis heute aber “nur”, die Transzendenz von solchen reellen Zahlen nachzuweisen, die durch gen¨ ugend rasch konvergente Grenzprozesse definiert sind, etwa durch gewisse Reihen oder Kettenbr¨ uche, wie dies in den Anwendungen in 1.3, 1.4 und 2.2 zum Ausdruck kam. Z.B. konver giert die Reihe n≥0 n!−1 f¨ ur e bei weitem nicht schnell genug, um auf diesem Wege die Transzendenz von e mit Hilfe eines bisher bekannten Approximationssatzes einsehen zu k¨onnen. Wie aber am Ende von 1.1 erw¨ ahnt, war w¨ ahrend der ersten H¨alfte des 19. Jahrhunderts das Interesse an der Frage nach der Transzendenz von π und anderer “in der Natur vorkommender” Konstanten aus Analysis, Geometrie und weiteren mathematischen Teildisziplinen erwacht. Die erste Zahl dieser Art, bei der der Transzendenznachweis gelang, war die Eulersche Zahl e. Dies war Hermites epochale Leistung im Jahre 1873. Nur wenig sp¨ ater, 1882, konnte Lindemann den Hermiteschen Ansatz so ausbauen, daß sich auch ein Beweis der Vermutung von Euler, Lambert und Legendre u ¨ber die Transzendenz von π ergab: Damit war gleichzeitig die alte Frage nach der Quadratur des Kreises negativ entschieden. Hermites Arbeit Sur la fonction exponentielle wurde in vier kurzen Noten (Oeuvres III, 150–181) publiziert. Aus heutiger Sicht kann man sagen, daß sich diese Arbeit, in der erstmals analytische Schlußweisen in die Transzendenzuntersuchungen eingef¨ uhrt wurden, als bis zum Jahre 1929 wichtigster Beitrag zu diesem neuen Teilgebiet der Zahlentheorie herausstellte. Als zentrales analytisches, wenngleich mathematisch u ¨beraus einfaches Hilfsmittel der Hermiteschen Methode hat sich die f¨ ur beliebige Polynomfunktionen ϕ und komplexe Zahlen u, v g¨ ultige Gleichheit
v
u
e−t ϕ(t) dt = e−u Φ(u) − e−v Φ(v),
Φ(t) :=
k≥0
ϕ(k) (t)
258
6. Transzendenz
erwiesen. Man bezeichnet diese als Hermitesche Identit¨at und best¨ atigt sie leicht durch sukzessive partielle Integrationen. Sie war historisch der entscheidende Ansatzpunkt f¨ ur die Beweise der in 2 und 3 zu formulierenden arithmetischen S¨ atze u ¨ber Werte der Exponentialfunktion an algebraischen Argumentstellen. Die Beweise dieser S¨atze sind in den seit den Originalarbeiten von Hermite, Lindemann sowie Weierstrass (vgl. 3) vergangenen 125 Jahren stark vereinfacht worden. Alleine vor 1900 entstanden mindestens 15 Publikationen bedeutender Mathematiker, in denen Beweisvarianten, Vereinfachungen und Verallgemeinerungen der Ergebnisse von Hermite und Lindemann ver¨ offentlicht wurden. Was die erw¨ ahnten Varianten und Vereinfachungen betrifft, kann der Leser auf die vergleichende Analyse im 36–seitigen Anhang Classical Proofs of the Transcendency of e and π des Buches von Mahler (Lectures on Transcendental Numbers, Springer, Berlin etc., 1976) verwiesen werden.
2. Hauptergebnisse von Hermite und Lindemann. Das erste Resultat ist der Satz von Hermite.
Die Zahl e ist transzendent.
Die in 1 genannte 30–seitige Arbeit, in der Hermite seine Methode vorstellte und den zitierten Satz zeigte, enth¨ alt eine F¨ ulle von weiteren analytischen Formeln, von denen viele zum Beweis selbst nicht gebraucht wurden. Diese Tatsache war sicher ein Grund f¨ ur die vorher angesprochene, bald anlaufende Welle von Varianten und Vereinfachungen. Andererseits scheinen im Wunsch, eine existierende Methode zu vereinfachen, die weiterf¨ uhrenden, in diesen analytischen Formeln vorhandenen Ans¨ atze jahrzehntelang unentdeckt geblieben zu sein. Eine weitere Konsequenz des erw¨ahnten Formelreichtums in der Hermiteschen Originalarbeit d¨ urfte gewesen sein, daß manche ihrer Leser nicht einmal bemerken konnten, daß dort die Transzendenz von e tats¨achlich bewiesen ist. So wurde dieses damals sensationelle Ergebnis z.B. vom Referenten der Hermite–Arbeit im Jahrbuch u ¨ber die Fortschritte der Mathematik 5, 248–249 (1873) mit keinem Wort erw¨ ahnt. ¨ Ein ganz anderer Leser war F. Lindemann, der in seiner Arbeit Uber die Zahl π (Math. Ann. 20, 213–225 (1882)) bemerkte: “Man wird sonach die Unm¨ oglichkeit der Quadratur des Kreises darthun, wenn man nachweist, dass ... ”
§ 3.
Die S¨ atze von Hermite, Lindemann und Weierstraß
259
[Satz von Lindemann.] “... die Zahl π u ¨berhaupt nicht Wurzel einer algebraischen Gleichung irgendwelchen Grades mit rationalen Coefficienten sein kann.” Zwei Zeilen sp¨ater schreibt Lindemann: “Die wesentliche Grundlage der Untersuchung bilden die Relationen zwischen gewissen bestimmten Integralen, welche Herr Hermite angewandt hat. . . . § 4 enth¨ alt weitere Verallgemeinerungen.” Der detaillierte Beweis, den Lindemann dann f¨ ur die Transzendenz von π lieferte, ergab in seinem § 4 (im wesentlichen) noch folgende Verallgemeinerung, die man heute bezeichnet als Satz von Hermite–Lindemann. dent.
F¨ ur jedes α ∈ C × ist α oder eα transzen-
F¨ ur α = 1 erh¨ alt man den Satz von Hermite wieder. Wegen eπi = −1 ist πi, also π transzendent, und man hat erneut Lindemanns Hauptergebnis. Eine weitere unmittelbare Folge ist Korollar A. Ist α ∈ C × und log α = 0, wobei log irgendeine Bestimmung des komplexen Logarithmus ist, so ist α oder log α transzendent. Denn w¨ aren α und log α =: β beide algebraisch, so auch β und eβ (= α), obwohl β = 0 ist, und dies widerspricht dem Satz von Hermite–Lindemann. Der Nachweis der folgenden Konsequenz des Satzes von Hermite–Lindemann ¨ kann dem Leser als Ubung u ¨berlassen bleiben. Korollar B. Ist g eine der trigonometrischen Funktionen sin, cos, tan, cot, eine der hyperbolischen Funktionen sinh, cosh, tanh, coth oder Umkehrfunktion einer dieser acht Funktionen, so gilt f¨ ur jede Stelle α ∈ C × , an der g definiert ist: α oder g(α) ist transzendent.
3. Der Satz von Lindemann–Weierstraß. Am Ende seiner in 2 zitierten Arbeit k¨ undigte Lindemann noch an: “Versteht man unter den zi beliebige rationale oder algebraisch irrationale, von einander verschiedene Zahlen, und unter den Ni ebensolche Zahlen, die nicht s¨amtlich gleich Null sind, so kann keine Gleichung der Form bestehen: 0 = N0 ez0 + N1 ez1 + N2 ez2 + . . . + Nr ezr .
260
6. Transzendenz
... Eine genauere Darlegung der hier nur angedeuteten Beweise behalte ich mir f¨ ur eine sp¨ atere Ver¨ offentlichung vor.” Welch letztere dann allerdings unterblieb, da sich Lindemann anderen Gegenst¨anden zuwandte, insbesondere seine Kr¨ afte auf das Fermat–Problem 4.2.8 konzentrierte. Daf¨ ur hat dann K. Weierstrass in seiner Arbeit Zu Lindemann’s Abhand¨ lung: Uber die Ludolph’sche Zahl (Mathematische Werke II, 341–362) einen vollst¨ andigen Beweis der Lindemannschen Ank¨ undigung publiziert, die heute beider Namen tr¨agt. Von ihr werden sogleich vier a¨quivalente Formulierungen vorgestellt, deren dritte in § 4 bewiesen wird. Folgende Definitionen noch vorab: Sei K|L irgendeine K¨ orpererweiterung. Man ¨ber L , falls es ein f ∈ L[X1 , . . . nennt β1 , . . . , βn ∈ K algebraisch abh¨angig u . . . , Xn ] \ {0} gibt mit f (β1 , . . . , βn ) = 0; andernfalls heißen β1 , . . . , βn algebraorper von C, isch unabh¨ angig u ¨ber L. Ist speziell L = Q und K irgendein Teilk¨ so l¨aßt man den Zusatz “¨ uber Q” meistens weg: Man sagt in diesem Fall also, β1 , . . . , βn seien algebraisch abh¨ angig (bzw. unabh¨ angig), wenn es ein (bzw. kein) f ∈ Q[X1 , . . . , Xn ] \ {0} gibt mit f (β1 , . . . , βn ) = 0; o.B.d.A. kann hier offenbar f ∈ Q[X1 , . . . , Xn ] \ {0} durch f ∈ Z[X1 , . . . , Xn ] \ {0} ersetzt werden. Satz von Lindemann–Weierstraß. Seien α1 , . . . , αn ∈ Q.∗) Version 1: Sind α1 , . . . , αn paarweise verschieden, so sind eα1 , . . . , eαn linear unabh¨ angig u ¨ber Q. Version 1 : Sind α1 , . . . , αn paarweise verschieden, so sind eα1 , . . . , eαn linear unabh¨ angig u ¨ber Q. ¨ber Q linear unabh¨ angig, so sind eα1 , . . . , eαn u ¨ber Version 2: Sind α1 , . . . , αn u Q algebraisch unabh¨ angig. ¨ber Q linear unabh¨ angig, so sind eα1 , . . . , eαn u ¨ber Version 2 : Sind α1 , . . . , αn u Q algebraisch unabh¨ angig. Bemerkungen. 1) Der Satz von Lindemann–Weierstrass enthielt das erste Resultat u ¨ber algebraische Unabh¨angigkeit von Zahlen (vgl. Versionen 2 und 2 ), ohne daß dies allerdings Lindemann oder Weierstrass explizit angemerkt h¨ atten; beide zitierten nur Version 1. 2) Sind die α1 , . . . , αn u ¨ber Q linear abh¨ angig, so ist k1 α1 + . . . + kn αn = 0 mit gewissen nicht s¨amtlich verschwindenden kj ∈ Z. Ist die Numerierung der α’s o.B.d.A. so, daß k1 , . . . , km ≥ 0 > km+1 , . . . , kn gilt, so ist −k
m+1 km − Xm+1 · . . . · Xn−kn ∈ Z[X1 , . . . , Xn ] f := X1k1 · . . . · Xm
∗)
Hier und im folgenden bezeichnet Q den algebraischen Abschluß von Q in C, vgl. 1.6.3.
§ 3.
Die S¨ atze von Hermite, Lindemann und Weierstraß
261
ein Polynom = 0 mit f (eα1 , . . . , eαn ) = 0, weshalb dann also die eα1 , . . . , eαn u ¨ber Q und erst recht u ¨ber Q algebraisch abh¨angen. 3) Aus der oben gegebenen Definition der algebraischen Unabh¨ angigkeit folgt angig u ¨ber L, so ist direkt noch dieses: Sind β1 , . . . , βn ∈ K algebraisch unabh¨ jedes einzelne βj transzendent u ¨ber L. 4) Schließlich ist klar, daß der Satz von Hermite–Lindemann aus 2 im Satz von Lindemann–Weierstrass enthalten ist: W¨ are n¨ amlich f¨ ur ein α ∈ C × α 0 α gleichzeitig α, e ∈ Q, so w¨aren e , e u ¨ber Q linear abh¨ angig, obwohl 0, α ∈ Q voneinander verschieden sind, im Widerspruch zu Version 1. ¨ 4. Zur Aquivalenz der vier Versionen. Hier wird gezeigt, daß die Versionen 1 und 2 zueinander a¨quivalent sind ebenso wie die Versionen 1 und 2 . Trivialerweise folgen aus den erstgenannten Versionen die zweitgenannten; die ebenfalls zutreffende Umkehrung dieser Implikation braucht hier nicht bewiesen zu werden. Sobald Version 2 in § 4 gezeigt sein wird, ist damit jedenfalls die G¨ ultigkeit aller vier behaupteten Versionen eingesehen. ¨ber Q Es werde mit 1 ⇒ 2 begonnen und dazu angenommen, α1 , . . . , αn seien u linear unabh¨ angig, aber eα1 , . . . , eαn seien u ¨ber Q algebraisch abh¨angig, d.h. es g¨ abe ein Polynom
P =
L
p(j1 , . . . , jn )X1j1 · . . . · Xnjn ∈ Q[X1 , . . . , Xn ] \ {0},
j1 ,...,jn =0
welches an der Stelle (eα1 , . . . , eαn ) ∈ C n verschwindet. Dies besagt aber (1)
p(j1 , . . . , jn ) exp(j1 α1 + . . . + jn αn ) = 0.
j1 ,...,jn
Wegen der linearen Unabh¨angigkeit der α1 , . . . , αn u ¨ber Q sind die Argumente in exp(. . .) paarweise verschiedene algebraische Zahlen, etwa β1 , . . . , βm . Da die μ ∈ {1, . . . , m} und die (j1 , . . . , jn ), u ¨ber die in (1) summiert wird, bijektiv aufeinander bezogen sind, besagt (1) genau (2)
pμ exp(βμ ) = 0,
wobei die pμ ∈ Q in irgendeiner Reihenfolge mit den p(j1 , . . . , jn ) aus (1) u ¨bereinstimmen und somit nicht alle Null sind. (2) steht dann im Widerspruch zur Aussage von Version 1.
262
6. Transzendenz
Nun zu 2 ⇒ 1: Seien α1 , . . . , αn ∈ Q paarweise verschieden und es werde eine Beziehung der Form n
(3)
aj eαj = 0
j=1
mit a1 , . . . , an ∈ Q, nicht alle Null, angenommen. Ist n = 1, so hat man schon einen Widerspruch. Sei also n ≥ 2. Bezeichnet dann m die Maximalzahl der angigen α1 , . . . , αn , so ist 1 ≤ m ≤ n. O.B.d.A. sei die u ¨ber Q linear unabh¨ Numerierung der α’s so gew¨ahlt, daß α1 , . . . , αm u ¨ber Q linear unabh¨ angig sind und daß sich αm+1 , . . . , αn aus den α1 , . . . , αm mit rationalen Koeffizienten rjk linear kombinieren lassen, d.h. (4)
αj = rj1 α1 + . . . + rjm αm
(j = m + 1, . . . , n),
falls u ¨berhaupt m < n ist. Ist s ∈ N ein gemeinsamer Nenner aller rjk , also srjk =: sjk ∈ Z, so setzt man sk := Min(0, sm+1,k , . . . , sn,k ) ≤ 0 f¨ ur k = 1, . . . , m und bildet das Polynom −sm P := X1−s1 · . . . · Xm (
(5)
m j=1
aj Xjs +
n
s
sjm aj X1 j1 · . . . · Xm )
j=m+1
∈ Q[X1 , . . . , Xm ]. Die paarweise Verschiedenheit der sα1 , . . . , sαn impliziert, daß s¨ amtliche n in der Klammer rechts in (5) auftretenden Exponentensysteme (sδj1 , . . . , sδjm ) ∈ Nm 0 f¨ ur j = 1, . . . , m und (srj1 , . . . , srjm ) ∈ Zm f¨ ur j = m + 1, . . . , n paarweise verschieden sind. Daher ist P = 0 und weiterhin gilt mit (3), (4) und (5) P (eα1 /s , . . . , eαm /s ) m n 1 =( aj eαj + aj eα1 rj1 +...+αm rjm ) exp(− (s1 α1 + . . . + sm αm )) s j=1 j=m+1 = 0. Somit sind eα1 /s , . . . , eαm /s u ¨ber Q algebraisch abh¨angig, obwohl die Exponen¨ber Q linear unabh¨ angig sind, was Version 2 widerten α1 /s, . . . , αm /s ∈ Q u spricht. ¨ Die Aquivalenz 1 ⇔ 2 l¨ aßt sich v¨ ollig analog einsehen.
§ 4. § 4.
Die Methode von Hermite–Mahler
263
Die Methode von Hermite–Mahler
1. Vorbemerkungen. Zwanzig Jahre nach seinem Transzendenzbeweis f¨ ur e legte Hermite (Oeuvres IV, 357–377) eine weitere wichtige, diesmal rein analytische Untersuchung der Exponentialfunktion vor. Offenbar hat erst Mahler 1931 bemerkt, daß sich der Satz von Lindemann–Weierstrass aus den darin enthaltenen Formeln gewinnen l¨ aßt. Bevor dieser Weg zum Lindemann–Weierstrassschen Satz im vorliegenden Paragraphen eingeschlagen wird, sei noch eine grunds¨atzliche Vorbemerkung u ¨ber analytische Beweise f¨ ur Transzendenz oder algebraische Unabh¨ angigkeit gemacht. Diese verlaufen generell nach folgendem Muster: Man beschafft sich irgendwie aus der Annahme, der jeweils zu zeigende Satz sei falsch, eine nichtverschwindende algebraische Zahl, die aus algebraischen Gr¨ unden “nicht zu klein” sein kann, aber aus analytischen Gr¨ unden “sehr klein” sein muß. F¨ ur die in diesem und dem folgenden Paragraphen zu beweisenden arithmetischen S¨ atze werden in 2 die unteren, also die algebraischen Absch¨atzungen vorbereitet.
2. Ungleichungen f¨ ur algebraische Zahlen. Zun¨ achst einige zweckm¨aßige Bezeichnungen: H(P ) bedeutet die H¨ohe eines Polynoms P ∈ C[X1 , . . . , Xn ], das ist das Maximum der Absolutbetr¨ age s¨amtlicher Koeffizienten von P . Ist α ∈ Q, d := ∂(α) und sind α1 := α, α2 , . . . , αd s¨amtliche Konjugierten von α bez¨ uglich Q, so heißt α := Max |αδ | das Haus von α. Ist Pα := 1≤δ≤d
ad X d + . . . + a0 ∈ Z[X] das in 1.6.1 eingef¨ uhrte ganzzahlige Minimalpolynom von α, so ist d−1 d (ad α) + aδ ad−1−δ (ad α)δ = 0 d δ=0
¨ber Q wegen Pα (α) = 0. Dies bedeutet, daß ad α Wurzel des normierten, u offenbar ebenfalls irreduziblen Polynoms Xd +
d−1
aδ ad−1−δ X δ ∈ Z[X] d
δ=0
ist. Somit ist aδ α eine ganze algebraische Zahl (desselben Grades wie α) und es ist {m ∈ N : mα ganz algebraisch} = ∅. Jedes Element dieser Menge heißt ein Nenner f¨ ur α; ihr kleinstes Element heißt der Nenner von α, in Zeichen Nen α oder Nen(α).
264
6. Transzendenz
Lemma.
×
F¨ ur α ∈ Q
gilt |α| ≥ (Nen α)−∂(α) α
1−∂(α)
.
Beweis. Nach Definition von Nen α ist β := α Nen α (= 0) eine ganze algebraische Zahl, f¨ ur die nach Satz 1.6.5(i) die Norm N (β) ∈ Z \ {0} ist, weshalb |N (β)| ≥ 1 gilt; dabei bedeutet N die in 1.6.4(1) eingef¨ uhrte Norm. Weiter ist ∂(β) = ∂(α) (=: d); ebenso ist klar, daß man alle Konjugierten β1 , . . . , βd von β erh¨alt, indem man die Konjugierten α1 , . . . , αd von α jeweils mit Nen α multipliziert. So ist nach Definition von N (β) in 1.6.4(1) 1 ≤ |β1 · . . . · βd | = (Nen α)d |α1 · . . . · αd | ≤ (Nen α)d α
d−1
|α|,
was schon die behauptete Ungleichung impliziert. Das soeben eingesehene Lemma wird ben¨otigt zum Beweis eines weiteren Satzes, den man oft zitiert als Liouville–Absch¨ atzung. Seien α1 , . . . , αs ∈ Q und h der Grad des algebraischen Zahlk¨orpers Q(α1 , . . . , αs ) u ¨ber Q. Es sei P ∈ Z[X1 , . . . , Xs ] \ {0} und sein Grad in Xσ sei ∂σ (P ). Dann gilt entweder P (α1 , . . . , αs ) = 0 oder s −h∂σ (P ) (1 + ασ )Nen ασ |P (α1 , . . . , αs )| ≥ H(P )1−h . σ=1
Beweis. Man setze dσ := ∂σ (P ), Nσ := Nen ασ . Ist dann (1)
P =
d1
...
δ1 =0
ds
p(δ1 , . . . , δs )X1δ1 · . . . · Xsδs ,
δs =0
so ist offenbar Nen(P (α1 , . . . , αs )) ≤ sσ=1 Nσdσ . Weiter ist P (α1 , . . . , αs ) ∈ Q(α1 , . . . , αs ) und somit ∂(P (α1 , . . . , αs )) ≤ h. Ist jetzt (α :=) P (α1 , . . . , αs ) = 0, so folgt mit dem vorangestellten Lemma s (2) |P (α1 , . . . , αs )| ≥ α 1−h Nσ−hdσ . σ=1
(Daß man u ¨brigens bei der Ersetzung von ∂(α) durch h tats¨achlich h¨ ochstens weiter verkleinert, folgt aus der bei α = 0 g¨ ultigen Ungleichung α Nen α ≥ 1.) Nach (1) ist α ≤ H(P ) ≤ H(P )
d1 δ1 =0 s
...
ds
α1
δ1
δs =0
· . . . · αs
δs
= H(P )
dσ s
ασ
δσ
σ=1 δσ =0
(1 + ασ )dσ .
σ=1
Verwendet man diese Absch¨atzung rechts in (2) weiter, so erh¨ alt man die Absch¨atzung von Liouville.
§ 4.
Die Methode von Hermite–Mahler
265
Bemerkung. Wie erkl¨ art sich die Bezeichung “Liouville–Absch¨atzung”? Man nehme dort s := 1, α1 := α algebraisch, P := qX − p mit q ∈ N, p ∈ Z. Wegen h = ∂(α) hat man bei α = p/q die Ungleichung |αq − p| ≥ c1 (α)(Max(|p|, q))1−∂(α)
(3)
mit von p, q unabh¨ angiger Konstanten c1 (α) > 0. Ist nun o.B.d.A. |αq − p| ≤ 1, so |p| ≤ 1 + |α|q ≤ (1 + |α|)q und daher |αq − p| ≥ c2 (α)q 1−∂(α) wegen (3), wo c2 dieselbe Eigenschaft wie c1 hat. Damit hat man von neuem den Liouvilleschen Approximationssatz 1.2.
3. Konstruktion geeigneter Exponentialpolynome. Nun werden die ersten analytischen Vorbereitungen f¨ ur den Beweis des Satzes von Lindemann– Weierstrass nach der Hermite–Mahlerschen Methode getroffen. Seien a1 , . . . , as ∈ C paarweise verschieden und sei m := (m1 , . . . , ms ) ∈ Ns0 . F¨ ur z ∈ C ergibt sich aus s 1 (1) R(z; m) := ewz (w − aσ )−mσ −1 dw 2πi |w|=r σ=1 bei r > Max |aσ | mittels Residuensatz 1≤σ≤s
(2)
R(z; m) =
s
Pσ (z; m)eaσ z
σ=1
mit den Polynomfunktionen (3) Pσ (z; m) :=
1 +...+s =mσ
s 1 σ mτ + τ z (−1)τ (aσ − aτ )−mτ −τ −1 . σ ! τ τ =1 τ =σ
Dabei wurde die Leibniz–Formel u ¨ber die mehrfache Differentiation von Produkten ber¨ ucksichtigt. Andererseits f¨ uhrt die Substitution w = 1t im Integral rechts in (1) zu (4)
R(z; m) =
1 2πi
|t|= r1
tM−1 ez/t
s
(1 − aσ t)−mσ −1 dt,
σ=1
wobei (5)
M + 1 :=
s σ=1
(mσ + 1)
266
6. Transzendenz
gesetzt ist. Ist ρ≥0 bρ tρ die Taylor–Entwicklung von σ (1 − aσ t)−mσ −1 um t = 0, so f¨ uhrt der Residuensatz von (4) zu (6)
R(z; m) =
∞ ρ=0
bρ z M+ρ . (M + ρ)!
Bemerkung. Ganze Funktionen der Form treten, nennt man Exponentialpolynome.
Pσ (z) exp(aσ z), wie sie in (2) auf-
4. Eigenschaften dieser Exponentialpolynome. Die f¨ ur den Beweis des Satzes von Lindemann–Weierstrass relevanten Eigenschaften der in 3 konstruierten Exponentialpolynome entnimmt man folgendem Lemma. Sind a1 , . . . , as ∈ C paarweise verschieden, so gilt bei beliebigem m ∈ Ns0 , wenn noch M durch 3(5) definiert ist: (i) Der Grad von Pσ in z ist mσ . (ii) mσ !Pσ (1; m) ist ein Polynom in den (aσ − aτ )−1 , τ = 1, . . . , s, τ = σ, vom Gesamtgrad h¨ochstens M und mit ganzrationalen Koeffizienten. (iii) Es ist |Pσ (1; m)| ≤ cM 1 ; sind speziell die a1 , . . . , as ∈ Q, so gilt auch Pσ (1; m) ≤ cM andertem c1 . 1 , eventuell mit abge¨ (iv) R(z; m) hat an 0 eine Nullstelle der Ordnung M . (v) Es ist |R(1; m)| ≤ c2 /M !. Dabei h¨ angen die Konstanten c1 , c2 ≥ 1 zwar von den a1 , . . . , as ab, jedoch nicht von m. Beweis. (i) und (ii) sind direkt aus 3(3) ersichtlich, wenn man f¨ ur (ii) noch die mit 3(5) folgende Absch¨atzung (1)
(mτ + 1 + τ ) = (M − mσ ) + (mσ − σ ) ≤ M
τ =σ
f¨ ur alle (1 , . . . , s ) ∈ Ns0 mit 1 + . . . + s = mσ beachtet. Mit c3 := Max(1, Max |aσ − aτ |−1 ) τ =σ
folgt aus 3(3) unter Ber¨ ucksichtigung von (1) und 3(5) (2) |Pσ (1; m)| ≤ cM 3
1 +...+s =mσ
s mτ + τ M + mσ = cM ≤ (4c3 )M , 3 m τ σ τ =1
§ 4.
267
Die Methode von Hermite–Mahler
was den ersten Teil von (iii) beweist. Um den Zusatz einzusehen, hat man lediglich in der Definition von c3 das “innere” Maximum u ¨ber die (aσ − aτ )−1 zu nehmen; dann gilt (2) genauso f¨ ur Pσ (1; m) . (iv) folgt direkt aus 3(6) und b0 = 1. Weiter ergibt sich aus ∞ s ∞ mτ + τ bρ t = tρ (aτ t)τ = τ ρ=0 τ =1 ρ=0
∞
ρ
τ =0
1 +...+s =ρ
s mτ + τ τ aτ τ τ =1
mit c4 := Max(1, |a1 |, . . . , |as |) (3)
|bρ | ≤ cρ4
1 +...+s =ρ
s mτ + τ M +ρ = cρ4 τ ρ τ =1
f¨ ur alle ρ ∈ N0 und daraus mittels 3(6) |R(1; m)| ≤
∞ ec4 1 ρ −1 c4 ρ! = , M ! ρ=0 M!
was auch (v) beweist. Bemerkung. Die Richtigkeit der in (2) bzw. (3) verwendeten Formel zur Auswertung der s–fachen Summe u ¨ber Produkte gewisser Binomialkoeffizienten sieht man folgendermaßen ein: In |z| < 1 gilt f¨ ur m ∈ N0 (1 − z)
−m−1
∞ m+ = z , =0
wie sich durch m–fache Differentiation der geometrischen Reihe ergibt. Sind m1 , . . . , ms ∈ N0 , so folgt daraus mit der Festsetzung 3(5) ∞ ∞ s s M +ρ ρ mτ + τ τ −M−1 −mτ −1 = (1 − z) = z = (1 − z) z τ ρ ρ=0 τ =1 τ =1 τ =0 s ∞ mτ + τ = zρ τ ρ=0 τ =1 1 +...+s =ρ
in |z| < 1, woraus man durch Koeffizientenvergleich die oben zweimal verwendete Formel s mτ + τ M +ρ = τ ρ τ =1 1 +...+s =ρ
f¨ ur alle ρ ∈ N0 erh¨alt.
268
6. Transzendenz
5. Eine Determinantenbetrachtung. Nun wird m ∈ Ns0 auf s verschiedene Arten spezialisiert, indem man f¨ ur ρ = 1, . . . , s Rρ (z) := R(z; N − 1 + δρ1 , . . . , N − 1 + δρs ) sowie Pρσ (z) := Pσ (z; N − 1 + δρ1 , . . . , N − 1 + δρs )
(σ = 1, . . . , s)
bildet. Dabei bedeutet δρσ das Kronecker–Symbol und N ∈ N ist zun¨achst beliebig. Nach 3(2) ist f¨ ur ρ = 1, . . . , s (1)
Rρ (z) =
s
Pρσ (z)eaσ z .
σ=1
Nach Lemma 4(i) hat Pρσ in z den Grad N − 1 + δρσ und daher hat die Polynomfunktion (2)
Δ(z) := det(Pρσ (z))ρ,σ=1,...,s
den Grad sN . Nach 3(5) gilt f¨ ur die obigen s speziellen Wahlen f¨ ur m stets M = sN und so entnimmt man der sich aus (1) und (2) ergebenden Identit¨ at ⎛ a1 z
Δ(z)e
⎜ ⎜ = det ⎜ ⎜ ⎝
R1 (z)
P12 (z)
.. .
.. .
Rs (z)
Ps2 (z)
...
P1s (z) .. .
...
⎞ ⎟ ⎟ ⎟, ⎟ ⎠
Pss (z)
daß Δ(z) wegen Lemma 4(iv) an z = 0 eine Nullstelle mindestens der Ordnung sN hat. Also gilt mit einem (explizit angebbaren) c ∈ C × Δ(z) = cz sN .
(3)
6. Gewinnung einer nichtverschwindenden algebraischen Zahl. Man macht nun die der Version 2 des Lindemann–Weierstrassschen Satzes in 3.3 angigen α1 , . . . , αn ∈ Q widersprechende Annahme, bei u ¨ber Q linear unabh¨ seien eα1 , . . . , eαn u ¨ber Q algebraisch abh¨angig. Dann existiert ein Polynom (1)
P =
L λ1 ,...,λn =0
p(λ1 , . . . , λn )X1λ1 · . . . · Xnλn
§ 4.
Die Methode von Hermite–Mahler
269
mit nicht s¨amtlich verschwindenden algebraischen Koeffizienten p(λ1 , . . . , λn ), die o.B.d.A. als ganz algebraisch vorausgesetzt werden d¨ urfen, so daß gilt P (eα1 , . . . , eαn ) = 0. Nun betrachtet man die r := (K + 1)n Polynome X1κ1 · . . . · Xnκn P mit 0 ≤ ¨ber C linear unabh¨ angige Linearformen in κ1 , . . . , κn ≤ K. Dies sind offenbar u den s := (K+L+1)n Potenzprodukten X1μ1 ·. . .·Xnμn mit 0 ≤ μ1 , . . . , μn ≤ K+L, deren Koeffizienten Null oder irgendwelche der p(λ1 , . . . , λn ) aus (1) sind. Bezeichnet man nun die s nach Voraussetzung paarweise verschiedenen algebraischen Zahlen μ1 α1 + . . . + μn αn , 0 ≤ μ1 , . . . , μn ≤ K + L, in irgendeiner Reihenfolge mit a1 := 0, a2 , . . . , as , so gelten die r homogenen linearen Gleichungen (2)
s
bρσ eaσ = 0
(ρ = 1, . . . , r),
σ=1
wobei die Matrix (bρσ ) maximalen Rang r hat Denkt man sich nun die Untersuchungen in 3 bis 5 mit den zuletzt definierten uhrt, so erkennt man Δ(1) = 0 aus 5(3). Daher algebraischen a1 , . . . , as durchgef¨ hat die quadratische Matrix (Pρσ (1))ρ,σ=1,...,s , die bei der Wahl z = 1 in 5(1) auftritt, den Rang s, und so kann man s − r verschiedene λ1 , . . . , λs−r ∈ {1, . . . , s} finden, so daß die Zahl ⎛ ⎞ b11 ... b1s . . ⎜ ⎟ .. .. ⎜ ⎟ ⎜ ⎟ br1 ... brs ⎜ ⎟ (3) δ := det ⎜ ⎟ ⎜ Pλ1 1 (1) . . . Pλ1 s (1) ⎟ ⎜ ⎟ . . ⎝ ⎠ .. .. Pλs−r 1 (1) . . . Pλs−r s (1) von Null verschieden ist. Weiter liegt δ in dem von α1 , . . . , αn (vgl. Lemma 4(ii)) und den Koeffizienten von P erzeugten algebraischen Zahlk¨ orper, der u ¨ber Q den Grad d haben m¨ oge.
7. Untere Absch¨ atzung. Ist γ1 ein Nenner aller (aσ − aτ )−1 , σ = τ , so ist nach 6(3) und Lemma 4(ii) (1)
(s−r)sN
Nen δ ≤ γ1
N !s−r .
Ist γ2 eine obere Schranke f¨ ur die H¨ auser aller Koeffizienten von P (und damit eine Schranke f¨ ur alle bρσ in 6(2)), so ergibt sich aus 6(3) mittels Lemma 4(iii) (2)
(s−r)sN
δ ≤ s!γ2r γ3
.
270
6. Transzendenz
Dabei sind γ1 , γ2 , γ3 (und im folgenden γ4 , γ5 , γ6 ) ebenso wie r, s, d mindestens ucksicht auf Eins und h¨ angen h¨ ochstens von α1 , . . . , αn , P und K ab. Mit R¨ ∂(δ) ≤ d sowie (1) und (2) folgt aus Lemma 2 (3)
|δ| ≥ γ4−N N !−(s−r)d .
8. Obere Absch¨ atzung. Mittels 5(1) und 6(2) ergibt sich aus 6(3) ⎛ ⎞ 0 b12 ... b1s .. .. .. ⎜ ⎟ . . . ⎜ ⎟ ⎜ ⎟ 0 br2 ... brs ⎜ ⎟ δ = det ⎜ Pλ1 2 (1) . . . Pλ1 s (1) ⎟ ⎜ Rλ1 (1) ⎟ ⎜ ⎟ .. .. .. ⎝ ⎠ . . . Rλs−r (1) Pλs−r 2 (1) . . . Pλs−r s (1) Entwickelt man hier die Determinante nach der ersten Spalte, so folgt unter Beachtung von Lemma 4(v) (1)
|δ| ≤ (s − r)
γ5 r (s−r−1)sN γ γ ≤ γ6N N !−s . (sN )! 2 3
9. Parameterwahl. Da es jetzt gelingen wird, durch geeignete Wahl eines h¨ ochstens von α1 , . . . , αn und P abh¨ angigen K f¨ ur (1)
s > (s − r)d
zu sorgen, widersprechen sich die Ungleichungen 7(3) und 8(1) f¨ ur jedes N ≥ N0 (α1 , . . . , αn , P ) und die Annahme zu Anfang von 6 erweist sich als falsch. Nach Definition von r, s in 6 folgt n¨ amlich mit K := L(nd−1) unter Verwendung des Mittelwertsatzes der Differentialrechnung (s−r)d = (K+L+1)n −(K+1)n d = Ln(K+λ+1)n−1 d = (K+L)(K+λ+1)n−1 mit reellem λ ∈]0, L[. Diese Gleichung f¨ uhrt direkt zu (s−r)d < (K+L+1)n = s, womit (1) tats¨ achlich befriedigt ist.
10. Historische Anmerkung. Hermite hatte in seinem urspr¨ unglichen Transzendenzbeweis f¨ ur e ganz ¨ahnliche Determinantenbetrachtungen anzustellen, wie dies oben in 5 durchgef¨ uhrt wurde. Seine Vorgehensweise in diesem
§ 5.
Der Satz von Gel’fond–Schneider
271
Punkt hat die weitere Entwicklung der analytischen Transzendenzmethoden nachhaltiger beeinflußt, als dies alle vereinfachenden Beweisvarianten f¨ ur die S¨ atze von Hermite, Lindemann und Weierstrass in der Folgezeit vermochten. In diesem Zusammenhang ist vor allem die große Arbeit von Siegel (Gesam¨ melte Abhandlungen I, 209–266) aus dem Jahre 1929 Uber einige Anwendungen diophantischer Approximationen zu nennen. In ihrem ersten Teil wurde eine neue Methode zum Nachweis der algebraischen Unabh¨ angigkeit von Zahlen entwickelt, die Werte gewisser ganzer Funktionen an algebraischen Argumentstellen sind. Siegels Hauptergebnisse verallgemeinerten den Satz von Lindemann– Weierstrass (in den Versionen 2, 2 ). Einer der wesentlichen analytischen Punkte in Siegels Methode war der Nachweis des Nichtverschwindens gewisser Determinanten, deren Elemente Polynome sind. Siegels Schlußweise an dieser Stelle ist offenbar von Hermites Vorgehen bei der Exponentialfunktion entscheidend beeinflußt worden, w¨ahrend Mahler seinen in diesem Paragraphen dargestellten Weg zum Satz von Lindemann–Weierstrass kurz nach Erscheinen der Siegelschen Arbeit publizierte. Siegels Arbeit enthielt zahlreiche neue Ideen, die sich auf die weitere Entwicklung der Transzendenzmethoden u ¨beraus fruchtbar ausgewirkt haben; insbesondere auf eine wird sogleich in 5.1 zur¨ uckzukommen sein.
§ 5.
Der Satz von Gel’fond–Schneider
1. Hilberts siebtes Problem. Wie dies bereits in 3.1 angeklungen ist, blieb Hermites Methode f¨ ur u ¨ber 50 Jahre der einzige Schritt in Richtung auf die Entwicklung einer analytischen Transzendenztheorie. Ohne die wichtigen, in den §§ 3 und 4 besprochenen Beitr¨ age von Lindemann und Weierstrass als “quantit´es n´egligeables” verstehen zu wollen, bleibt doch festzustellen, daß die wirklichen nach–Hermiteschen Fortschritte nicht beim Ausbau oder bei der Vereinfachung einer existierenden Methode erzielt wurden, sondern beim Ringen um die L¨ osung neuer, offener Probleme. Hilbert selbst hat dies geahnt, als er im Rahmen seiner bereits in 3.2.13 zitier¨ ten “Probleme” als siebtes unter der Uberschrift Irrationalit¨ at und Transzendenz bestimmter Zahlen folgendes ausf¨ uhrte: “Hermites arithmetische S¨atze u ¨ber die Exponentialfunktion und ihre Weiterf¨ uhrung durch Lindemann sind der Bewunderung aller mathematischen Generationen sicher. Aber zugleich erw¨achst uns die Aufgabe, auf dem betretenen Wege fortzuschreiten. Ich m¨ochte daher eine Klasse von Problemen kennzeichnen, die meiner Meinung nach als die n¨ achstliegenden hier in Angriff zu nehmen
272
6. Transzendenz
sind. Wenn wir von speziellen, in der Analysis wichtigen transzendenten Funktionen erkennen, daß sie f¨ ur gewisse algebraische Argumente algebraische Werte annehmen, so erscheint uns diese Tatsache stets als besonders merkw¨ urdig und der eingehenden Untersuchung w¨ urdig. Wir erwarten eben von transzendenten Funktionen, daß sie f¨ ur algebraische Argumente im allgemeinen auch transzendente Werte annehmen, und obgleich ..., so werden wir es doch f¨ ur h¨ ochst wahrur alle scheinlich halten, daß z.B. die Exponentialfunktion eiπz , die offenbar f¨ rationalen Argumente z stets algebraische Werte hat, andererseits f¨ ur alle irrationalen algebraischen Argumente z stets transzendente Zahlenwerte annimmt. Wir k¨ onnen dieser Aussage auch eine geometrische Einkleidung geben, wie folgt. Wenn in einem gleichschenkligen Dreieck das Verh¨ altnis vom Basiswinkel zum Winkel an der Spitze algebraisch, aber nicht rational ist, so ist das Verh¨ altnis zwischen Basis und Schenkel stets transzendent. Trotz der Einfachheit dieser ¨ Aussage und der Ahnlichkeit mit den von Hermite und Lindemann gel¨ osten Problemen halte ich doch den Beweis dieses Satzes f¨ ur a¨ußerst schwierig, ebenso wie etwa den Nachweis daf¨ ur, daß die Potenz αβ f¨ ur eine algebraische Basis √ 2 oder α und einen algebraisch irrationalen Exponenten β, z.B. die Zahl 2 eπ = i−2i , stets eine transzendente oder auch nur eine irrationale Zahl darstellt. Es ist gewiß, daß die L¨osung dieser und a¨hnlicher Probleme uns zu ganz neuen Methoden und zu neuen Einblicken in das Wesen spezieller irrationaler und transzendenter Zahlen f¨ uhren muß.” Offenbar verallgemeinerte das hier von Hilbert gestellte Problem die in 1.1 √ b erw¨ahnte Vermutung von Euler u ¨ber die Transzendenz von a . A.O. Gel’fond gelang 1929 eine partielle L¨osung des siebten Hilbertschen Problems im Spezialfall imagin¨ ar–quadratischer Exponenten β, womit insbesondere die Transzendenz von eπ bewiesen war (vgl. Ende des obigen Hilbert– Zitats). Gel’fond st¨ utzte sich dabei auf die Methode der Entwicklung einer ganzen Funktion (hier ez ) in eine Newtonsche Interpolationsreihe nach geeigneten Interpolationsstellen (hier (λ1 + βλ2 ) log α mit (λ1 , λ2 ) ∈ Z2 ), die eine Aus× nutzung der arithmetischen Voraussetzungen (α, β ∈ Q , log α = 0, β imagin¨ ar– β quadratisch) und der Annahme (hier α ∈ Q) gestatten. Ein Jahr sp¨ater konnte R.O. Kuz’min mit demselben Ansatz auch den Spezialfall reell–quadratischer Exponenten β erledigen und somit insbesondere Eulers Vermutung beweisen. Bald danach gelangen vollst¨ andige (und u ¨berdies kurze) L¨osungen des siebten Hilbertschen Problems unabh¨ angig voneinander Gel’fond (Dokl. Akad. Nauk SSSR 2, 1–6 (1934)) und Schneider (J. Reine Angew. Math. 172, 65–69 (1934)), deren Ergebnis so formuliert sei: Satz von Gel’fond–Schneider. Sei α ∈ C × und log α = 0, wobei log eine beliebige Bestimmung des komplexen Logarithmus bedeutet; sei β ∈ C \ Q.
§ 5.
Der Satz von Gel’fond–Schneider
273
Dann ist mindestens eine der Zahlen α, β, αβ (:= eβ log α ) transzendent. Dies beinhaltet insbesondere die geometrische Behauptung des Hilbert–Zitats: Sei A bzw.B der Winkel an der Spitze bzw. an der Basis des gleichschenkligen Dreiecks und sei a bzw. b die L¨ ange der Schenkel bzw. der Basis; nach ¨ Voraussetzung ist B A ∈ Q \ Q. Eine elementargeometrische Uberlegung zeigt (1)
A b = cos B = sin . 2a 2
Wendet man nun den Satz von Gel’fond–Schneider an mit α := eiA und β := B , so sind eiA und (αβ =) eiB , also auch eiA/2 und eiB nicht beide algebraisch. A 1 Nach den klassischen Eulerschen Formeln sin A = 2i (eiA/2 − e−iA/2 ), cos B = 2 1 iB b + e−iB ) sind dann auch sin A 2 (e 2 , cos B nicht beide algebraisch und so ist a nach (1) transzendent. Beiden L¨ osungen von Gel’fond und Schneider ist gemeinsam, daß sie nun nicht mehr, wie noch Gel’fond 1929, eine einzige Funktion direkt untersuchen, sondern daß sie sich einer Idee bedienen, die in a¨hnlichem Zusammenhang erstmals in der in 4.10 zitierten Arbeit von Siegel auftauchte. Diese Idee, in 3 als Siegelsches Lemma pr¨azisiert, bestand darin, mit Hilfe eines Dirichletschen Schubfachschlusses zun¨achst aus den arithmetisch zu untersuchenden ganzen Funktionen (ez , eβz bei Gel’fond; z, αz bei Schneider) eine Hilfsfunktion aufzubauen und diese dann geeignet weiter zu behandeln. Bis vor zwei Jahrzehnten begann fast jede analytische Methode f¨ ur Transzendenz oder algebraische Unabh¨angigkeit damit, daß man zun¨ achst ein geeignetes Siegelsches Lemma ausnutzte. 1989 fand dann M. Laurent einen Ansatz, der ohne dieses Lemma auskommt und stattdessen auf Rangabsch¨atzungen gewisser Matrizen zur¨ uckgreift.
2. Ein Schubfachschluß. Um ein solches Lemma beweisen zu k¨onnen, wird zun¨ achst vorausgeschickt das mit einem Schubfachschluß zu beweisende ur m = 1, . . . , M ; Lemma. Seien C, M, N ∈ N mit M < N ; seien amn ∈ IR f¨ amtlich verschwinn = 1, . . . , N und Maxm,n |amn | ≤ A. Dann existieren nicht s¨ dende x1 , . . . , xN ∈ Z mit allen |xn | ≤ C, so daß f¨ ur m = 1, . . . , M gilt |am1 x1 + . . . + amN xN | < N AC 1− M . N
Beweis. Man betrachte die N –Tupel x := (x1 , . . . , xN ) ∈ NN 0 mit allen xn ≤ C und schreibt Lm (x) := am1 x1 +. . . +amN xN . Ist Vm bzw. −Wm die Summe der
274
6. Transzendenz
positiven bzw. negativen unter den am1 , . . . , amN , so ist Vm + Wm ≤ N A und Vm C ≥ Lm (x) ≥ −Wm C. Die (C + 1)N Punkte L(x) := (L1 (x), . . . , LM (x)) fallen also alle in einen gewissen achsenparallelen W¨ urfel des IRM der Kantenl¨ ange N AC. Man w¨ ahle nun J ∈ N maximal, so daß J < (C + 1)N/M gilt; sodann zerlege man den genannten W¨ urfel in J M kongruente achsenparallele NAC Teilw¨ urfel (der Kantenl¨ ange J ). Wegen J M < (C + 1)N gibt es einen derartigen Teilw¨ urfel, in den zwei der L(x) hineinfallen, etwa L(x ) und L(x ). Dies bedeutet jedoch |
N n=1
amn (xn − xn )| = |Lm (x ) − Lm (x )| ≤
N AC J
f¨ ur m = 1, . . . , M.
Der Punkt x = (x1 , . . . , xN ) mit allen xn := xn − xn leistet das im Lemma Gew¨ unschte, wenn man x = x − x = 0 beachtet ebenso wie die Ungleichung J > C N/M , die sich mit dem Mittelwertsatz der Differentialrechnung wie folgt ergibt: Nach Definition von J ist J ≥ (C + 1)N/M − 1 und nun ist (C + 1)N/M − N (C + ϑ)(N−M)/M > 1 wegen N > M , C ≥ 1, ϑ ∈]0, 1[. C N/M = M
3. Siegelsches Lemma. Hier wird eine Tatsache aus der Theorie der algebraischen Zahlk¨orper ben¨otigt, die man z.B. bei E. Hecke (Vorlesungen u ¨ber die Theorie der algebraischen Zahlen, Akad. Verlagsgesellschaft, Leipzig, 1923;∗) S. 77 ff.) findet: Sei K ein algebraischer Zahlk¨ orper vom Grad d u ¨ber Q und OK der Ganzheitsring von K (vgl. 1.6.5). Dann gibt es u ¨ber Q linear unabh¨ angige w1 , . . . , w aßt d ∈ OK , so daß sich jedes A ∈ OK in eindeutiger Weise schreiben l¨ d als A = δ=1 aδ wδ mit a1 , . . . , ad ∈ Z. Jedes solche System w1 , . . . , wd ∈ OK heißt eine Ganzheitsbasis von K. Ist nun w1 , . . . , wd ∈ OK eine Ganzheitsbasis von K und sind σ1 , . . . , σd die verschiedenen Einbettungen von K in C, so ist die Determinante Δ(w1 , . . . , wd ) := det(σj wδ )j,δ=1,...,d von Null verschieden und ihr Absolutbetrag h¨ angt alleine von K, nicht jedoch von der speziell gew¨ahlten Ganzheitsbasis w1 , . . . , wd ab. Mit diesen Vorbemerkungen und Lemma 2 hat man alle Mittel beisammen, um zu beweisen das folgende ∗)
¨ In englischer Ubersetzung: Lectures on the Theory of Algebraic Numbers, Springer, Berlin etc., 1981.
§ 5.
Der Satz von Gel’fond–Schneider
275
Siegelsche Lemma. Sei K ein algebraischer Zahlk¨ orper vom Grad d u ¨ber Q. Seien M, N ∈ N mit N > dM und seien Amn ∈ OK (1 ≤ m ≤ M , 1 ≤ n ≤ N ) vorgegeben; A sei eine obere Schranke f¨ ur die Absolutbetr¨ age s¨amtlicher Amn und deren Konjugierten bez¨ uglich Q. Dann gibt es eine von M , N , den Amn und von A unabh¨ angige Konstante c > 0, so daß die M Gleichungen N
Amn xn = 0
(m = 1, . . . , M )
n=1
durch ein von Null verschiedenes (x1 , . . . , xN ) ∈ ZN mit s¨amtlichen |xn | ≤ ullt werden. 1 + (cN A)dM/(N−dM) erf¨ Beweis. Es wird eine Ganzheitsbasis w1 , . . . , wd von K fixiert, d.h. mit gewissen amnδ ∈ Z ist Amn =
(1)
d
amnδ wδ
δ=1
f¨ ur alle vorkommenden m, n. F¨ ur σ ∈ {σ1 , . . . , σd } hat man wegen (1) die dM N Gleichungen (2)
σAmn =
d
amnδ σwδ .
δ=1
Unterdr¨ uckt man hier f¨ ur den Moment die Indizes m, n, so ist nach der Cramerschen Regel ⎞ ⎛ σ1 w1 . . . σ1 A . . . σ1 wd ⎜ ⎟ ⎜ . .. .. ⎟ .. aδ Δ(w1 , . . . , wd ) = det ⎜ . . ⎟ ⎟, ⎜ ⎝ ⎠ σd w1
. . . σd A . . . σd wd
wobei die σj A in der δ–ten Spalte der Matrix nach Voraussetzung absolut durch das A im Lemma beschr¨ankt sind. Aus dieser Gleichung hat man wegen Δ(w1 , . . . , wd ) = 0 unmittelbar |amnδ | ≤ cA mit einem nur von w1 , . . . , wd abh¨ angigen c > 0. Nun wendet man Lemma 2 an, indem man dort M , A, C der Reihe nach ersetzt durch dM , cA, 1 + [(cN A)dM/(N−dM) ]. Nach jenem Lemma existieren nicht s¨amtlich verschwindende x1 , . . . , xN ∈ Z mit allen |xn | ≤ 1 + (cN A)dM/(N−dM) , so daß f¨ ur m = 1, . . . , M ; δ = 1, . . . , d gilt |
N n=1
amnδ xn | < cN A(1 + [(cN A)dM/(N−dM) ])−(N−dM)/dM < 1.
276
6. Transzendenz
Da alle amnδ , xn ∈ Z sind, verschwindet hier die Summe links f¨ ur alle genannten m,δ, weshalb man mit (1) N
Amn xn =
n=1
d δ=1
wδ
N
amnδ xn = 0
n=1
f¨ ur m = 1, . . . , M gewinnt. Bemerkung. Das c im Siegelschen Lemma h¨angt offenbar alleine von der fest gew¨ahlten Ganzheitsbasis w1 , . . . , wd von K ab.
4. Hilfsfunktion f¨ ur Gel’fond–Schneider. Man macht sofort die Annahme, unter den Voraussetzungen des zu beweisenden Satzes seien α, β, αβ , (=: γ) algebraisch, und setzt K := Q(α, β, γ), dessen Grad u ¨ber Q wieder h heißen m¨oge. Nun strebt man an, ein Polynom (1)
P =
L 1 −1 L 2 −1
p(λ1 , λ2 )X1λ1 X2λ2 ∈ Z[X1 , X2 ] \ {0}
λ1 =0 λ2 =0
mit absolut “nicht zu großen” p(λ1 , λ2 ) zu bauen, so daß die ganze Funktion F (z) := P (ez , eβz ) “viele” Nullstellen hat (mit Vielfachheiten gerechnet). Genau will man an jede der U verschiedenen Stellen u log α (u = 0, . . . , U −1) Nullstellen von F mindestens der Vielfachheit N plazieren, d.h f¨ ur (2)
F (n) (u log α) = 0
f¨ ur
0 ≤ n < N, 0 ≤ u < U
sorgen. Dabei hat man log α = 0 zu beachten und L1 , L2 , N, U ∈ N sind Parameter, die im Moment noch weitestm¨oglich frei bleiben sollen. Sie werden in 8 so gew¨ahlt, daß insgesamt ein Widerspruch entsteht, der dann den Satz von Gel’fond–Schneider beweist. Aus (1) erh¨ alt man durch Differentiation (3)
F (n) (u log α) =
L 1 −1 L 2 −1
p(λ1 , λ2 )(λ1 + βλ2 )n αλ1 u γ λ2 u ,
λ1 =0 λ2 =0
wobei man insgesamt bereits entscheidend die Differentialgleichung und das Additionstheorem der Exponentialfunktion ausgenutzt hat. Die Faktoren der p(λ1 , λ2 ) rechts in (3) sind aus K, nicht unbedingt aus OK . Sind A1 , B1 , C1 die Nenner von α, β, γ, so stellen die Ausdr¨ ucke A1L1 U B1N C1L2 U F (n) (u log α)
§ 5.
277
Der Satz von Gel’fond–Schneider
wegen (3) Linearformen in den L1 L2 Unbestimmten p(λ1 , λ2 ) mit Koeffizienten aus OK dar, und zwar hat man N U solche Linearformen gem¨aß der Anzahl der Paare (n, u) in (2). Bezeichnet man ab jetzt positive Konstanten, die alleine von α, β, γ abh¨ angen d¨ urfen, mit c1 , c2 , . . ., so hat man im Hinblick auf die Anwendung des Siegelschen Lemmas 3 mit L := Max(L1 , L2 ) die folgende Absch¨ atzung A1L1 U B1N C1L2 U (λ1 + βλ2 )n αλ1 u γ λ2 u ≤ exp(c1 LU + N log L + c2 N ) =: A. Um die Bedingung N > dM des Siegelschen Lemmas zu garantieren, hat man gegenw¨artig L1 L2 > hN U vorauszusetzen; damit der “Siegelsche Exponent” dM/(N − dM ) in jenem Lemma durch 1 nach oben beschr¨ ankt werden kann, wird noch sch¨ arfer verlangt L1 L2 ≥ 2hN U.
(4)
Nach dem Siegelschen Lemma gibt es dann nicht s¨amtlich verschwindende agen, p(λ1 , λ2 ) ∈ Z mit durch 1 + c3 L1 L2 A nach oben beschr¨ankten Absolutbetr¨ also (5)
|p(λ1 , λ2 )| ≤ exp(c4 LU + N log L + c2 N ) =: B,
so daß die mit diesen p’s gebildete “Hilfsfunktion” F (z) = P (ez , eβz ) s¨amtliche Bedingungen (2) erf¨ ullt. Man hat lediglich c4 geeignet gr¨oßer als c1 zu w¨ahlen.
5. Gewinnung einer zur Absch¨ atzung geeigneten Zahl. Um die in 4.1 angedeutete Beweistaktik verfolgen zu k¨onnen, besorgt man sich nun eine nichtverschwindende Zahl aus K, die in 6 nach unten und in 7 nach oben abgesch¨ atzt wird. Nach 4(1) hat die Hilfsfunktion F die Gestalt F (z) =
L 1 −1 L 2 −1
p(λ1 , λ2 )e(λ1 +βλ2 )z =:
λ1 =0 λ2 =0
L1 L2 −1
pλ ewλ z
λ=0
mit paarweise verschiedenen wλ ∈ C, die in irgendeiner Reihenfolge mit den wegen β ∈ Q paarweise verschiedenen λ1 + βλ2 u ¨bereinstimmen. Da die Vandermonde–Determinante det(wλκ )κ,λ=0,...,L1 L2 −1 von Null verschieden ist und da nach Konstruktion in 4 die pλ (das sind die p(λ1 , λ2 ) aus 4(1)) nicht alle Null sind, folgt aus F
(κ)
(z) =
L1 L2 −1 λ=0
w z κ pλ e λ wλ
(κ = 0, 1, . . .),
278
6. Transzendenz
daß F in ganz C h¨ ochstens Nullstellen einer Ordnung kleiner als L1 L2 haben kann. Nach der vorstehenden Betrachtung ist die ganze Funktion F nicht identisch ur Null. Daher gibt es ein kleinstes M ∈ N, so daß zwar F (n) (u log α) = 0 f¨ u = 0, . . . , U − 1; n = 0, . . . , M − 1, jedoch F (M) (u0 log α) = 0 f¨ ur ein geeignetes u0 ∈ {0, . . . , U − 1}. Nach Konstruktion in 4 ist M ≥ N klar. Wegen 4(3) ist dieses F (M) (u0 log α) ∈ K × und damit ein Kandidat zur weiteren Behandlung nach dem in 4.1 aufgestellten Programm.
6. Untere Absch¨ atzung. Nach 4(3) ist F (M) (u0 log α) ein Polynom in α, β, γ mit Graden h¨ ochstens L1 U , M , L2 U und in Z gelegenen Koeffizienten, die mit R¨ ucksicht auf 4(5) und N ≤ M h¨ ochstens gleich L 1 −1 L 2 −1
|p(λ1 , λ2 )|(λ1 + λ2 )M ≤ exp(c5 LU + 2M log L + c6 M )
λ1 =0 λ2 =0
sind. Nach der Liouville–Absch¨atzung 4.2 ist (1)
log |F (M) (u0 log α)| ≥ −2(h − 1)M log L − c7 LU − c8 M.
7. Obere Absch¨ atzung. Nach den Ergebnissen in 5 ist mit F auch (1)
F1 (z) := F (z)
U−1
(z − u log α)−M
u=0
eine ganze Funktion. Auf |z| = R gilt nach Definition von F und wegen 4(5) die Absch¨ atzung |F (z)| ≤ L2 B exp((1 + |β|)LR). Verlangt man auch noch R ≥ 2U | log α|, so gilt daher auf |z| = R die Absch¨atzung u |z − u log α|M ≥ ( 12 R)MU . Wegen (1), 4(5) und M ≥ N ist somit insgesamt auf |z| = R unter der Voraussetzung (2) (2)
(3)
|F1 (z)| ≤ exp(c9 LR + M log L + c10 M U − M U log R).
Als ganz entscheidend wird sich hier der Anteil −M U log R erweisen, der von den “sehr vielen” Nullstellen herr¨ uhrt, f¨ ur die bei der Konstruktion der Hilfsfunktion F in 4 gesorgt wurde.
§ 5.
Der Satz von Gel’fond–Schneider
279
Durch Taylor–Entwicklung von F um u0 log α sieht man aus (1) sofort F1 (u0 log α) =
U−1 1 (M) (u0 log α) ((u0 − u) log α)−M . F M! u=0 u=u0
In Verbindung mit (3) liefert das Maximumprinzip dann log |F (M) (u0 log α)| ≤ M log M + M U log U + c9 LR + M log L + c11 M U − M U log R. Mit 6(1) kombiniert gibt dies unter Ber¨ ucksichtigung von (2) (4) M U log R ≤ M log M + M U log U + c12 LR + c13 M U + (2h − 1)M log L.
8. Parameterwahl. Da man nun einen Widerspruch erzwingen m¨ochte, muß man versuchen, die noch freien Parameter L1 , L2 , N , U , R so zu w¨ahlen, daß zwar 4(4) : L1 L2 ≥ 2hN U, 7(2) : R ≥ 2U | log α| erf¨ ullt sind, nicht jedoch 7(4). W¨ ahlt man etwa U := 2h+2, N eine Quadratzahl (die gen¨ ugend groß genommen werden kann), L := L1 := L2 := (2h + 1)N 1/2 , so ist jedenfalls 4(4) in Ordnung. W¨ ahlt man weiter etwa R := M 1/2 (≥ N 1/2 ), so ist auch 7(2) erf¨ ullt, wenn man nur N als Quadratzahl ≥ c14 nimmt. Mit den getroffenen Wahlen ist die rechte Seite von 7(4) kleiner als M log M + c15 M + (2h − 1) 12 M log M = (h + 12 )M log M + c15 M . Die linke Seite in 7(4) ist gleich (h + 1)M log M und somit tats¨ achlich gr¨oßer als die rechte, wenn nur M ≥ c16 ist, was durch gen¨ ugend große Wahl von N erzwungen werden kann. Damit ist der Satz von Gel’fond–Schneider bewiesen. Der Leser hat sicher erkannt, daß man bei der Parameterwahl durchaus einen gewissen Spielraum hat; man muß ja “nur” 4(4), 7(2) erf¨ ullen und 7(4) verletzen. Bemerkung. Der in 4 bis 8 gef¨ uhrte Beweis des Satzes von Gel’fond und Schneider folgte der Methode von Gel’fond. W¨ ahrend jedoch Gel’fond sowohl Differentialgleichung als auch Additionstheorem der Exponentialfunktion investierte, kam Schneider alleine mit dem Additionstheorem aus. Schneider begann mit derselben Annahme, konstruierte mit Siegels Lemma sein P in 4(1) aber so, daß F (z) := P (z, αz ) viele einfache Nullstellen hatte, etwa an allen N 2 (wegen β ∈ Q) paarweise verschiedenen Stellen u + βv;
280
6. Transzendenz
u, v = 0, . . . , N − 1. Wieder erweist sich F als nicht identisch Null. Ein funktionentheoretischer Satz, der die sogenannte Wachstumsordnung von F , das ist ) (wobei M (r, F ) := Max|z|=r |F (z)| gesetzt ist), ρ(F ) := limr→∞ log loglogM(r,F r mit ihrer Nullstellenanzahl in “großen” Kreisen um z = 0 in Verbindung bringt, gestattet nun zu schließen, daß F nicht an allen Stellen u + βv, (u, v) ∈ N20 verschwinden kann. Somit hat man die Existenz eines kleinsten M ∈ N, M ≥ N , so daß F zwar an allen Stellen u + βv (u, v = 0, . . . , M − 1) verschwindet, daß es jedoch u0 , v0 mit 0 ≤ u0 , v0 ≤ M , Max(u0 , v0 ) = M und F (u0 + βv0 ) = 0 gibt. Dieses F (u0 + βv0 ) ∈ K × kann nun analog zu 6 und 7 nach unten und oben abgesch¨atzt werden.
9. Ausblicke. Vier neuere Entwicklungstendenzen der analytischen Transzendenztheorie seien noch ganz kurz gestreift. a) Axiomatisierungen. Die Bemerkung am Ende von 8 hat gezeigt, daß sowohl Gel’fond als auch Schneider bei ihren L¨ osungen des siebten Hilbertschen Problems unterschiedliche Methoden angewandt haben, die beide in der Folgezeit zu weiteren Ergebnissen gef¨ uhrt haben. Den ersten Versuch, einen allgemeinen Satz herauszupr¨ aparieren, der m¨oglichst viele, mit der Gel’fondschen Methode beweisbaren Resultate umfaßt, wurde von Schneider 1948 unternommen und sp¨ ater in seinem Buch [26], S¨atze 12 und 13, ausf¨ uhrlich dargestellt. Die wohl eleganteste Version einer solchen “Axiomatisierung” der Gel’fondschen Methode findet der Leser bei M. Waldschmidt [31], S. 77ff., wo eine a¨hnliche Axiomatisierung der Schneiderschen Methode angegeben ist, S. 49ff. b) Bakers Resultate. Man kann den Satz von Gel’fond und Schneider × aquivalent wie folgt formulieren: F¨ ¨ ur α1 , α2 ∈ Q sind log α1 , log α2 u ¨ber Q linear unabh¨ angig genau dann, wenn sie u ¨ber Q linear unabh¨ angig sind; dabei sind die log αj beliebige, aber dann fixierte Bestimmungen des komplexen Logarithmus. Ist n¨amlich die in 1 formulierte Version richtig und nimmt man an, log α1 , log α2 seien u ¨ber Q linear abh¨ angig, nicht aber u ¨ber Q, so besagt dies, daß (β :=) × log α1 are dann αβ2 (= α1 ) transzendent. log α2 ∈ Q \Q ist; wegen α2 ∈ Q , log α2 = 0 w¨ ×
Ist dagegen die neue Version richtig und nimmt man an, es g¨ abe α2 ∈ Q , log α2 = 0 und β ∈ Q \ Q mit αβ2 =: α1 algebraisch, so ist α1 = 0 und log α1 − β log α2 = 0, d.h. log α1 , log α2 w¨aren u ¨ber Q linear abh¨ angig, obwohl sie (wegen β ∈ Q) u ¨ber Q linear unabh¨ angig sind. Baker hat nun in einer Reihe von Arbeiten ab 1966 die in 4 bis 8 dargestellte Gel’fondsche Transzendenzmethode so verallgemeinert, daß er z.B. zei× ¨ber Q linear gen konnte: Sei n ∈ N, α1 , . . . , αn ∈ Q ; log α1 , . . . , log αn sind u
§ 5.
Der Satz von Gel’fond–Schneider
281
unabh¨ angig genau dann, wenn 1, log α1 , . . . , log αn u ¨ber Q linear unabh¨ angig sind. Wesentlich wichtiger noch als diese rein qualitativen Ergebnisse waren f¨ ur die Anwendungen seine quantitativen Versch¨ arfungen des soeben zitierten Satzes, d.h. effektive untere Schranken f¨ ur |β0 + β1 log α1 + . . . + βn log αn | in Abh¨ angigkeit von den Graden und H¨ ohen∗) der algebraischen αi , βj . Solche Resultate spielen z.B. bei den in 2.5 angesprochenen effektiven Versch¨arfungen des Liouvilleschen Approximationssatzes eine große Rolle. F¨ ur seine bahnbrechenden Arbeiten, zu denen man vielleicht am besten durch sein Buch (Transcendental Number Theory, University Press, Cambridge, 1975) Zugang erh¨ alt, wurde Baker auf dem Internationalen Mathematiker–Kongreß in Nizza 1970 mit einer Fields–Medaille ausgezeichnet. ×
c) Gel’fonds Vermutung. Ist α ∈ Q , log α = 0 und β ∈ Q mit d := ∂(β) ≥ 2; dann betrachtet man die d − 1 nach Gel’fond–Schneider transzendenten d−1 ur d ≥ 3 zeigte Gel’fond 1949, daß mindestens zwei Zahlen αβ , . . . , αβ . F¨ der vorstehenden d − 1 Zahlen voneinander algebraisch unabh¨ angig sind; dazu hat er seine Transzendenzmethode von 1934 zu einer Methode f¨ ur algebraische Unabh¨ angigkeit ausgebaut. Er vermutete, daß s¨ amtliche d − 1 Potenzen unter den genannten Voraussetzungen voneinander algebraisch unabh¨ angig sind. F¨ ur d = 3 ist dies in seinem zitierten Resultat enthalten, aber f¨ ur kein d ≥ 4 ist die Vermutung bewiesen, obwohl sich gerade die Gel’fondsche Methode f¨ ur algebraische Unabh¨angigkeit in den letzten 15 Jahren enorm entwickelt hat. Das beste in dieser Richtung zur Zeit bekannte Resultat stammt von G. Diaz (1987): Unter den obigen d−1 Potenzen gibt es mindestens [ 21 (d+1)] voneinander algebraisch unabh¨ angige. d) Schanuels Vermutung: Sind α1 , . . . , αn ∈ C u ¨ber Q linear unabh¨ angig, so kommen unter den 2n Zahlen α1 , . . . , αn , eα1 , . . . , eαn n voneinander algebraisch unabh¨ angige vor. Dies ist die weitestgehende Vermutung u ¨ber die arithmetische Natur von Werten der Exponentialfunktion. Im Falle algebraischer α1 , . . . , αn ist ihre Aussage richtig und identisch mit Version 2 des Satzes von Lindemann– ¨ber Q linear Weierstrass. Ist β ∈ Q und d := ∂(β) ≥ 2, so sind 1, β, . . . , β d−1 u unabh¨ angig und die Vermutung von S. Schanuel, angewandt mit n := d, w¨ urde d−1 × die algebraische Unabh¨ angigkeit von αβ , . . . , αβ , log α bei α ∈ Q , log α = 0, also auch die Gel’fondsche Vermutung aus c) implizieren. Die Richtigkeit der Schanuelschen Vermutung w¨ urde z.B. auch die algebraische Unabh¨ angigkeit von e und π enthalten und damit insbesondere die Transzendenz von e + π und eπ. ∗)
Unter der H¨ohe einer algebraischen Zahl versteht man die H¨ ohe ihres ganzzahligen Minimalpolynoms.
Kapitel 7. Primzahlen
Dieses Schlußkapitel handelt nochmals, nun sehr ausf¨ uhrlich, von den multiplikativen Bausteinen der nat¨ urlichen Zahlen, den Primzahlen. Der Euklidsche Satz u ¨ber die Unendlichkeit der Primzahlmenge, f¨ ur den in den Kapiteln 1 und 2 f¨ unf Beweise gegeben wurden, legt zahlreiche Fragen nahe, von denen hier einige besprochen werden sollen. So geht es in § 1 zun¨ achst um die Darstellbarkeit von Primzahlen als Werte gewisser Funktionen. Des weiteren wird die Problematik der großen bzw. kleinen L¨ ucken in der Primzahlfolge behandelt. Die Frage nach der Gr¨ oßenordnung von π(x), der Anzahl aller Primzahlen unterhalb x, auf die schon in 1.4.5 und in § 1 erste Antworten gefunden wurden, r¨ uckt in den §§ 2 und 3 immer mehr in den Mittelpunkt. In § 2 werden haupts¨achlich die S¨atze von Tchebychef diskutiert, die bereits die richtige Gr¨ oßenordnung von π(x) erkennen lassen. W¨ahrend hier jedoch sehr einfache Hilfsmittel ausreichen, st¨ utzt sich der in § 3 gegebene analytische Beweis des Primzahlsatzes von Hadamard und De La Vallee Poussin, der die Asymptotik π(x) ∼ x/ log x beinhaltet, wesentlich auf funktionentheoretische S¨atze, insbesondere auf eine detaillierte Untersuchung der von Riemann eingef¨ uhrten Zetafunktion.
§ 1.
Elementare Ergebnisse
1. Darstellung von Primzahlen durch Polynome. Goldbach bemerkte in einem Brief vom 18. November 1752 an Euler, daß ein Polynom nicht nur Primzahlen darstellen kann. Diese Aussage wird im folgenden Satz pr¨azisiert, dessen Beweis einer Idee Eulers (1760) folgt. Satz. Ein Polynom in einer Unbestimmten mit komplexen Koeffizienten, dessen Werte an allen gen¨ ugend großen ganzzahligen Stellen Primzahlen sind, ist konstant.
§ 1.
Elementare Ergebnisse
283
Beweis. Sei f ∈ C[X] und f (n) ∈ IP f¨ ur alle n ≥ n0 bei geeignetem ganzem n0 . Dies zieht ersichtlich f ∈ Q[X] nach sich und deswegen gibt es ein γ ∈ N mit γf ∈ Z[X]. Ist p0 die Primzahl f (n0 ), wendet man die Taylor–Formel 2.4.4(1) an und substituiert dort n0 bzw. γtp0 , t ∈ N0 , f¨ ur X bzw. Y , so erh¨ alt man f (n0 + γtp0 ) = f (n0 ) + tp0
1 γf (λ) (n0 )(γtp0 )λ−1 , λ!
λ≥1
1 γf (λ) (n0 ) ganz sind. So geht p0 = f (n0 ) in allen Primzahlen wobei alle λ! f (n0 + γtp0 ), t ∈ N0 , auf, weshalb f (n0 + γtp0 ) = f (n0 ) f¨ ur alle t ∈ N0 sein muß. Dies impliziert die Konstanz von f .
Bemerkungen. 1) W¨ahrend es also keine nichtkonstanten komplexen Polynome gibt, die an allen gen¨ ugend großen ganzzahligen Stellen Primzahlen als Werte annehmen, hat man immer wieder versucht, wenigstens nichtkonstante Polynome zu finden, die an vielen sukzessiven ganzzahligen Stellen Primzahlwerte haben. So hat Euler 1772 angemerkt, daß X 2 − X + 41 an allen Stellen 1, 2, . . . , 40 Primzahlwerte hat. Legendre (Th´eorie des Nombres, 1798, No. 255) notierte, daß X 2 + X + 41 an den Stellen 0, . . . , 39 (nach Eulers Resultat also sogar an −40, −39, . . . , 0, . . . , 39) Primzahlwerte annimmt. Ersetzt man in Legendres Polynom X durch X − 40, so gewinnt man X 2 − 79X + 1601 als Polynom, das an den Stellen 0, 1, . . . , 79 Primzahlwerte hat. ¨ Ubrigens steht hinter der Eulerschen Bemerkung der 1913 von G. Rabinowitsch entdeckte Satz. F¨ ur negative ganze, quadratfreie d ≡ 1 (mod 4) sind folgende Aussagen aquivalent: ¨ (i) (ii)
Das Polynom X 2 − X + 14 (1 + |d|) hat an allen Stellen 1, 2, . . . , 14 (|d| − 3) Primzahlwerte. √ Der Ganzheitsring des imagin¨ ar–quadratischen Zahlk¨ orpers Q( d) ist faktoriell.
√ Wie in der Bemerkung zu 1.6.9 festgestellt, ist der Ganzheitsring von Q( −163) Hauptidealring, also nach Satz 1.5.5C faktoriell und so liefert die Implikation (ii) ⇒ (i) des zitierten Satzes genau das obige Eulersche Polynom mit vielen Primzahlwerten. 2) Man kann sich nat¨ urlich auch fragen, ob nichtkonstante ganzzahlige Polynome die Eigenschaft haben k¨onnen, daß sie wenigstens an unendlich vielen ganzzah¨ ligen Stellen Primzahlen als Werte annehmen. Uber den gegenw¨ artigen Stand dieses Problems wurde bereits in 3.2.10 berichtet.
284
7. Primzahlen
3) In Erg¨ anzung zu dem oben bewiesenen Satz sei noch erw¨ahnt, daß es Matijasevic im Zusammenhang mit seiner negativen L¨osung des zehnten Hilbert– Problems (vgl. 6.2.5) gelungen ist, ein ganzzahliges Polynom in mehreren Unbestimmten so zu konstruieren, daß dieses s¨amtliche Primzahlen, aber keine anderen nat¨ urlichen Zahlen als Werte annimmt, wenn die Komponenten der Argumentstellen unabh¨ angig voneinander alle nichtnegativen ganzen Zahlen durchlaufen. Ein derartiges Polynom (in 26 Unbestimmten) findet der Leser explizit auf Seite 331 des in 3.2.13 zitierten Sammelwerks Mathematical developments arising from Hilbert problems. 4) R.C. Buck (Amer. Math. Monthly 53, 265 (1946)) hat gezeigt, daß man das Wort Polynom im Satz durch rationale Funktion ersetzen kann.
2. Exponentielle Folgen von Primzahlen. W.H. Mills (Bull. Amer. Math. Soc. 53, 604 (1947)) hat mit der Entdeckung des folgenden Resultats zahlreiche weitere Untersuchungen angeregt, die sich mit der Frage der Darstellung unendlich vieler (oder aller) Primzahlen durch m¨ oglichst “einfache” Forn ur alle nat¨ urlichen meln besch¨aftigen: Es gibt eine reelle Zahl u > 1, so daß [u3 ] f¨ n Primzahl ist. Obwohl der Beweis dieses Millsschen Satzes elementar ist, hat er den Nachteil, von dem tiefliegenden, mit analytischen Methoden bewiesenen Satz von A.E. Ingham (Quart. J. Math. Oxford (2) 8, 255–266 (1937)) (1)
5/8
pk+1 − pk = O(pk )
(k → ∞)
u ¨ber die Gr¨ oßenordnung der Differenz sukzessiver Primzahlen abzuh¨angen. Dabei bedeutet hier und im folgenden stets pk die k–te Primzahl, wenn man der Gr¨ oße nach ordnet, also p1 = 2, p2 = 3, p3 = 5 usw. Das nachfolgend zitierte Ergebnis von E.M. Wright (Amer. Math. Monthly 58, 616–618 (1951)) h¨ angt weder von (1) noch von einer der neueren Versch¨ arfungen von (1) ab, sondern lediglich von der elementar beweisbaren Absch¨ atzung (2)
pk+1 − pk < pk
(k = 1, 2, . . .);
daf¨ ur w¨ achst aber die nur Primzahlen darstellende Folge mit zunehmendem n sehr viel schneller als im Millsschen Beispiel: Zu jeder Primzahl p existiert ein reelles u ∈]p, p + 1[ , so daß alle Zahlen [wn ] mit n ∈ N0 Primzahlen sind; dabei ist w0 := u und wn+1 := 2wn f¨ ur alle nichtnegativen ganzen n gesetzt. Die Richtigkeit von (2) folgt aus dem sogenannten Bertrandschen Postulat: F¨ ur jedes reelle x ≥ 1 existiert eine Primzahl im Intervall ]x, 2x]. Dies hat 1852 P.L. Tchebychef (Oeuvres I, 49–70) mit elementaren Mitteln gezeigt,
§ 1.
285
Elementare Ergebnisse
die denjenigen eng verwandt sind, die in § 2 zum Zuge kommen. Die (heute leicht irref¨ uhrende) Bezeichnung des “Postulats” r¨ uhrt daher, daß J. Bertrand (J. Ecole Roy. Polytechn. 17, 129 (1845)) festgestellt hat, f¨ ur jedes n = 7, . . . , 6 · 106 existiere mindestens eine Primzahl zwischen 12 n und n − 2 und daraufhin vermutete, das sei wohl immer so. Bemerkung. Als Beispiel einer Formel, die alle Primzahlen darstellt, sei ein Resultat von W. Sierpinski (C. R. Acad. Sci. Paris 235, 1078–1079 (1952)) zitiert. Diesem werde vorausgeschickt, daß pk ≤ 2k f¨ ur alle k ∈ N gilt, wie (2) k sofort induktiv lehrt. Daher konvergiert die Reihe k≥1 pk 10−2 ; ihr Wert sei a. Dann gilt f¨ ur alle k ∈ N (3)
k
pk = [102 a] − 102
k−1
[102
k−1
a].
¨ Man muß allerdings vor einer Ubersch¨ atzung der Bedeutung derartiger Versuche warnen: Um viele Primzahlen aus (3) zu berechnen, muß man gen¨ ugend viele Dezimalstellen von a kennen und dazu ben¨ otigt man wiederum die Kenntnis vieler Primzahlen, wie man aus der Reihendarstellung von a sieht.
3. Große L¨ ucken. In 2 wurden mehrfach obere Absch¨ atzungen f¨ ur die Differenz sukzessiver Primzahlen referiert (vgl. 2(1), 3(2)). Eine Aussage in entgegengesetzter Richtung macht folgender Satz.
Die Folge der Differenzen sukzessiver Primzahlen ist nicht beschr¨ ankt.
Beweis. Ist J ∈ N beliebig, so betrachte man die J Zahlen zj := (J + 1)! + j f¨ ur ur die genannten j und so hat j = 2, . . . , J +1. Offenbar ist j echter Teiler von zj f¨ man J aufeinanderfolgende zusammengesetzte nat¨ urliche Zahlen konstruiert. Bemerkung. Die l¨angste derzeit explizit bekannte Primzahll¨ ucke schließt an die Primzahl 218 209 405 436 543 an, wonach genau 906 zusammengesetzte Zahlen folgen (vgl. T.R. Nicely, Math. Comp. 68, 1311–1315 (1999)). Der Beweis des obigen Satzes garantiert eine derartig große L¨ ucke erst oberhalb 102290 .
4. Sieb des Eratosthenes, Primzahltafeln. Bevor in 6 das Problem besonders kleiner L¨ ucken in der Primzahlfolge √ diskutiert wird, soll hier ein Verfahren zur Bestimmung aller Primzahlen p mit x < p ≤ x beschrieben werden, wenn √ man s¨amtliche p ≤ x bereits kennt. Dieses Verfahren n¨ utzt die folgende einfache Tatsache aus.
286
7. Primzahlen
√ Proposition. F¨ ur reelles x > 1 und ganze n mit x < n ≤ √ x gilt: n ist Primzahl genau dann, wenn jede n teilende Primzahl gr¨ oßer als x ist. √ ur p(n), Beweis. F¨ ur alle Primzahlen p mit p|n sei p > x; dies gilt insbesondere√f¨ √ die kleinste n teilende Primzahl (man beachte n ≥ 2).Also ist p(n) > x ≥ n und nach Proposition 1.1.4 ist n Primzahl. Die Umkehrung ist trivial. Das in Aussicht gestellte Verfahren werde nun an einem Beispiel (x = 270) erl¨ autert. Man schreibt alle nat¨ urlichen n ≤ x (= 270) in √ einem rechteckigen Schema (mit 2 · 3 · 5 = 30 Spalten) hin und macht die x (< 17) nicht u ¨bersteigenden Primzahlen (2, 3, 5, 7, 11, 13) kenntlich (hier durch Fettdruck). Sodann markiert man deren im Schema vorkommenden Vielfachen (hier durch Unterstreichen). Dabei sind zur Ersparnis der Schreibarbeit von vornherein die Vielfachen von 2, 3 oder 5 weggelassen, was damit gleichbedeutend ist, daß man nur die zu 30 teilerfremden n ins Schema aufnimmt; dies f¨ uhrt anstelle von 30 zu ϕ(30) = 8 Spalten. Nach der vorangestellten Proposition sind die nicht √ unterstrichenen n zwischen x und x genau die Primzahlen dieses Intervalls.
1 31 61 91 121 151 181 211 241
7 37 67 97 127 157 187 217 247
11 41 71 101 131 161 191 221 251
13 43 73 103 133 163 193 223 253
17 47 77 107 137 167 197 227 257
19 49 79 109 139 169 199 229 259
23 53 83 113 143 173 203 233 263
29 59 89 119 149 179 209 239 269
Den hier beschriebenen Algorithmus bezeichnet man als Sieb des Eratosthenes. Eratosthenes von Kyrene (3. Jahrhundert v.Chr.) hat auf dem H¨ ohepunkt seines Schaffens wie Diophant (vgl. 1.3.1) in Alexandria gelebt. Sein Verfahren wurde durch die Introductio Arithmetica des Nikomachos von Gerasa (um 100 n. Chr.) u ¨berliefert. Das Sieb des Eratosthenes ist f¨ ur numerische Zwecke gut geeignet. Insbesondere dient es zur Erstellung (nicht zu umfangreicher) Primzahltafeln. So schreibt man aus dem soeben vorgef¨ uhrten Beispiel die folgende kleine Tafel zusammen (π ist die in 1.1.4 definierte Anzahlfunktion).
§ 1.
x 2 3 5 7 11 13 17 19 23 29
π(x)
5
10
x 31 37 41 43 47 53 59 61 67 71
π(x)
15
20
x 73 79 83 89 97 101 103 107 109 113
287
Elementare Ergebnisse
π(x)
25
30
x 127 131 137 139 149 151 157 163 167 173
π(x)
35
40
x 179 181 191 193 197 199 211 223 227 229
π(x)
45
x 233 239 241 251 257 263 269
π(x)
55
50
Die historische Entwicklung der Primzahltafeln sei in groben Z¨ ugen durch eine kleine Aufstellung nachgezeichnet: L. Fibonacci (1202) F. Van Schooten (1657) ¨ger (1746), J.H. Lambert (1770) J.G. Kru G. Vega (1796) L. Chernac (1811) J.C. Burckhardt (1814/7) Z. Dase (1862) J. Glaisher (1879/83) D.N. Lehmer (1909/14)
p < 102 p < 104 p < 105 p < 4 · 105 p < 106 p < 3 · 106 6 6 · 10 < p < 9 · 106 3 · 106 < p < 6 · 106 p < 107
Die letztgenannte Primzahltafel von Lehmer (List of Prime Numbers from 1 to 10, 006, 721, Carnegie Inst. Washington, Publ. No. 165, 1914) wurde 1956 neu aufgelegt und d¨ urfte noch immer die weitverbreitetste sein, wenngleich man im Zeitalter der immer schnelleren Computer Vertafelungen der Primzahlen bis in die Gr¨ oßenordnung 109 vorgenommen hat. Wenn man eine Tafel aller Primzahlen bis N hat, kann man π(x) f¨ ur alle x ≤ N unmittelbar durch Ausz¨ ahlen ermitteln. Tats¨ achlich hat Gauss genau auf diesem Wege aus den Tafeln von Lambert und Vega die (richtige) Vermutung u ¨ber das Verhalten von π(x) bei x → ∞ herauspr¨ apariert (vgl. 2.1). In seiner Besprechung der neu erschienenen Primzahltafeln von Chernac ¨ außerte er sich dann auch begeistert (Werke II, 181–182) “... Wie sch¨atzbar ein solches der Arithmetik gemachtes Geschenk sei, beurtheilt ein Jeder leicht, der viel mit gr¨ ossern Zahlenrechnungen zu thun hat. Der Verf. verdient doppelten Dank, sowohl f¨ ur seine h¨ ochst m¨ uhsame Arbeit selbst,..., als f¨ ur den gewiss sehr erheblichen auf den Druck gemachten Aufwand, wof¨ ur sich
288
7. Primzahlen
sonst schwerlich ein Verleger gefunden haben m¨ ochte. . . . Die erste Million ist nun f¨ ur Jedermanns Gebrauch da; und wer Gelegenheit und Eifer f¨ ur diesen Gegenstand hat, m¨oge daher seine M¨ uhe auf das Weitere richten.” Auf M¨ oglichkeiten, π(x) exakt bis weit hinein in Bereiche zu berechnen, in denen l¨ angst nicht mehr alle Primzahlen bekannt sind, wird in 5 kurz eingegangen.
5. Anzahlfunktion. Ist wieder x > 1 reell (wie in 4), ¨berstehen genau die √ so u √ 1+π(x) −π( x) Zahlen 1 und die Primzahlen p mit x < p ≤ x den Siebprozeß nach Eratosthenes: Aus der Menge aller nat¨ urlichen n ≤ x sind ja genau die √ Primzahlen p ≤ x und deren Vielfache ausgesiebt worden. Definiert man f¨ ur beliebige reelle y (1)
P (y) :=
p
p≤y
sowie (2)
Q(x, y) := #{n ∈ N : n ≤ x, (n, P (y)) = 1},
so ist die Gleichung (3)
√ √ 1 + π(x) − π( x) = Q(x, x)
unmittelbar einsichtig. Q(x, y) wird nun f¨ ur die weiteren Betrachtungen geeignet umgeformt, indem man sich der in Satz 1.4.9(iii) notierten Eigenschaft der ¨ bius–Funktion μ bedient. So ergibt sich Mo 1= μ(d). (4) Q(x, y) = n≤x d|(n,P (y))
n≤x (n,P (y))=1
Die letzte Summationsbedingung d|(. . .) ist nach Definition des ggT a¨quivalent zu den beiden Bedingungen d|n, d|P (y), so daß man weiter die Formel (5)
Q(x, y) =
d|P (y)
μ(d)
1=
d|P (y)
n≤x d|n
x μ(d)[ ] d
hat, wegen (3) insbesondere (6)
√ π(x) = π( x) − 1 +
√ d|P ( x)
x μ(d)[ ]. d
§ 1.
289
Elementare Ergebnisse
Nach 1.4.9 ist μ(d) in (5) und (6) nur der Werte 1 und −1 f¨ ahig, da P (y) quadratfrei ist. Die Anzahl der d ∈ N mit d|P (y), also der Summanden rechts in (5), ist 2π(y) . Sind n¨ amlich p1 , . . . , pπ(y) genau die y nicht u ¨bersteigenden Primzahlen, so sind daraus genau 2π(y) verschiedene quadratfreie d ∈ N multiplikativ zu bilden. √ Formel (6) erlaubt nun die exakte Berechnung von π(x), wenn alle x nicht u ¨bersteigenden Primzahlen bekannt sind (vgl. Ende von 4). Diese prinzipielle M¨ oglichkeit zur Ermittlung von π(x) ist in der Praxis nat¨ urlich stark limitiert durch die mit x rasch anwachsende Anzahl der rechts in (6) zu ber¨ ucksichtigenden Summanden. Mit verfeinerten Siebtechniken haben verschiedene Autoren zu (6) analoge Formeln f¨ ur π(x) ersonnen, bei denen der genannte Nachteil von (6) sukzessive reduziert wurde. Zu erw¨ ahnen sind hier vor allem E.D.F. Meissel (Math. Ann. 2, 636–642 (1870)), D.H. Lehmer (Illinois J. Math. 3, 381–388 (1959)) sowie J.C. Lagarias, V.S. Miller und A.M. Odlyzko (Math. Comp. 44, 537–560 (1985)). Die Werte f¨ ur π(108 ) und π(109 ) in der nachfolgenden Tabelle stammen von Meissel, der letztere allerdings um 56 nach oben korrigiert von Lehmer, dessen Berechnung von π(1010 ) um 1 nach unten korrigiert werden mußte. F¨ ur i = 11, 12, 13 wurde π(10i ) von J. Bohman (mittels Lehmers Methode) im Jahre 1972 angegeben, f¨ ur i = 14, 15, 16 von Lagarias, Miller und Odlyzko. i
π(10i)
1 2 3 4 5 6 7 8 9
4 25 168 1 229 9 592 78 498 664 579 5 761 455 50 847 534
i 10 11 12 13 14 15 16 17 18
π(10i) 455 052 511 4 118 054 813 37 607 912 018 346 065 536 839 3 204 941 750 802 29 844 570 422 669 279 238 341 033 925 2 623 557 157 654 233 24 739 954 287 740 860
Bemerkung. In Bemerkung 3 zu 1.4.5 wurde in quantitativer Weise gezeigt, daß es nicht zu wenig Primzahlen gibt. In entgegengesetzter Richtung kann unter Ausn¨ utzung der Darstellung (5) der in (2) definierten Funktion Q(x, y) bewiesen werden, daß fast keine nat¨ urliche Zahl Primzahl ist in folgendem Sinne: x Bei x → ∞ gilt π(x) = O( log log x ). Euler (Opera Omnia Ser. 1, XIV, 216– 244) hat 1737 festgestellt, daß es “unendlich viel weniger Primzahlen als ganze Zahlen” gibt; seine Begr¨ undung bewies die Behauptung jedoch nicht in dem soeben pr¨azisierten Sinne.
290
7. Primzahlen
6. Primzahlzwillinge. Ist pk , wie nach 2(1) vereinbart, die k–te Primzahl und wird dk := pk+1 − pk gesetzt, so zeigt Satz 3 die Unbeschr¨anktheit der Folge (dk )k∈N . Andererseits ist dk = 1 genau f¨ ur k = 1, also dk ≥ 2 f¨ ur k ≥ 2. Jedes Paar (pk , pk+1 ) mit dk = 2 heißt ein Primzahlzwilling. Beispiele hierf¨ ur sind (3,5), (5,7), (11,13), (17,19). Analog dazu, wie man seit Jahrhunderten m¨ oglichst große Primzahlen explizit zu finden sucht (vgl. 3.2.12), ist man auch an m¨ oglichst großen Primzahlzwillingen interessiert. Genannt seien hier die Paare (n−1, n+1) mit n = 109 +8, 1012 +62, 76 · 3139 , 156 · 5202 , 297 · 2546 , 318 032 361 · 2107001 , wobei die letzte Zahl bereits 32 220 Dezimalstellen hat. Als Anzahlfunktion wird man hier, a¨hnlich wie π(x) bei den Primzahlen, zu untersuchen haben π2 (x) := #{n ∈ N : n, n + 2 ∈ IP, n + 2 ≤ x}.
(1)
Definiert man mit der Bezeichnung 5(1) jetzt analog zu 5(2) (2)
Q2 (x, y) := #{n ∈ N : n ≤ x, (n(n + 2), P (y)) = 1},
so u ¨berlegt man sich leicht, daß f¨ ur x ≥ 9 die Gleichung √ √ π2 (x) − π2 ( x + 2) = Q2 (x − 2, x)
(3)
gilt, die man √ als Analogon zu 5(3) zu betrachten hat. Die Auswertung von Q2 (x − 2, x) ist allerdings nicht einfach zu handhaben, weshalb (3) f¨ ur die exakte Berechnung von π2 (x) ungeeignet ist. In dieser Hinsicht bleibt man bei den Primzahlzwillingen auf die grobe Methode des Abz¨ ahlens angewiesen, die zur folgenden Tabelle f¨ uhrt: i
π2 (10i )
i
1 2 3 4 5 6
2 8 35 205 1 224 8 169
7 8 9 10 11 12
π2 (10i ) 58 980 440 312 3 424 506 27 412 679 224 376 048 1 870 585 220
Die vorstehende Tabelle st¨ utzt die Vermutung, daß es unendlich viele Primzahlzwillinge gibt. Die Frage nach dem Analogon zum Euklidschen Satz 1.1.4 ist demnach noch offen.
§ 1.
Elementare Ergebnisse
291
Im folgenden soll kurz u ¨ber einige Resultate in dieser Richtung referiert werden. Dazu werde zuerst angemerkt, daß hinter Gleichung (3) offenbar wie in 4 und 5 die Siebmethode von Eratosthenes steht: Aus der Folge aller Produkte n(n + √ 2) mit n + 2 ≤ x siebt man diejenigen aus, die Vielfache einer Primzahl p ≤ x sind. V. Brun hat ab 1915 in einer Reihe von Arbeiten eine neuartige Siebmethode entwickelt, mit deren Hilfe er die Anzahlfunktion (2) wesentlich subtiler absch¨ atzen konnte, als dies via der Analoga zu 5(4) und 5(5) m¨ oglich war. Die interessantesten S¨atze von Brun u ¨ber Primzahlzwillinge sind diese: ∗ ¨ber alle Primzahlen p, f¨ ur die auch p + 2 Primzahl ist, a) Die Reihe p p−1 u konvergiert. Falls es u ¨berhaupt unendlich viele Primzahlzwillinge gibt, sind sie jedenfalls sehr viel seltener als die Primzahlen, deren Reziprokensumme p p−1 nach Bemerkung 4 zu 1.4.5 divergiert. b) Es gibt unendlich viele nat¨ urliche n mit Ω(n) ≤ 9 und Ω(n+2) ≤ 9. Dabei ist die (streng additive) zahlentheoretische Funktion Ω wie folgt erk¨ art: Ist νp (n) die Vielfachheit von p in n, so ist Ω(n) := p νp (n). Klar ist, daß die obige Vermutung bewiesen w¨are, wenn man Ω(n), Ω(n + 2) ≤ 9 in b) durch Ω(n), Ω(n + 2) < 2 ersetzen k¨onnte. In dieser Richtung wurde 1973 tats¨achlich die vorletzte Stufe erreicht, als Chen (Sci. Sinica 16, 157–176 (1973)) mit neueren Siebmethoden zeigte: Es gibt unendlich viele Primzahlen p mit Ω(p + 2) ≤ 2. Bemerkungen. 1) Das Problem der Primzahlzwillinge geh¨ ort zu einem allgemeineren Problemkreis, den man mit Siebmethoden wirkungsvoll angreifen kann: Seien a, k, ∈ N, b ∈ Z \ {0}, 2|ab, (a, b) = 1, (k, ) = 1. Was l¨aßt sich aussagen u ¨ber die Anzahl der Primzahlen p ≡ (mod k), f¨ ur die ap + b ebenfalls Primzahl ist? Der Fall a = k = = 1, b = 2 ist das oben diskutierte Problem der Primzahlzwillinge; auf den Fall a = 2, b = 1, k = 4, = 3 beziehen sich die Voraussetzungen u ¨ber p in Korollar 3.2.12. ¨ 2) Uber Siebmethoden und ihre Anwendungen kann sich der Leser orientieren in Kapitel IV des Buches von H. Halberstam und K.F. Roth (Sequences I, Clarendon, Oxford, 1966), ferner in den B¨ uchern von Halberstam und Richert (Sieve Methods, Academic Press, London etc., 1974) bzw. von W. Schwarz Einf¨ uhrung in Siebmethoden der analytischen Zahlentheorie, Bibliographisches Institut, Mannheim etc., 1974).
7. Die Goldbach–Probleme. Goldbach schrieb in einem Brief vom 7. Juni 1742 an Euler, scheinbar sei jede ganze Zahl gr¨oßer als Eins ein aggregatum trium numerorum primorum. In seiner Antwort vom 30. Juni ging Euler auf
292
7. Primzahlen
diese Passage ein, indem er es als sicher erachtete, daß jeder numerus par summa duorum primorum sei. Seit man die Eins nicht mehr zu den Primzahlen rechnet, formuliert man zwei Goldbach–Probleme: a) Jede gerade Zahl gr¨oßer als Zwei ist als Summe zweier Primzahlen darstellbar. b) Jede ungerade Zahl gr¨oßer als F¨ unf ist als Summe dreier Primzahlen darstellbar. Klar ist, daß b) von a) impliziert wird. Ist n¨ amlich n ≥ 7 ungerade, so ist n − 3 ≥ 4 gerade und nach a) hat man n = 3 + p + p mit Primzahlen p, p . Noch im Jahre 1900 beurteilte Hilbert in seinem bereits in 3.2.13 und 6.5.1 zitierten Pariser Vortrag die Aussichten, bei den Goldbach–Problemen [und bei dem in 6 behandelten Problem der Primzahlzwillinge] in n¨ achster Zeit voranzukommen, offenbar nicht zu optimistisch: “ ... wird man vielleicht dereinst in die Lage kommen, an die strenge Beantwortung des Problems von Goldbach zu gehen, ... [ferner an die bekannte Frage, ob es unendlich viele Primzahlenpaare mit der Differenz 2 gibt ...]” Um 1920 gab es dann erste wesentliche Fortschritte bei beiden Goldbach– Problemen. Brun konnte mit seiner schon in 6 erw¨ ahnten Siebmethode zeigen, daß es zu jedem gen¨ ugend großen geraden n ein nat¨ urliches q mit q < n gibt, so daß Ω(q), Ω(n − q) ≤ 9 gilt. Verbesserte Siebmethoden ergaben durch Chen (Kexue Tongbao 17, 385–386 (1966)) folgendes bisher beste Ergebnis zu a): Zu jedem gen¨ ugend großen geraden n gibt es eine Primzahl p < n mit Ω(n − p) ≤ 2. Als derzeit weitreichendstes numerisches Resultat zu a) sei dasjenige von T. Oliveira e Silva (http://listserv.nodak.edu/...) von 2005 erw¨ ahnt, nachdem jede gerade Zahl n mit 4 ≤ n ≤ 3 · 1017 Summe zweier Primzahlen ist. W¨ ahrend Problem a) noch offen ist, wurde b) prinzipiell gel¨ost. Einen ersten entscheidenden Schritt machten dabei Hardy und Littlewood (Acta Math. 44, 1–70 (1923)), die mit einer analytischen Methode zeigten, daß jede große ungerade Zahl Summe dreier Primzahlen ist, vorausgesetzt allerdings, eine Verallgemeinerung der in 3.12 zu diskutierenden unbewiesenen Riemannschen Vermutung ist richtig. Daß grunds¨ atzlich ein gangbarer Weg zur Behandlung von b) gefunden war, erwies sich bald als wichtiger als die Einschr¨ ankung des erzielten Resultats durch die unbewiesene Voraussetzung. I.M. Vinogradov (Dokl. Akad. Nauk SSSR 15, 291–294 (1937)) gelang es n¨ amlich, durch Verfeinerung der analytischen Techniken das Hardy–Littlewood–Resultat von der unbewiesenen Annahme zu befreien. Vinogradov zeigte, daß jede ungerade Zahl 15 gr¨ oßer als 33 Summe dreier Primzahlen ist. Diese Schranke konnte inzwischen von Chen und T. Wang (Acta Math. Sinica 32, 702–718 (1989)) auf exp(exp(11, 503)) =: E gesenkt werden, eine Zahl, die im Dezimalsystem immer noch etwa 43000 Ziffern hat. Um b) vollst¨andig zu beweisen, bleiben “lediglich”
§ 2.
Anzahlfunktion: Tchebychefs S¨ atze
293
noch die ungeraden n mit 3 · 1017 < n ≤ E zu kontrollieren. Bemerkung. Eine Darstellung des Chenschen Satzes findet sich in Kapitel 11 des in Bemerkung 2 zu 6 zitierten Buchs von Halberstam und Richert. Mit den von Hardy, Littlewood und Vinogradov angewandten Methoden kann man sich sehr gut vertraut machen durch das Studium des Buchs von Vaughan [30]. Die wichtigsten Originalarbeiten zu den Goldbach–Problemen sind in Buchform zusammengefaßt durch Y. Wang (Goldbach Conjecture, World Scientific, Singapore, 1984), aufgeteilt nach elementaren (hierzu rechnet man weite Teile der Siebtheorie) und analytischen Methoden. Zu dieser in der Zahlentheorie u ¨blich gewordenen Einteilung der Methoden werden in 3.9 einige grunds¨ atzliche Worte zu sagen sein.
§ 2.
Anzahlfunktion: Tchebychefs S¨ atze
1. Vermutungen von Legendre und Gauss. Bis zum Ende des achtzehnten Jahrhunderts kannte man u ¨ber das asymptotische Verhalten der Anzahlfunktion → 0 bei π lediglich die beiden qualitativen Aussagen π(x) → ∞ bzw. π(x) x x → ∞ von Euklid bzw. Euler. Quantitative Verfeinerungen lagen nicht vor. Erst das gewissenhafte Ausz¨ahlen immer umfangreicherer Primzahltafeln (vgl. 1.4) f¨ uhrte unabh¨ angig voneinander Legendre und Gauss zu Vermutungen, die beide nach geeigneter Interpretation zur asymptotischen Gleichheit (vgl. 1.4.12) (1)
π(x) ∼
x (x → ∞) log x
aquivalent sind. ¨ Legendre (Th´eorie des Nombres, 1798, No. 394–401) verglich die aus den Tafeln von Vega, Chernac und Burckhardt ermittelten Werte von π(x) f¨ ur x ≤ 106 mit der Funktion (2)
λ(x) :=
x log x − 1, 08366
¨ und fand im betrachteten Bereich sehr gute Ubereinstimmung. In No. 395 a.a.O. sagte er ganz deutlich, es bliebe nur noch u ¨brig, das allgemeine Gesetz zu beweisen. Gauss hat seine Anmerkungen u ¨ber die Approximation von π(x) durch eine “einfache” Funktion in einem Brief vom 24. Dezember 1849 an J.F. Encke mitgeteilt (Werke II, 444–447). Wie aus diesem Brief hervorgeht, datiert seine
294
7. Primzahlen
erste Besch¨aftigung mit dem Problem mindestens bis 1793 zur¨ uck (er war damals sechzehn Jahre alt): “Die g¨ utige Mitteilung Ihrer Bemerkungen u ¨ber die Frequenz der Primzahlen ist mir in mehr als einer Beziehung interessant gewesen. Sie haben mir meine eigenen Besch¨aftigungen mit demselben Gegenstande in Erinnerung gebracht, deren erste Anf¨ange in eine sehr entfernte Zeit fallen, ins Jahr 1792 oder 1793, wo ich mir die Lambert’schen Supplemente zu den Logarithmentafeln angeschafft hatte. Es war noch ehe ich mit feineren Untersuchungen aus der h¨oheren Arithmetik mich befaßt hatte eines meiner ersten Gesch¨afte, meine Aufmerksamkeit auf die abnehmende Frequenz der Primzahlen zu richten, zu welchem ahlte, und die Resultate auf Zweck ich dieselben in einzelnen Chiliaden∗) abz¨ einem der angehefteten weissen Bl¨atter verzeichnete.∗∗) Ich erkannte bald, dass unter allen Schwankungen diese Frequenz durchschnittlich nahe dem Logarithmen verkehrt proportional sei, so dass die Anzahl aller Primzahlen unter einer gegebenen Grenze n nahe durch das Integral dn log n ausgedr¨ uckt werde, wenn der hyperbolische Logarithm. verstanden werde. In sp¨aterer Zeit, als mir die in Vega’s Tafeln (von 1796) abgedruckte Liste bis 400031 bekannt wurde, dehnte ich meine Abz¨ ahlung weiter aus, was jenes Verh¨ altnis best¨ atigte. Eine grosse Freude machte mir 1811 die Erscheinung von Chernac’s cribrum, und ich habe (da ich zu einer anhaltenden Abz¨ ahlung der Reihe nach keine Geduld hatte) sehr oft einzelne unbesch¨ aftigte Viertelstunden verwandt, um bald hie bald dort eine Chiliade abzuz¨ ahlen; ich liess jedoch zuletzt es ganz liegen, ohne mit der Million ganz fertig zu werden. Erst sp¨ ater benutzte ich Goldschmidt’s Arbeitsamkeit, theils die noch gebliebenen L¨ ucken in der ersten Million auszuf¨ ullen, theils nach Burckardt’s Tafeln die Abz¨ahlung weiter fortzusetzen. So sind (nun schon seit vielen Jahren) die drei ersten Millionen abgez¨ahlt, und mit dem Integralwerth verglichen ...”, wor¨ uber nun eine kleine Tabelle folgt. Offenbar von Encke auf die Legendresche Ann¨aherung (2) an π(x) aufmerksam gemacht, f¨ahrt Gauss dann fort: “Dass Legendre sich auch mit diesem Gegenstande besch¨aftigt hat, war mir nicht bekannt, auf Veranlassung Ihres Briefes habe ich in seiner Th´eorie des Nombres nachgesehen, und in der zweiten Ausgabe einige darauf bez¨ ugliche Seiten gefunden, die ich fr¨ uher u ¨bersehen (oder seitdem vergessen) haben muss. Legendre gebraucht die Formel n log n − A ∗) ∗∗)
Folge von tausend sukzessiven Zahlen Direkt vor dem Brief an Encke abgedruckt (Werke II, 435–443)
§ 2.
295
Anzahlfunktion: Tchebychefs S¨ atze
wo A eine Constante sein soll, f¨ ur welche er 1,08366 setzt.” Der Brief endet mit einer vergleichenden Betrachtung seiner eigenen Approximation x dt (3) li x := (x > 1) 0 log t an π(x) mit der Legendreschen aus (2). Dabei hat man das Integral rechts in 1−ε x dt (3) im Sinne des Cauchyschen Hauptwerts limε↓0 ( 0 + 1+ε ) log t zu verstehen. Die in (3) definierte Funktion li heißt Integrallogarithmus. Mittels partieller Integration kann nun die asymptotische Gleichheit x (4) li x ∼ (x → ∞) log x leicht best¨atigt werden. Es ist n¨ amlich x x x 2 1 dt li x − li 2 = 1· dt = − + 2 log t log x log 2 2 2 log t und daraus |li x −
x |≤ log x
x
√ x
√ dt + O( x) = O log2 t
x log2 x
,
was zu (4) f¨ uhrt. Wenn (1) bewiesen ist, ist π(x) ∼ λ(x) bzw. wegen (4) auch π(x) ∼ li x gezeigt; in dem hier pr¨ azisierten Sinne sind dann die Vermutungen von Legendre bzw. Gauss best¨atigt, daß λ bzw. li die Funktion π gut ann¨ ahern. Wie bereits in 1.4.14 erw¨ ahnt, ist die Aussage (1) nichts anderes als der Primzahlsatz, der zuerst 1896 gezeigt werden konnte und f¨ ur den in § 3 ein Beweis gef¨ uhrt wird. Einige Dinge, die dort ben¨ otigt werden, die aber auch von selbst¨andigem Interesse sind, werden im laufenden Paragraphen bereitgestellt. Dessen Hauptergebnisse gehen auf die beiden wichtigen Arbeiten von Tchebychef (Oeuvres I, 27–48 bzw. 49–70) Sur la fonction qui d´etermine la totalit´e des nombres premiers bzw. M´emoire sur les nombres premiers aus den Jahren 1851/4 zur¨ uck. Tchebychef konnte zwar die Asymptotik (1) noch nicht beweisen; immerhin konnte er aber zeigen, daß logx x die “richtige” Gr¨ oßenordnung f¨ ur π(x) ist (vgl. 3).
2. Legendres Identit¨ at. F¨ ur jede Primzahl p und f¨ ur jede nat¨ urliche Zahl n ist die Vielfachheit von p in n! gleich ∞ n (1) . pj j=1
296
7. Primzahlen
Bemerkung. Man beachte hier, daß [np−j ] Null ist genau dann, wenn pj > n oder gleichbedeutend j > (log n)/(log p) gilt. Den Ausdruck (1) f¨ ur νp (n!) hat Legendre in der Einleitung zu seiner Th´eorie des Nombres angegeben. Beweis. Offenbar ist f¨ ur j ∈ N0 Ap (n, j) := #{k ∈ N : k ≤ n, νp (k) = j} =
n n − j+1 pj p
und damit wegen der strengen Additivit¨ at von νp (vgl. Bemerkung zu 1.4.2) νp (n!) =
n k=1
νp (k) =
∞
jAp (n, j) =
j=1
∞ ∞ n n j j − (j − 1) j , p p j=1 j=1
was (1) impliziert.
3. Obere Absch¨ atzung. Nun wird die in der Bemerkung zu 1.5 erw¨ ahnte, mit x dem Sieb des Eratosthenes erzielbare Aussage π(x) = O( log log ) x erheblich verbessert. Satz. (1)
F¨ ur alle reellen x > 1 gilt π(x) < 8 log 2
Beweis. Bei nat¨ urlichem n gilt νp 2n und also
x . log x
2n
= 1 f¨ ur alle Primzahlen p mit n < p ≤ 2n p≤ ≤ 22n . n
n
nπ(2n)−π(n) ≤
n
Logarithmieren liefert f¨ ur n = 2, 3, . . . (2)
π(2n) − π(n) ≤
2n log 2 . log n
Ist k ≥ 3 und wendet man (2) f¨ ur n = 2i (i = 2, . . . , k − 1) an, so erh¨ alt man durch Addition π(2k ) ≤ π(4) +
k−1 i=2
2i+1 2i+1 2k+2 < < , i i k i=1 k−1
§ 2.
Anzahlfunktion: Tchebychefs S¨ atze
297
wobei man die Ungleichung rechts (f¨ ur k ≥ 3) induktiv best¨ atigt. Indem man k = 1, 2 direkt betrachtet, gewinnt man π(2k ) <
(3)
2k+2 k
f¨ ur alle nat¨ urlichen k. Jedem reellen x > 1 ordnet man nun in eindeutiger Weise k ∈ N zu gem¨aß 2k−1 < x ≤ 2k und erh¨ alt dann mittels (3) und der Monotonie von π 2k+2 x π(x) ≤ π(2k ) < < (8 log 2) . k log x Bemerkungen. 1) Mit der in 1.6 erw¨ ahnten Siebmethode von Brun kann man ¨ ebenfalls π(x) = O(x/ log x) erhalten. Uber die Primzahlzwillinge liefert Bruns Methode π2 (x) = O(x/ log2 x), woraus leicht das in 1.6 unter a) zitierte Resultat folgt. 2) Mit a¨hnlich elementaren Schlußweisen wie zu (1) kann man in entgegengesetzter Richtung zu π(x) ≥
(4)
1 x log 2 2 log x
f¨ ur alle reellen x ≥ 2 gelangen. Dies versch¨arft die in Bemerkung 3 zu 1.4.5 gefundene untere Absch¨ atzung f¨ ur π(x) deutlich.
4. Partielle Summation. In 5 und 6 ebenso wie in den Abschnitten 2, 3, 9, 12 von § 3 wird ben¨ otigt das folgende Lemma u ¨ ber partielle Summation. Sei (an )n∈N eine Folge komplexer Zahlen, (tn )n∈N eine streng monoton wachsende, unbeschr¨ ankte Folge reeller Zahlen und A(t) die Summe u ¨ber diejenigen an , deren Indizes n der Bedingung tn ≤ t gen¨ ugen. Ist dann g : [t1 , ∞) → C stetig differenzierbar, so gilt f¨ ur alle reellen x ≥ t1 x an g(tn ) = A(x)g(x) − A(t)g (t)dt. n tn ≤x
t1
Beweis. Sei N ∈ N gem¨aß tN ≤ x < tN+1 gew¨ahlt; dann gilt wegen A(t) = A(tn ) ur n ≥ 2 sowie A(t1 ) = a1 f¨ ur tn ≤ t < tn+1 und wegen A(tn ) − A(tn−1 ) = an f¨
298
7. Primzahlen
x
A(t)g (t)dt =
N−1
t1
n=1
=
N−1
tn+1
+ tn
x
A(t)g (t)dt
tN
A(tn )(g(tn+1 ) − g(tn )) + A(tN )(g(x) − g(tN ))
n=1
=
N
A(tn−1 )g(tn ) −
n=2
=−
N
N
A(tn )g(tn) + A(x)g(x)
n=1
an g(tn ) + A(x)g(x).
n=1
Als Spezialfall des Lemmas erweist sich die Eulersche Summenformel in ihrer einfachsten Form. Seine Summenformel gab Euler (Opera Omnia Ser. 1, XIV, 42–72) im Jahre 1732 ohne Beweis an; 1735 lieferte er einen Beweis nach (Opera Omnia Ser. 1, XIV, 108–123). Ist x ≥ 1 reell, so wendet man das Lemma u ¨ber partielle Summation an mit an := 1, tn := n f¨ ur alle nat¨ urlichen n. Man erh¨ alt f¨ ur stetig differenzierbare g := [1, ∞) → C mittels partieller Integration
g(n) = [x]g(x) −
n≤x
x
[t]g (t)dt
1
x x 1 1 = [x]g(x) − (t − )g (t)dt + (t − [t] − )g (t)dt 2 2 1 1 x x 1 1 1 g(t)dt + g(1) + ([x] + − x)g(x) + (t − [t] − )g (t)dt. = 2 2 2 1 1
Schreibt man N f¨ ur ganzzahliges x, so nimmt die Eulersche Summenformel die gel¨ aufigere Form (1)
N n=1
N
g(n) = 1
1 g(t)dt + (g(1) + g(N )) + 2
1
N
1 (t − [t] − )g (t)dt 2
an. Insbesondere f¨ ur g = log erh¨ alt man daraus
(2)
N 1 1 log N ! = log t dt + log N + (t − [t] − )t−1 dt 2 2 1 1 1 = N log N − N + log N + O(1) 2 N
§ 2.
299
Anzahlfunktion: Tchebychefs S¨ atze
bei N → ∞. Dabei ist beachtet, daß f¨ ur große n gilt
n+1 n
1 1 1 1 (t − [t] − )t−1 dt = 1 − (n + ) log(1 + ) = − n−2 + O(n−3 ). 2 2 n 12
Der erhaltene Ausdruck f¨ ur log N ! ist im wesentlichen die wohlbekannte Stir– ling–Formel.
5. Zwei asymptotische Ergebnisse von Mertens. Hier werden nach dem Vorgang von Mertens (J. Reine Angew. Math. 78, 46–62 (1874)) zwei Summen u ¨ber Primzahlen ausgewertet. Durch Kombination beider Resultate wird dann in 6 ein weiterer Satz von Tchebychef gewonnen, f¨ ur den dieser in der ersten am Ende von 1 genannten Arbeit einen deutlich komplizierteren Beweis geliefert hat. Proposition A. Bei x → ∞ gilt
p≤x
log p p
= log x + O(1).
Beweis. Nach der Legendre–Identit¨ at 2 ist f¨ ur ganzes N ≥ 0 log N ! =
νp (N !) log p
p≤N
(1)
=
(log p)
p≤N
[N p−j ] j≥1
log p N N =N − − [ ] log p + (log p) [N p−j ]. p p p p≤N
p≤N
p≤N
j≥2
Die Anzahl der Summanden der Σ2 (N ) genannten zweiten Summe ganz rechts 6N in (1) ist π(N ), nach Satz 3 also h¨ochstens log N bei N > 1; da jeder einzelne Summand nichtnegativ und durch log N beschr¨ankt ist, hat man 0 ≤ Σ2 (N ) ≤ 6N f¨ ur N ≥ 1. F¨ ur die mit Σ3 (N ) bezeichnete letzte Doppelsumme in (1) gilt offenbar 0 ≤ Σ3 (N ) ≤ N
p≤N
log p log p
da die auftretende unendliche Reihe konvergiert. Benutzt man andererseits in (1) zur Auswertung von log N ! die Formel 4(2), so erh¨alt man nach Division durch N die Asymptotik log N + O(1) = (log p)/p. p≤N
300
7. Primzahlen
F¨ ur jedes große reelle x ist damit log p {x} = log[x] + O(1) = log x + log(1 − ) + O(1) p x
p≤x
1 = log x + O(1) + O( ), x woraus die Behauptung folgt; man beachte {x} = x − [x]. Proposition B. Es gibt eine reelle Konstante B, so daß f¨ ur x → ∞ gilt 1 1 = log log x + B + O( ). p log x
p≤x
Beweis. Nach dem Lemma 4 u ¨ber partielle Summation, angewandt mit tn := pn , an := (log pn )/pn , g(t) := 1/ log t, ist x 1 log p 1 A(t) A(x) (2) = = + dt. p p log p log x t log2 t 2 p≤x p≤x Nach Proposition A ist hier A(t) = log t + a(t), wobei a(t) beschr¨ ankt bleibt. Tr¨ agt man dies rechts in (2) ein, so entsteht ∞ ∞ 1 x dt a(t) a(x) a(t) = +1+ − dt + dt; 2 p log x t log t t log2 t 2 t log t 2 x p≤x
die beiden letzten Summanden rechts sind O( log1 x ). Bemerkung. Proposition B stellt eine deutliche Verbesserung einer Aussage in ¨ Bemerkung 4 zu 1.4.5 dar. Als Ubung leite man aus Proposition B die Asymptotik 1 C (1 − ) ∼ (x → ∞) p log x p≤x
¨ mit einer Konstanten C ∈ IR+ her. Ubrigens ist C = e−γ , wobei γ die in 5.1.11 erw¨ahnte Eulersche Konstante bedeutet.
6. Letzte Vorstufe des Primzahlsatzes. Die Absch¨atzungen 3(1) und 3(4) erg¨ anzend konnte Tchebychef mit seinen Methoden in Richtung auf den Primzahlsatz 1(1) noch zeigen:
§ 3. Satz. Eins.
Der Primzahlsatz
301
Wenn π(x)(log x)/x bei x → ∞ konvergiert, dann ist der Grenzwert
Beweis. Es existiere der Grenzwert limx→∞ π(x) logx x und er sei gleich C; das bedeutet π(x) = logx x (C + ε(x)) mit einer Funktion ε(x), die bei x → ∞ gegen Null konvergiert. Unter Beachtung dieser Gleichheit gibt das Lemma 4 u ¨ber partielle Summation, angewandt mit tn := pn , an := 1, g(t) := 1/t x 1 1 π(x) π(t) 1· = dt Σ(x) : = = + p p x t2 2 p≤x p≤x x C + ε(x) C + ε(t) = + dt = (C + δ(x)) log log x log x t log t 2 mit einer Funktion δ(x), die bei x → ∞ gegen Null strebt. Nach Proposition 5B ist Σ(x) = log log x+O(1) und so folgt aus der zuletzt erhaltenen Gleichungskette C = 1. Bemerkung. In den Ungleichungen 3(4) bzw. 3(1) kann man die Faktoren 1 x 2 log 2 bzw. 8 log 2 bei log x noch verbessern, vor allem dann, wenn man mit Absch¨ atzungen f¨ ur π(x) zufrieden ist, die nur f¨ ur alle gen¨ ugend großen x gelten. Tchebychef selbst hatte 0,92129... bzw. 1,10555... als Faktoren. Mit Tchebychefs Originalmethode, aber viel gr¨ oßerem numerischem Aufwand konnte Sylvester (Collected Mathematical Papers III, 530–545; IV, 687–731) beide Faktoren noch weiter auf 0,95695... bzw. 1,04423... versch¨arfen. Seine zweite Arbeit erschien 1892, vier Jahre vor dem Beweis des Primzahlsatzes. Interessant ist das Ende seiner ersten Arbeit (1881), wo er u ¨ber den (vermuteten) Primzahlsatz sagt: “... we shall probably have to wait until some one is born into the world as far surpassing Tchebycheff in insight and penetration as Tchebycheff has proved himself superior in these qualities to the ordinary run of mankind.”
§ 3.
Der Primzahlsatz
1. Riemanns Anstoß. Nachdem die elementaren Tchebychefschen Methoden weitgehend ausgen¨ utzt waren, stagnierte das Problem der asymptotischen Bestimmung von π(x) bis in die 1890er Jahre. Wichtige Fortschritte der Funktionentheorie ließen damals die bereits in 1.4.14 zitierte Riemannsche Abhandlung Ueber die Anzahl der Primzahlen unter einer gegebenen Gr¨ osse aus dem Jahre 1859 erst richtig zug¨anglich und fruchtbar werden. In dieser seiner einzigen, zu Lebzeiten publizierten zahlentheoretischen Arbeit hatte Riemann auf nur neun Druckseiten in a¨ußerst komprimierter Form u ¨ber
302
7. Primzahlen
ausgiebige Untersuchungen referiert, eigentlich mehr ein Programm entworfen, dessen Ideen die Nachwelt zu verstehen und auszuarbeiten hatte. Was er dort wirklich war, daß die zun¨ achst nur in der Halbebene Re s > 1 durch die bewies, Reihe n−s definierte Funktion ζ(s) (vgl. 1.4.4(3)) nach ganz C meromorph fortsetzbar ist, daß diese Fortsetzung lediglich an der Stelle 1 einen Pol besitzt (einfach und mit Residuum 1) und daß sie einer gewissen Funktionalgleichung gen¨ ugt (vgl. 10). Außerdem folgten vier Behauptungen u ¨ber die Nullstellenverteilung der Zetafunktion, eine u ¨ber die Produktzerlegung der ganzen Funktion (s − 1)ζ(s) und als einzige zahlentheoretische Behauptung die sogenannte Primzahlformel. Bei dieser wird die endliche Summe j≥1 1j π(x1/j ) im wesentlichen durch li x und die Werte li xρ exakt ausgedr¨ uckt, wenn ρ alle Nullstellen der Zetafunktion durchl¨ auft und li den durch 2.1(3) eingef¨ uhrten Integrallogarithmus bezeichnet. Wichtiger als die Primzahlformel selbst, f¨ ur deren Richtigkeit Riemann nur heuristische Gr¨ unde angegeben hatte, war seine Idee, durch Anwendung der Theorie der analytischen Funktionen einer komplexen Variablen auf das Studium einer ganz bestimmten Funktion, hier der Zetafunktion, zahlentheoretische S¨atze zu gewinnen. Diese Idee erwies sich als umso fruchtbarer, je weiter sich die Funktionentheorie entwickelt hatte. So konnte J. Hadamard 1893, gest¨ utzt auf seine Untersuchungen u ¨ber die Produktentwicklung ganzer Funktionen endlicher Wachstumsordnung (vgl. Bemerkung zu 6.5.8), einer Verfeinerung des Weierstrassschen Produktsatzes, drei der oben genannten Riemannschen Behauptungen beweisen. Ebenfalls von der Hadamardschen Produktentwicklung von (s − 1)ζ(s) ausgehend konnte H. Von Mangoldt 1895 die Riemannsche Primzahlformel zeigen, aus der der Primzahlsatz jedoch nicht abgeleitet werden konnte. Im Jahre 1905 erbrachte Von Mangoldt noch den Beweis einer weiteren der sechs Riemannschen Behauptungen, von denen heute noch eine offen ist (vgl. 12). In diese Jahre st¨ urmischer Entwicklung, angeregt durch Riemanns genialen Anstoß und die Schaffung geeigneter Hilfsmittel in der Funktionentheorie, fielen auch die beiden ersten Beweise f¨ ur den Primzahlsatz.
Bei x → ∞ gilt π(x) ∼ x/(log x).
Diese Beweise fanden unabh¨angig voneinander und nahezu zeitgleich Hadamard (Oeuvres I, 189–210) und C. De La Vallee Poussin (Ann. Soc. Sci. Bruxelles 20, 183–256, 281–397 (1896)). Beide verwendeten entscheidend die Tatsache, daß ζ in der Halbebene Re s ≥ 1 nicht verschwindet (vgl. unten Satz 4). Auch der hier in 2 bis 8 zu f¨ uhrende Beweis des Primzahlsatzes n¨ utzt dies (in 6) aus.
§ 3.
Der Primzahlsatz
303
2. Konvergenz einer Folge und Primzahlsatz. Nachstehend wird der Primzahlsatz auf ein der hier anzuwendenden Methode leichter zug¨ angliches Problem verlagert. Proposition.
Die Konvergenz der Folge log p − log n n=1,2,... p
(1)
p≤n
impliziert den Primzahlsatz. Beweis. Setzt man A(x) := p≤x (log p)/p f¨ ur reelles positives x und konvergiert die Folge (1) gegen c, so hat man wegen log([x]/x) = log(1 − {x}/x) = O( x1 ) bei x→∞ A(x) − log x − c = A([x]) − log[x] − c + O(x−1 ) = o(1). Daher strebt die Funktion A(x) − log x der reellen Variablen x bei x → ∞ gegen c. Mit geeigneter Funktion ε : IR+ → IR, die limx→∞ ε(x) = 0 gen¨ ugt, ist also f¨ ur x ∈ IR+ nach der Voraussetzung in der Proposition A(x) = log x + c + ε(x). Nach dem Lemma 2.4 u ¨ber partielle Summation ist dann log p p p log p p≤x x x 1 − log t = A(x) + A(t) dt log x log2 t 2 x x dt 2c ε(x)x 1 − log t +2+ + + ε(t) dt. = log t log 2 log x log2 t 2 2
π(x) = (2)
ur alle t oberhalb eines Wird nun ε ∈ IR+ beliebig vorgegeben, so ist |ε(t)| ≤ ε f¨ x0 (ε), das o.B.d.A. schon gr¨ oßer als e sein m¨oge; das letzte Integral in (2) ist absolut beschr¨ ankt durch |
x0 (ε)
ε(t) 2
x 1 − log t 2 dt| + ε − . 2 log x log 2 log t
Aus (2) folgt damit π(x) = li x + o(x/ log x) und hieraus mit 2.1(4) der Primzahlsatz.
304
7. Primzahlen
Bemerkung. Umgekehrt kann auch aus dem Primzahlsatz die Konvergenz der Folge (1) hergeleitet werden.
3. Die Reste der Zetareihe. In 1.4.4(3) wurde die Riemannsche Zetafunktion ζ in σ := Re s > 1 definiert durch die Reihe ∞
(1)
n−s .
n=1
Die in 4 und 6 u ¨ber die “Reste” ist enthalten im folgenden Lemma.
n≥N
n−s dieser Reihe ben¨otigte Information
F¨ ur jedes nat¨ urliche N gilt in σ > 1 ∞
(2)
n−s =
n=N
1 N 1−s + s s−1
∞
(1 − {t})t−s−1 dt.
N
Dabei ist das Integral in σ > 0 holomorph. Beweis. F¨ ur reelles x ≥ N ist nach dem Lemma 2.4 u ¨ber partielle Summation
n
−s
−s
= ([x] − N + 1)x
x
+s
([t] − N + 1)t−s−1 dt.
N
N≤n≤x
In der Halbebene σ > 1 folgt daraus bei x → ∞ ∞
n−s = s
∞
(t − N + 1 − {t})t−s−1 dt
N
n=N
und die Ausf¨ uhrung des Integrals liefert (2). Daß das in σ > 0 absolut konvergente Integral (3)
∞
J(s) :=
(1 − {t})t−s−1 dt
N
dort eine holomorphe Funktion definiert (N ≥ 1 sei eine feste reelle Zahl), kann man allgemeinen funktionentheoretischen S¨atzen u ¨ber die Holomorphie sogenannter Parameterintegrale entnehmen, soll hier jedoch ad hoc gezeigt werden.
§ 3.
Der Primzahlsatz
305
Dazu beachtet man die f¨ ur reelle t ≥ 1 und komplexe h = 0 g¨ ultige Absch¨atzung ∞
(4)
(−1) 1 | (t−h − 1) + log t| = | h−1 log t| h ! =2 1 ≤ |h|(log t)2 (|h| log t) ! ≥0
= |h|t|h| log2 t. F¨ uhrt man jetzt noch das ebenfalls in σ > 0 absolut konvergente Integral ∞ (5) K(s) := − (1 − {t})(log t)t−s−1 dt N
ein, so folgt mit (3) und (4) f¨ ur komplexe h = 0 und s mit Re s > 0, Re(s+h) > 0 ∞ 1 J(s + h) − J(s) − K(s)| = | (1 − {t}) (t−h − 1) + log t t−s−1 dt| | h h N ∞ ≤ |h| t−σ−1+|h| log2 t dt N ∞ t−1−(σ/2) log2 t dt. ≤ |h| N
Denn bei festem s mit σ = Re s > 0 darf im Sinne des geplanten Grenz¨ ubergangs h → 0 von vornherein |h| ≤ 12 σ vorausgesetzt werden. Damit ist die Holomorphie von J in σ > 0 gezeigt einschließlich der in dieser Halbebene g¨ ultigen (erwarteten) Gleichung J = K.
4. Fortsetzung und Nullstellenfreiheit der Riemannschen Zetafunktion. Diesbez¨ uglich entnimmt man die f¨ ur den Beweis des Primzahlsatzes ben¨ otigten Informationen folgendem Satz. Die in σ > 1 durch die Reihe 3(1) definierte Riemannsche Zetafunktion l¨ aßt sich in die Halbebene σ > 0 meromorph fortsetzen. Diese Fortsetzung ist dort holomorph bis auf einen einfachen Pol an der Stelle 1 mit dem Residuum 1; außerdem ist sie in σ ≥ 1 nullstellenfrei. Beweis. Alle Aussagen, die sich auf die Halbebene σ > 1 beziehen, wurden schon in 1.4.4 bereitgestellt. Nach Lemma 3 gilt in σ > 1 ∞ 1 (1) ζ(s) = +s (1 − {t})t−s−1 dt , s−1 1
306
7. Primzahlen
wobei das Integral rechts in σ > 0 holomorph ist. Damit ist jetzt nur noch ζ(1 + it) = 0 f¨ ur alle reellen t = 0 zu zeigen. W¨ are 1+iT mit T ∈ IR× eine Nullstelle von ζ, so w¨ urde die Taylor-Entwicklung von ζ(s + iT ) um s = 1 beginnen mit ζ(s + iT ) = (s − 1)ζ (1 + iT ) + . . . ,
(2)
w¨ahrend nach (1) die Laurent–Entwicklung von ζ(s) um s = 1 mit ζ(s) = (s − 1)−1 + . . .
(3) anf¨ angt. Die durch
Z(s) := ζ(s)3 ζ(s + iT )4 ζ(s + 2iT )
(4)
definierte Funktion Z ist in σ > 1 holomorph, in σ > 0 meromorph und hat wegen (2) und (3) an der Stelle s = 1 eine Nullstelle, weswegen log |Z(σ)| → −∞
(5)
bei σ → 1
gilt. Aus der Eulerschen Produktdarstellung 1.4.4(4) von ζ folgt durch Logarithmieren (6)
log ζ(s) =
− log(1 − p−s ) =
p
∞ 1 p
j=1
j
p−js =:
∞
an n−s
n=1
in σ > 1, wobei log den Hauptwert des komplexen Logarithmus bedeutet. Da die an offenbar nichtnegative rationale Zahlen sind, ist mit t := Im s (7)
log |ζ(s)| = Re log ζ(s) =
∞
an n−σ cos(t log n),
n=1
wobei log links und in der Summe rechts wieder den reellen Logarithmus bedeutet. F¨ ur σ > 1 ist wegen (4) und (7) log |Z(σ)| = 3 log |ζ(σ)| + 4 log |ζ(σ + iT )| + log |ζ(σ + 2iT )| ∞ = an n−σ (3 + 4 cos(T log n) + cos(2T log n)) ≥ 0, n=1
was (5) widerspricht. Dabei folgt die untere Absch¨atzung der Summe aus an n−σ ≥ 0 und der f¨ ur alle reellen τ g¨ ultigen Ungleichung 3 + 4 cos τ + cos 2τ = 2(1 + cos τ )2 ≥ 0.
§ 3.
307
Der Primzahlsatz
¨ 5. Uber gewisse Dirichlet–Reihen. Ist (an )n=1,2,... eine beliebige Folge komplexer Zahlen, so nennt man bei komplexem s Reihen der Gestalt ∞ an n−s (1) n=1
Dirichlet–Reihen. Solche Reihen sind bereits in 1.4.4(1) und 1.4.4(3) aufgetreten, ebenso wie zuletzt in 3 und 4. In 6 wird u ¨ber Dirichlet–Reihen folgendes einfache Ergebnis gebraucht. Lemma. Gilt bei beliebigem reellem ε > 0 f¨ ur die Koeffizienten an der Dirichlet–Reihe (1) die Bedingung an = O(nε ) bei n → ∞, so konvergiert diese Reihe mindestens in σ > 1 absolut und kompakt gleichm¨ aßig, definiert dort also eine holomorphe Funktion. Beweis. Man fixiere ein reelles σ0 > 1 beliebig. Sodann w¨ ahle man ε reell mit 0 < ε < σ0 − 1 beliebig und hat nach Voraussetzung |an | ≤ c(ε)nε f¨ ur alle n ∈ N und daher ∞ ∞ ∞ | an n−s | ≤ c(ε) n−(σ−ε) ≤ c(ε) n−(σ0 −ε) n=1
n=1
n=1
f¨ ur alle komplexen s mit Re s = σ ≥ σ0 . Die Reihe ganz rechts konvergiert wegen σ0 − ε > 1 und das Weierstrasssche Majoranten–Kriterium liefert die Behauptung. ¨ Bemerkung. Uber die Theorie der Dirichlet–Reihen gibt etwa das Buch von G.H. Hardy und M. Riesz (The general theory of Dirichlet’s series, University Press, Cambridge, 1952) detaillierte Ausk¨ unfte.
6. Die Existenz des Grenzwerts. Nach Proposition 2 ist der Primzahlsatz bewiesen, sobald das folgende Ergebnis gezeigt ist. Satz.
Die Folge (
p≤n
log p p
− log n)n=1,2,... konvergiert.
ur nat¨ urliche n gesetzt, so gilt an = Beweis. Wird an := p≤n (log p)/p f¨ log n +O(1) nach Proposition 2.5A, erst recht also an = O(nε ) f¨ ur jedes ε ∈ IR+ . Nach Lemma 5 definiert die in σ > 1 absolut konvergente Reihe an n−s dort eine holomorphe Funktion f (s). F¨ ur diese gilt in σ > 1, wenn man die Summationsreihenfolge mit R¨ ucksicht auf die vorliegende absolute Konvergenz vertauscht, ∞ ∞ log p −s log p −s (1) f (s) = n = n . p p n=p p n=1 p≤n
308
7. Primzahlen
Die letzte innere Summe wird mittels Lemma 3 weiter bearbeitet: ∞
(2)
−s
n
n=p
1 1−s = +s p s−1 =
∞
(1 − {t})t−s−1 dt
p
p 1 1 s(s − 1) − + s − 1 ps − 1 ps (ps − 1) p
∞
(1 − {t})t−s−1 dt .
p
F¨ ur jede Primzahl p ist die Funktion gp (s) :=
(3)
1 s(s − 1) + s s p (1 − p ) p
∞
(1 − {t})t−s−1 dt
p
in der Halbebene σ > 0 holomorph; weiter gilt dort die Absch¨ atzung |gp (s)| ≤
(4)
1 pσ (pσ
− 1)
+
|s|(|s| + 1) . σpσ+1
Nach (1), (2), (3) ist in σ > 1 f (s) =
log p p
p
p 1 1 log p + gp (s) = + gp (s) log p , s s s−1 p −1 s−1 p p −1 p
wobei die letzte Reihe rechts wegen (4) eine in σ > definiert. Mit dieser hat man also (5)
f (s) =
1 2
holomorphe Funktion h
1 log p + h(s) . s − 1 p ps − 1
Durch Differentiation der linken H¨ alfte von 4(6) erh¨ alt man in σ > 1 log p ζ (s) =− ; ζ(s) ps − 1 p dies in (5) eingetragen f¨ uhrt zu der in σ > 1 g¨ ultigen Formel (6)
f (s) =
1 ζ (s) − + h(s) , s−1 ζ(s)
deren rechte Seite nach Satz 4 und den vor (5) u ¨ber h festgestellten Holomorphieverh¨ altnissen jedenfalls in σ ≥ 1 holomorph ist bis auf einen doppelten Pol an der Stelle 1. Der Hauptteil der Laurent–Entwicklung von f um 1 ist wegen
§ 3.
Der Primzahlsatz
309
(6) und Satz 4 gleich (s − 1)−2 + C(s − 1)−1 mit einer gewissen reellen Konstanten C. Mit diesem C definiert man nun die jedenfalls in σ ≥ 1 holomorphe Funktion F (s) := f (s) + ζ (s) − Cζ(s). Diese neueFunktion F besitzt nach (1), 3(1) und der aus 3(1) folgenden Formel ζ (s) = − (log n)n−s in σ > 1 die folgende Darstellung als Dirichlet–Reihe F (s) =
∞
(an − log n − C)n−s ,
n=1
deren Koeffizienten fn := an − log n − C =
(7)
log p − log n − C p
p≤n
nach Proposition 2.5A beschr¨ankt sind. Der in 8 folgende Konvergenzsatz beinhaltet dann insbesondere, daß die Reihe ∞
(8)
fn n−1
konvergiert,
n=1
woraus in 7 gefolgert wird, daß (fn )n=1,2,... eine Nullfolge ist. Das letztere ist nach (7) gleichbedeutend mit log p − log n = C. n→∞ p lim
p≤n
7. Anwendung des Cauchy–Kriteriums. Mit diesem wird hier gezeigt, daß die durch 6(7) definierte Folge (fn ) wegen 6(8) gegen Null konvergiert. Wegen 6(8) gibt es zun¨ achst zu beliebigem reellem ε ∈]0, 12 ] ein N0 = N0 (ε) > 0, so daß f¨ ur alle ganzen N > N0 die beiden Ungleichungen (1) fn n−1 < ε2 und fn n−1 > −ε2 N≤n≤N(1+ε)
N(1−ε)≤n≤N
gelten. F¨ ur die ganzen n mit N ≤ n ≤ N (1 + ε) ist wegen 6(7) fn =
log p log p N − log n − C ≥ − log N − C + log p p n
p≤n
p≤N
≥ fN − log(1 + ε) > fN − ε.
310
7. Primzahlen
Nach der ersten Ungleichung (1) folgt hieraus
(fN − ε)
(2)
N≤n≤N(1+ε)
1 < ε2 . n
Da die Summe links in (2) nicht kleiner als 1+[N(1+ε)]−N > N(1+ε) ε(1 + ε), also fN < ε(2 + ε) ≤ 52 ε, wenn nur N > N0 gilt.
ε 1+ε
ist, folgt fN −ε <
Andererseits gilt f¨ ur die ganzen n mit N (1 − ε) ≤ n ≤ N wegen 6(7) fn ≤
log p N − log N − C + log ≤ fN − log(1 − ε) < fN + 2ε, p n
p≤N
letzteres mit R¨ ucksicht auf ε ≤ 12 . Nach der zweiten Ungleichung (1) erh¨ alt man daraus (3)
(fN + 2ε)
N(1−ε)≤n≤N
1 > −ε2 . n
≥ ε. Aus (3) folgt damit fN + Hier ist die Summe nicht kleiner als N−[N(1−ε)] N 2ε > −ε, also fN > −3ε, falls nur N > N0 gilt. Insgesamt hat man |fN | < 3ε f¨ ur diese N und so ist (fN ) als Nullfolge erkannt.
8. Konvergenzsatz. Sei (fn )n=1,2,... eine beschr¨ankte Folge komplexer Zahlen und die in σ > 1 durch die Dirichlet–Reihe (1)
∞
fn n−s
n=1
definierte Funktion F sei in σ ≥ 1 holomorph. Dann konvergiert die Reihe (1) in σ ≥ 1 gegen F (s). Beweis. Man fixiere s0 ∈ C mit σ0 := Re s0 ≥ 1. Dann ist F (s + s0 ) jedenfalls in σ := Re s ≥ 0 nach Voraussetzung holomorph. √ Ist jetzt R ∈ IR+ beliebig gew¨ahlt, so kann man ein δ ∈ IR+ mit δ ≤ Min(1, R/ 2) finden derart, daß das Kreissegment DR,δ := {s ∈ C : |s| ≤ R, Re s ≥ −δ} ganz dem Holomorphiegebiet von F (s + s0 ) angeh¨ ort. Bezeichnet Γ den einmal in positivem Sinne durchlaufenen Rand von DR,δ und Γr (bzw. Γ ) den in der
§ 3.
Der Primzahlsatz
311
rechten (bzw. linken) Halbebene σ > 0 (bzw. σ ≤ 0) gelegenen Teil von Γ, so gilt nach der Cauchyschen Integralformel
(2)
2πiF (s0 ) =
Γ
F (s + s0 )N s (s−1 + sR−2 )ds.
Dabei bedeutet N hier und im folgenden eine beliebige nat¨ urliche Zahl. F¨ ur s ∈ Γr ist Re(s + s0 ) > 1, also hat man dort (3) F (s + s0 ) = ( + )fn n−s−s0 =: QN (s + s0 ) + RN (s + s0 ). n≤N
n>N
Da QN (s + s0 ) in der ganzen s–Ebene holomorph ist, hat man 2πiQN (s0 ) = QN (s + s0 )N s (s−1 + sR−2 )ds |s|=R (4) = QN (s + s0 )N s (s−1 + sR−2 )ds Γr + QN (s0 − s)N −s (s−1 + sR−2 )ds. Γr
Subtrahiert man (4) von (2), so entsteht unter Beachtung von (3) 2πi(F (s0 ) − QN (s0 )) =
312
7. Primzahlen
(5)
= Γr
(RN (s + s0 )N s − QN (s0 − s)N −s )(s−1 + sR−2 )ds
+ Γ
F (s + s0 )N s (s−1 + sR−2 )ds.
Kann man jetzt zeigen, daß hier die rechte Seite f¨ ur gen¨ ugend große N beliebig klein wird, so bedeutet dies die Konvergenz der Partialsummen QN (s0 ) = −s0 −s0 f n der Reihe f n gegen F (s ), womit dann der Satz bewiesen n n 0 n≤N n ist. Um die Kleinheit der rechten Seite in (5) einzusehen, werden einige Absch¨ atzungen ben¨otigt. Zun¨ achst ist 1 s 2 2 Re s + = cos(arg s) = s R2 R R2
(6)
auf |s| = R.
Auf der in Γ enthaltenen Strecke s = −δ + it, t ∈ IR, |t| ≤ (R2 − δ 2 )1/2 ist (7)
s 1 1 (δ 2 + t2 )1/2 R2 + δ 2 + t2 2 | + 2| ≤ 2 + = ≤ . 2 2 1/2 2 2 2 1/2 s R R δ (δ + t ) R (δ + t )
Bezeichnet c ∈ IR+ eine obere Schranke f¨ ur alle |fn |, n = 1, 2, . . ., so gilt f¨ ur s ∈ Γr erstens ∞ 1 1 (8) n−σ−1 < t−σ−1 dt = |RN (s + s0 )| ≤ c σN σ N n>N
und zweitens 1 1 1 nσ−1 ≤ N σ ( + ). |QN (s0 − s)| ≤ c N σ
(9)
n≤N
Dabei ist beachtet, daß man f¨ ur σ ≥ 1 die Absch¨atzung
nσ−1 = N σ−1 +
n≤N
N−1
N
nσ−1 < N σ−1 +
tσ−1 dt = N σ 0
n=1
hat, w¨ ahrend man in 0 < σ < 1 sogar mit n≤N
auskommt.
n
σ−1
N
tσ−1 dt =
< 0
1 σ N σ
1 1 + N σ
§ 3.
313
Der Primzahlsatz
Wegen (6), (8), (9) ist f¨ ur s ∈ Γr 2 s 1 2σ 1 2σ 1 + |(RN (s + s0 )N s − QN (s0 − s)N −s )( + 2 )| ≤ c =c 4+ 2 s R σ N R N R2 und so gilt f¨ ur das erste Integral rechts in (5) 2 1 (. . .)(. . .)ds| ≤ 2πc (10) | + . R N Γr Das zweite Integral rechts in (5) muß man sehr genau untersuchen. Zun¨ achst werde M := Max{|F (s + s0 )| : s ∈ DR,δ } gesetzt; offenbar h¨angt M alleine von R und δ ab. Auf dem Teil von Γ mit Re s = −δ ber¨ ucksichtigt man |N s | = N −δ im Integranden; die L¨ ange dieses Teils des Integrationswegs ist ochstens den Beitrag 2(R2 − δ 2 )1/2 < 2R und so liefert dieser wegen (7) h¨ 2 M N −δ 2R δ
(11)
zum Absolutbetrag des zweiten Integrals in (5). Der Beitrag des in −δ < Re s ≤ 0 verlaufenden Teils des Integrationswegs ist wegen (6), wenn ϕ den in der Figur definierten Winkel bedeutet,
π/2+ϕ
3π/2
+ 3π/2−ϕ
π/2
F (Reiτ + s0 )N R cos τ +iR sin τ
2 cos τ iReiτ dτ. R
Der Absolutbetrag hiervon ist h¨ ochstens 2M
π/2+ϕ
π/2+ϕ
= 4M ≤ 4M
π/2 sin ϕ 0
(− cos τ )N R cos τ dτ
3π/2−ϕ
π/2
(12)
3π/2
+
(− cos τ )N R cos τ dτ = 4M
0
sin ϕ
x N −Rx dx (1 − x2 )1/2
4M N −Rx dx < , R log N
falls nur N > 1 ist. Hierbei hat man die vorletzte Ungleichung, da sin ϕ = δ √1 nach der Wahl von δ gilt und daher x(1 − x2 )−1/2 ≤ 1 f¨ ur alle reellen R ≤ 2 x ∈ [0, sin ϕ] zutrifft. Aus (11) und (12) entnimmt man die Absch¨ atzung 4M R 4M | F (s + s0 )N s (s−1 + sR−2 )ds| ≤ + . δN δ R log N Γ
314
7. Primzahlen
Dies mit (10) kombiniert ergibt wegen (5) (13)
2 1 2M R 2M + + . |F (s0 ) − QN (s0 )| ≤ c + δ R N πδN πR log N
Ist nun ε ∈ IR+ beliebig vorgegeben, so fixiert man etwa R := 1ε und w¨ ahlt anschließend δ (alleine abh¨ angig von ε), so daß es alle von ihm zu Anfang des Beweises verlangten Eigenschaften hat. Wie nach (10) festgestellt, h¨ angt dann auch M lediglich von ε ab. Wegen (13) hat man somit f¨ u r alle ganzen N > 2M 1/δ N0 (ε) := Max 1, ε−1 , ( πδε ,exp( 2M ) die Ungleichung 2) π |F (s0 ) − QN (s0 )| < 3cε + ε + ε = (3c + 2)ε, was den Konvergenzsatz beweist.
9. Mittelwert der M¨ obius–Funktion. Im folgenden Satz wird eine weitere Anwendung des Konvergenzsatzes 8 gegeben. Satz.
¨ bius–Funktion aus 1.4.9, so gilt Bezeichnet μ die Mo ∞
(1)
μ(n)n−s =
n=1
1 ζ(s)
in der Halbebene σ ≥ 1. Insbesondere ist ∞ μ(n) = 0. n n=1
(2)
Beweis. Da μ nach Satz 1.4.9(i), (ii) multiplikativ und beschr¨ ankt ist, gilt nach Satz 1.4.4, Satz 1.4.9(ii) und 1.4.4(4) in σ > 1 ∞ n=1
μ(n)n−s =
∞ p
ν=0
μ(pν )p−νs =
(1 − p−s ) = p
1 . ζ(s)
Die Funktion 1ζ ist nach Satz 4 in σ ≥ 1 holomorph; nach Satz 8 konvergiert also μ(n)n−s in σ ≥ 1 gegen 1/ζ(s).
§ 3.
315
Der Primzahlsatz
Ist f eine zahlentheoretische Funktion und existiert limx→∞ x1 n≤x f (n), so heißt dieser Grenzwert der Mittelwert von f . Daß z.B. die Eulersche Funktion ϕ keinen Mittelwert besitzt, geht aus Satz 1.4.12 hervor. ¨ biusKorollar. Bei x → ∞ gilt n≤x μ(x) = o(x) und daher besitzt die Mo sche Funktion μ den Mittelwert Null. Beweis. Lemma 2.4 u ¨ber partielle Summation liefert mit A(t) :=
μ(n)n−1
n≤t
1 1 x 1 μ(n) n = A(x) − μ(n) = A(t)dt. x x n x 1 n≤x
n≤x
ur alle reellen t ≥ x0 (ε) nach Ist ε ∈ IR+ beliebig vorgegeben, so ist |A(t)| ≤ ε f¨ x (ε) dem vorstehenden Satz, also hat man f¨ ur alle x ≥ Max(x0 (ε), 1ε 1 0 |A(t)|dt) die Absch¨atzung 1 x0 (ε) 1 1 μ(n)| ≤ ε + |A(t)|dt + ε(x − x0 (ε)) ≤ 3ε. | x x 1 x n≤x
Bemerkungen. 1) Die im Korollar untersuchte Summe wurde bereits in Bemerkung 4 zu 1.4.9 erw¨ahnt. 2) Euler betrachtete in § 277 seiner schon in 6.1.1 zitierten in AnaIntroductio −1 lysin Infinitorum – in moderner Terminologie – die Reihe μ(n)n und argu mentierte heuristisch, sie sei gleich dem Produkt p (1 − p−1 ), also gleich 1/ζ(1) und somit Null. Diese Schlußweise wurde sp¨ater insoweit gerechtfertigt, als man immerhin sichern konnte: Wenn Eulers Reihe konvergiert, so hat sie den Wert Null. Daß sie tats¨achlich konvergent ist, wurde erst 1897 durch Von Mangoldt bewiesen, der sich dabei auf funktionentheoretische Untersuchungen der Riemannschen Zetafunktion st¨ utzte. Landau entdeckte dann 1899, daß Gleichung (2) mittels elementarer Methoden aus dem Primzahlsatz ableitbar ist. Dies bedeutet: Wenn man den Primzahlsatz hat, so kann man daraus ohne Verwendung analytischer, d.h. funktionentheoretischer Methoden Gleichung (2) gewinnen. 1911 zeigte Landau erg¨ anzend, daß auch umgekehrt der Primzahlsatz aus Gleichung (2) mit elementaren Methoden folgt. Zwei S¨atze, die in dem hier pr¨azisierten Sinne auseinander elementar ableitbar sind, bezeichnet man in der Zahlentheorie als elementar ¨aquivalent. Dementsprechend sind Gleichung (2) und der Primzahlsatz zueinander elementar a¨quivalent, unabh¨ angig davon, wie jeder dieser beiden S¨ atze einzeln bewiesen werden kann.
316
7. Primzahlen
10. Funktionalgleichung der Zetafunktion. −sDie Zetafunktion wurde in 1.4.4 durch die f¨ ur σ > 1 konvergente Reihe n definiert und in 4 mittels partieller Summation in die Halbebene σ > 0 meromorph fortgesetzt. Der Leser konnte sich davon u ¨berzeugen, daß beim oben gegebenen Beweis des Primzahlsatzes lediglich die Kenntnis der Zetafunktion in σ ≥ 1 ben¨ otigt wurde. In seiner in 1 genannten Arbeit hatte Riemann zwei Beweise angegeben f¨ ur folgenden Satz. Die Riemannsche Zetafunktion l¨ aßt sich in die ganze komplexe Ebene meromorph fortsetzen und gen¨ ugt dort der Funktionalgleichung (1)
s −s/2 1 − s −(1−s)/2 ζ(1 − s)Γ = ζ(s)Γ . π π 2 2
Bemerkungen. 1) Im Satz bedeutet Γ die in C meromorphe und nullstellenfreie Gammafunktion, die genau an den Stellen 0, −1, −2, . . . Pole besitzt, die s¨amtliche einfach sind. 2) Die hier in der symmetrischen Form (1) angegebene Funktionalgleichung der Riemannschen Zetafunktion wird oft auch in der a¨quivalenten Gestalt 1 ζ(s) = 2s π s−1 sin( πs)Γ(1 − s)ζ(1 − s) 2 aufgeschrieben. F¨ ur diverse Beweise der Funktionalgleichung vergleiche man etwa die f¨ unf einschl¨ agigen Monographien u ¨ber die Riemannsche Zetafunktion von E.C. Titchmarsh (The Theory of the Riemann Zeta–Function, Clarendon Press, Oxford, 1951; 2nd Ed. 1986, revised by D.R. Heath–Brown; Reprint 1988), H.M. Edwards (Riemann’s Zeta Function, Academic Press, New York– London, 1974), A. Ivic (The Riemann Zeta–Function, J. Wiley, New York etc., 1985), S.J. Patterson (An introduction to the theory of the Riemann Zeta– Function, Cambridge University Press, Cambridge, 1988) und A.A. Karatsuba, S.M. Voronin (The Riemann Zeta–Function, W. de Gruyter, Berlin– New York, 1992).
11. Pole und Nullstellen der Zetafunktion. Hier¨ uber gibt folgendes Ergebnis Auskunft, dessen Beweis sich wesentlich auf die Funktionalgleichung 10(1) st¨ utzt.
§ 3.
Der Primzahlsatz
317
Satz. (i) Die Riemannsche Zetafunktion hat genau an der Stelle 1 einen Pol; dieser ist einfach und hat Residuum 1. (ii) Außerhalb des Streifens 0 < σ < 1 hat die Zetafunktion lediglich an −2, −4, −6, . . . Nullstellen, die s¨ amtliche einfach sind. (iii) F¨ ur jedes komplexe s mit 0 < Re s < 1 gilt: Ist eine der Zahlen s, s¯, 1−s, 1 − s¯ Nullstelle der Zetafunktion, so trifft dies f¨ ur s¨ amtliche zu; auch die Nullstellenordnungen sind dann dieselben. Beweis. (i), (ii): Mit R¨ ucksicht auf Satz 4 m¨ ussen nur noch die Teile der Behauptungen gezeigt werden, die sich auf die Halbebene σ ≤ 0 beziehen. In σ > 0 hat das Produkt P (s) := ζ(s)Γ( 2s )π −s/2 nach Satz 4 und den in Bemerkung 1 zu 10 zitierten Eigenschaften der Gammafunktion genau an der Stelle s = 1 einen Pol, der u ¨berdies einfach ist. Wegen 10(1) ist dies gleichbedeutend damit, daß P (s) in σ < 1 genau an der Stelle s = 0 einen Pol hat, der einfach ist. Dort hat aber der Faktor Γ( 2s ) von P (s) einen einfachen Pol, weshalb ζ(s) an 0 holomorph und von Null verschieden ist. So ist die Zetafunktion in σ < 1 polfrei. Da P (s) in σ ≥ 1 nullstellenfrei ist, gilt dies wegen 10(1) auch in σ ≤ 0. Insgesamt hat P (s) in σ ≤ 0 weder Nullstellen noch (wenn man von s = 0 absieht) Pole. Daher hat ζ(s) in σ ≤ 0 (abgesehen von der bereits behandelten Stelle s = 0) genau dort Nullstellen, wo Γ( 2s ) Pole hat, d.h. an s = −2, −4, −6, . . . ; Bemerkung 1 in 10 zieht die Einfachheit all dieser Nullstellen nach sich. (iii): Die Symmetrie–Eigenschaften der Nullstellen im Streifen 0 < σ < 1 ergeben sich folgendermaßen. In σ > 1 hat man ζ(¯ s) = n−¯s = n−s = ζ(s); n≥1
n≥1
analytische Fortsetzung zeigt dann, daß ζ(¯ s) = ζ(s) in ganz C zutrifft. Somit liegen die ζ–Nullstellen symmetrisch zur reellen Achse und die Ordnungen zweier konjugiert komplexer Nullstellen sind gleich. Aus 10(1) sieht man unmittelbar: Ist s eine in 0 < σ < 1 gelegene ζ–Nullstelle, so hat 1 − s dieselbe Eigenschaft und die Nullstellenordnungen von s und 1 − s sind gleich. Daß die Zetafunktion im sogenannten kritischen Streifen 0 < σ < 1 unendlich viele Nullstellen hat, die nach (iii) des Satzes symmetrisch sowohl zur Mittelgeraden σ = 12 als auch zur reellen Achse verteilt sind, war eine der drei Riemannschen Behauptungen, die Hadamard 1893 beweisen konnte (vgl. 1). ¨ Uber die vertikale Verteilung der ζ–Nullstellen im kritischen Streifen weiß man sehr gut Bescheid. Bezeichnet n¨amlich N (T ) f¨ ur reelles T ≥ 0 die gem¨aß Vielfachheiten genommene Anzahl dieser Nullstellen in 0 ≤ Im s ≤ T , so besagt eine
318
7. Primzahlen
durch Von Mangoldt 1905 bewiesene Behauptung Riemanns (1)
N (T ) =
T T T log − + O(log T ) 2π 2π 2π
bei T → ∞ (vgl. 1). ¨ Uber die horizontale Verteilung der ζ–Nullstellen des kritischen Streifens ist nicht so viel Genaues bekannt. Man kann bisher nicht die Existenz einer noch so kleinen reellen Konstanten η ∈]0, 12 ] garantieren, so daß ζ in der Halbebene σ > 1 − η nullstellenfrei ist (vgl. auch 12). Man kennt lediglich bei |t| → ∞ gegen Null konvergente positive Funktionen η(|t|), so daß ζ(σ + it) = 0 ist f¨ ur σ > 1 − η(|t|) und |t| gen¨ ugend groß. De La Vallee Poussin hat dies 1899 f¨ ur η(τ ) = c(log τ )−1 bewiesen; das beste Resultat in dieser Richtung lautet derzeit η(τ ) = c(log τ )−2/3 (log log τ )−1/3 und wurde 1958 unabh¨ angig voneinander (im wesentlichen) von N.M. Korobov und Vinogradov gefunden. Dabei bedeuten c jeweils absolute positive Konstanten.
12. Riemannsche Vermutung heißt die einzige der bisher noch offenen Riemannschen Behauptungen (vgl. 1): Alle im Streifen 0 < σ < 1 gelegenen Nullstellen der Zetafunktion liegen auf der Mittelgeraden σ = 12 . Heute vermutet man zus¨atzlich, daß auch (vgl. Satz 11 (ii)) diese Nullstellen s¨amtliche einfach sind. Andererseits seien von den theoretischen Resultaten, die f¨ ur die Richtigkeit der Riemannschen Hypothese sprechen, lediglich zwei erw¨ahnt. Zum einen gelang Weil (Oeuvres Scientifiques/Collected Papers I, 277–279) f¨ ur gewisse zu ζ analoge Funktionen der Beweis des Analogons zur Riemannschen Vermutung, ein Ergebnis, welches von P. Deligne (Inst. Hautes Etudes Sci. Publ. Math. 43, 273–307 (1974)) noch weitgehend verallgemeinert werden konnte. Zum zweiten konnte gezeigt werden, daß ein gewisser Anteil der nach Maßgabe von 11(1) im kritischen Streifen enthaltenen ζ–Nullstellen tats¨ achlich auf σ = 12 liegt. Bezeichnet n¨amlich N0 (T ) die gem¨aß Vielfachheiten gez¨ahlte Anzahl der ζ– Nullstellen auf der Strecke (1)
Re s =
1 , 2
0 ≤ Im s ≤ T,
so hat A. Selberg 1942 die Existenz einer reellen Konstanten c ∈]0, 1[ bewiesen, so daß N0 (T ) ≥ cN (T ) f¨ ur alle gen¨ ugend großen T > 0 gilt. Dasselbe Resultat mit c = 25 konnte J.B. Conrey (Bull. Amer. Math. Soc 20, 79–81 (1989)) sichern; genauer zeigte er, daß mindestens 40 Prozent der nichttrivialen ζ–Nullstellen auf σ = 12 liegen und u ¨berdies einfach sind.
§ 3.
Der Primzahlsatz
319
Interessant ist noch folgender einfache Zusammenhang zwischen Riemannscher Vermutung und dem Verhalten der bereits in Bemerkung 4 zu 1.4.9 betrachteten Funktion M (x) := n≤x μ(n), die trivialerweise der Ungleichung |M (x)| ≤ x
(2) f¨ ur alle reellen x ≥ 0 gen¨ ugt.
Satz. (i) Gilt M (x) = O(xα ) bei x → ∞ mit reellem α ∈ [ 12 , 1], so ist ζ in der Halbebene σ > α nullstellenfrei. (ii) Aus der Voraussetzung M (x) = O(x1/2 ) folgt die Richtigkeit der Riemannschen Vermutung und u ¨berdies die Einfachheit aller ζ–Nullstellen im kritischen Streifen. Beweis. Lemma 2.4 u ¨ber partielle Summation liefert bei σ > 1 x −s −s μ(n)n = M (x)x + s M (t)t−s−1 dt, 1
n≤x
woraus wegen (2) und 9(1) nach dem Grenz¨ ubergang x → ∞ f¨ ur σ > 1 folgt ∞ 1 (3) =s M (t)t−s−1 dt. ζ(s) 1 (i): Wird nun M (x) = O(xα ) vorausgesetzt, so konvergiert das Integral rechts in (3) in der Halbebene σ > α absolut und definiert dort eine holomorphe Funktion, wie analoge Betrachtungen zu 3(3) erkennen lassen. Die in σ > α holomorphe rechte Seite von (3) stellt somit die analytische Fortsetzung von ζ1 in die genannte Halbebene dar, weshalb dort ζ selbst nullstellenfrei sein muß. (Insbesondere zeigt dies Argument, daß M (x) = O(xα ) bei α < 12 sicher falsch ist.) (ii): Die jetzt wegen |M (x)| ≤ cx1/2 in σ > in dieser Halbebene die Absch¨ atzung
1 2
g¨ ultige Gleichung (3) impliziert
1 |s| . ≤c |ζ(s)| σ − 12
(4)
Ist s0 eine k–fache Nullstelle von ζ, so gilt ζ(s) = ak (s−s0 )k +. . . (mit ak ∈ C × ) f¨ ur alle komplexen s nahe bei s0 . Ist insbesondere s0 = 12 + it0 mit reellem t0 eine solche Nullstelle, so gilt f¨ ur alle s = 12 + ε + it0 mit kleinem ε ∈ IR+ wegen (4) die Absch¨ atzung | 12 + ε + it0 | 1 1 |ζ( + ε + it0 )| ≤ c(1 + |t0 |) (1 + |ak |)εk =: c1 εk−1 , ε 2 ε was wegen der Kleinheit von ε sofort k = 1 impliziert. 1≤c
320
7. Primzahlen
Bemerkungen. 1) Absch¨ atzungen des Typs M (x) = O(xα ) mit α < 1 sind bisher nicht bekannt (vgl. Korollar 9). Insbesondere macht Teil (ii) des Satzes das Interesse deutlich, welches die erst j¨ ungst widerlegte Mertenssche Vermutung gehabt hat (vgl. Bemerkung 4 zu 1.4.9). 2) Riemann selbst ¨außerte sich S. 139 a.a.O. zu seiner Behauptung so: “... es ist sehr wahrscheinlich, dass alle Wurzeln reell sind.∗) Hiervon w¨ are allerdings ein strenger Beweis zu w¨ unschen; ich habe indess die Aufsuchung desselben nach einigen fl¨ uchtigen vergeblichen Versuchen vorl¨ aufig bei Seite gelassen, da er f¨ ur den n¨ achsten Zweck meiner Untersuchung entbehrlich schien.” 3) Hilbert begann die Formulierung des achten Problems seiner schon in 3.2.13 ¨ und 6.5.1 genannten Sammlung unter der Uberschrift Primzahlprobleme folgendermaßen: “In der Theorie der Verteilung der Primzahlen sind in neuerer Zeit durch Hadamard, De La Vallee Poussin, Von Mangoldt und andere wesentliche Fortschritte gemacht worden. Zur vollst¨ andigen L¨osung der Probleme, die uns die Riemannsche Abhandlung ... gestellt hat, ist es jedoch noch n¨ otig, die Richtigkeit der a¨ußerst wichtigen Behauptung von Riemann nachzuweisen, daß die Nullstellen der Funktion ζ(s) ... s¨ amtlich den reellen Bestandteil 12 haben – wenn man von den bekannten negativ ganzzahligen Nullstellen absieht... ” Gegen Ende seines achten Problems regte Hilbert das Studium der Zetafunktion algebraischer Zahlk¨ orper an, was seither zwar intensiv betrieben wird, allerdings ohne daß hier die Analoga zur Riemannschen Vermutung h¨ atten gezeigt werden k¨onnen.
13. Schlußbemerkungen. Die ersten Beweise des Primzahlsatzes durch Hadamard und De La Vallee Poussin verliefen im wesentlichen so: Man stellt zun¨ achst die (je nach Vorgang gewichtete) Summe (1)
an
n≤x
der Koeffizienten der in σ > 1 konvergenten Dirichlet–Reihe an n−s von −ζ (s)/ζ(s) durch ein komplexes Integral l¨ angs der vertikalen Geraden Re s = σ0 mit σ0 > 1 dar, in dessen Integrand der Quotient ζ /ζ eingeht. Da ζ in σ ≥ 1, ja sogar noch in einem gewissen Bereich σ > 1 − η(|t|) (vgl. Ende von 11) nullstellenfrei ist, kann der Integrationsweg so weit nach links verlagert werden, daß man den Pol der ζ–Funktion an s = 1 zur asymptotischen Auswertung der ∗)
Er meint alle s mit ζ( 12 + is) = 0, die nicht rein imagin¨ ar sind.
§ 3.
Der Primzahlsatz
321
Koeffizientensumme (1) via Residuensatz ausnutzen kann. Diese Auswertung von (1) liefert den Primzahlsatz in der Form π(x) ∼ li x (vgl. 2.1). Klar ist, daß man f¨ ur die Wegverlagerung nach links gen¨ ugend gute obere Absch¨ atzungen f¨ ur den Integranden, insbesondere f¨ ur |(ζ /ζ)(σ + it)| in 1 − η(|t|) < σ ≤ σ0 bei |t| → ∞ ben¨ otigt. Sowohl die Sicherung der Nullstellenfreiheit von ζ in 1 − η(|t|) < σ < 1 bei gen¨ ugend großem |t| als auch die Gewinnung der erw¨ ahnten guten Schranken uhevoll. Daf¨ ur hat dieser ¨alteste Weg f¨ ur |ζ /ζ| in diesem Bereich ist zwar m¨ zum Primzahlsatz den Vorteil, sofort zu einer quantitativen Verfeinerung des Typs (2)
π(x) = li x + O(x exp(−c logα x))
bei x → ∞ mit positiver Konstanten c zu f¨ uhren. Gest¨ utzt auf sein am Ende von 11 erw¨ ahntes Resultat u ¨ber die Nullstellenfreiheit von ζ etwas links von σ = 1 hat De La Vallee Poussin 1899 die Asymptotik (2) mit α = 12 bewiesen. (Das ebenfalls am Ende von 11 zitierte Ergebnis von Korobov und Vinogradov f¨ uhrt in (2) im wesentlichen zu α = 35 und damit zum derzeit besten Restglied im Primzahlsatz.) Neue Wege zum Primzahlsatz haben um 1930 herum die Tauber–S¨ atze von S. Ikehara und N. Wiener er¨offnet. Grunds¨ atzlich gestatten Tauber–S¨ atze asymptotische Aussagen u ¨ber (1), wenn man das asymptotische Verhalten bei ugend σ → 1 der in σ > 1 durch die Reihe an n−s definierten Funktion gen¨ gut kennt und wenn die Reihen–Koeffizienten an geeignete Zusatzbedingungen erf¨ ullen. F¨ ur die Beweise und Anwendungen der angesprochenen Tauber–S¨ atze in der Primzahltheorie wurde die aufwendige Absch¨ atzung von |ζ /ζ| an ∞ ebenso u ¨berfl¨ ussig wie der Nachweis des Nichtverschwindens von ζ etwas links von σ = 1. Daf¨ ur h¨ angen die Beweise dieser Tauber–S¨ atze von gewissen Resultaten u ¨ber Fourier–Transformation ab, die ihrerseits keineswegs auf der Hand liegen. Vor fast drei Jahrzehnten hat D.J. Newman (Amer. Math. Monthly 87, 693– 696 (1980)) einen dritten analytischen Weg zum Primzahlsatz gefunden, dem die Darstellung oben in 2 bis 8 gefolgt ist. Wie dort gesehen, kommt der Newmansche Ansatz einerseits mit Integration l¨angs endlicher Wege (und der Tatsache ζ(s) = 0 in σ ≥ 1) aus, umgeht also Absch¨atzungen bei ∞; andererseits ist er frei von S¨ atzen der Fourier–Analysis. Newmans Konvergenzsatz 8 geht u ¨brigens auf Ingham (Proc. London Math. Soc. (2) 38, 458–480 (1935)) zur¨ uck, der allerdings Fourier–Theorie zum Beweis ben¨ utzte, was komplizierter als die Methode komplexer Integration ist. R¨ uckblickend kann man sagen, daß die analytische Primzahltheorie in weitgehender Ausf¨ uhrung des Riemannschen Programms durch die großen Erfolge von
322
7. Primzahlen
Hadamard, De La Vallee Poussin, Von Mangoldt und anderen um die Wende zum 20. Jahrhundert gewaltig vorangetrieben wurde. Diese Entwicklung wurde durch das Erscheinen von Landaus epochemachendem Handbuch [12] im Jahre 1909 noch verst¨ arkt: die Ideen der analytischen Zahlentheorie begannen sich rasch auszubreiten und zogen viele bedeutende Ergebnisse nach sich. Die Erfolge der analytischen Methoden f¨ uhrten andererseits gelegentlich auch zur Untersch¨ atzung elementarer Methoden selbst durch einflußreiche Mathematiker. So a¨ußerte sich etwa Hardy, dem die analytische Zahlentheorie starke Impulse verdankt, in seinem Vortrag u ¨ber “Goldbach’s Theorem” am 6. Oktober 1921 vor der Mathematischen Gesellschaft in Kopenhagen folgendermaßen (Collected Papers I, 549–550): ”You may ask me what an ‘elementary’ method is, and I must explain precisely what I understand by this expression. I do not mean an easy or a trivial method; an elementary method may be quite desperately ingenious and subtle. I am using the word in a definite and technical sense, and in this I am only following the common usage of arithmeticians. I mean, by an elementary method, a method which makes no use of the notion of an analytic function... ...Let us turn back ... to its central theorem, the ‘Primzahlsatz’∗) or ‘prime number theorem’... No elementary proof is known, and one may ask whether it is reasonable to expect one. Now we know that the theorem is roughly equivalent to a theorem about an analytic function, the theorem that Riemann’s Zeta– function has no zeros on a certain line∗∗) . A proof of such a theorem, not fundamentally dependent upon the ideas of the theory of function, seems to me extraordinarily unlikely. It is rash to assert that a mathematical theorem cannot be proved in a particular way... If anyone produces an elementary proof of the prime number theorem, he will show that these views are wrong, that the subject does not hang together in the way we have supposed... ” Als dann doch im Jahre 1948, wenige Monate nach Hardys Tod, gleichzeitig ¨ s (Proc. Nat. Selberg (Ann. Math. (2) 50, 305–313 (1949)) und P. Erdo Acad. Sci. USA 35, 374–384 (1949)) elementare Beweise des Primzahlsatzes fanden, wirkte dies wie eine Sensation: Seit Tchebychef hatte man sich ein Jahrhundert lang immer wieder vergeblich um einen derartigen Weg bem¨ uht. “Dies zeigt”, um mit Siegel zu sprechen, “daß man u ¨ber die wirklichen Schwierigkeiten eines Problems nichts aussagen kann, bevor man es gel¨ ost hat.” ¨ s–Selbergsche Entdeckung verhalf in der Folgezeit den elementaren Die Erdo Methoden in der Zahlentheorie zu neuem Ansehen und gab ihnen den geb¨ uhrenden Platz neben den analytischen zur¨ uck. Einen guten Eindruck von dieser ∗) ∗∗)
Man sieht auch bei Hardy den Einfluß von Landaus “Handbuch”. ζ(s) = 0 auf Re s = 1.
§ 3.
Der Primzahlsatz
323
Entwicklung gewinnt der interessierte Leser etwa anhand des Buchs von A.O. Gel’fond und YU.V. Linnik (Elementary Methods in the Analytic Theory of Numbers, M.I.T. Press, Cambridge/Mass., 1966).
Literaturverzeichnis
Literatur zur Zahlentheorie
[1]
Borewicz, S.I., Safarevic, I.R.: Zahlentheorie, Birkh¨ auser, Basel– Stuttgart, 1966
[2]
Chahal, J.S.: Topics in Number Theory, Plenum Press, New York– London, 1988
[3]
Edwards, H.M.: Fermat’s Last Theorem. A Genetic Introduction to Algebraic Number Theory, Springer, New York–Heidelberg–Berlin, 1977 (Corr. 3rd Printing 2000)
[4]
Frey, G.: Elementare Zahlentheorie, Vieweg, Braunschweig–Wiesbaden, 1984
[5]
Gundlach, K.B.: Einf¨ uhrung in die Zahlentheorie, Bibl. Institut, Mannheim–Wien–Z¨ urich, 1972
[6]
Hardy, G.H., Wright, E.M.: Einf¨ uhrung in die Zahlentheorie, Oldenbourg, M¨ unchen, 1958
[7]
Hasse, H.: Vorlesungen u ¨ber Zahlentheorie, Springer, Berlin-G¨ ottingenHeidelberg, 1950 (2. Aufl. 1964)
[8]
Hlawka, E., Schoissengeier, J.: Zahlentheorie, Manz, Wien, 1979 (2. Aufl. 1990)
[9]
Hua, L.K.: Introduction to Number Theory, Springer, Berlin–Heidelberg–New York, 1982
[10]
Indlekofer, K.–H.: Zahlentheorie, Birkh¨ auser, Basel–Stuttgart, 1978
[11]
Ireland, K., Rosen, M.: A Classical Introduction to Modern Number Theory, Springer, New York–Heidelberg–Berlin, 1982 (Corr. 2nd Printing 1993)
Literaturverzeichnis
325
[12]
Landau, E.: Handbuch der Lehre von der Verteilung der Primzahlen, Teubner, Leipzig–Berlin, 1909 (Nachdruck: Chelsea, New York, 1974)
[13]
Landau, E.: Vorlesungen u ¨ber Zahlentheorie, Hirzel, Leipzig, 1927 (Nachdruck: Chelsea, New York, 1950 (Band I, 1.Teil) bzw. 1969 (Band I, 2.Teil; B¨ande II, III))
[14]
Leveque, W.J.. Fundamentals of Number Theory, Addison–Wesley, Reading/Mass. etc., 1977 (Reprint: Dover, Mineola NY, 1996)
[15]
Leveque, W.J.: Topics in Number Theory, Addison-Wesley, Reading/ Mass., 1956 (Reprint: Dover, Mineola NY, 2002)
[16]
Mordell, L.J.: Diophantine Equations, Academic Press, London–New York, 1969
[17]
Narkiewicz, W.: Number Theory, World Scientific, Singapore, 1983
[18]
Niven, I., Zuckerman, H.S.: Einf¨ uhrung in die Zahlentheorie, Bibl. Institut, Mannheim–Wien–Z¨ urich, 1976
[19]
Perron, O.: Die Lehre von den Kettenbr¨ uchen, Teubner, Leipzig–Berlin, 1929 (3. Aufl., B¨ ande I, II, Teubner, Stuttgart, 1954, 1957)
[20]
Prachar, K.: Primzahlverteilung, Springer, Berlin–G¨ ottingen–Heidelberg, 1957 (2. Aufl. 1978)
[21]
Remmert, R., Ullrich, P.: Elementare Zahlentheorie, Birkh¨ auser, Basel– Boston–Berlin, 1986 (2. Aufl. 1995)
[22]
Ribenboim, P.: The New Book of Prime Number Records, Springer, New York etc., 1995
[23]
Ribenboim, P.: 13 Lectures on Fermat’s Last Theorem, Springer, New York–Heidelberg–Berlin, 1979 (2nd Printing 1994)
[24]
Rose, H.E.: A Course in Number Theory, Claredon Press, Oxford, 1988 (2nd Ed. 1994)
[25]
Scheid, H.: Zahlentheorie, Wissenschaftsverlag, Mannheim–Wien–Z¨ urich, 1991 (2. Aufl. 1994)
[26]
Schmidt, W.M.: Diophantine Approximation, Springer, Berlin–Heidelberg–New York, 1980 (2nd Printing 1996)
[27]
Schneider, T.: Einf¨ uhrung in die transzendenten Zahlen, Springer, Berlin–G¨ ottingen–Heidelberg, 1957
326
Literaturverzeichnis
[28]
Schwarz, W.: Einf¨ uhrung in die Zahlentheorie, Wiss. Buchgesellschaft, Darmstadt, 1975 (2. Aufl. 1987)
[29]
Sierpinski, W.: Elementary Theory of Numbers, Pa´ nstwowe Wydawnictwo Naukowe, Warszawa, 1964 (2nd Ed., revised and enlarged by A. Schinzel, North–Holland, Amsterdam–New York–Oxford, 1988)
[30]
Vaughan, R.C.: The Hardy-Littlewood method, University Press, Cambridge etc., 1981 (2nd Ed. 1997)
[31]
Waldschmidt, M.: Nombres Transcendants, Springer, Berlin–Heidelberg–New York, 1974
[32]
Wolfart, J.: Einf¨ uhrung in die Zahlentheorie und Algebra, Vieweg, Braunschweig–Wiesbaden, 1996
Aufgabensammlungen zur Zahlentheorie
[A1]
Kaiser, H., Lidl, R., Wiesenbauer, J.: Aufgabensammlung zur Algebra, Akad. Verlagsgesellschaft, Wiesbaden, 1975
[A2]
Parent, D.P.: Exercises de th´eorie des nombres, Paris, 1978 (Reproduction 1999)
[A3]
¨ , G.: Aufgaben und Lehrs¨ Polya, G., Szego atze aus der Analysis, Band II, Springer, Berlin–Heidelberg, 1925 (4. Aufl. 1971)
[A4]
Sierpinski, W.: A Selection of Problems in the Theory of Numbers, Pergamon Press, New York, 1964
[A5]
Sierpinski, W.: 250 Problems in Elementary Number Theory, Amer. Elsevier Publ. Comp., New York, 1970
Gauthier–Villars,
Zahlreiche Aufgaben sind auch in [2], [4], [10], [11], [14], [15], [17], [18], [24], [25] enthalten.
Literatur zur Geschichte der Zahlentheorie
¨hler, W.K.: Gauss, a biographical study, Springer, Berlin–Heidel[G1] Bu berg–New York, 1981
Literaturverzeichnis
327
[G2] Dickson, L.E.: History of the theory of numbers, Vols. I, II, III, Carnegie Institute, Washington D.C., 1919, 1920, 1923 (Reprint: Dover, Washington D.C., 2005) [G3] Dieudonne, J.: Geschichte der Mathematik 1700–1900, Vieweg, Braunschweig–Wiesbaden, 1985 [G4] Euklid: Die Elemente, Buch I–XIII, Wiss. Buchgesellschaft, Darmstadt, 1980 (Nachdruck 4. Aufl.: Deutsch, Frankfurt a.M., 2003) [G5] Gauss, C.F.: Untersuchungen u ¨ber h¨ ohere Arithmetik, Nachdruck: Chelsea, New York, 1965 ¨ (Deutsche Ubersetzung der Disquisitiones Arithmeticae, G. Fleischer Jun., Leipzig, 1801. Hiervon Nachdruck: Springer, Berlin etc., 1986. Die Disquisitiones Arithmeticae sind identisch mit dem ersten Band der Gaussschen Werke.) [G6] Mahoney, M.S.: The mathematical career of Pierre de Fermat, University Press, Princeton, 1973 [G7] Ore, O.: Number Theory and its History, McGraw Hill, New York etc., 1948 (Paperback: Dover, New York, 2001) [G8] Scharlau, W., Opolka, H.: Von Fermat bis Minkowski, Springer, Berlin–Heidelberg– New York, 1980 [G9] Thiele, R.: Leonhard Euler, Teubner, Leipzig, 1982 [G10] Van Der Waerden, B.L.: Erwachende Wissenschaft, Birkh¨ auser, Basel–Stuttgart, 1956 (2. Aufl. 1966) [G11] Weil, A.: Number Theory; An approach through history. From Hammurapi to Legendre, Birkh¨ auser, Boston–Basel–Stuttgart, 1983 (4th Printing 2007) [G12] Wussing, H.: Carl Friedrich Gauss, Teubner, Leipzig, 1979 (5. Aufl. 1989)
Namen– und Sachverzeichnis
Namenverzeichnis Adleman, L.M. 100, 101 Alford, W.R. 100 Apery, R. 40 Archimedes 186 Armengaud, J. 143 Artin, E. 113, 146 Aryabhata 32, 94 Augustinus 10 Bachet, C.G. 172 Bachmann, P. 50, 146, 183 Baker, A. 174, 254, 280 Balasubramanian, R. 163 Barnes, E.S. 74 Basmakova, I.G. 29 Bell, E.T. 53 Bernoulli, D. 52 Bernoulli, Jakob 52 Bernoulli, Johann 52 Bertrand, J. 285 Betti, E. 53 ¨ hmer, P.E. 251 Bo Bohman, J. 289 Borewicz, S.I. 324 Brahmagupta 32, 94 Bressoud, D.M. 101 Brun, V. 291 Buck, R.C. 284 ¨hler, W.K. 326 Bu
Buhler, J. 183 Burckhardt, J.C. 287 Cameron, M. 143 Cantor, G. 212, 216, 247 Carcavi, P. De 180 Cashwell, E.D. 58 Cataldi, P.A. 142 Cauchy, A.L. 172 Cayley, A. 196 Cesaro, E. 52 Chahal, J.S. 324 Chatland, H. 74 Chein, E.Z. 12 Chen, J.-R. 163, 291 Chernac, L. 287 Clarkson, R. 143 Cohen, H. 100 Colquitt, W.N. 143 Conrey, J.B. 318 Crandall, R. 101, 183 Czwalina, A. 29 Dase, Z. 287 Davenport, H. 74 Dedekind, R. 76 Deligne, P. 318 Denning, D.E.R. 102 Deshouillers, J.-M. 163
Namenverzeichnis
Diaz, G. 281 Glaisher, J. 287 Dickson, L.E. 163, 186, 327 Goldbach, C. 52, 80, 88, 282, 291 Dieudonne, J. 327 Granville, A. 100 Diophant 28, 170, 179 Gundlach, K.B. 324 Dirichlet, P.G.L. 52, 95, 139, 181, 187 Dixon, J.D. 101 Hadamard, J. 302 Dress, F. 163 Hagis, P. Jr. 12 Hajratwala, N. 143 Edwards, H.M. 182, 316, 324 Halberstam, H. 291 Eisenstein, G. 136, 146 Hardy, G.H. 50, 292, 307, 322, 324 Encke, J.F. 293 Hasse, H. 8, 146, 324 Eratosthenes 186, 286 Heath-Brown, D.R. 113, 316 ¨ s, P. 322 Erdo Hecke, E. 274 Ernvall, R. 183 Hensel, K. 8, 182 Euklid 5, 11, 12, 20, 21, 23, 28, Hermes, J. 88 168, 186, 327 Hermite, C. 257, 263 Euler, L. 11, 52, 80, 97, 109, 131, Hilbert, D. 14, 146, 162 139, 143, 145, 155, 158, 172, 177, 181, Hlawka, E. 324 191, 227, 240, 242, 257, 272, 282, 289, Hooley, C. 113 295, 315 Hua, L.K. 324 Everett, C.J. 58 Hurwitz, A. 143 Huygens, C. 237 Faltings, G. 177, 183, 185 Fauquembergue, E. 143 I-Hsing 94 Fel’dman, N.I. 254 Ikehara, S. 321 Fermat, P. 52, 80, 97, 155, 179, 184 Indlekofer, K.-H. 324 Fibonacci, L. (= Pisano, L.) 194, Ingham, A.E. 284, 321 287 Ireland, K. 324 Fourier, J.B. 220 Ivic, A. 316 Frey, G. 184, 324 Ivory, J. 97 Frobenius, G. 116 Iwaniec, H. 140 Fueter, R. 174 Jacobsthal, E. 155 Gage, P. 143 Jacobi, C.G.J. 113, 146, 164, 177 Gauss, C.F. 8, 13, 53, 65, 75, 76, 81, James, R.D. 14 87, 94, 103, 110, 115, 132, 134, 145, Jensen, K.L. 182 148, 162, 165, 199, 293, 327 Jordan, C. 48 Gel’fond, A.O. 272, 279, 323 Gerstenhaber, M. 146 Kaiser, H. 326 Gillies, D.B. 143 Kanada, Y. 214 Girard, A. 155 Karatsuba, A.A. 316
329
330
Namen- und Sachverzeichnis
Keller, W. 144 Koblitz, N. 102 Kondo, S. 214 Korobov, N.M. 318, 321 Kranakis, E. 101, 102 ¨ger, J.G. 287 Kru Kubina, J.M. 163 Kummer, E.E. 182 Kuz’min, R.O. 272 Lagarias, J.C. 289 Lagrange, J.L. 103, 145, 158, 185, 228, 232
Lambert, J.H. 110, 243, 257, 287 Landau, E. 50, 157, 162, 315, 325 Lang, S. 177 Laurent, M. 273 Legendre, A.M. 8, 130, 139, 145, 162, 181, 232, 243, 257, 293
Lehmer, D.H. 143, 289 Lehmer, D.N. 287 Leibniz, G.W. 52, 97, 103, 216 Lenstra, H.W., Jr. 100 Lessing, G.E. 186 Leveque, W.J. 325 Lidl, R. 326 Lindemann, F. 257 Linnik, YU.V. 323 Liouville, J. 162, 244 Littlewood, J.E. 50, 292 Lucas, E. 100, 140
Miller, J.C.P. 113 Miller, V.S. 289 Mills, W.H. 284 ¨ bius, A.F. 53 Mo Mordell, L.J. 175, 177, 325 Napier, J. (=Neper, J.) 206 Narkiewicz, W. 325 Neper, J. (= Napier, J.) 206 Newman, D.J. 321 Nicely, T.R. 285 Nickel, L. 143 Nikomachos 286 Niven, I. 14, 325 Noll, C. 143 Odlyzko, A.M. 46, 289 Olivera e Silva, T. 292 Opolka, H. 327 Ore, O. 327 Pagliarulo, S. 214 Parent, D.P. 326 Patterson, S.J. 316 Paxson, G.A. 100 Pell, J. 185 Perron, O. 24, 192, 232, 240, 325 Pervusin, J. 141, 143 Pieper, H. 147 Pintz, J. 46 Pisano, L. (= Fibonacci, L.) 194, 287
Mahler, K. 94, 163, 212, 221, 258, 263
Mahoney, M.S. 327 Mangoldt, H. Von 302, 315 Matijasevic, YU.V. 255, 284 Meissel, E.D.F. 289 Mengoli, P. 52 Mersenne, M. 80 Mertens, F. 46, 51, 299 ¨nkyla ¨, T. 183 Metsa
Poincare, H. 175 Polya, G. 326 Pomerance, C. 100 Powers, R.E. 143 Prachar, K. 120, 325 Pythagoras 10, 28, 167 Rabinowitsch, G. 283 Remmert, R. 325 Ribenboim, P. 183, 325
Namenverzeichnis
Ribet, K. 184 Richelot, F.J. 88 Richert, H.–E. 140, 291 Riele, H.J.J. Te 46 Riemann, B. 52, 175, 301, 316 Riesel, H. 143 Riesz, M. 307 Rivest, R. 101 Rivoal, T. 40 Robinson, R.M. 143 Rose, H.E. 325 Rosen, M. 324 Roth, K.F. 248, 291 Rumely, R. 100 Safarevic, I.R. 146, 324 Schanuel, S. 281 Scharlau, W. 327 Scheid, H. 325 Schinzel, A. 326 Schmidt, W.M. 255, 325 Schneider, T. 250, 272, 279, 325 Schoeneberg, B. 199 Schoissengeier, J. 324 Scholz, A. 199 Schooten, F. Van 287 Schwarz, W. 291, 326 Selberg, A. 318, 322 Selfridge, J.L. 143 Sesiano, J. 29 Shallit, J.O. 251 Shamir, A. 101 Shimura, G. 184 Siegel, C.L. 177, 248, 271 Sierpinski, W. 285, 326 Slowinski, D. 143 Spence, G. 143 Stark, H.M. 75 Stemmler, R.M. 163 Stevin, S. 216 Stickelberger, L. 116 Stieltjes, T.J. 46, 240
Stirling, J. 52 Stolz, O. 216 Sundman, K.F. 240 Sun-Tsu 90 Swinnerton-Dyer, H.P.F. 74 Sylvester, J.J. 52, 301 ¨ , G. 326 Szego Tagaki, T. 146 Taniyama, Y. 184 Taylor, R. 184 Tchebychef, P.L. 284, 295, 299 Thiele, R. 327 Thue, A. 155, 174, 248 Titchmarsh, E.C. 316 Tietze, H. 214 Tuckerman, B. 143 Ullrich, P. 325 Vallee Poussin, C. De La 302, 318, 321
Vaughan, R.C. 167, 293, 326 Vega, G. 287 Vinogradov, I.M. 292, 318, 321 Voronin, S.M. 316 Waerden, B.L. Van Der 216, 327
Waldschmidt, M. 280, 326 Wallis, J. 52, 237 Wang, T. 292 Wang, Y. 293 Wantzel, P. 243 Waring, E. 103, 162 Weierstrass, K. 260 Weil, A. 184, 318, 327 Weisstein, E.W. 237 Welsh, L., Jr. 143 Western, A.E. 113 Wieferich, A. 162 Wiener, N. 321
331
332 Wiesenbauer, J. 326 Wiles, A. 183 Wilson, J. 103 Wolfart, J. 326 Woltman, G. 143 Wright, E.M. 284, 324
Namen- und Sachverzeichnis
Wunderlich, M.C. 163 Wussing, H. 327 Zermelo, E. 8 Zuckerman, H.S. 325
333
Sachverzeichnis
Sachverzeichnis Abspaltungslemma 64 algebraisch (un-)abh¨ angig 260 algebraische Kurve 172 Grad einer —n — 172 rationaler Punkt einer —n — 172 algebraische Zahl 66 Haus einer —n — 263 Konjugierte einer —n — 67 Minimalpolynom einer —n — 66 Nenner einer —n — 263 Norm einer —n — 68, 69 algebraischer Zahlk¨ orper 68 Ganzheitsbasis eines —n —s 274 Grad eines —n —s 68 Approximationssatz Dirichletscher — 186 Liouvillescher — 244 Thue-Siegel-Rothscher — 163, 249 Artinsche Vermutung 113 assoziiert 54 asymptotisch gleich 49
Bertrandsches Postulat 284 beste N¨ aherung 235 birational a ¨quivalent 176
Cantorsche Entwicklung 217 Carmichael–Zahl 100 chinesischer Restsatz
89
Deszendenzmethode 174, 180 dezimale Darstellung — — nat¨ urlicher Zahlen 201 — — reeller Zahlen 206 diophantische Gleichung 29 lineare — — 29 polynomiale — — 29 direktes Produkt von Gruppen 92
direkte Summe von Ringen
92
Dirichlet–Reihe 307 Dirichletsches Schubfachprinzip 95 Division mit Rest 15 Divisionsalgorithmus 16, 60 duale (= dyadische) Darstellung 202
100,
Einheit 53 Einheitengruppe 53 euklidischer Algorithmus 23 Euler–Produkt 52 Eulersches Kriterium 131 Eulersche Phifunktion 48 Eulersche Summenformel 298 Exponentialpolynom 266 Faltung
41
Fermat–Eulerscher Satz 98 Fermatscher Satz großer — — 180 kleiner — — 96 Fermatsche Vermutung 180 Fermat–Zahl 80 Fibonacci–Folge 194 Fundamentalsatz der Arithmetik
7
g –adische Darstellung — — nat¨ urlicher Zahlen 202 Stellenzahl der — — — — 202 — — reeller Zahlen 206 Ziffern der — — — — 206 Ganzheitsbasis 274 Ganzheitsring 70 Gaussscher Zahlring 76 Gausssches Lemma 132 gebrochener Teil 186 Gel’fondsche Vermutung 281 gemischtperiodisch 207
334
Namen- und Sachverzeichnis
Gesamtgrad 62 ggT 15, 54 Goldbach–Probleme 292 Grad — einer algebraischen Zahl — eines Polynoms 62 — -Satz 63 Gradfunktion 60 Hauptideal 58 Hauptidealring 58 Hilbert–Probleme
elliptische — 177 rationale — 177 K¨ urzungsregel 82 66
Legendre–Symbol 130 Liouville–Absch¨atzung 264 Mersenne–Zahl 141 Mertenssche Vermutung 46 ¨ biussche Funktion 45 Mo ¨ biussche Umkehrformel 46 Mo
146
O(...), o(...) 49 Ideal — eines kommutativen Rings 58 — in Z 18 imagin¨ ar-quadratische Irrationalit¨ at 71 Index 122 Integrallogarithmus 295 Integrit¨ atsring 3, 53 invers modulo m 84 irreduzibel 55
Jacobsthalsche Summe 149 kanonische (Primfaktor-)Zerlegung 9 Kettenbruch 24, 223 — einer rationalen Zahl 24 Element eines —s 24 N¨ aherungsbruch eines —s 224 N¨ aherungsnenner eines —s 224 N¨ aherungsz¨ ahler eines —s 224 kgV 25, 55 kongruent modulo m 79, 107 Kongruenz lineare — 83 Modul einer — 84 polynomiale — 104 simultane lineare —en 89 Kurve algebraische — 172
Ordnung modulo m
96
partielle Summation
297
Pellsche Gleichung 185 Minimall¨ osung der —n — 190 Periode 208 Periodenl¨ ange 95, 207 periodische Folge 207 modulo m — — 95 Polynom 61 H¨ ohe eines —s 263 Koeffizienten eines —s 61 Leitkoeffizient eines —s 62 normiertes — 62 Polynomring 62 ganzzahliger — 65 Potenzrest 124 Primelement 55 Primfaktor 8 Primitivwurzel modulo m 109 Primzahl 5 (ir-)regul¨ are — 182 Primzahlsatz 52, 295, 302 Primzahltafeln 286 Primzahlzwilling 290 Prinzip des kleinsten Elements 3 pythagor¨ aisches Dreieck 177 pythagor¨ aisches Tripel 167 primitives — — 167
335
Sachverzeichnis
quadratfrei 46 —er Kern 128 quadratischer (Nicht-)Rest 124 quadratisches Reziprozit¨ atsgesetz 134 Erg¨ anzungss¨ atze zum —n — 134 reduzibel 55 reell–quadratische Irrationalit¨ at 71 reinperiodische Folge 207 modulo m — — 95 Restklasse modulo m 79 prime — — 86 prime —ngruppe — 86 Restsystem modulo m absolut kleinstes — — 83 kleinstes nichtnegatives — — 83 primes — — 86 vollst¨ andiges — — 83 reziprok modulo m 84 Riemannsche Fl¨ache 175 Geschlecht einer —n — 175 Riemannsche Vermutung 318 Riemannsche Zetafunktion 39 Funktionalgleichung der —n — 316 Ring euklidischer — 60 faktorieller — 57 ZPE- — 58 Satz von — — Dirichlet 138 — — Euklid u ¨ber Primzahlen 5 pythagor¨ aische Tripel 168 — — Euler u ¨ber Kongruenzen 97 periodische Kettenbr¨ uche 227 — — Fermat 96 — — Gauss 115 — — Gel’fond-Schneider 272 — — Hermite 258
— — Hermite-Lindemann 259 — — Jacobi 166 — — Lagrange u ¨ber den Kettenbruch reell-quadratischer Zahlen 229 vier Quadrate 158 — — Lindemann-Weierstrass 260 — — Wilson 102 Schanuelsche Vermutung 281 Sekantenmethode 174 Sieb des Eratosthenes 286 Siegelsches Lemma 275 summatorische Funktion 44 Tangentenmethode 173 teilbar 3, 53 Teiler 3, 53 echter — 55 gr¨ oßter gemeinsamer — 15, 54 Teileranzahlfunktion 4, 10 teilerfremd 19, 54 paarweise — 19 Teilersummenfunktion 10 Thue–Gleichung 252 Thuesches Lemma 155 unzerlegbar
55
Vielfaches 3 kleinstes gemeinsames — Vielfachheit 9 Vorperiode 208 Vorperiodenl¨ ange 95, 207
25, 55
Waring–Problem 162 Wurzel eines Polynoms modulo m 104 Zahl algebraische — 66 ganze (= ganzrationale) —
2, 70
336
Namen- und Sachverzeichnis
ganzalgebraische — 70 nat¨ urliche — 2 transzendente — 66 vollkommene — 10 zusammengesetzte — 5 zahlentheoretische Funktion 35 Mittelwert einer —n — 315 (streng) additive — — 36
(streng) multiplikative — — 36 Zahlk¨ orper algebraischer — 68 imagin¨ ar-quadratischer — 71 quadratischer — 71 reell-quadratischer — 71 zerlegbar 55