Gernot Stroth Algebra De Gruyter Studium
Gernot Stroth
Algebra
Einführung in die Galoistheorie
2. überarbeitete und erweiterte Auflage
Mathematics Subject Classification 2010 12D-xx, 12E-xx, 12F-xx, 12J-xx, 13A-05, 13F-xx, 20B-xx, 20D-xx Autor Prof. Dr. Gernot Stroth Martin-Luther-Universitat Halle-Wittenberg Naturwissenschaftliche Fakultät II Institut für Mathematik 06099 Halle (Saale)
[email protected]
ISBN 978-3-11-029070-7 e-ISBN 978-3-11-029071-4
Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2013 Walter de Gruyter GmbH, Berlin/Boston Satz: Tanovski Publishing Services, Leipzig Druck und Bindung: Hubert & Co. GmbH & Co. KG, Göttingen Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com
Für Natascha, Kerstin und Nicole
Vorwort zur 2. Auflage Die zweite Auflage wurde in einigen Einzelheiten, insbesondere bei den Druckfehlern, aber auch inhaltlich, verbessert. Für die gemachten Anregungen bedanke ich mich besonders bei den Kollegen Benjamin Friedrich (Leipzig) und Tibor Toth (Cardiff). Darüber hinaus wurde ein kleines Kapitel über rein inseparable Körpererweiterungen eingefügt und das Kapitel über p-adische Zahlen zu einer Einführung in die Bewertungstheorie ausgeweitet. Damit konnte dann im Anhang auch der Satz von Monsky bewiesen werden, der zwar ein Satz der Geometrie ist, für den aber bis heute kein Beweis ohne Bewertungstheorie bekannt ist. Das zentrale Anliegen des Buches ist nach wie vor das Studium der Nullstellen von Polynomen. Dies wurde mit einem neuen Kapitel 20 zum Satz von Sturm abgeschlossen, welches durch das Kapitel 19 über angeordnete Körper vorbereitet wird, das sicherlich auch von unabhängigen Interesse ist. Für die Unterstützung beim Erstellen der Zeichnungen sei dem Verlag De Gruyter und insbesondere Herrn Plamen Tanovski gedankt. Halle, im Februar 2013
Gernot Stroth
Vorwort zur 1. Auflage Der vorliegende Text ist aus meiner Vorlesung Algebra I/II, die ich mehrmals an der Freien Universität Berlin und dann im akademischen Jahr 1994/95 an der Martin-LutherUniversität Halle-Wittenberg gehalten habe, entstanden. Die Vorlesung richtete sich an Studenten im dritten Fachsemester. Vorausgegangen war eine Vorlesung „Lineare Algebra“, etwa im Umfang meines Buches Lineare Algebra, Heldermann 1995, in der die Begriffe Ring, Körper und Gruppe einführend behandelt wurden, so dass hier bereits einige Kenntnisse vorausgesetzt werden konnten. Die relevanten Tatsachen werden jedoch (ohne Beweis) im vorliegenden Buch kurz angegeben. In der Vorlesung Algebra I wurde der Standardstoff, Kapitel 1–Kapitel 10 dieses Buches, behandelt. Im Gegensatz zu den meisten Büchern über Algebra, in denen die Begriffe Gruppe, Ring, Körper als eigenständige Gebiete vorgestellt werden, ist das Ziel dieses Buches, eine Darstellung der Galoistheorie von Polynomgleichungen zu geben. Alles ordnet sich diesem Ziel unter. So werden Ringe und Gruppen nur soweit behandelt, wie es für die Entwicklung der Galoistheorie notwendig ist. Der Name Algebra ist arabischer Herkunft und bedeutet in etwa „Lösung von Gleichungen“. Dies ist auch der Gegenstand dieses Buches. In der Schule lernt man, wie man die Lösungen von 3x 2 − 13x − 10 = 0 findet. Die Gleichung ax 2 + bx + c = 0 hat die Wurzeln √ −b ± b 2 − 4ac . r1 , r2 = 2a Das liefert dann für obige Gleichung r1 , r2 = 5, −2/3. Das Hauptanliegen dieses Buches ist die Beschäftigung mit Polynomgleichungen und ihren Lösungen. Schon die Babylonier (1600 v. Chr.) besaßen Methoden, quadratische Gleichungen zu lösen. Ca. 100 n. Chr. wurden die ersten algebraischen Formeln für quadratische Polynome gefunden. Geometrische Lösungen für die Gleichungen dritten Grades waren auch bekannt, algebraische Formeln aber bis 1500 völlig unbekannt. Die Mathematiker der Renaissance in Bologna teilten kubische Gleichungen in drei Grundtypen ein x 3 + px = q,
x 3 = px + q,
x 3 + q = px.
Man beachte, dass die Existenz negativer Zahlen noch nicht akzeptiert wurde. Diese Gleichungen wurden von Ferro gelöst. Die heute übliche Formel stammt von Tartaglia (1535), der seine Methode in einem öffentlichen Wettkampf der Methode von Fior, einem Studenten von Ferro, gegenüber stellte und ihre Überlegenheit demonstrierte. Allerdings hielt er seine Methode, wie damals durchaus üblich, geheim, hat sie jedoch später Cardano mitgeteilt, wobei dieser versprechen musste, sie nicht weiterzugeben. Dieser hielt sich nicht daran, sondern veröffentlichte 1545 ein Buch, in dem sich unter anderem auch die Lösungsformeln der Gleichungen dritten Grades befanden. Weiter enthielt das Buch die auf Ferrari, einen Schüler von Cardano, zurückgehende Methode,
Vorwort zur 1. Auflage
ix
eine Gleichung vierten Grades zu lösen, indem man sie auf eine kubische Gleichung zurückführt. Alle Formeln hatten eine seltsame gemeinsame Eigenschaft. Man erhält z. B. für die Gleichung x 3 + px = q 3 2 3 q 3 q q q2 p p3 + + + + + . x= 2 27 4 2 27 4 Dieser Ausdruck ist aus den Koeffizienten der Gleichung aufgebaut, wobei nur Addition, Subtraktion, Multiplikation, Division und Wurzelziehen vorkommen. Solche Ausdrücke nennt man Radikale. Da alle Gleichungen vom Grad höchstens vier nun durch Radikale gelöst waren, war es natürlich zu fragen, ob dies auch für die Gleichung 5. Grades möglich ist. Viele Mathematiker versuchten sich an diesem Problem. Euler z. B. fand viele neue Methoden. Um 1770 war es Lagrange, der einen wesentlichen Schritt vorwärts machte. Er untersuchte systematisch die verschiedenen Tricks, die zu den Formeln für die Gleichungen vom Grad ≤ 4 führten, und zeigte, dass diese alle im Wesentlichen darauf beruhten, geeignete Funktionen in den Wurzeln zu finden, die unter gewissen Permutationen der Wurzeln invariant sind. Er zeigte weiter, dass dieses Verfahren für die Gleichung fünften Grades scheitern muss. Somit hatte man nach Lagrange die Vermutung, dass die Lösung der allgemeinen Gleichung 5. Grades durch Radikalausdrücke nicht möglich ist. Im Jahre 1813 lieferte Ruffini einen Beweis, der allerdings einige Lücken hatte. Dies lag hauptsächlich daran, dass Ruffini keine mathematisch strenge Definition der Lösbarkeit durch Radikalausdrücke hatte. Die Nichtlösbarkeit der allgemeinen Gleichung 5. Grades wurde schließlich von Abel 1824 bewiesen. Nun ergab sich natürlich die Frage, welche Gleichungen sind durch Radikale lösbar. Abel arbeitete hieran, starb aber 1829. Die Lösung dieses Problems durch Galois 1832 ist dann auch der Hauptgegenstand dieses Buches. Die eigentliche revolutionäre Idee von Galois war die folgende: Seien f ein Polynom mit rationalen Koeffizienten und x1 , . . . , xn die Nullstellen. Sei K = Q(x1 , . . . , xn ) der kleinste Teilkörper von C, der alle Nullstellen enthält, so muss man K untersuchen, wenn man etwas über f erfahren will. Dem Körper K wird eine gewisse Gruppe G von Automorphismen zugeordnet, die sogenannte Galoisgruppe. Wir betrachten z. B. die Gleichung √ √ √ √ x 4 − 5x 2 + 6 = 0. Die Nullstellen in C sind α = 2, β = − 2, γ = 3 und δ = − 3. Es gehören die Paare α, β und γ, δ jeweils irgendwie zusammen. Wir können α und β von γ und δ unterscheiden, indem wir nur Gleichungen mit rationalen Koeffizienten benutzen. Es sind α und β Nullstellen von x 2 − 2 aber γ und δ nicht. Zwar besteht auch ein Unterschied zwischen α und β, aber der Vorzeichenwechsel ist nicht mit rationalen Polynomen zu entdecken. Nun gibt es genau vier Anordnungen der Wurzeln, so dass alle in der ersten Anordnung richtigen rationalen Gleichungen in jeder Anordnung richtig bleiben: αβγδ |αβδγ |βαγδ |βαδγ . Die Permutationsgruppe dieser vier Anordnungen ist genau die Galoisgruppe. Galois zeigte, dass sich viele wesentliche Eigenschaften von f in der Gruppe G widerspiegeln, so z. B. die Frage nach der Lösbarkeit durch Radikale. Dabei entdeckte er, dass es in Gruppen G ausgezeichnete Untergruppen N gibt, die sogenannten Normalteiler. Zu diesen gehören dann
x
Vorwort zur 1. Auflage
Zwischenkörper Q ⊆ K1 ⊆ K , die genauso wie K gebildet sind. Damit ist die Tür zur Induktion aufgestoßen. Das Hauptresultat von Galois ist, dass f genau dann eine Radikalformel für die Wurzeln besitzt, falls es eine Kette 1 = N1 N2 · · · Nk = G gibt, so dass Ni+1 /Ni kommutativ ist. Bedeutend ist hierbei, dass das Kriterium nicht irgendeine Formel in den Koeffizienten des Polynoms f ist. Um die Frage nach der Auflösbarkeit durch Radikalausdrücke beantworten zu können, muss eine neue Struktur, die Gruppe, eingeführt werden. Das Kriterium ist dann in der Sprache dieser neuen Theorie. Die Entdeckung des Normalteilers durch Galois und die Entwicklung der Galoistheorie war der eigentliche Anfang der Algebra, deren Axiomatisierung bis in die 30er Jahre dieses Jahrhunderts reicht. Der Weg zu diesem Resultat wird lang sein. Wir müssen uns zunächst in Kapitel 1 mit Polynomen beschäftigen. Dazu werden wir etwas allgemeinere Strukturen, die Ringe, betrachten. Für eine gewisse Klasse, euklidische Ringe, Hauptidealringe, zu denen dann auch die Polynomringe gehören, werden wir eine Teilbarkeitstheorie entwickeln. Als nächstes müssen wir uns die Körper näher ansehen. Das heißt, wir müssen uns mit der Frage beschäftigen, wie wir überhaupt zu obigem Körper K kommen (Kapitel 2, Kapitel 3). Wir werden algebraische Erweiterungen von Körpern und Zerfällungskörper von Polynomen betrachten. Weiter werden wir die Existenz algebraisch abgeschlossener Körper beweisen. In Kapitel 5 müssen wir die Gruppentheorie soweit entwickeln, dass wir unsere Probleme wirklich mit Hilfe dieser Theorie lösen können. Insbesondere werden wir uns mit auflösbaren Gruppen beschäftigen und zeigen, dass die symmetrische Gruppe vom Grad mindestens 5 nicht auflösbar ist. Dies ist der eigentliche Grund für die Nichtexistenz von Auflösungsformeln obiger Art für Gleichungen vom Grad größer als vier. Darüber hinaus werden wir den wichtigsten Satz der endlichen Gruppentheorie, den Sylowsatz, beweisen. In Kapitel 6 werden wir dann die eigentliche Galoistheorie entwickeln, die den Zusammenhang zwischen den Zwischenkörpern und der Automorphismengruppe einer Körpererweiterung zum Gegenstand hat. Die Galoistheorie wird hier als Teilgebiet der Körpertheorie, also ohne Verbindung zu den Polynomen, vorgestellt. Diese Verbindung wird dann später in Kapitel 7 und Kapitel 8 hergestellt. Hier wird gezeigt, dass der Zerfällungskörper eines separablen Polynoms stets galoissch ist, d. h. hierauf ist die in Kapitel 6 entwickelte Theorie anwendbar. Das Ziel dieses Buches ist, zu zeigen, was hinter den klassischen Problemen, wie Lösbarkeit von Gleichungen (Kapitel 10, Kapitel 13) und Konstruktion mit Zirkel und Lineal steckt (Kapitel 4, Kapitel 11). Darüber hinaus kann man sehen, wie verschiedene Zweige der Mathematik zusammenarbeiten, um ein Problem zu lösen. Wir werden die bis hierher entwickelte Theorie anwenden, um das eingangs angedeutete Kriterium zur Auflösbarkeit von Polynomgleichungen durch Radikalausdrücke herzuleiten. Weiter
Vorwort zur 1. Auflage
xi
werden wir die klassischen Konstruktionsaufgaben Dreiteilung des Winkels, Quadratur des Kreises, Verdoppelung des Würfels und Konstruktion des regelmäßigen n-Ecks behandeln. Neben der reinen Entwicklung der Theorie wollen wir uns auch mit praktischen Fragen beschäftigen. Diese werden im zweiten Teil des Buches im Vordergrund stehen. So wollen wir uns in Kapitel 12 mit einer interessanten Klasse von Polynomen, den Kreisteilungspolynomen beschäftigen. Neben der Frage nach Irreduzibilität wird hier auch die Frage nach Methoden zur Berechnung dieser Polynome beantwortet. Wir werden die Resultate über Kreisteilungspolynome anwenden, um drei klassische Sätze, den Satz von Zsigmondy über die Existenz von primitiven Primzahlen, den Satz von Dirichlet über Primzahlen in arithmetischer Progression und den Satz von Wedderbum über die Nichtexistenz endlicher Schiefkörper zu beweisen. Viele praktische Fragen beruhen darauf, dass wir Polynome in irreduzible faktorisieren können, bzw. den größten gemeinsamen Teiler von Polynomen berechnen können. Hierzu werden in Kapitel 16 und Kapitel 17 Algorithmen entwickelt. Der notwendige theoretische Unterbau, der aus der Bewertungstheorie kommt und mit dem Henselschen Lemma endet, wird in Kapitel 15 bereitgestellt. Dabei ist auch hier wieder nicht an eine Einführung in die Bewertungstheorie gedacht. Es soll nur der später vorgestellte Hensel-Algorithmus motiviert werden. Das Buch endet in Kapitel 18 mit Methoden zur Berechnung von Galoisgruppen. Zunächst werden die bekannten Formeln für die Gleichung vom Grad höchstens 4 hergeleitet. Danach werden zwei Algorithmen zur Berechnung von Galoisgruppen von Polynomen mit ganzzahligen Koeffizienten vorgestellt. Da diese sehr viel Information über die symmetrischen Gruppen voraussetzen, ist klar, dass sie nur bis zu kleinen Graden eingesetzt werden können. Auf welchen Ideen allgemeine Algorithmen beruhen könnten, wird am Ende dieses Paragraphen kurz skizziert. Auch das sog. Umkehrproblem der Galoistheorie wird kurz angesprochen. So werden in Kapitel 14 die abelschen Gruppen und in Kapitel 18 die symmetrischen Gruppen als Galoisgruppen über Q realisiert. Auch wird als Beispiel die Gruppe AG(3, 2), eine Erweiterung einer Gruppe der Ordnung 8 mit GL(3, 2), als Galoisgruppe eines Polynoms vom Grad 8 realisiert. In einem Anhang haben wir zwei Gegenstände aufgenommen, die nicht für das Erreichen der in diesem Buch gestellten Ziele notwendig sind, aber doch in ein Algebra Lehrbuch gehören, den Beweis der Transzendenz von e und π und den Beweis der algebraischen Abgeschlossenheit von C. Zum Ende noch ein paar Worte zu der Person Evariste Galois. Er wurde 1811 geboren und starb 1832 nach einem Duell. Mit 15 Jahren publizierte er bereits seine ersten Arbeiten. Genauso revolutionär wie im politischen war er auch im mathematischen Denken. Insofern hatte er es schwer von seinen Zeitgenossen verstanden zu werden. Seine erste Arbeit auf dem Gebiet der Auflösbarkeit von Polynomgleichungen reichte Galois 1829 bei der Akademie der Wissenschaften in Paris ein. Sein Referent war
xii
Vorwort zur 1. Auflage
Cauchy, der sich damals auch mit der Auflösbarkeit von Polynomgleichungen befaßte. Cauchy lehnte diese Arbeit und eine acht Tage später zum gleichen Thema eingereichte Arbeit ab. Die Manuskripte sind nie gefunden worden. Auch eine 1830 anlässlich des Wettbewerbs „Großer Preis der Mathematik“ eingereichte Arbeit ist verschollen. Im Jahre 1831 sandte Galois zum letzten Mal eine Arbeit an die Akademie. Da Cauchy nicht in Paris war, wurden Poisson und Lacroix zu Gutachtem bestellt. Beide waren allerdings mehr an Physik als an Algebra interessiert. So lehnten sie nach 5 Monaten die Arbeit mit der Begründung ab, dass sie sie nicht verstehen und ihre Bedeutung auch nicht sehen. Das Werk Galois wurde also von seinen Zeitgenossen weder verstanden noch gewürdigt. Es wäre wohl verlorengegangen, wenn er nicht am Vorabend seines Duells seine Resultate in einem Brief an seinen Freund Auguste Chevalier zusammengefaßt hätte. Es dauerte bis 1846, bis sein Nachlass herausgegeben wurde. Äußerer Anlass waren Arbeiten von Cauchy zur Gleichungstheorie, die sich aber im althergebrachten Rahmen bewegten. Liouville erkannte nun die wesentliche Bedeutung der Galoisschen Arbeiten und gab sie 1846 heraus. Für weitere Informationen zu diesem Themenkreis sei auf die Biographie „Evariste Galois 1811–1832“ von Laura Toti Rigatelli, Birkhäuser 1996, verwiesen. Abschließend danke ich noch allen, die das Entstehen dieses Buches über die Jahre kritisch begleitet haben. Mein besonderer Dank geht an die Studenten meiner Vorlesung 1996/97, die mich bei der Fehlersuche unterstützt haben, und an Herrn Dr. S. Heiss, der große Teile des Manuskripts gelesen und Verbesserungsvorschläge gemacht hat. Halle, im Januar 1998
Gernot Stroth
Inhalt Vorwort zur 2. Auflage
vii
Vorwort zur 1. Auflage
viii
1
1
Ringe
2
Körpererweiterungen
3
Algebraische Erweiterungen
4
Konstruktionen mit Zirkel und Lineal
5
Gruppen
6
Galoistheorie
7
Normale Erweiterungen
8
Separable Erweiterungen
9
Rein inseparable Erweiterungen
10
Radikalerweiterungen
11
Regelmäßige n-Ecke
12
Kreisteilungskörper
13
Norm und Spur
14
Abelsche Erweiterungen von Q
15
Bewertungen und p -adische Zahlen
16
Der größte gemeinsame Teiler
217
17
Faktorisierung von Polynomen
228
18
Galoisgruppen
35 40 55
61 92 110 117 125
129 137 148
169
245
175 179
xiv
Inhalt
19
Angeordnete Körper
20
Der Satz von Sturm
A
Der Körper der komplexen Zahlen
B
Transzendenz von e und π
C
Triangulierung von Quadraten
Literaturverzeichnis Stichwortverzeichnis
311 313
279 291 297
301 306
1 Ringe Dieses Kapitel soll die Grundlagen für die späteren Untersuchungen im Rahmen der Galoistheorie legen. Wir werden uns deshalb im Wesentlichen nur mit den Polynomringen beschäftigen. Für diese soll eine Teilbarkeitstheorie entwickelt werden, die parallel zu der Teilbarkeitstheorie in Z ist. Dabei werden wir sehen, dass beide Ringe nur Spezialfälle von größeren Klassen von Ringen, den euklidischen Ringen bzw. den Hauptidealringen, sind. Insbesondere die beiden letzten Klassen von Ringen spielen in der Zahlentheorie eine wichtige Rolle, auf die wir aber im Rahmen dieses Buches nicht eingehen können. Eine Andeutung dieses Zusammenhangs wird in Beispiel 1.29 gegeben. Wir setzen voraus, dass der Leser mit den einfachsten Definitionen und Resultaten der Ringtheorie vertraut ist, wiederholen aber noch einmal die notwendigen Definitionen. Definition 1.1. Sei R eine Menge mit zwei Verknüpfungen +, ·. Bezüglich + sei R eine kommutative Gruppe. Weiter gelte: (1) a · (b · c) = (a · b) · c für alle a, b, c ∈ R. (2) a · (b + c) = a · b + a · c für alle a, b, c ∈ R. (3) (a + b) · c = a · c + b · c für alle a, b, c ∈ R. (4) Es gibt ein Element 1 ∈ R mit 1 · a = a · 1 = a für alle a ∈ R. Dann nennen wir R einen Ring. Ist a · b = b · a für alle a, b ∈ R, so heißt R kommutativ. Ein kommutativer Ring, in dem (R\{0}, ·) eine Gruppe ist, heißt Körper. Da normalerweise die Art der Verknüpfung aus dem Zusammenhang heraus ersichtlich ist, werden wir in Zukunft statt a · b einfach ab schreiben. Definition 1.2. Seien R ein Ring und i ⊆ R. Es seien (i, +) eine Untergruppe von (R, +) und ai ∈ i für alle a ∈ R und i ∈ i. Dann heißt i ein Linksideal in R. Entsprechend wird Rechtsideal definiert. Ist i Linksideal und Rechtsideal, so heißt i 2seitig. Ist aus dem Zusammenhang klar, ob es sich um ein Links- oder Rechtsideal handelt, bzw. falls dies keine Rolle spielt, so werden wir einfach von einem Ideal sprechen. Beispiel 1.3. (1) Seien R = Z und i = 2Z = {n | n ∈ Z, n gerade }. Dann ist i ein Ideal. Wir werden später sehen, dass alle Ideale von Z ähnlich wie i aussehen, also aus den Vielfachen eines festen Elementes aus Z bestehen. (2) Sei R = ac db | a, b, c, d ∈ R der Ring der 2 × 2-Matrizen über R. Wir setzen
a b i= | a, b ∈ R . 0 0 x y x y ya+tb Es ist a0 b0 z t = xa+zb ∈ i für alle z t ∈ R. 0 0
2
Ringe
Somit ist i ein Rechtsideal. Es ist aber kein Linksideal, da 0 0 a b 0 0 = ∈ i 1 0 0 0 a b ist. Also sind die Begriffe Links- und Rechtsideal verschieden. Definition 1.4. Sei R ein Ring und sei i ein 2-seitiges Ideal in R. Wir setzen R/i = {a + i | a ∈ R}.
Auf R/i definieren wir eine Addition und Multiplikation durch (a + i) + (b + i) = (a + b) + i (a + i)(b + i) = ab + i.
Wir nennen R/i mit dieser Addition und Multiplikation den Faktorring von R nach i. Dass die Bezeichnung „Ring“ für R/i gerechtfertigt ist, zeigt der folgende Satz, dessen Beweis wir dem Leser überlassen. Satz 1.5. Seien R ein Ring und i ein 2-seitiges Ideal in R. Dann ist R/i ein Ring. Definition 1.6. Seien R1 und R2 zwei Ringe. (1) Eine Abbildung f : R1 → R2 heißt (Ring-)Homomorphismus, falls ϕ(a + b) = ϕ(a) + ϕ(b)
und
ϕ(ab) = ϕ(a)ϕ(b)
für alle a, b ∈ R1 gilt. Ein surjektiver, injektiver, bijektiver Homomorphismus heißt Epimorphismus, Monomorphismus bzw. Isomorphismus. Gibt es einen Isomorphismus zwischen R1 und R2 , so schreiben wir R1 R2 .
(2) Sei ϕ : R1 → R2 ein Homomorphismus. Wir setzen Kern ϕ = {a | a ∈ R1 , ϕ(a) = 0}.
Wir nennen Kern ϕ den Kern von ϕ.
Ringe
3
Satz 1.7. Seien R1 und R2 zwei Ringe und ϕ : R1 → R2 ein Homomorphismus. Dann ist Kern ϕ ein 2-seitiges Ideal in R1 und R1 / Kern ϕ Bild ϕ.
Beweis. Offenbar ist Kern ϕ eine Untergruppe von R1 bezüglich +. Seien nun a ∈ R1 und b ∈ Kern ϕ. Dann ist ϕ(ab) = ϕ(a)ϕ(b) = 0 = ϕ(b)ϕ(a) = ϕ(ba).
Also sind ab und ba in Kern ϕ, d. h. Kern ϕ ist ein 2-seitiges Ideal. Wir definieren ψ : Bild ϕ → R1 / Kern ϕ durch ψ(ϕ(a)) = a + Kern ϕ.
Da ψ durch die Wahl eines Urbildes von ϕ(a) definiert wurde, ist zunächst zu zeigen, dass ψ wohldefiniert ist. Sei dazu ϕ(a) = ϕ(b). Dann ist a − b ∈ Kern ϕ, also ist a + Kern ϕ = b + Kern ϕ. Somit ist ψ wohldefiniert. Wir zeigen nun zuerst, dass ψ ein Homomorphismus ist. Wir wählen dazu Elemente ϕ(a), ϕ(b) ∈ Bild ϕ. Dann ist ψ(ϕ(a) + ϕ(b)) = ψ(ϕ(a + b)) = (a + b) + Kern ϕ = (a + Kern ϕ) + (b + Kern ϕ) = ψ(ϕ(a)) + ψ(ϕ(b))
und ψ(ϕ(a)ϕ(b)) = ψ(ϕ(ab)) = (ab) + Kern ϕ = (a + Kern ϕ)(b + Kern ϕ) = ψ(ϕ(a))ψ(ϕ(b)).
Also ist ψ ein Homomorphismus. Sei a ∈ R1 . Dann ist ψ(ϕ(a)) = a + Kern ϕ, also ist ψ ein Epimorphismus. Sei ψ(ϕ(a)) = Kern ϕ. Dann ist a ∈ Kern ϕ, also ϕ(a) = 0. Somit ist ψ ein Monomorphismus. Eine wichtige Folgerung aus Satz 1.7, die wir häufig benutzen werden, ist, dass für ein 2-seitiges Ideal i jedes Ideal von R/i Bild eines Ideals von R, das oberhalb von i liegt, ist, und umgekehrt. Der folgende Satz gibt eine idealtheoretische Kennzeichnung der Körper in der Klasse der Ringe. Satz 1.8. Ein kommutativer Ring R mit mindestens zwei Elementen ist genau dann ein Körper, wenn er keine Ideale ungleich {0} und R enthält. Beweis. Es habe R nur die Ideale {0} und R. Wir zeigen zunächst, dass jedes Element von R\{0} invertierbar ist.
4
Ringe
Sei 0 ≠ a ∈ R. Wir betrachten die Menge aR = {ar | r ∈ R}
und zeigen, dass aR ein Ideal ist. Sind ar1 , ar2 ∈ aR, so ist ar1 + ar2 = a(r1 + r2 ) ∈ aR. Sind b ∈ R und ar ∈ aR, so ist (ar )b = a(r b) ∈ aR. Damit ist aR ein Ideal. Da a = a · 1 ∈ aR ist, ist aR ≠ {0}. Nach Annahme ist somit aR = R. Dann ist aber 1 ∈ aR, d. h. es gibt ein b ∈ R mit 1 = ab, was liefert, dass a invertierbar ist. Um zu zeigen, dass R\{0} eine Gruppe ist, müssen wir noch zeigen, dass R\{0} multiplikativ abgeschlossen ist. Seien dazu a, b ∈ R\{0} mit ab = 0. Wie bereits bewiesen, gibt es ein c ∈ R mit bc = 1. Somit ist a = a · 1 = a(bc) = (ab)c = 0 · c = 0.
Dies ist ein Widerspruch. Da |R| ≥ 2 ist, ist R\{0} ≠ ∅ und somit eine Gruppe. Insbesondere haben wir gezeigt, dass R ein Körper ist. Seien nun umgekehrt R ein Körper und i ein Ideal, i ≠ {0}. Wir wählen ein Element a ≠ 0 in i. Dann gibt es ein b ∈ R mit ab = 1. Also ist 1 ∈ i. Sei nun r ∈ R beliebig. Dann ist r = 1 · r ∈ i, d. h. R = i. Bemerkung 1.9. (1) Die Voraussetzung |R| ≥ 2 ist notwendig in Satz 1.8, da in einem Körper 0 ≠ 1 gilt; in einem Ring gilt dies nicht notwendig. Der Ring R = {0} erfüllt alle Voraussetzungen, ist aber kein Körper! (2) Eine wichtige Anwendung von Satz 1.8, die wir später häufig benutzen werden, ist die folgende: Seien K1 , K2 zwei Körper und ϕ : K1 → K2 ein Homomorphismus. Da weiter nach Satz 1.7 Kern ϕ ein Ideal in K1 ist, ist nach Satz 1.8 entweder Kern ϕ = K1 oder Kern ϕ = 0. Also ist ϕ entweder die Nullabbildung oder ein Monomorphismus. Wir wollen das Wesentliche der eindeutigen Primfaktorzerlegung in Z herausarbeiten, um es dann auf eine größere Klasse von Ringen verallgemeinern zu können. Eine der wesentlichen Eigenschaften von Z ist, dass aus a ≠ 0 ≠ b stets ab ≠ 0 folgt, was z. B. in Z/6Z nicht mehr richtig ist. Dies führt zunächst zu folgender Definition. Definition 1.10. Sei R ein kommutativer Ring. (1) Ein Element 0 ≠ a ∈ R heißt Nullteiler, falls es ein 0 ≠ b ∈ R mit ab = 0 gibt. (2) Enthält R keine Nullteiler, so heißt R ein Integritätsbereich. (3) Ein Ideal p ≠ R von R heißt Primideal, falls R/p ein Integritätsbereich ist.
Ringe
5
Beispiele 1.11. (1) Z ist Integritätsbereich. (2) Ist p Primzahl, so ist pZ Primideal in Z. Dies motiviert die Bezeichnung Primideal nachträglich. Sei (a + pZ)(b + pZ) = 0 + pZ, so ist ab ∈ pZ. Also ist ab = pr mit geeignetem r ∈ Z. Da p Primzahl ist, ist p ein Teiler von a oder b. Wir können annehmen, dass a von p geteilt wird. Dann ist a = pt ∈ pZ. Also ist a + pZ = pt + pZ = pZ. (3) Sei R = Z/4Z = {1 + 4Z, 2 + 4Z, 3 + 4Z, 4Z}. Es ist 2+4Z ≠ 4Z aber (2+4Z)(2+4Z) = 4+4Z = 4Z. Also ist 4Z kein Primideal in Z. (4) Wir wollen zeigen, dass nZ, n > 0, genau dann ein Primideal ist, falls n eine Primzahl ist. Ist n eine Primzahl so folgt die Behauptung mit (2). Sei nun n keine Primzahl. Dann gibt es a > 1 < b mit n = ab. Also ist nZ = (a + nZ)(b + nZ)
mit a + nZ ≠ nZ ≠ b + nZ.
Damit ist nZ kein Primideal. Wir werden später sehen, dass die nZ und {0} sämtliche Ideale von Z sind. Die Primideale ≠ {0}, sind somit genau die Ideale pZ mit p Primzahl. Die Eigenschaft von Primzahlen p in Z, dass, wenn p ein Produkt teilt, es auch einen der Faktoren teilen muss, überträgt sich auf Primideale, wie der folgende Satz zeigt. Satz 1.12. Seien R ein kommutativer Ring und i ≠ R ein Ideal. Dann ist i genau dann ein Primideal, falls aus ab ∈ i mit a, b ∈ R stets a ∈ i oder b ∈ i folgt. Beweis. (1) Seien i ein Primideal und ab ∈ i. Dann ist i = ab + i = (a + i)(b + i). Da R/i ein Integritätsbereich ist, folgt a + i = i oder b + i = i, d. h. a ∈ i oder b ∈ i. (2) Sei (a + i)(b + i) = i. So ist ab ∈ i. Nach Voraussetzung ist a ∈ i oder b ∈ i. Also ist a + i = i oder b + i = i, und R/i ist ein Integritätsbereich. Definition 1.13. Sei R ein Ring. Ein (Rechts-, Links-)Ideal m ≠ R nennen wir maximal, falls für jedes (Rechts-, Links-)Ideal n von R mit m ⊆ n ≠ R stets m = n folgt. Um die Existenz maximaler Ideale in Ringen zu zeigen, benötigen wir ein mengentheoretisches Hilfsmittel, das wir auch an späterer Stelle noch einsetzen werden. Sei M eine Menge mit einer Halbordnung . Eine Teilmenge K von M heißt eine Kette, falls für a, b ∈ K stets a b oder b a gilt. Eine Kette K besitzt eine obere Schranke m ∈ M, falls k m für alle k ∈ K ist. Ein Element m0 ∈ M heißt maximal in M, falls aus m ∈ M und m0 m stets m = m0 folgt. Das angesprochene Hilfsmittel lautet nun wie folgt:
6
Ringe
Lemma (Lemma von Zorn1 ). Sei M eine nicht leere halbgeordnete Menge. Hat jede Kette K von M eine obere Schranke in M, so gibt es wenigstens ein maximales Element in M.2 Satz 1.14. Sei R ein Ring. (1) Jedes (Rechts-, Links-)Ideal i von R, i ≠ R, liegt in einem maximalen Ideal. (2) Ist R kommutativ, so ist jedes maximale Ideal ein Primideal. Beweis. (1) Sei i ein Ideal. Wir setzen S = {j | i ⊆ j, j ≠ R, j Ideal}.
Da i ∈ S ist, ist S ≠ ∅. Wir ordnen S per Inklusion. Ist K eine Kette in S, d. h. eine vollständig geordnete Teilmenge, so setzen wir j= k. k∈K
Dann ist j ein Ideal. Wir zeigen j ∈ S. Da i ⊆ j ist, müssen wir nur j ≠ R zeigen. Sei somit j = R. Dann ist 1 ∈ j. Also gibt es ein k ∈ K mit 1 ∈ k, was aber R = k liefert, ein Widerspruch. Somit hat jede Kette in S eine obere Schranke. Mit dem Lemma von Zorn folgt nun, dass es maximale Elemente m in S gibt. (2) Da m ein maximales Ideal ist, ist nach Satz 1.8 R/m ein Körper. Insbesondere ist R/m ein Integritätsbereich und dann m ein Primideal. Wir wollen die eindeutige Primfaktorzerlegung von Z in einer größeren Klasse von Ringen beweisen. Dazu müssen wir zunächst den Begriff der Primzahl verallgemeinern. Eine Primzahl p ∈ Z hat die Eigenschaft, dass sie, wenn sie ein Produkt teilt, einen der Faktoren teilt. Sie hat aber auch die Eigenschaft, dass p außer ±p und ±1 keine weiteren Teiler hat. Dies ist die Eigenschaft, mit der man in der Schule üblicherweise Primzahlen einführt. Diese wollen wir zur Verallgemeinerung benutzen. Da aber nicht klar ist, ob beide Eigenschaften gleichwertig sind, wollen wir mit der Namensgebung etwas vorsichtig sein. Elemente, die die zweite Eigenschaft haben, sind offenbar nicht mehr zerlegbar. Wir wollen sie irreduzibel nennen. Die Elemente, die die erste Eigenschaft haben, werden wir prim nennen. In den uns hauptsächlich interessierenden
1 M. Zorn, * 6. 6. 1906 Hamburg, † 9. 3. 1993 Bloomington. Er emigrierte 1933 in die USA und war Professor in Yale und an der Indiana University, Bloomington. Arbeitsgebiete: Gruppentheorie und Mengenlehre. Zorn erlangte besondere Berühmtheit durch das Zornsche Lemma, das sich in [62] befindet. 2 Für weitere Informationen bzw. Äquivalenzen zu Axiomen der Mengenlehre siehe P. Halmos [17]. Dort kann man in § 16 mehr über das Lemma von Zorn erfahren.
Ringe
7
Ringen, den Hauptidealringen, werden wir sehen, dass die irreduziblen Elemente genau die Primelemente sind. Unsere Definition von irreduzibel hat z. B. in Z zur Folge, dass mit 2 auch −2 irreduzibel ist. Die besondere Rolle von −1 in Z soll zunächst herausgearbeitet werden. Es sind offenbar 1 und −1 die beiden einzigen invertierbaren Elemente in Z. In allgemeinen Ringen kann es durchaus mehr invertierbare Elemente e geben. Wir nennen diese Einheiten. Ist dann p irreduzibel, so auch ep . In Z ist 10 = 2 · 5 aber auch 10 = (−2) · (−5). Dies zeigt, dass wir eine Eindeutigkeit der Primfaktorzerlegung nur modulo Einheiten haben können und führt zu folgender Definition: Definition 1.15. Sei R ein Integritätsbereich. (1) Sind a, b ∈ R, so nennen wir a einen Teiler von b , falls es ein c ∈ R gibt, so dass b = ac ist. Wir schreiben dann a | b. (2) Ein Element e ∈ R heißt Einheit, falls e ein Teiler von 1 ist. (3) Ein Element p ∈ R heißt irreduzibel, falls aus ab = p mit a, b ∈ R stets a Einheit oder b Einheit folgt und p selbst keine Einheit ist. (4) R heißt ZPE-Ring (Ring mit eindeutiger Primfaktorzerlegung), falls sich jedes 0 ≠ a ∈ R in der Gestalt ep1 · · · pn mit einer Einheit e und bis auf Einheiten eindeutig bestimmten irreduziblen Elementen pi schreiben lässt. (5) Ein Element 0 ≠ p ∈ R, das keine Einheit ist, heißt Primelement, falls aus p · r = ab (d. h. p teilt ab) mit a, b, r ∈ R stets a = p · s oder b = p · s (s ∈ R geeignet) folgt. Die Primelemente sind immer auch irreduzibel, wie wir jetzt zeigen werden. Lemma 1.16. Sei R ein Integritätsbereich und p ein Primelement Dann ist p irreduzibel. Beweis. Sei p = ab mit a, b ∈ R. Dann können wir a = ps für geeignetes s ∈ R annehmen. Also ist p = psb. Das liefert p(1 − sb) = 0. Da R ein Integritätsbereich ist, folgt sb = 1, d. h. b ist eine Einheit. Somit ist p irreduzibel. Irreduzible Elemente müssen im allgemeinen nicht prim sein, wie wir in Beispiel 1.18 sehen werden. In den uns interessierenden Ringen wird das allerdings so sein. Bemerkung. Man kann sich natürlich auch fragen, warum wir nicht Ringe betrachten, in denen die Zerlegung als Produkt von Primelementen eindeutig ist, sog. faktorielle Ringe. Der Grund ist recht einfach. Ist R ein solcher Ring und r ∈ R ein irreduzibles Element, so kann man r eindeutig als Produkt ep1 · · · pn mit Primelementen pi schreiben. Da r irreduzibel ist, folgt dann n = 1, d. h. r ist ein Primelement. In solchen Ringen sind also Primelemente und irreduzible Elemente immer gleich. D. h. sie sind auch ZPE-Ringe. Deshalb beschränken wir uns auf ZPE-Ringe. Wie wir später noch sehen werden, sind in einem ZPE-Ring auch irreduzible Elemente prim, d. h. ZPERinge und faktorielle Ringe sind nur zwei Bezeichnungen für den gleichen Tatbestand.
8
Ringe
Lemma 1.17. Sei R ein Integritätsbereich und 0 ≠ pR ein Primideal in R. Dann ist p irreduzibel. Beweis. Sei ab = p mit a, b ∈ R. Dann ist ab ∈ pR. Nach Satz 1.12 ist a ∈ pR oder b ∈ pR. Sei ohne Beschränkung a ∈ pR. Dann ist a = px mit x ∈ R, was p = pxb und dann p(1 − xb) = 0 liefert. Da p ≠ 0 ist, folgt 1 = xb, womit b eine Einheit ist. Da pR ≠ R ist nach Definition des Primideals, ist p keine Einheit. Beispiel 1.18. (1) Die Umkehrung von Lemma 1.17 ist i. a. falsch. Sei R = {a + b −5 | a, b ∈ Z}. Dann ist R ein Integritätsbereich, da R ⊆ C ist. Wir zeigen, dass das Element √ √ 3 ∈ R irreduzibel ist. Sei dazu 3 = (a + b −5)(c + d −5). Also gilt auch ¯ = (a − b −5)(c − d −5), 3=3 wobei ¯ das Bilden des konjugiert Komplexen ist. Das ergibt 9 = 3 · 3 = (a + b −5)(a − b −5)(c + d −5)(c − d −5) = (a2 + 5b2 )(c 2 + 5d2 ).
Die eindeutige Primfaktorzerlegung in Z liefert a2 + 5b2 = 3 oder 9. Das geht nur mit a = ±2, b = ±1 und a2 + 5b2 = 9. Dann ist aber c 2 + 5d2 = 1, √ √ was c = ±1, d = 0 liefert. Damit ist c + d −5 = ±1, d. h., c + d −5 ist eine Einheit. Wir haben somit gezeigt, dass 3 irreduzibel ist. Wir zeigen nun, dass 3 kein Primelement ist. Es ist 9 = 3 · 3 = (2 + −5)(2 − −5). √ √ Aber 2 + −5 ≠ 3(a + b −5) mit a, b ∈ Z, da 3 nicht 2 teilt. Somit haben wir ein Beispiel eines irreduziblen Elementes, das kein Primelement ist. √ √ Auch ist 3R kein Primideal. Es ist (2 + −5)(2 − −5) = 9 ∈ 3R, aber weder √ √ (2 + −5) noch (2 − −5) sind in 3R enthalten. (2) Wir wollen die Ideale in Z bestimmen. Sei i ⊆ Z ein Ideal, i nicht das Nullideal {0} und auch nicht Z. Da mit x ∈ i stets auch −x ∈ i ist, gibt es in i positive Elemente. Wir wählen nun x ∈ i minimal mit x > 0. Sei y ∈ i. Indem wir notfalls y durch −y ersetzen, können wir y ≥ x annehmen. Also gibt es ein n ∈ N mit nx ≤ y < (n +1)x . Nun ist y − nx < x . Da i ein Ideal ist, ist y − nx ∈ i. Die minimale Wahl von x liefert y − nx = 0, d. h. y = nx . Somit ist i = xZ = {xa | a ∈ Z}.
Beispiel 1.18(2) führt uns zu der folgenden Definition:
Ringe
9
Definition 1.19. Ein Integritätsbereich R heißt ein Hauptidealring, falls jedes Ideal i von R die Gestalt aR mit geeignetem a ∈ R hat. Es besagt Beispiel 1.18(2), dass Z ein Hauptidealring ist. Wir hatten in Bsp. 1.11(4) gesehen, dass die Primideale ungleich Null in Z genau die Ideale der Form pZ mit p Primzahl sind. Dies wollen wir nun auf die Klasse der Hauptidealringe verallgemeinern. Lemma 1.20. Sei R ein Hauptidealring. Dann sind 0 und pR mit irreduziblem p die sämtlichen Primideale von R. Jedes von 0 verschiedene Primideal ist maximal. Beweis. Sei p ein Primideal, p ≠ 0. Dann ist p = pR mit geeignetem p ∈ R. Nach Lemma 1.17 ist p irreduzibel. Sei umgekehrt p irreduzibel. Wir zeigen, dass pR maximal ist. Es folgt dann mit Satz 1.14(2), dass pR ein Primideal ist. Sei also pR ⊂ aR ⊂ R. Dann ist p = ab mit b ∈ R. Ist a eine Einheit, so ist 1 ∈ aR, ein Widerspruch. Also ist a keine Einheit und somit ist b eine Einheit, d. h. es gibt ein c ∈ R mit bc = 1. Das liefert pc = abc = a ∈ pR. Also ist aR ⊆ pR, ein Widerspruch. Ein sehr wichtiger Begriff in der Arithmetik von Z ist der des größten gemeinsamen Teilers. Auch diesen wollen wir nun verallgemeinern. Definition 1.21. Seien R ein Integritätsbereich und a1 , . . . , an ∈ R. Wir nennen d einen größten gemeinsamen Teiler der ai und schreiben ggT(a1 , . . . , an ) = d,
falls d alle ai teilt, und für jedes c ∈ R, das alle ai teilt, stets d durch c geteilt wird. Es ist also d maximal bezüglich der Teilerelation. Obwohl durch die Bezeichnung d = ggT(a, b) suggeriert, ist d nicht eindeutig bestimmt. In Z ist z. B. 2 = ggT(2, 4), aber auch −2 = ggT(2, 4). Die obige Definition zeigt: Sind d1 = ggT(a, b) und d2 = ggT(a, b), so ist d1 | d2 und d2 | d1 , was d1 = d2 e mit einer Einheit e liefert. Der größte gemeinsame Teiler ist also nur bis auf Einheiten eindeutig bestimmt. Trotzdem werden wir im Folgenden stets von dem größten gemeinsamen Teiler sprechen und je nach Bedarf den geeigneten wählen. Als erstes zeigen wir, dass es in einem Hauptidealring für endlich viele Elemente stets einen größten gemeinsamen Teiler gibt. Satz 1.22. Seien R ein Hauptidealring und a1 , . . . , an ∈ R. Dann existiert ein größter gemeinsamer Teiler d der ai , i = 1, . . . , n, in R, und es gibt b1 , . . . , bn ∈ R mit a1 b1 + a2 b2 + · · · + an bn = d.
10
Ringe
Beweis. Da R ein Hauptidealring ist, gilt a1 R + · · · + an R = dR
mit d ∈ R geeignet.
Also ist ai = dri , i = 1, . . . , n. Insbesondere teilt d dann alle ai . Weiter gilt d = a1 b1 + · · · + an bn mit geeigneten bi ∈ R. Sei nun t ∈ R ein Element, das alle ai , i = 1, . . . , n, teilt. Dann wird auch d = a1 b1 + · · · + an bn von t geteilt. Also ist d ein größter gemeinsamer Teiler der ai , i = 1, . . . , n. Dass in einem Integritätsbereich nicht unbedingt ein größter gemeinsamer Teiler zweier Elemente existieren muss, kann man in Aufgabe 17 sehen. Die obige Darstellung des größten gemeinsamen Teilers werden wir noch häufig benutzen. Satz 1.23. Ist R ein Hauptidealring, so ist jedes irreduzible Element prim. Beweis. Sei p ein Teiler von ab , d. h. ab = pr und sei c = ggT(a, p). Da c ein Teiler von p ist, ist c eine Einheit oder c = ep mit einer Einheit e. Da a von c geteilt wird, können wir c = 1 annehmen. Nach Satz 1.22 gibt es u, v ∈ R mit 1 = up + va. Durch Multiplikation mit b erhalten wir b = upb + vab = (ub + vr )p und somit ist p ein Teiler von b . In Hauptidealringe sind also die Begriffe irreduzibel und prim gleich. Unser Ziel ist es zu zeigen, dass Hauptidealringe eine eindeutige Primfaktorzerlegung haben. Dazu sehen wir uns zunächst an, wie wir in Beispiel 1.18(2) gezeigt haben, dass Z ein Hauptidealring ist. Wir hatten benutzt, dass es in Z eine Division mit Rest gibt. Dies wollen wir nun verallgemeinern. Definition 1.24. Ein Integritätsbereich R heißt ein euklidischer3 Ring, falls es eine Abbildung ϕ : R\{0} → N ∪ {0} mit folgenden Eigenschaften gibt: (1) Für a, b ∈ R mit ab ≠ 0 gilt ϕ(ab) ≥ ϕ(a), (2) Zu jedem Paar a, b ∈ R mit a ≠ 0, gibt es Elemente q, r ∈ R mit b = qa + r , wobei r = 0 oder ϕ(r ) < ϕ(a) ist (Division mit Rest). Nun können wir genauso wie in Beispiel 1.18(2) vorgehen und zeigen: Satz 1.25. Jeder euklidische Ring ist Hauptidealring. Beweis. Sei 0 ≠ i ein Ideal in R. Wähle 0 ≠ a ∈ i mit ϕ(a) minimal. Sei b ∈ i und b = aq + r mit ϕ(r ) < ϕ(a) oder r = 0. Dann ist r = b − aq ∈ i. Wegen der minimalen Wahl von a ist r = 0. Also ist b = aq, d. h. i = aR.
3 Euklid von Alexandria, * um 365 v. Chr., † um 300 v. Chr., wirkte in Alexandria, Verfasser der „Elemente“.
Ringe
11
Beispiele 1.26. (1) R = Z. Wir setzen ϕ(a) = |a|. Ist ab ≠ 0, so ist ϕ(ab) = |ab| = |a||b| ≥ |a| = ϕ(a).
Es gibt q ∈ Z mit qa ≤ b < (q + 1)a.
Ist b = qa + r , so ist r = 0, oder ϕ(r ) = |r | < |a| = ϕ(a). (2) Der nun folgende Ring ist nur ein Spezialfall einer wesentlich größeren Klasse von Ringen, mit denen wir uns in Beispiel 1.29 beschäftigen werden. Man nennt ihn den Ring der Gaußschen Zahlen4 : Z[i] = {a + bi | a, b ∈ Z} ⊆ C.
Da Z[i] ⊆ C ist, ist Z[i] ein Integritätsbereich. Wir setzen nun ϕ(a + ib) = a2 + b 2 = (a + ib)(a − ib) = |a + ib|2 .
Für c + id ≠ 0 gilt ϕ((a + ib)(c + id)) = |(a + ib)(c + id)|2 = |a + ib|2 |c + id|2 ≥ |a + ib|2 = ϕ(a + ib).
Seien β = a + ib und α = c + id gegeben, wobei c + id ≠ 0 ist. Wir wollen jetzt β durch α mit Rest teilen. Es ist a + ib (a + ib)(c − id) (a + ib)(c − id) β = = = = s + it α c + id (c + id)(c − id) c 2 + d2
mit s, t ∈ Q.
β/α
×
q
4 C. F. Gauß, * 30. 4. 1777 Braunschweig, † 23. 2. 1855 Göttingen, Professor in Göttingen. Gauß wird als der größte Mathematiker der Neuzeit bezeichnet. In seiner Doktorarbeit bewies er den Fundamentalsatz der Algebra (jedes nicht konstante Polynom mit komplexen Koeffizienten hat eine Nullstelle in den komplexen Zahlen). Mit 19 Jahren bewies er die Konstruierbarkeit des regelmäßigen 17-Ecks mit Zirkel und Lineal, ein Problem, das bis auf Euklid zurück geht. 1801 veröffentlichte er die „Disquisitiones Arithmeticae“, eines der bedeutendsten Werke der Mathematik. Hier wurden die Grundlagen der Zahlentheorie, die bis daher aus vereinzelten Problemen bestand, gelegt. Er arbeitete auf vielen verschiedenen Gebieten (Geometrie, Algebra, Astronomie, Physik) und führte grundlegende Begiffe ein, wie z. B. die Gaußsche Glockenkurve und die erste geometrische Interpretation der komplexen Zahlen mittels der Gaußschen Zahlenebene.
12
Ringe
Wir wählen x, y ∈ Z mit |s − x| ≤ Dann ist (a + ib) = (x + iy)(c + id) + r
1 2
und |t − y| ≤
1 2
und setzen q = x + iy .
mit r = (c + id)[(s + it) − (x + iy)].
Somit ist ϕ(r ) = ϕ(c + id)ϕ((s − x) + i(t − y)) ≤ ϕ(c + id) 12 < ϕ(c + id).
(3) In euklidischen Ringen kann man mit dem sogenannten euklidischen Algorithmus sehr leicht einen größten gemeinsamen Teiler von a ≠ 0 und b berechnen: Wir setzen r−1 = b, r0 = a, dann ist r−1 = q1 r0 + r1
mit ϕ(r1 ) < ϕ(r0 ).
Nun wenden wir die Division mit Rest auf das Paar r0 , r1 an: r0 = q2 r1 + r2 ,
ϕ(r2 ) < ϕ(r1 )
usw. ri = qi+2 ri+1 + ri+2 ,
ϕ(ri+2 ) < ϕ(ri+1 )
Dies wird solange fortgesetzt, bis der Rest Null wird, also rs = qs+2 rs+1 .
Dann ist rs+1 ein größter gemeinsamer Teiler von a und b . Wir wollen dies durch Induktion nach s beweisen. Ist r1 = 0, so ist a ein Teiler von b und damit auch der größte gemeinsame Teiler. Sei jetzt r1 ≠ 0. Per Induktion besitzen dann a = r0 und r1 den größten gemeinsamen Teiler rs+1 . Da b = q1 a + r1 ist, ist rs+1 auch ein Teiler von b. D. h. rs+1 teilt den ggT(a, b). Andererseits teilt der ggT(a, b) auch r1 . Damit teilt er auch ggT(a, r1 ) = rs+1 , was rs+1 = ggT(a, b) liefert. Sei z. B. b = 60, a = 35. Dann ist 60 = 35 + 25 35 = 25 + 10 25 = 2 · 10 + 5 10 = 2 · 5.
Also ist 5 = ggT(60,35).
Wir wollen jetzt zeigen, dass jeder Hauptidealring eine eindeutige Primfaktorzerlegung besitzt.
Ringe
13
Lemma 1.27. Sei R ein Hauptidealring. Dann besitzt jede nicht leere Teilmenge S von Idealen von R ein bezüglich Inklusion maximales Element. Beweis. Sei K eine Kette in S. Dann ist j = i∈K i ein Ideal. Da R ein Hauptidealring ist, ist j = cR mit geeignetem c ∈ R. Somit gibt es ein i ∈ K mit c ∈ i. Da i ein Ideal ist, ist j = cR ⊆ i ⊆ j. Also ist j ∈ K und somit j ∈ S, d. h. jede Kette in S hat eine obere Schranke. Nun folgt mit dem Lemma von Zorn die Behauptung. Satz 1.28 (Hauptsatz). Sei R ein Hauptidealring. Dann ist R ein ZPE-Ring. Beweis. Wir zeigen zunächst, dass sich jedes Element a ∈ R, a ≠ 0, als ep1 · · · pk mit einer Einheit e und irreduziblen pi schreiben läßt. Dazu betrachten wir S = {bR | a = bp1 · · · pn mit endlich vielen irreduziblen pi }.
Da aR ∈ S ist, ist S ≠ ∅. Nach Lemma 1.27 gibt es ein maximales Element cR in S. Nach Definition von S ist a = cp1 · · · pk .
Wir zeigen zunächst, dass c eine Einheit ist. Sei dazu cR ≠ R. Nach Satz 1.14 ist cR ⊆ m ⊆ R mit maximalem Ideal m in R. Sei m = pR. Nach Satz 1.14(2) ist m ein Primideal. Nach Lemma 1.17 ist p irreduzibel. Nun ist c = pd mit geeignetem d. Also ist cR ⊆ dR. Da a = dpp1 · · · pn ist, ist dR ∈ S. Die Maximalität von cR liefert nun dR = cR. Dann ist d = r c mit geeignetem r ∈ R, was c = dp = cr p ergibt. Somit ist r p = 1, ein Widerspruch. Wir haben nun cR = R, d. h. c ist Einheit. Damit haben wir die Existenz der Zerlegung gezeigt. Wir zeigen jetzt die Eindeutigkeit der Zerlegung. Sei dazu ˜1 · · · p ˜r a = ep1 · · · pk = e˜p ˜r . Seien dabei ˜1 , . . . , p mit Einheiten e, e˜ und irreduziblen Elementen p1 , . . . , pk , p ˜i vorkommen, d. h. bei pt , . . . , pk die irreduziblen Elemente, die auch unter den p ˜j mit einer Einheit f˜j , j = t, . . . , k. Dann ist geeigneter Anordnung ist pj = f˜j p ˜p ˜1 · · · p ˜r −k+t pt · · · pk , a = ep1 · · · pt−1 pt · · · pk = e˜
˜ Einheit. e˜
Da R ein Integritätsbereich ist, folgt ˜p ˜1 · · · p ˜r −k+t . ep1 · · · pt−1 = e˜ ˜i , pj gibt, so dass für eine geeignete Also können wir annehmen, dass es kein Paar p ˜i = pj d haben. Einheit d wir p
14
Ringe
Es ist ˜1 + p1 R) · · · (p ˜r + p1 R) = ((˜ ˜1 · · · p ˜r ) + p1 R) = p1 R, (˜ e + p1 R)(p ep ˜r ∈ p1 R ist. Nach Lemma 1.20 ist p1 R ein Primideal und damit ein ˜1 · · · p da e˜p maximales Ideal. Somit ist nach Satz 1.8 R/p1 R ein Körper. Also gibt es ein i mit ˜i + p1 R = p1 R1 d. h. p ˜i ∈ p1 R. Dann ist p ˜i = p1 d. Da p ˜i irreduzibel ist, folgt dass p d eine Einheit ist, ein Widerspruch.
Wir haben bisher gezeigt, dass jeder euklidische Ring ein Hauptidealring und jeder Hauptidealring ein ZPE-Ring ist. Ein Beispiel eines ZPE-Rings, der kein Hauptidealring ist, werden wir in Beispiel 1.47 kennenlernen. Wir wollen nun zeigen, dass es Hauptidealringe gibt, die nicht euklidisch sind. Beispiel 1.29. Beispiele von Integritätsbereich kommen häufig aus der Zahlentheorie. Sei m ∈ Z, m quadratfrei. Wir setzen √ Rm = {r + s m | r , s ∈ Z} für m ≡ 2,3 (mod 4) √ Rm = {(r + s m)/2) | r , ∈ Z, r , s haben gleiche Parität}
sonst.
Da Rm in C enthalten ist, ist Rm ein Integritätsbereich. Weiter ist sogar Rm in √ {a+b m | a, b ∈ Q} = M enthalten. Wir werden später sehen, dass M ein Körper ist, √ den wir dann mit Q( m) bezeichnen werden. Wir können für Rm auch die folgende Definition geben Rm = {u | u ∈ M, u ist Nullstelle eines Polynoms x 2 + cx + d mit c, d ∈ Z}.
Hier ist die Asymmetrie zwischen m ≡ 1 (mod 4) und m ≡ 1 (mod 4) aufgehoben. √ Für u = a + b m ∈ M definieren wir jetzt √ √ N(u) = a2 − mb2 = (a + b m)(a − b m).
Aus der zweiten Gleichung kann man sofort ablesen: N(u1 u2 ) = N(u1 )N(u2 )
(vgl. mit dem ϕ aus Beispiel 1.26(2)!). Wir wollen Rm auf seine Hauptidealeigenschaft hin untersuchen. Nicht jeder Ring Rm ist Hauptidealring. Betrachten wir z. B. R−5 . Wie wir in Beispiel 1.18 gesehen haben, gibt es irreduzible Elemente in R−5 , die keine Primelemente sind. Dies geht aber nach Satz 1.23 in einem Hauptidealring nicht. Also haben wir, dass R−5 kein Hauptidealring ist. Auf der anderen Seite ist R−1 nach Beispiel 1.26(2) mit der Abbildung ϕ(r ) = N(r ) sogar euklidisch. Ist m < 0, so ist Rm allerdings selten euklidisch, wie wir jetzt zeigen werden.
Ringe
15
(1) Ist m < 0, m quadratfrei, m ≠ −1, −2, −3, −7, −11, so ist Rm nicht euklidisch. Ist m = −1, −2, −3, −7, −11, so ist Rm euklidisch, wobei ϕ(r ) = N(r ) ist. Beweis. Seien Rm euklidisch und m = −6, −10 oder m ≤ −13. Wir wählen ein b ∈ Rm \{0} so, dass b keine Einheit ist, und dann mit ϕ(b) minimal. Sei weiter a ∈ Rm beliebig. Da Rm euklidisch ist, gibt es q, r ∈ Rm mit a = bq + r
und r = 0 oder
ϕ(r ) < ϕ(b).
Die minimale Wahl von b liefert, dass r = 0 oder eine Einheit ist. Sei r eine Einheit. Dann ist r r = 1 für geeignetes r . Also ist 1 = N(r r ) = N(r )N(r )
und dann N(r ) = ±1. √ Sei r = m1 + m2 m. Dann ist ±1 = m12 − m22 m. √ Da m < −1 ist, folgt m2 = 0 und m1 = ±1. Sei r = (m1 + m2 m)/2. Dann ist ±4 = m12 − m22 m.
Wieder gilt m2 = 0 und m1 = ±2. Also ist stets r = ±1. Damit haben wir a = bq
oder
a = bq ± 1.
Somit teilt b entweder a, a + 1 oder a − 1. Wir wählen nun speziell a = 2. Dann gilt, b teilt 2 oder 3, da b keine Einheit ist. Wir zeigen, dass 2 und 3 beide irreduzibel sind. √ √ Sei 3 = [(u + v m)/2][(x + y m)/2] mit u, v, x, y ∈ Z. Dann ist 32 = N(3) = [(u2 − mv 2 )/4][(x 2 − my 2 )/4].
Da kein Faktor eine Einheit ist, folgt mit Satz 1.25 und Satz 1.28 3 = (u2 − mv 2 )/4 = (x 2 − my 2 )/4.
Das liefert u2 − mv 2 = 12, was offenbar keine Lösung hat. √ √ Sei 2 = [(u + v m/2][(x + y m)/2] mit u, v, x, y ∈ Z. Dann ist 4 = [(u2 − v 2 m)/4][(x 2 − y 2 m)/4].
Somit ist 8 = u2 − v 2 m, was auch keine Lösung hat. Da b aber 2 bzw. 3 teilt, folgt nun, dass b = ±2 oder ±3 ist. Die Einheiten sind ±1, wie bereits gezeigt.
16
Ringe
√ Sei nun m ≡ 1 (mod 4). Dann wählen wir a = (1 + m)/2. Wir erhalten nun √ √ a + 1 = (3 + m)/2 und a − 1 = (−1 + m)/2. Damit gilt, dass 2 oder 3 eine der Zahlen a, a + 1, a − 1 teilt. Ist nun entweder √ √ (x + y m)/4 ∈ Rm oder (x + y m)/6 ∈ Rm , so muss 2 bzw. 3 die Koeffizienten x und y teilen. Dies ist aber weder bei a, a + 1 noch bei a − 1 der Fall. √ √ Ist m ≡ 2,3 (mod 4), so wählen wir a = 1 + m. Dann ist a + 1 = 2 + m und √ a − 1 = m. Wieder teilt weder 2 noch 3 eine der Zahlen a, a + 1, a − 1. Dass Rm für die angegebenen Werte euklidisch ist, kann man wie in Beispiel 1.26(2) zeigen.
Wir haben gerade gezeigt, dass z. B. R−19 kein euklidischer Ring ist. Wir wollen zeigen, dass R−19 ein Hauptidealring ist. Damit haben wir dann ein Beispiel eines Hauptidealrings, der nicht euklidisch ist. (2) Sei m quadratfrei, m ≠ 1, 0. Für x, y ∈ Rm , wobei x nicht von y geteilt wird und |N(x)| ≥ |N(y)| ist, gebe es stets u, v ∈ Rm mit (1) xu ≠ yv und (2) |N(xu − yv)| < |N(y)| Dann ist Rm ein Hauptidealring. Beweis. Sei 0 ≠ i ⊆ Rm ein Ideal. Wir wählen y ∈ i mit y ≠ 0 und |N(y)| minimal. Sei weiter x ∈ i beliebig gewählt. Ist x kein Teiler von y , so gibt es nach Annahme dann u, v ∈ Rm mit xu − yv ≠ 0 und |N(xu − yv)| < |N(y)|. Da xu − yv ∈ i ist, ist dies ein Widerspruch zur Wahl von y . Somit ist x = yt , d. h. i = yRm . Dieses Kriterium wenden wir nun mit m = −19 an und zeigen: (3) R−19 ist ein Hauptidealring. Beweis. Da −19 ≡ 1 (mod 4) ist, ist R−19 = {(a + b −19)/2 | a, b ∈ Z, a und b haben die gleiche Parität}. Da m < 0 ist, ist N(u) ≥ 0 für alle u ∈ R−19 . Wir wollen (2) nachprüfen. Seien x, y ∈ R−19 , y kein Teiler von x und N(x) ≥ N(y). Gesucht sind u, v ∈ Rm mit xu − yv ≠ 0 und N(xu − yv) < N(y) bzw. N((x/y)u − v) < 1. √ Es ist x/y ∈ M , also ist x/y = (a + b −19)/c mit geeigneten a, b, c ∈ Z und ggT(a, b, c) = 1. Da x/y ∈ R−19 ist, folgt c > 1. Sei c = 2. Da x/y ∈ R−19 ist, folgt nun, dass a und b entgegengesetzte Parität haben. Wir setzen u = 1 und v = ((a − 1) + b −19)/2 ∈ R−19 . Dann ist
x y
u−v =
1 2
und
0
1 2
=
1 < 1. 4
Ringe
17
Sei c = 3. Dann ist 3 kein Teiler von a oder 3 kein Teiler von b. Insbesondere ist a2 + b2 ≡ 0 (mod 3). Nun ist a2 + 19b2 ≡ a2 + b2
(mod 3).
Also ist a2 + 19b2 = 3q + r
mit r = 1 oder 2.
√ Wir setzen u = a − b −19 und v = q. Dann ist x
r u − v = (a + b −19)(a − b −19)/3 − q = (a2 + 19b2 )/3 − q = y 3
und 0
r 3
=
r 1 4 < 1. oder . Insbesondere ist N 9 9 3
Sei c = 4. Dann können nicht a und b beide gerade sein. Sind nicht beide ungerade, so gilt a2 + 19b2 ≡ a2 − b2 ≡ ±1
(mod 4).
Also ist a2 + 19b2 = 4q + r
Wir setzen nun
u = a − b −19
mit r = 1 oder 3. und v = q.
Wie im Fall c = 3 folgt x y
u−v =
r 4
und 0 < N
r 4
=
1 9 , < 1. 16 16
Sind a, b beide ungerade, so ist a2 + 19b2 ≡ a2 + 3b2 ≡ 4 (mod 8). √ Also ist a2 + 19b2 = 8q + 4. Wir setzen jetzt u = (a − b −19)/2 und v = q. Dann folgt x y
u−v =
1 2
und
0
1 2
Sei nun c ≥ 5. Nach Satz 1.22 gibt es d, e, f ∈ Z mit ad + be + cf = 1.
Wir dividieren ae − 19bd durch c mit Rest, also ae − 19bd = cq + r .
=
1 < 1. 4
18
Ringe
Wir können die Division so ausführen, dass |r | ≤ 2c ist. Wir setzen nun u = e + d −19 und v = q − f −19. Dann ist x u − v = (a + b −19)(e + d −19)/c − (q − f −19) y = (ae − 19bd − qc)/c + (ad + be + cf ) −19/c = (r − −19)/c und
N((r + −19)/c) = (r 2 + 19)/c 2 .
Ist c > 5, so ist (r 2 + 19)/c 2 ≤
19 7 1 + 19 /c 2 ≤ + = < 1. 4 4 36 9
c2
Ist c = 5, so ist |r | ≤ 2 und dann (r 2 + 19)/c 2 ≤ (4 + 19)/25 < 1. Wir haben somit mit R−19 einen Hauptidealring, der kein euklidischer Ring ist. Es kommt sogar noch schlimmer. Ist m < 0, so hat Rm die ZPE-Eigenschaft genau für die folgenden Werte von m: −1, −2, −3, −7, −11, −19, −43, −67, −163 (siehe [18, §14.7]). Ist m > 0, so ist Rm euklidisch mit ϕ(r ) = |N(r )| genau für m = 2, 3, 5, 6, 7, 11, 13, 17, 19, 21, 29, 33, 37, 41, 57, 73 (siehe [18, Satz 247]). Es ist ein offenes Problem zu entscheiden, für welche m > 0 der Ring Rm die ZPE-Eigenschaft hat. Eines unserer Hauptziele ist die Behandlung von Auflösungsformeln für Nullstellen von Polynomen. Dazu müssen wir aber diese Begriffe erst einmal in unsere Theorie einbringen. Wir beginnen mit den Polynomen und definieren den sogenannten Polynomring. Definition 1.30. Seien R ein Ring und P (R) = {(ai ) | ai ∈ R, ai = 0 für fast alle i}
die Menge der abbrechenden Folgen über R. Wir definieren auf P (R) eine Addition und Multiplikation durch (ai ) + (bi ) = (ai + bi ) (ai )(bi ) = (ci ),
wobei ci =
i j=0
Den Ring P (R) nennen wir den Polynomring über R.
aj bi−j ist.
Ringe
19
Man rechnet nach, dass P (R) ein Ring ist. Das Einselement 1 ist jetzt die Folge (1, 0, . . . , 0, . . . ). Wir setzen nun x = (0,1,0, . . . ). Dann ist x 2 = (0,0,1,0, . . . ) und allgemein x n = (0, 0, . . . , 0, 1 ,0, . . . ). ↑
n+1
Die Abbildung a → (a, 0, . . . , 0, . . . ) ist ein Monomorphismus von R nach P (R). Somit können wir R mit einem Unterring von P (R) identifizieren. Ist nun die Folge (a0 , a1 , a2 , . . . ) ∈ P (R), so folgt mit dieser Identifikation (a0 , a1 , a2 , . . . ) = a0 · 1 + a1 x + a2 x 2 + · · · . j Ist also ai = 0 für i > n, so ist (aj ) der Ausdruck n j=0 aj x zugeordnet. Dies ist die Schreibweise, die wir gewohnt sind. Wir schreiben deshalb im folgenden für P (R) stets R[x] =
n
ai x | ai ∈ R, n ∈ N ∪ {0} . i
i=0
Wenn wir uns aber an die Definition erinnern, so sehen wir deutlich, dass die Polynome n i i=0 ai x keine Funktionen sind, obwohl das x es suggeriert. Wir müssen somit sehr wohl zwischen Polynomen und Polynomfunktionen unterscheiden. So sind f = x und g = x 2 als Polynome in Z/2Z[x] verschieden, als Funktionen über Z/2Z sind aber f (x) = x und g(x) = x 2 gleich: f (2Z) = 2Z = g(2Z),
f (1 + 2Z) = g(1 + 2Z) = 1 + 2Z.
Dennoch werden viele Beweise durch die suggestive Schreibweise leichter verständlich, weshalb wir diese benutzen wollen. Dabei muss man sich aber immer der Probleme bewußt sein! Definition 1.31. Sei R ein Ring, f =
n
ai x i ∈ R[x]
mit an ≠ 0.
i=0
Dann setzen wir n = grad f (Grad von f ). Wir setzen weiter grad 0 = −∞. Lemma 1.32. Sind f , g ∈ R[x], so gilt (1) grad(f g) ≤ grad f + grad g . (2) Ist R ein Integritätsbereich, so gilt grad(f g) = grad f + grad g . Insbesondere ist R[x] ein Integritätsbereich.
20
Ringe
Beweis. Die Behauptung ist klar, falls f = 0 oder g = 0 ist. Seien also f =
n
ai x i
und g =
i=0
m
bj x j
mit an ≠ 0 ≠ bm .
j=0
Dann ist f g = an bm x n+m +
n+m−1
ci x i .
i=0
Also ist grad(f g) ≤ n + m = grad f + grad g . Ist R ein Integritätsbereich, so ist an bm ≠ 0 und grad(f g) = n + m. Insbesondere ist f g ≠ 0. Im Spezialfall, dass R ein Körper ist, gilt sogar: Satz 1.33. Sei K ein Körper. (1) K[x] ist euklidisch, insbesondere ein ZPE-Ring. (2) Die Einheiten von K[x] sind die Polynome vom Grad Null, d. h. die Elemente a ∈ K\{0}. (3) K[x] hat unendlich viele Primideale. Beweis. (1) Setze ϕ(f ) = grad f für f ∈ K[x]\{0}. Ist f g ≠ 0, so gilt nach Lemma 1.32(2) ϕ(f g) = grad(f g) = grad f + grad g = ϕ(f ) + ϕ(g) ≥ ϕ(f ).
Seien f =
n
i=0 ai x
i
und g =
m
j=0
bj x j mit an bm ≠ 0. Gesucht sind q und r
mit f = qg + r
und r = 0
oder
grad r < grad g.
Ist grad f < grad g , so setzen wir q = 0 und f = r . Sei also grad f ≥ grad g . Wir betrachten jetzt f1 = f − x n−m
an g. bm
Dann ist grad f1 ≤ n − 1. Per Induktion nach grad f ist f1 = q1 g + r1 mit grad r1 < grad g oder r1 = 0. Nun ist an f = q1 + x n−m g + r1 . bm Also haben wir eine Division mit Rest, d. h. K[x] ist ein euklidischer Ring. Nach Satz 1.25 und Satz 1.28 ist dann K[x] ein ZPE-Ring.
Ringe
21
(2) Ist f ∈ K[x] eine Einheit, so gibt es ein g ∈ K[x] mit f g = 1. Nach Lemma 1.32(2) ist 0 = grad 1 = grad f g = grad f + grad g.
Also ist grad f = 0. (3) Es gibt irreduzible Elemente, da nach (2) nicht alle Elemente Einheiten sind. Seien weiter p1 K[x], . . . , pn K[x] die sämtlichen Primideale ≠ 0. Wir setzen jetzt n α f = 1 + p1 · · · pn . Also ist f keine Einheit. Dann ist f = e i=1 pi i . Dabei ist n i=1 αi > 0 und wir können α1 > 0 annehmen. Da p1 ein Teiler von f ist, ist p1 auch ein Teiler von f − p1 · · · pn = 1, ein Widerspruch. Der hier gegebene Beweis ist der gleiche, mit dem man auch zeigen kann, dass es in Z unendlich viele Primzahlen gibt. Eines der Ziele dieses Buches ist es, die Galoistheorie zu entwickeln, die sich mit Nullstellen von Polynomen beschäftigt. Unsere Polynome sind aber irgendwelche Folgen, d. h., es fehlt uns die Verbindung zu den Nullstellen der entsprechenden Polynomfunktionen. Diese Verbindung wollen wir nun herstellen. Definition 1.34. Seien R ein kommutativer Ring und a ∈ R. Die Abbildung τa : f =
n
ai x i →
i=0
n
ai ai
i=0
von R[x] nach R nennen wir den Einsetzungshomomorphismus und schreiben für τa (f ) auch f (a). Man rechnet leicht nach, dass τa in der Tat ein Homomorphismus ist. Damit können wir nun auch den Begriff der Nullstelle definieren. Definition 1.35. Seien R ein kommutativer Ring und f ∈ R[x]. Ein Element a ∈ R heißt Nullstelle von f , falls f (a) = 0 ist. Wir wollen die ZPE-Eigenschaft von R[x] untersuchen. Dazu greifen wir zunächst die Definition von irreduziblen Elementen aus Definition 1.15 auf. Wir nennen die irreduziblen Elemente aus R[x] irreduzible Polynome. Beispiele 1.36. (1) Jedes Polynom vom Grad 1 über einem Körper ist irreduzibel. (2) Sei f = x 2 − 2 ∈ Q[x]. Ist f = x 2 − 2 = (ax + b)(cx + d), so können wir ohne Einschränkung a = 1 = c annehmen. Also folgt nun b+d=0 bd = −2.
22
Ringe
√ Das liefert b2 = 2. Da bekanntlich 2 ∈ Q ist, folgt, dass f irreduzibel ist. Das Polynom f = x 2 − 2 ∈ R[x] ist jedoch nicht irreduzibel, da √ √ f = (x − 2)(x + 2)
gilt. Die Frage der Irreduzibilität hängt also stark vom Körper ab. (3) Sei K ein Körper und f ∈ K[x] mit 2 ≤ grad f ≤ 3. Ist f nicht irreduzibel, so hat f einen echten Teiler g , dessen Grad größer als Null ist. Nach Lemma 1.32 können wir grad g = 1 annehmen. Also sind Polynome vom Grad zwei oder drei genau dann irreduzibel, wenn sie keine Nullstelle in K haben (siehe Lemma 1.37). Diese Bemerkung wird uns noch häufig Fragen nach der Irreduzibilität sehr erleichtern. Die nächsten beiden Lemmas sind für die weiteren Untersuchungen von fundamentaler Bedeutung. Lemma 1.37. Seien K ein Körper und f ∈ K[x], f ≠ 0. Ist a eine Nullstelle von f , so existiert ein g ∈ K[x] mit f = (x − a)g.
Beweis. Nach Satz 1.33(1) gibt es g, r ∈ K[x] mit f = (x − a)g + r
und
r =0
oder
grad r < grad(x − a) = 1.
Also ist stets r ∈ K . Nun ist 0 = f (a) = (a − a)g(a) + r = r .
Satz 1.38. Seien K ein Körper und 0 ≠ f ∈ K[x]. Seien weiter a1 , . . . , an paarweise verschiedene Nullstellen von f in K . Dann gibt es ein g ∈ K[x] mit f =
n
(x − ai )g.
i=1
Insbesondere ist n ≤ grad f . Beweis. Wir beweisen die Behauptung durch Induktion nach n. Für n = 1 steht dies ˜ mit g ˜ ∈ K[x]. Dann ist in Lemma 1.37. Seien also n > 1 und f = n−1 i=1 (x − ai )g 0 = f (an ) =
n−1
˜ n ). (an − ai ) g(a
i=1
Da die a1 , . . . , an paarweise verschieden sind, folgt n−1
(an − ai ) ≠ 0.
i=1
˜ n ) = 0. Nach Lemma 1.37 ist dann Also ist g(a
Somit ist f =
n
i=1 (x
˜ = (x − an )g. g − ai )g .
Ringe
23
Bisher haben wir uns hauptsächlich mit K[x] beschäftigt, wobei K ein Körper war. Wir werden später aber häufig in Z[x] arbeiten müssen. Natürlich ist Z ⊆ Q und somit Z[x] ⊆ Q[x]. In Q[x] haben wir eine eindeutige Primfaktorzerlegung, d. h. jedes Polynom aus Z[x] kann eindeutig als Produkt in Q[x] irreduzibler Polynome geschrieben werden. Wir wollen aber wissen, ob dies auch mit irreduziblen Polynomen in Z[x] möglich ist. Dazu abstrahieren wir zunächst die Konstruktion, die von Z zu Q führt. Lemma 1.39. Sei R ein Integritätsbereich. (1) Es gibt einen Körper K mit folgenden Eigenschaften: (a) Es gibt einen Monomorphismus α : R → K . (b) Jedes Element aus K hat die Gestalt α(r1 )α(r2 )−1 mit r1 , r2 ∈ R und r2 ≠ 0. (2) Durch die in (1) angegebenen Eigenschaften ist K bis auf Isomorphie eindeutig bestimmt. ˜ ein Körper und ψ : R → K ˜ ein Monomorphismus, so gibt es einen Monomor(3) Sind K ˜ ˜ ˜ phismus ψ : K → K mit ψα = ψ. Beweis. (1) Wir definieren auf R × (R\{0}) eine Äquivalenzrelation ∼ durch (r1 , s1 ) ∼ (r2 , s2 )
genau für r1 s2 = r2 s1 .
Offenbar ist ∼ reflexiv und symmetrisch. Seien (r1 , s1 ) ∼ (r2 , s2 ) und (r2 , s2 ) ∼ (r3 , s3 ). Dann gilt r1 s2 = r2 s1 und r2 s3 = r3 s2 . Also ist r1 s2 s3 = r2 s1 s3 = r2 s3 s1 = r3 s2 s1 . Da s2 ≠ 0 ist, folgt r1 s3 = r3 s1 , d. h. (r1 , s1 ) ∼ (r3 , s3 ). Somit ist ∼ transitiv. Sei K = {(r , s) | (r , s) ∈ R × (R\{0})}
die Menge der Äquivalenzklassen von ∼. Wir definieren auf K eine Addition und Multiplikation durch (r1 , s1 ) + (r2 , s2 ) = (r1 s2 + r2 s1 , s1 s2 ) (r1 , s1 ) (r2 , s2 ) = (r1 r2 , s1 s2 ).
Dann ist K ein kommutativer Ring. Es ist (0, 1) das Nullelement und (1, 1) das Einselement. Da (r , s) (s, r ) = (1, 1)
für r ≠ 0
und (0, s) ∼ (0, 1) ist, folgt, dass K ein Körper ist. Nun definieren wir α : R → K durch α(r ) = (r ,1).
Offenbar ist α ein Homomorphismus. Wir zeigen, dass α ein Monomorphismus ist. Sei dazu r ∈ Kern α. Dann ist (0, 1) = α(r ) = (r ,1). Also ist (0, 1) ∼ (r ,1). Dies liefert nun r = r · 1 = 1 · 0 = 0.
24
Ringe
−1
Weiter ist (r , s) = (r ,1) (1, s) = (r ,1) (s,1) = α(r )α(s)−1 . (2) Sei K ein Körper, der (1) erfüllt, mit zugehörigem Monomorphismus β. Wir definieren ϕ : K → K durch ϕ((r , s)) = β(r )β(s)−1 . ϕ ist wohldefiniert: Sei (r1 , s1 ) ∼ (r2 , s2 ). Dann ist r1 s2 = r2 s1 . Also ist β(r1 )β(s2 ) = β(r2 )β(s1 ) und dann β(r1 )β(s1 )−1 = β(r2 )β(s2 )−1 .
Somit ist ϕ((r , s)) von der Auswahl des Paares (r , s) unabhängig. Der Beweis, dass ϕ ein Homomorphismus ist, sei dem Leser als Übung überlassen. Nach (1)(b) ist K = {β(r )β(s)−1 | (r , s) ∈ R × (R\{0})}.
Also ist ϕ ein Epimorphismus. Nach Satz 1.7 ist Kern ϕ ein Ideal in K . Nach Satz 1.8 hat K nur die Ideale 0 und K . Da ϕ((1, 1)) = 1 ≠ 0 ist, folgt Kern ϕ = 0. Also ist ϕ ein Isomorphismus und K K. ˜ durch ˜:K→K (3) Wir definieren ψ ˜ ψ(α(r )α(s)−1 ) = ψ(r )ψ(s)−1 .
Sei α(r )α(s)−1 = α(r )α(s )−1 . Dann ist α(r )α(s ) = α(r )α(s), also haben wir α(r s ) = α(r s). Da α ein Monomorphismus ist, folgt r s = r s . Also ist ψ(r )ψ(s ) = ψ(r s ) = ψ(r s) = ψ(r )ψ(s)
und dann ψ(r )ψ(s)−1 = ψ(r )ψ(s )−1 , ˜ ist wohldefiniert. d. h., ψ ˜ ein Homomorphismus ist, ist klar. Wegen Dass ψ −1 ˜ ψ(α(1)α(1) ) = ψ(1)ψ(1)−1 = 1
˜ ≠ 0. Nach Satz 1.8 ist nun ψ ˜ ein Monomorphismus. ist ψ Sei r ∈ R. Dann ist ˜ ˜ ψ(α(r )) = ψ(α(r )α(1)−1 ) = ψ(r )ψ(1)−1 = ψ(r ), ˜ = ψ. d. h. ψα
Ringe
25
Definition 1.40. Sei R ein Integritätsbereich. Den Körper K aus Lemma 1.39 nennen wir den Quotientenkörper von R. Den Quotientenkörper von R[x] bezeichnen wir mit R(x). Wegen Lemma 1.39(2) können wir die Elemente von K mit R(x) =
f g
a b
bezeichnen. Also
| f , g ∈ R[x], g ≠ 0 .
Wegen Lemma 1.39(3) enthält jeder Körper, der R enthält, auch einen Quotientenkörper. Den Quotientenkörper von Z bezeichnet man üblicherweise mit Q. Wir wollen nun untersuchen, wie es mit der ZPE-Eigenschaft von R[x] aussieht, wenn R ein ZPE-Ring ist. Dabei nutzen wir aus, dass R[x] in K[x] liegt, wobei K ein Quotientenkörper von R ist. Weiter benutzen wir, dass K[x] ein ZPE-Ring ist. Definition 1.41. Seien R ein ZPE-Ring und 0 ≠ f =
n
i=0 ai x
i
∈ R[x]. Wir setzen
I(f ) = ggT(a0 , . . . , an ).
Wir nennen I(f ) den Inhalt von f . Lemma 1.42. Seien R ein ZPE-Ring und f , g ∈ R[x]\{0}. Dann gilt I(f ) I(g) = e I(f g)
mit einer Einheit e ∈ R. Beweis. Es ist f = cf1 und g = dg1 , wobei c = I(f ), d = I(g) und I(f1 ) = I(g1 ) = 1 gilt. Daher ist es ausreichend, die Behauptung für I(f ) = I(g) = 1 zu beweisen. m i j Seien f = n i=0 ai x und g = j=0 bj x . Weiter sei p ein irreduzibles Element in R. Wir wählen r maximal in 0 ≤ r ≤ n, so dass p nicht ar teilt. Sei genauso s maximal in 0 ≤ s ≤ m, so dass p nicht bs teilt. Der Koeffizient cr +s von x r +s in f g ist a0 br +s + · · · + ar bs + ar +1 bs−1 + · · · + ar +s b0 .
Da p nicht ar bs , aber alle ar +i bs−i und bs+i ar −i mit i ≥ 1, teilt, ist p kein Teiler von cr +s . Damit teilt p auch nicht I(f g). Dies gilt für jedes irreduzible Element. Also ist I(f g) eine Einheit, da R ein ZPE-Ring ist.
26
Ringe
Lemma 1.43. Seien R ein ZPE-Ring und f ∈ R[x] mit I(f ) = 1. Sei weiter K der Quotientenkörper von R. Dann ist f irreduzibel in K[x] genau dann, wenn f irreduzibel in R[x] ist. Beweis. Sei f irreduzibel in K[x] und f = gh mit g, h ∈ R[x] ⊆ K[x]. Dann können wir annehmen, dass g eine Einheit in K[x] ist. Nach Satz 1.33(2) ist g ∈ R. Da I(f ) = 1 ist, folgt, dass g eine Einheit in R[x] ist. Sei nun umgekehrt f irreduzibel in R[x] und f = gh mit g, h ∈ K[x]. Dann ist g=
n ai i x b i=0 i
und h =
m cj j x d j=0 j
mit geeigneten ai , bi , ci , di ∈ R.
Wir setzen a=
n
bi
und
b=
i=0
m
dj .
j=0
Dann sind ag = g0 ∈ R[x] und bh = h0 ∈ R[x]. Sind α = I(g0 ) und β = I(h0 ), so sind g0 = αg1 und h0 = βh1 mit I(g1 ) = I(h1 ) = 1. Nun gilt αβg1 h1 = abgh = abf . Nach Lemma 1.42 ist αβ = abe mit einer Einheit e ∈ R. Also ist f = g1 h1 e. Da f irreduzibel ist, ist dann ohne Einschränkung g1 eine Einheit. Somit ist g1 ∈ K nach Satz 1.33(2). Dann ist aber auch g = a−1 αg1 ∈ K . Dies bedeutet jedoch, dass f irreduzibel in K[x] ist. Diesen Satz werden wir häufig in der folgenden Form anwenden. Korollar 1.44. Ist f = irreduzibel in Q[x].
n
i=0
ai x i irreduzibel in Z[x] mit ggT(a0 , . . . , an ) = 1, so ist f
Nun kommen wir endlich zu dem Hauptresultat. Satz 1.45. Ist R ein ZPE-Ring, so auch R[x]. Beweis. Sei K der Quotientenkörper von R. Nach Satz 1.33(1) ist K[x] ein ZPE-Ring. Sei 0 ≠ f ∈ R[x], dann ist f ∈ K[x]. Also gilt f = cp1 · · · pr
mit einer Einheit c ∈ K[x] und irreduziblen pi ∈ K[x]. Sei ai das Produkt der Nenner der Koeffizienten von pi . Dann ist fi = ai pi ∈ R[x]. Weiter ist fi = ci qi mit ci ∈ R und qi ∈ R[x], wobei I(qi ) = 1 ist. Also ist pi = acii qi , wobei ai , ci ∈ R sind. Wir setzen c = ab und haben so r r ai f = a ci q1 · · · qr . b i=1
i=1
Ringe
Sei zunächst I(f ) = 1. Nach Lemma 1.42 ist dann b einer Einheit e ∈ R. Also ist f = eq1 · · · qr
r
i=1 ai
27
r = a i=1 ci e mit
mit qi ∈ R[x].
Da die pi irreduzibel in K[x] sind, sind auch die qi irreduzibel in R[x]. Sei nun f = e˜r˜1 · · · r˜k mit irreduziblen r˜i ∈ R[x]. Nach Lemma 1.42 ist I(˜ ri ) = 1. Nach Lemma 1.43 sind die r˜i irreduzibel in K[x]. Also ist r = k und r˜i = ei pi bei geeigneter Nummerierung. Das liefert ai r˜i = ei ci qi . Nach Lemma 1.42 ist dann r˜i = qi e˜i mit einer Einheit e˜i ∈ R. Also ist f = e˜q1 · · · qr und die Darstellung ist eindeutig. Sei nun I(f ) = d. Es ist f = df˜ mit I(f˜) = 1. Dann ist f˜ eindeutig darstellbar. Da d ∈ R ist, gilt d = d1 · · · dk mit irreduziblen di ∈ R und diese Darstellung ist eindeutig. Sei nun f = eq1 · · · qr , mit irreduziblen qi ∈ R[x]. Sei weiter ci = I(qi ). Dann ist r ˜r ˜1 · · · q df˜ = e ci q
˜i und I(˜ mit irreduziblen q qi ) = 1.
i=1
˜r mit einer ˜1 · · · q ˜i eindeutig Nach Lemma 1.42 ist f˜ = e˜q Einheit e˜. Weiter sind die q r ˜ ˜ bestimmt. Die Zerlegung von d = c ist auch eindeutig bestimmt da R ein e i i=1 ZPE-Ring ist. Somit ist die Zerlegung f = eq1 · · · qr
eindeutig bestimmt. Korollar 1.46. Ist K ein Körper, so ist K[x1 , . . . , xn ] ein ZPE-Ring. Hier ist zunächst undefiniert, was K[x1 , . . . , xn ] sein soll. Um K[x1 , x2 ] zu definieren, kann man K[x1 , x2 ] = (K[x1 ])[x2 ] setzen. Dies wollen wir auch so machen. Die Definition hat allerdings den Nachteil, dass wir eine Ordnung in die xi gebracht haben. Man muss dann zeigen, dass die Konstruktion von der Reihenfolge unabhängig ist, d. h. (K[x1 ])[x2 ] (K[x2 ])[x1 ]. Man kann allerdings auch abstrakter vorgehen. Sei I = N ∪ {0} und n ∈ N. Sei Pn (R) die Menge aller Funktion a : I n → R, die endlichen Träger haben, d. h. a(i1 , . . . , in ) ≠ 0 nur für endlich viele (i1 , . . . , in ) ∈ I n . Für n = 1 haben wir unsere Definition des Polynomrings als P1 (R). Seien i = (i1 , . . . , in ) ∈ I n und a, b ∈ Pn (R), so definieren wir (a + b)(i) = a(i) + b(i) a(j)b(k). (ab)(i) = j,k∈I n j+k=i
Damit wird Pn (R) zu einem Ring. Dies ist der Polynomring in n Variablen.
28
Ringe
Der Zusammenhang mit der obigen mehr suggestiven Definition ergibt sich wie folgt: Für k ≤ n setzen wir ek = (0, . . . , 0, 1 , 0, . . . , 0). ↑
n+1
Wir definieren xk durch xk (ek ) = 1
und xk (i) = 0 für i ∈ I n , i ≠ ek .
Beispiel 1.47. Sei R = Z[x]. Nach Satz 1.45 ist R ein ZPE-Ring. Wir wollen zeigen, dass R kein Hauptidealring ist. Sei dazu i der Kern des Einsetzungshomomorphismus f → f (0), d. h. i = xR. Es ist somit R/xR Z, was liefert, dass xR ein Primideal in R ist. Da Z kein Körper ist, ist xR nicht maximal. Somit ist nach Lemma 1.20 R kein Hauptidealring. Damit haben wir ein Beispiel eines ZPE-Rings, der kein Hauptidealring ist. Auch die Summendarstellung des ggT wie in Satz 1.22 gilt in R nicht. Es ist offenbar 1 = ggT(2, x), aber xR + 2R ≠ R, da 2 keine Einheit in Z ist. Also gibt es keine h, t ∈ Z[x] mit 1 = 2h + xt . Wir haben nun zwar, dass Z[x] ein ZPE-Ring ist, allerdings wissen wir nicht, wie man einem Polynom aus Z[x] ansieht, ob es irreduzibel ist. Dies ist auch durchaus ein nichttriviales Problem. Man beachte, dass es ja auch schon in Z nicht ganz einfach ist festzustellen, ob eine gegebene Zahl eine Primzahl ist. Wir wollen jetzt ein Irreduzibilitätskriterium angeben, das häufig sehr effektiv ist. Satz 1.48 (Eisenstein5 ). Seien R ein ZPE-Ring mit Quotientenkörper K und f = a0 + a1 x + · · · + an x n
mit ai ∈ R.
Für ein irreduzibles Element p ∈ R sei p kein Teiler von an , aber p teile an−1 , . . . , a0 . Ist p 2 kein Teiler von a0 , so ist f irreduzibel in K[x].
5 F. G. Eisenstein, * 16. 4. 1823 Berlin, † 11. 10. 1852 Berlin. Eisenstein studierte ab 1843 an der Berliner Universität und erhielt dort den Doktorgrad ehrenhalber nach der Veröffentlichung von über 25 Arbeiten. Er habilitierte 1847 an der Berliner Universität und wurde 1852 Mitglied der Berliner Akademie. Eisenstein arbeitete auf den Gebieten der Zahlentheorie, Algebra, elliptische Funktionen und beschäftige sich mit quadratischen, kubischen und biquadratischen Reziprozitätsgesetzen. Herausragend waren seine Arbeiten über die Teilung der Lemniskate und die elliptischen Funktionen. Hier entstehen auch die später nach ihm benannten Eisenstein-Reihen.
Ringe
29
Beweis. Da p nicht I(f ) teilt, können wir I(f ) = 1 annehmen. Nach Lemma 1.43 genügt es zu zeigen, dass f irreduzibel in R[x] ist. Sei also f = gh mit g=
r
bi x i
h=
und
i=0
t
cj x j ,
r , t > 0, br ≠ 0 ≠ ct .
j=0
Es ist a0 = b0 c0 . Da a0 von p geteilt wird, erhalten wir, dass b0 oder c0 von p geteilt werden. Da p2 nicht a0 teilt, können wir annehmen, dass p nicht c0 teilt. Da p nicht I(f ) teilt, teilt p auch nicht I(g) nach Lemma 1.42. Sei nun k minimal mit p teilt nicht bk . Ist k < n, so teilt p den Koeffizienten ak = bk c0 + bk−1 c1 + · · · + b0 ck .
Aber p teilt bk−i ci für i > 0 und p teilt weder bk noch c0 . Das ist ein Widerspruch. Also ist k = n. Dann ist aber k = r = n, d. h. grad g = grad f . Nach Lemma 1.32 ist dann grad h = 0, ein Widerspruch. Beispiele 1.49. (1) Sei f = 29 x 5 + 53 x 4 + x 3 +
1 3
∈ Q[x]. Dann ist
9f = 2x 5 + 15x 4 + 9x 3 + 3 ∈ Z[x].
Wir wenden Satz 1.48 mit p = 3 auf das Polynom 2x 5 + 15x 4 + 9x 3 + 3 an. Also ist f irreduzibel in Q[x]. p −1 = x p−1 + x p−2 + x p−3 + · · · + x + 1, p eine Primzahl. Dann ist (2) Sei f = xx−1 f (x + 1) =
(x + 1)p − 1 = x p−1 + pxh(x) + p x
mit h ∈ Z[x].
Nun folgt mit Satz 1.48, dass f irreduzibel ist. (3) Neben Satz 1.48 gibt es noch ein zweites sehr effektives Irreduzibilitätskriterium. Sei dazu n ∈ N. Wir erweitern die Abbildung Z → Z/nZ zu einer Abbildung Z[x] → Z/nZ[x] durch f =
n i=0
ai x i → f¯ =
n
¯i x i a
¯i = ai + nZ). (a
i=0
Ist n eine Primzahl, so ist Z/nZ ein Körper. Also haben wir eine eindeutige Primfaktorzerlegung in Z/nZ[x]. Sei nun f ∈ Z[x] und f = gh. Dann erhalten wir auch in Z/nZ[x] eine Zerlegung, solange n nicht den höchsten Koeffizienten von f teilt. Es gilt somit: Ist f¯ irreduzibel in Z/nZ[x], so auch f in Z[x]. Der Vorteil von Z/nZ[x] gegenüber Z[x] ist der, dass Z/nZ endlich ist, man also nur endlich viele Tests benötigt, um festzustellen, ob f¯ irreduzibel ist. Sei f = x 4 + 15x 3 + 7 ∈ Z[x]. Wir setzen n = 5. Dann erhalten wir das Polynom ¯ ∈ Z/5Z[x]. f¯ = x 4 + 2
30
Ringe
¯, 1 ¯, 2 ¯, 3 ¯ und 4 ¯ sieht man, dass f¯ keine Nullstelle in Durch Einsetzen der Zahlen 0 ¯ ¯ ¯ ¯ . Sei also ¯h mit grad g ¯ = 2 = grad h Z/5Z hat. Ist f reduzibel, so ist f = g 2 ¯ ¯ ¯ = (x 2 + ax ¯ + b)(x x4 + 2 + c¯x + d).
Koeffizientenvergleich liefert ¯ ¯ + c¯ = 0, a
¯ + d¯ = 0, ¯ ¯c + b a¯
¯d¯ = 2. ¯ b
Daraus erhalten wir ¯ + d¯ = a ¯2 . b ¯ 1, ¯ 4} ¯ . Also gilt ¯2 ∈ {0, Es ist a ¯ 1 ¯ = 2, ¯ − b) ¯ b(
¯2 = 2 ¯ −b
oder
¯ 4 ¯ = 2. ¯ − b) ¯ b(
¯ die Elemente 0 ¯, 1 ¯, 2 ¯, 3 ¯, 4 ¯ einsetzt, erhält man einen Widerspruch. Indem man für b Also ist f irreduzibel in Z[x]. ¯ gewesen. Es Hätten wir nicht n = 5, sondern n = 3 betrachtet, so wäre f¯ = x 4 + 1 4 ¯ 2 2 ¯ ¯ . Damit hätten wir die Irreduzibilität nicht −x−1) gilt aber x +1 = (x +x−1)(x beweisen können. Wir werden dieses Verfahren in Kapitel 17 wieder aufgreifen und zeigen, dass es nur endlich viele „schlechte“ n für ein gegebenes Polynom f gibt.
Zum Ende dieses Kapitels wollen wir noch einige einfache Resultate über Körper beweisen. Definition 1.50. Seien R ⊆ S Ringe. Die Verknüpfungen von R seien Einschränkungen der Verknüpfungen von S. Sei 1 das Einselement von S. Ist 1 ∈ R, so heißt R ein Unterring von S. Lemma 1.51. Seien Ri , i ∈ I , Unterringe eines Rings S, dann ist auch der Durchschnitt i∈I Ri ein Unterring von S. Sind alle Ri Körper, so ist auch R ein Körper.
R=
Beweis. Sei dem Leser zur Übung überlassen. Definition 1.52. Sei K ein Körper. (1) Den Durchschnitt aller Unterkörper von K nennen wir den Primkörper von K . (2) Ist n die kleinste natürliche Zahl mit n · 1 = 1 · · + 1 = 0, so heißt n die Cha + · n
rakteristik von K . Wir schreiben char K = n. Gibt es kein solches n, so schreiben wir char K = 0. Der nächste Satz zeigt, dass nicht jede natürliche Zahl als Charakteristik vorkommt.
Ringe
31
Satz 1.53. Die Charakteristik eines Körper ist 0 oder eine Primzahl. Beweis. Sei char K = n ≠ 0, also n · 1 = 0. Sei n = pq mit einer Primzahl p . Dann ist p · (q · 1) = 0, d. h. (p · 1)(q · 1) = 0. Somit ist (p · 1) = 0 oder (q · 1) = 0, was wegen der minimalen Wahl nun n = p liefert. Wir werden jetzt gleich für jede nach Satz 1.53 zulässige Zahl einen Körper mit dieser Charakteristik angeben. Beispiele 1.54. (1) Es hat Q die Charakteristik Null. (2) Seien p eine Primzahl und K = Z/pZ. Dann ist K ein Körper, für den wir auch GF(p) schreiben. Die Abkürzung kommt aus dem Englischen und bedeutet Galois field. Sei a · 1 ∈ pZ mit a ∈ N. Dann ist p ein Teiler von a. Also ist p ein Teiler von char K . Nach Satz 1.53 ist dann p = char K . Beispiel 1.54 listet alle Primkörper auf, wie der folgende Satz zeigt. Satz 1.55. Seien K ein Körper und k der Primkörper. (1) Ist char K = 0, so ist k Q. (2) Ist char K = p ≠ 0, so ist k GF(p). Beweis. (1) Sei ψ : N → k mit ψ(n) = n · 1. Da char K = 0 ist, ist ψ ein Monomorphismus. Also können wir N ⊆ k annehmen. Das liefert dann Z ⊆ k. Nach Lemma 1.39 enthält k einen zu Q isomorphen Unterkörper. Also ist k Q. (2) Sei K1 = {0, 1, . . . , p − 1}. Dann ist K1 ⊆ k. Für x ∈ {1, . . . , p − 1} ist ggT(x, p) = 1. Somit gibt es nach Satz 1.22 a, b ∈ Z mit ax + bp = 1.
Weiter können wir a ∈ {1, . . . , p − 1} annehmen. Da bp = 0 in K ist, folgt ax = 1, und K1 ist ein Körper. Es ist K1 = k nach Definition von k. Sei τ : GF(p) → k mit τ(i + pZ) = i.
Dann ist τ ein Isomorphismus, also ist k GF(p). Satz 1.56. Sei K ein Körper und k der Primkörper. Ist α ein Automorphismus von K , so ist α(a) = a für alle a ∈ k.
32
Ringe
Beweis. Es ist α(1) = 1. Ist char K = p ≠ 0, so erhalten wir die Behauptung mit Satz 1.55(2). Sei also char K = 0. Dann können wir nach Satz 1.55(1) k = Q annehmen. Wegen α(1) = 1, folgt α(z) = z für alle z ∈ Z. Sei jetzt ab ∈ Q. Dann ist a b · b ∈ Z. Also ist a a a a = α(b) · α = bα . b· =α b· b b b b Damit erhalten wir a a =α . b b
Übungen 1.
Sei (R, +, ·) ein Ring. Für a, b ∈ R werden neue Verknüpfungen definiert durch a ⊕ b = a + b − 1, a b = a + b − a · b.
2.
(a) Zeige, dass (R, ⊕, ) und (R, +, ·) zueinander isomorphe Ringe sind. (b) Was sind die neutralen Elemente in (R, ⊕, )? Seien R ein kommutativer Ring und a, b zwei Ideale von R. n (a) Zeige: a ∩ b ⊇ ab = i=1 ai bi | n ∈ N, ai ∈ a, bi ∈ b . (b) Gib ein Beispiel an, wo ab ≠ a ∩ b ist. (c) Es gelte a + b = R und a ∩ b = {0}. Zeige: Die Abbildung ϕ : r → (r + a, r + b)
ist ein Ringisomorphismus von R nach R/a × R/b (Addition und Multiplikation komponentenweise). 3. Seien K ein Körper und R = Kn der Matrizenring der n × n-Matrizen über K . Zeige, dass R nur die trivialen zweiseitigen Ideale {0} und R enthält. 4. Bestimme alle Ideale von Z/12Z. Welche sind maximal, welche prim? 5. In jedem endlichen kommutativen Ring ist jedes Primideal maximal. 6. Seien R ein kommutativer Ring und i ⊆ R ein Ideal. Sei ∅ ≠ S ⊆ R mit S · S ⊆ S und S ∩ i = ∅. ( S · S = {s1 s2 | s1 , s2 ∈ S}) (a) Zeige mit dem Zornschen Lemma, dass es in der Menge P aller Ideale p mit i ⊆ p ⊆ R und p ∩ S = ∅ ein maximales Element (bzgl. Inklusion) gibt. (b) Zeige, dass ein maximales Element in P ein Primideal ist. 7. Z ist das einzige Ideal von Z, das sowohl 12Z als auch 5Z enthält. 8. Sei R ein Integritätsbereich. Ist |R| < ∞, so ist R ein Körper. 9. Sei K[x1 , . . . , xn ] der Polynomring über einem Körper K . Für welche n ist K[x1 , . . . , xn ] ein Hauptidealring? 10. Seien R ein Hauptidealring und a, b ∈ R. In welcher Beziehung stehen das kleinste gemeinsame Vielfache von a und b und aR ∩ bR? 11. Sei R ein Integritätsbereich. Dann ist 0 ≠ pR genau dann ein Primideal, falls p ein Primelement in R ist. 12. In einem ZPE-Ring sind die irreduziblen Elemente genau die Primelemente. 13. Dividiere im Ring Z[i] der Gaußschen Zahlen (siehe Beispiel 1.26(2)) 1 + 25i mit Rest durch 3 + 4i.
Ringe
33
14. Bestimme den größten gemeinsamen Teiler der Polynome (a) x 7 − x 3 + 5 und x 3 + 7 in Q[x], ¯ 3−2 ¯ 6 + x 3 − 3x ¯ +5 ¯ und 2x ¯ in K[x], wobei (b) x 7 − 4x ¯ = n + 7Z | n = 0, . . . , 6} K = Z/7Z = {n
ist. 15. Finde Polynome f , g ∈ Q[x] mit (x 8 − 1)f + (x 5 − 1)g = x − 1. 16. Zeige, dass (x 2 + 1)Z[x] in Z[x] ein Primideal, aber kein maximales Ideal ist. 17. Sei R = Q[x 2 , x 3 ]. Zeige, dass es in R keinen größten gemeinsamen Teiler von x 5 und x 6 gibt. Insbesondere ist R kein ZPE-Ring. 18. Sei Qp = { ab | a, b ∈ Z, p teilt nicht b}, p Primzahl. (a) Zeige, dass Qp ein euklidischer Ring ist. (b) Bestimme die Einheiten von Qp . (c) Bestimme die Primelemente von Qp . (d) Bestimme die maximalen Ideale von Qp . √ 19. Zeige, dass Rm = {r + s m | r , s ∈ Z} für m = −2, −1,2,3 ein euklidischer Ring ist, wobei √ 2 ϕ(r + s m) = |r − ms 2 | sei. 20. Sei K = GF(p), p eine Primzahl. (a) Zeige: x∈K\{0} x = −1. (b) Folgere aus (a): Ist p ≡ 1 (mod 4), so existiert ein x ∈ N, das die Kongruenz x 2 ≡ −1 (mod p) erfüllt. 21. Zeige, dass bis auf Einheiten die Primelemente in Z[i] genau die folgenden sind: (a) 1 + i, (b) p , p Primzahl mit p ≡ 3 (mod 4),
22.
23. 24. 25.
(c) a + bi, wobei a2 + b2 eine Primzahl kongruent 1 modulo 4 ist. (Hinweis: Benutze, dass der euklidische Betrag auf Z[i] multiplikativ ist. Für p ∈ Z, p Primzahl, p ≡ 1 (mod 4), benutze Aufgabe 20.) Sei R = Z[i] der Ring der Gaußschen Zahlen (siehe Beispiel 1.26(2)) und sei weiter K = R/3R. (a) Zeige, dass K ein Körper ist. (b) Bestimme char K und |K|. Gib einen Körper mit 4 Elementen an. Gibt es einen Körper mit 6 Elementen? Bestimme für jede Primzahl p ¯ x 2 − 5) ¯ ggT(x 3 − 1,
in GF(p)[x]. 26. Bestimme alle irreduziblen Polynome vom Grad 2 und 3 in GF(2)[x] und GF(3)[x]. 27. Zeige, dass x 3 − 9 irreduzibel in GF(7)[x], aber reduzibel in GF(11)[x] ist. 28. Sei p = x n + an−1 x n−1 + · · · + a0 ∈ Z[x]. (a) Ist s ∈ Q mit p(s) = 0, so ist s ∈ Z und s teilt a0 . (b) Besitzt x 11 − 14x 7 + x + 1 rationale Nullstellen? 29. (a) Seien R und S zwei kommutative Ringe und ϕ : R → S ein Homomorphismus. Zeige: Ist ¯ : R[x] → S mit s ∈ S, so gibt es für ϕ genau eine Fortsetzung auf den Polynomring ϕ ¯ ϕ(x) = s. (b) Sei K ein Körper, ϕ : K[x] → K[x] ein Automorphismus. Zeige: (i) p ∈ K[x] ist genau dann irreduzibel, wenn ϕ(p) irreduzibel ist. (ii) Für c ∈ K wird durch k → k für k ∈ K und x → x + c genau ein Homomorphismus ψ : K[x] → K[x] definiert. Dieser ist sogar ein Automorphismus.
34
Ringe
30. Zeige, dass die folgenden Polynome in Q[x] irreduzibel sind. (a) 2x 4 + 5x 3 − 4x + 2, (b) x 4 + x 3 + x 2 + x + 1. 31. Das Polynom x q + 1 ist in Z[x] genau dann irreduzibel, falls q eine 2-Potenz ist. 32. Bestimme die Primfaktorzerlegung von x 5 + x 4 + x 2 + x + 2 in Z[x]. 33. Bestimme die Nullstellen von (a) x 3 − 6x 2 + 11x − 6, (b) x 4 + x 3 + x 2 + x + 1, (c) x 4 − 6x 2 + 11. in Q, R und C. 34. Ist x 5 − x 2 + 1 ∈ Q[x] irreduzibel? 35. Bestimme die Primfaktorzerlegung von x 3 + y 3 + z 3 − x 2 (y + z) − y 2 (x + z) − z2 (x + y) + 2xyz
in Z[x, y, z]. 36. Seien K ein unendlicher Körper und f ∈ K[x1 , . . . , xn ] ein Polynom mit f (a1 , . . . , an ) = 0 für alle ai ∈ K . Dann ist f = 0. 37. Seien f ∈ Z[x] und a, b, c, d paarweise verschiedene ganze Zahlen. Es gelte weiter f (a) = f (b) = f (c) = f (d) = 5.
Zeige, dass es kein k ∈ Z mit f (k) = 8 gibt. 38. Seien f ∈ Z[x] und k ∈ N, so dass f (1), . . . , f (k) alle nicht durch k teilbar sind. Dann ist f (r ) ≠ 0 für alle r ∈ Z. 39. Bestimme alle Polynome p ∈ Z[x] mit p(x 2 + 1) = p(x)2 + 1 und p(0) = 0.
2 Körpererweiterungen In diesem Kapitel wollen wir uns mit der Situation beschäftigen, dass ein Körper k in einem Körper K enthalten ist. Wir werden den größeren als Vektorraum über dem kleineren auffassen und eine für die weitere Entwicklung fundamentale Dimensionsformel (Satz 2.5) beweisen. Definition 2.1. Seien R ein Ring, k und K Körper mit k ⊆ K . (1) Für N ⊆ R bezeichnen wir mit [N]R den Durchschnitt aller Unterringe von R, die N enthalten. (Nach Lemma 1.51 ist [N]R ein Ring.) (2) Sei N eine Teilmenge von K . Wir setzen M = k ∪ N . Für den Quotientenkörper von [M]K in K schreiben wir k(N). Wir nennen k(N) den durch Adjunktion von N aus k entstandenen Erweiterungskörper. Ist N = {n1 , . . . , nr }, so schreiben wir auch k(n1 , . . . , nr ) statt k({n1 , . . . , nr }). Satz 2.2. Seien K ein Körper, k ⊆ K ein Unterkörper und N ⊆ K .Wir setzen M = k ∪ N . Dann ist [M]K =
n i=1
ai
ki
mji | ai ∈ k, mji ∈ N, n, ki ∈ N ∪ {0} .
ji =1
Jedes Element aus k(N) ist in k(E) für eine geeignete endliche Teilmenge E ⊆ N enthalten. n ki Beweis. Wir setzen M = i=1 ai ji =1 mji | ai ∈ k, mji ∈ N, n, ki ∈ N ∪ {0} . Dann ist M ⊆ M. Offensichtlich ist M ein Ring. Da jeder Ring, der M enthält, auch M enthält, ist [M]K = M. Sei x ∈ k(N). Dann ist x = ab mit a, b ∈ [M]K . Es kommen nur endlich viele mi in der Darstellung von a und b vor, d. h. x ∈ k(E), wobei E die Menge der mi ist, die in der Darstellung von a und b vorkommen. Definition 2.3. Seien k und K Körper. (1) Die Körpererweiterung k ⊆ K heißt endlich erzeugt, wenn es eine endliche Menge X = {x1 , . . . , xn } ⊆ K gibt, mit K = k(X). (2) Der Körper K heißt endlich erzeugt, wenn K über seinem Primkörper endlich erzeugt ist. (3) Die Körpererweiterung k ⊆ K heißt einfach, falls es ein a ∈ K gibt, so dass K = k(a) ist. Ein Element a ∈ K mit dieser Eigenschaft heißt dann auch ein primitives Element. Achtung: Die Schreibweise in Definition 2.3(3) ähnelt der des Quotientenkörpers des Polynomrings. Dies sind aber zwei verschiedene Begriffe!
36
Körpererweiterungen
Jeder Oberkörper K eines Körpers k kann als k-Vektorraum aufgefasst werden. Die wesentliche Invariante eines Vektorraumes ist seine Dimension. Es liegt also nahe, dass diese auch für die Körpererweiterung k ⊆ K wichtig sein wird. Definition 2.4. Sei k ⊆ K eine Körpererweiterung. Wir betrachten K als k-Vektorraum. Seine Dimension nennen wir den Grad der Körpererweiterung. Diesen bezeichnen wir mit [K : k]. Eine Körpererweiterung k ⊆ K heißt endlich, falls [K : k] endlich ist. Indem wir einiges von der Struktur des Körpers vergessen und die Lineare Algebra anwenden, beweisen wir nun einen der effektvollsten Sätze. Satz 2.5 (Gradsatz). Seien L ein Körper, k und K Unterkörper von L mit k ⊆ K ⊆ L. Dann gilt [L : k] = [L : K][K : k]. Sind insbesondere zwei der Grade endlich, so auch der dritte. Beweis. Sei {xi | i ∈ I} eine Basis von K als k-Vektorraum und {yj | j ∈ J} eine Basis von L als K -Vektorraum. Wir zeigen, dass {xi yj | i ∈ I, j ∈ J} eine Basis von L als k-Vektorraum ist. (1) Lineare Unabhängigkeit: Sei i∈I aij xi yj = 0, aij ∈ k, nur endlich viele der aij seien ungleich Null. j∈J
Dann ist
aij xi yj = 0.
j∈J i∈I
Da
i∈I
aij xi ∈ K ist, folgt aus der linearen Unabhängigkeit der yj , dass
aij xj = 0
für alle j
i∈I
ist. Da die xi linear unabhängig sind, folgt nun, dass aij = 0 für alle i, j ist. Also ist {xi yj | i ∈ I, j ∈ J} linear unabhängig. (2) Erzeugendensystem: Sei a ∈ L. Dann ist a = j∈J λj yj mit geeigneten λj ∈ K . Es ist λj =
λij xi
mit geeigneten λij ∈ k.
i∈I
Das liefert a=
i∈I j∈J
λij xi yj .
Körpererweiterungen
37
Beispiele 2.6. (1) Es ist R(i) = C, i die imaginäre Zahl mit i2 = −1. Somit ist R ⊆ C einfach und [C : R] = 2 mit Basis {1, i}. √ √ (2) Q( 2) ist der Quotientenkörper von {a + b 2 | a, b ∈ Q} = N gemäß Satz 2.2. √ √ √ √ Sei 0 ≠ a + b 2 ∈ N . Da (a + b 2)(a − b 2) = a2 − 2b2 ∈ Q ist und 2 ∈ Q √ √ √ ist, folgt a2 − 2b2 = c ≠ 0. Also ist ac − bc 2 ∈ N . Da ac − bc 2 a + b 2 = 1 ist, ist N ein Körper. Somit ist √ √ Q( 2) = {a + b 2 | a, b ∈ Q}. √ Insbesondere ist [Q( 2) : Q] = 2. √ (3) Sei u = 3 2 ∈ R. Dies legt u eindeutig fest, da es genau zwei nicht reelle und eine reelle dritte Wurzel aus 2 gibt. Wir setzen K = Q(u). Nach Satz 2.2 ist K √ √ Quotientenkörper von {a + b 3 2 + c 3 4 | a, b, c ∈ Q} = N . Wir zeigen wieder, dass N ein Körper ist. Sei also √ √ 3 3 0 ≠ a + b 2 + c 4 ∈ N. Sei zunächst c ≠ 0. Dann können wir c = 1 annehmen. Es ist √ √ √ √ 3 3 3 3 (a + b 2 + 4)(b − 2) = (ab − 2) + (b2 − a) 2. √ √ Somit genügt es zu zeigen, dass stets a + b 3 2 mit a + b 3 2 ≠ 0 ein Inverses hat. Wir setzen y=
Da
a3
√ √ a2 ba b2 3 3 − 3 2+ 3 4. 3 3 3 + 2b a + 2b a + 2b
√ 3 2 ∈ Q ist, ist a3 + 2b 3 ≠ 0. Dann ist √ 3 (a + b 2)y = 1.
Also ist Q(
√ 3
2) = {a + b
√ 3
und dann ist 2 ≤ [Q( √ 3
2+c
√ 3
√ 3
4 | a, b, c ∈ Q}
2) : Q] ≤ 3.
√ 3
√ √ √ Angenommen 4 = a + b 2. Dann ist 2 = a 3 2 + b 3 4. Also ist 3 2 eine √ √ Nullstelle des Polynoms bx 2 + ax − 2 in Q( 3 2)[x]. Weiter ist 3 2 Nullstelle von √ 3 x 3 − 2. Nach Satz 1.38 ist dann x − 2 ein Teiler beider Polynome. D. h. ggT(x 3 − 2, bx 2 + ax − 2) = f ≠ 1.
Es ist dann f ein Teiler von x 3 − bx 2 − ax = (x 2 − bx − a)x . Also ist f ein Teiler von x 2 − bx − a und bx 2 − b2 x − ab. Damit teilt f auch (bx 2 + ax − 2) − (bx 2 − b2 x − ab) = (a + b 2 )x + (ab − 2) = g.
38
Körpererweiterungen
√ √ Somit ist 3 2 eine Nullstelle von g . Da a, b ∈ Q sind, folgt 3 2 ∈ Q, ein Widerspruch. Dies zeigt √ 3 [Q( 2) : Q] = 3. √ √ (4) Dass nicht allgemein [Q( n t) : Q] = n für n t ∈ Q gilt, zeigt folgendes Beispiel. √ Wir betrachten u = 3 1 ∈ Q, also u = e2π i/3 . Dann folgt wie oben Q(u) = {a + bu + cu2 | a, b, c ∈ Q},
insbesondere ist 2 ≤ [Q(u) : Q]. Es ist x 3 − 1 = (x − 1)(x 2 + x + 1). Weiter ist u ≠ 1 Nullstelle von x 3 − 1. Also ist u2 + u + 1 = 0, was u2 = −u − 1 liefert. Somit ist Q(u) = {a + bu | a, b ∈ Q}.
Dann ist aber [Q(u) : Q] = 2. √ √ √ √ (5) Wir wollen Q( 2, 3) bestimmen. Es ist Q( 2, 3) der Quotientenkörper von √ N = {a + b 2 + c 3 + d 6 | a, b, c, d ∈ Q}. √ √ Wie wir wissen, ist Q( 2) = {a + b 2 | a, b ∈ Q}. Genauso erhalten wir auch √ √ Q( 2)( 3) = {f + e 3 | e, f ∈ Q( 2)}. √ √ √ √ Offenbar ist Q( 2)( 3) = Q( 2, 3). Wir wollen zunächst einmal annehmen, √ √ dass 3 ∈ Q( 2) ist. Das liefert dann √ 3 = a + b 2 mit a, b ∈ Q. √ Es ist a + b 2 Nullstelle von √ √ x − (a + b 2) x − (a − b 2) = x 2 − 2ax + a2 − 2b2 √ √ und 3 ist Nullstelle von x 2 − 3. Somit ist 3 Nullstelle von der Differenz der
beiden Polynome, also −2ax + a2 − 2b2 + 3 = g. p
Sei a = 0. Dann ist 3 = 2b2 . Ist b = q in gekürzter Form, so folgt 2p2 = 3q2 , was mit der eindeutigen Primfaktorzerlegung in Z einen Widerspruch ergibt. Also ist √ a ≠ 0. Nun folgt aber 3 ∈ Q, ein Widerspruch. Somit haben wir √ √ [Q( 2)( 3) : Q( 2)] = 2. Mit (1) und Satz 2.5 folgt nun √ √ √ √ [Q( 2, 3) : Q] = [Q( 2)( 3) : Q( 2)][Q( 2) : Q] = 4. √ √ Wir wollen zeigen, dass die Erweiterung Q ⊆ Q( 2, 3) einfach ist.
Körpererweiterungen
39
√ √ √ √ Es ist Q( 2 + 3) ⊆ Q( 2, 3). Weiter ist √ ( 2 + 3)2 = 5 + 2 6. √ √ √ Das liefert 6 ∈ Q( 2 + 3). Da √ √ √ ( 2 + 3) 6 − 2( 2 + 3) = 2 √ √ ist, folgt nun N ⊆ Q( 2 + 3), also √ √ Q( 2 + 3) = Q( 2, 3). √ √ Insbesondere ist die Erweiterung Q ⊆ Q( 2, 3) einfach. (6) Sei C(x) der Quotientenkörper von C[x]. Dann ist offenbar C ⊆ C(x) einfach. Weiter ist [C(x) : C] = ∞.
Es drängen sich nun die folgenden Fragen auf, die wir in den nächsten Kapiteln beantworten werden: (1) Wie kann man allgemein den Grad [K : k] einer Erweiterung k ⊆ K berechnen? (2) Wann ist für k ⊆ K und M ⊆ K der Ring [M]K ein Körper? (3) Gibt es ein Kriterium dafür, dass k ⊆ K einfach ist?
Übungen 1. 2.
3.
4.
√ √ Zeige, dass die Körper Q( 2) und Q( 3) nicht isomorph sind. Bestimme folgende Körpergrade: √ (a) [Q( 6) : Q], √ √ √ (b) [Q( 3, 5, 11) : Q], √ √ (c) [Q( 3 + 5) : Q]. √ √ Sei α1 eine reelle 3 2 und α2 eine nicht reelle 3 2. Zeige: (a) [Q(α1 ) : Q] = [Q(α2 : Q] = 3, (b) [Q(α1 , α2 ) : Q] = 6, (c) Q(α1 ) ∩ Q(α2 ) = Q. Seien x1 , . . . , x4 die Wurzeln (in C) von x 4 − 2x 2 + 2. Zeige: (a) Q(x1 , x2 ), Q(x1 , x3 ) und Q(x1 , x4 ) sind nicht alle isomorph. (b) Die Körper Q(x1 , x2 , x3 ) und Q(x1 , x2 , x3 , x4 ) sind isomorph.
3 Algebraische Erweiterungen Anstatt die Nullstellen eines einzelnen Polynoms f zu studieren, kann man auch die Gesamtheit der Elemente, die Nullstellen von Polynomen über einem festen Körper k sind, studieren. Eine interessante Frage ist z. B. die folgende: Ist a Nullstelle eines Polynoms über k und b Nullstelle eines Polynoms über k, ist dann auch a+b Nullstelle eines Polynoms über k? Diese und verwandte Fragen wollen wir in diesem Kapitel beantworten. Definition 3.1. Seien k ⊆ K eine Körpererweiterung und u ∈ K . Dann heißt u algebraisch über k, falls es ein Polynom 0 ≠ f ∈ k[x] mit f (u) = 0 gibt. Anderenfalls heißt u transzendent. Eine Erweiterung k ⊆ K heißt algebraisch, falls jedes Element aus K algebraisch über k ist. Der Schlüssel für viele Fragen über algebraische Erweiterungen ist der folgende Satz. Satz 3.2. Sei k ⊆ K eine Körpererweiterung mit [K : k] < ∞. Dann ist k ⊆ K algebraisch. Beweis. Sei [K : k] = n. Wir wählen u ∈ K beliebig. Dann sind 1, u, u2 , . . . , un i linear abhängig. Also ist n i=0 ai u = 0 für geeignete ai ∈ k, wobei nicht alle ai n gleich Null sind. Wenn wir p = i=0 ai x i setzen, so ist p ≠ 0 und p(u) = 0. Der nächste Satz klassifiziert die einfachen Erweiterungen und beantwortet die ersten beiden Fragen aus Kapitel 2. Satz 3.3. Sei K = k(u) eine einfache Erweiterung. Ist u transzendent über k, so ist K k(x), k(x) der Quotientenkörper des Polynomrings und [K : k] = ∞. Ist u algebraisch über k, so existiert ein eindeutig bestimmtes irreduzibles Polynom mu ∈ k[x] mit höchstem Koeffizienten 1 und mu (u) = 0. Es sind [K : k] = grad mu < ∞ und K = [k ∪ {u}]K k[x]/mu k[x]. Beweis. Sei M = k ∪ {u}. Wir bilden [M]K wie in Definition 2.1 und definieren eine Abbildung σ : k[x] → [M]K durch σ (p) = p(u)
für jedes p ∈ k[x].
Es ist σ ein Homomorphismus mit Bild σ =
n
ai ui | ai ∈ k, n ∈ N ∪ {0} = [M]K .
i=0
Ist p ∈ Kern σ , so ist 0 = σ (p) = p(u). Ist u transzendent, so ist p = 0, d. h. Kern σ = 0. Also ist σ ein Isomorphismus und k[x] [M]K . Dann ist k(u) k(x).
Algebraische Erweiterungen
41
Sei nun u algebraisch. Nach Satz 1.7 und Satz 1.33 ist Kern σ = mu k[x] für geeignetes mu ∈ k[x]. Weiter ist k[x]/mu k[x] [M]K nach Satz 1.7. Da u algebraisch ist, ist mu k[x] ≠ 0. Da σ ≠ 0 ist, ist mu k[x] ≠ k[x]. Also können wir annehmen, dass mu normiert und keine Einheit ist. Nun ist [M]K ein Integritätsbereich, da [M]K ⊆ K ist. Nach Definition 1.10 ist dann mu k[x] ein Primideal. Nach Lemma 1.17 ist mu irreduzibel, und nach Lemma 1.20 ist [M]K ein Körper. Insbesondere ist k(u) = [M]K . Wir zeigen jetzt, dass mu eindeutig bestimmt ist. Sei f irreduzibel und normiert mit f (u) = 0. Dann ist f ∈ Kern σ , d. h. mu teilt f . Da f irreduzibel ist, ist f = mu · e mit einer Einheit e, d. h. e ∈ k. Da f und mu normiert sind, folgt e = 1, d. h. f = mu . i i Sei also mu = n i=0 ai x mit an = 1. Es ist {u |∈ N ∪ {0}} ein Erzeugendenn−1 n i system für k(u). Da aber u = − i=0 ai u ist, ist sogar die Menge {1, u, . . . , un−1 } ein Erzeugendensystem für k(u). Insbesondere ist dann [k(u) : k] ≤ grad mu . Seien bi ∈ k, i = 0, . . . , n − 1, mit n−1
bi ui = 0.
i=0
i Wir setzen p = n−1 i=0 bi x . Dann ist p ∈ Kern σ . Also teilt mu das Polynom p . Da grad p < grad mu ist, folgt p = 0. Somit ist {1, . . . , un−1 } linear unabhängig, d. h. [k(u) : k] = grad mu .
Definition 3.4. Sei u algebraisch über k. Das gemäß Satz 3.3 eindeutig bestimmte Polynom mu ∈ k[x] nennen wir das Minimalpolynom von u. Bemerkung 3.5. Sei k ⊆ K eine Körpererweiterung. Wir betrachten wieder K als k-Vektorraum. Für u ∈ K , u algebraisch über k, definieren wir die lineare Abbildung αu von K mit αu v = uv
für v ∈ K.
Dann ist das Minimalpolynom von αu im Sinne der Linearen Algebra genau mu . Satz 3.6. Für eine endlich erzeugte Erweiterung K = k(u1 , . . . , un ) sind gleichwertig: (1) u1 , . . . , un sind algebraisch über k. (2) [K : k] ist endlich. (3) k ⊆ K ist algebraisch.
42
Algebraische Erweiterungen
Beweis. (1) ⇒ (2): Wir beweisen die Behauptung durch Induktion nach n. Für n = 1 steht die Behauptung in Satz 3.3. Sei also jetzt n > 1. Es ist offenbar K in dem Körper L = k(u1 , . . . , un−1 )(un ) enthalten. Nach Satz 2.5 ist [L : k] = [k(u1 , . . . , un−1 )(un ) : k(u1 , . . . , un−1 )] · [k(u1 , . . . , un−1 ) : k].
Per Induktion folgt jetzt die Behauptung. (2) ⇒ (3): Diese Aussage steht bereits in Satz 3.2. (3) ⇒ (1): Per Definition ist in einer algebraischen Erweiterung jedes Element algebraisch. Damit ist die eingangs gestellte Frage, ob aus a algebraisch und b algebraisch auch a + b algebraisch folgt, positiv beantwortet. Es gilt sogar der folgende allgemeinere Satz Satz 3.7. Ist k ⊆ K eine algebraisch erzeugte Erweiterung, so ist k ⊆ K algebraisch. Beweis. Sei M die Menge der algebraischen Elemente von K über k. Dann ist K = k(M). Nach Satz 2.2 gibt es für jedes u ∈ K eine endliche Teilmenge Eu von M mit u ∈ k(Eu ). Nach Satz 3.6 ist dann u algebraisch über k. Korollar 3.8. Die Menge A der über Q algebraischen Zahlen in C bilden einen Körper. Es ist A abzählbar, da es nur abzählbar viele Polynome über Q gibt, und C ist überabzählbar. Man würde erwarten, dass man viel mehr transzendente Zahlen kennt als algebraische. In Wirklichkeit ist nur für wenige, explizit gegebene reelle Zahlen wirklich bekannt, dass sie transzendent sind. Hierzu und für einen Beweis der Transzendenz von e und π siehe Kapitel B im Anhang. Lemma 3.9. Seien k ⊆ K ⊆ L zwei Körpererweiterungen. Seien weiter k ⊆ K algebraisch und u ∈ L. Dann ist u genau dann algebraisch über k, wenn u algebraisch über K ist. i Beweis. Sei u algebraisch über K und p = n i=0 ai x ∈ K[x] mit p(u) = 0. Es ist u algebraisch über k(a0 , . . . , an ) = K1 . Nach Satz 3.6 sind [K1 (u) : K1 ] < ∞ und auch [K1 : k] < ∞. Nach Satz 2.5 ist [K1 (u) : k] = [K1 (u) : K1 ][K1 : k] < ∞. Nach Satz 3.6 ist dann u algebraisch über k. Ist u algebraisch über k, so auch algebraisch über K , da k ⊆ K ist. Definition 3.10. Seien k1 und k2 Körper und σ : k1 → k2 ein Isomorphismus. Für n n f = i=0 ai x i ∈ k1 [x] setzen wir σ (f ) = i=0 σ (ai )x i ∈ k2 [x]. Das nächste Lemma wird für die spätere Entwicklung der Galoistheorie von entscheidender Bedeutung sein.
Algebraische Erweiterungen
43
Lemma 3.11. Seien k1 (u1 ) und k2 (u2 ) Körper und σ : k1 → k2 ein Isomorphismus. Sei n m1 = i=0 ai x i ∈ k1 [x] ein irreduzibles Polynom mit m1 (u1 ) = 0. Genau dann gibt es eine Fortsetzung τ : k1 (u1 ) → k2 (u2 ) von σ mit τ(u1 ) = u2 , falls σ (m1 )(u2 ) = 0 ist. In diesem Fall ist τ eindeutig bestimmt. Beweis. Gibt es eine Fortsetzung τ mit τ(u1 ) = u2 , so ist 0 = τ(0) = τ
n
n n ai ui1 = τ(ai )ui2 = σ (ai )ui2 = σ (m1 )(u2 ).
i=0
i=0
i=0
Sei umgekehrt σ (m1 )(u2 ) = 0. Ist u ∈ k1 (u1 ) beliebig, so gibt es ein 0 ≤ m < n mit u=
m
bi ui1
mit geeigneten bi ∈ k1 .
i=0
Wir definieren τ durch
m
τ(u) =
σ (bi )ui2 .
i=0
Wir zeigen zunächst, dass τ wohldefiniert ist. Sei dazu m
bi ui1 =
i=0
t
ci ui1 ,
0 ≤ t < n.
i=0
Wir können t ≥ m annehmen und dann bj = 0 für j = m + 1, . . . , t , setzen. Also ist t
t
bi ui1 =
i=0
ci ui1 ,
d. h.
0=
i=0
t
(bi − ci )ui1 .
i=0
Somit ist u1 Nullstelle von p=
t
(bi − ci )x i .
i=0
Nach Lemma 1.37 ist ggT(m1 , p) ≠ 1. Da m1 irreduzibel ist, ist m1 ein Teiler von p . Da t < n = grad m1 ist, folgt p = 0, d. h. bi = ci . Also ist τ wohldefiniert. Seien v1 =
m
bi ui1
und v2 =
i=0
r
ci ui1
i=0
zwei beliebige Elemente in k1 (u1 ), mit bi , i = 1, . . . , m, und ci , i = 1, . . . , r , geeignete Elemente in k1 . Wir können wieder r = m annehmen. Dann sind τ(v1 ) + τ(v2 ) =
m i=0
σ (bi )ui2 +
r i=0
σ (ci )ui2 =
m i=0
(σ (bi ) + σ (ci ))ui2 = τ(v1 + v2 )
44
Algebraische Erweiterungen
und τ(v1 )τ(v2 ) =
m
σ (bi )ui2
m
i=0
=
σ (ci )ui2
i=0
2m i
2m i σ (bj )σ (ci−j ) ui2 = σ bj ci−j ui2
i=0 j=0
i=0
j=0
= τ(v1 v2 ).
Somit ist τ ein Homomorphismus. Klar ist, dass τ ein Monomorphismus, σ = τ|k1 und τ(u1 ) = u2 ist. Es bleibt zu zeigen, dass τ ein Epimorphismus ist. Sei mu2 das Minimalpolynom von u2 über k2 . Es ist σ (m1 )(u2 ) = 0, also ist mu2 ein Teiler von σ (m1 ). Da grad σ (m1 ) = n ist, folgt grad mu2 ≤ n. Sei nun v=
t
di ui2 ∈ k(u2 ).
i=0
Wir können t < n annehmen. Wir wählen nun ai ∈ k1 mit σ (ai ) = di , i = 0, . . . , t . Dann ist v=τ
t
ai ui1 .
i=0
Also ist τ eine Fortsetzung. Es bleibt, die Eindeutigkeit zu zeigen. Seien τ1 und τ2 zwei Fortsetzungen, so ist τ1|k1 = τ2|k1 . Sei ti=0 bi ui1 ∈ k1 (u1 ). Jetzt erhalten wir τ1
t i=0
t t t bi ui1 = τ1 (bi )ui2 = τ2 (bi )ui2 = τ2 bi ui1 . i=0
i=0
i=0
Also ist τ1 = τ2 . Definition 3.12. Seien k ⊆ K1 und k ⊆ K2 zwei Körpererweiterungen. Wir nennen K1 und K2 k-isomorph (In Symbolen K1 k K2 ), falls es einen Körperisomorphismus τ : K1 → K2 mit τ|k = id gibt. Bisher hatten wir stets algebraische Erweiterungen in einem größeren Oberkörper betrachtet. Der nächste Satz gibt eine Möglichkeit zur Konstruktion von algebraischen Erweiterungen direkt aus dem Grundkörper ohne Benutzung von irgendwelchen Oberkörpern.
Algebraische Erweiterungen
45
Satz 3.13. Sei k ein Körper und q ∈ k[x] ein irreduzibles Polynom. Dann gibt es bis auf k-Isomorphie einen eindeutig bestimmten Erweiterungskörper K , der von einem Element u mit q(u) = 0 über k erzeugt wird. Es ist [K : k] = grad q. Sind insbesondere u1 , u2 Nullstellen von q, so ist k(u1 ) k(u2 ). Beweis. Wir setzen K = k[t]/qk[t]. Nach Lemma 1.20 ist K ein Körper. Indem wir {a + qk[t] | a ∈ k}
mit k identifizieren, können wir k ⊆ K annehmen. Hinsichtlich der Einbettung k ⊆ K erhalten wir q=
n
(ai + qk[t])x i ∈ K[x].
i=0
Wenn wir u = t + qk[t] setzen, so gilt q(u) =
n i=0
(ai + qk[t])(t + qk[t])i =
n
ai t i + qk[t] = qk[t].
i=0
Also ist u eine Nullstelle von q in K . Weiter ist offenbar K = k(u). Seien u1 und u2 zwei Nullstellen von q, K1 = k(u1 ) und K2 = k(u2 ). Sei σ die Identität auf k. Nach Lemma 3.11 gibt es dann eine Fortsetzung τ von σ mit τ : K1 → K2 . Also sind K1 und K2 k-isomorph. Da q irreduzibel ist, ist q = amu für ein geeignetes a ∈ k. Nach Satz 3.3 ist [K : k] = grad q. Der eben bewiesene Satz erlaubt es uns, einen Körper zu konstruieren, in dem q ei√ ne Nullstelle hat. Betrachten wir z. B. das Polynom q = x 2 − 2 über Q. Dann ist Q( 2) √ der eindeutig bestimmte Körper, in dem q eine Nullstelle hat. Wir haben soeben Q( 2) konstruiert, ohne die Kenntnis von R oder C. Selbst wenn wir nur Q kennen, können √ wir Q( 2) konstruieren. Wir müssen also nicht zunächst Q in einen Oberkörper einbetten, in dem q eine Nullstelle hat. Diese unabhängige Konstruktion wird später noch von großem Nutzen sei. Anknüpfend an Satz 3.13 erhalten wir: Satz 3.14. Sei k ein Körper und f ∈ k[x] vom Grad n. Dann gibt es eine Erweiterung K von k, so dass [K : k] ≤ n! ist, und f über K in Linearfaktoren zerfällt. Beweis. Sei α eine Nullstelle von f . Nach Satz 3.13 ist [k(α) : k] ≤ n. Nun wenden wir Induktion nach n auf g = (x − α)−1 f über k(α) an.
46
Algebraische Erweiterungen
Definition 3.15. Seien k und K Körper. (1) Ist k ⊆ K eine Körpererweiterung, so heißt K ein Zerfällungskörper einer Menge F ⊆ k[x] von nichtkonstanten Polynomen, wenn jedes Polynom aus F in K[x] in Linearfaktoren zerfällt und es eine Menge W ⊆ K gibt, die nur aus Nullstellen der Polynome aus F besteht, so dass K = k(W ) ist. (2) Der Körper K heißt algebraisch abgeschlossen, falls jedes nicht konstante Polynom f ∈ K[x] eine Nullstelle in K hat. ¯ von k ist eine algebraische Erweiterung von k, die (3) Ein algebraischer Abschluss k algebraisch abgeschlossen ist. Satz 3.14 besagt, dass jedes Polynom über einem Körper k einen Zerfällungskörper besitzt. Die Abschätzung für den Grad des Zerfällungskörpers scheint zunächst sehr schlecht zu sein. Wie wir später sehen werden (Satz 18.18), wird sie aber in einigen Fällen angenommen. Beispiele 3.16. √ (1) Q( 2) ist Zerfällungskörper für F = {x 2 − 2}. (2) C ist algebraisch abgeschlossen (siehe Kapitel A). Aber C ist nicht der algebraische Abschluss von Q (siehe Korollar 3.8). Es ergeben sich nun die folgenden Fragen (1) Sei F ⊆ k[x]. Gibt es einen Zerfällungskörper K von F ? (2) Gibt es einen algebraischen Abschluss K von k? (3) Sind die Körper K in (1) und (2) eindeutig bestimmt? Wir wollen zunächst die Eindeutigkeitsfrage angehen. Satz 3.17. Seien k1 , und k2 Körper und σ : k1 → k2 ein Isomorphismus. Seien weiter n m1 = i=0 ai x i ∈ k1 [x], m2 = σ (m1 ) ∈ k2 [x] und Ki Zerfällungskörper von mi über ki , i = 1, 2. Dann kann σ zu einem Isomorphismus Θ : K1 → K2 erweitert werden. Beweis. Wir beweisen den Satz durch Induktion nach n = grad m1 . Sei p = ti=0 bi x i t ein irreduzibler Teiler von m1 über k1 . Wir setzen q = i=0 σ (bi )x i . Dann teilt q das Polynom m2 . Seien a1 eine Nullstelle von p und a2 eine von q. Nach Lemma 3.11 gibt es eine Fortsetzung τ von σ auf k1 (a1 ) mit τ : k1 (a1 ) → k2 (a2 )
und τ(a1 ) = a2 .
Es sind m1 = (x − a1 )
n−1
ci x i
in k1 (a1 )[x]
i=0
und m2 = (x − τ(a1 ))
n−1 i=0
τ(ci )x i .
Algebraische Erweiterungen
47
Wir definieren g1 =
n−1
ci x i
und
g2 =
i=0
n−1
τ(ci )x i .
i=0
Dann ist Ki Zerfällungskörper von gi über ki (ai ), i = 1, 2. Es ist grad gi < n. Also gibt es per Induktion eine Fortsetzung Θ von τ mit Θ : K1 → K2 . Korollar 3.18. Seien K1 , K2 Zerfällungskörper über k für ein Polynom f ∈ k[x]. Dann sind K1 und K2 k-isomorph. Beweis. Die Behauptung folgt mit Satz 3.17, wobei σ die Identität auf k ist. Wir wollen uns nun dem allgemeinen Fall zuwenden. Satz 3.19. Seien k1 und k2 Körper und σ : k1 → k2 ein Isomorphismus. Seien F1 eine Teilmenge von k1 [x] und F2 = {σ (f ) | f ∈ F1 } ⊆ k2 [x]. Seien schließlich K1 , K2 Zerfällungskörper von F1 bzw. F2 über k1 bzw. k2 . Dann kann σ zu einem Isomorphismus Θ : K1 → K2 erweitert werden. Beweis. Sei S = {(kα , φα ) | k1 ⊆ kα ⊆ K1 , kα Körper, φα : kα → K2 ist Monomorphismus mit φα|k1 = σ }.
Wir definieren eine Halbordnung auf S durch (kα , φα ) ≤ (kβ , φβ ),
falls kα ⊆ kβ und φβ|kα = φα .
Da (k1 , σ ) ∈ S ist, ist S ≠ ∅. Sei K eine Kette in S. Wir definieren (k, τ) durch k= kα und τ = φα . (kα ,φα )∈K
(kα ,φα )∈K
Die letzte Definition macht Sinn, da wir φα als Teilmenge des kartesischen Produktes kα × K2 ⊆ K1 × K2 auffassen können. Klar ist, dass (k, τ) ∈ S eine obere Schranke von K ist. Nach dem Lemma von Zorn gibt es ein maximales Element (k0 , Θ) ∈ S. Wir zeigen k0 = K1 . Sei K1 ≠ k0 . Dann gibt es ein f1 ∈ F1 , so dass f1 nicht über k0 zerfällt. Da f1 über K1 zerfällt, enthält K1 einen Zerfällungskörper L1 von f1 über k0 . Sei W die Menge der Nullstellen von f1 . Dann ist L1 = k0 (W ). Setzen wir f2 = Θ(f1 ), so gibt es genauso in K2 einen Zerfällungskörper L2 von f2 . Nach Satz 3.17 gibt es eine Erweiterung Θ1 von Θ mit Θi : L1 → L2 . Also ist (k0 , Θ) ≤ (L1 , Θ1 ) ∈ S und (k0 , Θ) ≠ (L1 , Θ1 ). Das widerspricht der Maximalität von (k0 , Θ).
48
Algebraische Erweiterungen
Also ist k0 = K1 . Dann ist aber Θ(K1 ) ein Zerfällungskörper von {Θ(f ) | f ∈ F1 } = {σ (f ) | f ∈ F1 } = F2 .
Die Definition des Zerfällungskörpers liefert Θ(K1 ) = K2 . Damit haben wir die Frage nach der Eindeutigkeit von Zerfällungskörpern behandelt. Die Existenzfrage bleibt offen. Wir wenden uns nun zunächst dem größten Zerfällungskörper, dem algebraischen Abschluss, zu. Wir werden zeigen, dass es stets einen solchen algebraischen Abschluss gibt. Dazu wollen wir aber erst einige äquivalente Bedingungen zu der Eigenschaft algebraisch abgeschlossen zu sein angeben. Satz 3.20. Sei k ein Körper. Gleichwertig sind: ¯. (1) k = k (2) Zu jedem nicht konstanten Polynom f ∈ k[x] existiert ein a ∈ k mit f (a) = 0. (3) k hat keine endlichen Erweiterungen ungleich k. (4) Die irreduziblen Polynome in k[x] sind linear. Beweis. (1) ⇒ (2): Dies ist Definition 3.15(2). (2) ⇒ (3): Sei a algebraisch über k und ma das Minimalpolynom zu a. Dann ist ma irreduzibel. Nach (2) hat ma eine Nullstelle in k. Da ma irreduzibel ist, folgt grad ma = 1, d. h. ma = x − a ∈ k[x]. Somit ist a ∈ k und k hat keine algebraischen Erweiterungen ungleich k. Nach Satz 3.2 hat k dann auch keine endlichen Erweiterungen ungleich k. (3) ⇒ (4): Sei f irreduzibel und grad f = n. Nach Satz 3.13 hat k eine algebraische Erweiterung K mit [K : k] = n = grad f . Nach (3) ist dann grad f = 1. (4) ⇒ (1): Sei f ein nicht konstantes Polynom in k[x]. Wegen Satz 1.33 ist dann f = p1 · · · pr mit irreduziblen pi . Es ist p1 = ax + b nach (4). Also hat f eine Nullstelle in k. Nun folgt (1) mit Definition 3.15(2). Satz 3.21. Ist K der Zerfällungskörper von k[x], so ist K ein algebraischer Abschluss von k. Beweis. Sei L eine algebraische Erweiterung von K . Nach Lemma 3.9 ist L algebraisch über k. Sei nun u ∈ L und mu das Minimalpolynom von u in k[x]. Nach Annahme gilt in K[x], dass mu = (x − ui )ni ist. Also ist u ∈ K , d. h. L = K . Mit Satz 3.20 folgt, dass K algebraisch abgeschlossen ist. Korollar 3.22. Seien K1 und K2 algebraische Abschlüsse von k. Dann gibt es einen Isomorphismus Θ : K1 → K2 mit Θ(a) = a für alle a ∈ k. Beweis. Ein algebraischer Abschluss ist ein Zerfällungskörper für F = k[x]. Nun folgt die Behauptung mit Satz 3.19.
Algebraische Erweiterungen
49
Damit reduziert sich die Beantwortung unserer Fragen auf den Beweis der Existenz eines algebraischen Abschlusses. Dieses ist im wesentlichen ein mengentheoretisches ¯ bekommen. Problem. Wir wollen zunächst eine Vorstellung von der Größe von k Satz 3.23. Seien k ein Körper und K eine algebraische Erweiterung von k. Ist |k| < ∞, ¯, so ist |K| = ℵ0 . so ist |K| ≤ ℵ0 . Ist |k| = ∞, so ist |k| = |K|. Ist |k| < ∞ und K = k Beweis. Es ist offenbar |k[x]| = |k|ℵ0 . Insbesondere ist |k[x]| = ℵ0 , falls |k| < ∞ ist, und |k[x]| = |k| sonst. Sei nun a ∈ K . Dann ist a Nullstelle eines Polynoms in k[x], da k ⊆ K algebraisch ist. Weiter hat jedes Polynom nur endlich viele Nullstellen. Ist |k| = ∞, so gilt |k| ≤ |K| ≤ ℵ0 |k[x]| = |k[x]| = |k|. ¯ < ∞, so betrachten wir Ist |k| < ∞, so ist |K| ≤ ℵ0 . Wäre |k| f = (x − a) + 1. ¯ a∈k
¯, ein Widerspruch. Also ist |k| ¯ = ℵ0 . Dann hat f keine Nullstelle in k
Satz 3.24. Jeder Körper k hat einen algebraischen Abschluss. Beweis. Das Problem bei diesem Beweis ist, dass man nicht einfach die Menge aller algebraischen Erweiterungen von k betrachten und darin eine maximale suchen kann, da dies vielleicht gar keine Menge ist. Wir müssen also etwas vorsichtiger vorgehen. Wir suchen eine Menge S mit |S| > |k|, bzw. die überabzählbar ist, falls |k| endlich ist, so dass k in S enthalten ist. Ein Satz der Mengenlehre sagt, dass es so etwas gibt. (Mit der richtigen Interpretation z.B. S = k ∪ P (k) ∪ R.) ˆ = (K, +K , ·K ), so dass k ⊆ K ⊆ S ist, +K und ·K FortSei S die Menge aller K setzungen der Addition und Multiplikation von k sind und k ⊆ K eine algebraische Körpererweiterung ist. Wir definieren auf S eine Halbordnung ≤S durch ˆ2 , ˆ1 = (K1 , +K1 , ·K1 ) ≤S (K2 , +K2 , ·K2 ) = K K
falls K1 ⊆ K2 und +K1 , ·K1 Einschränkungen von +K2 , ·K2 sind, d. h. K1 ist Unterkörper von K2 . Dadurch, dass alle K in S enthalten sind, ist S eine Menge. Da (k+, ·) ∈ S ist, ist S ≠ ∅. Sei K eine Kette in S. Wir setzen L = K∈K K . Dann ist L ⊆ S . Sind x, y ∈ L, so ˆ ˆ ∈ K mit x, y ∈ K . Wir definieren x +L y = x +K y und x ·L y = x ·K y . gibt es ein K ˆ1 , K ˆ1 ≤S K ˆ2 oder K ˆ2 ≤S K ˆ1 gilt, d. h. K1 ist ˆ2 ∈ K stets K Da für je zwei Elemente K Unterkörper von K2 oder umgekehrt, ist die Definition von +L und ·L von der Wahl
50
Algebraische Erweiterungen
des Körpers K unabhängig. Also ist L mit +L , ·L ein Körper. Ist u ∈ L, so gibt es ˆ ∈ K mit u ∈ K . Also ist u algebraisch über k. Somit ist k ⊆ L algebraisch ein K ˆ = (L, +L , ·L ) ∈ S. Nach dem Lemma von Zorn gibt es ein maximales Element und L ˆ M = (M, +M , ·M ) ∈ S. Wir zeigen, dass M ein algebraischer Abschluss von k ist. Dazu wollen wir Satz 3.20(3) benutzen. Sei N eine Erweiterung von M mit [N : M] = n < ∞. Dann ist |N| = |M|, bzw. |N| ≤ ℵ0 für |M| < ∞, nach Satz 3.23. Also ist |S| > |N|. Dann gibt es eine Injektion σ : N → S mit σ|M = id. Sei F = Bild σ . Wir definieren auf F eine Körperstruktur durch: x + y = σ σ −1 (x) + σ −1 (y) xy = σ σ −1 (x)σ −1 (y) . Man kann nun nachrechnen, dass F damit ein Körper wird. Wir wollen dies exemplarisch für (xy)z = x(yz) durchführen. Es gilt: −1 σ (x)σ −1 (y) σ −1 (z) = σ −1 (x) σ −1 (y)σ −1 (z) , da N ein Körper ist. Also ist σ −1 σ (σ −1 (x)σ −1 (y)) σ −1 (z) = σ −1 (x) σ −1 σ (σ −1 (y)σ −1 (z)) und . σ σ −1 σ (σ −1 (x)σ −1 (y)) σ −1 (z) = σ σ −1 (x) σ −1 σ (σ −1 (y)σ −1 (z)) Nach Definition der Multiplikation in F gilt dann σ σ −1 (x)σ −1 (y) z = xσ σ −1 (y)σ −1 (z) und weiter (xy)z = x(yz).
Mit dieser Definition der Verknüpfungen auf F gilt σ (a)σ (b) = σ σ −1 (σ (a))σ −1 (σ (b)) = σ (ab) und
σ (a) + σ (b) = σ σ −1 (σ (a)) + σ −1 (σ (b)) = σ (a + b).
Also ist σ ein Isomorphismus zwischen N und F . Sei nun a ∈ F . Dann ist σ −1 (a) ∈ N . Also ist σ −1 (a) algebraisch über M , und i es gibt ein 0 ≠ f ∈ M[x] mit f (σ −1 (a)) = 0. Sei f = n i=0 ai x . Dann ist n n n 0= ai σ −1 (a)i = σ −1 (ai )σ −1 (a)i = σ −1 ai ai . i=0
σ|M =id
i=0
i=0
Das liefert f (a) = 0. Somit ist a algebraisch über M , und M(a) ⊆ F ⊆ S ist eine algebraische Erweiterung von M . Damit ist M(a) auch eine algebraische Erweiterung von k nach Lemma 3.9. Da σ die Identität auf k ist, setzen die auf F definierten Verknüpfungen diejenigen von k fort. Also ist (M(a), +M(a) , ·M(a) ) ∈ S. Da
Algebraische Erweiterungen
51
σ|M = id ist, ist (M, +M , ·M ) ≤S (M(a), +M(a) , ·M(a) ). Da (M, +M , ·M ) maximal ist, folgt M(a) = M , was M = F liefert. Da σ ein Isomorphismus ist, folgt nun auch N = M und mit Satz 3.20, dass M ein algebraischer Abschluss von k ist.
Satz 3.25. Sei k ein Körper. Jede Menge F ⊆ k[x] von nicht konstanten Polynomen hat einen bis auf k-Isomorphie eindeutig bestimmten Zerfällungskörper. ¯ ein algebraischer Abschluss von k und W die Menge der Nullstellen der Beweis. Sei k ¯. Dann ist k(W ) ⊆ k ¯ und k(W ) ist ein Zerfällungskörper von F . Polynome aus F in k Die Eindeutigkeit folgt mit Satz 3.19.
Beispiele 3.26. (1) Sei f = (x 2 − 3)(x 3 + 1) ∈ Q[x]. Wir bestimmen den Zerfällungskörper in C. Es ist √ √ −1 − i 3 −1 + i 3 x− . f = (x + 3)(x − 3)(x + 1) x − 2 2 √ √ √ 3 = Q( 3, i) ein Zerfällungskörper. Also ist Q 3, −1+i 2 √ (2) Sei f = (x 2 − 2x − 2)(x 2 + 1) ∈ Q[x]. Die Nullstellen von f in C sind 1 ± 3 √ und ±i. Also ist Q( 3, i) auch ein Zerfällungskörper von f . √ (3) Q( 3) ist Zerfällungskörper für f = t 2 − 3 und f = t 2 − 2t − 2.
Die Beispiele (1)–(3) zeigen, dass ein Zerfällungskörper die Menge F nicht eindeutig bestimmt. (4) Sei f = x 2 + x + 1 ∈ GF(2)[x]. Nun können wir nicht C benutzen, um den Zerfällungskörper zu berechnen. Zunächst zeigen wir, dass f irreduzibel ist. Ein Teiler hätte Grad 1. Es ist aber f (0) = 1 = f (1), d. h. f hat keine Nullstelle in GF(2). Sei α eine Nullstelle in GF(2). Dann gilt α2 = 1 + α. Es ist (α + 1)2 + α + 1 + 1 = 0.
Somit ist mit α auch α + 1 eine Nullstelle von f und GF(2)(α) = {0,1, α, 1 + α}
ist ein Zerfällungskörper. Zum Abschluss wollen wir auf die dritte Frage aus Kapitel 2 eine teilweise Antwort geben.
52
Algebraische Erweiterungen
Satz 3.27. Sei k ein unendlicher Körper und k ⊆ K eine algebraische Erweiterung. Dann ist die Erweiterung genau dann einfach, wenn es nur endlich viele Zwischenkörper L mit k ⊆ L ⊆ K gibt. Beweis. Sei K = k(α) und m das Minimalpolynom von α über k. Seien weiter g ∈ K[x] ein Teiler von m und L1 der von den Koeffizienten von g erzeugte Teilkörper von K . Da m nur endlich viele Teiler besitzt, erhalten wir so endlich viele Zwischenkörper. Wir wollen zeigen, dass dies alle sind. Sei also k ⊆ L ⊆ K ein Zwischenkörper und g das Minimalpolynom von α über L. Dann sind g(α) = 0 und m(α) = 0. Also teilt g das Polynom m in L[x] und dann auch in K[x]. Zu jedem Zwischenkörper L gehört also ein Teiler von m ∈ K[x]. Sei L1 der von den Koeffizienten von g erzeugte Körper. Es ist L1 (α) = K und L1 ⊆ L. Weiter ist g irreduzibel über L1 und L. Also ist nach Satz 3.13 [K : L1 ] = grad g = [K : L]. Das liefert L = L1 . Somit sind genau die von den Koeffizienten der Teiler von m erzeugten Körper alle Zwischenkörper. Damit gibt es nur endlich viele. Es gebe nun umgekehrt nur endlich viele Zwischenkörper. Dann ist die Menge {k(α) | α ∈ K} endlich. Wir wählen α ∈ K mit [k(α) : k] maximal und wollen dafür K = k(α) zeigen. Sei dies nicht so. Dann wählen wir ein β ∈ K\k(α). Wir betrachten die Menge {k(α + r β) | r ∈ k} = N .
Da |k| = ∞ und |N | < ∞ ist, gibt es nach dem Schubfachprinzip s, t ∈ k mit s ≠ t und k(α + sβ) = k(α + tβ). Also ist β = (s − t)−1 [(α + sβ) − (α + tβ)] ∈ k(α + sβ).
Dann ist k(α + sβ) = k(α, β) ⊃ k(α),
ein Widerspruch. Das zeigt K = k(α). Wir werden später sehen (Satz 5.40), dass dieser Satz auch für endliches k gilt. Was uns allerdings weiterhin fehlt, ist ein Kriterium dafür, wann es nur endlich viele Zwischenkörper gibt. Ein hinreichendes Kriterium dafür werden wir erst im Rahmen der Galoistheorie geben können.
Algebraische Erweiterungen
53
Übungen 1.
2.
3.
4. 5.
Finde Gegenbeispiele oder beweise: (a) Jeder Körper hat Erweiterungen. (b) Jeder Körper hat nichttriviale algebraische Erweiterungen. (c) Jede einfache Erweiterung ist algebraisch. (d) Jede algebraische Erweiterung ist einfach. (e) Alle einfachen algebraischen Erweiterungen eines Körpers sind isomorph. Sei K ⊆ L eine Körpererweiterung. Zeige: L ist genau dann algebraisch über K , wenn jeder Ring R mit K ⊆ R ⊆ L, so dass die Operationen auf R Einschränkungen der Operationen auf L sind, ein Körper ist. Seien K , M1 und M2 Teilkörper eines Körpers L. Es sei M1 ⊇ K ⊆ M2 und L = M1 (M2 ). Weiter sei [L : K] < ∞. Dann gilt: (a) [L : K] ≤ [M1 : K][M2 : K]. (Benutze Aufgabe 2.) (b) Ist [L : K] = [M1 : K][M2 : K], so ist M1 ∩ M2 = K . (c) Ist M1 ∩ M2 = K und [M1 : K] = 2, so gilt [L : K] = [M1 : K][M2 : K]. (d) Im allgemeinen gilt nicht, dass [L : K] = [M1 : K][M2 : K] ist, falls M1 ∩ M2 = K ist. Seien σ : L → σ (L) ein Körperisomorphismus und K ⊆ L ein Teilkörper. Zeige, dass [L : K] = [σ (L) : σ (K)] gilt. (Siehe Bemerkung 3.5) Seien L eine algebraische Erweiterung eines Körpers K und α ∈ L. Definiere nun Sα : L → L durch Sα (β) = αβ.
Dann gilt: (a) Sα ist eine K -lineare Abbildung. (b) Das in Definition 3.4 definierte Polynom mα ist auch das Minimalpolynom von Sα im Sinne der Linearen Algebra. 6. Seien K ein Körper und L eine Erweiterung vom Grad 2 von K . Zeige: (a) Ist char K ≠ 2, so gibt es ein α ∈ L mit L = K(α) und mα = x 2 − a für geeignetes a ∈ K . (b) Ist char K = 2, so ist entweder für jedes α ∈ L\K stets mα = x 2 + a für geeignetes a ∈ K , oder es gibt ein α ∈ L mit mα = x 2 + x + a für geeignetes a ∈ K . 7. Sei L eine Erweiterung vom Grad m eines Körpers K . Sei f ∈ K[x] irreduzibel vom Grad n. Sind m und n teilerfremd, so ist f irreduzibel in L[x]. 8. Seien K1 = Q(α) mit mα = x 2 − 2 und K2 = Q(β) mit mβ = x 2 − 4x + 2. Zeige: K1 K2 . √ 9. Seien L = Q(x) der Quotientenkörper des Polynomrings Q[x], M = Q(x, i) mit i = −1 und L1 = Q(x + i). Dann sind L ⊆ M und L1 ⊆ M algebraisch. Zeige, dass K ⊆ M für K = L ∩ L1 nicht algebraisch ist. 10. Seien a1 , . . . , an paarweise verschiedene ganze Zahlen. Zeige: f =1+
n
(x − ai )2 ist irreduzibel in Z[x].
i=0
(Hinweis. Sei g ein normierter Primteiler von f mit grad g ≤ n. Folgere mit dem Zwischenwertsatz und Einsetzen geeigneter Werte g = n i=1 (x − ai ) ± 1.) 3 11. Sei f = x + px + q ∈ Q[x]. Die Nullstellen von f seien α1 , α2 , α3 . 2 (a) Berechne d = (α1 − α2 )(α2 − α3 )(α3 − α1 ) mit Hilfe der Koeffizienten von f . (b) Es sei L ein Zerfällungskörper von x 3 − 2x + 2 über Q. Zeige, dass [L : Q] = 6 ist. 12. Sei f = x 4 + x 2 + 1 ∈ Q[x]. Bestimme einen Zerfällungskörper von f . 13. Sei K der Zerfällungskörper von x 3 − 7 über Q. Bestimme ein α ∈ K mit K = Q(α) und das Minimalpolynom von α.
54
Algebraische Erweiterungen
14. Bestimme einen Zerfällungskörper von f = x 3 + 2x + 1 ∈ GF(3)[x] über GF(3) und zerlege f in Linearfaktoren. 15. Sei f ∈ K[x] mit grad f = n. Sei L ein Zerfällungskörper von f . Dann ist [L : K] ein Teiler von n!. 16. Seien |K| = ∞ und L = K(t) eine transzendente Erweiterung des Körpers K . Zeige, dass L unendlich viele K -Automorphismen besitzt. 17. Seien L = K(α) und [L : K] = n. Dann ist die Anzahl der Körper M mit K ⊆ M ⊆ L höchstens 2n−1 . 18. Seien K = GF(p) und L = K(x, y) der Quotientenkörper des Polynomrings in zwei Variablen. Zeige: (a) [L : K(x p , y p )] = p 2 . (b) Es gibt unendlich viele Zwischenkörper zwischen L und K(x p , y p ).
4 Konstruktionen mit Zirkel und Lineal Nach Platon1 gibt es nur zwei perfekte geometrische Figuren, den Kreis und die Gerade. Dieser philosophische Hintergrund veranlasste die Griechen dazu, zur Konstruktion geometrischer Figuren nur Zirkel und Lineal zu erlauben. Dabei ist das Lineal unmarkiert, eine wichtige Einschränkung. Immerhin kann man mit diesen Hilfsmitteln eine Reihe von Konstruktionen ausführen. Geraden können in beliebig viele gleiche Teile geteilt werden, Winkel können halbiert, Quadrate verdoppelt, Parallelen gezogen werden usw. Aber es gibt Probleme, die intuitiv lösbar sein sollten, es aber doch nicht sind. Es gibt drei berühmte Probleme, die die Griechen nicht lösen konnten: die Verdoppelung des Würfels, die Dreiteilung des Winkels und die Quadratur des Kreises. Die Lösung dieser Probleme ist unmöglich, wie wir zeigen werden. Wenn man das platonische Konzept verlässt, so können diese Probleme gelöst werden, was schon den Griechen bekannt war. Wir werden das für die Dreiteilung des Winkels zeigen. Mit unseren bisherigen Methoden ist es nicht schwer, diese Probleme negativ zu entscheiden. Dazu müssen wir nur die geometrischen Fragestellungen in die algebraische Sprache übersetzen. Allerdings gibt es auch andere Probleme wie z. B. die Konstruktion des regelmäßigen n-Ecks. Hier liegen die Dinge nicht so einfach. Das regelmäßige n-Eck ist für einige n konstruierbar und für einige nicht. So ist das 7-Eck nicht konstruierbar, aber das 17-Eck kann konstruiert werden, wie Gauß bewies. Die Konstruierbarkeit können wir aber mit unseren Methoden noch nicht beweisen, dazu muss erst die Theorie weiterentwickelt werden. In Kapitel 11 werden wir uns dann mit der Konstruktion von n-Ecken beschäftigen. Wir beginnen mit der Übersetzung der Geometrie in die Sprache der Algebra. Sei P0 ⊆ {(x, y) | x, y ∈ R} eine Punktmenge. Wir betrachten folgende Operationen: (1) Lineal: Durch je zwei Punkte von P0 ziehe eine Gerade. (2) Zirkel: Ziehe einen Kreis um einen Punkt aus P0 , wobei der Radius der Abstand zwischen zwei Punkten aus P0 ist. Definition 4.1. Sei P0 eine Teilmenge von R2 . (1) Die Schnittpunkte von Geraden und Kreisen, die mit den Operationen (1) und (2) gezeichnet wurden, heißen im ersten Schritt aus P0 konstruierbare Punkte. (2) Einen Punkt r ∈ R2 nennen wir konstruierbar von P0 aus, falls es eine Kette r1 , . . . , rn = r von Punkten ri ∈ R2 gibt, so dass ri im ersten Schritt aus der Punktmenge P0 ∪ {r1 , . . . , ri−1 }, i = 1, . . . , n, konstruierbar ist.
1 Platon, * 427 v. Chr. Athen. † 347 v. Chr. Athen, griechischer Philosoph, Schüler des Sokrates. Gründer einer eigenen Lehrstätte. Hauptarbeitsgebiete: Theorie der Proportionen, Theorie der irrationalen Größen, Theorie der fünf regulären Körper. Er hinterließ fundamentale arithmetische und geometrische Definitionen und entwickelte ein Programm zur Axiomatisierung der Geometrie.
56
Konstruktionen mit Zirkel und Lineal
Q2
P1
P2
Q1
(1) (2) (3) (4) (5) (6)
Ziehe die Gerade P1 P2 . Schlage den Kreis um P1 mit Radius P1 P2 . Schlage den Kreis um P2 mit Radius P1 P2 . Die beiden Kreise schneiden sich in Q1 und Q2 . Bilde P˜0 = P0 ∪ {Q1 , Q2 }. Ziehe die Gerade Q1 Q2 . Bilde den Schnittpunkt Q1 Q2 ∩ P1 P2 . Dieser ist der gesuchte Mittelpunkt.
Beispiel 4.2. Konstruktion des Mittelpunktes. Seien P1 , P2 ∈ R2 . Wir setzen P0 = {P1 , P2 }.
Wir wollen nun unsere bereits gewonnenen Resultate über Körper auf Konstruktionsprobleme anwenden. Jedem Stadium der Konstruktion ordnen wir den Unterkörper von R zu, der von allen Koordinaten der bis dahin konstruierten Punkte erzeugt wird. Sei K0 der Unterkörper von R, der von den Koordinaten der Punkte von P0 erzeugt wird. Induktiv gehört dann zu ri = (xi , yi ) der Körper Ki = Ki−1 (xi , yi ). Also erhalten wir eine Kette K0 ⊆ K1 ⊆ · · · ⊆ Kn ⊆ R. Diese Bezeichnungen halten wir im Rest dieses Kapitels fest.
Konstruktionen mit Zirkel und Lineal
57
Lemma 4.3. Sei ri = (xi , yi ). Dann sind xi , yi Nullstellen quadratischer Polynome über Ki−1 . Beweis. Es gibt 3 Fälle: Gerade schneidet Gerade, Gerade schneidet Kreis, Kreis schneidet Kreis. Wir wollen exemplarisch Gerade schneidet Kreis vorführen. Die anderen Fälle seien dem Leser zur Übung überlassen. B (p, q) A |
|
(s1 , s2 )
(r , s)
(t1 , t2 )
C
Seien A, B und C drei Punkte mit den Koordinaten (p, q), (r , s) und (t, u), wobei p , q, r , s , t , u ∈ Ki−1 sind. Wir haben die Gerade AB und den Kreis um C mit Radius w . Dabei ist w der Abstand zweier Punkte (s1 , s2 ) und (t1 , t2 ) aus Pi−1 , mit s1 , s2 , t1 , t2 ∈ Ki−1 . Dann gilt nach Pythagoras (s1 − t1 )2 + (t2 − s2 )2 = w 2 .
Also ist w 2 ∈ Ki−1 . Bekanntlich ist die Gleichung der Gerade AB : (x − p)/(r − p) = (y − q)/(s − q).
(1)
Die Gleichung des Kreises ist: (x − t)2 + (y − u)2 = w 2 .
(2)
(1) und (2) liefern für den Schnittpunkt 2 (s − q) (x − p) + q − u = w 2 . (x − t)2 + (r − q) Also sind x und y Nullstellen einer quadratischen Gleichung. Bemerkung. Geht man naiv wie in obigem Beweis vor, so erhält man, dass die Koordinaten des Durchschnitts zweier Kreise Nullstellen von Polynomen vom Grad vier sind. Man kann aber den Durchschnitt zweier Kreise auf den Durchschnitt eines Kreises und einer Geraden zurückführen. So ist der Durchschnitt der Kreise x2 + y 2 = r 2
und
(x − u)2 + (y − v)2 = t 2
auch Durchschnitt von x2 + y 2 = r 2
mit der Geraden 2ux + 2vy − r 2 − u2 − v 2 + t 2 = 0.
58
Konstruktionen mit Zirkel und Lineal
Satz 4.4. Sei r = (x, y) konstruierbar von P0 und K0 der zu P0 gehörige Körper. Dann sind [K0 (x) : K0 ] und [K0 (y) : K0 ] Potenzen von 2. Beweis. Sei r1 , . . . , rn = r eine Kette nach r mit ri = (xi , yi ) gemäß Definition 4.1(b). Nach Lemma 4.3 und Satz 3.13 ist [Ki−1 (xi ) : Ki−1 ] = 1 oder 2 und genauso erhalten wir [Ki−1 (yi ) : Ki−1 ] = 1 oder 2. Nun ist [Ki−1 (xi , yi ) : Ki−1 (xi )][Ki−1 (xi ) : Ki−1 ] = 1, 2 oder 4.
Also ist [Ki : Ki−1 ] eine 2-Potenz. Eine Induktion liefert, dass [Kn : K0 ] eine 2-Potenz ist. Wegen [Kn : K0 (x)][K0 (x) : K0 ] = [Kn : K0 ]
ist auch [K0 (x) : K0 ] eine 2-Potenz. Satz 4.4 gibt uns nun ein notwendiges Kriterium für die Konstruierbarkeit mit Zirkel und Lineal in die Hand, mit dem wir die drei klassischen Konstruktionsprobleme (Verdoppelung des Würfels, Dreiteilung des Winkels, Quadratur des Kreises) negativ entscheiden können. Allerdings können wir damit noch nicht zeigen, dass gewisse Probleme positiv gelöst werden können. In diesem Fall müssen wir noch immer eine Konstruktion angeben. Erst die Galoistheorie wird uns in Kapitel 11 genügend Hilfsmittel zur Verfügung stellen, so dass wir ein notwendiges und hinreichendes Kriterium haben. Satz 4.5. Die Verdoppelung des Würfels ist nicht möglich. Beweis. Es sei ein Würfel mit seinen Seiten gegeben. Wir können annehmen, dass eine Kante die Strecke (0, 0)(1, 0) ist. Falls wir diesen Würfel verdoppeln können, so kön√ nen wir aus P0 = {(0, 0), (1, 0)} den Punkt ( 3 2, 0) konstruieren. Also ist nach Satz 4.4 √ 3 [Q( 2) : Q] eine 2-Potenz. Aber x 3 − 2 ist irreduzibel über Q nach Satz 1.48 und √ somit ist [Q( 3 2) : Q] = 3 nach Satz 3.13, ein Widerspruch. Satz 4.6. Der Winkel 60° = π /3 kann nicht gedrittelt werden. Beweis. Die Konstruktion ist äquivalent dazu, dass (α, 0) mit α = cos(π /9) konstruierbar ist. Dann ist auch (β, 0) mit β = 2 cos(π /9) konstruierbar. Also ist [Q(β) : Q] eine 2-Potenz nach Satz 4.4.
59
Konstruktionen mit Zirkel und Lineal
π 9
(0, 0)
(1, 0)
Nun gilt cos(π /3) = 4 cos3 (π /9) − 3 cos(π /9)
d. h. 1 2
= 12 β3 − 32 β
oder
β3 − 3β − 1 = 0.
Es ist x − 3x − 1 irreduzibel, da nach Substitution (x + 1)3 − 3(x + 1) − 1 = x 3 + 3x 2 − 3
nach Satz 1.48 irreduzibel ist. Der Widerspruch folgt nun wieder mit Satz 3.13. Satz 4.7. Die Quadratur des Kreises mit Zirkel und Lineal ist nicht möglich. Beweis. Dies beruht darauf, dass π nicht algebraisch ist. Siehe dazu Satz B.2. Beispiel 4.8. (siehe [52] Aufgabe 5.3) Wir wollen hier sehen, dass, wenn wir die Hilfsmittel nur ein wenig erweitern, wir z. B. die Dreiteilung eines Winkels durchführen können. Zugelassen sei der Zirkel und ein handelsübliches Lineal (d. h. wir benötigen eine Markierung) r . Die Markierung sei im Abstand r . Gegeben sei der Winkel AOB = θ . Die folgende Konstruktion liefert den Winkel θ/3. A X E θ B
θ 3
O
Y
D
60
Konstruktionen mit Zirkel und Lineal
(1) Wir tragen den Radius r auf dem markierten Lineal ab. Nun schlagen wir einen Kreis mit dem Radius r um O . Das liefert die Schnittpunkte X , Y . (2) Wir legen das Lineal durch X mit einer Markierung D auf BY und verschieben es so lange, bis die andere Markierung E auf dem Kreis ist. Dann ist der Winkel EDO gleich θ/3. Beweis. Sei γ der Winkel EOD und α der Winkel EXO . Da das Dreieck OXE gleichschenklig ist, ist der Winkel XEO gleich α. Also ist der Winkel XOE gleich π −2α. Es folgt dann π = θ+γ+π −2α, d. h. 2α = θ+γ . Aber auch das Dreieck OED ist gleichschenklig. Also ist der Winkel EDO gleich γ und somit π − α = π − 2γ . Das liefert α = 2γ und 2α = 4γ , d. h. θ = 3γ .
Übungen 1.
2. 3.
4.
Konstruiere mit Zirkel und Lineal: √ √ (a) 5 und 7 nur unter Verwendung des Satzes von Pythagoras;2 (b) zu vorgegebener Gerade und vorgegebenem Punkt die Parallele durch diesen Punkt. Zeige, dass nicht jeder konstruierbare Winkel mit Zirkel und Lineal in fünf gleiche Teile zerlegt werden kann. (a) Seien α1 , α2 , α3 transzendente Zahlen. Zeige: α1 + α2 + α3 , α1 α2 + α2 α3 + α3 α1 und α1 α2 α3 können nicht alle algebraisch sein. (b) e und π sind transzendent. Folgere daraus: e + π oder e · π ist nicht algebraisch. (Offen ist, ob e + π oder e · π algebraisch ist!) Behandle die Restfälle aus Lemma 4.3.
2 Pythagoras, * um 560 v. Chr. Samos, † um 480 v. Chr. Metapont, Führer einer mystischen Sekte. Authentische Berichten über sein Leben sind nicht überliefert.
5 Gruppen Die Idee der Galoistheorie ist es, Verbindungen zwischen Körpern und ihren Automorphismengruppen herzustellen. Bevor wir dies wirklich effektiv machen können, müssen wir einiges über Gruppen wissen. Die für die Entwicklung und Anwendung der Galoistheorie notwendigen Resultate sollen in diesem Kapitel bereitgestellt werden. Die Begriffe Gruppe und Untergruppe setzen wir als bekannt voraus. Definition 5.1. Seien G eine Gruppe und U eine Untergruppe von G. Ist g ∈ G, so setzen wir gU = {gu | u ∈ U}
und U g = {ug | u ∈ U}.
Wir nennen gU eine Linksnebenklasse und U g eine Rechtsnebenklasse von U in G. Lemma 5.2. Seien G eine Gruppe und U eine Untergruppe von G. Dann ist G= gU = Ug. g∈G
g∈G
Sind g1 und g2 in G mit g1 U ∩ g2 U ≠ ∅, so ist g1 U = g2 U (entsprechend gilt auch: U g1 ∩ U g2 ≠ ∅ liefert Ug1 = U g2 ). Weiter ist g1 U = g2 U genau für g1−1 g2 ∈ U . Beweis. Wir beweisen die Behauptung nur für Linksnebenklassen. Für die Rechtsnebenklassen geht der Beweis analog. Ist g ∈ G, so ist g ∈ gU . Also ist G= gU . g∈G
Sei nun g1 U ∩ g2 U ≠ ∅. Dann ist g1 u1 = g2 u2 für geeignete u1 , u2 ∈ U . Sei h ein beliebiges Element in g1 U . Dann ist h = g1 u = g2 u2 u−1 1 ∈ g2 U . Also ist g1 U ⊆ g2 U . Genauso folgt auch g2 U ⊆ g1 U und damit g1 U = g2 U . Ist nun g1 U = g2 U , so ist g1 u = g2 mit geeignetem u ∈ U . Das liefert jetzt u = g1−1 g2 ∈ U . Sei jetzt umgekehrt u = g1−1 g2 ∈ U . Dann erhalten wir hieraus g1 u = g2 ∈ g1 U ∩ g2 U . Somit haben wir g1 U = g2 U . Die Links- (Rechts-) Nebenklassen bilden eine Partition der Gruppe G. Jede Partition einer Menge liefert eine Äquivalenzrelation. Also können wir für jede Äquivalenzklasse einen Vertreter auswählen. Das führt zu der folgenden Definition.
62
Gruppen
Definition 5.3. Sei G eine Gruppe und U eine Untergruppe von G. Aus jeder Nebenklasse gU wählen wir einen Vertreter r . Die Menge R dieser Vertreter nennen wir ein Linksnebenklassenvertretersystem. Es ist G= r U mit r1 U ∩ r2 U = ∅ für r1 ≠ r2 , r1 , r2 ∈ R. r ∈R
Wir nennen |R| den Index von U in G und schreiben dafür |G : U |. Es ist |G : U | die Anzahl der verschiedenen Linksnebenklassen von U in G. Wir haben den Index für Linksnebenklassen definiert. Genauso könnten wir einen Index unter Verwendung von Rechtsnebenklassen definieren. Das nächste Lemma zeigt, dass dies den gleichen Index liefert. Lemma 5.4. Sei G eine Gruppe und U eine Untergruppe von G. Die Anzahl der Linksnebenklassen von U in G ist gleich der Anzahl der Rechtsnebenklassen von U in G. Beweis. Sei R ein Vertretersystem für die Linksnebenklassen. Dann ist {Ur −1 | r ∈ R}
eine Menge von Rechtsnebenklassen. Sei U r1−1 ∩ Ur2−1 ≠ ∅. Dann gibt es u1 , u2 ∈ U , so dass u1 r1−1 = u2 r2−1 gilt. Also ist r2−1 r1 ∈ U , d. h. r2 U = r1 U nach Lemma 5.2. Sei weiter g ∈ G. Dann ist g −1 ∈ r U , für geeignetes r ∈ R . Also ist g −1 = r u mit u ∈ U . Das liefert g = u−1 r −1 ∈ U r −1 . Somit ist G= Ur −1 . r ∈R
Damit ist {r −1 | r ∈ R} ein Rechtsnebenklassenvertretersystem. Satz 5.5 (Lagrange1 ). Sei G eine Gruppe und U eine Untergruppe. Dann ist |G| = |U||G : U |.
Ist insbesondere |G| < ∞, so sind |U| und |G : U| Teiler von |G|.
1 J. Lagrange, * 25. 1. 1736 Turin, † 10. 4. 1813 Paris, Professor in Turin, Berlin und Paris. Lagrange lieferte grundlegende Arbeiten zur Variationsrechnung, Zahlentheorie, Differentialrechnung. Er gilt als Begründer der analytischen Mechanik.
Gruppen
63
Beweis. Sei R ein Linksnebenklassenvertrersystem von U in G, also G= r U. r ∈R
Dann ist |G| =
|r U |.
r ∈R
Die Abbildung u → r u ist eine bijektive Abbildung von U auf r U . Damit erhalten wir |G| = |R||U | = |U ||G : U|. Bemerkung 5.6. Satz 5.5 zeigt, dass nicht jede Teilmenge einer endlichen Gruppe eine Untergruppe sein kann. Das legt natürlich die Frage nahe, zu welchen Teilern d von |G| es Untergruppen U mit |U| = d gibt. ! Die allgemeinste Frage, folgt aus d ! |G| stets, dass es eine Untergruppe der Ordnung d gibt, ist negativ zu beantworten (siehe Bemerkung 5.37). Ist jedoch pn = d eine Primzahlpotenz, so gibt es stets eine Untergruppe U von G mit |U| = d, wie wir später sehen werden. Ein tiefliegender Satz [12] besagt: Ist |G| ungerade, |G| = ab mit teilerfremden a und b , so existiert stets eine Untergruppe U von G mit |U| = a. Satz 5.7 (Kürzungssatz). Ist G eine Gruppe, U eine Untergruppe von G und V eine Untergruppe von U , dann gilt |G : V | = |G : U||U : V | (vgl. Satz 2.5). Beweis. Sei R ein Vertretersystem von U in G und S ein Vertretersystem von V in U . Dann ist die Behauptung, dass {r s | r ∈ R, s ∈ S} ein Vertretersystem von V in G ist. Sei g ∈ G. Dann gibt es ein r ∈ R mit g ∈ r U , d. h. g = r u mit geeignetem u ∈ U . Weiter gibt es ein s ∈ S mit u ∈ sV , d. h. u = sv mit geeignetem v ∈ V . Also ist g = r u = r (sv) = (r s)v ∈ (r s)V . Das liefert G= (r s)V . r ∈R s∈S
Sei x ∈ r1 s1 V ∩ r2 s2 V . Dann ist x = r1 s1 v1 = r2 s2 v2 mit vi ∈ V . Hieraus folgt = s2 v2 v1−1 s1−1 ∈ U und dann r1 U = r2 U , was r1 = r2 liefert. Nun erhalten wir s1 v1 = s2 v2 , also ist s2−1 s1 = v2 v1−1 ∈ V . Dann ist s1 V = s2 V und somit s1 = s2 . Damit ist r1 s1 = r2 s2 und |{r s | r ∈ R, s ∈ S}| = |R||S|. r2−1 r1
Wir wollen nun die Verknüpfung zwischen Elementen auf eine Verknüpfung zwischen Teilmengen einer Gruppe ausdehnen.
64
Gruppen
Definition 5.8. Sind G eine Gruppe und A, B nichtleere Teilmengen von G, so setzen wir AB = {ab | a ∈ A, b ∈ B}.
Bemerkung 5.9. Im allgemeinen ist AB keine Untergruppe, selbst wenn A und B Untergruppen sind, wie wir gleich sehen werden. Sei G die Symmetriegruppe des gleichseitigen Dreiecks. 1
3
2
Sei s die Spiegelung an der Achse durch die Ecke 1 und die Mitte der Kante 23 und t die Spiegelung an der Achse durch 2 und die Mitte von 13. Dann sind {1, s} = A und {1, t} = B Untergruppen von G, da s 2 = id = t 2 ist. Es ist AB = {1, t, st, s}.
Da das Dreieck genau 6 Symmetrien (die drei Spiegelungen und die Drehungen um 120°, 240° und 360°) hat, kann AB keine Untergruppe sein, da |AB| = 4 kein Teiler von 6 = |G| ist. In der Tat ist das Inverse von st nicht in AB . Genauso kann man auch sehen, dass BA keine Untergruppe ist. Das nächste Lemma besagt, wann AB eine Untergruppe ist. Lemma 5.10. Seien G eine Gruppe und A, B Untergruppen. Dann ist AB genau dann eine Untergruppe, wenn AB = BA gilt. Beweis. Sei zunächst AB = BA. Ist ab ∈ AB mit a ∈ A und b ∈ B , so ist (ab)−1 = b−1 a−1 ∈ BA = AB.
Weiter ist für a1 b1 , a2 b2 ∈ AB mit a1 , a2 ∈ A und b1 , b2 ∈ B stets a1 b1 a2 b2 = a1 (b1 a2 )b2 , wobei b1 a2 = a3 b3 ∈ BA = AB ist.
Also ist a1 b1 a2 b2 = (a1 a3 )(b3 b2 ) ∈ AB,
d. h. AB ist eine Untergruppe.
Gruppen
65
Sei umgekehrt AB eine Untergruppe von G. Sei ab ∈ AB mit a ∈ A und b ∈ B . Dann ist (ab)−1 ∈ AB . Also ist b −1 a−1 = (ab)−1 = a1 b1 mit a1 ∈ A und b1 ∈ B . Nun ist ab = (a1 b1 )−1 = b1−1 a−1 1 ∈ BA.
Das liefert AB ⊆ BA. Für die umgekehrte Inklusion wählen wir b ∈ B und a ∈ A. Dann ist b = 1 · b ∈ AB und a = a · 1 ∈ AB . Da AB eine Untergruppe ist, ist ba = (1 · b)(a · 1) ∈ AB.
Somit ist BA ⊆ AB . Lemma 5.11. Seien G eine Gruppe und A, B endliche Untergruppen von G. Dann ist |AB| =
|A||B| . |A ∩ B|
Beweis. Seien R ein Linksnebenklassenvertretersystem von A ∩ B in A und r ∈ R. Dann ist r B ⊆ AB . Also ist r B ⊆ AB. r ∈R
Sei x = ab ∈ AB mit a ∈ A und b ∈ B . Dann ist a ∈ r (A ∩ B) für geeignetes r ∈ R . Also ist a = r y mit y ∈ A ∩ B . Das liefert yb ∈ B und dann x = ab = r (yb) ∈ r B.
Somit ist
r B = AB.
r ∈R
Sei r1 B ∩ r2 B ≠ ∅. Dann gibt es b1 , b2 ∈ B mit r1 b1 = r2 b2 . Insbesondere ist r2−1 r1 = b2 b1−1 ∈ B ∩ A. Das liefert r1 (A ∩ B) = r2 (A ∩ B).
Dann ist nach Lemma 5.2 r1 = r2 . Somit haben wir ! ! |AB| = ! r B! = |r B| = |R||B| = |A : A ∩ B||B| r ∈R
r ∈R
=
Satz 5.5
|A||B| . |A ∩ B|
Die nächsten beiden Definitionen sind für die Gruppentheorie und im Rahmen dieses Buches für die Entwicklung der Galoistheorie von eminenter Bedeutung. Sie werden die Tür zu Induktionsbeweisen aufstoßen.
66
Gruppen
Definition 5.12. Sei G eine Gruppe. Eine Untergruppe N von G heißt ein Normalteiler von G oder auch normal in G, falls für alle g ∈ G stets gN = Ng ist. Hierfür schreiben wir abkürzend N G. Die Entdeckung des Normalteilerbegriffes durch Galois ist nicht nur für die noch zu entwickelnde Theorie der Polynomgleichungen, sondern auch für die Gruppentheorie von großer Bedeutung. In jeder Gruppe G sind sowohl G als auch {1} Normalteiler. Galois selbst erkannte schon die herausragende Rolle, die die Gruppen, die sonst keine weiteren Normalteiler besitzen, in der Gruppentheorie spielen. Er bewies auch den ersten Klassifikationssatz für diese sogenannten einfachen Gruppen (siehe Aufgabe 28 und Aufgabe 29). Den extremen Gegenpol zu den einfachen Gruppen bilden die abelschen Gruppen, in denen jede Untergruppe ein Normalteiler ist. Definition 5.13. Sei G eine Gruppe und N normal in G. Wir setzen G/N = {gN | g ∈ G}
und definieren auf G/N eine Verknüpfung ◦ durch (g1 N) ◦ (g2 N) = (g1 N)(g2 N) = (g1 g2 )N.
Wir nennen G/N die Faktorgruppe von G nach N . Man vergleiche diese Definition mit der Definition 1.4 des Faktorrings und der aus der Linearen Algebra bekannten Definition des Faktorraumes. Dass insbesondere bei Letzterem keine Vorraussetzungen an die Struktur des Unterraumes gestellt werden, liegt daran, dass ein Vektorraum eine abelsche Gruppe ist, somit alle Unterräume Normalteiler sind. Satz 5.14. Seien G eine Gruppe und N ein Normalteiler von G. Dann ist G/N eine Gruppe mit neutralem Element N . Es ist |G/N| = |G : N|. Beweis. Es ist zunächst zu zeigen, dass ◦ eine Abbildung ist. Diese ist als Produkt von Teilmengen der Gruppe definiert, also eine Abbildung. Es bleibt nur, die zweite Gleichheit zu beweisen. Es ist (g1 N)(g2 N) = (g1 Ng2 )N = g1 (Ng2 )N
wegen des Assoziativgesetzes in Gruppen. Da N ein Normalteiler ist, gilt nach Definition 5.12 Ng2 = g2 N . Also ist (g1 N)(g2 N) = g1 (g2 N)N = (g1 g2 )NN = (g1 g2 )N,
da N eine Untergruppe und somit NN = N ist. Der Nachweis der Gruppenaxiome sei dem Leser überlassen.
Gruppen
67
Satz 5.15. Sei G eine Gruppe. (1) Sind Ni (i ∈ I ) Normalteiler von G, so ist i∈I Ni ein Normalteiler von G. (2) Sind N ein Normalteiler und U eine Untergruppe von G, so ist U ∩N ein Normalteiler in U . Weiter ist NU eine Untergruppe von G. (3) Sind N1 und N2 Normalteiler von G, so ist auch N1 N2 normal in G. Beweis. (1) Seien n ∈ i∈I Ni und g ∈ G. Dann ist g −1 ng ∈ Ni für alle i. Also ist g −1 ng ∈ i∈I Ni , d. h. i∈I Ni g = g i∈I Ni . (2) Ist u ∈ U , so ist un = n u mit n ∈ U ∩N und n ∈ N . Aber n = unu−1 ∈ U , d. h. u(U ∩ N) = (U ∩ N)u. Es ist uN = Nu für jedes u ∈ U . Also ist NU = UN . Nun folgt die Behauptung mit Lemma 5.10. (3) Sei g ∈ G. Dann ist g(N1 N2 ) = N1 (gN2 ) = (N1 N2 )g . Besonders wichtig sind Normalteiler in Verbindung mit Homomorphismen. Diese wollen wir nun einführen. Danach werden wir wie in Kapitel 1 für Ringe auch für Gruppen einen Homomorphiesatz beweisen, der die Verbindung zwischen Normalteilern und Homomorphismen herstellt. Definition 5.16. Seien G und H zwei Gruppen. Wir nennen eine Abbildung f :G→H
einen Homomorphismus, falls f (gh) = f (g)f (h)
für alle g, h ∈ G
gilt. Ist f surjektiv, so heißt f ein Epimorphismus. Ist f injektiv, so heißt f ein Monomorphismus. Ein bijektiver Homomorphismus heißt Isomorphismus. Wir schreiben dann G H . Ist G = H , so nennen wir einen Isomorphismus auch Automorphismus. Die Menge der Homomorphismen von G nach H bezeichnen wir mit Hom(G, H). Wie in Kapitel 1 bezeichnen wir mit Bild f = {f (g) | g ∈ G}
das Bild von f in H und mit Kern f = {g | g ∈ G, f (g) = 1}
den Kern von f in G. Wir werden nun zunächst wieder die Zusammenhänge zwischen Injektivität und Kern untersuchen und den Homomorphiesatz beweisen. Dabei können wir sehen, dass die Normalteiler in Gruppen die Rolle von 2-seitigen Idealen in Ringen übernehmen.
68
Gruppen
Lemma 5.17. Sei f : G → H ein Homomorphismus. Dann gilt: (1) f (1) = 1. (2) f (g −1 ) = f (g)−1 , für alle g ∈ G. (3) Bild f ist Untergruppe von H . Beweis. Übungsaufgabe für den Leser. Lemma 5.18. Sei f : G → H ein Homomorphismus. Dann ist Kern f G. Beweis. Es ist 1 ∈ Kern f nach Lemma 5.17(1), also ist Kern f ≠ ∅. Wir wählen g, h ∈ Kern f . Dann ist f (gh−1 ) = f (g)f (h−1 ) = f (g)f (h)−1 = 1 · 1 = 1.
Also ist gh−1 ∈ Kern f . Insbesondere ist Kern f eine Untergruppe von G. Seien nun g ∈ G und x ∈ Kern f . Dann ist f (g −1 xg) = f (g −1 )f (x)f (g) = f (g −1 )f (g) = f (g −1 g) = f (1) = 1.
Also ist g −1 xg ∈ Kern f , d. h. g(Kern f ) = (Kern f )g . Beispiel 5.19. Sei P = {a | a ∈ R, a > 0}. Mit der Multiplikation der reellen Zahlen ist P eine Gruppe. Sei log : P → R(+) der Logarithmus zur Basis e. Dann gilt log(ab) = log(a) + log(b).
Also ist log ein Homomorphismus. Sei a ∈ R. Dann ist a = log ea .
Also ist log ein Epimorphismus. Ist log a = log b, so folgt a = elog a = elog b = b.
Also ist log : P → R ein Isomorphismus. Lemma 5.20. Sei f ∈ Hom(G, H). Dann ist f genau dann ein Monomorphismus, falls Kern f = {1} ist. Beweis. Sei f ein Monomorphismus. Es ist Kern f das Urbild des neutralen Elements, also ist Kern f = {1}. Sei umgekehrt Kern f = {1} und f (a) = f (b). Dann ist f (ab−1 ) = 1. Also ist −1 ab ∈ Kern f = {1}, d. h. a = b.
Gruppen
69
Satz 5.21 (Homomorphiesatz). Seien G, H Gruppen, und sei f ∈ Hom(G, H). Sei weiter N = Kern f . Dann gibt es einen Monomorphismus μ von G/N nach H mit f (g) = μ(gN) für jedes g ∈ G. Es ist Bild f = Bild μ . Also Bild f G/ Kern f .
Beweis. Wir setzen μ(gN) = f (g) für jedes g ∈ G. (1) μ ist wohldefiniert: Sei g1 N = g2 N . Dann ist g2 = g1 n mit geeignetem n ∈ N . Es ist μ(g1 N) = f (g1 )
=
n∈Kern f
f (g1 )f (n) = f (g1 n) = f (g2 ) = μ(g2 N).
(2) Seien g1 N , g2 N ∈ G/N . Dann ist μ((g1 N)(g2 N)) = μ(g1 g2 N) = f (g1 g2 ) = f (g1 )f (g2 ) = μ(g1 N)μ(g2 N).
Also ist μ ein Homomorphismus. (3) Es ist Bild μ = {μ(gN) | g ∈ G} = {f (g) | g ∈ G} = Bild f . (4) Sei gN ∈ Kern μ . Dann ist 1 = μ(gN) = f (g). Also ist g ∈ N . Das liefert Kern μ = {N}. Somit ist μ ein Isomorphismus von G/N auf Bild f . Wir wollen nun noch einige später recht nützliche Anwendungen des Homomorphiesatzes beweisen. Satz 5.22. Sei G eine Gruppe. (1) Ist U eine Untergruppe von G und N G, so ist NU/N U/U ∩ N.
(2) (Kürzungssatz) Sind M und N Normalteiler von G mit N ⊆ M , so ist (G/N)/(M/N) G/M.
Beweis. (1) Wir definieren eine Abbildung f : U → NU /N durch f (u) = uN
für jedes u ∈ U.
Offenbar ist f ein Homomorphismus mit Bild f = NU /N . Ist u ∈ Kern f , so ist N = f (u) = uN , d. h. u ∈ N . Also ist Kern f ⊆ N ∩ U . Sei umgekehrt u ∈ N ∩ U . Dann ist f (u) = uN = N . Also gilt Kern f = U ∩ N . Nun folgt die Behauptung mit Satz 5.21. (2) Wir definieren eine Abbildung f : G/N → G/M durch f (gN) = gM
für jedes g ∈ G.
70
Gruppen
(a) f ist wohldefiniert: Sei g1 N = g2 N , dann ist g1−1 g2 ∈ N ⊆ M . Also ist auch g1 M = g2 M , was f (g1 N) = g1 M = g2 M = f (g2 N)
liefert. (b) Dass f ein Homomorphismus mit Bild f = G/M ist, sei dem Leser überlassen. (c) Kern f = M/N : Sei gN ∈ Kern f . Dann ist M = f (gN) = gM.
Also ist g ∈ M , d. h. gN ∈ M/N . Sei umgekehrt mN ∈ M/N mit m ∈ M . Dann ist f (mN) = mM = M.
Damit erhalten wir mN ∈ Kern f . Die Behauptung folgt nun aus (b), (c) und Satz 5.21. Eine wichtige Klasse von Gruppen ist die der zyklischen Gruppen, die wir gleich definieren werden. In einer typischen Anwendung in Satz 5.28 wollen wir dann den Homomorphiesatz zur Klassifikation dieser Gruppen einsetzen. Definition 5.23. Sei G eine Gruppe und M ⊆ G. Wir setzen " M! = U. M⊆U U Untergruppe
Dann ist M! eine Untergruppe von G. Wir nennen M! die von M erzeugte Untergruppe von G. Ist M = {m1 , . . . , mk }, so schreiben wir auch m1 , . . . , mk ! statt {m1 , . . . , mk }!. Lemma 5.24. Seien G eine Gruppe und M eine Teilmenge von G. Wir bezeichnen mit M −1 die Menge {m−1 | m ∈ M}. Dann ist M! = {e, x1 · · · xn | xi ∈ M ∪ M −1 , n ∈ N}.
Beweis. Wir setzen D = {e, x1 · · · xn | xi ∈ M ∪ M −1 , n ∈ N}. Dann ist D ≠ ∅. Sei −1 x1 · · · xn ∈ D . Dann ist (x1 · · · xn )−1 = xn · · · x1−1 ∈ D. Sind x1 · · · xn und y1 · · · ym ∈ D , so ist x1 · · · xn y1 · · · ym ∈ D.
Also ist D eine Untergruppe von G. Da M ⊆ D ist, folgt M! ⊆ D . Ist andererseits x ∈ M , so ist x −1 ∈ M!. Also ist M ∪ M −1 ⊆ M!. Dann ist aber auch jedes endliche Produkt in den Elementen aus M ∪ M −1 in M! enthalten. Also ist D ⊆ M!.
71
Gruppen
Definition 5.25. Sei G eine Gruppe. (1) G heißt zyklisch, falls es ein g ∈ G mit G = g! gibt. (2) Ist g ∈ G, so bezeichnen wir mit o(g) die Ordnung von g!. Wir nennen o(g) die Ordnung von g in G. Lemma 5.26. Sei g ∈ G mit o(g) = n < ∞. (1) Dann ist n die kleinste natürliche Zahl i mit g i = 1. (2) Ist g m = 1, so ist n ein Teiler von m. Beweis. (1) Sei g m = 1 mit m ≤ n. Es ist g! = {g i | i ∈ Z} nach Lemma 5.24. Wegen g m = 1, folgt g! = {g i | 0 ≤ i < m}.
Also ist n = | g!| ≤ m. Das liefert m = n. (2) Sei m = xn + r mit 0 ≤ r < n. Dann ist 1 = g m = (g n )x g r = g r .
Nach (1) ist r = 0. Lemma 5.27. Seien G eine endliche abelsche Gruppe und a, b ∈ G. (1) Ist ggT(o(a), o(b)) = 1, so ist o(ab) = o(a)o(b). (2) a, b! enthält ein c mit o(c) = kgV(o(a), o(b)). Beweis. (1) Es ist (ab)o(a)o(b) = 1. Also ist o(ab) ein Teiler von o(a)o(b) nach Lemma 5.26(2). Sei m = o(ab). Dann ist (ab)m = 1, also am b m = 1. Somit ergibt sich 1 = (am )o(a) = (b−m )o(a) . Insbesondere ist bmo(a) = 1, d. h. o(b) teilt mo(a) nach Lemma 5.26(2). Da o(b) teilerfremd zu o(a) ist, folgt, dass m von o(b) geteilt wird. Genauso folgt, dass m auch von o(a) geteilt wird. Somit ist o(a)o(b) ein Teiler von o(ab), d. h. o(ab) = o(a)o(b). (2) Seien a
a
b
o(a) = p1 1 · · · prar · · · pt t ,
b
o(b) = p1 1 · · · prbr · · · ps s
die Primfaktorzerlegungen von o(a) und o(b), wobei p1 , . . . , pr die gemeinsamen ˜ stets Primfaktoren seien. Hierbei sei die Anordnung so gewählt, dass für 1 ≤ i ≤ a ˜ + 1 ≤ i ≤ r stets bi > ai sei. ai ≥ bi und für a Wir setzen ˜ a r a b x= pi i , y = pi i , c1 = ax und c2 = by . ˜ i=a+1 a p1 1
i=1
a ar +1 · · · pa˜ a˜ pr +1
a
b
b
b
˜ a+1 Dann ist o(c1 ) = · · · pt t und o(c2 ) = pa+1 · · · pr r · · · ps s . Ins˜ besondere ist ggT(o(c1 ), o(c2 )) = 1. Nach (1) ist
o(c1 c2 ) = o(c1 )o(c2 ) = kgV(o(a), o(b)).
72
Gruppen
Satz 5.28. Sei G eine zyklische Gruppe. (1) Ist |G| = ∞, so ist G Z. (2) Ist |G| = n < ∞, so ist G Z/nZ. Beweis. Nach Lemma 5.24 ist G = {g i | i ∈ Z} = g!. Sei f : Z → G mit f (i) = g i . Es ist f (i + j) = g i+j = g i g j = f (i)f (j).
Also ist f ein Homomorphismus. Offenbar ist f surjektiv. Sei 0 ≠ i ∈ Kern f . Dann ist 1 = f (i) = g i . Ist |G| = ∞, so gibt es ein solches i nicht. Also ist dann f ein Isomorphismus. Das ist (1). Sei nun |G| = n < ∞. Nach Lemma 5.26(2) ist n ein Teiler von i, d. h. i ∈ nZ. Ist umgekehrt i = nj ∈ Z, so ist f (i) = g nj = 1. Also ist nZ = Kern f . Nun folgt G Z/nZ mit Satz 5.21. Das ist (2). Wir können nun zeigen, dass für zyklische Gruppen die Umkehrung des Satzes von Lagrange (Satz 5.5) gilt. Hierbei machen wir von einer typischen Vorgehensweise in der Algebra Gebrauch. Wir wollen einen Satz über allgemeine zyklische Gruppen beweisen. Mit Satz 5.28 haben wir aber eine vollständige Klassifikation der zyklischen Gruppen. Somit ist der Satz bewiesen, sowie wir ihn im Beispiel verifiziert haben. Der Beweis von Sätzen wird also auf die Verifikation in Beispielen zurückgeführt, welche in manchen Fällen aber immer noch recht schwierig sein kann. Satz 5.29. Sei G eine zyklische Gruppe der Ordnung n. Ist m ein Teiler von n, so besitzt G eine Untergruppe U von der Ordnung m. Beweis. Nach Satz 5.28 ist G Z/nZ. Also genügt es, die Behauptung für Z/nZ zu beweisen. Sei n = mk. Dann ist nZ ⊆ kZ. Nach Satz 5.22(2) ist (Z/nZ)/(kZ/nZ) Z/kZ.
Also ist n = |Z/nZ| = |Z/kZ||kZ/nZ| = k|kZ/nZ|. Das liefert m = |kZ/nZ| und kZ/nZ ist die gesuchte Untergruppe in Z/nZ. Die wesentliche Idee der Galoistheorie besteht darin, gewisse Permutationen von Nullstellen eines Polynoms zu betrachten, also eine Untergruppe der Gruppe aller bijektiven Abbildungen der Nullstellen. Sei z. B. f =
n
ai x i ∈ Q[x]
i=0
und sei K ein Zerfällungskörper von f . Seien weiter σ ∈ Aut(K) und u eine Nullstelle von f in K . Dann ist f (σ (u)) =
n i=0
ai σ (u)i =
n i=0
σ (ai )σ (u)i = σ
n i=0
ai x i = σ (f (u)) = 0.
Gruppen
73
Also permutiert σ die Nullstellen von f . Wir wollen uns deshalb zunächst mit der Gruppe der bijektiven Abbildungen einer Menge näher beschäftigen. Definition 5.30. Seien Ω = {1, 2, . . . , n} und Σn die Menge aller bijektiven Abbildungen von Ω. Wir nennen Σn die symmetrische Gruppe auf Ω. Die Elemente aus Σn nennen wir Permutationen. Für g ∈ Σn schreiben wir i1 i2 ... in g= , g(i1 ) g(i2 ) . . . g(in ) wobei {i1 . . . , in } = {1, . . . , n} in irgendeiner Anordnung sei. Satz 5.31. |Σn | = n! Beweis. Sei g ∈ Σn . Dann gibt es für g(1) genau n Möglichkeiten. Für g(2) sind alle Werte aus Ω\{g(1)} möglich, d. h. wir haben genau n − 1 Möglichkeiten. Allgemein gibt es für g(i) ∈ Ω\{g(1), g(2), . . . , g(i − 1)}
genau n − (i − 1) Möglichkeiten. Somit gibt es zusammen genau Elemente in Σn .
n
i=1 i
= n! viele
Definition 5.32. Eine Permutation z, die nach geeigneter Anordnung von {1, . . . , n} die Form m1 m2 . . . mk−1 mk mk+1 . . . mn z= m2 m3 . . . mk m1 mk+1 . . . mn hat, heißt ein k-Zyklus. Wir schreiben dann vereinfachend z = (m1 , m2 , . . . , mk ).
Ein 2-Zyklus heißt Transposition. Die in Definition 5.32 angegebene Schreibweise für einen k-Zyklus ist offenbar wesentlich einfacher als die aus Definition 5.30. Wir wollen nun sehen, dass wir dies auf beliebige Permutationen ausdehnen können. Satz 5.33 (Zyklenzerlegung). Sei g ∈ Σn . (1) Es gibt paarweise disjunkte Mengen M1 , . . . , Mt , mit ti=1 Mi = {1, . . . , n}, so dass bei geeigneter Anordnung Mi = {mi1 , . . . , miki } dann g das Produkt der Zyklen (mi1 , . . . , miki ), i = 1, . . . , t , ist, d. h. g = (m11 , . . . , m1k1 )(m21 , . . . , m2k2 ) · · · (mt1 , . . . , mtkt ).
(2) Ist n ≥ 2, so ist g ein Produkt von Transpositionen.
74
Gruppen
Beweis. (1) Wir führen auf Ω eine Relation ∼ ein: i ∼ j genau dann, falls es ein k ∈ N ∪ {0} gibt, so dass g k (i) = j ist.
Wir zeigen, dass ∼ eine Äquivalenzrelation ist. Da g(i) = i ist, ist i ∼ i. Sei i ∼ j , so gibt es ein k ∈ N ∪ {0} mit g k (i) = j . Sei m = o(g), dann ist g m−1 = g −1 . Also ist i = g −k (j) = g (m−1)k (j), d. h. j ∼ i. Sei i ∼ j und j ∼ , so gibt es k, s ∈ N ∪ {0} mit g k (i) = j und g s (j) = . Dann ist g k+s (i) = , also i ∼ . Seien M1 , . . . , Mt die Äquivalenzklassen von ∼. Dann ist Mi ∩ Mj = ∅ für i ≠ j und ti=1 Mi = Ω. Wir wählen mi1 ∈ Mi und definieren mik = g k (mi1 ), k = 1, . . . , o(g) − 1. Sei k g (mi1 ) = g (mi1 ) für ein Paar k, mit k > . Dann ist g k− (mi1 ) = mi1 . Daher gibt es ein ki , so dass alle g j (mi1 ), j = 1, . . . , ki , paarweise verschieden sind und Mi = {mi1 , . . . , miki } ist. Insbesondere ist dann g|Mi = (mi1 , . . . , miki ). Nun ist t g = i=1 g|Mi , was die Behauptung ist. (2) Es genügt, die Behauptung für einen Zyklus (m1 , . . . , mk ) zu zeigen. Ist k = 1, so ist (m1 ) = (m1 , m2 )(m1 , m2 ). Sei nun k > 1. Dann ist (m1 , . . . , mk ) = (m1 , mk )(m1 , mk−1 ) · · · (m1 , m2 ).
Ein Zyklus der Länge 1 in der Zyklenzerlegung wird per Konvention nicht aufgeschrieben. Also (1, 2)(3)(4, 5, 6) und (1, 2)(4, 5, 6) sind die gleichen Elemente. Ist aus dem Zusammenhang klar, was gemeint ist, so werden auch üblicherweise die Kommata in den Zyklen weggelassen. Also statt (4, 5, 6) schreiben wir auch (4 5 6). Es muss aber klar sein, dass nicht (45, 6) gemeint ist. Die Darstellung als Produkt von Transpositionen ist nicht eindeutig. So ist (1, 2, 3) = (1, 3)(1, 2) = (2, 3)(1, 3) = (1, 2)(1, 3)(2, 3)(1, 2).
Allerdings werden wir sehen, dass die Parität der Anzahl der Transpositionen eindeutig festgelegt ist. Den nachfolgenden schönen Beweis kann man in dem Buch von P. M. Neumann, G. A. Stoy, E. C. Thompson [38, Seite 17] finden. Er wird dort Cauchy2 zugeschrieben. Satz 5.34. Seien h1 , . . . , hr ∈ Σn , n ≥ 2, Transpositionen und g ∈ Σn . (1) Hat h1 h2 · · · hr in der Zyklenzerlegung genau c Zyklen, so ist r ≡n−c
(mod 2).
2 Augustin Louis Cauchy *21.8.1789 Paris, †23.5 1857 Sceaux, Ingenieur zur Zeit Napoleons, Professor in Paris. Er lieferte fundamentale Arbeiten zur Algebra, Infinitesimalrechnung und mathematischen Physik.
Gruppen
75
(2) Wir setzen sgn(g) = (−1)x(g) ,
wobei x(g) die Anzahl der Transpositionen in einer Darstellung von g als Produkt von Transpositionen ist. Dann ist sgn : Σn → {1, −1}
ein Epimorphismus. Dabei ist {1, −1} mit der normalen Multiplikation reeller Zahlen eine Gruppe. Beweis. (1) Wir beweisen die Behauptung durch Induktion nach r . Ist r = 0, so ist die Behauptung richtig, da das Produkt von Null Transpositionen die Identität ist, also c = n gilt. Sei r > 0. Wir setzen f = h1 h2 · · · hr −1 hr und g = h2 · · · hr . Sei g = (α1 , . . . , αb1 )(β1 , . . . .βb2 ) · · · (λ1 , . . . , λbd )
die Zyklenzerlegung von g , d. h. g hat genau d Zyklen. Per Induktion ist r −1≡n−d
(mod 2).
Die Zyklen von g können in jeder Reihenfolge geschrieben werden und jeder Zyklus kann an jeder Stelle starten. Also können wir h1 = (α1 , αs+1 ), falls beide Einträge von h1 , im gleichen Zyklus von g liegen, oder h1 = (α1 , β1 ), falls sie in verschiedenen Zyklen liegen, annehmen. Im ersten Fall ist f = h1 g = (α1 , . . . , αs )(αs+1 , . . . , αb1 )(β1 , . . . , βb2 ) · · · (λ1 , . . . , λbd ).
Also ist c = d + 1 und dann r ≡n−d−1≡n−c
(mod 2).
Im zweiten Fall ist f = h1 g = (α1 , . . . , αb1 , β1 , . . . , βb2 )(γ1 , . . . , γb3 ) · · · (λ1 , . . . , λbd ).
Somit ist c = d − 1 und r ≡n−d+1≡n−c
(mod 2).
Dies beweist (1). (2) Sei f ∈ Σn . Ist f ein Produkt von sowohl r als auch s Transpositionen, so ist nach (1) r ≡ n−c ≡ s (mod 2), wobei c die Anzahl der Zyklen in der Zyklenzerlegung ist. Also ist x(f ) modulo 2 eindeutig bestimmt, d. h. sgn ist eine Abbildung. Da sgn((1, 2)) = −1 ist, ist sgn surjektiv auf {1, −1}. Versehen mit der Multiplikation
76
Gruppen
reeller Zahlen ist {1, −1} eine Gruppe. Seien g, h ∈ Σn . Dann kann gh als Produkt von x(g) + x(h) Transpositionen geschrieben werden. Also ist sgn(gh) = (−1)x(g)+x(h) = sgn(g) sgn(h).
Damit ist sgn ein Homomorphismus. Definition 5.35. Die Abbildung sgn aus Satz 5.34 nennen wir die Signum-Abbildung und sgn(g) das Signum der Permutation g . Ist sgn(g) = 1, so nennen wir g eine gerade Permutation, sonst eine ungerade Permutation. Mit An bezeichnen wir den Kern von sgn und nennen An die alternierende Gruppe. Lemma 5.36. Ist g = z1 · · · zt ∈ Σn , zi Zyklen der Länge ki , dann ist t
sgn g =
(−1)ki −1 .
i=1
Beweis. Wegen Satz 5.34 genügt es, die Behauptung für einen Zyklus der Länge k zu beweisen. Wie im Beweis von Satz 5.33 gesehen, ist dieser ein Produkt von k − 1 Transpositionen. Also ist nach Satz 5.34 sgn z = (−1)k−1 . Bemerkungen 5.37. (1) Es ist An = Kern sgn nach Lemma 5.18 ein Normalteiler in Σn . Nach Satz 5.21 ist Σn /An Bild sgn = {1, −1}. Also ist |An | = n! . 2 (2) Ist n ≠ 2, 4, so sind {1}, An und Σn die einzigen Normalteiler von Σn , wie wir in Satz 5.57 zeigen werden. Dies ist der tiefere Grund dafür, dass es für die allgemeine Gleichung vom Grad ≥ 5 keine Formeln für die Nullstellen gibt, die nur die arithmetischen Operationen und Wurzelausdrücke benutzen, wie wir sie für Gleichungen vom Grad höchstens vier kennen, bzw. in Beispiel 18.7 und Beispiel 18.12 herleiten werden. (3) Sei G = A4 . Dann ist |G| = 12. Wir zeigen, dass G keine Untergruppe U mit |U | = 6 hat. Sei dazu U eine solche Untergruppe, welche dann normal in G ist (siehe Aufgabe 11). Sei V = {(12)(34), (13)(24), (14)(23), id}.
Es ist V eine Untergruppe3 von A4 und nach Satz 5.15 ist V U eine Untergruppe von A4 . Nach Lemma 5.11 ist 12 ≥ |V U| =
3 V wird auch Kleinsche Vierergruppe genannt.
6·4 |V ||U| = . |V ∩ U | |V ∩ U |
Gruppen
77
Somit ist V ∩ U ≠ 1. Wir setzen h = (123). Dann ist h−1 (12)(34)h = (13)(24), h−1 (13)(24)h = (14)(23), h−1 (14)(23)h = (12)(34).
Da U G ist, ist h−1 (V ∩ U)h ⊆ U . Somit folgt V ⊆ U , was aber Satz 5.5 widerspricht. Insbesondere gilt die Umkehrung von Satz 5.5 nicht. Wenn wir allerdings A4 durch Σ4 ersetzen, liegen die Dinge anders. Sei G = Σ4 . Dann ist |G| = 24. Die Teiler von 24 sind 1, 2, 3, 4, 6, 8, 12, 24. (12)(34)!
ist eine Untergruppe der Ordnung 2,
(123)!
ist eine Untergruppe der Ordnung 3,
V
ist eine Untergruppe der Ordnung 4,
Σ3
ist eine Untergruppe der Ordnung 6,
A4
ist eine Untergruppe der Ordnung 12.
Wir zeigen, dass V (12)! eine Untergruppe der Ordnung 8 ist. Es ist |V (12)!| =
4·2 |V || (12)!| = . |V ∩ (12)!| |V ∩ (12)!|
Da sgn(12) = −1 und V ⊆ A4 ist, ist V ∩ (12)! = 1. Also ist |V (12)!| = 8. Wir müssen noch zeigen, dass V (12)! eine Untergruppe von Σ4 ist. Es ist V die Menge aller Elemente mit Signum gleich +1, in deren Zyklenzerlegung nur 2-Zyklen vorkommen. Also ist V normal in Σ4 . Mit Satz 5.15(2) folgt nun, dass V (12)! eine Untergruppe ist. Man kann die Gruppen G, die für jeden Teiler d ihrer Ordnung stets eine Untergruppe der Ordnung d besitzen, nicht klassifizieren. Es gilt zwar noch, dass sie auflösbar sind (vgl. Definition 5.54), aber mehr kann man nicht sagen. Es gilt (vgl. [21, Satz (VI.11)]): Ist G eine auflösbare Gruppe, so gibt es stets eine Gruppe H mit G ≤ H , so dass es für jeden Teiler d von |H| eine Untergruppe U von H gibt, mit |U| = d. Die Struktur der Gruppen, die die Umkehrung von Satz 5.5 erfüllen, ist also beliebig kompliziert. Es gilt aber immerhin noch der folgende Satz: Satz 5.38. Sei G eine Gruppe, die zu jedem Teiler d von |G| genau eine Untergruppe besitzt. Dann ist G zyklisch. Beweis. Wir beweisen die Behauptung durch Induktion nach |G|. Dazu sei zunächst |G| = xy mit ggT(x, y) = 1 und 1 < x < |G|. Dann gibt es Untergruppen U1 , U2 von G mit |U1 | = x und |U2 | = y . Da es genau eine Untergruppe der Ordnung x bzw. y gibt, sind U1 und U2 normal in G. Da ggT(|U1 |, |G : U1 |) = 1 ist, ist jede Untergruppe U von G, deren Ordnung die Ordnung von U1 teilt, in U1 enthalten. Also erfüllt U1
78
Gruppen
die Voraussetzungen und ist somit per Induktion zyklisch. Das gleiche gilt für U2 . Seien U1 = a! und U2 = b! mit ggT(o(a), o(b)) = 1. Es ist a−1 b−1 a ∈ U2 , da U2 normal in G ist, und b−1 ab ∈ U1 , da U1 normal in G ist. Also ist a−1 b−1 ab ∈ U1 ∩ U2 = 1, d. h. ab = ba. Somit ist G abelsch und nach Lemma 5.27(1) ist o(ab) = |G|, d. h. G = ab!. Sei nun |G| = p f eine Primzahlpotenz. Wir wählen g ∈ G mit o(g) maximal und h ∈ G beliebig. Dann ist | h!| ≤ | g!|. Nach Satz 5.29 hat g! eine Untergruppe U mit |U | = | h!|. Also ist h ∈ g!, da es nur eine Untergruppe vorgegebener Ordnung gibt. Damit ist nun aber g! = G. Als eine Anwendung unserer Resultate über Gruppen wollen wir zeigen, dass jede endliche algebraische Erweiterung eines endlichen Körpers einfach ist (vgl. Satz 3.27). Satz 5.39. Sei G eine endliche Untergruppe der multiplikativen Gruppe eines Körpers. Dann ist G zyklisch. Beweis. Sei t = kgV(o(a) | a ∈ G). Dann ist at = 1 für alle a ∈ G. Also besteht G aus Nullstellen von x t − 1. Da x t − 1 nach Satz 1.38 höchstens t verschiedene Nullstellen hat, folgt |G| ≤ t . Es bleibt zu zeigen, dass G ein Element von der Ordnung t enthält. Das folgt aber sofort aus Lemma 5.27(2). Satz 5.40. Seien k ein endlicher Körper und K eine endliche algebraische Erweiterung von k. Dann gibt es ein a ∈ K mit K = k(a). Beweis. Sei [K : k] = n. Dann ist |K| = |k|n < ∞. Nach Satz 5.39 gibt es ein a ∈ K , so dass a! die multiplikative Gruppe von K ist. Dann ist K = k(a). Unser nächstes Ziel ist es, den wichtigsten Satz der endlichen Gruppentheorie zu beweisen, den Satz von Sylow. Der Beweis folgt der Darstellung in [53, chapter 2, §2]. Definition 5.41. Seien G eine Gruppe und U und V zwei Untergruppen. Sei weiter g ∈ G. Dann nennen wir UgV = {ugv | u ∈ U, v ∈ V }
eine Doppelnebenklasse von U und V . Ähnlich wie wir eine Gruppe in Nebenklassen nach einer Untergruppe disjunkt zerlegen können, können wir dies auch mit Doppelnebenklassen nach zwei Untergruppen machen. Der wesentliche Unterschied zu den Nebenklassen ist der, dass alle Nebenklassen nach einer Untergruppe gleich viele Elemente haben, Doppelnebenklassen können aber verschieden viele Elemente haben.
Gruppen
79
Lemma 5.42. Sei G eine Gruppe mit Untergruppen U und V . Dann gilt: (1) G = g∈G U gV . (2) Sind g, h ∈ G und UgV ∩ U hV ≠ ∅, so ist UgV = UhV . |U||V | (3) |U gV | = |U∩gV g −1 | für g ∈ G. Beweis. (1) folgt direkt aus der Definition 5.41. (2) Sei u1 gv1 = u2 hv2 mit ui ∈ U und vi ∈ V . Dann ist −1 g = u−1 1 u2 hv2 v1 ∈ UhV .
Also ist U gV ⊆ U hV und genauso UhV ⊆ U gV . (3) Es ist |U gV | = |U gV g −1 | = |U(gV g −1 )|
=
Lemma 5.11
|U||V | |U ||gV g −1 | = , |U ∩ gV g −1 | |U ∩ gV g −1 |
da |V | = |gV g −1 | ist. Ist G eine Gruppe mit |G| = p a t , p t , p Primzahl, so wollen wir zeigen, dass G eine Untergruppe U mit |U| = p a besitzt. Dazu beweisen wir zunächst den Satz für eine spezielle Gruppe, die Gruppe GL(n, p) der invertierbaren linearen Abbildungen eines n-dimensionalen Vektorraumes über dem Körper GF(p). Danach zeigen wir, dass es für beliebiges G stets ein n gibt, so dass G ≤ GL(n, p) ist. Die Behauptung folgt dann mit der Aussage, dass, falls in einer Gruppe H mit |H| = ps r , p teilt nicht r , es eine Untergruppe der Ordnung p s gibt, es in jeder Untergruppe G von H der Ordnung p a t eine Untergruppe der Ordnung p a gibt. Zunächst wollen wir die Gruppe GL(n, p) näher betrachten. Satz 5.43. Sei V ein n-dimensionaler GF(p)-Vektorraum und GL(n, p) die Gruppe aller invertierbaren linearen Abbildungen von V . Dann ist |GL(n, p)| = p
n(n−1) 2
n
(p i − 1).
i=1
Beweis. Sei {v1 , . . . , vn } eine Basis von V und g ∈ GL(n, p). Dann gibt es pn − 1 n
p −p
.. . p n − p i−1
.. .
Möglichkeiten für g(v1 ), da g(v1 ) ≠ 0 sein muss. Möglichkeiten für g(v2 ), da g(v2 ) ∈ g(v1 )! ist. .. .
.. .
Möglichkeiten für g(vi ), da g(vi ) ∈ g(v1 ), . . . , g(vi−1 )! ist. .. .
.. .
Insgesamt haben wir also (p n − 1)(pn − p) · · · (p n − p n−1 ) viele Möglichkeiten.
80
Gruppen
Satz 5.44. Die Menge der n × n-Matrizen der Gestalt A = (aij ) mit Einträgen aij ∈ GF(p) und aii = 1, i = 1, . . . , n, und aij = 0 für j > i bilden eine Gruppe der Ordnung p
n(n−1) 2
.
Beweis. Es ist klar, dass diese Menge eine Gruppe bildet. Da die Anzahl der aij mit j < i gerade n(n−1) ist und für jedes solche aij alle Elemente aus GF(p) zulässig sind, 2 gibt es genau p
n(n−1) 2
viele solche Matrizen.
Satz 5.45. Seien H eine Gruppe mit |H| = p s r und U eine Untergruppe von H mit |U | = p a t , p r , p t . Gibt es in H eine Gruppe P der Ordnung p s , so gibt es in U eine Untergruppe P1 der Ordnung pa . Weiter gilt für geeignetes g ∈ H , dass P1 = U ∩gP g −1 ist. Beweis. Sei P eine Untergruppe von H mit |P | = p s . Nach Lemma 5.42(1) und (2) ist |H| = g∈R |UgP | für eine geeignete Teilmenge R von H . Nach Lemma 5.42(3) gilt |H| =
g∈R
Also ist
g∈R
|U||P | . |U ∩ gP g −1 |
|U| = r, |U ∩ gP g −1 |
|U | d. h. es gibt mindestens ein g ∈ H , so dass |U ∩gP nicht durch p teilbar ist. Da g −1 | −1 −1 −1 U ∩ gP g ⊆ gP g ist, ist dann |U ∩ gP g | = p a .
Satz 5.46 (Satz von Sylow4 ). Sei G eine endliche Gruppe mit |G| = pa t , wobei p t . Dann enthält G eine Untergruppe P mit |P | = p a . Beweis. Sei V ein |G|-dimensionaler Vektorraum über GF(p) mit {vg | g ∈ G} als Basis. Jedem h ∈ G ordnen wir durch h : vg → vhg eine lineare Abbildung zu. Dadurch wird G zu einer Gruppe von linearen Abbildungen auf V . Wir zeigen, dass diese Zuordnung injektiv ist. Es induziere h ∈ G die triviale Abbildung auf V . Dann ist hg = g für alle g , d. h. h = 1. Also können wir G als Untergruppe von GL(|G|, p) auffassen. Nach Satz 5.44 wissen wir, dass GL(|G|, p) eine Untergruppe (|G|−1)|G| enthält. Nach Satz 5.43 und Satz 5.45 enthält nun G eine von der Ordnung p 2 Untergruppe P der Ordnung p a .
4 L. Sylow, * 12. 12. 1832 Christiana, † 7. 9. 1918 Oslo. Er wirkte als Lehrer bis 1898 und erhielt dann eine Professur an der Universität Christiana. Sein wichtigstes Arbeitsgebiet war die Gruppentheorie, daneben lieferte er auch Beiträge zur Theorie der elliptischen Funktionen.
Gruppen
81
Definition 5.47. Sei G eine Gruppe mit |G| = p a t , wobei t nicht durch p geteilt wird. Eine Untergruppe P von G mit |P | = p a nennen wir eine Sylow-p -Untergruppe von G. Wir haben gerade gezeigt, dass jede endliche Gruppe Sylow-p-Untergruppen für jede Primzahl p enthält. Es gilt aber noch mehr. Satz 5.48. Sei G eine Gruppe mit |G| = p a t , wobei p t . Sind P1 und P2 Sylow-p Untergruppen, so gibt es ein g ∈ G mit P1 = gP2 g −1 . Beweis. Wir wenden Satz 5.45 mit U = P1 und P = P2 an. Nach Satz 5.45 gibt es ein g ∈ G mit |P1 ∩ gP2 g −1 | = |P1 |, also ist P1 = gP2 g −1 . Zwei Untergruppen U , V einer Gruppe G nennt man konjugiert, wenn es ein g ∈ G mit g −1 U g = V gibt. In dieser Sprache besagt Satz 5.48, dass alle Sylowp -Untergruppen einer Gruppe konjugiert sind. Wir wollen in Satz 5.50 eine starke Aussage über die Anzahl der Sylow-p -Untergruppen einer Gruppe G machen. Dazu beweisen wir zunächst ein Resultat über Gruppen bijektiver Abbildungen, das uns noch an vielen anderen Stellen nützlich sein wird. Lemma 5.49. (1) Sei G eine Gruppe von bijektiven Abbildungen einer Menge Ω und sei a ∈ Ω. Dann gilt: (a) Die Menge Ga = {g | g ∈ G, g(a) = a} ist eine Untergruppe von G. (b) Es ist |G : Ga | = |{g(a) | g ∈ G}| (2) Seien G eine Gruppe und U eine Teilmenge von G. Wir setzen NG (U) = {g | g ∈ G, gU g −1 = U }.
Dann ist NG (U) eine Untergruppe von G und |G : NG (U)| = |{gU g −1 | g ∈ G}|.
(Ist U eine Untergruppe, so ist NG (U) die größte Untergruppe von G, in der U normal ist.) Beweis. (1)(a) Da 1 ∈ Ga ist, ist Ga ≠ ∅. Seien weiter g, h ∈ Ga . Dann ist gh ∈ Ga , da gh(a) = g(a) = a ist. Aus a = g −1 g(a) = g −1 (a) folgt g −1 ∈ Ga . (b) Sei τ eine Abbildung von der Menge der Nebenklassen von Ga in G in die Menge {g(a) | g ∈ G} definiert durch τ(gGa ) = g(a) für g ∈ G. Sei gGa = hGa , dann ist h = gx mit geeignetem x ∈ Ga . Also erhalten wir h(a) = gx(a) = g(a). Damit ist τ wohldefiniert. Sei nun g(a) = h(a), dann ist h−1 g(a) = a. Also ist h−1 g ∈ Ga , was gGa = hGa liefert. Somit ist τ bijektiv und dann |G : Ga | = |{g(a) | g ∈ G}|.
82
Gruppen
(2) Wir setzen Ω = {gU g −1 | g ∈ G}. Für h ∈ G definieren wir h(gUg −1 ) = hgUg −1 h−1 .
Damit wird G zu einer Gruppe von bijektiven Abbildungen von Ω. Mit den Bezeichnungen aus (1)(a) ist GU = NG (U), und die Behauptung folgt mit (1). Die Gruppe Ga aus Lemma 5.49 wird auch der Stabilisator von a in G genannt. Die Gruppe NG (U) nennen wir den Normalisator von U in G. Satz 5.50. Sei G eine endliche Gruppe. (1) Jede p -Untergruppe U von G (d. h. |U| = p s für ein s ) liegt in einer Sylow-p Untergruppe. (2) Die Anzahl der Sylow-p -Untergruppen ist ein Teiler von |G|, der kongruent 1 modulo p ist. Beweis. Wir zeigen, dass die Anzahl der Sylow-p -Untergruppen, die U enthalten, kongruent 1 modulo p ist. Insbesondere ist dann U in einer Sylow-p -Untergruppe enthalten, was (1) beweist. Wählen wir für U die Einsuntergruppe, so erhalten wir dann die zweite Aussagen von (2). Sei also P eine feste Sylow-p -Untergruppe von G und H = NG (P ). Dann ist insbesondere die Anzahl der Konjugierten von P gleich |G : H| ein Teiler von |G|, was die erste Aussage von (2) beweist. Ist R eine p -Untergruppe von H , so ist R ⊆ P .
(1)
Es ist P H . Also ist RP eine Untergruppe von H nach Satz 5.15. Es ist |RP |
=
Lemma 5.11
|R| |R||P | = |P | · . |R ∩ P | |R ∩ P |
Somit ist |RP | eine p -Potenz. Nach Satz 5.5 ist |H|/|RP | ∈ N. Da p |H|/|P |, folgt |R| |R∩P | = 1, also ist R = R ∩ P ⊆ P . |G : H| =
k
|U| , mit geeigneten gi ∈ G, i = 1, . . . , k. |U ∩ gi Hgi−1 | i=1
(2)
Dies folgt durch Anwendung von Lemma 5.42 auf das Paar U, H . | Es ist nun p |G : H| und jedes |U ∩g|UHg −1 ist eine p -Potenz. Also muss ein | i
Summand |U| |U∩gi Hgi−1 |
|U | |U ∩gi Hgi−1 |
i
= 1 vorkommen. Sei n(U) die Anzahl der Summanden mit
= 1. Wir zeigen, dass n(U) gleich der Anzahl der Sylow-p-Untergruppen
von G ist, die U enthalten.
Gruppen
83
Sei |U : U ∩ gHg −1 | = 1. Dann ist U = U ∩ gHg −1 , also ist U ⊆ gHg −1 bzw. g U g ⊆ H . Nach (1) haben wir g −1 Ug ⊆ P , was dann U ⊆ gP g −1 liefert. Somit erhalten wir: −1
Ist U ∩ gHg −1 = U , so ist U ⊆ gP g −1 .
(3)
Sei nun umgekehrt U ⊆ gP g −1 . Dann ist g −1 Ug ⊆ P ⊆ H und somit erhalten wir U ⊆ gHg −1 . Also gilt: Ist U ⊆ gP g −1 , so ist U ∩ gHg −1 = U .
(4)
Wir können (4) auch wie folgt formulieren: Ist U in einer Sylow-p -Untergruppe von G enthalten, so gibt es ein g ∈ G mit U = U ∩ gHg −1 .
(5)
Ist U ⊆ g1 P g1−1 = g2 P g2−1 für g1 , g2 ∈ G, so ist g1 g2−1 ∈ H , was Ug1 H = Ug2 H liefert. Sei nun umgekehrt Ug1 H = U g2 H mit U ∩ gi Hgi−1 = U , i = 1,2. Dann ist g1 = ug2 h mit geeigneten h ∈ H und u ∈ U . Also ist g1 P g1−1 = ug2 hP h−1 g2−1 u−1 = u(g2 P g2−1 )u−1 ,
da wir h ∈ NG (P ) haben. Da u ∈ g2 P g2−1 ist, ist g1 P g1−1 = g2 P g2−1 . Somit haben wir gezeigt, dass die Anzahl der Sylow-p -Untergruppen, die U enthalten, genau n(U) ist. Insbesondere ist n(U) ≥ 1, das ist (1). Nun ist aber |G : H| ≡ n(U)
(mod p).
Es ist |G : H| unabhängig von der Wahl von U . Setzen wir U = P , so gilt |G : H| ≡ n(P )
(mod p).
Da P eine Sylow-p -Untergruppe von G ist, ist n(P ) = 1. Also ist 1 = n(P ) ≡ |G : H|
(mod p).
Somit gilt (2). Das folgende Beispiel zeigt, wie stark Satz 5.50(2) die Struktur von Gruppen einschränkt.
84
Gruppen
Beispiel 5.51. (1) Seien |G| = 21 = 3 · 7 und S eine Sylow-7-Untergruppe. Es ist ! |G : NG (S)| ! |G : S| = 3.
Da |G : NG (S)| ≡ 1 (mod 7) ist, folgt G = NG (S),
d. h. S ist normal in G.
Jede Gruppe der Ordnung 21 hat also eine normale Sylow-7-Untergruppe. (2) Sei |G| = 3 · 5 · 7 = 105. Für p ∈ {3, 5, 7} bezeichnen wir mit Np eine Sylow-pUntergruppe von G. Es ist ! |G : NG (N7 )| ! |G : N7 | = 15.
Das liefert |G : NG (N7 )| = 1 oder 15.
Sei zuerst |G : NG (N7 )| = 15. Dann können wir die Elemente von G, die in einer Sylow-7-Untergruppe liegen, abzählen. ! ! ! gN7 g −1 ! = 15 · 6 + 1 = 91. g∈G
Es ist weiter
! |G : NG (N5 )| ! |G : N5 | = 21.
Also ist |G : NG (N5 )| = 1 oder 21.
Sei |G : NG (N5 )| = 21. Jetzt können wir auch die Elemente von G, die in einer Sylow-5-Untergruppe liegen, abzählen. ! ! ! gN5 g −1 ! = 21 · 4 + 1 = 85. g∈G
Zusammen ergibt das ! ! ! gN5 g −1 ∪ gN7 g −1 ! = 85 + 90 = 175 > 105. g∈G
g∈G
Dieser Widerspruch zeigt, dass N5 normal in G ist. Seien N5 = ω! und N7 = γ!. Es ist |N5 −{1}| = 4. Da γ die Potenzen von ω permutiert und die Ordnung von Σ4 nicht durch 7 teilbar ist, folgt γ −1 ωγ = ω, also ! ist ω ∈ NG (N7 ), d. h. 5 · 7 ! |NG (N7 )|. Das widerspricht aber |G : NG (N7 )| = 15. Somit haben wir, dass stets N7 normal in G ist. Sei weiter ω−1 γω ≠ γ . Dann induziert ω einen 5-Zyklus auf N7 \{1}. Da |N7 \{1}| = 6 ist, gibt es ein γ i mit ω−1 γ i ω = γ i . Nun ist aber γ! = N7 = γ i !, d. h. ω−1 γω = γ . Somit gilt
Gruppen
85
! ! immer 7 ! |NG (N5 )|, was dann aber |G : NG (N5 )| ! 3 liefert. Also ist auch in diesem Fall N5 normal in G. Damit haben wir gezeigt, dass eine Gruppe der Ordnung 105 genau eine Sylow-5Untergruppe und genau eine Sylow-7-Untergruppe besitzt.
Satz 5.52. (Satz von Cauchy) Seien G eine endliche Gruppe und p eine Primzahl, die |G| teilt. Dann gibt es in G ein Element von der Ordnung p. Beweis.5 Sei P eine Sylow-p -Untergruppe von G. Dann ist P ≠ 1. Wir wählen ein ! s Element 1 ≠ ω ∈ P . Dann ist nach Satz 5.5 | ω!| ! |P |. Also ist ωp = 1 und p s−1 ps−1 p ω ≠ 1 für ein s . Setzen wir γ = ω , so ist γ = 1 und γ ≠ 1. Satz 5.53. Sei G eine endliche p -Gruppe, G ≠ 1. Dann gilt (1) Z(G) = {h | h ∈ G, gh = hg für alle g ∈ G} ist eine Untergruppe von G (Zentrum von G) mit Z(G) ≠ 1. (2) Es gibt einen Normalteiler G1 von G mit |G : G1 | = p Beweis. (1) Dass Z(G) eine Untergruppe von G ist, sei dem Leser zur Übung überlassen. Wir zeigen Z(G) ≠ 1. Sei dazu M = {x | x ∈ G}. Wir definieren eine Relation ∼ auf M durch x ∼ y , falls es ein g ∈ G mit y = g −1 xg gibt. Man rechnet leicht nach, dass ∼ eine Äquivalenzrelation ist. Die Äquivalenzklassen von ∼ bezeichnen wir mit M1 , . . . , Mr . Dann ist r |G| = |Mi |. i=1
Aus jedem Mi wählen wir einen Vertreter mi . Dann ist Mi = {g −1 mi g | g ∈ G}. Mit Lemma 5.49 erhalten wir, dass |Mi | = |G : NG ({mi })| eine p-Potenz ist. Sei M1 = {1}. Dann ist r |G| = 1 + |Mi |. i=2
Da |G| eine p -Potenz ist, muss es ein i ≥ 2 geben, so dass |Mi | = 1 ist. Also ist Mi = {g −1 mi g | g ∈ G} = {mi } ≠ {1}. Das liefert gmi = mi g für alle g ∈ G, oder 1 ≠ mi ∈ Z(G). (2) Nach (1) und Satz 5.52 gibt es eine Untergruppe N ⊆ Z(G) mit |N| = p . Jede Untergruppe des Zentrums ist normal in G. Nun wenden wir Induktion nach |G| auf G/N an. Die Auflösbarkeit von Gleichungen wird sich in gewissen Eigenschaften von Gruppen widerspiegeln, die wir auch auflösbar nennen wollen. Diese wollen wir nun untersuchen.
5 Einen schönen Beweis, der den Satz von Sylow nicht benutzt, kann man in [34] finden.
86
Gruppen
Definition 5.54. Eine Gruppe G heißt auflösbar, falls es eine Kette Ni von Untergruppen von G gibt, mit 1 = Nk+1 · · · N2 N1 = G, so dass Ni /Ni+1 abelsch ist (i = 1, . . . , k). Wir werden sehen, dass es genau dann eine Formel für die Nullstellen eines Polynoms gibt, die nur Wurzelausdrücke benutzt, falls die zu dem Polynom gehörige Gruppe auflösbar ist. Wie schon mehrfach gesagt, werden wir den Beweis dieser Tatsache durch Induktion durchführen, indem wir dem Polynom mehrere Polynome kleineren Grades zuordnen. Zu diesen werden dann Normalteiler bzw. Faktorgruppen der Ausgangsgruppe gehören. Das nächste Lemma besagt, dass beim Übergang zu Normalteilern und Faktorgruppen die Auflösbarkeit erhalten bleibt. Mehr sogar, dass aus der Auflösbarkeit von Normalteiler und Faktorgruppe die der Gruppe folgt. Dies wird dann zur Folge haben, dass, falls die oben erwähnten kleineren Polynome Auflösungsformeln besitzen, dies auch für das Ursprungspolynom gilt. Satz 5.55. Seien G eine Gruppe, U eine Untergruppe und N ein Normalteiler. (1) Ist G auflösbar, so ist auch G/N auflösbar. (2) Ist G auflösbar so ist U auflösbar. (3) Sind G/N und N auflösbar, so auch G. Beweis. (1) Sei 1 = Nk+1 Nk · · · N1 = G, so dass für alle i stets Ni /Ni+1 abelsch ist. Für n1 N , n2 N ∈ Ni N/N gilt ˜ (n1 N)(n2 N) = (n1 n2 )N = (n2 n1 )nN
˜ ∈ Ni+1 . mit geeignetem n
Somit ist ˜ (n1 N)(n2 N) = (n2 N)(n1 N)(nN)
˜ ∈ Ni+1 N/N . mit geeignetem nN
Also ist (Ni N/N)/(Ni+1 N/N) abelsch. (2) Sei 1 = Nk+1 Nk · · · N1 = G, so dass für alle i stets Ni /Ni+1 abelsch ist. Setze Ui = Ni ∩ U , i = 1, . . . , k + 1. Dann ist 1 = Uk+1 Uk · · · U1 = U
und Ui /Ui+1 = Ni ∩ U/Ni+1 ∩ U
Satz 5.22(1)
(Ni ∩ U)Ni+1 /Ni+1
ist abelsch. (3) Seien 1 = Nk+1 · · · N1 = N und 1 = Ms+1 /N · · · M1 /N = G/N , wobei für alle i, j sowohl Ni /Ni+1 als auch (Mj /N)/(Mj+1 /N) abelsch sind. Dann ist 1 = Nk+1 · · · N1 = Ms+1 · · · M1 = G.
Es ist Ni /Ni+1 abelsch und (Mi /N)/(Mi+1 /N) auflösbar.
Satz 5.22(2)
Mi /Mi+1 abelsch. Also ist G
Gruppen
87
Satz 5.56. Jede endliche p -Gruppe G ist auflösbar. Beweis. Nach Satz 5.53(2) existiert eine Kette 1 = Gk+1 Gk · · · G1 = G
mit |Gi /Gi+1 | = p, i = 1, . . . , k. Insbesondere ist Gi /Gi+1 zyklisch. Satz 5.57. Ist n ≥ 5 und 1 ≠ N ein Normalteiler von An , so ist N = An . Beweis. Sei zunächst (123) ∈ N . Es ist (23k) ∈ An für k > 3. Also ist auch (23k)−1 (123)(23k) = (1k2) ∈ N
und dann (1k2)2 = (12k) ∈ N
für k ≥ 3.
(1)
Nach Satz 5.33(2) ist Σn = (ij) | 1 ≤ i < j ≤ n!. Da (ij) = (1i)(1j)(1i) ist, ist Σn = (1i) | 2 ≤ i ≤ n!.
Das liefert An = (1ij) | i, j = 2, . . . , n!.
Für i ≠ 2 gilt (1ij) = (12j)(12i)(12j)−1 .
Also ist An = (12k) | k ≥ 3!.
Mit (1) folgt nun N = An . Somit können wir annehmen, dass N keine 3-Zyklen enthält. Sei x = abc · · · ∈ N,
wobei a, b, c Zyklen der Zyklenzerlegung seien (vgl. Satz 5.33). Sei zunächst a = (a1 , a2 , a3 , . . . , am ) mit m ≥ 4. Für t = (a1 , a2 , a3 ) ∈ An ist dann t −1 xt ∈ N . Nun ist t −1 xt = (t −1 at)bc · · · = z . Das liefert den Widerspruch N " zx −1 = t −1 ata−1 = (a1 , a3 , a4 ).
Somit können wir annehmen, dass in der Zyklenzerlegung von x nur 2-Zyklen und 3-Zyklen auftauchen. Angenommen, x enthalte mindestens zwei 3-Zyklen, also x = (123)(456)y.
Wir setzen t = (234). Dann ist N " (t −1 xt)x −1 = (15243),
ein Widerspruch.
88
Gruppen
Sei x = (123)p mit p 2 = 1. Dann ist x 2 = (132) ∈ N , ein Widerspruch. Somit haben wir, dass x nur 2-Zyklen enthält. Sei also x = (12)(34)p
mit p2 = 1.
Wir setzen t = (234). Dann ist N " (t −1 xt)x −1 = (13)(24) = y.
Da n ≥ 5 ist, ist u = (135) ∈ An . Also ist N " u−1 yu = (15)(24) = z.
Nun ist auch N " zy = (135),
ein Widerspruch. Gruppen G ≠ 1, die nur die Normalteiler 1 und G enthalten, nennt man einfach. Die alternierenden Gruppen An bilden für n ≥ 5 eine unendliche Serie einfacher Gruppen. Sei SL(n, K) die Gruppe der linearen Abbildungen A eines Vektorraumes der Dimension n über einem endlichen Körper K mit det A = 1. Ist dann n > 2 oder |K| > 3 für n = 2, so ist stets SL(n, K)/Z(SL(n, K)) einfach. Es gibt noch weitere Serien einfacher Gruppen, die ähnlich gebildet sind. Dazu gibt es weitere 26 sogenannte sporadische Gruppen, die kein gemeinsames Bildungsgesetz erkennen lassen. Eine der großen Leistungen der Mathematik war die Klassifikation der endlichen einfachen Gruppen, die 2001 abgeschlossen wurde. Satz 5.58. Für n ≥ 5 ist Σn nicht auflösbar. Beweis. Es ist An ein Normalteiler von Σn . Nach Satz 5.57 ist An einfach. Da n ≥ 5 ist, ist An nicht abelsch. Also ist An nicht auflösbar. Nun folgt die Behauptung mit Satz 5.55(2). Satz 5.59. Für n ≤ 4 ist Σn auflösbar. Beweis. (a) Es ist Σ2 abelsch, also auflösbar. (b) Es ist A3 = (123)! abelsch und Σ3 /A3 ist von der Ordnung zwei, also auch abelsch. Somit ist Σ3 auflösbar. (c) Wir setzen V = {(12)(34), (13)(24), (14)(23), id} (vgl. Bemerkung 5.37). Es ist V abelsch und normal in Σ4 , da V = {g ∈ A4 , g 2 = 1} ist. Es ist |A4 /V | = 3, also ist A4 /V abelsch und |Σ4 /A4 | = 2, also ist Σ4 /A4 abelsch. Insbesondere ist Σ4 auflösbar. Um später Polynome produzieren zu können, die keine Formeln für die Nullstellen besitzen, die nur Wurzelausdrücke benutzten, werden wir das nächste Lemma benötigen.
Gruppen
89
Definition 5.60. Sei G eine Untergruppe von Σn . Wir nennen G transitiv, falls es für jedes Paar i, j, ∈ {1, . . . , n} stets ein g ∈ G mit g(i) = j gibt. Lemma 5.61. Sei G eine Untergruppe von Σn . Dann gilt: (1) Sind (1, 2, . . . , n) und (1, 2) in G, so ist G = Σn . (2) Enthält G eine Transposition und einen (n − 1)-Zyklus, und ist G transitiv so ist G Σn . Beweis. (1) Seien c = (1, 2, . . . , n), t = (1, 2) und G ≥ c, t!. Dann erhalten wir ctc −1 = (2, 3) ∈ G. Weiter ist c(2, 3)c −1 = (3, 4) ∈ G usw. Also ist für alle m stets (m, m +1) ∈ G. Nun ist (1, m)(m, m +1)(1, m) = (1, m +1). Somit ist (1, m) ∈ G für alle m, d. h. G = Σn . (2) Es ist o. B. d. A. τ = (2, 3, . . . , n) ∈ G. Wegen der Transitivität von G ist σ = (1, k) ∈ G für geeignetes k. Wir wählen nun ein i ∈ Z mit 2 ≤ k + i ≤ n. Dann ist τ i σ τ −i = (1, k + i) ∈ G.
Also ist G ≥ (1, j) | 2 ≤ j ≤ n! = Σn .
Übungen 1. 2.
Ist G eine Gruppe mit |G| = 4, so ist G abelsch. Seien G eine Gruppe und g ∈ G mit o(g) = n. Ist k ∈ N, so ist o(g k ) =
3.
4.
5. 6. 7.
n . ggT(n, k)
Sei G eine Gruppe. Zeige: (a) Die Abbildung g → g −1 (g ∈ G) ist genau dann ein Automorphismus, wenn G abelsch ist. (b) Gilt für alle 1 ≠ g ∈ G stets g 2 = 1, so ist G abelsch. Sei G eine Gruppe, g ∈ G. Zeige: (a) g i g j = g i+j für alle i, j ∈ Z, (b) (g i )j = g ij für alle i, j ∈ Z, (c) (g −1 )i = g −i für alle i ∈ Z. Seien G eine Gruppe und a, b ∈ G mit a5 = 1 und aba−1 = b 2 . Bestimme die möglichen Ordnungen von b. Seien G eine endliche Gruppe und m eine positive Zahl mit ggT(m, |G|) = 1. Ist a ∈ G, so gibt es genau ein b ∈ G mit bm = a. Sei G eine Gruppe. Für ein n ∈ N gelte (ab)n = an bn ,
(ab)n+1 = an+1 bn+1 ,
(ab)n+2 = an+2 bn+2 .
Dann ist ab = ba. Gilt die Aussage auch, falls nur (ab)n = an bn , (ab)n+1 = an+1 bn+1 vorausgesetzt wird?
90
8.
Gruppen
Seien A, B , C Teilmengen einer Gruppe G. Dann gilt: A ∪ B ∪ C! =
9.
A ∪ B! ∪ C! = A ∪ B ∪ C!!.
(Dedekind6 -Identität) Seien A, B , C Untergruppen der Gruppe G mit A ⊆ C . Dann gilt AB ∩ C = A(B ∩ C).
10. Seien U eine Untergruppe und N ein Normalteiler der endlichen Gruppe G. Zeige: (a) Ist ggT(|G/N|, |U |) = 1, so ist U ⊆ N . (b) Ist ggT(|G : U |, |N|) = 1, so ist N ⊆ U . 11. Sind G eine Gruppe und U eine Untergruppe mit |G : U | = 2, so ist U normal in G. 12. Gib ein Beispiel einer Gruppe G mit Untergruppen K und N an, so dass K normal in N und N normal in G, aber K nicht normal in G ist. 13. Seien G eine endliche Gruppe und p der kleinste Primteiler von |G|. Sei weiter x ∈ G mit x p = 1, so dass x! normal in G ist. Dann ist xg = gx für alle g ∈ G. 14. Sei G eine endliche Gruppe, N ein Normalteiler von G, und sei P eine Sylow-p -Untergruppe von N . Zeige G = NNG (P ).
15.
16. 17. 18.
19.
20.
(a) Ist U eine Untergruppe von G mit |G : U | = n, so existiert ein Homomorphismus ϕ : G → Σn mit Kern ϕ = g∈G U g . (b) Ist G eine endliche Gruppe, |G| = n, so ist G zu einer Untergruppe von Σn isomorph. Sei G eine Gruppe mit |G| = 2 · u, u ungerade. Dann enthält G eine Untergruppe N mit |G : N| = 2. (Wende Aufgabe 15 an, und berechne sgn t für ein t ∈ G mit t 2 = 1). Beweise Lemma 5.17. (a) Sind G eine endliche Gruppe und A und B Teilmengen von G mit |A| > |G|/2 < |B|, so ist G = AB . (Hinweis: für g ∈ G ist gB −1 ∩ A ≠ ∅.) (b) In einem endlichen Körper ist jedes Element Summe von zwei Quadraten. Sei G eine Gruppe. Für eine Untergruppe H von G und ein g ∈ G bezeichne mit H g die Gruppe g −1 Hg . Zeige: (a) Ist g ∈ G\H , so ist g ∈ HH g . (b) Sei H ≠ G. Ist g ∈ G, so ist G ≠ HH g . (c) Ist |G| < ∞ und ist p der kleinste Primteiler von |G|, so ist jede Untergruppe H von G mit |G : H| = p ein Normalteiler von G. Sei D ein nicht notwendig kommutativer Körper. Dann ist Z(D) = {x | x ∈ D, xa = ax für alle a ∈ D}
ein kommutativer Teilkörper von D. Zeige: Ist N ein (nicht notwendig kommutativer) Teilkörper von D, und ist N ∗ ein Normalteiler von D ∗ (N ∗ , D ∗ die multiplikativen Gruppen von N bzw. D), so ist N = D oder N ⊆ Z(D). (Hinweis: Für λ ∈ D und a ∈ N betrachte λ−1 aλ und (λ + a)−1 a(λ + a).) 21. Sei G eine Gruppe. Die Menge Z(G) = {x | x ∈ G, xg = gx für alle g ∈ G} heißt Zentrum von G (vgl. Satz 5.53). Zeige: (a) Z(G) ist normal in G. (b) Ist G/Z(G) zyklisch, so ist G = Z(G).
6 Julius Wilhelm Richard Dedekind, * 6. 10. 1831 Braunschweig, †12 2 1916 Braunschweig. Dedekind war Professor in Braunschweig und leistete grundlegende Beiträge zu Algebra und Zahlentheorie.
Gruppen
91
22. Sei G einfach. Enthält G eine Untergruppe U mit 1 ≠ |G : U | ≤ 4, so ist |G| ≤ 3. 23. Zeige: (a) Σn ist isomorph zu einer Untergruppe von An+2 . (b) Ist n ≥ 2, so ist Σn nicht zu einer Untergruppe von An+1 isomorph. 24. Sei p eine Primzahl. Eine endliche p -Gruppe heißt elementar abelsch, falls sie abelsch ist und x p = 1 für alle x ∈ G gilt. Zeige: Ist G eine elementar abelsche p -Gruppe, so ist G isomorph zur additiven Gruppe eines Vektorraumes über GF(p). 25. Seien p und q Primzahlen. Ist G eine Gruppe mit |G| = pq, so ist G auflösbar. 26. Sei G eine Gruppe mit |G| = pn qm , wobei p und q Primzahlen mit p n < q sind. Dann hat G genau eine Sylow-q -Untergruppe. 27. Ist |G| = p 3 q, und hat G keine normale Sylow-Gruppe, so ist G Σ4 . 28. Es gibt keine einfache nichtabelsche Gruppe G mit |G| ≤ 59 (Benutze Aufgabe 15, Aufgabe 25 und Aufgabe 26). 29. Ist G eine einfache Gruppe der Ordnung 60, so ist G A5 . 30. Sei G1 die von a = (1,2,3,4) und b = (1, 3) erzeugte Untergruppe von Σ4 , und sei weiter G2 die von i 0 0 1 , b= a= 0 −i −1 0 erzeugte Untergruppe von GL(2, C). Zeige: (a) G1 und G2 sind nichtabelsche Gruppen von der Ordnung 8. (b) G1 G2 . (c) Bestimme alle Untergruppen von G1 und G2 , welche davon sind Normalteiler? 31. Ist G eine nichtabelsche Gruppe der Ordnung 8, so ist G zu einer der beiden Gruppen aus Aufgabe 30 isomorph. (Zeige: (a) Es gibt a ∈ G mit a2 ≠ 1 = a4 . (b) Für b ∈ G\ a! gilt ab = a−1 . (c) Es ist b2 = 1 oder b2 = a2 .) 32. Bestimme alle Gruppen der Ordnung 8. (Benutze Aufgabe 31)
6 Galoistheorie In diesem Kapitel werden wir den Zusammenhang zwischen einer Körpererweiterung und der zugehörigen Automorphismengruppe untersuchen. Es wird sich zeigen, dass unter gewissen Bedingungen eine Beziehung zwischen den Untergruppen und den Zwischenkörpern besteht. Das wird die Basis für die Behandlung unserer Frage nach der Auflösbarkeit von Polynomgleichungen sein. Wir haben bereits zu jeder Körpererweiterung einen Vektorraum assoziiert, dessen Dimension wir schon häufig benutzt haben. Für viele Probleme ist dies aber eine zu schwache Struktur, sie misst nur die Größe der Erweiterung, nicht aber die Gestalt. Galois tat mehr. Zu jedem Polynom definierte er eine Gruppe von Permutationen der Nullstellen, die heute zu seinen Ehren Galoisgruppe des Polynoms heißt. Wir werden diese Gruppe bezüglich einer Körpererweiterung k ⊆ K definieren, also zunächst ohne Polynome zu benutzen. Was besonders erstaunlich ist, ist, dass das Konzept einer Gruppe, wie es uns allen vertraut ist, zur Zeit von Galois kaum existierte. Man könnte nun so vorgehen, zu k ⊆ K einfach die Gruppe Aut(K) zu betrachten. Dabei geht aber k verloren. Wir definieren deshalb: Definition 6.1. Sei k ⊆ K eine Körpererweiterung. Wir bezeichnen die Menge aller Automorphismen von K , die k elementweise festlassen, mit G (K/k). Wir nennen G (K/k) die Galoisgruppe der Körpererweiterung k ⊆ K . Dass der Begriff Galoisgruppe gerechtfertigt ist, zeigt das nächste Lemma. Lemma 6.2. Sei k ⊆ K eine Körpererweiterung. Dann ist G (K/k) eine Gruppe. Beweis. Offenbar ist die Identität in G (K/k). Seien σ , τ ∈ G (K/k). Dann haben wir σ (a) = τ(a) = a für alle a ∈ k. Also ist σ τ(a) = a für alle a ∈ k, d. h. σ τ ∈ G (K/k). Ist a ∈ k, so ist a = σ −1 (σ (a)) = σ −1 (a). Also ist σ −1 ∈ G (K/k). Beispiele 6.3. (1) Sei K = k. Dann ist G (K/k) = 1. (2) G (C/R) = {1, ¯}: Hierbei ist ¯ das Bilden des konjugiert Komplexen. Sei α ∈ G (C/R). Wir setzen j = α(i), wobei i eine Quadrartwurzel aus −1 ist. Dann ist j 2 = (α(i))2 = α(i2 ) = α(−1) = −1. Also ist j = i oder −i. Nun ist α(x + iy) = α(x) + α(i)α(y) = x + jy für x, y ∈ R. Damit ist α = 1 oder α = ¯ . (3) Sei u die reelle dritte Wurzel aus 2 und α ∈ G (Q(u)/Q). Dann erhalten wir (α(u))3 = α((u)3 ) = α(2) = 2. Also ist α(u) = u ∈ R. Nach Beispiel 2.6(3) ist α = 1, d. h. G (Q(u)/Q) = 1.
Galoistheorie
93
Die Idee, Automorphismen eines mathematischen Objektes relativ zu einem Unterobjekt zu betrachten, ist eine allgemeine Methode. Dies passt hervorragend in das Erlangener Programm von Felix Klein1 . Seine Idee war, jede Geometrie als Theorie von Invarianten unter einer Transformationsgruppe zu betrachten. So ist z. B. die euklidische Geometrie das Studium der Invarianten der Gruppe der Abstand erhaltenden Transformationen der Ebene. Topologie kommt von der Gruppe aller stetigen Abbildungen, die eine stetige Inverse haben. Allein die Tatsache, dass die Galoisgruppe eine Gruppe ist, ist nichts Besonderes. Um nützlich zu sein, muss sie einiges von der Struktur der Erweiterung k ⊆ K widerspiegeln. Galois machte die Entdeckung, dass zwischen gewissen Zwischenkörpern und Untergruppen eine bijektive Korrespondenz besteht (Satz 6.10). Dass dies nicht immer so sein muss, zeigt Beispiel 6.3(3). Wir wollen zunächst diese Korrespondenz definieren. Eine der zentralen Fragen wird dann sein, wann diese eine Bijektivität ist. Definition 6.4. Seien k ⊆ K eine Körpererweiterung und G = G (K/k). Für einen Zwischenkörper k ⊆ L ⊆ K setzen wir G (L) = {σ ∈ G | σ (x) = x für alle x ∈ L}.
Wir nennen G (L) die Fixgruppe zu L in G. Für eine Untergruppe U von G setzen wir k (U) = {x | x ∈ K, σ (x) = x für alle σ ∈ U}.
Wir nennen k (U ) den Fixkörper von U . Die Funktoren G (·) und k (·) ordnen Zwischenkörpern Untergruppen beziehungsweise Untergruppen Zwischenkörper zu. Im nächsten Lemma betrachten wir einige Eigenschaften dieser Funktoren und ihre Beziehungen zu den Operationen Durchschnitt und Erzeugnis. Dies wird das zentrale technische Lemma für die folgenden Untersuchungen sein. Lemma 6.5. Seien k ⊆ K eine Körpererweiterung und G = G (K/k). Dann gilt: (1) Für alle Untergruppen U von G ist k (U) ein Unterkörper von K , der k enthält. (2) Für alle Zwischenkörper L ist G (L) eine Untergruppe von G. Es gilt G (L) = G (K/L). (3) Sind V und U Untergruppen von G mit U ⊆ V , so gilt k (U) ⊇ k (V ). (4) Sind L und M Unterkörper von K und ist k ⊆ L ⊆ M ⊆ K , so gilt G (L) ⊇ G (M). (5) k ({1}) = K . (6) G (K) = {1} und G (k) = G. G (L)) ⊇ L. (7) Ist L ein Unterkörper von K mit k ⊆ L, so ist k (G
1 F. Klein, * 25. 4. 1849 Düsseldorf. † 22. 6. 1925 Göttingen, Professor in Erlangen, München, Leipzig und Göttingen. Arbeitsgebiete: Geometrie und Gruppentheorie.
94
Galoistheorie
k(U)) ⊇ U . (8) Ist U Untergruppe von G, so ist G (k G (k k(U))) = k (U). (9) Für jede Untergruppe U von G ist k (G k(G G (L))) = G (L). (10) Für jeden Unterkörper L von K mit k ⊆ L ⊆ K ist G (k
Beweis. (1) Seien a, b ∈ k (U). Dann sind σ (a + b) = σ (a) + σ (b) = a + b, σ (ab) = σ (a)σ (b) = ab
und σ (a−1 ) = σ (a)−1 = a−1
für alle σ ∈ U . Also ist k (U) ein Körper. Weiter ist k ⊆ k (U). (2) Sei σ ∈ G (L). Dann ist σ ein Automorphismus von K , der L elementweise fest lässt. Also ist σ ∈ G (K/L). Sei umgekehrt σ ∈ G (K/L). Dann bleibt L unter σ elementweise fest und somit auch k. Also ist σ ∈ G (K/k), und σ lässt L elementweise fest, d. h. σ ∈ G (L). (3) Ist a ∈ K mit σ (a) = a für alle σ ∈ V , so ist auch σ (a) = a für alle σ ∈ U , d. h. a ∈ k (U). (4) Sei σ ∈ G mit σ (m) = m für alle m ∈ M . Dann ist auch σ () = für alle ∈ L, d. h. σ ∈ G (L). (5) Die Identität lässt offenbar jedes Element in K fest. (6) Es sind G (K) = {σ ∈ G | σ (x) = x für alle x ∈ K} = {1}
und G(k) = {σ ∈ G | σ (x) = x für alle x ∈ k} = G. G (L)) = k (G G (K/L)) ⊇ L. (7) Nach (2) ist G (L) = G (K/L). Also ist k (G k(U)). (8) Ist σ ∈ U , so ist σ (x) = x für alle x ∈ k (U). Also ist U ⊆ G (k G (k k(U))) ⊇ k (U). Nach (8) ist U ⊆ G (k k(U)) und dann nach (3) (9) Nach (7) ist k (G G (k k(U))). Also ist k (U) = k (G G (k k(U))). k (U ) ⊇ k (G k(G G (L))) ⊇ G (L). Nach (7) ist k (G G (L)) ⊇ L und dann nach (4) (10) Nach (8) ist G (k k(G G (L))) ⊆ G (L), also ist G (L) = G (k k(G G (L))). G (k
Bemerkung 6.6. Wie Beispiel 6.3(3) zeigt, gilt i. a. nicht k (G) = k. Weiter gilt in Lemma 6.5(7) i. a. keine Gleichheit. √ √ Sei K = Q( 3 2), k = Q und 3 2 die reelle Wurzel, wie in Beispiel 6.3(3). Dann ist G (k) = G, aber k (G) = K ⊃ k! Auch in Lemma 6.5(8) gilt i. a. keine Gleichheit, wie wir in Beispiel 6.26(1) sehen werden. Nach Lemma 1.51 wissen wir, dass der Durchschnitt von Körpern, die in einem gemeinsamen Oberkörper enthalten sind, wieder ein Körper ist. Also können wir wie bei Gruppen in Definition 5.23 auch bei Körpern ein Erzeugnis definieren.
Galoistheorie
95
Definition 6.7. Seien M , L Körper, die in einem Körper K enthalten sind. Dann bezeichnen wir mit ML den kleinsten Unterkörper von K , der M und L enthält. Wir nennen ML das Erzeugnis von M und L. Lemma 6.8. Sei k ⊆ K eine Körpererweiterung mit Zwischenkörpern L und L und Untergruppen U und U von G (K/k). Dann gilt: k(U ). Gilt zusätzlich sogar (1) k ( U , U !) = k (U) ∩ k (U ) und k (U ∩ U ) ⊇ k (U)k k(U ), so ist k (G G (k k(U)k k(U ))) = k (U)k k(U ). k (U ∩ U ) = k (U)k (2) G (LL ) = G (L) ∩ G (L ) und G (L ∩ L ) ≥ G (L), G (L )!. Gilt Gleichheit, so ist k( G (L), G (L )!)) = G (L), G (L )!. G (k Beweis. (1) Offenbar ist k (U) ∩ k (U ) ⊆ k ( U , U !). Sei umgekehrt σ (x) = x für alle σ ∈ U , U !. Dann ist x ∈ k (U) und x ∈ k (U ). Das liefert die Behauptung k (U ) ∩ k (U ) = k ( U, U !). k(U ). Dann ist x ein Quotient von Linearkombinationen von Sei nun x ∈ k (U)k Produkten von Elementen aus k (U) und k (U ) (siehe Satz 2.2). Ist also σ ∈ U ∩ U , k(U ) ⊆ k (U ∩ U ). so ist σ (x) = x , d. h. k (U)k k(U ). Dann ist Sei zusätzlich k (U ∩ U ) = k (U)k G (k k(U )k k(U ))) = k (G G (k k(U ∩ U ))) k (G
=
Lemma 6.5(9)
k(U ). k (U ∩ U ) = k (U)k
(2) Sei dem Leser als Übung überlassen. Die Korrespondenz, die wir suchen, ist die zwischen den Zwischenkörpern L mit G (L)) = L und den Untergruppen U mit G (k k(U)) = U . Wir werden sehen, dass k (G eine solche existiert. Sie wird noch die zusätzliche Eigenschaft haben, dass sie die Inklusion umkehrt. Sei F die Menge aller Zwischenkörper L mit k ⊆ L ⊆ K und G die Menge aller Untergruppen U von G (K/k). Dann haben wir: G : F −→ G k : G −→ F
Die Idee der Galoistheorie ist nun, nach Bedingungen für die Körpererweiterung k ⊆ K zu suchen, für die G und k Bijektionen sind. Definition 6.9. Eine Körpererweiterung k ⊆ K heißt Galoiserweiterung (oder gaG (k)) = k ist. loissch), wenn k (G
96
Galoistheorie
Satz 6.10 (Galoiskorrespondenz). Sei k ⊆ K eine Körpererweiterung mit Galoisgruppe G = G (K/k). Seien K = {L | k ⊆ L ⊆ K, L ist Zwischenkörper und L ⊆ K ist galoissch}
und k(U)) = U}. U = {U | U ist Untergruppe von G mit G (k
Dann sind die Bildungen k (·) und G (·) zwei inklusionsumkehrende bijektive Abbildungen zwischen K und U. G (L)) = L. Also ist G (k k(G G (L))) = G (L) und dann Beweis. Ist L ∈ K, so ist k (G G (L) ∈ U, d. h. G (·) ist eine Abbildung von K nach U. k(U)) = U . Somit haben wir k (G G (k k(U))) = k (U). Sei umgekehrt U ∈ U, also G (k Insbesondere ist k (U) ⊆ K galoissch, d. h. k (U) ∈ K. Also ist k (·) eine Abbildung von U nach K. Nach Lemma 6.5(3) und (4) sind k(·) und G (·) inklusionsumkehrend. Ist L ∈ K, G (L)) = L. Also ist k G die Identität. Sei U ∈ U. Dann ist G (k k(U)) = U , d. h. so ist k (G G k ist die Identität. Somit sind k (·) und G (·) beide bijektiv.
Wir wollen nun der Frage nachgehen, ob die Abbildungen k (·) und G (·) vielleicht für gewisse Erweiterungen bijektive Abbildungen zwischen den Mengen F und G sind. Dazu werden wir uns auf endliche Erweiterungen beschränken. Wir müssen dann k(U)) = U zeigen. Da stets G (k k(U)) ≥ U ist, genügt es, |G G (k k(U))| = |U| zu z. B. G (k zeigen. Dies wollen wir nun in mehreren Schritten tun. Satz 6.11. Seien k ⊆ L ⊆ M ⊆ K Körpererweiterungen, G = G (K/k) und weiter G (L) : G (M)| ≤ n. Ist insbesondere [K : k] < ∞, so ist [M : L] = n < ∞. Dann ist |G G (K/k)| ≤ [K : k]. |G Beweis. Wir beweisen den Satz durch Induktion nach n. Ist n = 1, so ist offenbar G (L) : G (M)| = 1. G (L) = G (M) und |G Sei nun n > 1 und L L0 M . Dann erhalten wir mit dem Gradsatz (Satz 2.5) [M : L] = [M : L0 ][L0 : L]. Weiter ist per Induktion G (L) : G (M)| |G
=
Satz 5.7
G (L) : G (L0 )||G G (L0 ) : G (M)| ≤ [M : L0 ][L0 : L] = n. |G
Wir können also annehmen, dass es keinen echten Zwischenkörper zwischen L und M gibt. Insbesondere ist M = L(u) mit geeignetem u ∈ M\L. Nach Satz 3.6 ist L ⊆ M algebraisch. Nach Satz 3.13 ist das Minimalpolynom f zu u von der Gestalt f =
n
ai x i
mit ai ∈ L und an = 1.
i=0
Für σ ∈ G (L) betrachten wir die Nebenklasse σ G (M). Es gilt σ (u) = σ (τ(u)) ˜ G (M). Ist σ (u) = σ ˜ (u), so ˜ ∈ G (L) mit σ G (M) ≠ σ für alle τ ∈ G (M). Sei σ
Galoistheorie
97
˜ −1 σ (u) = u, also σ ˜ σ −1 ∈ G (M), ein Widerspruch. Also liefern verschiedene ist σ Nebenklassen von G (M) auch verschiedene Bilder von u. Weiter ist f (σ (u)) =
n i=0
ai (σ (u))i =
n
σ (ai )(σ (u))i = σ (f (u)) = 0.
i=0
G (L) : G (M)| Damit permutiert G (L) die Nullstellen von f , was liefert, dass der Index |G höchstens gleich der Anzahl der verschiedenen Nullstellen von f ist. So erhalten wir G (L) : G (M)| ≤ n. |G Sei nun [K : k] < ∞, so gilt nach Lemma 6.5 G (K/k)| = |G G (K/k) : 1| = |G G (K/k) : G (K)| |G G (k) : G (K)| ≤ [K : k]. = |G
Die Idee der Galoiskorrespondenz ist, dass gewisse Aussagen sowohl für die Zwischenkörper der Erweiterung als auch für die Untergruppen der Galoisgruppe gemacht werden können. Somit sollte es einen Satz 6.11 entsprechenden Satz für die Untergruppen der Galoisgruppe geben. Diesen wollen wir nun beweisen. Hier werden Methoden der Linearen Algebra eingehen. Diesen werden wir auch noch in Kapitel 13 begegnen. Sie gehen auf E. Artin2 [2] und [3] zurück. Satz 6.12. Seien k ⊆ K eine Körpererweiterung und G = G (K/k). Sind U1 und U2 k(U1 ) : k(U2 )] ≤ n. Untergruppen von G mit U1 ⊆ U2 und |U2 : U1 | = n < ∞, so ist [k Beweis. Sei σ ∈ U2 . Wir betrachten die Nebenklasse σ U1 . Ist x ∈ k(U1 ), so ist x unter jedem Automorphismus aus U1 fest. Also ist {σ u(x) | u ∈ U1 } = {σ (x)}. k(U1 ) : k (U2 )] > n. Dann gibt es u1 , . . . , un+1 ∈ k (U1 ), die über k (U2 ) Sei nun [k linear unabhängig sind. Seien σ1 U1 , . . . , σn U1 die Nebenklassen von U1 in U2 mit σ1 = 1. Wir bilden das folgende lineare Gleichungssystem: a1 σ1 (u1 ) + a2 σ1 (u2 ) + · · · + an+1 σ1 (un+1 ) = 0
.. .
( ∗)
a1 σn (u1 ) + a2 σn (u2 ) + · · · + an+1 σn (un+1 ) = 0
mit den n + 1 Unbestimmten a1 , . . . , an+1 . Alle Koeffizienten dieses linearen Gleichungssystems liegen in K . Also gibt es eine nicht triviale Lösung in K . Unter allen
2 E. Artin, * 3. 3. 1898 Wien, † 20. 12. 1962 Hamburg, studierte in Wien und Leipzig, habilitierte 1923 in Hamburg, ab 1926 Professor in Hamburg, emigrierte 1937 in die USA, Professor Notre Dame University, Indiana University und Princeton, ab 1958 wieder Professor in Hamburg. Hauptarbeitsgebiete Zahlentheorie, Algebra, Topologie. Besonders herausragend: Lösung des 17. Hilbertschen Problems, Artinsches Reziprozitätsgesetz, Beiträge zur Klassenkörpertheorie, Linearisierung der Galoistheorie.
98
Galoistheorie
diesen Lösungen wählen wir eine, die besonders viele Nullen enthält. Bei geeigneter Numerierung sei diese a1 , . . . , ar ,0, . . . ,0,
wobei a1 , . . . , ar alle ungleich Null sind. Weiter können wir noch a1 = 1 annehmen. Wenn wir die erste Gleichung betrachten, so erhalten wir a1 u1 + a2 u2 + · · · + an+1 un+1 = 0.
Sind alle ai ∈ k (U2 ), so haben wir einen Widerspruch zur linearen Unabhängigkeit der ui . Also können wir a2 ∈ k (U2 ) annehmen. Dann gibt es ein τ ∈ U2 mit τ(a2 ) ≠ a2 . Anwendung von τ auf (∗) liefert n+1
τ(ai )τ(σj (ui )) = 0,
j = 1, . . . , n.
(∗∗)
i=1
Nun vertauscht τ aber nur die Nebenklassen, d. h. (∗∗) ist nur eine Permutation der Gleichungen von (∗). Insbesondere ist also 1, τ(a2 ), . . . , τ(ar ),0, . . . ,0
eine Lösung von (∗). Da die Differenz zweier Lösungen wieder eine Lösung ist, folgt, dass 0, a2 − τ(a2 ), a3 − τ(a3 ), . . . , ar − τ(ar ), 0, . . . , 0 eine Lösung ist. Diese hat aber mehr Nullen. Also ist sie die triviale Lösung, was a2 ≠ τ(a2 ) widerspricht. Satz 6.13. Seien k ⊆ L ⊆ M ⊆ K Körpererweiterungen, G = G (K/k) und U1 ⊆ U2 Untergruppen von G. (1) Ist L ⊆ K galoissch mit [M : L] = n < ∞, so ist auch M ⊆ K galoissch mit G (L) : G (M)| = n. Ist insbesondere k ⊆ K galoissch, so ist |G G (K/k)| = [K : k]. |G k(U1 )) = U1 und |U2 : U1 | = n < ∞, so sind [k k(U1 ) : k (U2 )] = n und (2) Sind G (k G (k k(U2 )) = U2 . Beweis. (1) Nach Satz 6.11 und Satz 6.12 gilt: k(G G (M)) : k (G G (L))] ≤ |G G (L) : G (M)| ≤ [M : L] = n. [k G (L)) = L. Somit ist Nach Annahme ist L ⊆ K galoissch, also ist k (G k(G G (M)) : L] ≤ [M : L] = n. [k G (M)) ⊇ M , was M = k (G G (M)) liefert. Also ist M ⊆ K Nach Lemma 6.5 ist stets k (G galoissch und k(G G (M)) : k(G G (L))] ≤ |G G (L) : G (M)| ≤ [M : L], [M : L] = [k G (L) : G (M)| = n liefert. was |G
Galoistheorie
99
(2) Nach Satz 6.11 und Satz 6.12 gilt G (k k(U2 )) : G (k k(U1 ))| ≤ [k k(U1 ) : k (U2 )] ≤ |U2 : U1 | = n. |G k(U1 )) = U1 . Weiter ist stets U2 ≤ G (k k(U2 )). Nun folgt Nach Voraussetzung ist G (k : k(U2 )) = U2 und [k k(U1 ) k (U2 )] = n. wie eben G (k
Jetzt sind wir in der Lage, die angekündigte Bijektivität der Abbildungen k (·) und G (·) zu beweisen. Satz 6.14 (Hauptsatz der Galoistheorie). Ist k ⊆ K eine endliche Galoiserweiterung, so sind alle Zwischenkörper in K und alle Untergruppen von G = G (K/k) in U. Die Abbildungen k (·) und G (·) sind inklusionsumkehrende Bijektionen der Menge der Zwischenkörper L auf die Menge der Untergruppen U . Weiter gilt: G (L) = U
genau für
L = k (U).
Beweis. Da k ⊆ K endlich ist, folgt mit Satz 6.13(1) |G| < ∞. Ist U1 = {1}, so ist k({1})) = {1}. Mit Satz 6.13(2) folgt nun G (k k(U2 )) = U2 für k ({1}) = K . Also ist G (k jede Untergruppe U2 von G. Also sind alle Untergruppen in U. Ist L ein Zwischenkörper, so ist L ⊆ K galoissch nach Satz 6.13(1). Also ist L ∈ K. Die Eigenschaften von k (·) und G (·) folgen nun aus Satz 6.10. G (L)) = L ist, folgt L = k (U). Es ist G (k k(U)) = U , also Sei G (L) = U . Da k (G k G folgt aus L = (U ) sofort (L) = U . Beispiel 6.15. Sei K = Q(ω) mit ω = e2π i/5 , d. h. ω5 = 1. Dann ist fω = x 4 + x 3 + x 2 + x + 1
das Minimalpolynom von ω über Q. Also ist [K : Q] = 4. Nach Lemma 3.11 sind die αi mit αi (ω) = ωi , i = 1, . . . , 4, Automorphismen von K . Insbesondere ist G (K/Q)| ≥ 4, und da nach Satz 6.11 |G G (K/k)| ≤ [K : Q] = 4 ist, folgt |G G (K/Q)| = 4. |G G (Q)) = Q zeigen. Es ist Um zu zeigen, dass Q ⊆ K galoissch ist, müssen wir k (G k(G G (Q))). Mit Satz 6.11 folgt G (K/Q) = G (K/k G (Q))] ≤ 4. 4 = |G| ≤ [K : k (G G (Q))] = 4 und somit k (G G (Q)) = Q. Das liefert [K : k (G
Diese Argumente wollen wir im Folgenden verallgemeinern.
100
Galoistheorie
Lemma 6.16. Seien k ⊆ K und G = G (K/k). Ist U eine endliche Untergruppe von G, so ist U ∈ U und [K : k (U)] = |U|. G (k)) ⊆ M ⊆ K , und [M : k (G G (k))] < ∞, Ist M ein Unterkörper von K mit k ⊆ k (G G (K/k) : G (M)| = [M : k (G G (k))]. so ist M ∈ K und |G Beweis. Wir setzen in Satz 6.13(2) U1 = 1 und U2 = U . Das liefert [K : k (U)] = |U | k(U)) = U , also ist U ∈ U. und G (k G (k)) und müssen zeigen, dass L ⊆ K galoissch Wir setzen in Satz 6.13(1) L = k (G G (L)) = k (G G (k k(G G (k)))) G (k)) = L. Also ist L ⊆ K galoissch, ist. Es ist k (G = k (G Lemma 6.5
und die Behauptung folgt mit Satz 6.13(1). Ein äußerst nützliches Resultat, um nachzuweisen, dass eine Erweiterung galoissch ist, ist der folgende Satz. Satz 6.17 (Artin). Seien K ein Körper und G eine endliche Gruppe von Automorphismen von K mit Fixkörper k. Dann ist k ⊆ K eine Galoiserweiterung mit G (K/k) = G und [K : k] = |G|. Beweis. Es ist G ≤ G (K/k). Nach Lemma 6.16 ist |G| = [K : k] und G ∈ U, d. h. k = k (G) ∈ K. Also ist k ⊆ K eine Galoiserweiterung mit Gruppe G. Bemerkungen 6.18. (1) Ist k ⊆ K endlich und galoissch, so hatten wir gesehen, dass dann für k ⊆ L ⊆ K stets L ⊆ K galoissch ist. Wir wollen nun an einem Beispiel zeigen, dass dies ohne die Endlichkeit der Erweiterung im allgemeinen nicht so sein muss. Sei K = Q(x) und k = Q. Wir betrachten die Abbildung αa : x → x + a
für a ∈ Q.
Seien p1 und p2 Polynome. Dann gilt unter αa p1 (x) + p2 (x) → p1 (x + a) + p2 (x + a) = (p1 + p2 )(x + a) p1 (x)p2 (x) → p1 (x + a)p2 (x + a)
= p1 p2 (x + a).
Also ist αa ein Isomorphismus von Q[x]. Nach Lemma 1.39(3) ist dann αa auch G (k)). Wir setzen ein Isomorphismus von Q(x). Sei f /g ∈ k (G h(x, y) = f (x)g(x + y) − g(x)f (x + y).
Dann ist h ein Polynom in x und y . Setzen wir y = a ein, so folgt h(x, a) = f (x)g(x + a) − g(x)f (x + a).
Galoistheorie
101
Nun ist nach Annahme αa (f /g) = f /g , d. h. f (x)/g(x) = f (x + a)/g(x + a).
Also ist h(x, a) = 0 für alle a ∈ Q. Wir betrachten nun h als Polynom in y : h(x, y) =
m
fi (x)y i .
i=0
Dann folgt fi (x) = 0 für i = 0, . . . , m und alle x ∈ Q. Also ist fi = 0 und somit auch h(x, y) = 0. Das liefert f (x + y) f (0) f (x) = = ∈ Q. g(x) g(x + y) g(0) G (k)) = Q. Insbesondere ist Q ⊆ Q(x) galoissch. Dies bedeutet k (G Setzen wir L = Q(x 3 ), so ist [Q(x) : Q(x 3 )] = 3. Sei α ∈ G (Q(x)/Q(x 3 )) und α(x) = f /g.
Es ist x 3 = α(x 3 ) = f 3 /g 3 . Also ist g 3 x 3 = f 3 . Da Q[x] ein ZPE-Ring ist, folgt, dass xg das Polynom f teilt. Also ist α(x) = x , d. h. Q(x 3 ) ⊆ Q(x) ist nicht galoissch. (2) Auch aus k ⊆ L und L ⊆ K galoissch folgt nicht, dass k ⊆ K galoissch ist, wie wir noch sehen werden ( Beispiel 7.13(7)). Dazu müssen wir allerdings die Galoiserweiterungen noch besser verstehen. Unter den Untergruppen einer Gruppe gibt es ausgezeichnete, die Normalteiler. Die Galoiskorrespondenz muss diesen ausgezeichnete Zwischenkörper zuordnen. Das wollen wir zunächst studieren. Satz 6.19. Seien k ⊆ K und σ ∈ G (K/k) = G. Seien weiter U eine Untergruppe von G und L ein Zwischenkörper. Dann gilt k(U)) und G (σ (L)) = σ G (L)σ −1 . (1) k (σ U σ −1 ) = σ (k (2) Ist L ∈ K, so ist auch σ (L) ∈ K. Ist U ∈ U, so ist auch σ Uσ −1 ∈ U. (3) Für L ∈ K gilt genau dann σ (L) = L für alle σ ∈ G, falls G (L) G ist. In diesem Fall folgt aus k ⊆ K galoissch stets, dass k ⊆ L galoissch ist. Weiter enthält G (L/k) G (L) isomorphe Untergruppe. eine zu G/G k(U)) ist. Ist x ∈ K und Beweis. (1) Wir zeigen zuerst, dass k(σ Uσ −1 ) = σ (k −1 −1 −1 (σ uσ )(x) = x für alle u ∈ U , so ist uσ (x) = σ (x), was σ −1 (x) ∈ k (U) k(U)) liefert. und dann x ∈ σ (k k(U)), also σ −1 (x) ∈ k (U). Dann ist Sei umgekehrt x ∈ σ (k uσ −1 (x) = σ −1 (x)
für alle u ∈ U.
Also ist σ uσ −1 (x) = x für alle u ∈ U , d. h. x ∈ k (σ Uσ −1 ).
102
Galoistheorie
Wir zeigen nun G (σ (L)) = σ G (L)σ −1 . Sei g ∈ G (σ (L)). Dann ist g(σ ()) = σ ()
für alle ∈ L.
Also ist σ −1 gσ () = für alle ∈ L. Das liefert σ −1 gσ ∈ G (L), was gleichbedeutend zu g ∈ σ G (L)σ −1 ist. Sei umgekehrt g = σ hσ −1 ∈ σ G (L)σ −1 mit h ∈ G (L). Dann erhalten wir g ∈ G (σ (L)), wegen gσ () = σ hσ −1 σ () = σ h() = σ (). G (L)) = L. Also ist (2) Sei L ∈ K. Dann ist L ⊆ K galoissch und somit k (G G (σ (L))) = k (σ G (L)σ −1 ) = σ (k k(G G (L))) = σ (L). k (G (1)
(1)
Das liefert σ (L) ∈ K. k(U)) = U und somit Sei U ∈ U. Dann ist G (k k(σ Uσ −1 )) = G (σ (k k(U))) = σ (G G (k k(U)))σ −1 = σ Uσ −1 , G (k (1)
(1)
d. h. σ U σ −1 ∈ U. (3) Sei L ∈ K. Sei weiter zunächst σ (L) = L für alle σ ∈ G. Nach (1) ist dann σ G (L)σ −1 = G (σ (L)) = G (L)
für alle σ ∈ G, d. h. G (L) G. Sei umgekehrt G (L) G. Dann ist G (L) = σ G (L)σ −1 = G (σ (L)) für alle σ ∈ G. Somit ist G (L)) = k (G G (σ (L))) = σ (L). L = k (G L∈K
(2)
G (L) = {gG G (L) | g ∈ G}. Wir definieren α : G/G G (L) → G (L/k) durch Es ist G/G G (L)) = g|L . α(gG
Da g(L) = L ist, folgt g|L ∈ Aut(L). Da g ∈ G ist, folgt g|L ∈ G (L/k). Wir zeigen zunächst, dass α eine Abbildung ist. Ist g1 G (L) = g2 G (L), so ist g1−1 g2 ∈ G (L). Also gilt für jedes ∈ L, dass g1 () = g2 () ist. Insbesondere ist g1|L = g2|L und dann α(g1 G (L)) = g1|L = g2|L = α(g2 G (L)).
Offenbar ist α ein Homomorphismus. Sei U = Bild α. Dann ist U eine Untergruppe von G (L/k). G (L) ∈ Kern α. Dann ist g|L = id, also g ∈ G (L). Damit erhalten wir Sei gG G (L). U G/G Sei ∈ L mit u() = für alle u ∈ U . Das liefert g() = für alle g ∈ G, d. h. ∈ k (G) = k, da k ⊆ K galoissch ist. Also ist k ⊆ L galoissch.
Galoistheorie
103
Wir wollen nun noch die Situation aus Satz 6.19(3) genauer studieren. Wir werden sehen, dass k ⊆ L genau dann galoissch ist, falls G (L) G ist. Dazu werden wir uns zunächst ansehen, welche k-Einbettungen von L nach K zu Elementen der Galoisgruppe G (K/k) fortsetzbar sind. Lemma 6.20. Sei k ein Teilkörper von K und seien weiter M und L Zwischenkörper mit k ⊆ M ⊆ L ⊆ K . Die Anzahl der M -Isomorphismen τ : L → K , die zu k-Isomorphismen G (M) : G (L)|. von K fortsetzbar sind, ist gleich |G Beweis. Sei X = {τ : L → K | τ ein M -Isomorphismus und τ = σ|L für ein σ ∈ G (K/k)}.
Da τ ein M -Isomorphismus ist, ist σ ∈ G (M). Sind zunächst σ1 , σ2 ∈ G (M) mit σ1 G (L) = σ2 G (L), so ist σ1 () = σ2 () für alle ∈ L. Also ist σ1|L = σ2|L , d. h. G (M) : G (L)|. |X| ≤ |G
Sei umgekehrt σ1 () = σ2 () für alle ∈ L, so ist σ1 G (L) = σ2 G (L). Also ist G (M) : G (L)| |X| ≥ |G
Satz 6.21. Sei K ⊆ L eine algebraische Erweiterung und sei M ein algebraisch abgeschlossener Oberkörper von K . Ist σ0 : K → M eine Einbettung, so gibt es eine Einbettung σ : L → M mit σ|K = σ0 . Beweis. Sei S = {(X, λ) | K ⊆ X ⊆ L, X ist Körper und λ : X → M ist eine Einbettung mit λ|K = σ0 }.
Wegen (K, σ0 ) ∈ S ist S ≠ ∅. Seien (X, λ), (Y , ν) ∈ S. Wir definieren eine Halbordnung durch (X, λ) ≤ (Y , ν), falls X ⊆ Y und ν|X = λ ist. Sei K eine Kette in S. Wir setzen U = (X,λ)∈K X und γ = (X,λ)∈K λ und zeigen, dass (U, γ) eine obere Schranke für K ist. Dass U ein Körper ist, ist klar. Für γ haben wir nachzuweisen, dass γ eine Abbildung ist. Seien also (X, λ) und (Y , ν) aus K und x ∈ X ∩ Y . Dann ist ohne Einschränkung (X, λ) ≤ (Y , ν). Also ist ν|X = λ. Somit ist ν(x) = λ(x), d. h. ν(x) = γ(x) = λ(x). Nach dem Lemma von Zorn existiert ein maximales Element (N, σ ) ∈ S. Wir zeigen, dass N = L ist. Sei a ∈ L. Es ist a algebraisch über K . Sei ma = n ai x i ∈ N[x] das Minimali=0 n polynom von a. Wir definieren f ∈ M[x] durch f = i=0 σ (ai )x i . Da M algebraisch abgeschlossen ist, hat f eine Nullstelle b in M . Nach Lemma 3.11 gibt es einen Isomorphismus τ : N(a) → σ (N)(b) ⊆ M mit τ(a) = b und τ|N = σ . Also ist (N(a), τ) ∈ S. Nun ist aber (N, σ ) ≤ (N(a), τ), so dass die Maximalität von (N, σ ) liefert, dass N = N(a) ist. Da a ∈ L beliebig war, folgt dann N = L.
104
Galoistheorie
¯ eine k-Einbettung. Dann gibt es ein ¯ und σ0 : K → k Korollar 6.22. Seien k ⊆ K ⊆ k ¯ σ ∈ G (k/k) mit σ|K = σ0 . ¯. Dann ist K ⊆ L algebraisch und M Beweis. Wir setzen in Satz 6.21 M = L = k ¯ → k ¯ mit σ|K = σ0 . Da k ⊆ k ¯ algebraisch abgeschlossen. Also gibt es ein σ : k ¯ algebraisch ist, ist σ surjektiv. Weiter ist σ (a) = a für alle a ∈ k, was σ ∈ G (k/k) liefert.
Satz 6.23. Seien M , L, K Körper mit M ⊆ L ⊆ K und [L : M] = n < ∞. Dann gibt es höchstens [L : M] viele verschiedene M -Einbettungen τ von L nach K . Beweis. Da [L : M] endlich ist, ist M ⊆ L algebraisch nach Satz 3.6. Ist σ : L → K eine M -Einbettung, so ist auch M ⊆ σ (L) algebraisch. Sei Σ die Menge aller M -Einbettungen von L in K . Dann ist der von den σ (L) für alle σ ∈ Σ erzeugte Unterkörper von K algebraisch über M nach Satz 3.7. Somit können wir annehmen, dass M ⊆ K algebraisch ist. Nun können wir K in seinen ¯ algebraischen Abschluss einbetten. Also können wir ohne Einschränkung K = M annehmen. ¯ ∈ G (K/M) = G von σ . Nach LemNach Satz 6.21 gibt es nun eine Fortsetzung σ G (M) : G (L)| = |G : G (L)|. Nach Satz 6.11 ist ma 6.20 ist die Anzahl der σ gleich |G dann |G : G (L)| ≤ [L : M], die Behauptung. Wir fassen die wesentlichsten Ergebnisse dieses Kapitels im nächsten Satz zusammen. Satz 6.24. Sei k ⊆ K eine endliche Galoiserweiterung und sei G = G (K/k). Seien weiter L und L Zwischenkörper und U = G (L) bzw U = G (L ). Dann gilt: (1) [K : L] = |U | und [L : k] = |G : U|. (2) L ⊆ L genau für U ⊇ U . (3) G (L ∩ L ) = U, U !. (4) G (LL ) = U ∩ U . (5) G (σ (L)) = σ U σ −1 für alle σ ∈ G. (6) k ⊆ L ist genau dann galoissch, wenn U normal in G ist. (7) Ist k ⊆ L galoissch, so ist G (L/k) G/U . Beweis. Nach Satz 6.14 ist L = k (U) und L = k (U ). (1) Dass [K : L] = |U | und [K : k] = |G| ist, steht bereits in Lemma 6.16. Also ist : [K k] = [K : L][L : k] = |G| = |U ||G : U |. Das liefert [L : k] = [G : U]. (2) Das steht in Satz 6.14. (3) Nach Lemma 6.8 ist k ( U, U !) = k (U) ∩ k (U ) = L ∩ L .
Galoistheorie
105
Also ist k( U , U !)) G (L ∩ L ) = G (k
=
Satz 6.14
U, U !.
(4) Nach Lemma 6.8 ist G (LL ) = G (L) ∩ G (L ) = U ∩ U .
(5) Das steht in Satz 6.19. (6) Sei U normal in G. Dann folgt mit Satz 6.19(3), dass k ⊆ L galoissch ist. Sei nun umgekehrt k ⊆ L galoissch. Nach Lemma 6.20 wissen wir, dass genau G (k) : G (L)| viele k-Isomorphismen σ : L → K zu Elementen von G fortsetzbar |G G (L/k)| = [L : k] = |G : U| ist, sind nach Satz 6.23 genau die Elemente sind. Da |G (1)
aus G (L/k) die fortsetzbaren, d. h. σ (L) = L für alle σ ∈ G. Nun liefert Satz 6.19(3) die Behauptung. G (L/k)| = [L : k] = |G : U | = |G/U|. Nach Satz 6.19 enthält G (L/k) (7) Es ist |G eine zu G/U isomorphe Untergruppe. Da beide Gruppen die gleiche Ordnung haben, liefert das nun G (L/k) G/U . In den nächsten beiden Kapiteln werden wir uns mit der Frage beschäftigen, wie man erkennen kann, ob eine endliche Erweiterung k ⊆ K galoissch ist. Weiter müssen wir die Galoistheorie noch mit Nullstellen von Polynomen verbinden, für deren Berechnung wir sie ja entwickelt haben. Der folgende Satz zeigt bereits in diese Richtung. Satz 6.25. Sei k ⊆ K eine Galoiserweiterung und sei u ∈ K ein über k algebraisches Element. Dann zerfällt das Minimalpolynom mu von u in K[x] in paarweise verschiedene Linearfaktoren. i Beweis. Es sei mu = n i=0 ai x ∈ k[x] und σ ∈ G (K/k) = G. Dann ist mu (σ (u)) =
n
ai (σ (u))i =
i=0
n
σ (ai )σ (u)i = σ
i=0
n
ai ui
i=0
= σ (mu (u)) = 0.
Also ist auch σ (u) eine Nullstelle von mu . Seien u1 , . . . , ur die verschiedenen Bilder von u unter G. Wir setzen g = (x − u1 ) · · · (x − ur ) =
r
bi x i
mit bi ∈ K.
i=0
Sei σ ∈ G. Dann ist σ (g) = (x − σ (u1 )) · · · (x − σ (ur ))
(siehe Definition 3.10 für die Definition von σ (g)).
106
Galoistheorie
Da σ die u1 , . . . , ur nur permutiert, folgt σ (g) = g . Also ist r
bi x i =
i=0
r
σ (bi )x i .
i=0
Das liefert σ (bi ) = bi für alle σ ∈ G. Somit ist bi ∈ k (G) = k, da k ⊆ K galoissch ist. Also ist g ∈ k[x]. Offenbar ist g ein Teiler von mu in k[x]. Da mu irreduzibel und normiert ist, folgt g = mu . Beispiele 6.26. (1) Sei K = k(x) der Quotientenkörper des Polynomrings über k. Für f /g ∈ k(x)\k mit ggT(f , g) = 1 setzen wir grad(f /g) = max{grad f , grad g}.
Nach Aufgabe 5 gilt [K : k(f /g)] = grad(f /g).
Sei nun σ ∈ G = G (K/k). Dann ist k(x) = k(σ (x)). Somit ist grad σ (x) = 1, d. h. ax + b . σ (x) = cx + d Weiter ist σ (x) ∈ k. Ist d = 0, so folgt daraus cb ≠ 0. Ist d ≠ 0 und ad = bc , so folgt σ (x) = db ∈ k, ein Widerspruch. Also ist stets ad − bc ≠ 0.
Jedes solche σ ist offenbar ein Automorphismus, da dx − b =x σ a − cx ist. Sei nun φ : GL(2, k) → G
mit
a φ c
b d
ax + b . =σ : x→ cx + d
Dann ist φ ein Homomorphismus mit a 0 Kern φ = | a ∈ k = Z(GL(2, k)). 0 a Somit ist G = G (K/k) GL(2, k)/Z(GL(2, k)) = PGL(2, k).
Sei |k| = ∞ und f /g ∈ k (G). Dann ist k(f /g) ⊆ k (G). Ist f /g ∈ k, so ist [K : k(f /g)] < ∞. Dann wäre aber auch [K : k(G)] < ∞. Nach Satz 6.24 wäre dann |G| < ∞, ein Widerspruch. Also ist k = k (G), d. h. k ⊆ K ist galoissch.
Galoistheorie
107
Für a ∈ k sei τa : x → x + a.
Dann ist U = {ta | a ∈ k} eine Untergruppe von G. Wie eben erhalten wir mit Satz 6.24 k (U) = k, da |U| = ∞ ist. Somit haben wir hier ein Beispiel dafür, dass in Lemma 6.5(8) nicht immer das Gleichheitszeichen steht. Ist |k| < ∞, so ist |G| = (q − 1)q(q + 1) mit q = |k|. Sei (x q2 − x)q+1 . (x q − x)q2 +1
F =k
Dann ist F ⊆ k (G). Da nach Aufgabe 5 [K : F ] = (q − 1)q(q + 1) ist, folgt F = k (G) mit Satz 6.17. Also ist F ⊆ K galoissch. (2) (a) Sei K = k(x1 , . . . , xn ) der Quotientenkörper des Polynomrings in n Variablen. Die Gruppe G = Σn , operiert auf den xi wie folgt: σ (xi ) = xσ (i)
für σ ∈ Σn .
Indem wir σ (a) = a für a ∈ k definieren, erhalten wir G = Σn ≤ Aut(K). (i) Es ist [K : k (G)] = |G| = n! nach Satz 6.17. (ii) Sei U ⊆ G eine Untergruppe von G, so ist U Galoisgruppe der Erweiterung k(U) ⊆ K . (b) Sei H eine beliebige endliche Gruppe. Wir betrachten H als Menge Ω und zusätzlich als Menge von Abbildungen von Ω. Jedem h ∈ H ordnen wir die Abbildung σh zu mit σh (g) = hg
für g ∈ H.
Sei n = |H|. Dann haben wir hiermit einen Homomorphismus φ : H → Σn . Da h als Gruppenelement invertierbar ist, ist auch σh invertierbar, also bijektiv. Ist h ∈ Kern φ, so ist σh (g) = g für alle g ∈ H . Das liefert hg = g , also h = 1. Somit ist jede endliche Gruppe H Untergruppe einer symmetrischen Gruppe. (c) Nach (b) und (a) ist jede endliche Gruppe Galoisgruppe einer endlichen Körpererweiterung. Die Eigenschaft, Galoisgruppe zu sein, schränkt also die Struktur einer Gruppe nicht ein. Eine der großen offenen Fragen ist, ob jede endliche Gruppe H auch Galoisgruppe einer Erweiterung Q ⊆ K ist, d. h. der Grundkörper ist stets Q. In unserem obigen Beispiel variierte der Grundkörper. Wir kommen darauf in Kapitel 14 und Kapitel 18 zurück. Wir haben uns in diesem Kapitel, obwohl nicht immer vorausgesetzt, im Wesentlichen nur mit endlichen Körpererweiterungen beschäftigt. Eine Behandlung der
108
Galoistheorie
Galoistheorie unendlicher Erweiterungen würde den Rahmen dieses Buches sprengen. Wenn man auf der zugehörigen Gruppe eine geeignete Topologie einführt und dann nur die abgeschlossenen Untergruppen betrachtet, so erhält man einen Satz 6.14 entsprechenden Satz. Im endlichen Fall ist jede Untergruppe abgeschlossen. Die unendliche Galoistheorie ist nicht nur von theoretischer Bedeutung. Die Grup¯ pe G (Q/Q) , die sogenannte absolute Galoisgruppe, spielt in der algebraischen Zahlentheorie eine wesentliche Rolle. Gruppentheoretisch führt die Untersuchung dieser Gruppe in den Bereich der proendlichen Gruppen. Für mehr Information zum Thema unendliche Galoistheorie sei auf den Übersichtsartikel von M. Jarden [24] verwiesen.
Übungen 1. 2.
3. 4.
5. 6.
√ √ √ Bestimme für die Erweiterung Q ⊆ Q( 2, 3, 5) die Galoisgruppe und alle Zwischenkörper. Sei F der Zerfällungskörper von x 4 − 7x 2 + 11 über Q. (a) Ist F galoissch über Q? (b) Bestimme die Galoisgruppe G (F /Q). (c) Bestimme die Zwischenkörper von Q ⊆ F . Welche sind über Q galoissch? Sei F ein Zerfällungskörper von x 3 − 2. Zeige: G (F /Q) Σ3 und bestimme alle Zwischenkörper. Welche sind über Q galoissch? Berechne die Galoisgruppe für die folgenden Erweiterungen: √ (a) Q ⊆ Q( 2), (b) Q ⊆ Q(α), wobei α die reelle 5-te Wurzel aus 7 sei. Sei K ein Körper mit Q ⊆ K ⊆ C. Ist [K : Q] = 2, so ist Q ⊆ K galoissch. Sei k ein Körper und K = k(x). Für f /g ∈ K mit ggT(f , g) = 1 setze grad f /g = max{grad f , grad g}.
Dann gilt: [K : k(f /g)] = grad f /g . (Hinweis: Betrachte das Polynom f (y) − ug(y), wobei u = 4
2
f (x) g(x)
ist.)
Sei f = x − 7x + 10 ∈ Q[x] und F ein Zerfällungskörper von f über Q. Bestimme G (F /Q). Ersetze in Aufgabe 7 den Körper Q durch GF(5). Beweise Lemma 6.8(2). Sei L der Zerfällungskörper von f über GF(2). (a) f = x 5 − 1. (b) f = x 7 − 1. Bestimme G (L/ GF(2)) und alle Zwischenkörper. 11. Sei f ∈ K[x] und L der Zerfällungskörper von f . Es habe f paarweise verschiedene Nullstellen in L. Ist G (L/K) transitiv auf den Nullstellen, so ist f irreduzibel über K . 12. Sei f = x 9 − 1 ∈ Q[x]. Bestimme den Zerfällungskörper L, G (L/Q) und alle Zwischenkörper. Welcher Zwischenkörper wird von ξ + ξ −1 , wobei f (ξ) = 0 ist, erzeugt? Zeige, dass x 3 − 2 über L irreduzibel ist. (Benutze Aufgabe 3.) 13. Sei L = K(α) eine endliche Galoiserweiterung von K . Sei f das Minimalpolynom von α über K und f (β) = 0 für ein β in einem Erweiterungskörper von L. Zeige, dass L = K(β) ist. 14. Sei L = K(α) eine endliche Galoiserweiterung von K und sei f das Minimalpolynom von α über K . Seien α = α1 , α2 , . . . , αn die Nullstellen von f in L. Definiere σi : L → L, i = 1, . . . , n, durch σi|K = id und σi (α) = αi . Zeige, dass G (L/K) = {σ1 , . . . , σn } ist. 7. 8. 9. 10.
Galoistheorie
109
√ √ √ √ Sei L = Q( 2 + 3). Bestimme das Minimalpolynom von 2 + 3 über Q. Berechne mit Aufgabe 14 die Gruppe G (L/Q). 16. Sei K ⊆ L galoissch und G = G (L/K) eine endliche einfache Gruppe. Ist K ⊆ M ⊆ L und K ⊆ M galoissch, so ist M = K oder M = L.
15.
7 Normale Erweiterungen Wir knüpfen an Satz 6.25 an. Dort wurde unter anderem gezeigt, dass eine galoissche Erweiterung k ⊆ K Zerfällungskörper für die Menge {mu | u ∈ K} ⊆ k[x] ist. Diese Eigenschaft wollen wir in diesem Kapitel weiter untersuchen. Definition 7.1. Eine algebraische Erweiterung k ⊆ K heißt normal, falls jedes irreduzible Polynom aus k[x], das eine Nullstelle in K hat, in K[x] in Linearfaktoren zerfällt. Nach Satz 6.25 ist jede Galoiserweiterung normal. Wir wollen uns in diesem und dem nächsten Kapitel damit beschäftigen, ob normale Erweiterungen auch galoissch sind. Dazu formulieren wir zunächst Definition 7.1 unter Verwendung von Isomorphismen: Satz 7.2. Seien k ⊆ K eine algebraische Erweiterung und L ein algebraisch abgeschlossener Oberkörper von K . Dann sind gleichwertig: (NOR 1) Jede k-Einbettung σ : K → L bildet K in sich ab. (NOR 2) k ⊆ K ist normal. (NOR 3) K ist Zerfällungskörper einer Menge von Polynomen aus k[x]. Beweis. (NOR 1) ⇒ (NOR 2): Seien f ein irreduzibles Polynom aus k[x] und a ∈ K mit f (a) = 0 und b ∈ L mit f (b) = 0. Nach Lemma 3.11 gibt es einen Isomorphismus τ : k(a) → k(b) mit τ(s) = s für alle s ∈ k und τ(a) = b. Nach Satz 6.21 gibt es eine Fortsetzung σ von τ mit σ : K → L. Nach Voraussetzung ist σ (K) = K . Also ist K " σ (a) = τ(a) = b. Damit enthält K alle Nullstellen von f , d. h. k ⊆ K ist normal. (NOR 2) ⇒ (NOR 3): Wir setzen F = {mα , | α ∈ K}, wobei mα das Minimalpolynom über k von α ist. Dann zerfällt mα in K[x] in Linearfaktoren, also ist K Zerfällungskörper für F . (NOR 3) ⇒ (NOR 1): Sei F eine Menge von Polynomen aus k[x], so dass jedes Polynom f ∈ F über K[x] in Linearfaktoren zerfällt und sei weiter K = k(W ), wobei W die Menge der Nullstellen der Polynome aus F sei. Ist σ : K → L eine k-Einbettung, i so ist σ (K) = σ (k(W )) = k(σ (W )). Ist f ∈ F , so ist f = n i=0 ai x mit geeigneten n i ai ∈ k. Also ist σ (f ) = i=0 σ (ai )x = f . Das liefert nun σ (W ) = W . Damit ist σ (K) = k(σ (W )) = k(W ) = K . Korollar 7.3. Quadratische Erweiterungen sind normal. Beweis. Seien [K : k] = 2 und a ∈ K\k. Dann ist nach Satz 3.13 grad ma = 2. Also ist ma = (x − a)(x − b). Somit ist auch b ∈ K . Dann ist K aber Zerfällungskörper von ma , da K = k(a) ist. Nun liefert Satz 7.2 die Behauptung.
Normale Erweiterungen
111
Korollar 7.4. Sei k ⊆ N eine normale Erweiterung, und seien K , L Körper mit k ⊆ K ⊆ N ⊆ L. Ist σ eine k-Einbettung mit σ (K) ⊆ L, so ist σ (K) ⊆ N . Beweis. Sei T der algebraische Abschluss von L. Nach Satz 6.21 kann σ zu τ auf N fortgesetzt werden, so dass τ(N) in T liegt. Nach Satz 7.2 ist τ(N) = N . Also gilt σ (K) = τ(K) ⊆ τ(N) = N . Der nächste Satz zeigt, dass es zu jeder Körpererweiterung eine kleinste normale Körpererweiterung gibt, die diese enthält. Satz 7.5. Zu jeder algebraischen Erweiterung k ⊆ K gibt es einen bis auf k-Isomorphie eindeutig bestimmten kleinsten Erweiterungskörper N ⊇ K , der über k normal ist. Ist ¯ [K : k] endlich, so ist [N : k] endlich. Innerhalb eines algebraischen Abschlusses k von k, der K enthält, ist N der von {σ1 (K), . . . , σn (K)} erzeugte Unterkörper, wobei die ¯ sind. σi (i = 1, . . . , n) die verschiedenen k-Einbettungen von K nach k ¯ normal über k. Seien N1 und N2 Oberkörper von K , die Beweis. Nach (NOR 3) ist k über k normal sind, und f ein Polynom aus k[x] mit einer Nullstelle in N1 ∩ N2 , so liegen nach (NOR 2) alle Nullstellen von f in N1 ∩ N2 . Also ist N1 ∩ N2 normal über k. Insbesondere ist " ˜ N N= ˜ N⊇K ˜ normal N über k
der gesuchte Körper. Sei nun [K : k] < ∞. Nach Korollar 7.4 ist σ (K) ⊆ N für jede k-Einbettung σ ¯. Nach Satz 6.23 gibt es höchstens [K : k] viele solche Einbettungen von K nach k σ1 , . . . , σn . Sei N1 der von σ1 (K), . . . , σn (K) erzeugte Körper. Dann ist N1 ⊆ N . Sei ¯ eine k-Einbettung. Dann ist τσi eine k-Einbettung von K nach k ¯. Also τ : N1 → k ist τσi (K) ⊆ N1 , d. h. τ(N1 ) ⊆ N1 . Nach (NOR 1) ist dann N1 normal. Die Definition von N liefert nun N = N1 . ¯ ein algebraischer AbDefinition 7.6. Sei k ⊆ K eine Körpererweiterung und sei k ¯. Der kleinste Körper N in k ¯, der K enthält, so dass k ⊆ N schluss von k mit K ⊆ k ¯ normal ist, heißt normale Hülle von K über k in k. ¯ ein algebraischer Abschluss von Satz 7.7. Seien k ⊆ K eine normale Erweiterung und K ¯ eines Zwischenkörpers k ⊆ L ⊆ K zu einem K . Dann ist jede k-Einbettung σ : L → K Automorphismus von K fortsetzbar. ¯ fortsetzbar. Beweis. Nach Korollar 6.22 ist σ zu einem Automorphismus τ von K Nach (NOR 1) ist τ|K ein Automorphismus von K .
112
Normale Erweiterungen
Korollar 7.8. Sei k ein Körper. Jede k-Einbettung eines algebraischen Erweiterungskör¯ von k lässt sich zu einem Automorphismus pers K von k in den algebraischen Abschluss k ¯ gelegenen) normalen Hülle N von K , d. h. zu einem Element aus G (N/k), fortder (in k setzen. ¯. Nun folgt die Behauptung mit Satz 7.7. ¯ =k Beweis. Es ist N ¯ ein algebraiLemma 7.9. Seien k ⊆ K ⊆ K algebraische Erweiterungen von k und k ¯ scher Abschluss von k mit K ⊆ k. Sind N die normale Hülle von K und N die von K ¯, so ist N ⊆ N . über k in k
Beweis. Es ist N normal und K ⊆ K ⊆ N . Also ist N ⊆ N . Wir wollen nun untersuchen, wie es mit der Normalität bezüglich Zwischenkörper, Erzeugnis und Durchschnitt steht. Also, ob aus k ⊆ K1 und k ⊆ K2 normal auch k ⊆ K1 K2 und k ⊆ K1 ∩ K2 normal folgt, und weiter, ob aus k ⊆ K ⊆ L und k ⊆ L normal auch K ⊆ L normal oder k ⊆ K normal folgt. Satz 7.10. Ein normaler Erweiterungskörper k ⊆ L ist auch über jedem Zwischenkörper K mit k ⊆ K ⊆ L normal. Weiter ist k ⊆ K genau dann normal, falls σ (K) = K für alle σ ∈ G (L/k) ist. Beweis. Jede K -Einbettung ist auch k-Einbettung. Also folgt die erste Aussage mit (NOR 1). Sei nun k ⊆ K normal und σ ∈ G (L/k). Nach (NOR 1) ist σ (K) = K . ¯ der algebraische Abschluss Sei umgekehrt σ (K) = K für alle σ ∈ G (L/k). Sei L ¯ von L und σ : K → L eine k-Einbettung. Nach Satz 7.7 ist σ zu einem Automorphismus von L fortsetzbar. Also ist σ ∈ G (L/k). Nach Voraussetzung ist nun σ (K) = K . Nach (NOR 1) ist somit k ⊆ K normal. Satz 7.11. Seien k ⊆ K1 und k ⊆ K2 normal und seien K1 und K2 in einem Oberkörper L enthalten. Dann sind K1 K2 und K1 ∩ K2 über k normal. ¯ eine k-EinBeweis. Es ist K1 ∩ K2 normal über k nach (NOR 2). Sei σ : K1 K2 → L bettung. Nach (NOR 1) ist σ (K1 ) = K1 und σ (K2 ) = K2 . Also ist σ (K1 K2 ) = K1 K2 . Somit ist K1 K2 normal über k.
Seien k ⊆ K und k ⊆ L Körpererweiterungen und K, L beide in einem Oberkörper enthalten. Der nächste wichtige Satz besagt, dass aus der Normalität von k ⊆ K auch die von L ⊆ LK folgt, man kann also Konstanten erweitern.
Normale Erweiterungen
113
Satz 7.12 (Translationssatz). Sei M ein Körper mit Unterkörpern K und L und sei k ⊆ K ∩ L ein weiterer Körper. Ist k ⊆ K normal, so ist L ⊆ LK normal, und G (KL/L) ist zu einer Untergruppe von G (K/K ∩ L) isomorph. ¯ eine L-Einbettung. Dann ist σ erst recht eine k-Einbettung. Beweis. Sei σ : KL → M Also ist σ (K) = K nach (NOR 1). Da σ (L) = L ist, folgt σ (KL) = KL. Also ist L ⊆ LK normal nach (NOR 1). Wir definieren eine Abbildung A auf G (KL/L) durch Aσ = σ|K für σ ∈ G (KL/L). Es ist σ|K ∈ G (K/K ∩ L). Also ist A : G (KL/L) → G (K/K ∩ L) ein Homomorphismus. Ist σ ∈ Kern A, so ist σ|K = 1 und somit ist σ = 1, da σ|L = 1 war. Damit ist A ein Monomorphismus und Bild A G (KL/L).
Beispiel 7.13. (1) Wir betrachten f (x) = x 4 − 2 und bestimmen den Zerfällungskörper K ⊆ C von f über Q. In C gilt: √ 4 x 4 − 2 = (x − a)(x + a)(x − ia)(x + ia) mit a = 2 ∈ R, a > 0. Also ist K = Q(a, i). (2) Wir bestimmen [K : Q]. Es ist [Q(a, i) : Q] = [Q(a, i) : Q(a)][Q(a) : Q].
Da i ∈ R, ist, ist i ∈ Q(a). Also ist x 2 + 1 das Minimalpolynom von i über Q(a) und dann ist [Q(a, i) : Q(a)] = 2. Nun ist a eine Nullstelle von f , und f ist irreduzibel über Q nach Satz 1.48. Also ist f = ma , d. h. [Q(a) : Q] = 4 nach Satz 3.13. Somit ist [K : Q] = 8. (3) Wir bestimmen G (K/Q). Wir wenden Lemma 3.11 auf das Paar Q(i)(a) und Q(i)(ia) an. Das liefert uns dann einen Automorphismus σ von K mit σ (i) = i und σ (a) = ia. Genauso liefert Lemma 3.11, angewandt auf das Paar Q(a)(i) und Q(a)(−i), ein τ ∈ Aut(K) mit τ(a) = a und τ(i) = −i. Das liefert die folgenden Automorphismen 1 σ σ2 σ3 τ σ τ σ 2τ σ 3τ
a a ia −a −ia a ia −a −ia
i i i i i −i −i −i −i.
G (K/Q)| ≥ 8. Nach Satz 6.11 ist |G G (K/Q)| ≤ [K : Q] = 8. Also ist Somit ist |G G (K/Q)| = 8 und Q ⊆ K ist galoissch nach Satz 6.17. |G
114
Normale Erweiterungen
Es ist G (K/Q) = σ , τ | σ 4 = 1 = t 2 , σ τ = σ −1 !. Dies ist die erste Gruppe aus Aufgabe 28, Kapitel 5. (4) Wir bestimmen die Untergruppen von G = G (K/Q). Es ist G die einzige Untergruppe der Ordnung 8. Die Untergruppen der Ordnung 4 sind: A = {1, σ , σ 2 , σ 3 },
B = {1, σ 2 , τ, σ 2 τ},
C = {1, σ 2 , σ τ, σ 3 τ}.
Die Untergruppen der Ordnung 2 sind: D = {1, σ 2 },
E = {1, τ},
F = {1, σ 2 τ},
J = {1, σ 3 τ},
H = {1, σ τ}.
Mit I = {1} haben wir die folgenden Inklusionsdiagramme für K und G. G B F
K
A E
k (F ) k (E) k (D) k (H) k (J)
C
D
H
k (B) k (A)
J
k (C)
Q
I
Das Inklusionsdiagramm für G folgt aus (4), das für K aus Satz 6.14. Es sind A, B und C normal in G, da sie den Index zwei haben (siehe Aufgabe 11, Kapitel 5). Weiter sind natürlich I und G normal. Da σ −1 Eσ = F und σ −1 Jσ = H ist, sind diese Gruppen nicht normal. Schließlich ist σ 2 mit allen Elementen aus G vertauschbar, also ist E normal in G. √ (5) Wir bestimmen die Zwischenkörper. Wir sehen sofort die Körper Q( 2), Q(i) und √ Q(i 2), welche vom Grad 2 sind. Diese entspechen k (B), k (A) bzw. k (C). Als Nächstes bestimmen wir k(H). Jedes Element x aus K kann in der Form x = a0 + a1 a + a2 a2 + a3 a3 + a4 i + a5 ia + a6 ia2 + a7 ia3
mit a0 , . . . , a7 ∈ Q geschrieben werden. Es ist σ τ(x) = a0 + a1 ia − a2 a2 − a3 ia3 − a4 i + a5 (−i)ia − a6 i(ia)2 − a7 i(ia)3 = a0 + a5 a − a2 a2 − a7 a3 − a4 i + a1 ia + a6 ia2 − a3 ia3 .
Also ist x genau dann unter σ τ fest, falls a1 = a5 ,
a2 = 0,
a3 = −a7
und a4 = 0
sind. Somit ist x = a0 + a1 (1 + i)a + a6 ia2 + a3 (1 − i)a3 = a0 + a1 (1 + i)a +
Dann ist k (H) = Q((1 + i)a).
a6 a3 ((1 + i)a)2 − ((1 + i)a)3 . 2 2
Normale Erweiterungen
115
Genauso folgt √ k (J) = Q((1 − i)a), k (F ) = Q(ia), k (E) = Q(a) und k (D) = Q(i, 2).
(6) Wir bestimmen die normalen Teilkörper. Da k (A), k (B) und k (C) Erweiterungen vom Grad zwei sind, sind diese Körper nach Korollar 7.3 sämtlich normal. Nach Satz 6.24(6) ist Q ⊆ L genau dann normal, falls G (L) ein Normalteiler in G ist. Also ist G (L) eine der Gruppen in {B, C, A, D, I, G}. Die Galoisgruppen von Q ⊆ k (B), k (A) bzw. k (C) haben alle die Ordnung 2. Die Galoisgruppe von Q ⊆ k (D) hat die Ordnung 4. Nach Satz 6.24(7) ist k(D)/Q) G/D Z2 × Z2 . G (k
(7) Es ist Q ⊆ k (F ) nicht normal. Da nach Satz 6.25 Galoiserweiterungen stets normal sind, ist Q ⊆ k (F ) nicht galoissch. Es ist Q ⊆ k (B) galoissch. Da k(F )/k k(B)) ist, ist k(B) ⊆ k(F ) galoissch. σ 2 ∈ G (k Damit haben wir ein Beispiel für die Tatsache, dass aus k ⊆ L galoissch und L ⊆ K galoissch nicht k ⊆ K galoissch folgt (siehe Bemerkung 6.18(2)). Zum Abschluss noch ein Lemma, das uns in Kapitel 10 gute Dienste leisten wird. (vgl. Satz 5.22(2)) Lemma 7.14. Seien k ⊆ K1 und k ⊆ K2 normale Körpererweiterungen mit K1 ⊆ K2 . Dann ist G (K2 /K1 ) G (K1 /k). G (K2 /k)/G
Beweis. Sei R : G (K2 /k) → G (K1 /k) mit R(τ) = τ|K1
für τ ∈ G (K2 /k).
Nach Satz 7.2 (NOR 1) ist R(τ) ∈ G (K1 /k). Offenbar ist R ein Homomorphismus. Nach Lemma 6.5(2) ist Kern R = G (K1 ) = G (K2 /K1 ). Nach Satz 7.7 ist jeder k-Isomorphismus von K1 auf K2 fortsetzbar. Also ist Bild R = G (K1 /k).
Die Behauptung folgt nun mit dem Homomorphiesatz Satz 5.21.
116
Normale Erweiterungen
Übungen 1. 2.
3. 4.
Bestimme G (L/ GF(5)) und alle Zwischenkörper, wobei L ein Zerfällungskörper von x 4 − 2 über GF(5) sei. Welche sind normal? Seien f ein irreduzibles Polynom aus k[x] und K eine normale Erweiterung von k. Seien weiter g und h irreduzible Faktoren von f in K[x]. Zeige: (a) Es gibt ein σ ∈ G (K/k) mit σ (h) = g . (b) Die Aussage (a) ist falsch, falls k ⊆ K nicht normal ist. Sei K ⊆ L galoissch und sei a ∈ L mit σ (a) ≠ a für alle σ ∈ G (L/K). Dann ist L = K(a). Bestimme die Galoisgruppe des Zerfällungskörpers von x 8 + (x + 1)8 + 1 = f
über Q. (Hinweis: Ist α eine Nullstelle, so auch
1 α
und −(α + 1).)
8 Separable Erweiterungen In Satz 6.25 hatten wir gesehen, dass galoissche Erweiterungen stets Zerfällungskörper sind. Wir wollen uns nun die umgekehrte Frage stellen, ob Zerfällungskörper stets galoissch sind. Nach Satz 6.25 und (NOR 3) ist somit entscheidend, ob irreduzible Polynome stets paarweise verschiedene Nullstellen haben. Unsere Erfahrung lässt uns diese Frage mit ja beantworten, da wir uns häufig nur mit irreduziblen Polynomen über Q beschäftigen. Wir werden gleich sehen, dass in der Tat irreduzible Polynome über Q stets paarweise verschiedene Nullstellen haben. Dass dies im Allgemeinen aber nicht so ist, zeigt das folgende Beispiel. Beispiel 8.1. Sei K = GF(2)(t) der Quotientenkörper des Polynomrings über GF(2). Sei f = x 2 + t ∈ K[x]. Wir zeigen zunächst, dass f irreduzibel über K ist. Sei f = (x + r (t))(x + h(t)) mit r (t), h(t) ∈ K . Dann ist x 2 + t = x 2 + (r (t) + h(t))x + r (t)h(t).
Koeffizientenvergleich liefert r (t) + h(t) = 0. Also ist r (t) = h(t). Dann ist (r (t))2 = t. 2 2 Sei r (t) = a(t) b(t) mit a(t), b(t) ∈ GF(2)[t]. Dann folgt t(b(t)) = (a(t)) . Aber 2 2 der Grad von (a(t)) ist gerade, während der von t(b(t)) ungerade ist. Somit ist f irreduzibel. √ Sei M = K( t). Dann ist [M : K] = 2 und K ⊆ M ist normal nach Korollar 7.3. Somit ist M der Zerfällungskörper von f über K . √ Über M ist aber f = (x+ t)2 , da char M = 2 und somit das Potenzieren mit 2 ein √ Automorphismus ist. Also hat f die doppelte Nullstelle t . Insbesondere ist K ⊆ M nach Satz 6.25 nicht galoissch.
Wir wollen verstehen, warum dieses Beispiel existiert. Wir werden sehen, dass es kein solches Beispiel für char K = 0 oder |K| < ∞ gibt. Definition 8.2. Seien k ⊆ K eine Körpererweiterung und f ein Polynom in k[x]. In K[x] gelte f = (x − u)r h, r ≥ 1, wobei h ∈ K[x] mit h(u) ≠ 0 sei. Dann heißt u eine Nullstelle der Ordnung r von f . Wir nennen f separabel, wenn die irreduziblen Faktoren von f in k[x] in keinem Erweiterungskörper K von k mehrfache Nullstellen haben. Ein Element u ∈ K heißt separabel über k, wenn u einfache Nullstelle seines Minimalpolynoms mu ∈ k[x] ist. Eine Erweiterung k ⊆ K heißt separabel, wenn alle Elemente in K separabel über k sind. Achtung: Ein separables Polynom f kann mehrfache Nullstellen haben. Dies ist nur für irreduzibles f nicht möglich!
118
Separable Erweiterungen
Sei f ∈ k[x] irreduzibel, dann könnte f Nullstellen haben, die separabel sind, und weiter Nullstellen, die nicht separabel sind. Wir wollen zunächst sehen, dass dies nicht vorkommen kann. Wollen wir testen, ob ein Polynom mehrfache Nullstellen hat, so ist es nützlich, die „Ableitung“ zu betrachten. Dies wollen wir zunächst ausführen. Definition 8.3. Sei f =
n
i=0 ai x
i
∈ k[x] ein Polynom. Wir setzen
f =
n
iai x i−1
i=0
und nennen f die Ableitung von f . Es ist zwar x −1 nicht definiert, aber in der Summe kommt x −1 nur mit dem i−1 Koeffizienten i = 0 vor, weshalb eigentlich f = n ist. i=1 iai x Die Ableitung für ein Polynom f ∈ R[x] stimmt mit der aus der Analysis bekannten Ableitung überein. Wir wollen nun sehen, dass auch die üblichen Rechenregeln gelten. Lemma 8.4. Seien f , g ∈ k[x]. Dann gilt: (1) f + g = (f + g) . (2) (f g) = f g + f g . (3) Ist f ≠ 0, so in grad f < grad f . m i i Beweis. Seien f = n i=0 ai x und g = i=0 bi x . Indem wir die Koeffizienten notfalls mit Nullen auffüllen, können wir n = m annehmen. i (1) Es ist f + g = n i=0 (ai + bi )x . Also ist (f + g) =
n
i(ai + bi )x i−1 =
i=0
n
iai x i−1 +
i=0
n
ibi x i−1 = f + g .
i=0
(2) Wir berechnen zunächst (x j g) für festes j . Es ist x j g = (x j g) =
n
(i + j)bi x i+j−1 = x j
i=0
i=0
ibi x i−1 + (jx j−1 )
i=0
j
n
n
bi x i+j . Also ist
n
bi x i
i=0
j
= x g + (x ) g.
Es ist f g =
n
i=0 ai x
(f g) =
n
i
g . Nach (1) ist (f g) =
(ai x i g) =
(∗)
i=0
n
n
i=0 (ai x
i
g) . Das liefert
(ai x i g + iai x i−1 g) = f g +
i=0
= f g + f g.
(3) Es ist grad f ≤ n − 1 < grad f .
n i=0
iai x i−1 g
( ∗)
Separable Erweiterungen
119
Lemma 8.5. Sei f ∈ k[x] ein irreduzibles Polynom. In einem Erweiterungskörper K von k habe f eine Nullstelle u der Ordnung r > 1. Dann ist f = 0. ¯. In k ¯ ein algebraischer Abschluss von k mit u ∈ k ¯ gilt Beweis. Sei k f = (x − u)r h
¯ mit h ∈ k[x] und h(u) ≠ 0.
Nach Lemma 8.4(2) ist f = r (x − u)r −1 h + (x − u)r h . ¯ Da r > 1 ist, ist x −u ein Teiler von f in k[x] . Also ist x −u ein Teiler von ggT(f , f ) ¯ in k[x] . Sei nun f ≠ 0. Nach Lemma 8.4(3) ist grad f < grad f . Da f irreduzibel ist, ist also ggT(f , f ) = 1 in k[x]. Nach Satz 1.22 ist dies äquivalent dazu, dass es a, b ∈ k[x] mit a(x)f (x) + b(x)f (x) = 1 ¯ ¯ gibt. Dies ist aber auch eine Zerlegung in k[x] , was ggT(f , f ) = 1 in k[x] liefert. ¯ Das ist ein Widerspruch dazu, dass x − u ein Teiler von ggT(f , f ) in k[x] ist.
Satz 8.6. Sei f ∈ k[x] ein irreduzibles Polynom. Ist char k = p > 0, so gibt es ein eindeutig bestimmtes irreduzibles separables Polynom g ∈ k[x] mit e
f (x) = g(x p )
mit eindeutig bestimmten e ∈ N ∪ {0}. Alle Nullstellen von f haben die gleiche Ordnung p e . Ist char k = 0, so ist f stets separabel. ¯ der algebraische Abschluss von k und α1 , . . . , αr die verschiedenen Beweis. Seien k ¯. Seien σi : k(α1 ) → k(αi ) k-Isomorphismen gemäß Lemma 3.11. Nullstellen von f in k ¯ Nach Korollar 6.22 kann jedes σi zu einem τi ∈ G (k/k) fortgesetzt werden. Sei jetzt f =
r
¯ (x − αi )mi ∈ k[x].
i=1
Da f ∈ k[x] ist, ist τi (f ) = f . Da τi (α1 ) = αi ist, haben alle Nullstellen die gleiche Vielfachheit m. Das liefert f =
r i=1
(x − αi )m =
r
(x − σi (α1 ))m .
i=1
Sei m > 1. Nach Lemma 8.5 ist dann f = 0. Das geht aber nur dann, wenn p = char k ein Teiler von m ist. Insbesondere ist char k ≠ 0. Wir betrachten nun das Polynom r p m/p ˜ p ). Es ist g ˜= ˜ ∈ k[x] irreduzibel, da . Dann ist f (x) = g(x g i=1 (x − αi ) wir sonst eine Zerlegung von f hätten. Nun folgt die Behauptung mit einer Induktion nach grad f .
120
Separable Erweiterungen
Korollar 8.7. Seien k ⊆ K eine Körpererweiterung, u ∈ K und mu das Minimalpolynom von u über k. Dann sind gleichwertig: (1) u ist separabel über k. (u) ≠ 0. (2) mu ≠ 0. (3) mu ¯ Beweis. (1) ⇒ (2): Sei n i=1 (x − ui ) die Zerlegung von mu in k[x]. Dann sind die ui paarweise verschieden. Wir wählen die Bezeichnung so, dass u1 = u ist. Nach Lemma 8.4(2) ist mu =
n
(x − ui ).
j=1 i≠j
Also ist mu (u) = i≠1 (u − ui ) ≠ 0. (u) ≠ 0 ist, ist mu ≠ 0. (2) ⇒ (3): Da mu (3) ⇒ (1): Sei u nicht separabel. Also ist die Ordnung r von u als Nullstelle von mu größer als 1. Nach Lemma 8.5 ist mu = 0, ein Widerspruch.
Korollar 8.8. Ist char k = 0, so ist jede algebraische Erweiterung von k separabel. Beweis. Nach Satz 8.6 ist jedes irreduzible Polynom separabel, was die Behauptung liefert. Satz 8.9. Seien k ⊆ N normal und G = G (N/k). Für u ∈ N setzen wir F = k(u). Dann ist r = |G : G (F )|, wobei r die Anzahl der verschiedenen Nullstellen des Minimalpolynoms mu von u über k ist. Beweis. Sei σ ∈ G mit σ|F ≠ 1. Dann ist σ (u) ≠ u eine Nullstelle von mu . Also ist die Anzahl der verschiedenen Nullstellen mindestens |G : G (F )|. Nach Lemma 3.11 und Satz 7.2 gilt die umgekehrte Ungleichung. Nun sind wir endlich in der Lage, eine Beschreibung der Galoiserweiterungen zu geben, die nur noch Polynome benutzt. Dies ist deshalb wichtig, da wir ja eigentlich das Problem der Existenz von Formeln für die Nullstellen von Polynomen lösen wollen. Satz 8.10. Sei k ⊆ K algebraisch. Dann sind gleichwertig: (1) k ⊆ K ist galoissch. (2) K ist ein separabler Zerfällungskörper für eine Menge F1 von Polynomen über k. (3) K ist Zerfällungskörper für eine Menge F2 von separablen Polynomen über k. Beweis. (1) ⇒ (2): Wir setzen F1 = {ma | a ∈ K} ⊆ k[x]. Dann folgt mit Satz 6.25, dass K separabel und Zerfällungskörper für F1 ist. (2) ⇒ (3): Dies folgt, wenn wir F2 = F1 setzen.
Separable Erweiterungen
121
(3) ⇒ (1): Sei zunächst [K : k] endlich. Wir setzen G = G (K/k). Seien f ein irreduzibler Faktor eines g ∈ F2 mit grad f = r > 1 und a ∈ K eine Nullstelle von f . Seien L = k(a) und H = G (L). Mit Satz 8.9 erhalten wir r = |G : H| = [L : k]. Nun fahren wir mit Induktion nach [K : k] fort. Es ist K ein Zerfällungskörper über L für F2 . Da [K : L] < [K : k] ist, ist K über L galoissch per Induktion. Also ist G (K/L)| = |H|. Das liefert [K : L] = |G [K : k] = [K : L][L : k] = |H||G : H| = |G|.
Nach Satz 6.17 ist dann k ⊆ K galoissch. Sei jetzt k ⊆ K unendlich. Wir wählen ein a ∈ K\k. Dann gibt es Nullstellen u1 , . . . , un von Polynomen aus F2 , so dass a ∈ k(u1 , . . . , un ) ist. Also ist a in einem Zerfällungskörper M für eine endliche Menge von Polynomen aus F2 enthalten. Somit ist [M : k] endlich. Nach dem ersten Teil des Beweises ist dann k ⊆ M galoissch. Also gibt es ein σ ∈ G (M/k) mit σ (a) ≠ a. Nach Satz 7.7 gibt es eine Fortsetzung ϕ von σ auf K , d. h. ϕ(a) ≠ a für ein ϕ ∈ G (K/k) = G. Somit ist k (G) = k, und dann ist k ⊆ K galoissch. Korollar 8.11. Sei k ⊆ K algebraisch mit char k = 0. Dann ist k ⊆ K genau dann galoissch, wenn k ein Zerfällungskörper einer Menge von Polynomen aus k[x] ist. Beweis. Nach Korollar 8.8 ist die Erweiterung k ⊆ K separabel. Nun folgt die Behauptung mit Satz 8.10. Korollar 8.12. Sei k ⊆ K algebraisch. Dann ist k ⊆ K genau dann eine Galoiserweiterung, wenn K normal und separabel über k ist. Damit ist die eingangs gestellte Frage beantwortet. Insbesondere gilt die Umkehrung von Satz 6.25! Es gilt sogar, dass es zu jeder separablen Erweiterung k ⊆ L eine kleinste Galoiserweiterung gibt, die L enthält. Satz 8.13. Sei k ⊆ L eine separable Erweiterung. Sei N der normale Abschluss von L in einem algebraischen Abschluss. Dann ist k ⊆ N separabel. Beweis. Sei F = {ma | a ∈ L} ⊆ k[x]. Nach Satz 7.2 enthält N einen Zerfällungskörper von F . Die Minimalität von N liefert mit (NOR 3), dass N ein Zerfällungskörper von F ist. Nun folgt die Behauptung mit Satz 8.10. Wir können nun die Frage, wann eine Körpererweiterung einfach ist (siehe Kapitel 2) ein Stück weiter beantworten.
122
Separable Erweiterungen
Satz 8.14 (Satz vom primitiven Element). Jede endliche separable Erweiterung k ⊆ K eines unendlichen Körpers k ist einfach. (Für |k| < ∞ siehe Satz 5.40.) ¯ . Nach Satz 8.13 ist N separabel und Beweis. Sei N der normale Abschluss von K in K nach Korollar 8.12 ist k ⊆ N galoissch. Nach Satz 7.5 ist [N : k] endlich, und dann G (N/k)| endlich. Damit hat aber G (N/k) nur endlich viele Untergruppen. ist auch |G Nach Satz 6.14 hat dann k ⊆ N auch nur endlich viele Zwischenkörper. Das gleiche gilt auch für k ⊆ K . Nach Satz 3.27 ist dann K = k(α) mit geeignetem α.
Wir können nun verstehen, warum das Beispiel 8.1 möglich war. Wir zeigen erst, dass stets char K ≠ 0 sein muss, und dann, dass K ein unendlicher Körper sein muss, da sonst keine nicht separablen Erweiterungen existieren. Definition 8.15. Ein Körper k heißt vollkommen, wenn jede algebraische Erweiterung von k separabel ist. Satz 8.16. Sei k ein Körper. (1) Ist char k = 0, so ist k vollkommen. (2) Ist char k = p > 0, so ist k genau dann vollkommen, wenn jedes Element in k eine p -te Potenz ist. Beweis. Die erste Aussage steht bereits in Korollar 8.8. Sei nun k vollkommen mit char k = p > 0. Sei F der Zerfällungskörper von {x p − a | a ∈ k}. Wir halten ein a ∈ k fest, und sei b eine Nullstelle von x p − a. Wegen (x p − a) = px p−1 = 0 folgt mit Satz 8.6, dass (x p − a) = (x − b)p ist. Da k vollkommen ist, ist x − b der einzige irreduzible Teiler von x p − a in k[x]. Also ist b ∈ k, d. h. a = bp und somit ist k = {bp | b ∈ k}. Seien umgekehrt k = {up | u ∈ k} und a algebraisch über k. Sei ma das i p Minimalpolynom von a und g = n i=0 ai x das Minimalpolynom von a . Da nach p p Annahme k = {u | u ∈ k} ist, gibt es bi , i = 1, . . . , n, mit ai = bi . Dann ist 0 = g(ap ) =
n i=0
ai (ap )i =
n
bi ai
p
.
i=0
n i p Also ist ma ein Teiler von g(x p ) = in k[x]. Da ma irreduzibel ist, i=0 bi x i ist ma ein Teiler von n b x . Das liefert grad m a ≤ n = grad g . i=0 i Sei jetzt a nicht separabel. Mit Satz 8.6 erhalten wir dann ein separables Polye e nom f ∈ k[x] mit ma (x) = f (x p ) für ein e > 0. Nun ist 0 = ma (a) = f (ap ). pe−1 p ) ist somit h(a ) = 0. Also ist g ein Teiler von h. Dies liefert Mit h(x) = f (x grad g ≤ grad h < grad ma , was aber nicht möglich ist.
Separable Erweiterungen
123
Korollar 8.17. Endliche Körper und algebraische Erweiterungen vollkommener Körper sind vollkommen. Beweis. (1) Sei k ⊆ K vollkommen und K ⊆ L algebraisch. Sei M eine algebraische Erweiterung von L. Nach Lemma 3.9 ist M eine algebraische Erweiterung von K . Also ist M separabel und L ist vollkommen. (2) Sei k = GF(p). Dann ist x p − x = 0 für alle x ∈ k, also gilt k = {up | u ∈ k}. Somit ist k vollkommen nach Satz 8.16(2). Sei nun K endlich. Dann ist [K : GF(p)] endlich, also ist GF(p) ⊆ K eine algebraische Erweiterung nach Satz 3.2. Die Behauptung folgt jetzt mit (1). Zum Abschluss dieses Kapitels wollen wir alle endlichen Körper angeben. Diese haben die interessante Eigenschaft, dass sie alle galoissch über ihrem Primkörper sind. Satz 8.18. Sei F ein endlicher Körper mit q Elementen und Primkörper k = GF(p). Dann ist q = p n mit [F : k] = n und F ist Zerfällungskörper von x q − x ∈ k[x]. Ist umgekehrt 0 < n ∈ N und p eine Primzahl. Dann gibt es einen bis auf Isomorphie eindeutig bestimmten Körper F mit q = p n Elementen. Es ist k ⊆ F galoissch mit zyklischer Galoisgruppe G = G (F /k) von der Ordnung n. Die Gruppe G wird von der Abbildung σ mit σ : a → ap .
erzeugt. Beweis. Da F ein Vektorraum der Dimension n über k ist, folgt q = p n . Die multiplikative Gruppe von F hat die Ordnung q − 1. Sei also a ∈ F \{0}. Dann ist nach Satz 5.5 | a!| ein Teiler von q − 1. Also ist aq−1 = 1 und aq = a. Somit ist jedes Element von F Nullstelle von x q − x . Das liefert, dass F in dem Zerfällungskörper von x q − x enthalten ist. Nach Satz 1.38 hat x q − x höchstens q verschiedene Nullstellen. Da |F | = q ist, folgt, dass F die Menge der Nullstellen von x q − x ist, also ist F der Zerfällungskörper von x q − x . Sei umgekehrt F der Zerfällungskörper von x q −x über k. Sind a und b Nullstellen von x q − x , so ist aq = a und b q = b. Da q = p n ist, erhalten wir dann auch (a ± b)q = aq ± bq = a ± b und (ab)q = aq b q = ab. Also bilden die Nullstellen von x q − x einen Körper. Da (x q − x) = −1 ist, hat x q − x nach Satz 1.38 und Lemma 8.5 genau q verschiedene Nullstellen. Also ist |F | = q. Die Eindeutigkeit von F folgt mit Korollar 3.18. k Die Abbildung σ : a → ap ist in G (F /k). Ist σ k = id, so ist ap = a für alle a ∈ F . n Da offenbar ap = a für alle a ∈ F gilt, können wir 0 < k ≤ n annehmen. Weiter k hat x p − x höchstens p k viele Nullstellen, was k = n liefert. Damit erhalten wir G (F /k)|. Das liefert σ ! = G (F /k) und k ⊆ F ist galoissch | σ !| = n = |F : k| ≥ |G nach Satz 6.14.
124
Separable Erweiterungen
Definition 8.19. Sei p eine Primzahl und n ∈ N. Den nach Satz 8.18 eindeutig bestimmten Körper mit p n Elementen bezeichnen wir mit GF(p n ). Den Automorphismus a → ap für a ∈ GF(p n ) nennen wir den Frobeniusautomorphismus.1
Übungen 1. 2. 3. 4. 5.
6. 7. 8.
9.
Seien K ein unendlicher Körper und L = K(x1 , . . . , xn ) eine algebraische Erweiterung von K . Sind x2 , . . . , xn separabel über K , so ist K ⊆ L einfach. Zeige, dass GF(2)(x 2 , y 2 ) ⊆ GF(2)(x, y) nicht einfach ist. Sei k ⊆ K eine algebraische Erweiterung. Jedes Polynom aus k[x] habe eine Nullstelle in K . Ist k vollkommen, so ist K ein algebraischer Abschluss von k. ¯ von K hat f genau dann mehrfache Sei f ∈ K[x] mit f ≠ 0. Im algebraischen Abschluss K Nullstellen, wenn ggT(f , f ) ≠ 1 ist. ¯ , der über K separabel (a) Sei K ein Körper. Dann gibt es einen maximalen Teilkörper L von K ist. (b) Je zwei Körper L aus (a) sind isomorph. n Sei char K = p ≠ 0 und a ∈ F , wobei K ⊆ F eine endliche Erweiterung sei. Ist dann ap ∈ K pm für alle n, so gibt es ein m ∈ N, so dass a separabel über K ist. Seien die Voraussetzungen wie in Aufgabe 6. Ist kein a ∈ F \K separabel über K , so gibt es für n jedes a ∈ F ein n = n(a) mit ap ∈ K . Seien f ∈ Q[x] und K der Zerfällungskörper von f . Setze G = G (K/Q). Seien weiter α eine Nullstelle von f in K und U = {g | g ∈ G, g(α) = α}. Zeige: Äquivalent sind: (a) Ist V eine Untergruppe von G mit U ⊆ V ⊆ G, so ist U = V oder V = G. (b) Ist L ein Körper mit Q ⊆ L ⊆ Q(α), so ist Q = L oder L = Q(α). n Finde eine notwendige und hinreichende Bedingung für n, so dass x 2 + x + 1 irreduzibel über GF(2) ist.
1 G. F. Frobenius, * 26.10. 1849 Berlin, † 3. 8. 1917 Berlin, Professor in Zürich und Berlin. Hauptarbeitsgebiet Gruppentheorie.
9 Rein inseparable Erweiterungen Wir haben im letzten Kapitel gesehen, dass Zerfällungskörper galoissch sind, falls sie separabel sind. In diesem Kapitel wollen wir den extrem anderen Fall betrachten. Definition 9.1. Sei K ⊆ F eine algebraische Erweiterung. Ein Element a ∈ F heißt rein inseparabel über K , falls das Minimalpolynom ma ∈ K[x] in jedem Zerfällungskörper von ma nur die Nullstelle a hat. Wir nennen F rein inseparabel über K , falls jedes Element aus F rein inseparabel über K ist. Lemma 9.2. Seien K ⊆ F eine algebraische Erweiterung und a ∈ F \ K rein inseparabel n n über K . Dann ist char K = p > 0 und es gibt ein n ∈ N mit ma = x p − ap ∈ K[x]. pn Als Polynom in F [x] gilt ma = (x − a) . Beweis. Dies folgt sofort aus Satz 8.6. Lemma 9.3. Sei K ⊆ F eine algebraische Erweiterung. (1) Ist a ∈ F rein inseparabel und gleichzeitig separabel, so ist a ∈ K . (2) Ist K ⊆ F eine rein inseparable Körpererweiterung, so ist sie normal und es ist G(F /K) = {id}. (3) Ist F = K(W ) und für alle a ∈ W sei stets a rein inseparabel über K , so ist die Erweiterung K ⊆ F rein inseparabel. (4) Seien K ⊆ F und F ⊆ L algebraische Erweiterungen. Dann ist K ⊆ L rein inseparabel genau dann, wenn F ⊆ L und K ⊆ F rein inseparabel sind. Beweis. (1) Da a rein inseparabel und separabel ist, ist ma = x − a das Minimalpolynom. Also ist a ∈ K . (2) Ist a ∈ F , so gibt es nach Lemma 9.2 ein n = n(a) ∈ N ∪ {0}, so dass n ma = (x − a)p ist. Somit ist F ein Zerfällungskörper der ma mit a ∈ F . Also ist K ⊆ F normal. Sei δ ∈ G(F /K). Dann ist ma (δ(a)) = 0, also ist δ(a) = a für alle a ∈ F . Damit ist δ = id. (3) Sei a ∈ F . Dann ist a ∈ K(a1 , . . . , an ) für geeignete a1 , . . . , an ∈ W . Da m alle Elemente in W rein inseparabel sind, gibt es mi ∈ N ∪ {0} mit ap i ∈ K nach m p Lemma 9.2. Sei m = maxn ∈ K für alle i = 1, . . . , n. i=1 mi . Dann ist ai Da a ein Polynom in den ai ist und wegen char K = p das Potenzieren mit p ein m m Automorphismus ist, folgt ap ∈ K . Also ist ma ein Teiler von (x − a)p , d. h. a ist rein inseparabel. (4) Ist K ⊆ L rein inseparabel, so gibt es für jedes a ∈ L ein m = m(a) ∈ N ∪ {0} m m mit ap ∈ K , also auch ap ∈ F . Somit ist F ⊆ L rein inseparabel und K ⊆ F rein inseparabel.
126
Rein inseparable Erweiterungen
Seien umgekehrt K ⊆ F und F ⊆ L rein inseparabel und a ∈ L. Dann gibt es ein m m r m = m(a) ∈ N ∪ {0} mit ap ∈ F und ein r = r (a) ∈ N ∪ {0} mit (ap )p ∈ K . m+r Also ist ap ∈ K , d. h. K ⊆ L ist rein inseparabel. √ √ √ Beispiel 9.4. Seien K = GF (2)(x) und F = K( 6 x). Dann ist F = K( x, 3 x). Es √ √ √ ist x rein inseparabel und 3 x ist separabel. Also ist K( x) rein inseparabel und √ K( 3 x) ist separabel.
In dem Beispiel haben wir eine Aufteilung in eine separable Erweiterung und eine rein inseparable Erweiterung. Wir wollen jetzt zeigen, dass dies kein Zufall ist. Dazu zunächst eine Definition. Definition 9.5. Sei K ⊆ F eine algebraische Erweiterung. Der separable Abschluss von K in F ist die Menge aller a ∈ F , die separabel über K sind. Der rein inseparable Abschluss von K in F ist die Menge aller a ∈ F , die rein inseparabel über K sind. Lemma 9.6. Seien K ⊆ F eine algebraische Erweiterung, S der separable Abschluss von K in F und I der rein inseparable Abschluss von K in F . Dann sind S und I Körpererweiterungen von K , wobei K ⊆ S separabel und K ⊆ I rein inseparabel ist. Weiter ist S ⊆ F rein inseparabel und S ∩ I = K . Beweis. Nach Satz 8.10 sind separabel erzeugte Erweiterungen separabel. Also ist S ein Körper. Nach Lemma 9.3 sind rein inseparabel erzeugte Erweiterungen rein inseparabel, also ist I ein Körper. Nach Lemma 9.3(1) ist I ∩ S = K . n Sei nun a ∈ F . Dann ist nach Satz 8.6 das Minimalpolynom ma = g(x p ) mit pn einem separablen Polynom g ∈ K[x]. Wir setzen b = a . Dann ist g(b) = 0, also n ist g = mb . Insbesondere ist b separabel, d. h. b ∈ S . Somit ist ap ∈ S für alle a ∈ F . Damit ist F rein inseparabel über S . Lemma 9.7. Seien K ⊆ F normal, S der separable Abschluss von K in F und I der G (S/K)) und rein inseparable Abschluss von K in F . Dann ist S/K galoissch, I = k (G G (S/K) G (F /I). Insbesondere ist I ⊆ F galoissch. Weiter ist F = SI . Beweis. Sei a ∈ S . Dann sind alle Nullstellen von ma separabel. Also liegen alle in S , d. h. S ist normal über K nach Satz 7.2. Mit Korollar 8.12 folgt, dass K ⊆ S galoissch ist. Sei G = G (F /K). Dann ist S invariant unter G. Wir definieren Θ : G (F /K) → G (S/K) mit Θ(δ) = δ|S für δ ∈ G (F /K).
Gemäß Lemma 9.3(2) ist ker Θ G (F /S) = {id}. Nach Satz 7.7 kann jeder Isomorphismus δ ∈ G (S/K) zu einem τ ∈ G (F /K) fortgesetzt werden, also τ|S = δ. Somit ist Θ ein Isomorphismus.
Rein inseparable Erweiterungen
127
Ist a ∈ I , so ist δ(a) = a, wie bereits gezeigt. Also ist I ⊆ k (G). Sei b ∈ k (G). n Nach Lemma 9.6 gibt es ein n ∈ N ∪ {0} mit bp ∈ S . Sei nun τ ∈ G (S/K). Da Θ surjektiv ist, gibt es ein δ ∈ G (F /K) mit δ|S = τ . Also gilt n
n
n
τ(bp ) = δ(b p ) = bp .
Dies bedeutet n
G (S/K)) = K. b p ∈ k(G
Damit ist b rein inseparabel über K , was I = k (G) liefert. Insbesondere erhalten wir G (F /K) = G (F /I) und I ⊆ F ist galoissch. Damit ist I ⊆ F separabel nach Korollar 8.12. Da I ⊆ SI ist, ist F separabel über SI . Da S ⊆ SI ist, ist andererseits SI ⊆ F rein inseparabel. Somit liefert Lemma 9.6 die Behauptung SI = F . Beispiel 9.8. Wir wollen hier zeigen, dass die Normalität in Lemma 9.7 notwendig ist. Seien dazu k ein Körper mit char k = 2 und K = k(x, y) der Körper der rationalen Funktionen in zwei Variablen über k. Sei u eine Nullstelle des irreduziblen Polynoms √ t 2 + t + x ∈ K[t] in einem Zerfällungskörper. Wir setzen S = K(u) und F = S( uy). √ Es ist K ⊆ S separabel und S ⊆ F rein inseparabel, da ( uy)2 ∈ S ist. Also ist S der separable Abschluss von K in F . Wir wollen den rein inseparablen Abschluss I von K in F bestimmen. Sei dazu √ √ a ∈ F mit a2 ∈ K . Da [F : K] = 4 ist, ist 1, u, uy, u uy eine Basis der Körpererweiterung. Wir schreiben a bezüglich dieser Basis, d. h. a = α + βu + γ uy + δu uy mit α, β, γ, δ ∈ K. Das liefert mit u2 = u + x dann: a2 = α2 + β2 (u + x) + γ 2 (uy) + δ2 (u + x)(uy) = α2 + β2 (u + x) + γ 2 (uy) + δ2 (uy + xy + uxy) = α2 + β2 x + δ2 (xy) + (β2 + (γ 2 + δ2 )y + δ2 (xy))u.
Da a2 ∈ K ist, ist der Koeffizient vor u gleich Null. Das liefert β2 + (γ + δ)2 y + δ2 xy = 0.
Wir nehmen zunächst δ ≠ 0 an. Dann ist x=
β2 + (γ + δ)2 y = δ2 y
%
&2
γ +1 δ
+
% &2 β 1 . δ y
Es sind ( γδ + 1)2 und ( βδ )2 in K 2 ⊆ k(x 2 , y 2 ). Damit erhalten wir den Widerspruch x ∈ k(x 2 , y 2 )(y) = k(x 2 , y). Somit ist δ = 0. Das liefert β2 + γ 2 y = 0. Da y kein Quadrat in K ist, ist γ = 0 und dann auch β = 0. Also ist a ∈ K , d. h. I = K und I ⊆ F ist nicht separabel. Es ist offenbar F ≠ SI .
128
Rein inseparable Erweiterungen
Übungen 1. 2.
Sei K ein Körper mit char K = p > 0. Ist K ⊆ F eine rein inseparable Erweiterung, K ≠ F , so enthält F einen Teilkörper L mit [L : K] = p . Seien K ein Körper mit char K = p > 0 und F = K(a) für ein a mit dem Minimalpolynom e ma = x p − b ∈ K[x], e ∈ N. Bestimme alle Teilkörper L mit K ⊆ L ⊆ F .
10 Radikalerweiterungen In diesem Kapitel wollen wir zu der eingangs gestellten Frage zurückkommen und klären, warum es für manche Gleichungen Auflösungsformeln gibt, die nur arithmetische Operationen und Wurzeln benutzen, und für andere nicht. Zuerst wollen wir aber das Problem einmal korrekt formulieren. Definition 10.1. Seien k und M Körper. Eine Erweiterung k ⊆ M heißt Radikalerweiten(i) rung, falls M = k(u1 , . . . , un ) mit ui ∈ k(u1 , . . . , ui−1 ), für geeignete n(i) ∈ N, i = 1, . . . , n, ist. Indem man notfalls neue ui einführt, kann man sogar n(i) = pi , pi Primzahl, annehmen. Das erste Ziel dieses Kapitels ist der Beweis der folgenden Aussage: Ist k ⊆ M eine Radikalerweiterung von k und L ein Zwischenkörper, so ist G (L/k) auflösbar. Ein paar Worte zu diesem Satz und obiger Definition sind notwendig. Der Begriff Radikalerweiterung übersetzt in die Sprache der Körpertheorie unser Problem, ob sich die Nullstellen eines Polynoms nur durch arithmetische Operationen und Wurzeln ausdrücken lassen. In der Anwendung ist L ein Zerfällungskörper. Es wäre vermessen zu erwarten, dass L selbst eine Radikalerweiterung ist. Wollen wir die Nullstellen durch Radikale (Wurzelausdrücke) beschreiben, so müssen wir dazu eventuell L verlassen. Man denke nur daran, dass die Formeln für die Gleichung 3-ten Grades, selbst wenn die Nullstellen reell sind, d. h. L ⊆ R ist, komplexe Zahlen benutzen, die nicht in R liegen. Wesentlich bei unserer Definition ist, dass wir nur den Fall behandeln, dass alle Nullstellen durch Radikale ausdrückbar sind. Es ist möglich, dass manche Nullstellen durch Radikale und andere nicht durch Radikale ausdrückbar sind, z. B. f = gh, g hat Nullstellen, die durch Radikale ausdrückbar sind, h hat keine solche. Wir werden sehen, dass für irreduzibles f entweder alle Nullstellen durch Radikale beschrieben werden können oder keine der Nullstellen. Da wir die bisher entwickelte Galoistheorie anwenden wollen, müssen wir von der Radikalerweiterung zu einer normalen Erweiterung, der normalen Hülle, übergehen können. Wir zeigen zunächst, dass diese auch eine Radikalerweiterung ist. Lemma 10.2. Seien k ⊆ L und k ⊆ M beides Radikalerweiterungen von k. Dann ist auch k ⊆ LM eine Radikalerweiterung. Beweis. Sei L = k(u1 , . . . , un ) und M = k(v1 , . . . , vm ). Dann ist LM = k(u1 , . . . , un , v1 , . . . , vm )
und n(i)
vi
∈ k(v1 , . . . , vi−1 ) ⊆ k(u1 , . . . , un , v1 , . . . , vi−1 ) für alle i = 1, . . . , m.
130
Radikalerweiterungen
Lemma 10.3. Sei L eine Radikalerweiterung von k und M die normale Hülle von L über k. Dann ist M eine Radikalerweiterung. Beweis. Nach Satz 7.5 wird M von endlich vielen Radikalerweiterungen von k erzeugt. Nun folgt die Behauptung mit Lemma 10.2. Lemma 10.4. Sei p eine Primzahl und L der Zerfällungskörper von x p − 1 über k. Dann ist G (L/k) abelsch. Beweis. Ist char k = p , so ist x p − 1 = (x − 1)p und L = k. Sei also char k ≠ p . Dann ist x p − 1 separabel, da (x p − 1) = px p−1 ist. Sei ε ≠ 1 und εp = 1. Dann ist {1, ε, ε2 , . . . , εp−1 } die Menge der Nullstellen von x p − 1. Also ist L = k(ε). Sind σ , τ ∈ G (L/k), so sind εσ und ετ Nullstellen von x p − 1. Also ist ε σ = εi und ετ = εj für geeignete i, j . Dann ist offenbar εσ τ = εij = ε ji = ε τσ , d. h. σ τ = τσ . Also ist G (L/k) abelsch. Lemma 10.5. Sei k ein Körper, in dem x n − 1 in Linearfaktoren zerfällt. Sei 0 ≠ a ∈ k und L der Zerfällungskörper über k von x n − a. Dann ist G (L/k) abelsch. Beweis. Sei u eine Nullstelle von x n − a und ε eine Nullstelle von x n − 1. Dann ist auch εu eine Nullstelle von x n − a. Sind u und v Nullstellen von x n − a, so ist (uv −1 )n = aa−1 = 1. Also ist v = εu mit εn = 1, d. h. die εu, wobei ε Nullstelle von x n − 1 ist, sind die sämtlichen Nullstellen von x n − a. Somit ist L = k(u), da nach Vorausetzung ε ∈ k ist. Seien σ , τ ∈ G (L/k), so folgt uσ = εu und uτ = ηu mit ε n = 1 = ηn . Damit ist στ u = εηu = ηεu = uτσ , d. h. G (L/k) ist abelsch. Satz 10.6. Ist k ⊆ L ⊆ M und M eine Radikalerweiterung von k, so ist G (L/k) auflösbar.
Bemerkung. Die Idee des Beweises des Satzes ist denkbar einfach. Eine Radikalerweiterung ist eine Folge von Erweiterungen N(u) mit un ∈ N . Solche Erweiterungen haben abelsche Galoisgruppen, wie wir gerade gesehen haben. Also wird die Galoisgruppe aus abelschen Schichten aufgebaut. Unglücklicherweise gibt es viele technische Probleme. Wir müssen, um Lemma 10.5 anwenden zu können, fehlende Einheitswurzeln hinzufügen. Weiter müssen wir die verschiedenen Erweiterungen zunächst zu Galoiserweiterungen machen, bevor die Galoiskorrespondenz arbeiten kann. Beweis von Satz 10.6. Seien G = G (L/k) und k0 = k (G). Wir können ohne Einschränkung k0 = k annehmen. Sei weiter N der normale Abschluss von M . Nach
Radikalerweiterungen
131
Lemma 10.3 ist N eine Radikalerweiterung. Also können wir ohne Einschränkung annehmen, dass M über k normal ist. Es ist k ⊆ L galoissch, da k (G) = k ist. Nach Lemma 7.14 ist G (M/L) G (L/k). G (M/k)/G
Anwendung von Satz 5.55 liefert, dass es genügt zu zeigen, dass G (M/k) auflösbar ist. Im Rest des Beweises spielt also L keine Rolle mehr. Sei M = k(u1 , . . . , un ). Gemäß der Bemerkung nach Definition 10.1 können wir annehmen, dass un(i) ∈ k(u1 , . . . , ui−1 ) ist, wobei n(i) eine Primzahl ist. i Nach dieser Reduktion können wir den Satz durch Induktion nach n beweisen. p Sei dazu M ein minimales Gegenbeispiel. Es ist u1 ∈ k mit einer Primzahl p . Sei M0 der Zerfällungskörper von x p − 1 über M und M1 ⊆ M0 der Zerfällungskörper von x p − 1 über k, also M0 = M1 M . √ p M0 = M( 1) G (M0 /k) auflösbar M1 (u1 )
G (M1 /k)
abelsch
abelsch
√ p k( 1) = M1
abelsch
abelsch
M = k(u1 , . . . , un )
G (M1 (u1 )/M1 )
abelsch
normal
G (M/k)
G (M0 /M1 )
G (M0 /M)
G (M0 /M1 (u1 ))
abelsch k
id
Nach Satz 7.2 ist M1 normal über k. Lemma 10.4 liefert nun: G (M1 /k) ist abelsch.
(1)
Es ist M0 = M1 (u1 , . . . , un ). Da x p − 1 in M1 völlig in Linearfaktoren zerfällt, gilt nach Lemma 10.5: G (M1 (u1 )/M1 ) ist abelsch.
(2)
Es ist M0 normal über k. Dann liefert Satz 7.10, dass M0 auch über M1 normal ist. Weiter ist M1 (u1 ) als Zerfällungskörper nach Satz 7.2 auch normal über M1 . Somit folgt mit Lemma 7.14: G (M0 /M1 (u1 )) G (M1 (u1 )/M1 ). G (M0 /M1 )/G
Um zu zeigen, dass G (M0 /M1 ) auflösbar ist, genügt es nach Satz 5.55 und (2) zu zeigen, dass G (M0 /M1 (u1 )) auflösbar ist.
132
Radikalerweiterungen
Es ist M0 = M1 (u1 )(u2 , . . . , un ). Per Induktion ist somit G (M0 /M1 (u1 )) auflösbar. Also haben wir: G (M0 /M1 ) ist auflösbar.
(3)
Es ist k ⊆ M1 ⊆ M0 und alle diese Körpererweiterungen sind normal. Also ist nach Lemma 7.14: G (M0 /M1 ) G (M1 /k). G (M0 /k)/G
Mit (1), (3) und Satz 5.55 erhalten wir, dass G (M0 /k) auflösbar ist.
(4)
Da M normal über k ist, folgt mit Lemma 7.14: G (M0 /k)/G G (M0 /M) G (M/k).
Mit Satz 5.55 folgt nun die Behauptung, dass G (M/k) auflösbar ist. Wir wollen uns die Umkehrung von Satz 10.6 ansehen. Diese gilt nicht in dieser Allgemeinheit. Zunächst betrachten wir den Fall char k = 0. Der Fall char k = p wird in Kapitel 13 nachgeholt. Satz 10.7. Sei k ⊆ L eine endliche Galoiserweiterung mit char k = 0. Enthält k alle primitiven p -ten Einheitswurzeln für jede Primzahl p , die die Ordnung von G (L/k) teilt und ist G = G (L/k) auflösbar, so ist k ⊆ L eine Radikalerweiterung. Beweis. Wir beweisen den Satz durch Induktion nach |G|. Wir können G ≠ 1 annehmen, da sonst k = L ist, und die Behauptung gilt. Sei N G mit 1 ≠ G/N abelsch. Ein solches N existiert nach Definition 5.54. Da in einer abelschen Gruppe jede Untergruppe normal ist, können wir |G/N| = p für eine Primzahl p annehmen. Sei M = k (N). Nach Satz 6.24 ist [M : k] = p . Weiter erhalten wir mit Lemma 6.5(2) N = G (L/M). Anwendung von Satz 5.55 liefert, dass N auflösbar ist. Also ist per Induktion M ⊆ L eine Radikalerweiterung von M . Es genügt somit, den Fall [L : k] = p zu betrachten, was dann |G| = p und G = σ liefert. Wir wollen nun zeigen, dass L = k(c) mit c p ∈ k ist. Sei ε eine primitive p-te Einheitswurzel in k. Wir betrachten das lineare Gleichungssystem :
p−1
εij σ i (x) = 0,
j = 0, . . . , p − 1,
i=0
mit den Unbestimmten σ i (x), i = 0, . . . , p − 1.
( ∗)
Radikalerweiterungen
133
Die Determinante von (∗) ist die Vandermondesche1 Determinante. Da die εj paarweise verschieden sind, ist diese Determinante nicht Null. Also hat (∗) nur die triviale Lösung. Wir wählen ein b ∈ L\k. Angenommen, es wäre
p−1
εij σ i (b) = 0
für alle j ≠ 0.
i=0
Dann ist
p−1
σ i (b) =
i=0
p−1p−1
j=0
p−1
p−1 p−1 εij σ i (b) = ε ij σ i (b) = pb.
i=0
i=0
j=0
p−1
p−1
Da σ i=0 σ i (b) = i=0 σ i (b) ist, ist i=0 σ i (b) ∈ k. Also folgt der Widerspruch pb ∈ k. Indem wir ε durch eine geeignete Potenz ersetzen, können wir also
p−1
c=
εi σ i (b) ≠ 0
i=0
annehmen2 . Es ist
p−1
σ j (c) =
p−1
ε i σ i+j (b) =
i=0
ε−j εi+j σ i+j (b) = cε−j .
i=0
Das liefert εj = cσ j (c)−1 .
Nun gilt
p−1
k
p−1
εj =
j=0
cσ j (c)−1 = c p
p−1
j=0
−1 σ j (c) .
j=0
Weiter ist σ
p−1
p−1 σ j (c) = σ j (c).
j=0
j=0
Also ist p−1
σ j (c)
−1
∈ k.
j=0
Damit erhalten wir c p ∈ k.
Da ε = cσ (c)−1 ist und ε ≠ 1 ist, folgt σ (c) ≠ c , d. h. c ∈ k. Nun ist L = k(c) und L ist Radikalerweiterung.
1 A. T. Vandermonde, * 28. 2. 1735 Paris, † 1. 1. 1796 Paris, tätig in Paris, Determinantentheorie. p−1 2 Das Polynom i=0 ε i σ i (x) nennt man auch Lagrange-Resolvente.
134
Radikalerweiterungen
Wir wollen jetzt Satz 10.6 und Satz 10.7 auf die Fragestellung anwenden, ob ein Polynom f ∈ k[x] Nullstellen besitzt, die sich nur durch arithmetische Operationen und Wurzeln ausdrücken lassen. Dazu verbinden wir zunächst die Begriffe Polynom und Galoisgruppe. Definition 10.8. Sei f ∈ k[x]. Mit der Galoisgruppe Gf von f bezeichnen wir die Galoisgruppe eines Zerfällungskörpers von f über k. Da alle Zerfällungskörper isomorph sind, ist diese Definition von der Auswahl des Zerfällungskörpers unabhängig. Da Gf auf den Nullstellen von f operiert, können wir Gf als Untergruppe von Σn (n = grad f ) auffassen.3 Ist nun K der Zerfällungskörper von f und M0 der Körper der Einheitswurzeln der Ordnung n! über k, so setzen wir K1 = KM0 . Ist k ⊆ K1 eine Radikalerweiterung, so sind die Lösungen von f (x) = 0 offensichtlich rationale Ausdrücke von Wurzeln. Umgekehrt folgt, dass k ⊆ K1 Radikalerweiterung ist, falls sich die Lösungen von f (x) = 0 so ausdrücken lassen. Die Lösbarkeit von f (x) = 0 durch Radikale ist also auf die Frage, ob k ⊆ K1 eine Radikalerweiterung ist, zurückgeführt. Dies ist die gleiche Frage, ob M0 ⊆ K1 eine Radikalerweiterung ist. Nach Satz 10.7 und Satz 10.6 ist dies äquivalent zu der Frage, ob G auflösbar ist oder nicht. Damit haben wir gezeigt: Satz 10.9. Ist f ein irreduzibles Polynom über k, char k = 0, so ist f genau dann durch Radikale auflösbar, falls f eine auflösbare Galoisgruppe hat. Satz 10.10. Sei f ein irreduzibles Polynom über k und L eine Radikalerweiterung von k, die eine Nullstelle von f enthält, so ist die Galoisgruppe von f über k auflösbar. Beweis. Sei N der normale Abschluss von L über k. Nach Lemma 10.3 ist dann N eine Radikalerweiterung von k. Weiter liefert Satz 7.2, dass N einen Zerfällungskörper von f enthält, also ist die Galoisgruppe von f auflösbar. Satz 10.10 besagt, dass es bei irreduziblen Polynomen nicht vorkommen kann, dass eine Nullstelle durch Radikale, eine andere aber nicht so ausgedrückt werden kann. Ist f ein Polynom vom Grad n, so ist die Galoisgruppe isomorph zu einer Untergruppe von Σn . Wir hatten in Satz 5.59 gesehen, dass Σn für n ≤ 4 auflösbar ist. Ist also grad f ≤ 4, so ist G nach Satz 5.55 auflösbar. Nun folgt mit Satz 10.7, dass wir die „bekannten“ Auflösungsformeln für die Nullstellen von f haben. Indem man in
3 So hat übrigens Galois die Galoisgruppe definiert. Zu Zeiten von Galois wurden Gruppen stets als Permutationsgruppen betrachtet. Cayley war der erste, der eine abstrakte Gruppe definierte. Das erste Axiomensystem der Gruppe, so wie wir es heute haben, wurde in dem Algebra-Lehrbuch von Weber [59] angegeben.
Radikalerweiterungen
135
dem Beweis von Satz 10.7 für b eine Nullstelle von f wählt, kann man rückwirkend das Polynom auflösen. Das werden wir in Beispiel 18.7 bei der Gleichung vom Grad 3 benutzen. Ist n ≥ 5, so ist nach Satz 5.58 Σn nicht auflösbar. Dass es stets Gleichungen mit der Gruppe Σn gibt, hatten wir bereits in Beispiel 6.26(2) gesehen. Wir wollen nun aber auch über Q eine Gleichung mit nicht auflösbarer Galoisgruppe angeben. Wir werden in Kapitel 18 noch weitere solche Gleichungen kennenlernen. Satz 10.11. Sei p eine Primzahl und f ∈ Q[x] ein irreduzibles Polynom vom Grad p . Es habe f in C genau zwei nicht reelle Nullstellen. Dann ist Σp die Galoisgruppe von f über Q. Beweis. Sei u eine Nullstelle. Dann ist nach Satz 3.13 p = [Q(u) : Q]. Sei L der ! ! G (L/Q)|. Zerfällungskörper, so ist p ! [L : Q], also ist p ! |G Nach Satz 5.52 gibt es ein σ ∈ G (L/Q) mit o(σ ) = p . Seien u1 , u2 , . . . , up die Nullstellen und u1 , u2 die beiden nicht reellen. Indem wir σ durch eine geeignete Potenz ersetzen, können wir annehmen, dass σ der Permutation (1, 2, . . . , p) der Nullstellen (u1 , . . . , up ) entspricht. Weiter ist wegen f ∈ Q[x] stets das Bilden des konjugiert Komplexen τ ein Element von G (L/k). Es ist τ(u1 ) = u2 und τ(ui ) = ui für i > 2. Also entspricht τ der Permutation (1, 2). Nach Lemma 5.61 ist (1, 2, . . . , p), (1, 2) = Σp . Beispiel 10.12. Sei f = x 5 −6x+3 ∈ Q[x]. Nach Satz 1.48 mit p = 3 ist f irreduzibel. Es ist f (−2) = −17, f (−1) = 8, f (0) = 3, f (1) = −2, f (2) = 23. Also hat f mindestens 3 reelle Nullstellen. Nach dem Satz von Rolle werden die Nullstellen von f durch Nullstellen von f getrennt. Es ist f = 5x 4 − 6 mit den Nullstellen ± 4 (6/5). Also hat f genau 3 reelle Nullstellen. Nach Satz 10.11 hat dann f die Galoisgruppe Σ5 . Also können die Nullstellen von f nicht durch Radikale ausgedrückt werden. Damit haben wir ein erstes Beispiel eines Polynoms, dessen Nullstellen nicht nur mit den arithmetischen Operationen und Wurzeln ausgedrückt werden können. Betrachtet man die Auflösungsformeln für die Gleichungen vom Grad höchstens vier, so sieht man, dass darin auch nur Wurzeln vom Grad höchstens vier vorkommen. Man kann die Fragestellung nach der Existenz von Auflösungsformeln also noch verschärfen, indem man fragt, ob es für eine Gleichung vom Grad n Auflösungsformeln gibt, in denen nur Wurzelausdrücke vorkommen, deren Grad höchstens n ist. Wir werden darauf in Kapitel 13 zurückkommen und im Beweis von Satz 13.9 sehen, dass dies für char k = 0 richtig ist. Dass dies im allgemeinen nicht so sein muss, zeigt eine kleine Überlegung. Ist k endlich, so ist auch der Zerfällungskörper L eines Polynoms f ∈ k[x] endlich. Damit ist jede Nullstelle von f eine Einheitswurzel. Somit ist jedes Polynom über einem endlichen Körper auflösbar. Wie die nachfolgende Aufgabe 1 zeigt, genügen aber noch nicht einmal bei einem quadratischen Polynom Quadratwurzeln, um die Nullstellen zu beschreiben.
136
Radikalerweiterungen
Übungen 1. 2. 3.
Bestimme die Galoisgruppe über GF(2) von x 2 + x + 1. Zeige, dass die Gleichung x 2 + x + 1 = 0 über GF(2) nicht durch „Quadratwurzelziehen“ lösbar ist. Sei f ∈ K[x] ein irreduzibles separables Polynom vom Primzahlgrad p . Ist die Galoisgruppe G = Gf auflösbar, so hat G einen Normalteiler N = σ mit |N| = p . Seien die Voraussetzungen wie in Aufgabe 2. Identifiziere die Nullstellen von f mit den Elementen von GF(p) in der Art, dass σ (x) = x + 1 ist. Sei α ∈ Gf . Dann folgt α(x) = ax + b
4.
5.
6.
7.
8.
mit eindeutig durch α bestimmten a, b ∈ GF(p). Insbesondere ist |Gf | ein Teiler von p(p − 1). Seien die Voraussetzungen wie in Aufgabe 2. (a) Sind α, β zwei beliebige Nullstellen von f , so ist K(α, β) ein Zerfällungskörper. (b) Ist K ⊆ R und p > 2, so sind entweder alle Nullstellen oder genau eine Nullstelle reell. Sei K ein Körper und p eine Primzahl. Für jede endliche separable Erweiterung M von K gelte ! p ! [M : K]. Dann ist für jede endliche separable Erweiterung M von K stets [M : K] eine Potenz von p . Finde Radikalerweiterungen von Q, die die folgenden Elemente aus C enthalten. √ √ √ (a) ( 11 − 7 23)/ 4 5. √ √ (b) ( 6 + 2 3 5)4 . √ √ (c) (2 5 5 − 4)/ 1 + 99. Zeige, dass die folgenden Polynome über Q nicht durch Radikale auflösbar sind: (a) x 5 − 4x + 2. (b) x 5 − 4x 2 + 2. (c) x 5 − 6x 2 + 3. (d) x 7 − 10x 5 + 15x + 5. Löse die folgende Gleichung über Q durch Radikale auf: x 6 + 2x 5 − 5x 4 + 9x 3 − 5x 2 + 2x + 1 = 0.
(Setze u = x + x1 !) 9. Zeige, dass die Galoisgruppe von f = x 5 − 4x 4 + 2x 2 + 2 ∈ Q[x] die Gruppe Σ5 ist. 10. Löse x 5 − 7x 4 + x 3 − x 2 + 7x − 1 durch Radikale auf.
11 Regelmäßige n-Ecke In diesem Kapitel greifen wir die in Kapitel 4 begonnenen Untersuchungen wieder auf. Wir betrachten die folgende Frage: Für welche n kann das regelmäßige n-Eck mit Zirkel und Lineal konstruiert werden? Die Griechen kannten Konstruktionen für n = 3, 5 und 15. Sie wussten auch, wie man das 2n-Eck vom n-Eck ausgehend, konstruiert. 2000 Jahre lang kamen aber keine wirklich neuen Erkenntnisse hinzu, bis am 30. März 1796 C. F. Gauß feststellte, dass das regelmäßige 17-Eck konstruierbar ist. In seinen Disquisitiones Arithmeticae gab er notwendige und hinreichende Kriterien für die Konstruierbarkeit an. Wir wollen diese Kriterien nun beweisen. Für die Notation vgl. Kapitel 4. Der Ausdruck „konstruierbar“ wird in diesem Kapitel stets für „mit Zirkel und Lineal konstruierbar“ benutzt. Lemma 11.1. Seien P eine Punktmenge des R(2) , die (0, 0) und (1, 0) enthält, und M = {a, b | (a, b) ∈ P }. Sind x und y in Q(M), so ist (x, y) von P aus konstruierbar. Beweis. Sei (x0 , y0 ) gegeben, so können wir (0, x0 ) und (0, y0 ) wie folgt konstruieren:
(0, x0 )
(0, y0 )
(0, 0)
(x0 , y0 )
(1, 0)
Von (0, 0) und (1, 0) können wir die Koordinatenachsen konstruieren, indem wir auf (0, 0)(1, 0) die Senkrechte in (0, 0) konstruieren. Dann können wir die Parallelen durch den Punkt (x0 , y0 ) zu den Achsen konstruieren. Sind umgekehrt (0, x0 ) und (0, y0 ) gegeben, so können wir (x0 , 0) konstruieren. Der Schnittpunkt der Senkrechten durch (0, y0 ) und (x0 , 0) liefert (x0 , y0 ). Also genügt es zu zeigen, dass aus (0, x) und (0, y) auch die Punkte (0, x + y), (0, x − y), (0, xy) und (0, x/y), (y ≠ 0) konstruiert werden können. Ein Kreis mit Radius y um (0, x) schneidet die y -Achse in (0, x + y) und (0, x − y), also sind die ersten beiden Punkte konstruierbar. Für die beiden anderen argumentieren wir wie folgt.
138
Regelmäßige n-Ecke
(0, x) (0, y)
ϕ
ϕ (1, 0)
(u, 0)
Wir verbinden (1, 0) mit (0, y) und ziehen eine Parallele durch (0, x). Das liefert den Punkt (u, 0). Es ist y/x = 1/y = tan ϕ, also ist u = x/y . Somit ist (0, x/y) konstruierbar. Wir wählen x = 1. (Es ist konstruierbar!) Dann ist (1/y, 0) konstruierbar, also auch (0, 1/y). Somit ist aus (0, 1/y) und (0, x) auch (x(1/y)−1 , 0) = (xy, 0) konstruierbar. Lemma 11.2. Sei k ⊆ k(α) ⊆ R mit [k(α) : k] = 2. Dann ist jeder Punkt (z, t) ∈ R2 mit Koordinaten z, t ∈ k(α) von einer geeigneten endlichen Menge von Punkten, deren Koordinaten in k liegen, konstruierbar. Beweis. Es ist α2 + pα + q = 0 mit geeigneten p, q ∈ k. Dabei ist bekanntlich √ −p± p2 −4q α= . Da α ∈ R ist, folgt p2 − 4q ≥ 0. 2 √ Die Behauptung folgt mit Lemma 11.1, falls wir (0, r ) für jedes positive r ∈ k mit endlich vielen Punkten (xi , yi ), xi , yi ∈ k, konstruieren können. Wir können (−1, 0) und (r , 0) konstruieren. (0, v)
a
(−1, 0)
b
(r , 0)
Der Kreis mit (−1, 0)(r , 0) als Durchmesser trifft die y -Achse im Punkt (0, v). Es ist v 2 +1 = a2 , v 2 +r 2 = b2 und a2 +b2 = (r +1)2 . Also ist (r +1)2 = 2v 2 +1+r 2 , √ d. h. v = r .
Regelmäßige n-Ecke
139
Satz 11.3. Sei k ⊆ R ein von den Koordinaten einer Menge P ⊆ R(2) mit (0, 0), (1, 0) ∈ P erzeugter Körper. Sei L ⊆ R ein Körper mit k ⊆ L und seien α, β ∈ L. Es gebe eine Kette k = K0 ⊆ K1 ⊆ · · · ⊆ Kr = L von Körpern Ki mit [Ki+1 : Ki ] = 2, i = 0, . . . , r − 1. Dann ist (α, β) von P aus konstruierbar. Beweis. Wir beweisen die Behauptung durch Induktion nach r . Der Induktionsanfang r = 0 steht in Lemma 11.1. Es ist (α, β) von endlich vielen Punkten aus Kr −1 nach Lemma 11.2 konstruierbar. Die Induktion liefert nun, dass diese Punkte aus P konstruierbar sind. Wegen Satz 4.4 ist die Existenz solcher Ki für die Konstruierbarkeit auch notwendig. Damit haben wir nun ein Kriterium, mit dem wir Konstruierbarkeitsfragen entscheiden können. Indem wir noch die Galoistheorie ins Spiel bringen, erhalten wir: Satz 11.4. Seien P ⊆ R(2) eine Punktmenge mit (0, 0), (1, 0) ∈ P und k der von den Koordinaten der Punkte aus P erzeugte Körper in R. Ist L ⊆ R ein normaler Erweiterungskörper von k mit [L : k] = 2r , für geeignetes r , so ist für jedes Paar α, β ∈ L der Punkt (α, β) aus P konstruierbar. Beweis. Da char L = 0 ist, ist k ⊆ L eine Galoiserweiterung nach Korollar 8.8 und Korollar 8.11. Sei G die zugehörige Galoisgruppe. Es ist |G| = 2r . Ist k = L, so ist die Behauptung klar. Also können wir ab jetzt G ≠ 1 annehmen. Wir zeigen, dass es eine Kette von Körpern Ki k = K0 ⊂ · · · ⊂ Kr = L
mit [Ki : Ki−1 ] = 2 für i = 1, . . . , r gibt. Dann folgt die Behauptung mit Satz 11.3. Wir wollen dies per Induktion nach [L : k] = 2r beweisen. Satz 5.53 liefert eine Untergruppe x mit |x| = 2, die normal in G ist. Sei Kr −1 = k (x). Dann ist nach Satz 6.24 [L : Kr −1 ] = 2 und G/x G (Kr −1 /k). Schließlich ist auch k ⊆ Kr −1 normal. Per Induktion existiert eine Kette k = K0 ⊂ · · · ⊂ Kr −1
mit [Ki : Ki−1 ] = 2
für i = 1, . . . , r − 1.
Also haben wir die gesuchte Kette k = K0 ⊂ · · · ⊂ Kr −1 ⊂ Kr = L.
Ab jetzt halten wir die Menge P = {(0, 0), (1, 0)} fest. Der von den Koordinaten dieser Menge erzeugte Körper ist dann Q. Also ist jeder Punkt mit rationalen Koordinaten konstruierbar. Wir wollen uns der Konstruktion des regelmäßigen n-Ecks zuwenden. Offenbar ist das regelmäßige n-Eck genau dann konstruierbar, wenn der Punkt (α, β) mit 2π α = cos 2π n und β = sin n konstruiert werden kann.
140
Regelmäßige n-Ecke
Lemma 11.5. Seien n, m natürliche Zahlen. (1) Ist das regelmäßige n-Eck konstruierbar und m ein Teiler von n, so ist auch das regelmäßige m-Eck konstruierbar. (2) Sind m und n teilerfremd und sind das regelmäßige m- und n-Eck konstruierbar, so ist auch das regelmäßige mn-Eck konstruierbar. Beweis. (1) Das regelmäßige n-Eck ist nach Voraussetzung konstruierbar. Wir setzen d = n/m und verbinden nun jede d-te Ecke des n-Ecks. Das liefert ein regelmäßiges m-Eck. (2) Da ggT(m, n) = 1 ist, gibt es nach Satz 1.22 a, b ∈ Z mit am + bn = 1.
Das liefert 1 1 1 =a +b . mn n m
Also können wir aus den Winkeln α
2π n
und
2π m
den Winkel
2π mn
konstruieren.
α
Korollar 11.6. Sei n = p1 1 · · · pr r die Primfaktorzerlegung von n. Dann ist das regelα mäßige n-Eck genau dann konstruierbar, falls jedes regelmäßige pi i -Eck konstruierbar ist. Lemma 11.7. Für jedes α ist das regelmäßige 2α -Eck konstruierbar. Beweis. Die Halbierung des Winkels ist möglich. Nun folgt die Behauptung durch Induktion nach α. Es genügt somit, ungerade Primzahlpotenzen zu betrachten. In der komplexen Ebene bilden die n-ten Einheitswurzeln die Ecken eines regelmäßigen n-Ecks. Weiter sind sie die Nullstellen von x n − 1. Diesen Zusammenhang werden wir im Folgenden ausnutzen. Lemma 11.8. Sei p eine Primzahl, so dass das regelmäßige p n -Eck konstruierbar ist. Sei ε eine primitive p n -te Einheitswurzel in C. Dann ist der Grad des Minimalpolynoms von ε über Q eine 2-Potenz. 2π i
Beweis. Es ist ε = e pn . Nach Voraussetzung ist (α, β) mit α = cos(2π /p n ) und β = sin(2π /p n ) konstruierbar. Also ist nach Satz 4.4 [Q(α, β) : Q] = 2r . Weiter ist [Q(α, β, i) : Q] = 2r +1 . Aber Q(α, β, i) enthält auch α + iβ = ε. Somit ist 2r +1 = [Q(α, β, i) : Q(ε)][Q(ε) : Q], d. h. [Q(ε) : Q] ist eine 2-Potenz. Nun folgt die Behauptung mit Satz 3.13.
Regelmäßige n-Ecke
141
Lemma 11.9. Sei p eine Primzahl und ε eine primitive p -te Einheitswurzel in C. Dann ist mε = 1 + x + · · · + x p−1 das Minimalpolynom von ε über Q. Beweis. Sei f = x p−1 + · · · + 1 = (x p − 1)/(x − 1). Dann ist f (ε) = 0. In Beispiel 1.49(2) haben wir gezeigt, dass f irreduzibel ist. Lemma 11.10. Sei p eine Primzahl und ε eine primitive p2 -te Einheitswurzel in C. Dann ist mε = x p(p−1) + x p(p−2) + · · · + x p + 1. 2
Beweis. Wir setzen g = x p(p−1) + x p(p−2) + · · · + x p + 1 = (x p − 1)/(x p − 1). Dann ist g(ε) = 0. Einsetzen von x = 1 + u liefert: 2
g(1 + u) =
2
(1 + up ) − 1 (1 + u)p − 1 ≡ p (1 + u) − 1 (1 + up ) − 1
(mod p).
Also ist g(1 + u) = up(p−1) + pf (u)
mit f ∈ Z[u].
Andererseits ist g(1 + u) = 1 + (1 + u)p + · · · + (1 + u)p(p−1) ,
d. h. f hat den konstanten Term 1. Nach Satz 1.48 ist also g irreduzibel. Satz 11.11 (Gauß). Das regelmäßige n-Eck ist genau dann mit Zirkel und Lineal konstruierbar, falls n die Gestalt n = 2r p1 · · · ps , r , s ≥ 0, mit paarweise verschiedenen n Primzahlen pi von der Form 22 i + 1 hat. α
α
Beweis. Sei n = 2r p1 1 · · · ps s die Primfaktorzerlegung. Sei weiter zunächst das α regelmäßige n-Eck konstruierbar. Nach Korollar 11.6 ist dann jedes regelmäßige pi i Eck konstruierbar. Ist αi ≥ 2 für ein i, so liefert Lemma 11.5, dass dann auch das regelmäßige pi2 -Eck konstruierbar ist. Damit ist nach Lemma 11.8 und Lemma 11.10 dann pi (pi − 1) eine 2-Potenz, ein Widerspruch. Also ist αi = 1 für alle i. Damit ist das regelmäßige pi -Eck konstruierbar. Dann liefern Lemma 11.8 und Lemma 11.9, dass pi − 1 = 2si für ein geeignetes si gilt. Sei si = ab mit ungeradem a. Dann ist pi = (2b )a + 1. j j b Da stets x a + 1 = (x + 1) a−1 j=0 (−1) x ist, folgt, dass pi von 2 + 1 geteilt wird, was ni a = 1 liefert. Somit ist si = 2 . Damit haben wir die Notwendigkeit bewiesen. Habe nun umgekehrt n die angegebene Gestalt. Aus Korollar 11.6 folgt, dass es genügt, Primzahlpotenzteiler von n zu betrachten. Nach Lemma 11.7 ist das regelmäßige 2r -Eck konstruierbar. Also müssen wir nur zeigen, dass jedes regelmäßige pi -Eck konstruierbar ist.
142
Regelmäßige n-Ecke
Sei ε eine primitive pi -te Einheitswurzel in C. Dann erhalten wir mit Lemma 11.9 [Q(ε) : Q] = pi − 1 = 2ai mit geeignetem ai . Da mit ε auch alle Potenzen von ε in Q(ε) enthalten sind, ist Q(ε) galoissch. Anwendung von Lemma 10.4 liefert, dass G (Q(ε)/Q) = G abelsch ist. Wir setzen K = R ∩ Q(ε). 2π ¯ Es ist ε = cos 2π pi + i sin pi ∈ R. Also ist τ mit τ(a) = a ein Automorphismus von Q(ε) mit k (τ) = K . Das liefert [Q(ε) : K] = 2 und H = G (Q(ε)/K) = τ mit Satz 6.24. ¯ Somit sind [K : Q] = 2ai −1 und cos 2π pi = (ε + ε )/2 ∈ k (τ) = K . Damit ist nach Satz 11.4 (0, cos 2π pi ) konstruierbar.
(0, cos 2π ) pi
(sin 2π , cos 2π ) pi pi
Durch Errichten der Senkrechten auf der y -Achse in (0, cos 2π ) und Schneiden pi
mit dem Einheitskreis erhalten wir (sin 2π , cos 2π ). Also ist das regelmäßige pi - Eck pi pi konstruierbar. Wir haben somit das Problem der Konstruierbarkeit in die Zahlentheorie verlagert. n
Wann ist Fn = 22 + 1 eine Primzahl? 1640 bemerkte Fermat1 , dass F0 = 3, F1 = 5, F2 = 17, F3 = 257 und F4 = 65537 n Primzahlen sind. (Nach ihm werden die Primzahlen der Form 22 + 1 Fermatprimzahlen genannt). Fermat vermutete, dass Fn stets eine Primzahl ist. Diese Vermutung wurde 1732 durch Euler2 widerlegt. Er zeigte, dass F5 = 641 × 6700417 ist. Für n ≤ 19
1 Pierre de Fermat, * 20. 8. 1601 Beaumont-de-Lomagne, † 12. 1. 1665 Castres, Jurist und Mathematiker. Er war Mitglied des obersten Gerichtshofs in Toulouse und beschäftigte sich mit Mathematik nur als Hobby. Fermat lieferte wesentliche Beiträge zur Geometrie, Analysis und Wahrscheinlichkeitstheorie. Berühmt sind seine Beiträge zur Zahlentheorie und hier insbesondere der „Große Fermatsche Satz“. Die Versuche, diesen Satz zu beweisen, führten zur Entwicklung der algebraischen Zahlentheorie. Schließlich wurde der Satz 1995 von A. Wiles bewiesen. 2 L. Euler, * 15. 4. 1707 Basel, † 18. 9. 1783 St. Petersburg, Professor in Berlin und St. Petersburg, bedeutendster Mathematiker des 18. Jahrhunderts. Euler lieferte auf fast allen damals zur Mathematik gehörenden Gebieten grundlegende Beiträge. Er publizierte über 500 Arbeiten und ca. 350 wurden erst nach seinem Tode publiziert. Bedeutend waren nicht nur seine erzielten Sätze, sondern auch seine Fähigkeit, die ihm bekannte Mathematik zu vereinheitlichen und zu systematisieren.
143
Regelmäßige n-Ecke
sind die obigen die einzigen Fermatprimzahlen. Für n > 19 gibt es für bestimmte n Nichtprimzahlbeweise. Z. B. wird F1945 von 5 · 21947 + 1 geteilt. Es gibt viele Konstruktionen des regelmäßigen 17-Eckes. Nachfolgend wollen wir zwei angeben. Eine Konstruktion des regelmäßigen 257-Eckes wurde 1832 von Richelot3 angegeben. Wir geben hier zunächst eine Konstruktion an, die sich an unserer Theorie orientiert, d. h. wir drücken die Wurzeln von x 17 − 1 durch Radikale aus. Sei Θ = 2π /17. Dann sind εk = cos kΘ + i sin kΘ, 1 ≤ k ≤ 16, die Nullstellen von x 16 + x 15 + · · · + 1. Wir betrachten die Lagrange-Resolvente. Die Galoisgruppe G ist zyklisch von der Ordnung 16. Betrachte den Körper Z/17Z. Die additive Gruppe ist zyklisch von der Ordnung 17, also unsere Gruppe der 17-ten Einheitswurzeln. Hierauf operiert (Z/17Z)∗ G als zyklische Gruppe der Ordnung 16, die von 3 + 17Z erzeugt wird. Dabei gilt modulo 17: m 3m
0 1
1 3
2 9
3 10
4 13
5 5
6 15
7 11
8 16
9 14
10 8
11 7
12 4
13 12
14 2
15 6
16 1
Das liefert die folgenden Ausdrücke, die wir laut Theorie zur Berechnung der Nullstellen betrachten müssen. x1 = ε1 + ε9 + ε13 + ε15 + ε16 + ε8 + ε4 + ε2 x2 = ε3 + ε10 + ε5 + ε11 + ε14 + ε7 + ε12 + ε6 y1 = ε1 + ε13 + ε16 + ε4 y2 = ε9 + ε15 + ε8 + ε2 y3 = ε3 + ε5 + ε14 + ε12 y4 = ε10 + ε11 + ε7 + ε6
Mit εk + ε17−k = 2 cos kΘ folgt x1 = 2(cos Θ + cos 8Θ + cos 4Θ + cos 2Θ) x2 = 2(cos 3Θ + cos 7Θ + cos 5Θ + cos 6Θ) y1 = 2(cos Θ + cos 4Θ) y2 = 2(cos 8Θ + cos 2Θ) y3 = 2(cos 3Θ + cos 5Θ) y4 = 2(cos 7Θ + cos 6Θ).
Weiter gilt x1 + x2 = −1.
3 F. J. Richelot, * 6. 11. 1808 Königsberg, † 31. 3. 1875 Königsberg, Schüler und Nachfolger von C. Jacobi, Arbeitsgebiet elliptische und hyperelliptische Funktionen.
144
Regelmäßige n-Ecke
Mit 2 cos mΘ cos nΘ = cos(m + n)Θ + cos(m − n)Θ folgt nun x1 x2 = 2{cos 4Θ + cos 2Θ + cos 8Θ + cos 6Θ + cos 4Θ + cos 6Θ + cos 5Θ + cos 7Θ + cos 11Θ + cos 5Θ + cos 15Θ + cos Θ + cos 13Θ + cos 3Θ + cos 14Θ + cos 2Θ + cos 7Θ + cos Θ + cos 3Θ + cos 11Θ + cos Θ + cos 9Θ + cos 2Θ + cos 10Θ + cos 5Θ + cos Θ + cos 9Θ + cos 5Θ + cos 7Θ + cos 3Θ + cos 4Θ + cos 5Θ} = 4(x1 + x2 ) = −4.
Also sind x1 und x2 die Nullstellen von t 2 + t − 4.
Es ist x1 > 0 und somit x2 < x1 . Weiter ist x1 = y1 + y2 und y1 y2 = 2{cos 9Θ + cos 7Θ + cos 3Θ + cos Θ + cos 12Θ + cos 4Θ + cos 6Θ + cos 2Θ} = x1 + x2 = −1.
Dann sind y1 und y2 Nullstellen von t 2 − x1 t − 1.
Genauso folgt, dass y3 und y4 Nullstellen von t 2 − x2 t − 1
sind. Wir setzen z1 = 2 cos Θ und z2 = 2 cos 4Θ. Dann ist y3 = z1 z2
und
z1 + z2 = y1 .
Also sind z1 und z2 Nullstellen von t 2 − y 1 t + y3 .
Indem wir nun nacheinander diese Gleichungen lösen, erhalten wir: '
√ √ 1 −1 + 17 + 34 − 2 17 cos Θ = 16 ( ' ' √ √ √ √ + 68 + 12 17 − 16 34 + 2 17 − 2(1 − 17) 34 − 2 17 . Dies ist offenbar konstruierbar. Wir wollen noch eine zweite, mehr geometrische Konstruktion angeben.4
4 Die erste geometrische Konstruktion des regelmäßigen 17-Ecks wurde von Johannes Erchinger 1825 gegeben. Die hier beschriebene Konstruktion geht auf H. W. Richmond [44] 1893 zurück.
Regelmäßige n-Ecke
145
B
P5
P3
K
N3
I
|
N5
F
O E
X N3
A
(1) Wir schlagen einen Kreis um O mit Radius OA. (2) Wir errichten die Senkrechte auf OA in O . Dies liefert den Schnittpunkt B mit dem Kreis. (3) Wir teilen OB in vier gleiche Teile. Dies liefert I mit OI = 1/4OB . (4) Wir teilen den Winkel OIA in vier gleiche Teile. Sei OIE = 1/4OIA. (5) Wir errichten in I auf IE die Senkrechte und halbieren dann den entstandenen Winkel. Damit erhalten wir F mit F IE = 45°. (6) Wir halbieren die Strecke F A. Dies liefert den Mittelpunkt X . Danach schlagen wir einen Kreis um X mit Radius XA. So konstruieren wir den Schnittpunkt K mit OB . (7) Wir schlagen einen Kreis um E mit Radius EK . Dieser schneidet OA in den Punkten N3 und N5 . (8) Wir errichten in N3 und N5 die Senkrechten. Dies ergibt Schnittpunkte P3 und P5 2π mit dem Kreis. Es ist AOP3 = 2π 17 · 3 und AOP5 = 17 · 5.
146
Regelmäßige n-Ecke
Wir wollen zeigen, dass diese Konstruktion in der Tat das 17-Eck liefert. Wir setzen dazu φ = OIE und Θ = 2π 17 . Es ist tan 4φ = 4. Weiter gilt: % 2(cos AOP3 + cos AOP5 ) = 2
ON3 − ON5 OA
& =4
OE OE = = tan φ. OA OI
Mit dem Satz von Pythagoras erhalten wir: (OK)2 + (OA)2 = (AK)2 , (OF )2 + (OK)2 = (F K)2 , (F O + OA)2 = (AK)2 + (F K)2
und (ON3 + ON5 )2 = (N3 K)2 + (N5 K)2 = (ON3 )2 + (OK)2 + (ON5 )2 + (OK)2 .
Das ergibt: 4(cos AOP3 )(cos AOP5 ) = −4 = −4
(ON3 )(ON5 ) (OK)2 = −4 (OA)2 (OA)2 π (F O) FO =− = tan(φ − ). 4 (OA) OI
Es ist 4 cot 4φ = 1. Also ist t 2 + 4t cot 4φ − 4 = t 2 + t − 4. Die Nullstellen hiervon seien x1 und x2 . Es folgt x1 = 2 tan 2φ und x2 = −2 cot 2φ. Seien wie oben y1 , y2 die Nullstellen von t 2 − x1 t − 1 und y3 , y4 die von t 2 − x2 t − 1. Dann gilt π ) 4 π y2 = tan(φ − ) 4 y3 = tan φ y1 = tan(φ +
y4 = − cot φ.
Das liefert nun mit den vorherigen Zuordnungen von y3 und y2 zu cos 3θ bzw. cos 5θ : 2(cos 3θ + cos 5θ) = y3 = tan φ = 2(cos AOP3 + cos AOP5 ) und π 4 cos 3θ cos 5θ = y2 = tan(φ − ) = 4(cos AOP3 )(cos AOP5 ). 4
Somit haben wir: 3θ = AOP3 und 5θ = AOP5 .
Damit sind A, P3 , P5 die 1., 3. bzw. 5. Ecke des regelmäßigen 17-Ecks. Alle weiteren lassen sich hieraus konstruieren.
Regelmäßige n-Ecke
147
Wir haben nun die beiden eingangs gestellten Probleme gelöst. Jetzt können wir die Galoistheorie wirklich würdigen. Wir haben ihre Grundzüge entwickelt und sie auf verschiedene Probleme angewandt. Wenn man wirklich eine Gleichung löst, so wendet man eine große Zahl von Tricks an (Methoden, Formeln, Graphen, numerische Approximation). Dies führt dazu, dass man in der Schule häufig glaubt, dass Algebra im Wesentlichen eine Sammlung von Tricks ist. Wir haben hier gesehen, dass, was als eine Sammlung unzusammenhängender Techniken aussieht, in Wirklichkeit von wenigen Grundprinzipien ausgeht. Das liefert eine Antwort zumindest auf die typische Frage der Algebra „Warum?“. Im weiteren Verlauf dieses Buches wollen wir uns nun zunächst den Fragen zuwenden, die sich direkt aus Kapitel 6–Kapitel 8 ergeben. (1) Realisierbarkeit von Gruppen G als Galoisgruppen über Q. (2) Auflösbarkeit durch Radikale bei endlicher Charakteristik des Grundkörpers. (3) Wie kann man die Galoisgruppe eines Polynoms wirklich berechnen.
Übungen 1. 2. 3. 4.
5.
Gegeben sei ein Winkel α mit cos(α) = 11/16. Zeige, dass die Dreiteilung dieses Winkels mit Zirkel und Lineal möglich ist. Gib eine Konstruktion für das regelmäßige 5-Eck an. Die Zahlen Mp = 2p − 1, p Primzahl, heißen Mersenne-Zahlen5 . Zeige, dass für p ≠ q stets ggT(Mp , Mq ) = 1 ist. n Sei Fn = 22 + 1. Zeige: (a) Fn+1 = 2 + Fn Fn−1 · · · F0 . (b) Ist m ≠ n, so ist ggT(Fm , Fn ) = 1. Benutze Aufgabe 4, um zu zeigen, dass es unendlich viele Primzahlen gibt.
5 M. Mersenne, * 8. 9. 1588 Soultière, † 1. 9. 1648 Paris, studierte zusammen mit R. Descartes am Jesuitenkolleg in La Flèche und wurde 1611 Franziskanermönch. Mersenne gilt als wichtiger Vermittler von Informationen, da er Briefkontakt mit vielen führenden Wissenschaftlern seiner Zeit hatte. Er lieferte Beiträge zur Mathematik, Akustik, Optik und Musiktheorie.
12 Kreisteilungskörper In diesem Kapitel greifen wir die in Kapitel 11 behandelten Körper Q(ε) wieder auf. Wir wollen solche Körper, die von Einheitswurzeln erzeugt werden, genauer untersuchen. Definition 12.1. (1) Sei K ein Körper. Ein Element t ∈ K heißt n-te Einheitswurzel, falls t Nullstelle von x n − 1 ist. Sei ¯ | t n − 1 = 0}. En = {t ∈ K
Ist t ∈ En , aber t ∈ Ei für alle 0 < i < n, so heißt t eine primitive n-te Einheitsprim prim wurzel. Wir bezeichnen diese Menge mit En . Mit Kn bezeichnen wir K(En ) und nennen Kn den n-ten Kreisteilungskörper über K . (2) Sei K = Q. Dann nennen wir φn = (x − t) ∈ C[x] prim
t∈En
das n-te Kreisteilungspolynom. Wir werden sehen, dass die φn immer ganzzahlige Koeffizienten haben. Also können wir sie auch über jedem endlichen Körper lesen. Ein wichtiges Ziel wird sein zu zeigen, dass φn über Q immer irreduzibel ist, über Körpern endlicher Charakteristik dies aber fast nie vorkommt. Zunächst wollen wir uns den Grad [Kn : K] ansehen. Sei prim dazu t ∈ En . Dann ist t i eine Nullstelle von x n − 1 für alle i. Sei 0 < i < j ≤ n mit t i = t j . Dann ist t j−i = 1, ein Widerspruch. Also ist |{t i | i ∈ Z}| = n. Damit ist En prim eine zyklische Gruppe mit Erzeuger t . Im Allgemeinen ist aber nicht klar, dass En nicht leer ist. Dies zu untersuchen, ist unser erstes Ziel. r
r
Lemma 12.2. Für n ∈ N seien n = p11 · · · pkk die Primfaktorzerlegung von n und ϕ(n) die Anzahl der primitiven n-ten Einheitswurzeln in C. Dann ist ϕ(n) =
k
r −1
pi i
(pi − 1).
i=1
Beweis. Ist a eine Lösung von x n − 1 und b eine Lösung von x n − 1, so auch ab. Das Gleiche gilt für a−1 . Also bilden die Lösungen von x n − 1 eine Untergruppe H von C∗ . Nach Satz 5.39 ist diese zyklisch. Da (x n − 1) = nx n−1 ≠ 0 ist, hat x n − 1 genau n verschiedene Nullstellen. Also gibt es primitive n-te Einheitswurzeln, nämlich die Erzeuger von H . Sei nun n = mr mit ggT(m, r ) = 1. Seien weiter t1 eine primitive m-te Einheitswurzel und t2 eine primitive r -te Einheitswurzel. Dann sind t1 , t2 ∈ H . Wir setzen s = t1 t2 , also s n = 1. Nach Lemma 5.27 ist s k ≠ 1 für 0 < k < n. Also ist s eine
Kreisteilungskörper
149
primitive n-te Einheitswurzel. Ist umgekehrt s eine primitive n-te Einheitswurzel, so sind s m = t2 eine primitive r -te Einheitswurzel und s r = t1 eine primitive m-te Einheitswurzel. Das liefert ϕ(n) = ϕ(m)ϕ(r ).
Somit genügt es, die Behauptung für n = p a zu zeigen. Die Anzahl der primitiven p -ten Einheitswurzeln ist aber gleich p a minus der Anzahl der pa−1 -ten Einheitswurzeln, also p a − p a−1 = pa−1 (p − 1). a
Die Funktion ϕ aus Lemma 12.2 nennt man auch die Eulerfunktion. Üblicherweise wird ϕ(n) als die Anzahl der zu n teilerfremden Zahlen zwischen 1 und n eingeführt. Wir wollen zeigen, dass unser ϕ(n) genau diese Anzahl bestimmt. Lemma 12.3. Sei ϕ(n) wie in Lemma 12.2 definiert. Es ist ϕ(n) die Anzahl der i mit 0 < i ≤ n und ggT(n, i) = 1. Insbesondere ist ϕ(n) die Anzahl der invertierbaren Elemente in Z/nZ. Beweis. Sei t eine primitive n-te Einheitswurzel. Sei weiter auch t i eine primitive n-te Einheitswurzel für ein i mit 0 < i ≤ n. Mit Lemma 5.26 erhalten wir dann ggT(i, n) = 1. Sei umgekehrt ggT(i, n) = 1 und t ik = 1 für ein k ∈ N. Nach Lemma 5.26 ist dann n ein Teiler von ik. Also ist n ein Teiler von k, d. h. t i ist primitive n-te Einheitswurzel. Das beweist die erste Behauptung. Sei x + nZ ∈ Z/nZ. Dann gibt es genau dann ein Inverses y + nZ ∈ Z/nZ zu x + nZ, falls es y, z ∈ Z mit xy + nz = 1 gibt. Dies ist gleichwertig zu ggT(x, n) = 1 nach Satz 1.22. Lemma 12.4. Seien n, m ∈ N. Dann gilt ϕ(m)ϕ(n) = ϕ(kgV(m, n))ϕ(ggT(m, n)). x
x
Beweis. Sei n = p1 1 · · · pr r die Primfaktorzerlegung von n. Nach Lemma 12.2 ist ϕ(n) =
r i=1
x −1
pi i
(pi − 1) =
r
x
pi i
r
i=1
Also gilt ϕ(n) = n
pi−1 (pi − 1) = n
i=1
p|n p Primzahl
(1 − p −1 ).
r i=1
(1 − pi−1 ).
150
Kreisteilungskörper
Nun ist ϕ(m)ϕ(n) = mn
(1 − p −1 )
p|n p Primzahl
= kgV(m, n)
(1 − p −1 )
p|m p Primzahl
(1 − p −1 )
p|n oder p|m p Primzahl
ggT(m, n)
(1 − p −1 )
p|n und p|m p Primzahl
= ϕ(kgV(m, n))ϕ(ggT(m, n)). prim
Ist char K = 0, so haben wir in Lemma 12.2 gesehen, dass En ≠ ∅ ist. Ist prim char K = p | n, so ist En sicherlich leer, da (x n − 1) = (x n/p − 1)p ist. prim
Lemma 12.5. Sei char K n. Dann ist En
≠ ∅.
Beweis. Da char K n, ist (x n −1) = nx n−1 ≠ 0. Anwendung von Lemma 8.5 liefert, dass x n − 1 genau n verschiedene Nullstellen hat. Aus Satz 5.39 folgt, dass En zyklisch mit Erzeuger t ist. Ist t m − 1 = 0 für ein m < n, so ist |En | < n, ein Widerspruch. Also gibt es primitive n-te Einheitswurzeln. Satz 12.6. Sei char K n. Dann ist Kn eine einfache Galoiserweiterung von K . Es ist [Kn : K] | ϕ(n), G (Kn /K) ist abelsch und zu einer Untergruppe der Einheitengruppe von Z/nZ isomorph. Beweis. Es ist Kn der Zerfällungskörper von x n − 1. Da (x n − 1) = nx n−1 und char K n ist, hat x n − 1 genau n verschiedene Nullstellen. Also ist x n − 1 ein separables Polynom. Nach Satz 8.10 ist K ⊆ Kn galoissch. Es ist Kn = K(t) mit einer primitiven n-ten Einheitswurzel t . Sei m das Minimalpolynom von t über K . Dann ist m ein Teiler von x n − 1. Ist σ ∈ G (Kn /K), so ist σ (t) auch eine Nullstelle von m, also eine primitive n-te Einheitswurzel. Das liefert σ (t) = t i für ein 0 < i < n. Da o(t) = o(σ (t)) ist, ist ggT(i, n) = 1 nach Lemma 5.26. Wir betrachten die Abbildung R mit R : σ → i + nZ
als Abbildung von G (Kn /K) in die Einheitengruppe von Z/nZ (vgl. Lemma 12.3). Offenbar ist R ein Homomorphismus. Sind σ , τ ∈ G (Kn /K) und ist weiter σ (t) = t i = τ(t), so ist σ −1 τ = id. Also ist R ein Monomorphismus. Damit ist G (Kn /K) zu der Untergruppe Bild R der Einheitengruppe von Z/nZ isomorph. Da diese nach Lemma 12.3 die Ordnung ϕ(n) hat, folgt nun mit Satz 6.24 und Satz 5.5 ! G (Kn /K)| ! ϕ(n). [Kn : K] = |G Es ergibt sich die Frage, wann [Kn : K] = ϕ(n) ist bzw. was über [Kn : K] ausgesagt werden kann, falls [Kn : K] < ϕ(n) ist.
Kreisteilungskörper
151
Satz 12.7. Sei K ein endlicher Körper mit |K| = q = p m . Seien weiter p n und [Kn : K] = f . Dann ist f die Ordnung von q + nZ in der Einheitengruppe von Z/nZ. Beweis. Es ist |Kn | = qf . Für eine primitive n-te Einheitswurzel t mit Kn = K(t) ist f
t q = t,
d. h. tq
f −1
= 1.
Dann ist nach Lemma 5.26 n | qf − 1, d. h. qf + nZ = 1 + nZ und somit, wieder mit Lemma 5.26, ist o(q + nZ) | f . Sei qr + nZ = 1 + nZ mit r ≤ f . Dann ist qr − 1 ≡ 0 (mod n). Also ist r r qr t − t = 0 und mt | x q − x . Nach Satz 8.18 hat der Zerfällungskörper von x q − x genau qr Elemente. Der Zerfällungskörper von mt hat aber qf Elemente, was qf ≤ qr und somit f = r liefert. Um weitere Aussagen über [Kn : K] zu bekommen, müssen wir φn näher untersuchen. Lemma 12.8. Ist n ∈ N, so gilt: (1) φ1 (0) = −1 und φn (0) = 1 für n > 1. (2) φn ∈ Z[x]. Beweis. (1) φ1 = x − 1 und φ2 = x + 1. Sei n ≥ 3 und φd (0) = 1 für alle 1 < d < n bereits gezeigt. Da jede Nullstelle von x n − 1 primitive d-te Einheitswurzel für ein d | n ist, haben wir xn − 1 = φd (x). d|n
Also ist
−1 = 0n − 1 =
φd (0) = −φn (0).
d|n
(2) Es ist φ1 ∈ Z[x]. Sei n > 1 und es gelte φd ∈ Z[x] für alle d < n. Dann ist wieder xn − 1 = φd = φn g mit geeignetem g ∈ Z[x]. d|n
Da I(φn ) = 1 ist, folgt mit Lemma 1.43 nun φn ∈ Z[x]. Wegen Lemma 12.8 ist φn = (x n − 1)
)
φd ∈ Z[x].
d|n, d≠n
Also können wir dieses Polynom über jedem Körper lesen. Ist insbesondere t ∈ K eine primitive n-te Einheitswurzel, so ist mt | φn .
152
Kreisteilungskörper
Beispiele 12.9. Sei n = 12. Es ist φ12 = (x 12 − 1)/(x 6 − 1)(x 2 + 1) = x 4 − x 2 + 1.
Da Q keine primitiven 12-ten Einheitswurzeln enthält, ist nach Satz 12.6 φ12 über Q entweder irreduzibel oder Produkt von zwei quadratischen Polynomen. Sei x 4 − x 2 + 1 = (x 2 + ax + b)(x 2 + cx + d)
mit a, b, c , d ∈ Z. Dann sind a = −c , b = d und b2 = 1. Also ist x 4 − x 2 + 1 = (x 2 + ax + b)(x 2 − ax + b)
mit b ∈ {1, −1}.
Der Koeffizient vor x 2 liefert −1 = 2b − a2 . Also a2 = 3 oder a2 = −1, beides ist in Z nicht möglich. Also ist φ12 irreduzibel über Q. In Satz 12.11 werden wir sehen, dass 12 keine Ausnahme ist, d. h., dass φn über Q stets irreduzibel ist. Sei nun aber K = GF(11). Dann ist x 4 − x 2 + 1 = (x 2 + 5x + 1)(x 2 − 5x + 1). Also ist φ12 nicht irreduzibel. Im nächsten Satz werden wir sehen, dass auch hierfür weder 12 noch char K = 11 eine Ausnahme ist. Satz 12.10. Sei p n und φn irreduzibel über GF(p). Dann ist n = 4 oder n | 2q s , wobei q eine ungerade Primzahl ist. Beweis. Nach Satz 12.7 ist φn genau dann irreduzibel, wenn ϕ(n) gleich der Ordnung von p + nZ in der Einheitengruppe von Z/nZ ist. Also n | pϕ(n) − 1 und n px − 1 für 0 < x < ϕ(n). Sei n = mr mit ggT(m, r ) = 1 und m, r > 1. Die Anwendung von Lemma 12.4 liefert ϕ(n) = ϕ(m)ϕ(r ). Sei u eine primitive m-te Einheitswurzel und sei weiter v eine primitive r -te Einheitswurzel. Dann ist nach Lemma 5.27 t = uv eine primitive n-te Einheitswurzel. Also ist GF(p)(t) = GF(p)(u)(v). Somit müssen φm und φr irreduzibel über GF(p) sein, da wir sonst eine der beiden Ungleichungen [GF(p)(u) : GF(p)] < ϕ(m) oder [GF(p)(v) : GF(p)] < ϕ(r ) hätten, wir aber bereits gezeigt haben, dass [GF(p)(t) : GF(p)] = ϕ(n) = ϕ(m)ϕ(r ) ist. Mit Satz 12.7 erhalten wir r | p ϕ(r ) − 1 und m | p ϕ(m) − 1. Das liefert dann r m = n | p kgV(ϕ(r ),ϕ(m)) − 1 und kgV(ϕ(r ), ϕ(m)) = ϕ(n) = ϕ(m)ϕ(r ). Insbesondere ist ggT(ϕ(r ), ϕ(m)) = 1. Nach Lemma 12.2 können wir annehmen, dass r = 2a eine 2-Potenz ist. Dann ist m ungerade. Also ist 2 | ϕ(m). Nun liefert Lemma 12.2 a = 1. Somit haben wir gezeigt: Ist n keine ungerade Primzahlpotenz, so gilt für jede Zerlegung r · m = n mit 1 < r ≤ m und ggT(r , m) = 1, dass r = 2 ist. Also muss dann m eine ungerade Primzahlpotenz sein. Dies liefert n | 2q s , wobei q eine ungerade Primzahl ist, oder n = 2a .
Sei nun n = 2a . Wir wollen a ≤ 2 zeigen. Sei dazu a ≥ 3. Es ist 8 | p2 − 1 a−2 a−2 und somit 2a | p 2 − 1. Also enthält nach Satz 5.29 und Satz 5.39 GF(p2 ) primitive 2a -te Einheitswurzeln. Das liefert [Kn : GF(p)] ≤ 2a−2 . Andererseits ist aber [Kn : GF(p)] = ϕ(n) = 2a−1 . Dieser Widerspruch zeigt a ≤ 2.
Kreisteilungskörper
153
In den Ausnahmefällen in Satz 12.10 gibt es jeweils unendlich viele Primzahlen p , so dass φn irreduzibel bzw. reduzibel ist. Anders liegen die Dinge, falls K = Q ist. Satz 12.11. Das Kreisteilungspolynom φn ∈ Q[x] ist stets irreduzibel. Weiter ist Q ⊆ Qn eine abelsche Erweiterung von Q und G (Qn /Q) ist zu der Einheitengruppe von Z/nZ isomorph. Beweis. Nach Lemma 12.3 und Satz 12.6 genügt es zu zeigen, dass φn ∈ Q[x] irreduzibel ist. Sei also f ∈ Z[x], f irreduzibel, normiert und f | φn . Wir müssen f = φn zeigen. Wir zeigen zunächst: Ist t ∈ Qn mit f (t) = 0 und p n, p prim, so ist auch f (t p ) = 0.
(∗)
Sei t wie in (∗) aber f (t p ) ≠ 0 für ein p, das n nicht teilt. Da f (t) = 0 ist, ist φn (t) = 0, d. h. t ist eine primitive n-te Einheitswurzel. Dann ist t p eine n-te Einheitswurzel. Somit ist (t p )n − 1 = 0. Es ist φn | x n −1, also erhalten wir x n −1 = f ·h mit h ∈ Z[x] nach Lemma 1.43. Da nach Annahme f (t p ) ≠ 0 ist, folgt h(t p ) = 0. Also ist t eine Nullstelle von h(x p ). Da f irreduzibel ist, ist f = mt und dann f | h(x p ). Das liefert h(x p ) = f (x)g(x)
mit g ∈ Z[x].
Da ap ≡ a (mod p) für alle a ∈ Z ist, folgt h(x p ) ≡ h(x)p
(mod p).
Also ist h(x)p ≡ f (x)g(x) (mod p). Damit haben f und h über GF(p) einen nicht trivialen gemeinsamen Teiler, was liefert, dass x n − 1 = f h in GF(p)n eine doppelte Nullstelle hat. Da p n, ist (x n − 1) = nx n−1 ≠ 0 und (x n − 1) hat nur 0 als Nullstelle. Dieser Widerspruch beweist (∗). Sei nun t ∈ Qn mit f (t) = 0. Sei 0 < i < n mit ggT(i, n) = 1. Wir zeigen f (t i ) = 0. Dies soll durch Induktion nach der Anzahl der Primfaktoren in i geschehen. Sei also p ein Primteiler von i. Nach (∗) ist f (t p ) = 0. Setze u = t p . Dann ist per −1 Induktion f (t i ) = f (u(ip ) ) = 0. Also gilt f (t i ) = 0 für alle 0 < i < n mit ggT(i, n) = 1. Nach Lemma 12.3 hat dann f genau ϕ(n) viele verschiedene Nullstellen. Also ist grad f = grad φn , d. h. f = φn . Damit ist φn irreduzibel. Wir wollen nun das Verhalten der Körper Qn zueinander studieren. Satz 12.12. Qm Qn = QkgV(m,n) . Beweis. Für a = kgV(m, n) erhalten wir Qm ⊆ Qa und Qn ⊆ Qa . Sei t eine primitive m-te Einheitswurzel und r eine primitive n-te Einheitswurzel. Nach Lemma 5.27(2) enthält r , t eine primitive a = kgV(m, n)-te Einheitswurzel. Also ist Qa ⊆ Qm Qn .
154
Kreisteilungskörper
Satz 12.13. Seien m, n ∈ N. Dann ist Qm ⊆ Qn genau dann, wenn eine der folgenden Aussagen gilt: (1) m | n. (2) n ist ungerade und m | 2n. Beweis. Ist m ein Teiler von n, so ist offenbar Qm ⊆ Qn . Sei n ungerade und m ein Teiler von 2n. Dann ist Qm ⊆ Q2n . Da ϕ(n) = ϕ(2n) nach Lemma 12.4 ist, folgt dann mit Satz 12.11 Qn = Q2n . Sei nun umgekehrt Qm ⊆ Qn und m n. Es ist Qm Qn = Qn . Also gilt nach Satz 12.12 Qn = QkgV(m,n) und somit nach Satz 12.11 ϕ(n) = ϕ(kgV(m, n)). Seien u x x u u ur +1 n = p1 1 · · · pr r und kgV(m, n) = p1 1 · · · pr r pr +1 · · · pt t die Primfaktorzerlegungen. Mit Lemma 12.2 erhalten wir ϕ(n) =
r
x −1
(pi − 1)pi i
und
ϕ(kgV(m, n)) =
i=1
t
pui −1 (pi − 1).
i=1
u −1 Da ϕ(n) = ϕ(kgV(m, n)) ist, erhalten wir ti=r +1 pi i (pi − 1) = 1. Wegen n ≠ kgV(m, n) folgt t > r . Also ist t = r + 1 und pr +1 = 2, ur +1 = 1. Das liefert 2n = kgV(m, n) und n ist ungerade. Insbesondere ist m | 2n.
Satz 12.14. Sind m, n ∈ N, so ist Qm ∩ Qn = QggT(m,n) . Beweis. Nach Satz 12.13 bzw. Satz 12.12 sind QggT(m,n) ⊆ Qm ∩ Qn und QkgV(m,n) = Qm Qn .
Aus der ersten Inklusion folgt [Qm ∩ Qn : Q] ≥ ϕ(ggT(m, n)).
( ∗)
Seien G = G (QkgV(m,n) /Q), F = G (Qm ) und H = G (Qn ). Dann folgt mit Satz 6.24 |F | = ϕ(kgV(m, n))/ϕ(m)
und |H| = ϕ(kgV(m, n))/ϕ(n).
Weiter ist F ∩ H ⊆ G (Qm Qn ) = 1. Anwendung von Lemma 5.11 liefert |F H| = |F ||H|/|F ∩ H| = ϕ(kgV(m, n))2 /ϕ(m)ϕ(n) = ϕ(kgV(m, n))/ϕ(ggT(m, n)).
Lemma 12.4
Nun ist F , H ⊆ G (Qm ∩ Qn ). Also ist G (Qm ∩ Qn )| ≥ ϕ(kgV(m, n))/ϕ(ggT(m, n)). |G
Kreisteilungskörper
155
Aus Satz 6.24 folgt dann [QkgV(m,n) : Qm ∩ Qn ] ≥ ϕ(kgV(m, n))/ϕ(ggT(m, n)).
Da [QkgV(m,n) : Q] = ϕ(kgV(m, n)) nach Satz 12.11 ist, folgt dann die Ungleichung [Qm ∩ Qn : Q] ≤ ϕ(ggT(m, n)). Mit (∗) folgt [Qm ∩ Qn : Q] = ϕ(ggT(m, n)) = [QggT(m,n) : Q].
Also ist Qm ∩ Qn = QggT(m,n) . Satz 12.15. Setze Qab =
n∈N Qn .
Dann ist Qab ein Teilkörper von C.
Beweis. Seien x, y ∈ Qab . Dann gibt es m, n ∈ N mit x ∈ Qm bzw. y ∈ Qn . Nach Satz 12.12 sind x, y ∈ QkgV(m,n) . Also sind x ± y und xy −1 beide in Qab enthalten, d. h. Qab ist Teilkörper von C. Ein tiefliegender Satz von Kronecker1 und Weber2 besagt: Ist L eine endliche Galoiserweiterung von Q in C und G (L/Q) abelsch, so ist L ⊆ Qn für geeignetes n. (siehe [37]) Dieser Satz ist Ausgangspunkt für die sogenannte Klassenkörpertheorie, die sich mit abelschen Erweiterungen von algebraischen Zahlkörpern, also endlichen Erweiterungen von Q beschäftigt. Weitere Informationen dazu kann man in dem Artikel von W. Narkiewicz [36] finden. Wir wollen hier nur einen Spezialfall beweisen. Satz 12.16. Ist [K : Q] = 2, so existiert ein n ∈ N mit K ⊆ Qn .
' Beweis. Da [K : Q] = 2 ist, gibt es ein ab ∈ Q, so dass K = Q ab ist. Wegen ' ' √ √ Q a = Q ab = Q( ab) können wir K = Q( m) mit m ∈ Z annehmen. Es b√ b2 √ ist Q( m) ⊆ Q(i, { p | p teilt m}). Offenbar ist Q(i) = Q4 . √ Gibt es nun für jedes p | m ein np mit Q( p) ⊆ Qnp , so ist nach Satz 12.12 K ⊆ QkgV(4,np1 ,...,npr ) , wobei p1 , . . . , pr die Primteiler von m sind. Also genügt es, die Behauptung für m = p, p prim, zu zeigen.
1 L. Kronecker, * 7. 12. 1823 Liegnitz, † 29. 12. 1891 Berlin, Professor in Berlin. L. Kronecker leistete Beiträge zur Linearen Algebra, Eliminationstheorie, Theorie der elliptischen Funktionen. Seine Hauptarbeitsgebiete waren Zahlentheorie und Funktionentheorie. Er entdeckte tiefliegende Beziehungen zwischen beiden Gebieten. 2 H. Weber, * 5. 5. 1842 Heidelberg, † 17. 5. 1913 Straßburg, Professor in Heidelberg, Zürich, Königsberg, Berlin, Marburg, Göttingen und Straßburg. H. Weber lieferte wichtige Beiträge zur Analysis, insbesondere partielle Differentialgleichungen, Algebra und Zahlentheorie. Er legte die Grundsteine für die Darstellungstheorie von Gruppen und die Klassenkörpertheorie. Bewies 1886 den von Kronecker 1853 vermuteten Satz von Kronecker-Weber. Sein „Lehrbuch der Algebra“ war lange Zeit das Standardwerk.
156
Kreisteilungskörper
√ Sei zunächst p = 2. Wir zeigen Q( 2) ⊆ Q8 . Sei α eine primitive 8-te Einheitswurzel in C. Wir setzen β = α + α−1 . Dann ist β2 = (α + α−1 )(α + α−1 ) = α2 + α−2 + 2.
Es ist α2 eine primitive 4-te Einheitswurzel. Also ist α2 ∈ {i, −i}. Dann ist offenbar α−2 = −α2 . Das liefert β2 = 2. √ Somit ist Q( 2) = Q(α + α−1 ) ⊆ Q8 . Sei nun p ungerade. Ist r ∈ N nicht durch p teilbar, so setzen wir ⎧ r ⎨ 1 falls r ≡ x 2 (mod p) für ein x, = ⎩−1 falls r ≡ x 2 (mod p) für alle x. p Man nennt pr das Legendre3 -Symbol. Es spielt in der Zahlentheorie eine große Rolle. Wir wollen nun zunächst einige Rechenregeln für das Legendre-Symbol beweisen. Zunächst bemerken wir, dass die Anzahl der Quadrate modulo p und der Nichtquadrate modulo p in {1, . . . , p − 1} gleich ist. Insbesondere ist ν = 0. p ν=1
p−1
(1)
Sei K = GF(p) Z/pZ. Nach Satz 5.39 ist K ∗ zyklisch von der Ordnung p − 1. Sei α : K∗ → K∗
mit α(a) = a2 .
Dann ist α ein Homomorphismus. Es ist Bild α = Menge der Quadrate in K ∗ . Ist a ∈ Kern α, so ist a2 = 1. Da p ungerade ist, gibt es nach Satz 5.29 genau zwei Elemente a ∈ K ∗ , a = ±1, mit a2 = 1. Also ist |Kern α| = 2. Der Homomorphiesatz (Satz 5.21) liefert nun |K ∗ : Bild α| = 2. Also ist |Bild α| = |K ∗ |/2,
d. h. es gibt genau so viele Quadrate wie Nichtquadrate. Das liefert (1). ν γ νγ : = Sind ν, γ ∈ N, so gilt p p p
(2)
Sei hierzu wieder K = Z/pZ und β : K ∗ → {−1, 1} der natürliche Homomorphismus mit Kern β = (K ∗ )2 . Sei ¯ der natürliche Homomorphismus von Z auf Z/pZ.
3 A. Legendre, * 18. 9. 1752 Paris, † 9. 1. 1833 Paris, Professor in Paris. Legendre lieferte Beiträge zu Zahlentheorie, Variationsrechnung, partiellen Differentialgleichungen und elliptischen Integralen.
Kreisteilungskörper
157
Es ist ( pν ) = ( pν¯ ) = β(¯ ν ). Nun ist aber (2) genau die Aussage, dass β ein Homomorphismus ist. Sei t eine primitive p -te Einheitswurzel. Wir setzen s=
Dann gilt s2 =
ν tν . p ν=1
p−1
p − 1
p:
p
(3)
Es ist p−1 p−1p−1 ν γ νγ νγ t ν+γ = t ν+γ = t ν+γ . p p p p (2) ν,γ=1 ν,γ=1 γ=1 ν=1 p−1
s2 =
Durchläuft ν alle Elemente aus (Z/pZ)∗ , so auch νγ (bei festem γ ). Also gilt νγγ
p−1 p−1
s2 =
γ=1 νγ=1
=
p
ν
p−1 p−1
t νγ+γ =
γ=1 νγ=1
ν t γ(ν+1) = p γ=1 ν=1 γ=1
p−1 p−1
p−1
p − 1
= (p − 1)
p
+
p
t γ(ν+1)
p−2 ν p − 1 0 t + t γ(ν+1) p p ν=1
ν p−1 t γ(ν+1) . p ν=1 γ=1
p−2
Es ist
p−1
t i = 0.
i=0
Also ist
p−1
t γ(ν+1) = −1
für ν + 1 ≠ p.
γ=1
Das liefert nun p − 1
s2 = (p − 1)
p
−
p − 1 p−1 p − 1 ν ν =p − =p . p p p (1) p ν=1 ν=1
p−2
Nun folgt mit (3) und Satz 12.12 p=s
p − 1 p
∈ Qp Q4 = Q4p .
158
Kreisteilungskörper
Wir wollen uns jetzt der Frage zuwenden, wie man die Kreisteilungspolynome (über Q) effektiv berechnen kann. Wir folgen hier im Wesentlichen der Darstellung in dem Buch von H. Lüneburg [32]. Die einfachste Möglichkeit wäre, diese rekursiv zu berechnen, wobei man die Formel x n − 1 = d|n φd benutzt. So folgt: φ1 = x − 1,
φ3 = x 2 + x + 1
φ2 = x + 1,
φ5 = x 4 + x 3 + x 2 + x + 1,
φ4 = x 2 + 1,
φ6 = x 2 − x + 1.
Ist p eine Primzahl, so ist
p−1
φp =
xi .
i=0
Dieses Verfahren hat jedoch den Nachteil, dass man φd für alle echten Teiler von n kennen muss. Wir wollen uns ein anderes Verfahren ansehen. Definition 12.17. Sei n ∈ N und α(n) die Anzahl der verschiedenen Primteiler von n und σ (n) das Produkt dieser Primteiler. Wir setzen ⎧ ⎨(−1)α(n) für σ (n) = n, μ(n) = ⎩ 0 sonst. μ heißt die Möbiusfunktion.
Die Möbiusfunktion stellt also zunächst fest, ob n quadratfrei ist, und in diesem Fall gibt sie an, ob die Anzahl der Primteiler gerade oder ungerade ist. Satz 12.18. Es ist φn =
−1
(x nd
− 1)μ(d) .
d|n
Beweis. Es ist μ(d) −1 μ(d) μ(d) (x nd − 1)μ(d) = φf = φf = φf . d|n
d|n f |nd−1
f d|n
f |n d|nf −1
μ(d) Nun ist d|nf −1 φf = φh d|nf −1 μ(d). f mit h = Sei n ≠ f . Dann gilt d|nf −1 μ(d) = d|σ (nf −1 ) (−1)α(d) . Ist d ein Teiler von σ (nf −1 ), der i Primteiler enthält, so trägt er zu d|σ (nf −1 ) (−1)α(d) den Summanden (−1)i bei. Das liefert nun α(nf −1 ) α(nf −1 ) −1 (−1)α(d) = (−1)i = (1 − 1)α(nf ) = 0. i i=0 d|σ (nf −1 ) Ist n = f , so ist d|nf −1 μ(d) = μ(1) = 1. Also ist φh f = φn oder 1 je nachdem, ob f = n oder f ≠ n ist. Dies ist die Behauptung.
Wir können nun φn gemäß Satz 12.18 berechnen.
Kreisteilungskörper
159
Beispiel 12.19. Es ist φ10 = (x 10 − 1)(x − 1)(x 2 − 1)−1 (x 5 − 1)−1 = x 4 − x 3 + x 2 − x + 1.
Man kann noch einige Vereinfachungen der Berechnung der Kreisteilungspolynome vornehmen, die wir nun beschreiben wollen. Satz 12.20. Sind m, n ∈ N, so ist φmn ein Teiler von φn (x m ). Beweis. Eine Nullstelle α von φmn ist eine primitive mn-te Einheitswurzel. Also ist αm eine primitive n-te Einheitswurzel. Das liefert φn (αm ) = 0 und alle Nullstellen von φmn sind auch Nullstellen von φn (x m ). Da φmn nur einfache Nullstellen hat, folgt φmn | φn (x m ). Satz 12.21. Sind m, n ∈ N und ist jeder Primteiler von m auch Teiler von n, so ist φmn = φn (x m ). Beweis. Es ist ϕ(mn) = mϕ(n) nach Lemma 12.2, da jeder Primteiler von m auch Primteiler von n ist. Also ist grad φmn = grad φn (x m ). Dann ist φmn = φn (x m ) nach Satz 12.20. Korollar 12.22. Ist n ∈ N und n = mσ (n), so ist φn = ϕσ (n) (x m ). Beweis. Jeder Primteiler von m teilt auch σ (n). Nun folgt die Behauptung mit Satz 12.21. Dies gibt uns jetzt eine noch effektivere Berechnungsmethode der Kreisteilungspolynome. Beispiel 12.23. Wir wissen, dass φ6 = x 2 − x + 1 ist. Also erhalten wir mit Korollar 12.22 φ12 = φ6 (x 2 ) = x 4 − x 2 + 1. Korollar 12.24. Ist p eine Primzahl und n ∈ N, so ist φpn =
p−1 i=0
x ip
n−1
.
Beweis. Es ist p n = p · p n−1 = σ (p n )p n−1 . Nun folgt die Behauptung mit Korollar 12.22 und
p−1
φp =
xi .
i=0
Damit können wir nun z. B. sofort φ8 = x 4 + 1 und φ9 = x 6 + x 3 + 1 angeben. Um aber ein allgemeingültiges Verfahren zu entwickeln, müssen wir doch etwas tiefer einsteigen.
160
Kreisteilungskörper
Satz 12.25. Sind m und n teilerfremde natürliche Zahlen und n > 1, falls m = 2 ist, und P die Menge der primitiven m-ten Einheitswurzel. Dann ist φmn = φn (ξx). ξ∈P
Beweis. Für m = 1 ist die Behauptung offenbar. Sei also m ≥ 2. Es ist grad φn (ξx) = ϕ(m)ϕ(n) = ϕ(mn) = grad(φmn ),
(1)
ξ∈P
da ggT(m, n) = 1 ist. Der höchste Koeffizient von ξ∈P φn (ξx) ist gleich
ξ ϕ(n) =
ξ∈P
ϕ(n) ξ . ξ∈P
Ist m > 2, so ist ξ ≠ ξ −1 für alle ξ ∈ P . Also ist ξ∈P ξ = 1. Ist m = 2, so ist P = {−1}. Nun ist aber n > 1, also n ≥ 3, da ggT(2, n) = 1 ist. Dann ist 2 | ϕ(n) und somit (−1)ϕ(n) = 1. Also gilt stets: Der höchste Koeffizient von ϕn (ξx) ist gleich 1. (2) ξ∈P
Um die Gleichheit der beiden Polynome zu zeigen, genügt es nachzuweisen, dass φmn das Polynom ξ∈P φn (ξx) teilt. Dazu genügt es wiederum zu zeigen, dass alle Nullstellen von φmn auch Nullstellen von ξ∈P φn (ξx) sind. Sei hierzu η eine primitive (mn)-te Einheitswurzel. Setze σ = ηn . Dann ist σ eine primitive m-te Einheitswurzel. Da ggT(m, n) = 1 ist, gibt es nach Satz 1.22 a, b ∈ Z mit an + bm = −1.
(3)
Indem wir a durch Vielfache von m abändern, können wir a ∈ N annehmen. Wir setzen nun μ = σ a.
Da ggT(m, a) = 1 ist, ist μ eine primitive m-te Einheitswurzel, also μ m = 1. Das liefert (μη)n = σ an ηn = σ −1−bm σ = σ −1 σ = 1. (3)
Sei r = o(μη). Nach Lemma 5.26 ist r | n. Weiter ist μ r ηr = 1. Also ist dann auch 1 = μ r m ηr m = ηr m . Damit haben wir mn = o(η) | r m, d. h. r = n. Somit ist μη eine primitive n-te Einheitswurzel, was liefert η ist Nullstelle von φn (ξx). (4) ξ∈P
Kreisteilungskörper
161
(4) gilt nun für jede Nullstelle von φmn . Also ist φmn | φn (ξx). ξ∈P
Da die Grade und die höchsten Koeffizienten beider Polynome gleich sind (1), (2), folgt die Behauptung. Wir wenden Satz 12.25 in den nächsten drei Sätzen an, und erhalten damit einen Algorithmus zur Berechnung der Kreisteilungspolynome. Satz 12.26. Ist n ≥ 3 eine ungerade natürliche Zahl, so ist φ2n = φn (−x). Satz 12.27. Ist p eine ungerade Primzahl und sind a, b ∈ N, so ist
p−1
φ2n pb =
a−1 p b−1
(−1)i x i2
.
i=0
Beweis. Satz 12.21 liefert a−1
φ2a pb = φ2pb (x 2
).
Nach Satz 12.26 ist a−1
φ2pb (x 2
a−1
) = φpb (−x 2
).
Mit Korollar 12.24 erhalten wir a−1
φp b (−x 2
p−1
)=
a−1
(−1)i x i2
pb−1
.
i=0
Satz 12.28. Ist n ∈ N und p eine ungerade Primzahl, die n nicht teilt, so ist φn φnp = φn (x p ).
Beweis. Nach Satz 12.20 ist φnp | φn (x p ). Da n nicht von p geteilt wird, ist mit ξ auch ξ p eine primitive n-te Einheitswurzel. Also ist φn | φn (x p ). Da φn und φnp irreduzibel sind, ist ggT(φn , φnp ) = 1 oder φn = φnp . Da aber grad φn = ϕ(n) und grad φnp = ϕ(n)(p − 1) ist, gilt ggT(φn , φnp ) = 1. Also ist φn φnp | φn (x p ).
Nun ist grad φn φnp = ϕ(n)p = grad φn (x p ). Weiter sind die höchsten Koeffizienten von φn φnp und φn (x p ) beide gleich 1. Das liefert die Behauptung.
162
Kreisteilungskörper
Beispiel 12.29. Wir haben nun ein weiteres Verfahren, φn zu berechnen. Wir bestimmen zunächst alle ungeraden Primteiler p1 , . . . , pt von n. Dann berechnen wir φp1 p2 = φp1 (x p2 )φ−1 p1 φp1 p2 p3 = φp1 p2 (x p3 )φ−1 p1 p2
.. . φp1 ···pt = φp1 ···pt−1 (x pt )φ−1 p1 ···pt−1 .
Ist n ungerade, so ist φσ (n) = φp1 ···pt . Ist n gerade, so folgt mit Satz 12.26, dass φσ (n) = φp1 ···pt (−x) −1
ist. Nach Korollar 12.22 ist φn = φσ (n) (x nσ (n) ). Zur Illustration wollen wir φ120 bestimmen. Es ist 120 = 23 · 3 · 5. Wir erhalten mit φ3 = x 2 + x + 1 10 φ15 = φ3 (x 5 )φ−1 + x 5 + 1)/x 2 + x + 1 3 = (x
= x 8 − x 7 + x 5 − x 4 + x 3 − x + 1.
Damit ergibt sich φ30 = φ15 (−x) = x 8 + x 7 − x 5 − x 4 − x 3 + x + 1
und dann φ120 = φ30 (x 4 ) = x 32 + x 28 − x 20 − x 16 − x 4 + 1.
Als Anwendung der Resultate dieses Kapitels wollen wir einen interessanten Satz beweisen, der etwas über Primteiler von ah − 1 aussagt. Diesen werden wir dann auf die Frage anwenden, ob es in {1 + nk | k ∈ N0 } für jedes n unendlich viele Primzahlen gibt. Der Beweis folgt im Wesentlichen der Darstellung in [4]. Lemma 12.30. Ist r ≥ 5 eine natürliche Zahl, so ist inf{(x r − y r )(x + y)−1 | x, y ∈ R, x ≥ y + 1 ≥ 2} > 2r .
Beweis. Wir betrachten (x r − y r )(x + y)−1 als Funktion in x . Deren Ableitung ((r − 1)x r + r x r −1 y + y r )(x + y)−2 ist im Bereich x ≥ 2, y ≥ 1 nicht negativ. Also ist die Funktion wachsend. Somit ist (x r − y r )(x + y)−1 ≥ ((y + 1)r − y r )(2y + 1)−1 .
Es genügt also, ν = inf{((y + 1)r − y r )(2y + 1)−1 | y ∈ R, y ≥ 1} > 2r
zu zeigen.
Kreisteilungskörper
163
Dies ist was wegen y ≥ 1 äquivalent zu: 2r − 1 > 2r für r ≥ 5. 3
Die letzte Behauptung folgt aber leicht durch Induktion nach r . Damit erhalten wir ν > 2r . Für a, b ∈ C und b ≠ 0 setzen wir nun φn (a, b) = bϕ(n) φn (ab−1 )
und L(n) = inf{|φn (a, b)| | a, b ∈ C, |a| ≥ |b| + 1 ≥ 2}.
Lemma 12.31. Ist n ≠ 1, 2, 3, 6, so ist L(n) > σ (n). Beweis. Es seien m und n natürliche Zahlen und jeder Primteiler von m teile auch n. Nach Satz 12.21 ist dann φmn = φn (x m ), also φmn (a, b) = φn (am , bm ). Das liefert: Ist jeder Primteiler von m auch ein Teiler von n, so ist L(mn) ≥ L(n). Insbesondere ist L(n) ≥ L(σ (n)).
(1)
Sei p ein Primteiler von n. Dann gilt ! ! |φnp (a, b)| = |φn (ap , bp )| = ! (ap − νbp )! ≥ (|a|p − |b|p )ϕ(n) , ν
wobei die ν die Nullstellen von φn sind. Nun gilt p p |a| − |b| = (|a| − |b| + |b|) − |b| = (|a| − |b|)i |b|p−i i i=1 p
p
p
p
≥ (|a| − |b|)p + p(|a| − |b|)p−1 ≥ 1 + p.
Das liefert L(np) ≥ (1 + p)ϕ(n) .
(2)
Sei jetzt σ (n) ∈ {1, 2, 3, 6} und sei weiter n > σ (n). Dann ist 4 oder 9 ein Teiler von n. Falls n eine 2-Potenz ist, so ist L(n) ≥ 1 + 2 > 2 = σ (n). (2)
164
Kreisteilungskörper
Falls n durch 12 teilbar ist, so ist ϕ(n/2) ≥ 2 und somit L(n) ≥ (1 + 2)2 = 9 > 6 = σ (n). (2)
Falls n durch 9 teilbar ist, so ist ϕ(n/3) ≥ 2 und L(n) ≥ (1 + 3)2 = 16 > 6 = σ (n). (2)
Also gilt: Ist σ (n) ∈ {1, 2, 3, 6} und n > σ (n), so ist L(n) > σ (n).
(3)
Sei nun n ein kleinstes Gegenbeispiel zur Behauptung des Lemmas. Aus (1) und (3) folgt, dass n quadratfrei ist und von einer Primzahl p ≥ 5 geteilt wird. Sei q ≠ p , q ≥ 3, ein Primteiler von n. Dann ist nq−1 ∈ {1, 2, 3, 6}. Das liefert jetzt per Induktion L(nq−1 ) > σ (nq−1 ) ≥ p > 3. Weil n quadratfrei ist, ist q nq−1 . Nach Satz 12.25 q−1 ist daher φn = i=1 φnq−1 (ν i x) mit einer primitiven q-ten Einheitswurzel ν . Also ist L(n) ≥ L(nq−1 )q−1 . Nun ist L(nq−1 )2 ≥ 3L(nq−1 ). Per Induktion ist dann L(nq−1 )i ≥ (i + 1)L(nq−1 ), also L(nq−1 )q−1 ≥ qL(nq−1 ). Das liefert den Widerspruch n = σ (n) ≥ L(n) ≥ L(nq −1 )q−1 ≥ qL(nq −1 ) > qσ (nq−1 ) = qnq−1 = n.
Es bleibt n ∈ {p, 2p}. Nach Satz 12.26 gilt φ2p (x) = φp (−x) und daher ist φ2p (a, b) = φp (a, −b). Das liefert L(2p) ≥ L(p).
Damit ist 2p ≥ L(p). Wegen |a| ≥ |b| + 1 ≥ 2 gelten a ≠ b und |a − b| ≤ |a| + |b|. Also ist |φp (a, b)| = |ap − bp ||a − b|−1 ≥ (|a|p − |b|p )(|a| + |b|)−1 .
Lemma 12.30 liefert dann ! 2p ≥ L(p) ≥ inf{|a|p − |b|p )(|a| + |b|)−1 ! |a| ≥ |b| + 1, |b| ≥ 1} > 2p.
Dieser Widerspruch beweist Lemma 12.31. Wir sind nun in der Lage, den angekündigten Satz über die Existenz gewisser Primteiler zu beweisen.
Kreisteilungskörper
165
Satz 12.32 (Zsigmondy4 [63]). Seien a und n beides natürliche Zahlen ungleich 1. Dann gibt es eine Primzahl p mit p | an − 1 und p am − 1 für 0 < m < n, es sei denn, es ist n = 2 und a + 1 ist eine Potenz von 2 oder n = 6 und a = 2. Beweis. Ist n = 2, so ist ggT(a + 1, a − 1) ein Teiler von 2. Also gibt es genau dann eine Primzahl p mit p | a + 1, p a − 1, falls a + 1 keine 2-Potenz ist. Sei also jetzt n ≥ 3. Es ist an−1 = d|n φd (a). Somit müssen wir die Primteiler von φn (a) untersuchen. Sei p | φn (a) und p | af − 1, aber p aj − 1 für alle 0 < j < f . Dann ist f | n. Wir setzen n = f pi w mit p w und r = f p i . Dann ist p | ar − 1. Es ist (an − 1)(ar − 1)−1 = (((ar − 1) + 1)w − 1)(ar − 1)−1 w w (ar − 1)i−1 . =w+ i i=2
Aus r < n folgt, dass (an − 1)(ar − 1)−1 =
d|n dr
φd (a) durch φn (a) teilbar ist.
Also ist dann p | (an − 1)(ar − 1)−1 und dann auch p | w , ein Widerspruch. Somit ist r = n, d. h. w = 1. Sei nun i ≥ 1 und sei weiter zunächst p ≥ 3. Wir setzen s = f p i−1 . Es ist p | as − 1. Weiter ist (an − 1)(as − 1)−1 = (((as − 1) + 1)p − 1)(as − 1)−1 p p (as − 1)i−1 = i i=1 p p −1 s = p + 2 p(p − 1)(a − 1) + (as − 1)i−1 . i i=3
Somit ist φn (a) als Teiler von (an − 1)/(as − 1) sicherlich nicht durch p 2 teilbar. Ist p = 2, so ist a ungerade, also ist f = 1. Nun ist 3 ≤ n = 2i , was i ≥ 2 liefert. i−1 Dann ist φn (a) = a2 + 1 nicht durch 4 teilbar. Also gilt stets, dass φn (a) nicht durch p 2 teilbar ist. Wir wollen nun annehmen, dass für alle p, die φn (a) teilen, stets f < n gilt. Dann ist p | n und φn (a) ist quadratfrei. Das liefert jetzt |φn (a)| ≤ σ (n). Wegen φn (a) = φn (a,1) gilt nach Lemma 12.31, dass n = 3 oder 6 ist. Sei zuerst n = 3. Dann ist 3 ≥ φ3 (a) = a2 + a + 1 ≥ 7, ein Widerspruch. Es bleibt n = 6. Nun folgt aus a2 − a + 1 = φ6 (a) ≤ 6 dann a = 2.
4 K. Zsigmondy, * 27. 3. 1867 Wien, † 14. 10. 1925 Wien, ab 1894 Dozent und außerordentlicher Professor in Wien, ordentlicher Professor in Prag und Wien. Sein Hauptarbeitsgebiet war die Zahlentheorie.
166
Kreisteilungskörper
Satz 12.33 (Dirichlet5 ). Sei n ∈ N. Die Menge {1+nk | k ∈ N∪{0}} enthält unendlich viele Primzahlen. Beweis. Für n = 1 bedeutet der Satz, dass es unendlich viele Primzahlen gibt, was bekanntlich richtig ist. Seien also n ≥ 2, a ∈ N und p eine Primzahl mit p | an − 1, aber p ai − 1 für jedes 0 < i < n. Nach Satz 5.5 ist n ein Teiler von p − 1 = |(Z/pZ)∗ |. Also gibt es ein k ∈ N mit p = 1 + nk. Wir setzen nun a = n. Dann folgt mit Satz 12.32, dass es Primzahlen in {1 + nk | k ∈ N} gibt. Seien p1 , . . . , pt Primzahlen in {1 + nk | k ∈ N}. Mit dieser Wahl von Primzahlen setzen wir jetzt a = np1 · · · pt . Nach Satz 12.32 gibt es eine Primzahl p mit p | an − 1
aber
p ai − 1
für jedes 0 < i < n.
Dann ist p ≠ p1 , . . . , pt und p ∈ {1 + nk | k ∈ N}. Eine weitere Anwendung von Satz 12.32 ist der Satz von Wedderburn. Wir nennen eine Struktur K einen Schiefkörper, wenn sie alle Körperaxiome erfüllt, außer vielleicht ab = ba für alle a, b ∈ K . Satz 12.34 (Wedderburn6 ). Jeder endliche Schiefkörper ist ein Körper. Beweis. Für jedes a ∈ K setzen wir CK (a) = {x | x ∈ K, ax = xa}. Offenbar ist CK (a) ein Schiefkörper. Sei Z(K) = a∈K CK (a). Dann ist Z(K) ≠ 0, da für jedes a ∈ K stets 1 ∈ CK (a) ist. Also ist Z(K) ein kommutativer Teilkörper von K . Es ist |Z(K)| = q = pf für eine Primzahl p nach Satz 8.18. Da K ein Vektorraum über Z(K) ist, folgt |K| = qn für ein n. Sei a ∈ K\Z(K). Dann ist auch CK (a) ein Vektorraum über Z(K). Also ist |CK (a)| = qs für ein geeignetes s . Da a ∈ Z(K) ist, folgt s < n. Insbesondere ist n > 2. Sei nun r eine Primzahl mit r | qn − 1, aber r qi − 1 für jedes 0 < i < n. Nach Satz 5.52 gibt es ein a ∈ K\Z(K) mit o(a) = r . Dann ist r ein Teiler von |CK (a)|−1 = qs −1, ein Widerspruch. Also gibt es ein solches r nicht. Nach Satz 12.32 ist dann q = 2 und n = 6. Nun ist |K ∗ | = 32 · 7. Anwendung von Satz 5.50 zeigt, dass K ∗ eine normale Sylow-7-Untergruppe hat, was aber |Z(K ∗ )| ≥ 3 liefert. Also ist q = |Z(K)| ≥ 4, ein Widerspruch.
5 J. Dirichlet, * 13. 2. 1805 Düren, † 5. 5. 1859 Göttingen, Professor in Breslau, Berlin und ab 1855 in Göttingen als Nachfolger von Gauß. Dirichlet lieferte bahnbrechende Arbeiten in der Mathematik und mathematischen Physik. 6 J. Wedderbum. * 26. 2. 1882 Forfor (Schottland), † 9. 10. 1948 Princeton, Professor in Princeton. Seine Arbeitsgebiete waren Analysis und Algebra.
Kreisteilungskörper
167
Übungen 1.
2.
3. 4.
(a) Für n ≠ 1, 2 gibt es einen Körper K mit Q ⊆ K ⊆ Qn und [K : Q] = 2. (b) Der Körper K aus Teil (a) ist eindeutig bestimmt, falls n eine ungerade Primzahl ist. Genau dann ist K in R enthalten, falls n ≡ 1 (mod 4) ist. (c) Sei p eine Primzahl. Ist L ein Körper mit Q ⊆ L ⊆ Qp und [L : Q] = 3, so ist L ⊆ R. √ √ √ (a) Zeige: Q24 = Q( −1, −2, −3). (b) Bestimme G (Q24 /Q), ihre Untergruppen U und die dazugehörigen Zwischenkörper K in Q ⊆ Q24 . Berechne φ315 und φ7203 . Seien p eine Primzahl, L = Qp und ξ eine primitive p -te Einheitswurzel. Sei K der Körper aus Aufgabe 1(b), H die Fixgruppe von K in G (L/Q) = G. Zeige K = Q(α) mit α= σ (ξ) − σ (ξ). σ ∈H
σ ∈G\H
Bestimme α2 für p = 7. Konstruiere eine Erweiterung von Q vom Grad 12 mit (a) einer zyklischen Galoisgruppe. (b) einer nichtzyklischen, aber abelschen Galoisgruppe. 6. Zeige, dass φ26 über GF(3) ein Produkt von 4 irreduziblen Polynomen vom Grad 3 ist. Bestimme GF(3)26 . Sei q = p m eine Primzahlpotenz. Bezeichne mit Nd,q die Anzahl der irreduziblen normierten 7. Polynome in GF(q)[x] vom Grad d. Zeige: n (a) x q − x ∈ GF(q)[x] ist das Produkt aller normierten irreduziblen Polynome in GF(q)[x], deren Grad n teilt. (b) qn = d|n dNd,q . 8. Sei Nd,q wie in Aufgabe 7. Zeige (a) nNd,q = d|n μ(d)qn/d . (b) Berechne N5,3 und N6,3 . 9. Sei n ∈ N gerade. Zeige: d|n μ(d)ϕ(d) = 0. 10. Berechne d|n ϕ(d) für n ∈ N. 11. Bestimme für i = 0, 2, 3 und 4 das kleinste xi ∈ N, so dass die Gleichung ϕ(n) = xi genau i Lösungen n hat7 . e e 12. Seien a, n ∈ N mit ggT(a, n) = 1 und n = p11 · · · ps s die Primfaktorzerlegung. Zeige: ϕ(n) (a) a ≡ 1 (mod n). e e (b) aϕ ≡ 1 (mod n) für ϕ = kgV(ϕ(p11 ), . . . , ϕ(ps s )). (c) Berechne 21000000 (mod 77). 13. Sei p eine ungerade Primzahl und n ∈ N. Betrachte den Homomorphismus 5.
π : (Z/p n Z)∗ → (Z/pZ)∗
definiert durch π (a + p n Z) = a + pZ.
Hierbei seien (Z/pn Z)∗ bzw. (Z/pZ)∗ die Einheitengruppen von Z/p n Z bzw. Z/pZ. Zeige: (a) Der Kern von π ist eine von (1 + p) + p n Z erzeugte zyklische Gruppe der Ordnung p n−1 . (b) Die Einheitengruppe von Z/p n Z ist zyklisch.
7 Ob es ein x gibt, so dass ϕ(n) = x genau eine Lösung hat, ist eine offene Frage.
168
Kreisteilungskörper
14. Welches ist der kleinste endliche Körper der Charakteristik 2, der eine primitive 5-te Einheitswurzel enthält? 15. Sei p = 2i + 1 eine Primzahl. Zeige (a) Q ⊆ Qp enthält genau einen minimalen Teilkörper L ≠ Q. √ (b) Für p = 5 ist L = Q( 5), wobei L der Teilkörper aus (a) ist. 16. Welchen Grad über Q hat der Zerfällungskörper L von x 6 + 1? Man gebe ein z ∈ L mit Q(z) = L an. 17. Sei K eine endliche Erweiterung von Q und WK die Gruppe der Einheitswurzeln in K . Zeige: (a) |WK | < ∞. √ (b) Für welche d ∈ Z enthält K = Q( d) Einheitswurzeln ungleich ±1? 18. Sei a ∈ N mit x = ϕ(a)/a < 1. Dann gibt es unendlich viele b ∈ N mit x = ϕ(b)/b. 19. Die Gleichung ϕ(n2 ) = k2 ist außer für ϕ(1) = 1 nicht lösbar. 20. Ist p eine Primzahl, so dass 2p + 1 keine Primzahl ist, so hat ϕ(x) = 2p keine Lösung.
13 Norm und Spur Wir wollen nun Satz 10.7 für endliche Charakteristik beweisen. Wesentlich hierbei ist, dass dazu der Begriff der Radikalerweiterung verallgemeinert werden muss, will man das Resultat, dass Radikalerweiterungen auflösbaren Galoisgruppen entsprechen, behalten. In Charakteristik p gibt es einen neuen Typ von Erweiterung mit zyklischer Galoisgruppe der Ordnung p . Um diesen in den Griff zu bekommen, führen wir die Begriffe Norm und Spur einer Körpererweiterung ein, die auch von unabhängigem Interesse sind. Definition 13.1. Sei k ⊆ K eine endliche Galoiserweiterung mit Gruppe G = G (K/k). Wir setzen für jedes a ∈ K σ (a) und NK/k (a) = σ (a). TK/k (a) = σ ∈G
σ ∈G
Wir nennen TK/k die Spur und NK/k die Norm der Erweiterung k ⊆ K . Offenbar sind TK/k (a) und NK/k (a) Elemente von k. Lemma 13.2. Sei k ⊆ K eine endliche Galoiserweiterung. Für alle a, b ∈ K gilt: (1) TK/k (a + b) = TK/k (a) + TK/k (b). (2) NK/k (ab) = NK/k (a)NK/k (b). (3) Ist n = [K : k] und a ∈ k, so ist TK/k (a) = na und NK/k (a) = an . Beweis. Dies sei dem Leser zur Übung überlassen. Satz 13.3 (E. Artin). Sei K ein Körper. Dann ist jede Menge verschiedener Automorphismen von K linear unabhängig über K . Beweis. Seien σ1 , . . . , σn Automorphismen und a1 , . . . , an ∈ K mit a1 σ1 + · · · + an σn = 0.
Sei dies eine kürzeste Relation, in der nicht alle ai gleich Null sind, also o. B. d. A. ai ≠ 0 für alle i. Dann ist offenbar n > 1. Da σ1 ≠ σ2 ist, gibt es ein b ∈ K mit σ1 (b) ≠ σ2 (b). Nun gelten a1 σ1 (bx) + a2 σ2 (bx) + · · · + an σn (bx) = 0
und a1 σ1 (x)σ1 (b) + a2 σ2 (x)σ1 (b) + · · · + an σn (x)σ1 (b) = 0
für alle x ∈ K .
170
Norm und Spur
Das liefert a2 (σ1 (b) − σ2 (b))σ2 (x) + · · · + an (σ1 (b) − σn (b))σn (x) = 0
für alle x ∈ K . Daher haben wir a2 (σ1 (b) − σ2 (b))σ2 + · · · + an (σ1 (b) − σn (b))σn = 0.
Diese Relation ist kürzer. Also sind alle Koeffizienten gleich Null. Da nach Wahl von b aber σ1 (b) − σ2 (b) ≠ 0 ist, folgt der Widerspruch a2 = 0. Satz 13.4. Sei k ⊆ K galoissch mit zyklischer Gruppe G = σ . Dann ist genau dann TK/k (a) = 0 für ein a ∈ K , falls es ein b ∈ K mit a = b − σ (b) gibt. Beweis. Seien zunächst a = b − σ (b) mit b ∈ K und |G| = n. Dann ist TK/k (a) =
n−1
σ i (a) = (b − σ (b)) + (σ (b) − σ 2 (b)) + · · ·
i=0
+ (σ n−1 (b) − σ n (b)) = b − σ n (b) = b − b = 0.
Sei nun umgekehrt TK/k (a) = 0. Es ist TK/k (K) ⊆ k. Da TK/k (K) ein k-Vektorraum ist, folgt TK/k (K) = k oder TK/k (K) = 0. Mit Satz 13.3 erhalten wir TK/k (K) ≠ 0. Wir wählen nun c ∈ K mit TK/k (c) = 1 und setzen di =
i
σ j (a) σ i (c)
für alle 0 ≤ i ≤ n − 2
j=0
und b = d0 + d1 + · · · + dn−2 .
Wir zeigen a = b − σ (b). Es ist σ (di ) = (σ (a) + σ 2 (a) + · · · + σ i+1 (a))σ i+1 (c).
Also ist di+1 − σ (di ) = aσ i+1 (c)
für alle 0 ≤ i ≤ n − 3.
Wegen TK/k (a) = 0 ist σ (dn−2 ) = −aσ n−1 (c) und somit ist b − σ (b) = d0 + (d1 − σ (d0 )) + (d2 − σ (d1 )) + · · · + (dn−2 − σ (dn−3 )) − σ (dn−2 ) = ac + aσ (c) + · · · + aσ n−1 (c) = aTK/k (c) = a.
Norm und Spur
171
Satz 13.5 (Artin-Schreier1 ). Sei k ⊆ K mit [K : k] = p = char k eine Galoiserweiterung. Dann gibt es ein a ∈ k, so dass K = k(u) ist, wobei u eine Nullstelle von x p − x − a ist. Beweis. Es ist G = G (K/k) = σ zyklisch von der Ordnung p. Nach Lemma 13.2 ist TK/k (1) = p = 0. Nach Satz 13.4 ist dann 1 = σ (u) − u für geeignetes u ∈ K . Also ist σ (u) = u + 1,
d. h.
σ (up ) = (1 + u)p = 1 + up .
Somit ist a = up − u = σ (up − u) ∈ k. Da σ (u) ≠ u ist, haben wir u ∈ k. Da [K : k] eine Primzahl ist, gilt K = k(u). Wir wollen nun den Beweis von Satz 10.7 imitieren. Dort ist der wesentliche Punkt die Berechnung der Lagrange-Resolvente, wozu nur zyklische Galoisgruppen benötigt werden. In unserer neuen Sprache wird mit Hilfe der dort gefundenen Lösung ein c konstruiert, so dass cσ j (c −1 ) eine Einheitswurzel ist, d. h. Norm 1 hat. Es wird dann gezeigt, dass daraus folgt, dass c p N(c) ∈ k ist, was K = k(c) und die Radikalerweiterung liefert, da [K : k] = p Primzahl war. Den ersten Schritt haben wir bereits in Satz 13.5 getan. Nun wollen wir den N(cσ j (c −1 )) = 1 entsprechenden Schritt tun. Satz 13.6 (Hilberts Theorem 902 ). Sei k ⊆ K galoissch mit G = G (K/k) = σ . Sei a ∈ K . Dann ist N(a) = 1 genau dann, falls es ein b ∈ K ∗ gibt, so dass a = bσ (b−1 ) gilt. Beweis. Sei a = bσ (b−1 ) für ein geeignetes b ∈ K ∗ . Dann ist NK/k (a) = aσ (a) · · · σ n−1 (a) = bσ (b−1 )σ (b)σ (b −2 ) · · · = 1.
Sei umgekehrt NK/k (a) = 1. Wir wählen c ∈ K beliebig und setzen di =
i
σ j (a) σ i (c)
für alle 0 ≤ i ≤ n − 1.
j=0
Es ist dn−1 = N(a)σ n−1 (c) = σ n−1 (c). Weiter gilt di+1 = aσ (di )
für alle 0 ≤ i ≤ n − 2.
1 O. Schreier, * 3. 3. 1901 Wien, † 2. 6. 1929 Hamburg, wirkte an der Universität Hamburg als Assistent und später Privatdozent, Hauptarbeitsgebiet Gruppentheorie. O. Schreier bewies zusammen mit E. Artin den Satz, dass ein Körper, in dem −1 nicht Summe von Quadraten ist, anordnungsfähig ist (siehe Korollar 19.18). 2 D. Hilbert, * 23. 1. 1862 Königsberg, † 14. 2. 1943 Göttingen, Professor in Königsberg und Göttingen. D. Hilbert lieferte fundamentale Arbeiten zu Zahlentheorie, Integralgleichungen, mathematischer Physik und Grundlagen der Geometrie. In einem programmatischen Vortrag auf dem intemationalen Mathematiker Kongress 1900 stellte er 23 Probleme vor, die er für die bedeutendsten der Mathematik hielt.
172
Norm und Spur
Wir setzen b = d0 + d1 + · · · + dn−1 . Da nach Satz 13.3 σ j (a) σ i ≠ 0
n−1 i i=0 j=0
ist, gibt es ein c mit b ≠ 0. Es ist σ (b) = σ (d0 ) + σ (d1 ) + · · · + σ (dn−1 ) = a−1 (d1 + · · · + dn−1 ) + σ n (c) = a−1 b.
Zum nächsten Lemma vergleiche Lemma 10.5. Lemma 13.7. Sei k ⊆ K galoissch mit G = G (K/k) = σ und |G| = n. Weiter sei char k n und es enthalte k alle n-ten Einheitswurzeln. Dann gibt es ein a ∈ k, so dass x n − a irreduzibel und K = k(u) mit einer Nullstelle u von x n − a ist. Beweis. Sei ε die Gruppe der Nullstellen von x n − 1 in k. Es ist NK/k (ε)
=
Lemma 13.2
εn = 1.
Nach Satz 13.6 ist dann ε = σ (u)u−1 für geeignetes u ∈ K.
Das liefert σ (u) = εu und σ (un ) = ε n un = un . Setzen wir a = un , so ist a ∈ k. Weiter ist k(u) der Zerfällungskörper von x n − a, da x n − a genau die Nullstellen εi u, 0 ≤ i ≤ n − 1, hat. Da char k n ist, hat x n − 1 genau n paarweise verschiedene Nullstellen, also gilt dies auch für x n − a. Da σ transitiv auf diesen Nullstellen operiert, folgt [k(u) : k] ≥ |G| = n. Das liefert k(u) = K , da [K : k] = n ist. Insbesondere ist x n − a irreduzibel. Um den Satz 10.7 entsprechenden Satz für endliche Charakteristik zu beweisen, müssen wir den Begriff der Radikalerweiterung verallgemeinern. Definition 13.8. Die Erweiterung k ⊆ K nennen wir durch Radikale auflösbar, falls sie separabel ist und es eine endliche Erweiterung F von K mit k = E0 ⊂ E1 ⊂ · · · ⊂ Em = F
gibt, so dass jeder Schritt Ei ⊂ Ei+1 von einem der folgenden Typen ist. (1) Ei+1 = Ei (u), u ist Einheitswurzel. (2) Ei+1 = Ei (u), u ist Nullstelle von x n − a mit a ∈ Ei und char k n. (3) Ei+1 = Ei (u), u ist Nullstelle von x p − x − a mit a ∈ Ei und char k = p . Nun wollen wir eine allgemeinere Fassung von Satz 10.6 und Satz 10.7 beweisen.
Norm und Spur
173
Satz 13.9. Sei k ⊆ K separabel. Dann ist k ⊆ K genau dann durch Radikale auflösbar falls der normale Abschluss N von K eine auflösbare Galoisgruppe G = G (N/k) hat. Beweis. Sei zunächst G auflösbar und m das Produkt aller Primzahlen in [N : k] die ungleich char k sind. Sei L = k(ε) mit einer primitiven m-ten Einheitswurzel ε. Nach Satz 12.6 ist G (L/k) abelsch. Nach Satz 7.12 ist G (NL/L) zu einer Untergruppe von G (N/N ∩ L) isomorph. Also ist G (NL/L) auflösbar. Nach Definition 5.54 und Satz 6.24 gibt es eine Kette von Zwischenkörpern L = L0 ⊂ L1 ⊂ · · · ⊂ Lr = NL,
so dass Li ⊂ Li+1 galoissch von Primzahlgrad ist. Nach Lemma 13.7 und Satz 13.5 ist dann L ⊆ NL durch Radikale auflösbar, also auch k ⊆ K . Sei nun umgekehrt k ⊆ K durch Radikale auflösbar. Sei σ eine Einbettung von K ¯ . Dann ist auch k ⊆ σ (K) durch Radikale auflösbar. Also ist k ⊆ N durch über k in K Radikale auflösbar nach Satz 7.5. Sei nun m wie oben, d. h. das Produkt aller Primzahlen ungleich char k, die [N : k] teilen. Sei L = k(ε) mit einer primitiven m-ten Einheitswurzel ε. Nach Satz 12.6 ist G (L/k) abelsch. Also genügt es nach Lemma 7.14 zu zeigen, dass G (NL/L) auflösbar ist. Es folgt dann, dass auch G (NL/k) auflösbar und dann sogar G (N/k), welches eine Faktorgruppe von G (NL/k) ist, nach Satz 5.55(3) auflösbar ist. Also können wir der Einfachheit halber k = L annehmen. Ist Ei+1 = Ei (u) für eine Nullstelle u von x n − a, so ist nach Lemma 10.5 die Erweiterung Ei ⊂ Ei+1 galoissch mit abelscher Gruppe. Es genügt also zu zeigen, dass G (Ei+1 /Ei ) auflösbar ist, falls Ei+1 = Ei (u) für p = char k und einer Nullstelle u von x p − x − a ist. Mit Satz 5.55 folgt dann die Behauptung. Sei R = GF(p) der Primkörper von Ei . Ist u Nullstelle von x p − x − a, so ist auch u + i mit i ∈ R eine Nullstelle. Also hat x p − x − a genau p paarweise verschiedene Nullstellen in Ei+1 . Insbesondere ist Ei+1 der Zerfällungskörper über Ei und Ei+1 hat nach Lemma 3.11 p Automorphismen σi : u → u + i.
Also ist [Ei+1 : Ei ] = p und G (Ei+1 /Ei ) ist zyklisch von der Ordnung p .
174
Norm und Spur
Übungen 1.
2.
Sei K ⊆ M ⊆ L und alle Erweiterungen seien galoissch. Dann gilt für alle x ∈ L: (a) NL/K (x) = NM/K (NL/M (x)), (b) TL/K (x) = TM/K (TL/M (x)). Sei K ⊆ L galoissch und {w1 , . . . , wn } eine K -Basis von L. Dann gilt det (TL/K (wi wj ))i,j=1,...,n ≠ 0.
3.
Seien K ⊆ L galoissch, a ∈ L und Aa die K -lineare Abbildung von L mit Aa (x) = ax.
4.
Zeige: (a) TL/K (a) = Spur(Aa ), (b) NL/K (a) = det Aa . Seien L ein Körper und G eine endliche Untergruppe von Aut(L). Eine Abbildung f : G → L∗ heißt ein verschränkter Homomorphismus, falls für alle g, h ∈ G stets f (gh) = h(f (g))f (h)
gilt. Zeige: (a) Ist f ein verschränkter Homomorphismus, so existiert ein a ∈ L mit f (g) = ag(a)−1
5.
für alle g ∈ G.
(b) Sei K ⊆ L eine endliche Galoiserweiterung mit Gruppe G = g. Zeige mit (a): Ist a ∈ L mit NL/K (a) = 1, so existiert ein b ∈ L mit a = bg(b)−1 . Beweise Lemma 13.2.
14 Abelsche Erweiterungen von Q Wir knüpfen in diesem Kapitel an Beispiel 6.26(2) an. Dort hatten wir gesehen, dass jede Gruppe Galoisgruppe einer geeigneten Körpererweiterung ist. In diesem Kapitel wollen wir zeigen, dass jede abelsche Gruppe sogar Galoisgruppe einer Erweiterung von Q ist. Wir werden dies innerhalb der Kreisteilungskörper realisieren und zeigen, dass jede abelsche Gruppe Faktorgruppe der Galoisgruppe eines Kreisteilungskörpers ist. Die Galoisgruppen der Kreisteilungskörper sind Einheitengruppen von Z/nZ nach Satz 12.11. Damit ist das Problem auf ein rein gruppentheoretisches zurückgeführt. Wir müssen dazu zunächst die abelschen Gruppen genauer untersuchen und werden zeigen, dass jede abelsche Gruppe ein direktes Produkt von zyklischen Gruppen ist. Die Idee ist dann, zunächst die zyklischen Gruppen zu realisieren. Ist n eine Primzahl, so ist Z/nZ ein Körper. Die Einheitengruppe ist somit zyklisch von der Ordnung n − 1. Es muss nun nur gezeigt werden, dass es zu vorgegebenem m stets eine Primzahl p gibt, so dass m | p − 1 gilt. Dann ist die zyklische Gruppe der Ordnung m eine Faktorgruppe von (Z/pZ)∗ . Dies müssen wir für die verschiedenen Faktoren der abelschen Gruppe A machen. Wir erhalten dann Primzahlen pi , so dass A eine Faktorgruppe von i∈I (Z/pi Z)∗ ist. Damit dies die Einheitengruppe von Z/nZ, n = i∈I pi , ist, müssen die pi paarweise verschieden sein. Wir müssen also für vorgegebenes m nicht nur eine Primzahl p mit m | p − 1 finden sondern unendlich viele. Die Existenz solcher Primzahlen folgt aus Satz 12.33. In diesem Kapitel werden wir abelsche Gruppen stets additiv schreiben. Satz 14.1 (Chinesischer Restsatz1 ). Seien n1 , . . . , nt paarweise teilerfremde natürliche Zahlen. Dann ist die durch σ : x → (x + n1 Z, x + n2 Z, . . . , x + nt Z) definierte Abbildung σ : Z → ti=1 Z/ni Z ein Epimorphismus mit Kern σ =
t
ni Z.
i=1
Beweis. Klar ist, dass σ ein Homomorphismus ist. Wir wollen den Homomorphiesatz anwenden. Dazu müssen wir Kern σ bestimmen. Sei also x ∈ Kern σ . Dann ist t x ∈ ni Z für alle i. Da ggT(ni , nj ) = 1 ist, folgt x ∈ i=1 ni Z. Damit erhalten wir t Kern σ = i=1 ni Z. Nun ist t t ! . ! ! ! !Z ni Z! = ni i=1
i=1
und
t t t !/ ! ! ! ! Z/ni Z! = |Z/ni Z| = ni . i=1
i=1
i=1
Somit ist nach dem Homomorphiesatz (Satz 5.21) σ surjektiv.
1 Dieser Satz findet sich in den Arbeiten des chinesischen Mathematikers und Astronomen Chin Chiu-Shao (1202–1261).
176
Abelsche Erweiterungen von Q
Korollar 14.2. Sind n1 , . . . , nt paarweise teilerfremde natürliche Zahlen. Dann ist die Einheitengruppe von Z/ ti=1 ni Z zur direkten Summe der Einheitengruppen der Z/ni Z, i = 1, . . . , t , isomorph. Korollar 14.3. Seien n1 , . . . , nr natürliche Zahlen, die paarweise teilerfremd sind, und x1 , . . . , xr ∈ Z. Dann haben die Kongruenzen x ≡ x1
(mod n1 )
.. . x ≡ xr
eine Lösung x , und diese ist modulo
(mod nr )
r
i=1 ni
eindeutig bestimmt. Beweis. Es ist (x1 + n1 Z, x2 + n2 Z, . . . , xr + nr Z) ∈ ri=1 Z/ni Z. Nach Satz 14.1 gibt es ein x ∈ Z mit (x + n1 Z, . . . , x + nr Z) = (x1 + n1 Z, . . . , xr + nr Z). Dies bedeutet aber x ≡ xi (mod ni ) für i = 1, . . . , r . Ist y eine zweite Lösung der Kongruenzen, r r r so folgt mit Satz 14.1 x + i=1 ni Z = y + i=1 ni Z. Also ist x modulo i=1 ni eindeutig bestimmt. e Satz 14.4. Sei A eine abelsche Gruppe der Ordnung ti=1 pi i , pi paarweise verschiee dene Primzahlen. Dann enthält A eine Untergruppe Ai von der Ordnung pi i und A = A 1 ⊕ · · · ⊕ At .
Beweis. Die Existenz der Ai folgt mit dem Satz von Sylow (Satz 5.46). Aus der Gleichung |A| = |A1 | + · · · + |At | folgt A = A1 + · · · + At . Da pi kein Teiler von | j≠i Aj | ist, erhalten wir Ai ∩ j≠i Aj = 0. Das liefert A = A1 ⊕ · · · ⊕ At . Der nächste Satz bestimmt die Struktur abelscher Gruppen noch genauer. Satz 14.5. Sei A eine endliche abelsche Gruppe. Dann ist A die direkte Summe von zyklischen Gruppen. Beweis. Nach Satz 14.4 können wir annehmen, dass A eine p -Gruppe ist. Sei a ∈ A mit o(a) maximal. Nach Satz 5.5 ist o(a) = p n für geeignetes n. Wir setzen B = a und beweisen die Behauptung durch Induktion nach |A|. Zunächst zeigen wir, dass es eine Untergruppe C von A gibt, so dass A = B ⊕ C ist. Ist A = B , so sind wir fertig. Sei also b ∈ A\B . Wir zeigen, dass es ein b mit b ∩ B = 0 gibt. Wir wählen b mit pb ∈ B , dann ist pb = ta für geeignetes t ∈ N. Da o(b) ≤ o(a) ist, gibt es ein a1 ∈ B mit pa1 = ta. Dann ist b1 = a1 − b ∈ B und pb1 = 0, d. h. |b1 | = p . Somit ist B ∩ b1 = 0. Sei nun 1 ≠ U eine Untergruppe von A mit B ∩ U = 0. Per Induktion gibt es eine Untergruppe C von A mit U ≤ C und C/U ∩ B + U/U = 0. Dann ist aber C ∩ B = 0 und somit ist A = B + C .
Abelsche Erweiterungen von Q
177
Per Induktion ist C eine direkte Summe von zyklischen Gruppen. Da B zyklisch war, ist dann A eine Summe von zyklischen Gruppen. Der nächste Satz verbindet die Galoisgruppen der Kreisteilungskörper mit den abelschen Gruppen. Satz 14.6. Ist A eine endliche abelsche Gruppe, so gibt es eine natürliche Zahl n, so dass A zu einer Faktorgruppe von G (Qn /Q), d. h. der Einheitengruppe Z/nZ, isomorph ist. Beweis. Nach Satz 14.5 gibt es zyklische Gruppen Ci mit A = C1 ⊕ · · · ⊕ Ct . Nach Satz 12.33 wissen wir, dass es paarweise verschiedene Primzahlen pi gibt, so dass t pi − 1 von |Ci | geteilt wird. Wir setzen n = i=1 pi . Nach Korollar 14.2 ist die Einheitengruppe von Z/nZ zur direkten Summe der Einheitengruppen der Z/pi Z isomorph. Die letztere ist aber eine zyklische Gruppe der Ordnung pi − 1. Sei qi = (pi − 1)/|Ci |. Dann enthält (Z/pi Z)∗ nach Satz 5.29 eine Untergruppe Hi mit |Hi | = qi . Also ist (Z/pi Z)∗ /Hi zyklisch von der Ordnung |Ci |, d. h. (Z/pi Z)∗ /Hi Ci nach Satz 5.28. Dann ist (Z/p1 Z)∗ /H1 ⊕ · · · ⊕ (Z/pt Z)∗ /Ht A
und A (Z/p1 Z)∗ /H1 ⊕ · · · ⊕ (Z/pt Z)∗ /Ht (Z/p1 Z)∗ ⊕ · · · ⊕ (Z/pt Z)∗ /(H1 ⊕ · · · ⊕ H1 ).
Satz 14.7. Ist A eine endliche abelsche Gruppe, so gibt es eine Galoiserweiterung L von Q, so dass A G (L/Q) ist. Beweis. Nach Satz 14.6 gibt es ein n ∈ N, so dass A zu einer Faktorgruppe der Galoisgruppe G = G (Qn /Q) isomorph ist. Sei also B Gund G/B A. Wir setzen L = k (B). Dann ist Q ⊆ L galoissch mit G (Q/L) A nach Satz 6.24. Ein wesentlich tiefer liegender Satz von Shafarevich [49] besagt, dass jede auflösbare Gruppe G sich als Galoisgruppe über Q realisieren lässt. Im nächsten Kapitel wollen wir zeigen, dass auch An und Σn über Q realisierbar sind.
178
Abelsche Erweiterungen von Q
Übungen 1.
2.
3.
Bestimme alle Lösungen in Z von x≡1
(mod 2),
x≡2
(mod 3),
x≡1
(mod 5)
in der Form x ≡ ? (mod 30). Gesucht ist eine notwendige und hinreichende Bedingung an die ganzen Zahlen a, b, c , so dass x≡a
(mod 12),
x≡b
(mod 15),
x≡c
(mod 6)
in Z lösbar ist. (a) Bestimme die Struktur der Einheitengruppe von Z/8Z. (b) Sei n ≥ 2. Betrachte den Homomorphismus π von der Einheitengruppe Z/2n Z nach der Einheitengruppe von Z/4Z definiert durch π (a + 2n Z) = a + 4Z.
4. 5.
Zeige, dass Kern π von 5 + 2n Z erzeugt wird und die Ordnung 2n−2 hat. (c) Für jedes n ∈ N bestimme die Struktur der Einheitengruppe des Rings Z/2n Z. Bestimme die Isomorphietypen der abelschen Gruppen von der Ordnung 81. Sei A eine endliche abelsche Gruppe und A∗ = Hom(A, C∗ ). Zeige: A∗ A.
6.
Sei A eine endliche abelsche Gruppe und U eine Untergruppe. Setze U ⊥ = {x | x ∈ A∗ : U ⊆ Kern x}
Dann gilt: (a) U ⊥ ist Untergruppe von A∗ . (b) U ⊥ A/U .
(vergleiche Aufgabe 5).
15 Bewertungen und p -adische Zahlen In den nächsten Kapiteln dieses Buches wollen wir Fragen der konkreten Berechenbarkeit behandeln. Insbesondere sollen im Kapitel 18 Methoden zur Berechnung von Galoisgruppen betrachtet werden. Desweiteren werden wir in Kapitel 16 und Kapitel 17 Methoden zur Berechnung des größten gemeinsamen Teilers und zum Testen der Irreduzibilität von Polynomen entwickeln. Hierfür benötigen wir einige Resultate über p -adische Zahlen, die wir in diesem Kapitel bereitstellen wollen. Die wesentliche Idee ist, auf Q eine neue Betragsfunktion einzuführen, die eine spezielle Primzahl auszeichnet. Dieses liefert dann neue Konvergenzsätze. Wie in der Analysis üblich können wir die Vervollständigung von Q bezüglich dieses neuen Betrags betrachten und erhalten so Körper Qp der Charakteristik Null, die sich in vielerlei Hinsicht besser als R verhalten. Das Zusammenspiel dieser Körper wird in der Zahlentheorie als ein starkes Hilfsmittel eingesetzt. Obwohl wir es nicht direkt benötigen, wollen wir diese Konstruktion noch in einem allgemeineren Rahmen, den sog. Bewertungen und Bewertungsringen, betrachten. Zunächst aber wollen wir diese neue Konvergenz mit einer „offensichtlich“ falschen Gleichung illustrieren. −1 = 4 + 4 · 5 + 4 · 52 + 4 · 53 + · · ·
Oder ist diese Gleichung doch richtig? Wenn wir einmal 1 auf beiden Zeilen addieren, so erhalten wir 0 = 5 + 4 · 5 + 4 · 5 2 + 4 · 53 + · · · = 0 + 5 · 5 + 4 · 5 2 + 4 · 53 + · · · = 0 + 0 + 5 · 5 2 + 4 · 53 + · · · = 0 + 0 + 0 + 5 · 53 + · · ·
Offenbar können wir beliebig viele Nullen produzieren. Ob die erste Gleichung richtig oder falsch ist, hängt also vom Konvergenzbegriff ab. Bei dem in der Analysis üblichen Konvergenzbegriff der Dezimalzahlen benutzen wir 10-er Potenzen. Wir fordern dann, dass diese beliebig klein werden. Hier haben wir es mit 5-er Potenzen zu tun und wir fordern, dass sie beliebig groß werden. Man darf eben nur nicht die obigen Zahlen als Elemente von Q interpretieren. Mit einem geeigneten Konvergenzbegriff gilt dann auch 2 = 4 + 1 · 5 + 3 · 5 2 + 1 · 53 + 3 · 54 + · · · 3
180
Bewertungen und p -adische Zahlen
Um dies zu testen, müssen wir den obigen Ausdruck nur mit 3 multiplizieren. Wir erhalten dann: 2 = 12 + 3 · 5 + 9 · 52 + 3 · 53 + 9 · 54 + · · · = = 2 + 5 · 5 + 9 · 5 2 + 3 · 53 + 9 · 54 + · · · = 2 + 0 + 10 · 52 + 3 · 53 + 9 · 54 + . . . = 2 + 0 + 0 + 5 · 53 + 9 · 54 + · · · = 2 + 0 + 0 + 0 + 10 · 54 + · · ·
Ein weiteres Beispiel ist √
7 = 1 + 1 · 3 + 1 · 3 2 + 0 · 33 + 2 · 34 + · · · ,
denn quadrieren liefert 7 = 1 + 2 · 3 + 3 · 3 2 + 2 · 33 + 5 · 34 + · · · = 1 + 2 · 3 + 0 + 3 · 3 3 + 5 · 34 + · · · = 1 + 2 · 3 + 0 + 0 + 6 · 34 + · · ·
Die Idee der Bewertungstheorie ist es, neue Konvergenzbegriffe einzuführen, die vom algebraischen Standpunkt gleichwertig sind. Dadurch werden dann obige Gleichungen zu richtigen Aussagen. Eine zweite Quelle für die von uns zu entwickelnde Bewertungstheorie sind die sogenannten Diophantischen Gleichungen. Hierbei handelt es sich um die Frage nach der Existenz von ganzzahligen Lösungen von Polynomgleichungen. Sei f (x1 , . . . , xn ) ∈ Z[x1 , . . . , xn ].
Wir sind an Lösungen f (a1 , . . . , an ) = 0 mit ai ∈ Z interessiert, z. B. x 2 − 7y 2 − 11 = 0.
In R haben wir unendlich viele Lösungen. Wir fragen aber, ob es ganzzahlige Lösungen gibt. Dann muss insbesondere x 2 − 7y 2 ≡ 11
(mod 4)
gelten, also x2 + y 2 ≡ 3
(mod 4).
Da jedes Quadrat kongruent 0 oder 1 modulo 4 ist, gibt es keine Lösungen. Beide Fragestellungen hängen mit dem Begriff eines Absolutwertes zusammen, den wir zunächst einführen. Dieser erweitert den bekannten Begriff einer Norm.
Bewertungen und p -adische Zahlen
181
Definition 15.1. Sei K ein Körper. Eine Funktion ϕ : K → R heißt ein Absolutwert auf K , falls die folgenden Bedingungen erfüllt sind: (1) ϕ(a) > 0 für alle a ≠ 0, ϕ(0) = 0. (2) ϕ(a)ϕ(b) = ϕ(ab) für alle a, b ∈ K . (3) ϕ(a + b) ≤ ϕ(a) + ϕ(b) für alle a, b ∈ K . Gilt statt (3) (3 ) ϕ(a + b) ≤ max{ϕ(a), ϕ(b)} für alle a, b ∈ K , so heißt ϕ eine Ultranorm oder ein nicht archimedischer Absolutwert, sonst, d. h. wenn (3), aber nicht (3 ) gilt, nennen wir ϕ archimedisch. Wir wollen zunächst einige elementare Eigenschaften von Absolutwerten zusammenstellen. Lemma 15.2. Sei ϕ ein Absolutwert auf K . Dann gilt: (1) ϕ(1) = 1. (2) ϕ(−b) = ϕ(b) für alle b ∈ K . Beweis. (1) Wir setzen in Definition 15.1(2) b = 1. Dann ist ϕ(a)ϕ(1) = ϕ(a), also ist ϕ(1) = 1. (2) Wir betrachten zunächst den Spezialfall b = −1 und setzen in Definition 15.1(1) a = b = −1. Dann ist ϕ(−1)2 = ϕ(1) = 1. Also ist ϕ(−1) = 1. Nun setzen wir in Definition 15.1(2) a = −1. Dann ist ϕ(−b) = ϕ(b)ϕ(−1) = ϕ(b).
Beispiele 15.3. (1) Sei K = Q und ϕ(a) = |a| der übliche Betrag. Dann ist ϕ ein Absolutwert auf Q. (2) Sei K = Q und p eine Primzahl. Ist a ∈ Q∗ , so ist a = (r /s)p n mit n ∈ Z und ggT(r , s) = 1, wobei p weder s noch r teilt. Wir setzen ϕp (a) = p −n
für a ≠ 0 und ϕp (0) = 0.
Dann ist ϕp ein Absolutwert auf Q. Seien a = (r /s)pn und b = (t/u)pm mit p n ≤ p m , so ist p n [(r /s) + (t/u)p m−n ] = a + b . Also ist a + b = (g/f )p x mit x ≥ n, d. h. ϕp ist nicht archimedisch, denn es gilt: p −x = ϕp (a + b) ≤ max{p −n , p −m } = p −n .
Wir werden später sehen, dass die in Beispiel 15.3(1) und Beispiel 15.3(2) angegebenen Absolutwerte in einem gewissen Sinn alle möglichen von Q sind. Zunächst wollen wir aber ϕp noch etwas genauer betrachten. Eine Folge (ai )i∈N heißt Cauchy-Folge bezüglich ϕp , falls es für jedes ε > 0 ein n = n(ε) ∈ N gibt, so dass ϕp (ai − aj ) < ε
gilt.
für alle i, j > n
182
Bewertungen und p -adische Zahlen
Sei Ωp die Menge aller Cauchy-Folgen bezüglich ϕp . Wir definieren auf Ωp eine Relation ∼ durch (ai ) ∼ (bi ) genau dann, wenn für jedes ε > 0 ein n = n(ε) existiert, so dass ϕp (ai − bi ) < ε für alle i > n ist. Sei Qp = Ωp /∼ die Menge der Äquivalenzklassen. Auf Qp definieren wir eine Addition und Multiplikation durch (ai )i∈N + (bi )i∈N = (ai + bi )i∈N (ai )i∈N (bi )i∈N = (ai bi )i∈N .
Dies ist das gleiche Verfahren, wie in der Analysis die reellen Zahlen mit dem Betrag |·| konstruiert werden. Auch hier erhält man einen Körper Qp der Charakteristik 0. Es ist ein Standardverfahren der Analysis, dass jede reelle Zahl als Dezimalbruch darstellbar ist. Dieses Verfahren können wir nach Qp mitnehmen. Das liefert Qp =
∞ r =−n
ar p r | 0 ≤ ar < p, n ∈ N .
Da die unendlichen Dezimalzahlen automatisch konvergieren (in R), konvergieren auch obige unendliche Reihen in Qp . Also ist Qp vollständig. Wir können ϕp auf Qp fortsetzen durch ϕp (
∞ r =−n
ar p r ) = p n
für an ≠ 0.
Wir setzen Zp = {x | ϕp (x) ≤ 1}.
Dann ist Zp ein Integritätsbereich. Offenbar ist Qp der Quotientenkörper von Zp =
∞
ai pi | 0 ≤ ai < p .
i=0
Wir werden dies alles später (Satz 15.28) in allgemeinerem Rahmen noch einmal genauer behandeln. Definition 15.4. Sei p eine Primzahl. Den Körper Qp nennen wir den Körper der p adischen Zahlen. Wir wollen nun versuchen, die eingangs angegebenen Gleichungen zu verstehen. Offenbar ist z. B. die erste eine Gleichung in Z5 .
Bewertungen und p -adische Zahlen
Sei α ∈ Zp , also α =
∞
i=0
183
ai pi . Dann ist
α≡
n
ai p i
(mod p n+1 ).
i=0
Ist weiter β ∈ Zp , so ist α=βα≡β
(mod p i )
für alle i ∈ N.
Ist f ∈ Zp [x], so ist ein α ∈ Zp genau dann eine Lösung von f (x) = 0, wenn f (α) ≡ 0 (mod p i ) für alle i ∈ N ist. Wir haben somit unendlich viele Kongruenzen zu lösen. Die Lösungen von f (x) ≡ 0
(mod p)
kann man durch Probieren finden. Wir wählen zuerst ein α0 mit 0 ≤ α0 < p und f (α0 ) ≡ 0 (mod p). Wir setzen α0 = a0 und sei αn−1 = a0 +a1 p+· · ·+an−1 p n−1 bereits gefunden mit f (αn−1 ) ≡ 0
(mod p n ).
Wir suchen nun αn = αn−1 + an p n mit f (αn ) ≡ 0
(mod p n+1 ).
Nach der Taylorformel ist f (αn ) = f (αn−1 ) + an f (αn−1 )p n + · · · ≡ f (αn−1 ) + an f (αn1 )p n
(mod p n+1 ).
Nun ist f (αn−1 ) ≡ hn−1 p n (mod p n+1 ). Damit kann an bestimmt werden: an f (αn−1 )p n + hn−1 p n ≡ 0 (mod p n+1 ).
Das ist äquivalent zu an f (αn−1 ) + hn−1 ≡ 0 (mod p).
Es existiert an , falls f (αn−1 ) ≡ 0 (mod p) ist. Ist f (αn−1 ) ≡ 0 (mod p) und hn−1 ≡ 0 (mod p), so existiert an nicht. Wir wollen dies auf die Gleichung f (x) = x 2 − 7 in Z3 [x] anwenden. Es ist x2 ≡ 7 ≡ 1
(mod 3).
Wir setzen also α0 = 1. Dann ist f (α0 ) = −6 ≡ 3
(mod 9).
184
Bewertungen und p -adische Zahlen
Das liefert h0 ≡ 1 (mod 3). Nun ist f (x) = 2x . Somit ist f (α0 ) ≡ 2
(mod 3).
Es ist dann a1 f (α0 ) + h0 ≡ 2a1 + 1 ≡ 0
(mod 3)
zu lösen. Das liefert a1 = 1. Also haben wir α1 = 1 + 1 · 3.
Nun sind f (α1 ) = 9, h1 = 1 und f (α1 ) = 8 ≡ 2 (mod 3). Somit ist 2a2 + 1 ≡ 0
(mod 3)
zu lösen, was a2 = 1 und α 2 = 1 + 1 · 3 + 1 · 32
liefert. Wenn wir dieses Verfahren fortsetzen, erhalten wir die eingangs gegebene √ Gleichung für 7. Hätten wir im ersten Schritt statt α0 = 1 lieber α0 = 2 gewählt, so hätten wir die zweite Wurzel von x 2 − 7 erhalten: β = 2 + 1 · 3 + 1 · 32 + 2 · 33 + 0 · 34 + · · · .
Wir wollen das Verfahren noch an einem zweiten Beispiel illustrieren. Sei f = x 2 + x + 1 ∈ Z[x].
Dann hat f (x) = 0 in R keine Lösungen. Da x 2 ≡ 1, −1, 0 (mod 5) ist, hat auch x2 + x + 1 ≡ 0
(mod 5)
keine Lösung. Also hat f (x) = 0 in Q5 keine Lösung. Anders sieht das in Q7 aus. Dort gibt es die Lösungen α = 2 + 4 · 7 + 6 · 72 + · · ·
und β = 4 + 2 · 7 + 6 · 72 + · · · .
Es ist α2 = β und β2 = α (α, β sind 3-te Einheitswurzeln in Q7 ). Es wäre allerdings inkorrekt, von α und β als komplexen Zahlen zu sprechen. Sie sind in Q7 und haben mit C nichts zu tun. Wir haben also eine Kollektion von Körpern R und Qp , p Primzahl, die unabhängig voneinander sind. Das Prinzip, alle diese Körper gleichzeitig zu betrachten, ist ein wichtiges Beweisprinzip in der Zahlentheorie. Man nennt es das Hasse-Lokal-GlobalPrinzip. Ein typischer Satz in dieser Richtung ist der folgende:
Bewertungen und p -adische Zahlen
185
Sei f ∈ Z[x1 , . . . , xn ] ein homogenes quadratisches Polynom mit quadratfreien Koeffizienten. Dann hat die Gleichung f = 0 genau dann eine nichttriviale Lösung in Z, falls die Gleichung f = 0 in R und jedem Qp eine nichttriviale Lösung hat. Bisher haben wir uns nur für Lösungen in Zp interessiert. Ist der führende Koeffizient von f durch p teilbar, aber p I(f ) (siehe Definition 15.1), so kann es Lösungen in Qp \Zp geben. Man hat dann aber die Möglichkeit einer Variablentransformation. Sei z. B. f = 9x 2 − 7. Dann gibt es kein α ∈ Z3 mit f (α) = 0. Setzen wir y = 3x , so ist f (y) = y 2 − 7. Das liefert nun, dass α = 3−1 + 1 + 1 · 3 + · · · , β = 2 · 3−1 + 1 + 1 · 3 + · · ·
Lösungen von f (x) = 0 in Q3 sind. Wir wollen jetzt die Absolutwerte auf Q näher untersuchen. Unser Ziel ist es zu zeigen, dass wir bereits alle möglichen (im Wesentlichen) kennen. Dies bezeichnet man auch als Satz von Ostrowski. Satz 15.5. Sei ϕ ein archimedischer Absolutwert auf Q. Dann gibt es eine reelle Zahl s > 0, so dass ϕ(a) = |a|s für alle a ∈ Q gilt. Beweis. Seien n, n ∈ N\{1}. Wir schreiben n = a0 + a1 n + · · · + ak nk
mit 0 ≤ ai < n und ak ≠ 0.
Wir berechnen ϕ(n ). Es ist ϕ(ai ) = ϕ (1 + · · · + 1) ≤ ai ϕ(1) = ai . Lemma 15.2 ai
Also gilt k
ϕ(n ) ≤
ai ϕ(ni ) < n(1 + ϕ(n) + · · · + ϕ(n)k ) ≤ n(k + 1) max{ϕ(n)k ,1}.
i=0
Da n ≥ nk ist, ist log n ≥ k log n, also k ≤ (log n )/ log n. Das liefert log n + 1 max{1, ϕ(n)log n / log n }. ϕ(n ) < n log n
Sei nun r ∈ N beliebig. Wir ersetzen in obiger Formel n durch nr . Dann erhalten wir r log n ϕ(nr ) < n + 1 max{1, ϕ(n)r log n / log n } log n
und somit 1/r r log n +n ϕ(n ) < n max{1, ϕ(n)log n / log n }. log n
186
Bewertungen und p -adische Zahlen
Nun gilt stets lim (r a + b)1/r = 1
r →∞
für a, b ∈ R, a, b > 0.
( ∗)
Also folgt
ϕ(n ) < max{1, ϕ(n)log n / log n }
für alle n, n ∈ N\{1}.
Wir zeigen jetzt, dass es ein n ∈ N\{1} mit ϕ(n ) > 1 gibt. Anderenfalls gilt ϕ(n ) ≤ 1 für alle n ∈ N\{1}. Für a, b ∈ Q und u ∈ N gilt aber stets u u−1 u u a ϕ((a + b) ) = ϕ(a + b + · · · + bu ) 1 u u ≤ ϕ(a) + ϕ( )ϕ(a)u−1 ϕ(b) + · · · + ϕ(b)u 1 ≤ ϕ(a)u + ϕ(a)u−1 ϕ(b) + · · · + ϕ(b)u ,
da ϕ
u i
≤ 1 für alle u, i ist. Also ist ϕ((a + b)u ) ≤ (u + 1) max{ϕ(a)u , ϕ(b)u }.
Das liefert ϕ(a + b) ≤ (u + 1)1/u max{ϕ(a), ϕ(b)}.
Wegen (∗) ist dann ϕ(a + b) ≤ max{ϕ(a), ϕ(b)} für alle a, b ∈ Q.
Das widerspricht aber unserer Annahme, dass Definition 15.1(3 ) nicht gilt. Also gibt es ein n ∈ N\{1} mit ϕ(n ) > 1. Dann ist für dieses n
ϕ(n ) ≤ ϕ(n)log n / log n .
Damit ist ϕ(n) > 1 für alle n ∈ N\{1}, was
ϕ(n ) ≤ ϕ(n)log n / log n
für alle n, n ∈ N\{1}
und weiter
ϕ(n )1/ log n ≤ ϕ(n)1/ log n
für alle n, n ∈ N\{1}
liefert. Also gilt per Symmetrie
ϕ(n )1/ log n = ϕ(n)1/ log n
für alle n, n ∈ N\{1}.
Bewertungen und p -adische Zahlen
187
Wir erhalten jetzt log ϕ(n)(log n)−1 = log ϕ(n )(log n )−1 = s
für alle n, n ∈ N\{1}
und ϕ(n) = ns
für alle n ∈ N\{1}.
Weiter ist ϕ(1) = 1s .
Ist z ∈ Z\N, so ist ϕ(z) wir
=
Lemma 15.2
ϕ(−z) = (−z)s = |z|s . Ist
|a|s = ϕ(a) = ϕ
Also ist ϕ
a b
∈ Q, so erhalten
a ·b =ϕ · ϕ(b). b b
a
a
! a !s ! ! =! ! . b
b Wir wollen nun den analogen Satz für nichtarchimedische Absolutwerte beweisen.
Satz 15.6. Ist ϕ ein nichttrivialer nichtarchimedischer Absolutwert auf Q, so gibt es eine Primzahl p und eine reelle Zahl s > 0 mit ϕ = ϕps . Beweis. Das Maximum-Axiom (Definition 15.1(3 )) liefert ϕ(n) ≤ 1 für alle n ∈ Z. Ist ϕ(n) = 1 für alle n ≠ 0, so ist ϕ trivial. Sei P = {b | b ∈ Z, ϕ(b) < 1}.
Es ist P ≠ {0}. Sind b1 , b2 ∈ P , so ist ϕ(b1 + b2 ) ≤ max{ϕ(b1 ), ϕ(b2 )} < 1
und ϕ(nb) = ϕ(n)ϕ(b) < 1
für alle b ∈ P und n ∈ Z.
Somit ist P ein Ideal in Z. Sind a, b ∈ Z mit ab ∈ P , so ist ϕ(a)ϕ(b) = ϕ(ab) < 1. Also ist ϕ(a) < 1 oder ϕ(b) < 1, d. h. a ∈ P oder b ∈ P . Nach Satz 1.12 ist P ein Primideal in Z und damit ist P = pZ mit einer Primzahl p . Wir setzen nun γ = ϕ(p). pk a b
Dann ist 0 < γ < 1. Sei r = ∈ Q mit ggT(a, b) = 1 und a, b ∈ pZ, k ∈ Z. Da a, b ∈ pZ = P sind, folgt ϕ(a) = 1 = ϕ(b). Also ist a a a ·b =ϕ ϕ(b) = ϕ . 1 = ϕ(a) = ϕ b b b Das liefert ϕ(r ) = γ k .
Nun ist ϕ(r )log p
−1 / log γ
= (γ log p
−1 / log γ
)k = (p −1 )k = ϕp (r ).
Wenn wir s = (log γ)/ log p −1 setzen, so erhalten wir ϕ = ϕps .
188
Bewertungen und p -adische Zahlen
Wir haben somit in Satz 15.5 und Satz 15.6 alle möglichen Absolutwerte auf Q konstruiert. Wenn wir uns auf nichtarchimedische Absolutwerte beschränken, so sehen wir, dass die Addition in R, also die Körperstruktur, keine Rolle spielt. Es kommt nur auf die Anordnung und die multiplikative Gruppe an. Dies wollen wir als Ansatzpunkt für eine Verallgemeinerung benutzen. Statt als Bildbereich die reellen Zahlen zu betrachten, wollen wir diese durch eine angeordnete Gruppe zu ersetzen. Definition 15.7. Eine angeordnete Gruppe A ist eine abelsche Gruppe A mit einer Teilmenge P , wobei die folgenden Eigenschaften gelten: ˙ {1}˙ ∪P −1 , P −1 = {a−1 | a ∈ P }. (1) A = P ∪ (2) Sind a, b ∈ P , so ist auch ab ∈ P . Die Ordnung entsteht dann durch x < y yx −1 ∈ P .
Es ist klar, dass hiermit eine Ordnung auf A definiert wird. Weiter ist mit x1 < x2 auch xx1 < xx2 für alle x ∈ A, die Ordnung ist also mit der Gruppenoperation verträglich. Wenn wir P durch P −1 ersetzen, erhalten wir wieder eine angeordnete Gruppe, mit der umgekehrten Ordnung. Bei den vorher eingeführten Absolutwerten spielte nicht nur die multiplikative Gruppe von R eine Rolle, sondern auch die Null in R. Für die gleich zu gebende Verallgemeinerung des Absolutwertes benötigen wir noch ein Element 0, wobei wir 0 · 0 = 0, x > 0 und x · 0 = 0 = 0 · x für alle x ∈ A setzen. Definition 15.8. Seien K ein Körper, A eine angeordnete abelsche Gruppe und ϕ : K → A ∪ {0} eine Abbildung. Wir nennen ϕ eine Bewertung auf K , falls die folgenden drei Eigenschaften erfüllt sind: (1) Es ist ϕ(a) = 0 genau dann, wenn a = 0 ist. (2) Es ist ϕ(ab) = ϕ(a)ϕ(b) für alle a, b ∈ K . (3) Es gilt ϕ(a + b) ≤ max{ϕ(a), ϕ(b)} für alle a, b ∈ K . Ist ϕ eine Bewertung auf K , so ist ϕ(K \ {0}) = W eine Untergruppe von A. Wir nennen W die Wertegruppe. Es ist klar, dass man A durch W ersetzen kann, da W = (W ∩ P ) ∪ {1} ∪ (W ∩ P −1 ) ist. Im Sinne von Definition 15.8 ist der in Beispiel 15.3(2) eingeführte Absolutwert ϕp mit A = R∗ und P = {a | a ∈ R, a > 0} eine Bewertung, die wir p -adischen Bewertung von Q nennen. In den Anwendungen, insbesondere in der Zahlentheorie, wird häufig die exponentielle Bewertung betrachtet. Dabei schreiben wir die angeordnete Gruppe additiv. Weiter kehren wir die Ordnung um und ersetzen 0 durch ∞. Dabei ist dann ∞ > x für alle x ∈ A. Damit können wir dann Definition 15.8 wie folgt schreiben.
Bewertungen und p -adische Zahlen
189
Definition 15.9. Sei K ein Körper und A eine additiv geschriebene abelsche Gruppe. Eine (exponentielle) Bewertung w auf K ist eine Abbildung w : K → A ∪ {∞} mit (1) w(a) = ∞ genau dann, wenn a = 0 ist. (2) w(ab) = w(a) + w(b) für alle a, b ∈ K . (3) w(a + b) ≥ min{w(a), w(b)} für alle a, b ∈ K . Es ist klar, dass Definition 15.9 äquivalent zu Definition 15.8 ist. Sei ϕp die p-adische Bewertung. Sei weiter a ∈ Q mit a = ( rs )p n , ggT(r , s) = 1 und p teilt weder r noch s . Dann ist ϕp (a) = p −n . Wir definieren wp mit wp (a) = n und A = Z. Dann ist w eine Bewertung im Sinne von Definition 15.9 und ϕp (a) = p −wp (a) . Daher auch der Name exponentielle Bewertung. Jeder Körper hat eine Bewertung ϕ mit ϕ(0) = 0 und ϕ(a) = 1 für alle a ∈ K \ {0}. Diese wollen wir die triviale Bewertung nennen. Im Folgenden verstehen wir unter Bewertung immer eine nichttriviale Bewertung. Für Bewertungen gilt Lemma 15.2 entsprechend. Lemma 15.10. Seien K ein Körper und ϕ eine Bewertung. Für jedes a ∈ K \ {0} ist ϕ(a) = ϕ(a−1 )−1 .
Beweis. Nach Lemma 15.2 ist ϕ(1) = 1. Sei jetzt a ∈ K mit a ≠ 0. Dann erhalten wir 1 = ϕ(aa−1 ) = ϕ(a)ϕ(a−1 ), was die Behauptung liefert. Lemma 15.11. Sei K ein Körper mit Bewertung ϕ. Wir setzen Rϕ = {x|x ∈ K, ϕ(x) ≤ 1}
und m = {x|x ∈ Rϕ , ϕ(x) < 1}.
Dann ist Rϕ ein Ring und m ist das einzige maximale Ideal in Rϕ . Beweis. Sind x, y ∈ K mit ϕ(x) ≤ 1 und ϕ(y) ≤ 1, so ist ϕ(x + y) ≤ max{ϕ(x), ϕ(y)} ≤ 1
nach Definition 15.8(3). Weiter ist ϕ(xy) = ϕ(x)ϕ(y) ≤ 1 nach Definition 15.8(2). Aus Lemma 15.2(1) folgt 1 ∈ Rϕ . Wegen Lemma 15.2(2) ist mit x ∈ Rϕ auch −x ∈ Rϕ . Also ist Rϕ ein Ring. Sind m ∈ m und a ∈ Rϕ , so ist ϕ(am) = ϕ(a)ϕ(m) < 1, d. h. am ∈ m. Sind weiter m1 , m2 ∈ m, so ist ϕ(m1 + m2 ) ≤ max{ϕ(m1 ), ϕ(m2 )} < 1. Also ist m ein Ideal. Sei nun n ein Ideal mit n ⊆ m. Dann gibt es ein x ∈ n \ m. Also ist ϕ(x) = 1. Nach Lemma 15.10 ist ϕ(x −1 ) = 1, also x −1 ∈ Rϕ . Damit ist 1 ∈ n und dann n = Rϕ . Somit ist m einziges maximales Ideal.
190
Bewertungen und p -adische Zahlen
Definition 15.12. Sei K ein Körper mit einer Bewertung ϕ. Den Ring Rϕ aus Lem¯ = Rϕ /m den Restklassenkörper ma 15.11 nennen wir den Bewertungsring und K zu ϕ. Wenn wir statt ϕ eine exponentielle Bewertung w betrachten, so sind Rw = {x ∈ K|w(x) ≥ 0} der Bewertungsring und m = {x|x ∈ K, w(x) > 0} das maximale Ideal.
Ist K = Qp und ϕp die p -adische Bewertung, so war Zp der zugehörige Bewertungsring. Es ist p ∈ Zp und sei m = pZp das von p in Zp erzeugte Ideal. Dann ist ¯ = Zp /m = {i + pZp | i = 0, . . . , p − 1} GF(p). K ¯ ähnelt sehr der des algebraischen Abschluss, wie sie in DefinitiDie Bezeichnung K on 3.15(3) eingeführt wurde. Allerdings wird es im Folgenden immer klar sein, wann der algebraische Abschluss und wann der Restklassenkörper gemeint ist. Wie die Darstellung von Zp zeigt, ist p ein Primelement in Rϕ , ja sogar das einzige Primelement, d. h. jede Nichteinheit x ist in einer Potenz mi enthalten, wobei i durch ϕp (x) = p −i festgelegt ist. Dies wollen wir jetzt verallgemeinern.
Definition 15.13. Sei K ein Körper mit einer Bewertung ϕ. Wir nennen ϕ diskret, falls das Bild ϕ(K \ {0}) eine multiplikative angeordnete zyklische Gruppe t mit t < 1 ist. Ist ϕ diskret, so ist ϕ(K \ {0}) eine unendliche zyklische Gruppe, da in einer angeordneten Gruppe aus t n = 1, stets t = 1 folgt (siehe Aufgabe 4). Da es bis auf Isomorphie nur eine unendliche zyklische Gruppe gibt (Satz 5.28(1)), können wir t in R einbetten. Also kann ϕ als Absolutwert realisiert werden. Insbesondere sind die p -adischen Bewertungen von Q alle diskreten Bewertungen. Satz 15.14. Sei K diskret bewertet mit ϕ(K \ {0}) = t, t < 1, und Rϕ der zugehörige Bewertungsring. Dann gibt es ein q ∈ Rϕ mit ϕ(q) = t , so dass m = qRϕ ist. Es ist Rϕ ein Hauptidealring und für x ∈ Rϕ ist ϕ(x) = t n genau dann, wenn x ∈ qn Rϕ \ qn+1 Rϕ ist. Beweis. Wir wählen q ∈ Rϕ mit ϕ(q) = t . Dann ist q ∈ m und somit qRϕ ⊆ m. Sei u ∈ m. Es ist ϕ(u) = ϕ(q)n für geeignetes n. Also ist u(qn )−1 ∈ Rϕ . Da qn ∈ qRϕ ist, folgt u = (u(qn )−1 )qn ∈ qRϕ . Das liefert m = qRϕ . Sei nun n ≠ 0 ein Ideal in Rϕ . Ist x ∈ n, so ist ϕ(x) = ϕ(q)n für geeignetes n ∈ N. Wir wählen n minimal, d. h. für y ∈ n ist ϕ(y) = ϕ(q)m mit m ≥ n. Dann ist y ∈ qm Rϕ ⊆ qn Rϕ . Also ist n ⊆ qn Rϕ . Genauso folgt qn ∈ xRϕ ⊆ n, d. h. n = qn Rϕ .
Bewertungen und p -adische Zahlen
191
Lemma 15.15. Sei R ein Integritätsbereich und A eine angeordnete Gruppe. Sei weiter ϕ : R → A ∪ {0} eine Abbildung, die Definition 15.8(1)–(3) erfüllt. Dann gibt es eine ˜ von ϕ auf den Quotientenkörper von R mit Fortsetzung ϕ ˜ ϕ
a b
= ϕ(a)(ϕ(b))−1 für
a ˜ = 0. ≠ 0 und ϕ(0) b
˜ a Beweis. Wir setzen ϕ( ) = ϕ(a)(ϕ(b))−1 für b ≠ 0. Ist a = dc , also ad = bc , so b b a c ˜ d ). Also ist ϕ ˜ b ) = ϕ( ˜ wohldefiniert. ist ϕ(a)ϕ(d) = ϕ(b)ϕ(c) und dann ϕ( Für r1 , r2 , t1 , t2 ∈ R mit t1 ≠ 0 ≠ t2 gilt: % ˜ ϕ
r1 t1 · r2 t2
&
% ˜ =ϕ
r 1 t1 r2 t2
&
= ϕ(r1 t1 )(ϕ(r2 t2 ))−1
˜ = ϕ(r1 )ϕ(t1 )(ϕ(r2 ))−1 (ϕ(t2 ))−1 = ϕ
und
% ˜ ϕ
t1 r1 + r2 t2
&
% ˜ =ϕ
r1 t2 + r2 t1 r 2 t2
%
& % & t1 r1 ˜ ϕ r2 t2
&
= ϕ(r1 t2 + r2 t1 )(ϕ(r2 t2 ))−1 ≤ max{ϕ(r1 t2 ), ϕ(r2 t1 )}(ϕ(r2 ))−1 (ϕ(t2 ))−1 = max{ϕ(r1 )ϕ(t2 ), ϕ(r2 )ϕ(t1 )}(ϕ(r2 ))−1 (ϕ(t2 ))−1 = max{ϕ(r1 )(ϕ(r2 ))−1 , ϕ(t1 )(ϕ(t2 ))−1 }
% & % & t1 r1 ˜ ˜ ,ϕ . = max ϕ r2 t2 ˜ eine Bewertung. Also ist ϕ
In den nächsten Beispielen wollen wir der Einfachheit der Notation halber und da wir gewohnt sind, Z als additive Gruppe zu schreiben, stets exponentielle Bewertungen betrachten. Die ersten beiden Beispiele werden das Verfahren aus Lemma 15.15 illustrieren. Im dritten Beispiel wollen wir eine nichtdiskrete Bewertung angeben. Zuvor müssen wir aber einen für die Bewertungstheorie wichtigen Körper, den Körper der formalen Laurentreihen definieren. Dazu betrachten wir zuerst den sogenannten Potenzreihenring. Sei R ein Ring und R{x} die Menge aller Folgen über R. Wir definieren auf R{x} eine Addition und Multiplikation wie folgt (vgl. Definition 1.30): (ai )i∈N + (bi )i∈N = (ci )i∈N
mit ai + bi = ci ,
i∈N
und (ai )i∈N · (bi )i∈N = (ci )i∈N
mit
ci =
i
aj bi−j .
j=0
Damit wird R{x} zu einem Ring, dem Ring der formalen Potenzreihen.
192
Bewertungen und p -adische Zahlen
Ähnlich wie in Definition 1.30 identifizieren wir die Folge (ai )i∈N mit ai = 0 für i ≠ j und aj = 1 mit x j . Wir schreiben dann statt (ai )i∈N
auch
∞
ai x i .
i=0
Dies ist aber eine rein formale Schreibweise. Wir haben hier keine Konvergenz! Allerdings gilt: ∞ i=0
ai x i =
∞
bi x i
genau für ai = bi für alle i ∈ N ∪ {0}.
i=0
Ist R = K ein Körper, so kann man leicht nachrechnen, dass K{x} ein Integritätsbereich ist. Der Quotientenkörper hiervon ist der Körper der formalen Laurentreihen1 K((x)) =
∞
an x n | an ∈ K, t ∈ Z .
n=t
Hierin gilt z. B. ∞ 1 = xi . 1−x i=0
Die üblichen Formeln der Analysis können verwendet werden. Beispiel 15.16. (1) Seien K ein Körper und R = K[x] der Polynomring über K . Für f ∈ R setzen wir w(f ) = − grad f .
Dann ist w : R → Z ∪ {∞} eine Abbildung. Wir zeigen, dass w die Bedingungen aus Definition 15.9(1)-(3) erfüllt. Dazu benutzen wir Lemma 1.32. Ist w(f ) = ∞, so ist grad f = −∞, was zu f = 0 äquivalent ist. Dies liefert, dass Definition 15.9(1) erfüllt ist. Seien f , g ∈ R. Dann ist grad(f g) = grad f + grad g . Also ist w(f g) = − grad(f g) = − grad f + (− grad g) = w(f ) + w(g),
was Definition 15.9(2) ist.
1 P. Laurent, * 18. 7. 1813 Paris, † 2. 9. 1854 Paris, Lehrtätigkeit an der École d’Application in Metz. Laurent leitete von 1840–1846 in Le Hâvre Arbeiten zur Erweiterung des Hafens, wurde 1846 Major und dann Bataillonschef in Paris. Berühmt wurde Laurent durch seine Arbeit „Extension du théorème de M. Cauchy“, in der er die heute sogenannte Laurententwicklung für in einem Kreisring holomorphe Funktionen einführte. Daraus entwickelte sich die Residuentheorie, ein wesentlicher Bestandteil der Funktionentheorie. Laurent beschäftigte sich weiter mit Fragen der Thermodynamik, Optik, Mechanik, fastperiodischen Funktionen und gab eine Integraldarstellung der Legendre-Polynome.
Bewertungen und p -adische Zahlen
193
Sei grad f ≥ grad g . Dann ist w(f + g) = − grad(f + g) ≥ − grad f = min{− grad f , − grad g} = min{w(f ), w(g)},
was Definition 15.9(3) ist. ˜ die exponentielle Bewertung auf K(x) gemäß Lemma 15.15. Der zugehörige Sei w Bewertungsring ist Rw =
!
f! !f , g ∈ R, g ≠ 0 mit grad f ≤ grad g . ! g
(2) Sei K ein Körper R = K{x} der Ring der formalen Potenzreihen. Für f =
∞
ai x i
mit am ≠ 0
i=m
∞
setzen wir w(f ) = m und w(0) = ∞. Sei g = f g = am bn x n+m +
i=n bi x
∞
i
mit bn ≠ 0. Dann ist
ck x k .
k=m+n+1
Also ist w(f g) = w(f ) + w(g). Ist m ≥ n, so ist w(f + g) ≥ w(g) = min{w(f ), w(g)}.
Nach Lemma 15.15 ist w fortsetzbar auf den Quotientenkörper, den Körper der formalen Laurentreihen K((x)) =
∞
ai x i |ai ∈ K, n ∈ Z .
i=n
Der zugehörige Bewertungsring ist Rw =
∞
ai x i |ai ∈ K
= K{x}.
i=0
(3) Sei K ein Körper und R = K[x, y] der Polynomring in zwei Variablen. Wir setzen A = Z × Z mit der lexikographischen Ordnung. m i j Für f = n i=0 j=0 aij x y ∈ R setzen wir w(f ) = min {(i, j)} und w(0) = ∞. aij ≠0 p q i j Sei weiter g = i=0 j=0 bij x y . Dabei seien (u, v) minimal mit auv ≠ 0 und (r , s) minimal mit br s ≠ 0. Sind jetzt (a, b) ≥ (u, v) und (c, d) ≥ (r , s), so ist a + c ≥ u + r . Ist sogar a + c > u + r , so ist (a + c, b + d) > (u + r , v + s).
194
Bewertungen und p -adische Zahlen
Ist a + c = u + r , so ist a = u und c = r . Dann ist b ≥ v und d ≥ s , also ist b + d ≥ v + s . Somit ist stets (a + c, b + d) ≥ (u + r , v + s).
Es gilt fg =
mit cij =
cij x ij aep bf q .
p+q=j e+f =i
Sei cij ≠ 0. Dann ist (i, j) ≥ (u + r , v + s). Dabei ist c(u+r )(v+s) = auv br s ≠ 0. Also ist w(f g) = w(f ) + w(g). Klar ist w(f + g) ≥ min{w(f ), w(g)}. Der zugehörige Bewertungsring ist kein Hauptidealring, also ist die Bewertung nach Satz 15.14 nicht diskret. Um dies zu sehen, betrachten wir das Element x . Es ist w(x) = (1,0) > (0,0). Also ist x ∈ Rw und keine Einheit. Es ist w(xy −n ) = (1, −n) > (0,0),
für n ∈ N. Also ist x ∈ ∩n∈N y n Rw . Da w(y) = (0,1) ≠ (0,0) ist, ist y keine Einheit in Rw . Da x von jeder Potenz von y geteilt wird, ist offenbar Rw kein ZP E -Ring. Also ist nach Satz 1.28 dann Rw kein Hauptidealring. Nach Lemma 15.10 gilt für eine nichttriviale Bewertung ϕ : K → A stets, dass für a ≠ 0 entweder a ∈ Rϕ oder a−1 ∈ Rϕ ist. Diese spezielle Eigenschaft wollen wir nun untersuchen. Definition 15.17. Seien K ein Körper und R ⊆ K ein Ring. Wir nennen R einen Bewertungsring in K , falls aus a ∈ K stets a ∈ R oder a−1 ∈ R folgt. Lemma 15.18. Seien K ein Körper und R ein Bewertungsring in K . Dann hat R genau ein maximales Ideal m. Beweis. Nach Satz 1.14 besitzt R ein maximales Ideal m. Seien a ∈ R \ m fest und 0 ≠ m0 ∈ m beliebig gewählt. Da m0 R ⊆ m ist, ist a ∈ m0 R. Also ist am0−1 ∈ R. Dann ist aber m0 a−1 ∈ R, d. h. m0 = ar mit r ∈ R. Dies liefert m0 ∈ aR und weiter m ⊆ aR, da m0 beliebig in m war. Da a ∈ m ist, ist dann aR = R, d. h. a ist eine Einheit. Damit sind alle Elemente in R \ m Einheiten, was liefert, dass m das einzige maximale Ideal ist. Wir haben gesehen, dass jeder Bewertungsring einer Bewertung auch Bewertungsring im abstrakten Sinne ist. Das nächste Lemma zeigt, dass auch die Umkehrung gilt.
Bewertungen und p -adische Zahlen
195
Satz 15.19. Seien K ein Körper und R ein Bewertungsring in K , m sein maximales Ideal. Wir setzen E = R \ m und A = K ∗ /E . Dann ist A eine multiplikative angeordnete Gruppe. Für jedes x ∈ K ∗ setzen wir ϕ(x) = xE . Mit ϕ(0) = 0 wird ϕ : K → A ∪ {0} zu einer Bewertung auf K . Für diese Bewertung ist R der zugehörige Bewertungsring. Beweis. Die Elemente in E sind nach Lemma 15.18 die Einheiten in R. Da das Produkt von Einheiten wieder eine Einheit ist, ist E eine Untergruppe von K ∗ und damit auch ein Normalteiler. Somit ist A wohldefiniert. Offenbar kann für jede Nebenklasse r E mit r ∈ R \ {0} ein Verterter m ∈ m \ {0} gefunden werden. Das liefert (R \ {0})/E = (m \ {0})E/E.
Nach Definition eines Bewertungsrings gilt für jedes Element aE ∈ K ∗ /E , dass aE ∈ (R \ {0})/E oder a−1 E ∈ (R \ {0})/E ist. Also gilt A = (m \ {0})E/E ∪ {E} ∪ (m \ {0})−1 E/E.
Dies liefert eine Ordnung auf A. Wir zeigen, dass ϕ mit ϕ(x) = xE eine Bewertung ist. Offenbar gilt Definition 15.8(1). Es ist ϕ(xy) = xyE = (xE)(yE) = ϕ(x)ϕ(y).
Also gilt auch Definition 15.8(2). Sei nun x ∈ R, x ≠ 0. Dann ist ϕ(x) = xE ∈ (m \ {0})E/E ∪ {E} = (R \ {0})E/E.
Das liefert ϕ(x) ≤ 1. Nun ist aber auch 1 + x ∈ R. Somit haben wir: Ist x ∈ K mit ϕ(x) ≤ 1, so ist ϕ(1 + x) ≤ 1.
( ∗)
Weiter ist ϕ(x −1 ) = x −1 E = ϕ(x)−1 . Seien nun a, b ∈ K , a ≠ 0. Wir können ϕ(a) ≥ ϕ(b) annehmen. Dann ist ϕ(ba−1 ) = ϕ(b)ϕ(a)−1 ≤ 1.
Also ist ϕ(a + b) = ϕ(a(ba−1 + 1)) = ϕ(a)ϕ(ba−1 + 1) ≤ ϕ(a) = max{ϕ(a), ϕ(b)}. (∗)
Das ist Definition 15.8(3). Somit ist ϕ eine Bewertung. Es ist R = {x | x ∈ K, ϕ(x) ≤ 1}. Also ist R der Bewertungsring zu ϕ.
196
Bewertungen und p -adische Zahlen
Satz 15.20. Sei R ein Bewertungsring. Dann sind gleichwertig (1) R ist ein Hauptidealring. (2) Ist K der Quotientenkörper von R, so hat K eine diskrete Bewertung. Beweis. (1) ⇒ (2): Sei m das maximale Ideal in R. Wir zeigen, dass die in Satz 15.19 konstruierte Bewertung diskret ist. Da R ein Hauptidealring ist, ist m = uR mit geeignetem u ∈ R. Es ist ϕ(u) = t < 1. Sein nun x ∈ m beliebig. Da R ein Hauptidealring ist, ist n∈N un R = {0}. Also gibt es ein i ∈ N mit x ∈ ui R aber x ∈ ui+1 R. Somit ist x = ui r mit r ∈ R \ m. Dann ist ϕ(x) = ϕ(ui )ϕ(r ) = t i · 1 = t i .
Damit ist ϕ(K \ {0}) = t und ϕ ist diskret. (2) ⇒ (1): Diese Aussage steht bereits in Satz 15.14. Diesen Satz können wir jetzt auch benutzen, um einen Fortsetzungssatz zu beweisen, der auf C. Chevalley2 zurück geht. Wir folgen hier der Darstellung in [23, Kapitel 9.8]. Satz 15.21. Sei K ein bewerteter Körper mit Bewertung ϕ und Wertegruppe A. Sei L ⊇ K ˜ ein Oberkörper. Dann kann ϕ auf L fortgesetzt werden, d. h. es gibt eine Bewertung ϕ ˜ , so dass von L und einen Ordnungsmonomorphismus δ von A in die Wertegruppe von ϕ ˜ ϕ(b) = δϕ(b) für alle b ∈ K gilt. ¯ = Rϕ /m und Beweis. Seien Rϕ der Bewertungsring zu K , m sein maximales Ideal, K ˜ ein algebraischer Abschluss von K ¯ . Mit τ wollen wir die Abbildung K ¯ mit τ(r ) = r + m für alle r ∈ Rϕ τ : Rϕ → K
bezeichnen. Wir setzen ˜ S = {(C, f )|Rϕ ⊆ C, C ist Unterring von L, f ∈ Hom(C, K),
so dass f (C) ein Körper ist und f|Rϕ = τ gilt.}. Offenbar ist (Rϕ , τ) ∈ S, d. h. S ≠ ∅. Wir ordnen S durch (C, f ) ≤ (C , f ), falls C ⊆ C und f|C = f ist. Dann liefert das Lemma von Zorn wie üblich ein maximales Element (B, f ) ∈ S.
2 C. Chevalley, *11.2.1909 Johannesburg, †28.6.1984 Paris. Chevalley war einer der Gründer des Bourbaki Kreises. Er leistete fundamentale Beiträge zur Algebra, algebraischen Geometrie und Zahlentheorie.
Bewertungen und p -adische Zahlen
197
Wir zeigen zunächst: B ist ein Bewertungsring in L.
( ∗)
Sei n = ker f . Dann ist n maximal in B, da B/n Bild f ein Körper ist. Wir setzen ˜ = {xb−1 |b ∈ B \ n, x ∈ B} ⊆ L. B
Sind b1 , b2 ∈ B, so folgt aus b1 b2 ∈ n stets b1 ∈ n oder b2 ∈ n, da n ein Primideal ist. ˜, dass auch x1 b1−1+x2 b2−1 = (x1 b2 +x2 b1 )(b1 b2 )−1 Also gilt mit x1 b1−1, x2 b2−1 ∈ B ˜ sind. Somit ist B ˜ ein Ring. und (x1 b1−1 )(x2 b2−1 ) = (x1 x2 )(b1 b2 )−1 in B ˆ ˜ Wir definieren nun einen Homomorphismus f von B nach L durch ˜ fˆ(xb−1 ) = f (x)f (b)−1 für alle xb−1 ∈ B.
Da aus x1 b1−1 = x2 b2−1 dann x1 b2 = x2 b1 und somit f (x1 )f (b2 ) = f (x2 )f (b1 ) ˜. Da Bild f ein folgt, ist fˆ wohldefiniert. Offenbar ist fˆ eine Fortsetzung von f auf B ˜ fˆ). Die maximale Wahl von (B, f ) Körper ist, ist Bild fˆ = Bild f . Also ist (B, f ) ≤ (B, ˜. Damit haben wir: liefert nun B = B Alle Elemente in B \ n sind invertierbar in B. Insbesondere ist n das einzige maximale Ideal.
(1)
Wir führen die folgenden Bezeichnungen ein: Ist α ∈ L, so seien B[α] bzw. n[α] die Teilmenge von L, die aus allen Polynomen in α mit Koeffizienten in B bzw. n besteht. Sei nun für ein a ∈ L sowohl n[a] = B[a] als auch n[a−1 ] = B[a−1 ]. Dann gibt es u0 , . . . , um , v0 , . . . , vn ∈ n mit 1 = u0 + u1 a + . . . + um am und 1 = v0 + v1 a−1 + . . . + vn a−n .
Wir können m ≥ n annehmen und wählen dann m minimal mit der Eigenschaft, dass obige Gleichungen gelten. Es ist (1 − v0 )an = v1 an−1 + . . . + vn .
Da 1 − v0 ∈ n ist, gibt es nach (1) ein b ∈ B mit b(1 − v0 ) = 1. Also ist an = w1 an−1 + . . . + wn , mit wi ∈ n.
Dann können wir aber die Gleichung 1 = u0 + u1 a + . . . + um am
zu einer Gleichung ˜0 + u ˜1a . . . + u ˜ n−1 an−1 1=u
verkürzen.
198
Bewertungen und p -adische Zahlen
Dies widerspricht der minimalen Wahl von m. Damit haben wir gezeigt: Ist a ∈ L, so ist n[a] ≠ B[a] oder n[a−1 ] ≠ B[a−1 ].
(2)
Um (∗) zu zeigen, müssen wir zeigen, dass für a ∈ L wir a ∈ B oder a−1 ∈ B haben. Dazu zeigen wir: Ist a ∈ L mit n[a] ≠ B[a], so ist a ∈ B.
(3)
Wir setzen zunächst f zu einem Homomorphismus α der Polynomringe B[x] und L1 [x], L1 = f (B), fort durch: α(
n
n
ai x i ) =
i=0
f (ai )x i .
i=0
Mit p wollen wir das Ideal in B[x] aller Polynome g mit g(a) = 0 bezeichen. Sei p das Bild von p unter α in L1 [x]. Wäre p = L1 [x], so würden wir ein Polynom n n g = i=0 ai x i mit ai ∈ B haben, so dass g(a) = 0 und i=0 f (ai )x i = 1 ist. Also ist f (a0 ) = 1 und f (ai ) = 0 für alle i > 0. Das liefert a0 ∈ 1 + n und ai ∈ n für i > 0. Also folgt aus g(a) = 0 dann 1 ∈ n[a], was n[a] ≠ B[a] widerspricht. Somit ist p ein echtes Ideal in L1 [x]. Ist p ≠ 0, so gibt es ein normiertes Polynom h ∈ L1 [x] mit ˜ algebraisch abgeschlossen ist, gibt es ein u ∈ K ˜ mit h(u) = 0. Ist p = hL1 [x]. Da K p = 0, so wählen wir u ∈ L1 beliebig. Sei eu der Einsetzungshomomorphismus, also eu (g) = g(u) für alle g ∈ L1 [x].
Die Hintereinanderausführung von α und eu liefert nun einen Homomorphismus f˜ ˜ mit von B[x] nach K f˜(
n
ai x i ) =
i=0
n
f (ai )ui mit ai ∈ B.
i=0
˜ Es ist p ⊆ Kern f˜. Damit induziert f˜ einen Homomorphismus von B[x]/p nach K durch n
ai x i + p →
i=0
n
f (ai )ui .
i=0
Da p genau aus den Polynomen g mit g(a) = 0 besteht, induziert dies nun einen ˜ mit Homomorphismus f˜ von B[a] nach K f˜ (
n
i=0
ai ai ) =
n
f (ai )ui , ai ∈ B.
i=0
Wir haben, dass f˜ (B[a]) zu L1 [u] isomorph ist. Da u algebraisch über L1 ist, ist L1 [u] ein Körper. Es ist f˜|B = f . Also ist (B[a], f˜ ) ∈ S und (B, f ) ≤ (B[a], f˜ ). Die Maximalität von (B, f ) liefert nun B = B[a] und dann a ∈ B, was (3) ist.
Bewertungen und p -adische Zahlen
199
Aus (2) und (3) folgt nun (∗). Wir können jetzt den Satz beweisen. Nach (∗) ist B ein Bewertungsring in L. Seien ˜ die Bewertung von K bzw. L gemäß Satz 15.19 zu Rϕ bzw. B. Nach (1) ist ϕ und ϕ Rϕ ∩ n = m und B \ n ∩ K = Rϕ \ m. Also gibt es einen kanonischen Ordnungsmonomorphismus β von K ∗ /(Rϕ \ m) nach L∗ /(B \ n) mit b(Rϕ \ m) → b(B \ n) für alle b ∈ K ∗ .
Es kann der Homomorphismus τ von Rϕ auf Rϕ /m zu f von B auf B/n erweitert ˜: werden. Also gilt für die Bewertungen ϕ und ϕ ˜ ϕ(b) = βϕ (b) für alle b ∈ K.
(4)
Sei nun ϕ die gegebene Bewertung auf K mit Wertegruppe A. Dann gibt es einen Ordnungsisomorphismus γ zwischen A und K ∗ /(Rϕ \ m) mit ϕ(b) = γϕ (b) für alle b ∈ K ∗ .
(5)
Zusammen mit (4) und (5) erhalten wir einen Ordnungsmonomorphismus δ von A nach L∗ /(B \ n) mit ˜ ϕ(b) = δϕ(b) für alle b ∈ K ∗ . ˜ die gesuchte Fortsetzung von ϕ. In diesem Sinne ist also ϕ
Wir wollen nun noch die von einer Bewertung induzierte Topologie ein wenig untersuchen. Zunächst wollen wir diese aber definieren. Definition 15.22. Sei K ein Körper mit Bewertung ϕ und Wertegruppe A. Für α ∈ A setzen wir Wα = {x|x ∈ K, ϕ(x) < α}.
Sei Tw die Topologie auf K , für die die x + Wα , x ∈ K, α ∈ A, und alle Vereinigungen dieser Mengen die offenen Mengen sind. Für alle α ∈ A ist 0 ∈ Wα und damit ist Wα eine Untergruppe der additiven Gruppe von K . Weiter ist auch stets x ∈ x + Wα . Bevor wir diese Topologie näher untersuchen, beweisen wir noch ein technisches Lemma. Lemma 15.23. Sei K ein Körper mit Bewertung ϕ. Dann gilt: (1) Sind x, y ∈ K ∗ mit ϕ(x) > ϕ(y), so ist ϕ(x + y) = ϕ(x). (2) Es seien x, y ∈ K ∗ und α ∈ A. Ist ϕ(x − y) < min{αϕ(y)2 , ϕ(x)},
so ist ϕ(x −1 − y −1 ) < α.
200
Bewertungen und p -adische Zahlen
Beweis. (1) Es ist ϕ(x) = ϕ(x + y − y) ≤ max{ϕ(x + y), ϕ(y)} ≤ max{ϕ(x), ϕ(y)} = ϕ(x).
Somit steht überall die Gleichheit, was dann auch ϕ(x + y) = max{ϕ(x), ϕ(y)} = ϕ(x)
liefert. (2) Es ist x −1 − y −1 = x −1 (y − x)y −1 . Also ist mit Lemma 15.10 ϕ(x −1 − y −1 ) = ϕ(x − y)ϕ(x)−1 ϕ(y)−1 .
Weiter ist ϕ(x − y) ≤ max{ϕ(x), ϕ(y)}. Wäre ϕ(x − y) = ϕ(y), so wäre nach Annahme ϕ(x) > ϕ(y) = ϕ(−y), was aber (1) widerspricht. Also erhalten wir ϕ(x − y) < ϕ(y). Dann erhalten wir wieder mit (1) ϕ(x) = ϕ(y + (x − y)) = ϕ(y).
Wegen ϕ(x − y) < αϕ(y)2 folgt nun ϕ(x −1 − y −1 ) < αϕ(y)2 ϕ(y)−2 = α.
Jetzt können wir die Topologie Tw näher untersuchen. Für die topologischen Begriffe sei auf das Buch der Autoren Boto von Querenburg [58] verwiesen. Unter einem topologischen Körper verstehen wir im Folgenden einen Körper K , der bezüglich der unterliegenden Topologie hausdorffsch ist und bei dem Addition und Multiplikation stetige Abbildungen von den Produktraum K × K nach K sind. Weiter ist die Abbildung x → x −1 stetig auf K \ {0}. Wir nennen K total unzusammenhängend, wenn die einzigen zusammenhängenden Teilmengen die einelementrigen sind, oder äquivalent, wenn jede offene Teilmenge abgeschlossen ist. Satz 15.24. Die Topologie Tw ist hausdorffsch und mit der Körperstruktur verträglich, d. h. K ist ein topologischer Körper. Weiter ist K total unzusammenhängend. Wenn wir auf A die diskrete Topologie definieren, so ist ϕ : K ∗ → A stetig. Beweis. Seien x, y ∈ K , x ≠ y , mit ϕ(x) = α, ϕ(y) = β und α ≤ β. Sei weiter ϕ(y − x) = δ. Offenbar ist x ∈ x + Wδ . Ist auch y ∈ x + Wδ , so ist y = x + xδ mit xδ ∈ Wδ . Also ist ϕ(y − x) = ϕ(xδ ) < δ, ein Widerspruch. Wir haben gesehen, dass y + Wδ ∩ x + Wδ = ∅ ist, da beide Nebenklassen nach der Untergruppe Wδ sind. Somit ist Tw hausdorffsch. Es ist offenbar, dass die Abbildungen (x, y) → x + y und x → −x stetig sind. Wir wählen x0 ≠ 0 ≠ y0 in K fest. Wegen xy − x0 y0 = (x − x0 )(y − y0 ) + (x − x0 )y0 + x0 (y − y0 )
genügt es für die Stetigkeit von (x, y) → xy zu zeigen, dass sowohl x → x0 x in x = 0 und (x, y) → xy in (0,0) stetig sind.
Bewertungen und p -adische Zahlen
201
Wir setzen Vα = {x|x0 x ∈ Wα }. Für x ∈ Vα ist α > ϕ(x0 x) = ϕ(x0 )ϕ(x), also haben wir ϕ(x) < αϕ(x0 )−1 . Somit ist Vα ⊆ Wαϕ(x0 )−1 . Ist umgekehrt r ∈ Wαϕ(x0 )−1 , so ist ϕ(x0 r ) = ϕ(x0 )ϕ(r ) < ϕ(x0 )(αϕ(x0 )−1 ) = α.
Damit ist x0 r ∈ Vα . Also ist Vα = Wαϕ(x0 )−1 offen. Somit ist x → x0 x in 0 stetig. Wir setzen nun ˜α = {(x, y)|xy ∈ Wα }. V ˜α und ϕ(x) = β, ϕ(y) = γ . Dann ist Seien (x, y) ∈ V α > ϕ(xy) = ϕ(x)ϕ(y) = βγ.
Es ist ϕ(x) < αγ −1 und ϕ(y) < αβ−1 . Also sind x ∈ Wαγ −1 und y ∈ Wαβ−1 und ˜α ⊆ Wαγ −1 × Wαβ−1 mit α > βγ . dann V Seien umgekehrt (r , t) ∈ Wαγ −1 × Wαβ−1 mit α > βγ . Dann ist ϕ(r t) = ϕ(r )ϕ(t) < α2 (γβ)−1 < α, ˜α . Somit ist V ˜α = Wαγ −1 × Wαβ−1 offen. Damit ist auch d. h. r t ∈ Wα , also (r , t) ∈ V (x, y) → xy in (0,0) stetig. Wir betrachten noch die Abbildung x → x −1 . Seien x0 ∈ K \ {0} und α ∈ A. Wir setzen β = min{αϕ(x0 )2 , ϕ(x0 )}.
Ist y ∈ x0 + Wβ , so ist y = x0 + r mit r ∈ Wβ . Das liefert ϕ(r ) < β ≤ ϕ(x0 ). Mit Lemma 15.23(1) erhalten wir dann ϕ(y) = ϕ(x0 ). Also ist ϕ(x0 − y) < β = min{αϕ(x0 )2 , ϕ(x0 )} = min{αϕ(x0 )2 , ϕ(y)}.
Eine Anwendung von Lemma 15.23(2) liefert jetzt ϕ(x0−1 − y −1 ) < α. Somit ist die Abbildung x → x −1 stetig. Für jedes α ∈ A ist K= x + Wα . x∈K
Also ist jede offene Menge Komplement einer Vereinigung offener Mengen, d. h. auch abgeschlossen. Somit ist K total unzusammenhängend. Sei schließlich A mit der diskreten Topologie versehen. Seien ϕ(x0 ) = α und weiter x ∈ x0 + Wα . Dann ist ϕ(x − x0 ) < α = ϕ(x0 ). Also erhalten wir mit Lemma 15.23(1) ϕ(x) = ϕ(x0 ), d. h. ϕ ist stetig. Wir haben in Satz 15.20 eine ringtheoretische Kennzeichnung diskreter Bewertungsringe gegeben. Wir wollen nun eine topologische geben. Dazu zunächst noch eine Definition.
202
Bewertungen und p -adische Zahlen
Definition 15.25. Sei X ein topologischer Raum. (1) Wir nennen X lokal kompakt, wenn X hausdorffsch ist und jeder Punkt eine kompakte Umgebung besitzt. (2) Wir nennen X vollständig, falls X metrischer Raum ist und jede Cauchy-Folge konvergiert. Satz 15.26. Seien K ein Körper mit Bewertung ϕ, Wertegruppe A und Rϕ der zugehörige Bewertungsring mit maximalem Ideal m. Genau dann ist K bezüglich der Topologie Tw lokal kompakt, wenn die folgenden drei Bedingungen erfüllt sind: (1) |Rϕ /m| < ∞. (2) ϕ ist diskret. (3) Tw kommt von einer Metrik, bezüglich der K vollständig ist. In diesem Fall ist Rϕ kompakt. Beweis. Sei zunächst K lokal kompakt. Dann gibt es eine kompakte Umgebung der Null, die Vα = {x|ϕ(x) ≤ α} für ein α ∈ A enthält. Sei a ∈ K mit ϕ(a) = α. Dann ist aRϕ ⊆ Vα . Nach Satz 15.24 ist ϕ : K \ {0} → A stetig, wobei auf A die diskrete Topologie definiert sei. Also ist Rϕ offen und abgeschlossen und dann auch aRϕ , da nach Satz 15.24 die Multiplikation mit Körperelementen stetig ist. Damit ist aRϕ kompakt und dann auch a−1 (aRϕ ) = Rϕ . Wir wollen nun zeigen, dass (1) - (3) erfüllt sind. Es ist Rϕ = (xi + m), wobei i∈I
die xi ein Nebenklassenvertretersystem von m in Rϕ bilden. Da m = W1 offen ist, sind alle xi + m offen. Da Rϕ kompakt ist und xi + m ∩ xj + m = ∅ für i ≠ j gilt, folgt |I| < ∞. Nun ist |I| = |Rϕ /m|. Das ist (1). Sei jetzt y ≠ 0, y ∈ m. Es ist Rϕ offen. Da die Multiplikation nach Satz 15.24 stetig ist, ist auch yRϕ offen. Nun folgt wie eben, dass Rϕ /yRϕ endlich ist. Also gibt es nur endlich viele Ideale, die y enthalten. Insbesondere ist P = {ϕ(x)|1 > ϕ(x) ≥ ϕ(y)}
endlich. Somit hat P ein größtes Element γ . Für alle x ∈ Rϕ mit ϕ(x) < 1 gilt entweder ϕ(x) < ϕ(y) ≤ γ oder ϕ(x) ≥ ϕ(y) und ϕ(x) ≤ γ . Somit ist γ das größte Element in ϕ(K ∗ ), das kleiner als 1 ist. Da P endlich ist, gibt es auch eine größte natürliche Zahl m, so dass γ m ∈ P ist. Also ist γ m ≥ ϕ(y) > γ m+1 .
Das liefert 1 ≥ ϕ(y)γ −m > γ . Nach Definition von γ folgt dann ϕ(y) = γ m . Also ist A = ϕ(K ∗ ) = γ und ϕ ist diskret. Dies ist (2). Wir können nun ohne Einschränkung A = ϕ(K ∗ ) ⊆ R annehmen. Wir setzen d(x, y) = ϕ(x − y). Man rechnet leicht nach, dass dies eine Metrik ist.
Bewertungen und p -adische Zahlen
203
Für r ∈ R ist K(m, r ) = {x|x ∈ K, d(x, m) < r } = {x|x ∈ K, ϕ(x − m) < r } der offene Kreis um m mit Radius r . Wir erhalten K(m, r ) = m + Wr .
Somit ist die von d induzierte Topologie genau Tw . Also ist K ein lokal kompakter metrischer Raum. Nach Satz 15.24 ist jede offene Teilmenge von K auch abgeschlossen. Da ϕ diskret ist, d. h. |A| abzählbar ist, ist K die Vereinigung von abzählbar vielen abgeschlossenen Umgebungen der Null, der Wα , α ∈ A. Nun folgt mit [58, 13.17], dass K vollständig ist. Das ist (3). Es seien nun umgekehrt (1) - (3) erfüllt. Nach Satz 15.24 genügt es zu zeigen, dass Rϕ kompakt ist. Nach (1) gibt es x1 , . . . , xq ∈ Rϕ , so dass q
Rϕ =
(xi + m)
i=1
ist. Sei eine offene Überdeckung von Rϕ , die keine endliche Überdeckung enthält. Dann können wir annehmen, dass auch x1 + m von nicht endlich überdeckt wird. Da ϕ nach (2) diskret ist, ist nach Satz 15.20 m ein Hauptideal, also m = uRϕ . Es ist x1 + m =
q
(x1 + xj u + m2 ).
j=1
Somit existiert nun ein x1 + x2 u + m2 , das nicht endlich überdeckt wird. Das liefert dann eine Folge yn = x1 + x2 u + . . . + xn un−1 mit yn + un Rϕ nicht endlich überdeckt. Dies ist aber eine Cauchy-Folge. Da K nach (1) vollständig ist, konvergiert die Folge (yn ) gegen ein z ∈ Rϕ . Sei nun U ∈ mit z ∈ U . Dann ist z + un Rϕ ⊆ U , für n genügend groß. Insbesondere ist x1 + x2 u + . . . + xn un−1 + un Rϕ ⊆ U , ein Widerspruch zu der Annahme, dass x1 + x2 u + . . . + xn un−1 + un Rϕ nicht endlich überdeckt ist. Wir hatten die p -adische Bewertung ϕp auf Qp fortgesetzt. Dies wollen wir jetzt im allgemeineren Rahmen nachvollziehen. Lemma 15.27. Sei K ein diskret bewerteter Körper mit Bewertung ϕ und Wertegruppe A. ˜ die Vervollständigung von K . Dann ist Die Topologie Tw komme von einer Metrik. Sei K ˜ ein topologischer Körper. Es ist ϕ eindeutig zu einer stetigen Abbildung ϕ ˜∗ → A ˜ :K K ˜ ˜ ist eine Bewertung von K . fortsetzbar, ϕ ˜ ein Körper ist. Dazu zeigen wir, dass die Beweis. Wir müssen zunächst zeigen, dass K ˜ existieren. Dass K ˜ ein Ring ist, sei dem Leser als Übung überlassen. Inversen in K Sei also (ai )i∈N eine Cauchy-Folge mit ai → 0. Wir können dann annehmen, dass alle ai ≠ 0 sind. Seien bi ∈ K mit ai bi = 1. Wir zeigen, dass auch (bi )i∈N ein Cauchy-Folge ist.
204
Bewertungen und p -adische Zahlen
Zunächst ist nach Satz 15.24 ϕ stetig. Also gibt es ein β und ein i0 , so dass ϕ(ai ) ≥ β für alle i ≥ i0 ist. Weiter gibt es ein n0 ∈ N mit ϕ(ai − aj ) < β für alle i, j ≥ n0 , da (ai )i∈N eine Cauchy-Folge ist. Also ist ai = aj + wβ mit wβ ∈ Wβ . Nach Lemma 15.23(1) ist für alle i, j ≥ max(n0 , i0 ) dann ϕ(ai ) = ϕ(aj ) ≥ β. Also gibt es ein j0 mit ϕ(ai ) = δ für alle i > j0 . Ist nun ε > 0 gegeben, so gibt es ein k > j0 , so dass wir für alle s, t > k die folgende Ungleichung realisieren können: ϕ(as − at ) < min{εδ2 , δ} = min{ϕ(as )2 , ϕ(at )}. −1 Nach Lemma 15.23(2) ist dann ϕ(a−1 s − at ) < ε für alle s, t > k. Dies bedeutet, dass −1 −1 −1 ˜ as − at ∈ Wε gilt. Somit ist (ai )i∈N eine Cauchy-Folge. Dies liefert, dass in K ˜ ein Körper. Inverse existieren. Damit ist K ˜ fortsetzbar. Ist x = lim xi , so ist Da ϕ stetig ist, ist ϕ eindeutig zu ϕ
˜ ϕ(x) = lim ϕ(xi ). ˜ eine Bewertung ist. Seien dazu x = lim xi und y = lim yi . Wir zeigen nun, dass ϕ Dann gilt: ˜ ˜ ˜ ϕ(xy) = ϕ((lim xi )(lim yi )) = ϕ(lim(x i yi )) = lim ϕ(xi yi ) ˜ ˜ = lim(ϕ(xi ))(ϕ(yi )) = (lim ϕ(xi ))(lim ϕ(yi )) = ϕ(x) ϕ(y). ˜ ˜ Sei weiter ϕ(x) . Dann gibt es ein i0 , so dass ϕ(xj ) ≤ ϕ(yj ) für alle j ≥ i0 ≤ ϕ(y) gilt. Also ist ϕ(xj + yj ) ≤ max{ϕ(xj ), ϕ(yj )} ≤ ϕ(yj ) für alle j ≥ i0 .
Das liefert ˜ ˜ ˜ ˜ = max{ϕ(x), ϕ(y)}. ϕ(x + y) = lim ϕ(xi + yi ) ≤ lim ϕ(yi ) = ϕ(y)
Wie wir das schon bei den p-adischen Zahlen gemacht haben, wollen wir auch jetzt die Vervollständigung beschreiben. Dort hatten wir die Elemente von Qp als Potenzreihen beschrieben. Wir werden jetzt sehen, dass dies nur ein Spezialfall der allgemeinen Situation ist. Satz 15.28. Sei K diskret bewertet mit Bewertung ϕ und Wertegruppe A = t, t < 1. Seien Rϕ der zugehörige Bewertungsring, y ∈ Rϕ mit ϕ(y) = t und m = yRϕ das maximale Ideal in Rϕ . Sei weiter Σ ein Vertretersystem von m in Rϕ als additive Gruppe ˜ die Vervollständigung von K und ϕ ˜ , so hat ˜ die Fortsetzung von ϕ auf K mit 0 ∈ Σ. Ist K ˜ eine eindeutige Darstellung jedes a ∈ K ˜= a
α
˜ a) ˜ = tm. si y i mit si ∈ Σ, sm ≠ 0, m ∈ Z und ϕ(
i=m
˜ sein maximales Ideal, so gilt: ˜ gehörige Bewertungsring und m Ist weiter Rϕ˜ der zu ϕ Rϕ m Rϕ /m. ˜ /˜
Bewertungen und p -adische Zahlen
205
˜ = lim ai . Nach der Beweis. Sei (ai )i∈N eine Cauchy-Folge mit ai ∈ K und sei a ˜ im Beweis von Lemma 15.27 ist dann ϕ( ˜ a) ˜ = lim ϕ(ai ) ∈ t ∪ {0}. Definition von ϕ ˜ a ˜ ∈ K, ˜ ≠ 0, so ist ϕ( ˜ a) ˜ = t m ∈ t. Also ist ϕ( ˜ ay ˜ −m ) = 1. Sei nun a Seien schon si ∈ Σ, i = 0, . . . , n − 1, gefunden, so dass ˜ ay ˜ −m − ϕ(
n−1
˜ n ) ist. si y i ) ≤ t n = ϕ(y
i=0
Dann gilt ˜ −m − ˜ −n (ay ϕ(y
n−1
sy i )) ≤ 1.
i=0
˜ ϕ(x) ˜ Da Rϕ dicht in Rϕ˜ = {x ∈ K| ≤ 1} ist, gibt es ein b ∈ Rϕ mit ˜ −m − ˜ −n (ay ϕ(y
n−1
si y i ) − b) ≤ t.
i=0
Nun ist b = sn + b y mit sn ∈ Σ. Also ist ˜ ay ˜ −m − ϕ(
n
si y i − b y n+1 ) ≤ t n+1 .
i=0
Weiter ist ˜ ay ˜ −m − ϕ(
n
˜ y n+1 ), ϕ( ˜ ay ˜ −m − si y i ) ≤ max{ϕ(b
i=0
n
si y i − b y n+1 )} ≤ t n+1 .
i=0
∞ i+m ˜ = lim n Somit ist a = j=m sj−m y j . Damit ist die Darstellung der Elei=0 si y ˜ bewiesen. mente aus K ˜ = m und Rϕ + m ˜ = Rϕ ˜ ∈ Rϕ Es ist Rϕ ∩ m ˜ . Ist a ˜ , so ist ˜ = s0 + y a
∞
˜. si y i−1 ∈ Rϕ + m
i=1
Also gilt ˜ /˜ ˜ = Rϕ /m. Rϕ m = Rϕ + m m Rϕ /Rϕ ∩ m ˜ /˜
Körper, die bezüglich einer diskreten Bewertung vollständig sind und |Rϕ /m| < ∞ erfüllen, nennt man auch lokale Körper. Mit Qp hatten wir bereits einen solchen kennen gelernt. Betrachten wir den Polynomring K[x] über einem endlichen Körper K mit der Bewertung aus Beispiel 15.16(1). Diese können wir nach Lemma 15.15 auf den Quotientenkörper K(x) fortsetzen. Der Bewertungsring Rϕ von K(x) besteht aus den Ausdrücken x k b(x)/c(x) mit b(0) ≠ 0 ≠ c(0) und k ≥ 0. Das maximale Ideal m sind genau diejenigen Ausdrücke mit k > 0. Sei α : Rϕ → K der Homomorphis-
206
Bewertungen und p -adische Zahlen
mus mit α(f ) = f (0), für alle f ∈ Rϕ . Dann ist der Kern genau m und somit ist K Rϕ /m. Nach Satz 15.28 ist der Körper der formalen Laurentreihen K((x)) die Vervollständigung von K(x). Weiter ist auch der Restklassenkörper von K((x)) zu dem von K(x) isomorph, also zu K isomorph. Das zeigt, dass K((x)) ein lokaler Körper ist. Man kann zeigen, dass jeder lokale Körper entweder der Körper der formalen Laurentreihen über einem endlichen Körper oder eine endliche Erweiterung von Qp ¯ im nächsten Satz beweisen. Für den ist. Wir wollen dies für den Fall char K = char K ¯ Fall char K ≠ char K siehe das Buch von N. Jacobson [23, Kapitel 9.12, Satz 9.16]. Satz 15.29. Sei K diskret bewertet mit Bewertung ϕ und Wertegruppe A = t, t < 1. ¯ vollkommen und char K = char K ¯ = p > 0, so existieren Ist K vollständig, Rϕ /m = K ¯ ein Teilkörper K0 von K mit K0 K und ein Element y ∈ K mit ϕ(y) = t , so dass K=
∞
ai y i |ai ∈ K0 , m ∈ Z
i=m
ist. Weiter ist ϕ|K0 trivial. Es ist K zum Ring der formalen Laurentreihen über K0 isomorph. Beweis. Seien Rϕ der Bewertungsring zu ϕ und m das maximale Ideal. Wir wählen y ∈ K mit ϕ(y) = t . Mit dieser Wahl haben wir m = yRϕ . Wir wollen Satz 15.28 anwenden. Dazu zeigen wir, dass es einen Unterkörper K0 von K gibt, der ein Neben¯ isomorph sein. Wir suchen klassenvertretersystem von m in Rϕ ist. Weiter soll K0 zu K ¯. ¯ → K0 ⊆ Rϕ mit α(a) ¯∈K ¯ +m=a ¯ für alle a also einen Isomorphismus α : K ¯ vollkommen ist, existiert nach Satz 8.16 für jedes n ∈ N das Element Da K −n ¯ . Für jedes n ∈ N wählen wir ein an ∈ Rϕ mit ¯p ∈ K a −n
¯p . an + m = a
Wir zeigen zunächst: pn
(an ) ist eine Cauchy-Folge. p
¯p Es ist an+1 ∈ a
−n
pn+1
(1)
p
= an +m. Also ist an+1 −an ∈ m. Wir zeigen nun, dass für alle
pn
pn+1
pn
n ∈ N stets an+1 − an ∈ mn+1 = y n+1 Rϕ gilt. Dann ist ϕ(an+1 − an ) ≤ t n+1 . pn Insbesondere ist dann (an ) eine Canchyfolge. pi
pi−1
Sei bereits an+1 −an
pi
mit c ∈ Rϕ geeignet. Nun haben wir char K = p ist. Somit ist
nun die Behauptung.
pi−1
∈ mi = y i Rϕ für ein i gezeigt, so ist an+1 − an
p i+1 an+1
−
pi an
p i+1 an+1
=
pi−1 (an
+ cy i )p =
pi an
= cy i
+ c p y ip , da
∈ mi+1 , da ip ≥ i + 1 ist. Per Induktion folgt
207
Bewertungen und p -adische Zahlen
Wir definieren α durch pn
¯ = lim an . α(a)
Da K vollständig ist, existiert nach (1) dieser Limes. Wir zeigen als Nächstes, dass α eine Abbildung ist. α ist wohldefiniert.
(2) p
n
pn
¯. Dann ist an − an ∈ m, also an − an Seien dazu an , an ∈ a n p pn liefert lim an = lim an . Das ist (2).
∈ mn+1 . Das
α ist ein Homomorphismus.
(3)
Dies ist klar, da Grenzwerte additiv und multiplikativ sind. ¯ nach Rϕ . α ist ein Monomorphismus von K
(4)
¯ die Folge (an )n∈N ¯ ein Körper ist, genügt es α ≠ 0 zu zeigen. Wir wählen zu 1 Da K ¯ mit an = 1 für alle n ∈ N. Dann ist offenbar α(1) = 1. ¯ = K0 ein Vertretersystem für m in Rϕ . Es ist α(K)
(5)
Wir haben pn
p
p2
p
¯ = lim an = a0 + (a1 − a0 ) + (a2 − a1 ) + . . . = a0 + α(a)
∞
pi
pi−1
(ai − ai−1 ).
i=1 pi
p i−1
Alle Summanden (ai − ai−1 ) liegen in m. Da ϕ diskret mit t < 1 ist, haben wir m = {u|u ∈ Rϕ , ϕ(u) < 1} = {u|u ∈ Rϕ , ϕ(u) ≤ t}. Also ist m abgeschlossen ¯ = a0 + m war, folgt ¯ − a0 ∈ m. Da a in K in der Topologie Tw . Das liefert α(a) ¯ = a0 + m = a ¯. Somit ist K0 ein Vertretersystem für m in Rϕ . α(a) Nun folgt die Behauptung mit (4), (5) und Satz 15.28 mit Σ = K0 . ¯ = 0, wie wir gleich zeigen Die gleiche Aussage gilt auch für char K = char K werden. Dazu beweisen wir nun ein fundamentales Lemma, das wir später auch zur Faktorisierung von Polynomen benutzen werden. Desweiteren werden wir dies auch benutzen, um Qp Qq für p ≠ q zu folgern.
Lemma 15.30 (Hensel3 ). Seien K diskret bewertet mit Bewertung ϕ und Wertegruppe A = t, t < 1, Rϕ der zugehörige Bewertungsring und m sein maximales Ideal. Weiter seien K vollständig, f = an x n + · · · + a0 ∈ Rϕ [x]
und
¯ ¯0 ∈ K[x]. ¯n x n + · · · + a f¯ = a
3 K. Hensel, * 29. 12. 1861 Königsberg, † 1. 6. 1941 Marburg, Professor in Berlin und ab 1902 in Marburg, Entdecker der p -adischen Zahlen.
208
Bewertungen und p -adische Zahlen
¯ mit normiertem g ¯ = 1. Dann existieren Urbilder ¯ ¯h ¯ und ggT(g, ¯ h) In K[x] gelte f¯ = g ¯ in Rϕ [x] mit ¯, h g , h von g (1) g ist normiert, (2) f = gh, ¯. (3) grad g = grad g
Beweis. Sei y ∈ Rϕ mit ϕ(y) = t . Dann ist m = yRϕ . Wir wählen g0 , h0 ∈ Rϕ [x] mit (1) g0 ist normiert, ¯, ¯, grad h0 = grad h (2) grad g0 = grad g ¯ ¯ ¯ ¯, h0 = h. (3) g0 = g Dabei können wir grad g0 > 0 ≤ grad h0 annehmen. Es ist per Konstruktion f − g0 h0 ∈ pRϕ [x].
(1)
¯ ∈ K[x] ¯ ¯ b Nach Satz 1.22 finden wir a, mit ¯+b ¯g ¯h ¯ = 1. a
(2)
¯ in Rϕ [x]. Dann ist ah0 + bg0 − 1 ¯ bzw. b Seien nun a und b Urbilder von a in yRϕ [x]. Also gilt f − g0 h0 ∈ yRϕ [x]
und
ah0 + bg0 − 1 ∈ yRϕ [x].
(3)
Nun konstruieren wir Folgen von Polynomen gn , hn . Diese werden dann gegen g bzw. h konvergieren. Seien gn , hn für ein n bereits gefunden mit: ¯ gn ist normiert mit grad gn = grad g n
gn − gn−1 ∈ y Rϕ [x] f − gn hn = y
n+1
rn (x) ∈ y
und
und n+1
¯ grad hn ≤ grad f − grad g n
hn − hn−1 ∈ y Rϕ [x]
Rϕ [x]
und
grad rn ≤ grad f .
(4) (5) (6)
Wir suchen nun gn+1 und hn+1 . Es sind gn −g0 ∈ yRϕ [x] und hn −h0 ∈ yRϕ [x]. Nach (3) ist dann ahn + bgn − 1 ∈ yRϕ [x].
(7)
Wir setzen an = arn und bn = brn . Dann ist an hn + bn gn − rn ∈ yRϕ [x].
(8)
Wir divideren an durch gn mit Rest, also an = gn cn + dn
mit grad dn < grad gn .
Somit können wir in (8) o. B. d. A. grad an < grad gn annehmen. Nun ist nach (8) ¯n + b ¯n g ¯n h ¯n r¯n = a
mit grad r¯n ≤ grad f .
(9)
Bewertungen und p -adische Zahlen
209
Es gilt ¯ n ≤ grad gn + grad f − grad g ¯ n ≤ grad gn + grad h ¯n h ¯ = grad f . grad a (4)
(4)
Also ist nach (9) ¯n g ¯n ≤ grad f . grad b
Das liefert nun ¯n ≤ grad f − grad g. ¯ grad b
Wir setzen jetzt gn+1 = gn + y n+1 an
und hn+1 = hn + y n+1 bn .
Da grad an < grad gn ist, ist gn+1 normiert. Weiter haben wir ¯ grad gn+1 = grad gn = grad g
und
gn+1 − gn = y n+1 an ∈ y n+1 Rϕ [x]
und
¯ grad hn+1 ≤ grad f − grad g
und hn+1 − hn = y n+1 bn ∈ y n+1 Rϕ [x].
Somit ist f − gn+1 hn+1 = f − gn hn − y n+1 (gn bn + hn an ) − y 2n+2 an bn = y n+1 (rn − gn bn − hn an ) − y 2n+2 an bn ∈ y n+2 Rϕ [x],
(6)
da rn − gn bn − hn an ∈ yRϕ [x] nach (8) ist. Damit haben wir Folgen (gn )n∈N und (hn )n∈N konstruiert, die (4), (5) und (6) erfüllen. Nach (5) sind diese Cauchy-Folgen. Die Vollständigkeit von K liefert, dass gn → g ∈ K[x]
und
hn → h ∈ K[x]
gilt. Weiter ist gn hn → f nach (6) und somit f = gh. ¯ ist, folgt Nach Lemma 1.43 gilt dann sogar g, h ∈ Rϕ [x]. Da aber grad gn = grad g ¯. nun grad g = grad g
Wir können jetzt den angekündigten Satz beweisen.
210
Bewertungen und p -adische Zahlen
Satz 15.31. Sei K diskret bewertet mit Bewertung ϕ, Wertegruppe A = t, t < 1, und ¯ = 0 und K Bewertungsring Rϕ mit maximalem Ideal m. Seien weiter char K = char K ¯ , der ein Vertretersystem für m in Rϕ ist vollständig. Dann existiert ein Körper K0 K und ein y ∈ Rϕ mit ϕ(y) = t , so dass K der Ring der formalen Laurentreihen über K0 ist, d. h. K=
∞
si y i |si ∈ K0 , n ∈ Z .
i=n
¯ = 0 und Beweis. Sei Z die von 1 erzeugte additive Untergruppe in Rϕ . Da char K 1 ∈ m ist, ist n ∈ m für alle n ∈ Z \ {0}. Also ist Z ∩ m = 0. Nach Definition eines Bewertungsrings haben alle Elemente aus Z ein Inverses in Rϕ . Somit können wir Q ⊆ Rϕ annehmen.
Wir betrachten jetzt die Menge ¯ ⊆L ¯ mit Q ¯, α)|L ¯ ist ein Unterkörper von K ¯, α : L ¯ → Rϕ S = {(L ¯}. ist ein Homomorphismus mit α(l) + m = l, für alle l ∈ L ¯ id) in ¯ ist das Bild von Q in K ¯ und nicht der algebraische Abschluss von Q.) Da (Q, (Q S ist, ist S ≠ ∅. Wir definieren eine Ordnung auf S durch ¯1 , α1 ) ≤ (L ¯2 , α2 ), falls L ¯2 und α2 ¯ = α1 ist. ¯1 ⊆ L (L |L 1
ˆ= Sei K eine Kette in S. Dann setzen wir L
¯,α)∈K (L
¯ und α ˆ= L
¯,α)∈K (L
α. Es ist offenbar
ˆ, α) ˆ eine obere Schranke von K , die in S liegt. Nach dem Lemma von Zorn existiert (L ¯=K ¯ gilt. Dazu nehmen ¯, α) ∈ S. Wir wollen zeigen, dass L ein maximales Element (L ¯\L ¯ gibt. Dies wollen wir zum Widerspruch führen. ¯∈K wir an, dass es ein a ¯: ¯ transzendent über L Es ist a
( ∗)
¯ wäre algebraisch. Dann gibt es ein irreduibles und normiertes Angenommen a ¯ = 0 ist, ist f¯ nach Korollar 8.8 separabel. ¯[x] mit f¯(a) ¯ = 0 . Da char K Polynom f¯ ∈ L Also ist ¯ g ¯ mit g( ¯ a) ¯ ≠ 0. f¯ = (x − a) ¯ ¯ ist, ist dies eine Zerlegung in K[x] ¯∈K Da a . n i ¯ ¯i )x i . Es ist f ∈ Rϕ [x] nach ¯i x , so setzen wir f = n Ist f = i=0 a i=0 α(a ¯ und Definition von α . Nach Lemma 15.30 gibt es ein a ∈ Rϕ mit a + m = a f = (x − a)g, wobei g ∈ Rϕ [x] ist.
211
Bewertungen und p -adische Zahlen
¯[x] → α(L ¯)[a] ⊆ Rϕ durch Wir definieren jetzt einen Homomorphismus ψ : L ψ(
n i=0
c¯i x i ) =
n
α(¯ ci )ai .
i=0
¯ algebraisch ist, ist Da a ¯[a] ¯[x]/f¯L ¯[x] ¯ L L
ein Körper. ¯[a] ˜ von L ¯ Nun ist ψ(f¯) = f (a) = 0. Also induziert ψ einen Homomorphismus ψ ˜ |L = α nach Definition von ψ. Weiter ist ψ( ˜ a) ¯ +m=a ¯. Damit ist nach Rϕ . Es ist ψ ¯⊂L ¯[a] ¯ , also L ¯≠L ¯[a] ¯[a], ¯ ist, ist L ˜ ∈ S. Da a ¯ ⊆K ¯ , ein Widerspruch zur ¯ ψ) ¯ ∈ L (L ¯ ist. ¯ ¯ transzendent über L Maximalität von (L, α). Somit haben wir gezeigt, dass a ¯) : ¯ in Rϕ , so ist a transzendent über L = α(L Ist a ein Urbild von a
(∗∗)
Sei a algebraisch über L. Dann gibt es ein f ∈ L[x] mit f (a) = 0 und f ≠ 0. Nach Definition von α ist α(L) ⊆ Rϕ \ m. Also ist f ∈ Rϕ [x] \ m[x]. Für jedes n n ¯i ) = ai für alle i = 0, . . . , n. Da ¯i x i mit α(a f = i=0 ai x i setzen wir f¯ = i=0 a ¯ ¯ ¯ = f (a) = 0, ein Widerspruch zu (∗). Also f ∈ m[x] ist, ist f ≠ 0. Es ist aber f (a) ist auch a transzendent über L. ¯(a) ¯)(a) durch ¯ von L ¯ nach α(L Wir definieren jetzt einen Homomorphismus α ¯ |L¯ = α und α( ¯ a) ¯ = a. Dieser Homomorphismus ist wohldefinert, da nach (∗) α ¯, α) < (L ¯(a), ¯ als auch a transzendent sind. Dann ist (L ¯ α) ¯ , ein und (∗∗) sowohl a Widerspruch. ¯ =L ¯ gilt. Nun folgt die Behauptung wieder mit Also haben wir gezeigt, dass K ¯ Satz 15.28 und Σ = K0 = α(K). ¯ = GF(p). Sei Beispiel 15.32. Seien K = Qp und m ∈ N mit p m. Dann ist K m ¯ ¯ ¯ ¯ ∈ K . Angenommen, es gibt ein b ∈ K mit a ¯ = b . Dann ist 0≠a ¯ g ¯ = (x − b) ¯ f¯ = x m − a ¯ in K[x] . ¯ ≠ 0. Weiter ist auch g( ¯ ≠ 0. Also sind die ¯ b) Da f¯ = mx m−1 ist, ist f¯ (b) Voraussetzungen von Lemma 15.30 erfüllt. D. h. f = x m − a = (x − b)g
in K[x]. Somit existiert die m-te Wurzel aus a in Qp , falls sie in GF(p) existiert. Wir wollen nun zeigen, dass die Körper R, C und Qp alle paarweise verschieden sind.
212
Bewertungen und p -adische Zahlen
Satz 15.33. Seien p und q verschiedene Primzahlen. (1) Qp hat genau dann eine primitive m-te Einheitswurzel, falls p > 2 und p − 1 von m geteilt wird, oder p = 2 = m ist. (2) Qp Qq . (3) C Qp R für alle p . ¯ eine Zerlegung von x p−1 − 1 in (x − a) Beweis. (1) Es ist x p−1 − 1 = 0≠a∈GF(p) ¯ Zp /pZp [x] GF(p)[x]. Nach Lemma 15.30 ist dann
p−1
x p−1 − 1 =
(x − bi )
in Zp [x].
i=1
Also gibt es primitive (p − 1)-te Einheitswurzeln in Qp . Sei nun a eine Einheitswurzel in Qp mit ap−1 ≠ 1. Dann gibt es auch ein a mit (p−1)m a = 1, wobei m eine Primzahl ist. Es ist ϕp (a)(p−1)m = ϕp (a(p−1)m ) = ϕp (1) = 1. ¯p−1 = 1. Somit ist Also ist ϕp (a) = 1. Das liefert a ∈ Zp . Dann ist a ap−1 = 1 + bp s
Nun gilt
mit s > 0 und p b.
1=a
(p−1)m
m 2 2s = 1 + mbp + b p + · · · + bm psm . 2 s
Das liefert mbp s ∈ p s+1 Zp . Also ist p | m. Da m Primzahl war, folgt p = m. Sei nun p ≠ 2. Dann ist p | pi für alle 1 ≤ i ≤ p − 1. Weiter ist sm = sp ≥ 3s ≥ 2s + 1. Also ist mbp s ∈ p 1+2s Zp . Das liefert nun aber den Widerspruch ps | b . Damit haben wir für p > 2 gezeigt, dass es nur primitive m-te Einheitswurzeln für m | p − 1 gibt. Es bleibt p = 2 = m. Wir zeigen, dass es in Q2 keine primitiven 4-ten Einheitswurzeln gibt. Dann ist (1) bewiesen. Sei a = 1 + 2s b eine primitive 4-te Einheitswurzel. Dann ist −1 = a2 = 1 + 2s+1 b + 22s b2 .
Das liefert nun den Widerspruch 1/2 = ϕ2 (−2) = ϕ2 (2s+1 b + 22s b 2 ) ≤ 1/2s+1 < 1/2.
(2) Sei Qp Qq . Mit (1) folgt dann q = 2 und p = 3. Wir betrachten die Gleichung x = 3. Sei x eine Lösung in Q3 . Dann gilt 3
ϕ3 (x)3 = ϕ3 (3) = 1/3.
Bewertungen und p -adische Zahlen
Also ist
213
3 ϕ3 (x) = 1/ 3 ∈ Q,
ein Widerspuch. Somit ist x 3 = 3 in Q3 nicht lösbar. Nun gilt 2 ¯ = x3 − 1 ¯ = (x − 1)(x ¯ ¯ x3 − 3 + x + 1)
in GF(2)[x].
Nach Lemma 15.30 ist x 3 − 3 = (x − b)h
in Q2 [x].
Somit ist x 3 = 3 lösbar in Q2 , was Q2 Q3 liefert. (3) Sei x eine Lösung von x 2 = p in Qp . Dann gilt ϕp (x)2 = 1/p,
also 1/ p = ϕp (x) ∈ Q,
ein Widerspruch. Somit ist x 2 = p in Qp nicht lösbar. Aber in R ist x 2 = p stets lösbar, d. h. R Qp C. Wir beweisen zum Schluss dieses Kapitels noch ein nützliches Reduzibilitätskriterium. Satz 15.34. Sei K = Qp und f = an x n + · · · + a0 ∈ K[x]
irreduzibel. Dann ist max{ϕp (ai ) | i = 0, . . . , n} = max{ϕp (a0 ), ϕp (an )}.
Beweis. Wir können o. B. d. A. max{ϕp (ai ) | i = 0, . . . , n} = 1 annehmen. Sei nun ϕp (a0 ) < 1 > ϕp (an ). Wir wählen j maximal mit ϕp (aj ) = 1. Also ist ϕp (ai ) < 1 für alle i = j + 1, . . . , n. Es ist dann ¯1 x + · · · + a ¯n x n ¯0 + a f¯ = a ¯0 + a ¯1 x + · · · + a ¯j x j =a ¯0 + · · · + x j ). ¯j (b =a ¯0 + · · · + x j . Nach Lemma 15.30 gibt es h und g mit f = hg ¯g ¯=b ¯ mit g Also ist f¯ = h und grad g = j . Das widerspricht aber 1 ≤ j < n und der Voraussetzung, dass f irreduzibel ist.
Der entsprechende Satz für den üblichen Betrag auf Q ist übrigens falsch. Es ist z. B. 9x 2 + 12x + 8 irreduzibel über R, aber max{|ai | | i = 0, 1, 2} = 12 = |a1 | ist ungleich |a0 | oder |a2 |.
214
Bewertungen und p -adische Zahlen
Übungen 1.
2.
3.
Sei K{x} der Potenzreihenring über dem Körper K . (a) Zeige, dass K{x} ein Integritätsbereich ist. (b) Berechne die Einheiten in K{x}. Sei K{x} der Potenzreihenring über dem Körper K . (a) Bestimme alle Ideale von K{x}. (b) Zeige, dass K{x} ein euklidischer Ring ist. Was sind die Primelemente? Sei K ein Körper mit Absolutwert | · |. Dann ist | · | genau dann nicht archimedisch, wenn für alle n ∈ N immer |1 · · + 1| ≤ 1 gilt. + · n
4. 5. 6. 7.
Sei A eine angeordnete abelsche Gruppe und t ∈ A mit o(t) = n < ∞ (also t n = 1, n ∈ N). Dann ist t = 1. Seien K ⊆ L algebraisch und ϕ eine Bewertung auf L. Ist ϕ(k) = 1 für alle k ∈ K\{0}, so ist ϕ() = 1 für alle ∈ L\{0}. Ist K ein Körper mit |K| < ∞, so hat K nur triviale Bewertungen. Sei ϕ eine Bewertung eines Körpers K . Seien weiter ai ∈ K , i = 1, . . . , n, mit a1 + a2 + · · · + an = 0,
n ≥ 2.
Dann gibt es j, k ∈ {1, . . . , n}, j ≠ k, mit ϕ(aj ) = ϕ(ak ) = max ϕ(ai ). i
8.
Seien R ein Integritätsbereich und m ein Ideal in R mit
∞
n=0
mn = 0. Definiere
|·|:R→Q
durch |v| =
1 v ∈ mk , v ∈ mk+1 , v ≠ 0 k
und |0| = 0.
Zeige: Die Fortsetzung von | · | auf den Quotientenkörper von R ist ein Absolutwert. 9. Sei R ein Bewertungsring eines Körpers K . Dann ist K ein Quotientenkörper von R. 10. Sei R ein diskreter Bewertungsring des Körpers K . Ist R ⊆ R1 ⊆ K , R1 ein Unterring von K , so ist R = R1 oder R1 = K . 11. Ein Integritätsbereich R ist genau dann ein Bewertungsring in seinem Quotienenkörper, wenn die Menge der Ideale von R durch Inklusion total geordnet ist. 12. Sei R ein Bewertungsring in einem Körper K . Sind a, b ∈ R, so ist a ein Teiler von b oder b ein Teiler von a. 13. Sei K ein Körper und R ⊆ K ein Bewertungsring in K . Sind f ∈ R[x] ein normiertes Polynom und a ∈ K eine Nullstelle von f , so ist a ∈ R. 14. Seien K ein diskret bewerteter vollständiger Körper mit Bewertungsring Rϕ . Sei f ∈ K[x ] ein normiertes irreduzibles Polynom. Dann ist f (0) ∈ Rϕ genau dann, wenn f ∈ Rϕ [x] ist. 15. Sei K ein vollständiger Körper bezüglich der Bewertung ϕ. Zeige, dass ∞ i=0 ai genau dann konvergiert, wenn lim ai = 0 ist. 16. Seien p1 , . . . , pn ∈ Z paarweise verschiedene Primzahlen, x1 , . . . , xn ∈ Z und 1 , . . . , n ∈ R mit i > 0 für alle i. Dann gibt es ein x ∈ Z mit ϕpi (x − xi ) ≤ i für alle i = 1, . . . , n.
Bewertungen und p -adische Zahlen
17.
Für eine Primzahl p definieren wir Z(p) = {
18. 19. 20.
21.
215
a | a, b ∈ Z, p teilt nicht b}. b
(a) Zeige, dass für jede Primzahl p stets Z(p) ein Bewertungsring in Q ist. (b) Bestimme den Durchschnitt der Z(p) über alle Primzahlen p . Bestimme alle diskreten Bewertungsringe in Q. Sei K ein Körper. Bestimme alle diskreten Bewertungen auf K(x), die auf K trivial sind. t Schreibe folgende Elemente aus Qp in der Form ∞ t=m at p , m ∈ Z: 1 (a) 5 ∈ Q3 , (b) 13 ∈ Q2 , (c) −1 ∈ Qp . Sei a ∈ Q. Dann gilt |a| ϕp (a) = 1. p 3
22. Zeige: x = 5 hat keine Lösung in Q5 . 23. Das Polynom x 2 + x + a, a ∈ Z, hat genau dann eine Nullstelle in Q2 , wenn a gerade ist. 24. Sei f = x 3 −x −a ∈ Q3 mit a ∈ Z. Wann ist f irreduzibel? Welche Grade haben die irreduziblen Faktoren? 25. Sei a ∈ Qp mit p -adischer Entwicklung a=
∞
αi p i .
i=k
26. 27.
28. 29.
30.
Dann ist a ∈ Q genau dann, wenn a periodisch ist, d. h. es existieren r ≥ 1 und n ≥ k mit αi+r = αi für alle i ≥ n. Sei x ∈ Q2 , x = 1 + 8r mit ϕ2 (r ) ≤ 1. Dann gibt es ein y ∈ Q2 mit y 2 = x , y = 1 + 2t und ϕ2 (t) ≤ 1. Seien K = Q2 und a ∈ K mit ϕ2 (a) = 1/2 oder 1. (a) x 2 = a hat genau dann eine Lösung in Q2 , wenn a = 1 + 23 b mit ϕ2 (b) ≤ 1 ist. (b) Zeige: Q2 hat genau sieben quadratische Erweiterungen Q2 (α). Dabei kann α so gewählt werden, dass α Nullstelle eines der folgenden Polynome ist: x 2 − 3, x 2 − 5, x 2 − 7, x 2 − 2, x 2 − 6, x 2 − 10, x 2 − 14. Sei f = x n + an−1 x n−1 + · · · + a0 ∈ Zp [x]. Ist ϕp (ai ) < 1 für alle i = 1, . . . , n − 1 und ϕp (a0 ) = 1/p , so ist f irreduzibel (vgl. Satz 1.48). Man untersuche die Zerlegung der Polynome in Q3 : (a) x 2 + 1, (b) x 2 + 2, (c) x 2 − 3. Sei f ∈ Zp [x] und α ∈ Zp mit ϕp (f (α)) < 1 und ϕp (f (α)) = 1. Dann ist die Folge α1 = α,
α2 = α1 −
f (α1 ) f (αn−1 ) , . . . , αn = αn−1 − f (α1 ) f (αn−1 )
konvergent. 31. Finde eine rationale Zahl b in Q5 , die eine Nullstelle a von f = x 3 − x 2 − 2x−8 bis auf approximiert, d. h. ϕ5 (b − a) ≤
1 . 53
1 53
216
Bewertungen und p -adische Zahlen
32. Seien K ein Körper mit Bewertung ϕ und Rϕ der zugehörige Bewertungsring mit maximalem Ideal m. Bezüglich Tw sei K lokal kompakt. Ist |Rϕ /m| = n, so hat die Gleichung x n = x genau n verschiedene Nullstellen in Rϕ . i 33. Sei K ein Körper mit Bewertung ϕ. Für jedes f ∈ K[x], f = n i=0 ai x , setzen wir ¯ ) = max{ϕ(ai ) | i = 1, . . . , n}. ϕ(f
Zeige dass mit der üblichen Fortsetzung auf K(x) (siehe Lemma 15.15) hierdurch eine Bewertung auf K(x) definiert wird.
16 Der größte gemeinsame Teiler Einer der ersten Algorithmen, den wir kennengelernt haben, war der euklidische Algorithmus zur Berechnung des ggT zweier Polynome f und g in Beispiel 1.26(3). Dieser hatte sich im weiteren Verlauf als besonders wichtig herausgestellt, weshalb wir ihn nun etwas genauer betrachten werden. Das folgende Beispiel stammt aus [10, Kapitel 4]. Wir wollen den größten gemeinsamen Teiler der folgenden Polynome bestimmen: f = 3x 6 + 5x 4 − 4x 2 − 9x + 21, g = x 8 + x 6 − 3x 4 − 3x 3 + x 2 + 2x − 5.
Der euklidische Algorithmus liefert 5 2 1 1 f + − x 4 + x2 − , 3 9 9 9 3 27 5 9 · 28 1 1 177 2 441 − x 4 + x2 − x − 9x + , + − f = − x2 − 5 25 3 25 25 9 9 g=
x2
−
=r1
125 55 51175 −177 2 441 x2 − x x + − 9x − r1 = 117 · 9 (117)2 3 · (13)3 25 25 =r2
233150 102500 , + x− 3 9 · (13) 2197 (13)4 · 92 4558866682219 233150 102500 1288744821 x− + . x− r2 = − 3 9326 25625 9 · (13) 2197 543589225
Damit haben wir ggT(f , g) = 1 gefunden. Offenbar sind diese Ausdrücke für die Berechnung mit einem Computer nicht sonderlich gut geeignet. Hierbei ist nicht das Hauptproblem, dass die auftretenden Koeffizienten nicht ganzzahlig sind. Es genügt, g mit einer geeigneten Potenz des führenden Koeffizienten von f zu multiplizieren. Dann erhalten wir als Reste − 15x 4 + 3x 2 − 9, 15795x 2 + 30375x − 59535, 1254542875143750x − 1654608338437500, 12593338795500743100931151992187500.
Das Problem liegt in der Größe der Koeffizienten, der während des euklidischen Algorithmus auftauchenden Polynome. Dies zeigt, dass, so praktisch der euklidische Algorithmus in der Form, wie wir ihn bewiesen haben, für theoretische Zwecke ist, so unpraktisch ist er für wirkliche Berechnungen. In diesem Kapitel wollen wir eine Verbesserung betrachten.
218
Der größte gemeinsame Teiler
i Definition 16.1. Seien h = n i=0 ai x ∈ Z[x] und p eine Primzahl. Wir bezeichnen ¯i die Restklasse von ai modulo p , i = 0, . . . , n, und setzen mit a hp =
n
¯i x i . a
i=0
Wir betrachten also das Polynom h modulo p , wie schon in Beispiel 1.49(3). Sei nun h = sr eine Zerlegung mit s, r ∈ Z[x]. Dann gilt natürlich auch hp = sp rp .
Für die Berechnung der ggT(f , g) in unserem obigen Beispiel wählen wir p = 5 und bestimmen f5 und g5 . Der größte gemeinsame Teiler von g5 und f5 wird mit dem euklidischen Algorithmus wie folgt berechnet: f5 = 3x 6 + x 2 + x + 1, g5 = x 8 + x 6 + 2x 4 + 2x 3 + x 2 + 2x, g5 = 2(x 2 + 1)f5 + 2x 2 + 3, f5 = (−x 4 − x 2 + 2)(2x 2 + 3) + x, 2x 2 + 3 = 2x · x + 3.
Also ist ggT(g5 , f5 ) = 1. Sei nun r = ggT(f , g). Dann teilt r sowohl f als auch g , also teilt rp sowohl fp als auch gp . Das liefert, dass r5 den ggT(f5 , g5 ) = 1 teilt, d. h. r5 = 1 ist. Da der höchste Koeffizient von r den höchsten Koeffizienten von g teilen muss, ist er gleich 1. Das liefert nun r = 1. Somit haben wir deutlich effizienter gezeigt, dass ggT(f , g) = 1 ist. Leider aber gilt im Allgemeinen nicht, dass rp = ggT(fp , gp ) ist, falls r durch r = ggT(f , g) definiert ist. Sind z. B. f = x − 3 und g = x + 2, so ist ggT(f , g) = 1. Aber f5 = g5 = x + 2,
d. h. ggT(f5 , g5 ) = x + 2 ≠ 1.
Das eben vorgestellte Verfahren der Reduktion nach Primzahlen hat offenbar den Vorteil, dass die auftauchenden Koeffizienten beschränkt sind. Allerdings kann man nicht jede Primzahl wählen. Wir können in unserem Beispiel nicht p = 2 oder 3 wählen. Es ist z. B. ggT(f2 , g2 ) = x + 1. Eine der Fragen, der wir nachgehen werden, ist, welche Primzahlen wir wählen können. Wir werden nun ein allgemeines Verfahren zur Berechnung des ggT entwickeln, das die obigen Bemerkungen über Reduktion nach Primzahlen zur Grundlage hat.
Der größte gemeinsame Teiler
219
Dazu müssen wir uns zunächst einmal das Wachstumsverhalten der Koeffizienten des ggT ansehen. Ist g=
d
aj x j ∈ C[x],
j=0
so setzen wir
d g = |aj |2 . j=0
Mit dieser Bezeichnung erhalten wir Lemma 16.2. Sind f =
d
j=0
aj x j ∈ C[x] und α ∈ C\{0}, so ist
¯ −1 )f . (x + α)f = |α|(x + α
Beweis. Wir setzen q = (x + α)f =
d+1
(aj−1 + αaj )x j
j=0
und ¯ −1 )f = r = (x + α
d+1
¯ −1 aj )x j (aj−1 + α
j=0
mit a−1 = am+1 = 0. Dann gilt: q2 =
d+1
|aj−1 + αaj |2 =
j=0
=
d+1
d+1
(aj−1 + αaj )(aj−1 + αaj )
j=0
¯ j−1 a ¯j−1 + αa ¯j + |α|2 |aj |2 ). (|aj−1 |2 + αaj a
j=0
Das gleiche Resultat erhalten wir für |α|2 r 2 . Lemma 16.3. Seien x1 , . . . , xn komplexe Zahlen und q ∈ N ∪ {0} mit 0 < |x1 | ≤ |x2 | ≤ · · · ≤ |xq | < 1 ≤ |xq+1 | ≤ · · · ≤ |xm |.
Wir setzen s(x) = (x − x1 ) · · · (x − xm )
und ¯1−1 ) · · · (x − x ¯q−1 )(x − xq+1 ) · · · (x − xm ). t(x) = (x − x
Dann ist s = |x1 · · · xq |t.
220
Der größte gemeinsame Teiler
Beweis. Wir beweisen die Behauptung durch Induktion nach q. Für q = 0 gilt sie ¯1−1 ). Dann gilt offensichtlich. Sei q > 0. Wir setzen s¯ = s/(x − x1 ) und t¯ = t/(x − x nach Lemma 16.2 ¯1−1 )¯ s = (x − x1 )¯ s = |x1 |(x − x s ¯1−1 )t¯ = |x1 ||x2 · · · xq |(x − x
(per Induktion)
= |x1 · · · xq |t.
Satz 16.4. Seien f = |zi | ≥ 1. Dann gilt
d
i=0 ai x
i
∈ C[x] und z1 , . . . , zk die Nullstellen von f mit
|ad |
k
|zi | ≤ f .
i=1
Beweis. Seien x1 , . . . , xd die Nullstellen von f (vielfache Nullstellen werden auch mehrfach aufgeschrieben), die wie folgt angeordnet seien: |x1 | ≤ · · · ≤ |xq | < 1 ≤ |xq+1 | ≤ · · · ≤ |xd |, q ≥ 0.
Also ist zi = xq+i , i = 1, . . . , k. Sei x1 = · · · = xn = 0 für ein n ≤ q. Dann ist a0 = 0. Wir ersetzen f durch f x −n . Es ist f = f x −n . Also können wir x1 ≠ 0 annehmen. Wir setzen nun g = ad
q
¯i−1 ) (x − x
i=1
d
(x − xi ) = ad x d + · · · + b0 .
i=q+1
Nach Lemma 16.3 ist f = |x1 , . . . , xq |g.
Damit erhalten wir f 2 ≥ |x1 · · · xq |2 (|ad |2 + |b0 |2 )
und weiter |b0 |2 = |ad |2 |x1 · · · xq |−2 |xq+1 · · · xd |2 ,
was mit f 2 ≥ |ad |2 |x1 · · · xq |2 + |ad |2 |xq+1 · · · xd |2 ≥ |ad |2
k i=1
die Behauptung liefert.
|zi |
Der größte gemeinsame Teiler
221
m i i Satz 16.5 (Landau-Mignotte-Ungleichung). Seien f = n i=0 bi x und g = i=0 ai x mit ai , bi ∈ Z und am ≠ 0 ≠ bn Polynome. Ist f ein Teiler von g , so gilt: n m ! !−1 n ! am ! ! |bi | ≤ 2 ! a2i . b n i=0 i=0
Beweis. Sind z1 , . . . , zk die Nullstellen von f mit |zi | ≥ 1, so ist n |bi | ≤ |z1 · · · zk ||bn |. i Indem wir
n n i=0
i
= 2n ausnutzen, erhalten wir
n n |bi | ≤ |z1 · · · zk ||bn | = 2n |z1 · · · zk ||bn |. i i=0 i=0 n
Somit gilt n
|bi | ≤ 2n |z1 · · · zk ||bn |
i=0
! a !−1 ! m! ! g. 2n ! Satz 16.4 bn ≤
Korollar 16.6. Jeder Koeffizient des größten gemeinsamen Teilers von f =
n
ai x i und g =
i=0
m
bi x i mit ai , bi ∈ Z und an ≠ 0 ≠ bm
i=0
ist beschränkt durch n m 2 1 1 min(m,n) 2 2 ggT(an , bm ) min a , b . |an | i=0 i |bm | i=0 i
Beweis. Es ist grad(ggT(f , g)) ≤ min{grad f , grad g}. Weiter teilt der führende Koeffizient von ggT(f , g) den größten gemeinsamen Teiler der führenden Koeffizienten von f und g . Nun folgt die Behauptung mit Satz 16.5. Korollar 16.7. Jeder Koeffizient des größten gemeinsamen Teilers von f =
n
ai x i und g =
i=0
m
bi x i mit ai , bi ∈ Z und a0 ≠ 0 ≠ b0
i=0
ist beschränkt durch n m 2 1 1 2 min(m,n) 2 ggT(a0 , b0 ) min a , b . |a0 | i=0 i |b0 | i=0 i
222
Der größte gemeinsame Teiler
Beweis. Sei h =
d
i=0 ci x
i
ein Teiler von f . Wir substituieren x durch x −1 . Dann ist
ˆ := x d h(x −1 ) = x d h
d i=0
ein Teiler von fˆ =
n
i=0 an−i x
i
ci x −i =
d
ci x d−i =
i=0
d
cd−i x i
i=0
ˆ an. . Nun wenden wir Korollar 16.6 auf fˆ und g
Es scheint seltsam zu sein, dass ggT(f , g) Koeffizienten haben kann, die größer als die Koeffizienten von f und g sind. Wie das folgende Beispiel zeigt, kommt dies aber durchaus vor. Seien f = x 3 + x 2 − x − 1 = (x + 1)2 (x − 1)
und g = x 4 + x 3 + x + 1 = (x + 1)2 (x 2 − x + 1).
Dann ist ggT(f , g) = x 2 + 2x + 1! Mit Korollar 16.6 und Korollar 16.7 haben wir eine Abschätzung für die Koeffizienten. Wie wir gesehen haben, muss allerdings ggT(fp , gp ) nicht gleich ggT(f , g)p sein. Lemma 16.8. Seien f , g ∈ Z[x] und p eine Primzahl, die nicht den führenden Koeffizienten von ggT(f , g) teilt. Dann ist grad ggT(fp , gp ) ≥ grad ggT(f , g).
Beweis. Da f von ggT(f , g) geteilt wird, wird auch fp von ggT(f , g)p geteilt. Also wird ggT(fp , gp ) von ggT(f , g)p geteilt. Das liefert grad ggT(fp , gp ) ≥ grad ggT(f , g)p .
Aber es ist grad ggT(f , g)p = grad ggT(f , g), da p nicht den führenden Koeffizienten von ggT(f , g) teilt. Lemma 16.8 setzt bei seiner Anwendung voraus, dass wir den ggT bzw. dessen führenden Koeffizienten kennen, bevor wir in der Lage sind zu prüfen, ob die Grade gleich sind. Da dieser Koeffizient aber die führenden Koeffizienten der beiden Polynome f und g teilt, erhalten wir eine einfachere Formulierung: Korollar 16.9. Seien f , g ∈ Z[x] und p eine Primzahl, die nicht den größten gemeinsamen Teiler der führenden Koeffizienten von f und g teilt. Dann ist grad ggT(fp , gp ) ≥ grad ggT(f , g).
Der größte gemeinsame Teiler
223
Betrachten wir noch einmal unser erstes Beispiel: f = x 8 + x 6 − 3x 4 − 3x 3 + x 2 + 2x − 5, g = 3x 6 + 5x 4 − 4x 2 − 9x + 21.
Es teilt zwar p = 2 nicht den führenden Koeffizienten. Dennoch hatten wir für f2 = x 8 + x 6 + x 4 + x 3 + x 2 + 1, g2 = x 6 + x 4 + x + 1, ggT(f2 , g2 ) = x + 1 gezeigt. Also kann es durchaus vorkommen, dass der Grad von ggT(fp , gp ) größer als der von ggT(f , g) ist. Wir wollen nun zeigen, dass es höchstens endlich viele Primzahlen gibt, die diese Eigenschaft haben. Dazu benötigen wir ein weiteres Hilfsmittel, die sogenannte Resultante. m i i Definition 16.10. Seien K ein Körper und f = n i=0 ai x und g = i=0 bi x Polynome in K[x]. Die Sylvester-Matrix zu f und g ist die folgende Matrix: ⎧⎛ ⎞ ⎪ . . . . . . a1 a0 0 ... 0 ⎪ ⎨ an an−1 ⎜ ⎟ .. ⎟ m ⎜ ⎪⎜ 0 ⎟ . a 0 . . . 0 a n 0 ⎪ ⎩⎜ ⎟ ⎜ 0 ⎟ . . . a a . . . a . . . a n m m−1 0 ⎟ ⎧⎜ ⎜ ⎟ ⎪ ⎟ ⎪ ⎨⎜ ⎜ bm bm−1 . . . b0 ⎟ ⎜ ⎟ bm ... n ⎜ 0 ⎟ ⎪ ⎠ ⎪ ⎩⎝ . . . b2 b1 b0 bm . . .
(m Zeilen mit den ai ’s, n Zeilen mit den bj ’s.) Beispiel 16.11. Sei f = x 3 + x 2 + x + 1 und g = 2x 2 + 1. Die Sylvester-Matrix ist ⎛
1 ⎜ ⎜0 ⎜ ⎜2 ⎜ ⎜ ⎝0 0
1 1 0 2 0
1 1 1 0 2
1 1 0 1 0
⎞ 0 ⎟ 1⎟ ⎟ 0⎟ ⎟. ⎟ 0⎠ 1
Definition 16.12. Seien f , g ∈ K[x]. Wir bezeichnen mit res(f , g) die Determinante der Sylvester-Matrix und nennen res(f , g) die Resultante von f und g . Es ist klar, dass res(f , g) bis auf ein Vorzeichen gleich res(g, f ) ist. Obwohl die Resultante als Determinante definiert ist, berechnet man sie so nicht. Die spezielle Struktur der Matrix erlaubt es, den euklidischen Algorithmus als Gauß-Elimination zu verwenden.
224
Der größte gemeinsame Teiler
Da res(f , g) bis auf das Vorzeichen gleich res(g, f ) ist, können wir die Rollen von f und g vertauschen und grad f ≤ grad g annehmen. Ist grad f = 0, so ist res(f , g) = am n . Sei nun grad f ≠ 0. Wir dividieren dann g durch f mit Rest. Also ist r g = t · f + h mit h = i=0 ci x i . Hierbei ist grad h < grad f oder h = 0. Wir setzen ci = 0 für alle i mit r < i ≤ m. Nun sind die Polynome xig − xih
(0 ≤ i < n)
Linearkombinationen der Polynome xj f
(0 ≤ j < m).
Also ändern wir die Determinante nicht, wenn wir für 0 ≤ i < m die bi durch die ci ersetzen. Diese neue Matrix hat die Form A ∗ . 0 B Dabei ist A eine Dreiecksmatrix mit Determinante am−r und B die Sylvestermatrix n von f und h. Die Fortsetzung dieses Algorithmus liefert dann die Resultante. Offenbar gilt: Satz 16.13. Für f , g ∈ C[x] gilt res(f , g) = 0 genau dann, wenn 1 ≠ ggT(f , g) ist. Diese Beziehung zwischen Resultante und ggT wollen wir uns zunutze machen. m i i Satz 16.14. Seien f = n i=0 ai x und g = i=0 bi x ∈ C[x] mit an ≠ 0 ≠ bm und weiter αi , i = 1, . . . , n, die Nullstellen von f bzw. βi , i = 1, . . . , m, die Nullstellen von g . Dann gilt: n (1) res(f , g) = am n i=1 g(αi ), mn n (2) res(f , g) = (−1) bm m i=1 f (βi ), n m n (3) res(f , g) = am n bm i=1 j=1 (αi − βj ).
Beweis. Wir werden (1)–(3) simultan durch Induktion nach min(n, m) beweisen. Da res(f , g) = (−1)nm res(g, f ) ist, können wir n ≤ m annehmen. Ist n = 0, so ist res(f , g) = am n und wir haben (1)–(3). Wir dividieren g durch f mit Rest, also g = t · f + h. Ist h = 0, so ist auch die Resultante gleich Null, d. h. es gilt (1)–(3), da f und g gemeinsame Nullstellen m−p res(f , h). Weiter ist g(αi ) = h(αi ) haben. Ist h ≠ 0, so ist res(f , g) = an für jede Nullstelle αi von f . Nun folgt (1) durch Induktion. Es folgt (3) aus (1), da m n g(αi ) = bm j=1 (αi − βj ) ist. Da an i=1 (αi − βj ) = (−1)n f (βj ) ist, folgt (2) aus (3).
Der größte gemeinsame Teiler
225
Satz 16.15. Seien f , g ∈ Z[x] und c = ggT(f , g). Sei p eine Primzahl, die den größten gemeinsamen Teiler der führenden Koeffizienten von f und g nicht teilt. Ist p kein Teiler von res(f /c, g/c), so ist ggT(fp , gp ) = cp . Beweis. Es sind f /c und g/c relativ prim. Da p den führenden Koeffizienten von c nicht teilt, ist cp ≠ 0. Also ist ggT(fp , gp ) = cp ggT(fp /cp , gp /cp ).
Nehmen wir an, es wäre ggT(fp /cp , gp /cp ) ≠ 1. Mit Satz 16.13 erhalten wir dann res(fp /cp , gp /cp ) = 0. Sei M die Sylvestermatrix. Dann haben wir offenbar det(Mp ) = det(M)p . Also ist auch res(f /c, g/c)p = 0. Aber nach Annahme ist p kein Teiler von res(f /c, g/c). Beispiel 16.16. Wir wollen ggT(f , g) für f = 3x 6 + 5x 4 − 4x 2 − 9x + 21, g = x 8 + x 6 − 3x 4 − 3x 3 + x 2 + 2x − 5
mit der eben beschriebenen Methode berechnen. Nach Korollar 16.7 können wir p > 192 wählen. Wir wählen p = 197. Der euklidische Algorithmus angewandt auf fp und gp liefert gp = (66x 2 − 44)fp + 87x 4 + 15x 2 + 133, fp = (34x 2 + 121) (87x 4 + 15x 2 + 133) +(−372 − 9x − 115), =r1
r1 = (−13x 2 + 99x + 165) (−37x 2 − 9x + 115) +65x − 1, =r2
r2 = (−43x + 78)(65x − 1) − 37.
Also ist ggT(fp , gp ) = 1. Damit ist auch ggT(f , g) = 1. Allerdings hat dieser Algorithmus immer noch den Nachteil, dass wir mit relativ großen Zahlen rechnen müssen. Wir wissen z. B. dass in Beispiel 16.16 auch p = 5 ausreicht! Man kann den Algorithmus jedoch noch verbessern. Es sei M wie eben die durch Korollar 16.7 gegebene Schranke. Sei a der größte gemeinsame Teiler der führenden Koeffizienten von f und g und p1 eine Primzahl mit p1 > a. Wir berechnen wie eben c1 = ggT(fp1 , gp1 ). Ist grad c1 = 0, so ist ggT(f , g) = 1. Sei also grad(c1 ) > 0. Wir setzen r1 = p1
und wählen eine neue Primzahl p2 > a und berechnen c2 = ggT(fp2 , gp2 ). Ist jetzt grad c2 < grad c1 , so ersetzen wir c1 durch c2 , suchen eine neue Primzahl
226
Der größte gemeinsame Teiler
p3 > a und wenden hiermit wieder das Verfahren an. Dies endet, wenn für ein i dann grad ci = grad ci+1 ist. Zur Vereinfachung nehmen wir i = 1 an. Wir wenden nun den Chinesischen Restsatz (Satz 14.1) auf das Paar c1 , c2 an (siehe unten). Das liefert ein Polynom cp1 p2 . Wir setzen r2 = r1 p2
und c1 = cr2 . Dieses Verfahren führen wir fort, bis wir bei einem ri mit ri > 2M enden. Sei c das zugehörige Polynom. Ist c ein Teiler von f und g , so sind wir fertig. Sonst fangen wir von vorne an. In einem euklidischen Ring ist übrigens der Beweis des Chinesischen Restsatzes konstruktiv. Es ist c1 ≡ c
(mod p1 ),
c2 ≡ c
(mod p2 ).
˜ 2 . Wir Mit dem euklidischen Algorithmus in Z finden wir c˜, d˜ mit 1 = c˜p1 + dp setzen ˜ 2 + c2 c˜p1 . cp1 p2 = c1 dp
Übungen 1. 2.
Beweise Satz 16.13. i Seien f = n K der Zerfällungsi=0 ai x ∈ K[x] ein normiertes Polynom vom Grad n, F ⊇ i−1 (siehe körper von f und α1 , . . . , αn die Nullstellen von f in F . Wir setzen f = n i=1 iai x Definition 8.3) und definieren die Diskriminante von f als D = Df = (αi − αj )2 . 1≤i<j≤n
Zeige: Df = (−1)n(n−1)/2 res(f , f ),
3.
wobei f als Polynom vom Grad n − 1 betrachtet wird. Berechne res(f , g) für (a) f = x 3 + x + 1, g = 2x 5 + x 2 + 2, f , g ∈ Q[x]. (b) f = x 4 + x 3 + 1, g = x 4 + x 2 + x + 1, f , g ∈ Q[x]. (c) Führe die gleichen Berechnungen wie in Aufgabe (a) für f , g ∈ GF(2)[x] durch. (d) Führe die gleichen Berechnungen wie in Aufgabe (b) für f , g ∈ GF(3)[x] durch. (e) Haben f , g in Aufgabe (a) gemeinsame Nullstellen (i) über Q? (ii) über K = GF(2)? (f) Haben f , g in Aufgabe (b) gemeinsame Nullstellen (i) über Q? (ii) über K = GF(3)?
Der größte gemeinsame Teiler
4.
Bestimme den ggT(f , g) für f = x 8 + 2x 5 + x 3 + x 2 + 1
und g = 2x 6 + x 5 + 2x 3 + 2x 2 + 2.
5.
als Polynome in Z[x]. Zeige: Ist (aij ) eine n × n-Matrix mit reellen Einträgen, dann ist |det(aij )|2 ≤
n n
|aij |2 .
i=1 j=1
6.
Sei p eine Primzahl. Zeige: res(f , g)p = res(fp , gp )
7.
für f , g ∈ Z[x],
falls p nicht die führenden Koeffizienten von f und g teilt. Benutze Aufgabe 5 und Aufgabe 6 zur Berechnung von res(f , g) für die Polynome f = 3x 6 + 5x 4 − 4x 2 − 9x + 21 und g = x 8 + x 6 − 3x 4 − 3x 3 + x 2 + 2x − 5.
227
17 Faktorisierung von Polynomen Eine der fundamentalen Fragestellungen, von der wir stets angenommen haben, dass wir sie lösen können, war, für ein Polynom f ∈ Z[x] zu entscheiden, ob es Polynome g und h in Z[x] mit 0 < grad g < grad f > grad h > 0 gibt, so dass f = gh ist. Dieses Problem wollen wir jetzt konkret angehen. Für das Folgende wollen wir stets voraussetzen, dass f quadratfrei ist. Dies können wir leicht bewerkstelligen. Sei z. B. f = g 2 h.
Dann ist f = 2gg h + gh .
Also teilt g den ggT(f , f ), den wir mit den Methoden aus Kapitel 16 berechnen können. Wir wollen nun ähnlich wie in Kapitel 16 vorgehen. Ist f = gh und p eine Primzahl, so ist auch fp = gp hp . Modulo p ist aber die Faktorisierung von Polynomen ein endliches Problem. Dazu werden wir einen Algorithmus angeben, der die Faktorisierung modulo p liefert. Wir betrachten eine Faktorisierung f = f1 · · · fr in irreduzible Teile (r ist uns noch nicht bekannt). Da f quadratfrei ist, sind die fi paarweise prim. Seien s1 , . . . , sr ∈ Z/pZ beliebig vorgegeben. Nach dem Chinesischen Restsatz Satz 14.1 gibt es ein Polynom v ∈ Z/pZ[x] mit v ≡ si
(mod fi ),
i = 1, . . . , r .
(1)
Weiter können wir grad v < grad f1 + · · · + grad fr = grad f annehmen. Wir werden sehen, dass man solche Lösungen v rückwärts dazu benutzen kann, um die fi zu bestimmen. Wir wollen die si als paarweise verschieden wählen. Dann ist ggT(f , v − si ) durch fi , aber nicht durch fj für alle j ≠ i teilbar. Insofern können wir die Faktoren bestimmen. Nur wie finden wir v , wenn wir die fi nicht kennen? Es gilt p
v p ≡ sj ≡ sj ≡ v
(mod fj ),
da der Körper Z/pZ die Charakteristik p hat. Nach Satz 14.1 gilt nun auch vp ≡ v
(mod f ).
(2)
Es ist v p − v ≡ (v − 0)(v − 1) · · · (v − (p − 1))
(mod p).
Ist also f ein Teiler von v p − v , so teilt fi einen der Faktoren v − j für 0 ≤ j ≤ p − 1. Somit gilt, dass v die Kongruenz (2) genau dann erfüllt, falls es auch eine Kongruenz vom Typ (1) erfüllt. Dies können wir als Satz formulieren.
Faktorisierung von Polynomen
229
Satz 17.1. Sei f ∈ Z/pZ[x] und sei f = f1 · · · fr eine Zerlegung in irreduzible Faktoren. Die Polynome ν ∈ Z/pZ[x], die Lösungen von (1) sind, sind genau die Lösungen von (2). Der Vorteil der Kongruenz (2) ist, dass die fi nicht mehr vorkommen. Die Idee bei der Lösung von (2) ist, dass wir es im Prinzip mit linearen Gleichungen für die Koeffizienten von v zu tun haben. Definition 17.2. Seien K ein endlicher Körper der Charakteristik p und f ∈ K[x] mit n = grad f . Wir setzen ⎛ ⎞ ... qn−1,0 q0,0 ⎜ ⎟ ⎜ . ⎟ .. .. ⎟, Q = ⎜ .. . . ⎝ ⎠ q0,n−1 . . . qn−1,n−1 wobei x kp ≡ qk,n−1 x n−1 + · · · + qk,1 x + qk,0
(mod f )
gilt. Die Matrix Q nennen wir die Berlekamp-Matrix zu f . Wenn wir ein Polynom vom Grad höchstens n − 1 als Vektor seiner Koeffizienten auffassen, so ist die Anwendung der linearen Abbildung Q gerade das Potenzieren mit p . Die Lösungen von (2) sind nun die Eigenvektoren von Q zum Eigenwert 1. Damit ist unser Faktorisierungsproblem auf ein Eigenvektorproblem der Linearen Algebra zurückgeführt. Eine Basis des Lösungsraums von (1) ist sicherlich v≡1
(mod fi ),
v≡0
(mod fj ),
j ≠ i, für jedes i = 1, . . . , r .
Also ist die Dimension des Eigenraumes zum Eigenwert 1 genau die Anzahl der irreduziblen Faktoren von f . Das liefert den folgenden Algorithmus, der auf Berlekamp [6] zurückgeht: (1) Wir testen, ob f quadratfrei ist. Andernfalls berechnen wir ggT(f , f ) mit einem Verfahren aus Kapitel 16. Es ist f = ggT(f , f )h. Nun wenden wir den Algorithmus auf die beiden Teiler h und ggT(f , f ) an. (2) Wir bestimmen Q. (3) Wir bestimmen eine Basis von Eigenvektoren zum Eigenwert 1. Ein Eigenvektor ist (1, 0, . . . , 0), da ganze Zahlen stets Lösungen sind. Die Anzahl der Basiselemente ist die Anzahl der irreduziblen Faktoren. (4) Wir berechnen ggT(f , v − s) für jedes s ∈ Z/pZ, wobei v ein Polynom ist, das zu einem nichttrivialen Eigenvektor gehört. Dies sollte eine Zerlegung von f liefern. Falls wir nicht genügend viele Faktoren finden, so können wir andere Eigenvektoren wählen.
230
Faktorisierung von Polynomen
Nun können wir also modulo p faktorisieren. Aber wie bekommen wir eine Faktorisierung in Z[x]? Ist fp irreduzibel, so auch f . Die Umkehrung ist aber falsch. Es ist x 2 + 1 irreduzibel, aber zerfällt für alle Primzahlen der Form 4k + 1 (da dann −1 ein Quadrat ist). Allerdings ist es stets irreduzibel für Primzahlen der Form 4k + 3. D. h. mit p = 3 können wir die Irreduzibilität beweisen. Es gibt hier also unendlich viele gute und unendlich viele schlechte Primzahlen. Es gibt sogar Polynome, die immer zerfallen, wie f = Φ12 = x 4 − x 2 + 1
(siehe Beispiel 12.9).
Nach Satz 12.10 ist fp niemals irreduzibel, falls p ≠ 2, 3 ist. Für p = 2 und p = 3 erhalten wir f2 = (x 2 + x + 1)2 und f3 = (x 2 + 1)2 . Diesem Problem des Zurückkommens nach Z[x] können wir wieder mit Satz 16.5 begegnen. Wir bestimmen N (Primzahl) so, dass alle Koeffizienten der fi zwischen −N/2 und N/2 liegen müssen, wobei N noch teilerfremd zu dem führenden Koeffizienten von f sei. Dann wenden wir den folgenden Algorithmus an, der auf Zassenhaus [61] zurückgeht. (1) Wir faktorisieren f modulo N . Das liefert f = f1 · · · fk (mod N). (2) Wir testen, ob die fi , als Polynome in Z[x] betrachtet, Teiler von f sind. Jedes solche fi ist dann ein irreduzibler Teiler von f . (3) Gibt es ein fi , das f nicht teilt, so gibt es einen irreduziblen Faktor von f in Z[x], der modulo N in mehrere Faktoren zerfällt. Wir bilden nun fi fj (mod N) für alle j und testen, ob diese Produkte f teilen. Jede solche Kombination ist wieder ein irreduzibler Teiler. (4) Wir wiederholen (3) mit Produkten der Länge 3, 4, usw., bis alle irreduziblen Faktoren gefunden sind. Beispiel 17.3. Sei f = x 4 −x 2 +1. Wir wählen gemäß Korollar 16.7 N = 37. Modulo 37 gilt f37 = (x 2 + 10)(x 2 − 11)
Es teilt aber weder x 2 + 10 noch x 2 − 11 das Polynom f in Z. Also ist f irreduzibel. Das Problem bei dem eben beschriebenen Algorithmus ist, dass er exponentiell ist. Hat ein Polynom r irreduzible Faktoren modulo N , so müssen im schlimmsten Fall 2r −1 Polynome auf Teilbarkeit getestet werden. Dennoch ist in der Praxis der aufwendigste Teil die Faktorisierung modulo N . Die Primzahl N , die durch Korollar 16.7 gegeben wird, wird sehr groß sein, was den Aufwand steigert. Man würde sich kleine Zahlen N wünschen. Dies könnte man wie in Kapitel 16 mit modularen Methoden angehen. Sei f = g1 h1 (mod p1 ) und f = g2 h2 (mod p2 ). Mit dem Chinesischen Restsatz können wir aus g1 und g2 ein Polynom modulo p1 p2 und aus h1 und h2 ein Polynom modulo p1 p2 konstruieren. Allerdings
Faktorisierung von Polynomen
231
können wir das gleiche auch mit den Paaren g1 , h2 und h1 , g2 machen. Diese Unklarheit, welche Faktoren zu wählen sind, ist ein Problem bei dieser Art von Algorithmus. Es spiegelt die Tatsache wider, dass Z/p1 p2 Z[x] kein ZPE-Ring ist! Wir wollen deshalb einen anderen Weg beschreiben. Wir wollen annehmen, dass wir eine Faktorisierung modulo p bereits berechnet haben. Daraus berechnen wir eine modulo p 2 und dann eine modulo p3 usw. Sei f ein Polynom mit führendem Koeffizienten 1. Modulo p sei f1 = g1 h1 ,
ggT(g1 , h1 ) = 1
Wir wollen eine Zerlegung modulo p2 konstruieren. Also f2 = g2 h2 .
Dabei gilt dann ˆ2 , g2 = g1 + p g
ˆ2 h2 = h1 + p h
und f2 = f1 + p fˆ2 .
Das liefert ˆ2) ˆ2 )(h1 + p h f2 ≡ (g1 + p g
(mod p2 ).
Also haben wir ˆ 2 + pg ˆ2 h1 f1 + p fˆ2 ≡ g1 h1 + pg1 h
(mod p 2 ).
Damit erhalten wir f1 − g1 h1 ˆ 2 g1 ˆ2 h1 + h + fˆ2 ≡ g p
(mod p).
Die linke Seite dieser Kongruenz ist bekannt. Also können wir mit dem euklidischen ˆ 2 berechnen, da ggT(h1 , g1 ) = 1 ist. ˆ2 , h Algorithmus g ˆ 2 < grad h1 annehmen. Damit ˆ2 < grad g1 und grad h Hierbei können wir grad g haben wir g2 , h2 bestimmt. Im allgemeinen Fall sei bereits f k ≡ gk h k
(mod pk )
bekannt. Dann setzen wir ˆk+1 , gk+1 = gk + p k g
ˆ k+1 hk+1 = hk + p k h
und fk+1 = fk + p k fˆk+1 .
Es gilt fk − gk hk ˆ k+1 ˆk+1 hk + gk h + fˆk+1 ≡ g pk
(mod p).
Nun ist hk ≡ h1 (mod p) und gk ≡ g1 (mod p). Also ist fk − gk hk ˆ k+1 g1 ˆk+1 h1 + h + fˆk+1 ≡ g pk
(mod p).
ˆ k+1 berechenbar. Da der euklidische Algorithmus stets ˆk+1 und h Daraus sind wieder g nur auf g1 , h1 angewandt wird, wird er nur eimnal benutzt!
232
Faktorisierung von Polynomen
Der hier angegebene Algorithmus, der eine Zerlegung von f modulo pk liefert, entspricht genau dem Beweis des Henselschen Lemmas in Lemma 15.30. Dieses Lemma liefert auch, dass gk , hk gegen eine Zerlegung von f konvergiert. Wir wollen den eben beschriebenen Algorithmus den Hensel-Algorithmus nennen. Dies führt zu folgendem Verfahren. Sei f gegeben, quadratfrei, mit führendem Koeffizienten 1. (1) Wir wählen eine Primzahl p. Sei fp = g1 · · · gn (mod p) mit dem BerlekampAlgorithmus berechnet. Sei weiter N = 2 × Schranke aus Satz 16.5. (2) Mit dem Hensel-Algorithmus bestimmen wir eine Faktorisierung modulo p k mit p k > N . Ist g ein solcher Faktor, so testen wir, ob f von g geteilt wird. Nun testen wir wieder alle Produkte, falls f nicht von g geteilt wird. Man kann Schritt 1 verbessern, indem man den Berlekamp-Algorithmus mit verschiedenen Primzahlen laufen lässt und nur die Zerlegungen in (2) benutzt, für die die Anzahl der irreduziblen Faktoren möglichst klein ist. Aber auch verschiedene Grade der einzelnen Faktoren können zu Ziel führen, wie nachfolgendes Beispiel zeigt. Gilt z. B.: modulo p1 : es ist f = g1 h1 , mit grad g1 = grad h1 = 2, modulo p2 : es ist f = g2 h2 , mit grad g2 = 3, grad h2 = 1 mit irreduziblen g1 , g2 , h1 , h2 , so ist f irreduzibel. Das letzte Problem, das wir zu lösen haben, ist, dass der führende Koeffizient von f i. a. nicht gleich 1 sein wird. Sei also f =
n
ai x i
mit an ≠ 0.
i=0
Dann multiplizieren wir f mit an−1 und ersetzen x durch x/an . Das liefert ein Pon lynom fˆ mit führendem Koeffizienten 1. Hierauf können wir unseren Algorithmus anwenden. Allerdings werden dadurch alle Koeffizienten deutlich größer, was die Schranke N vergrößert. Wir wollen unser Verfahren an einem Beispiel illustrieren. Beispiel 17.4. Sei f = x 5 + 3x 4 + 4x 3 + 4x 2 + 2x + 1. Nach Korollar 16.7 benötigen wir für den Zassenhaus-Algorithmus p = 227. Es ist dann z. B. x 227 durch f mit Rest zu teilen, um die Matrix Q zu bestimmen. Dies scheint sehr aufwendig zu sein. Wir wollen unseren gerade angegebenen Algorithmus anwenden. Wir wählen p = 2. Dann ist f1 = x 5 + x 4 + 1.
Faktorisierung von Polynomen
233
Wir bestimmen die Matrix Q. Es ist x0 = x0 + 0 · f , x2 = x2 + 0 · f , x4 = x4 + 0 · f , x 6 = x 4 + x + 1 + (x + 1)(x 5 + x 4 + 1), x 8 = x 4 + x 3 + x 2 + x + 1 + (x 3 + x 2 + x + 1)(x 5 + x 4 + 1).
Also ist ⎛ 1 ⎜ ⎜0 ⎜ Q=⎜ ⎜0 ⎜ ⎝0 0
0 0 1 0 0
0 0 0 0 1
1 1 0 0 1
⎞ 1 ⎟ 1⎟ ⎟ 1⎟ ⎟. ⎟ 1⎠ 1
Der Eigenraum zum Eigenwert 1 ist {(a,0, b, b, b) | a, b ∈ K}.
Damit haben wir die Basis 1
und x 4 + x 3 + x 2 = v.
Insbesondere hat f modulo 2 genau zwei Faktoren. Es ist ggT(f , v) = ggT(f , x 2 + x + 1) = x 2 + x + 1, ggT(f , v + 1) = ggT(f , x 4 + x 3 + x 2 + 1) = x 3 + x + 1.
Also ist f1 ≡ (x 2 + x + 1)(x 3 + x + 1)
(mod 2).
mit g1 = x 2 + x + 1 und h1 = x 3 + x + 1.
In der Tat ist x 2 + x + 1 ein Teiler von f . Aber x 3 + x + 1 ist kein Teiler von f . Nun ist f2 = x 5 + x 4 + 1 + 2(x 4 + 2x 3 + 2x 2 + x).
Es ergibt sich mit f = f2 = f1 + 2fˆ2
dann fˆ2 = x 4 + 2x 3 + 2x 2 + x.
234
Faktorisierung von Polynomen
Also ist fˆ2 = x 4 + 2x 3 + 2x 2 + x ≡ x 4 + x
(mod 2)
und f1 − g1 h1 = −(2x 3 + 2x 2 + 2x),
d. h. f1 − g1 h1 = −(x 3 + x 2 + x). 2
Damit ist f1 − g1 h1 + fˆ2 ≡ x 4 + x 3 + x 2 ≡ x 2 (x 2 + x + 1) 2 ≡ 0 · (x 3 + x + 1) + x 2 (x 2 + x + 1)
(mod 2).
ˆ 2 = x 2 . Dann erhalten wir ˆ2 = 0 und h Das liefert g g2 = g1 und h2 = h1 + 2x 2 = x 3 + 2x 2 + x + 1.
Es wird sich an h2 bis zu 28 > N nichts mehr ändern, da f = (x 2 + x + 1)(x 3 + 2x 2 + x + 1)
gilt. Bemerkungen. Das eigentliche Problem bei dem eben vorgestellten Algorithmus liegt im letzten Schritt, in dem Produkte darauf getestet werden, ob sie das Polynom f teilen oder nicht. Dies ist, wenn naiv angegangen, sicherlich sehr zeitaufwendig. Gesucht werden stets Algorithmen, die polynomiell sind, d. h. der Zeitaufwand lässt sich als ein Polynom in den Eingabedaten beschreiben (bei den hier untersuchten Problemen ist dies häufig der Grad des Eingangspolynoms). Es gibt nun Polynome f vom Grad m, die mindestens m/2 viele Faktoren modulo p k für jede Primzahl p und alle k ∈ N haben. Das Durchprobieren dieser Teiler wäre also sicherlich exponentiell im Grad m. Hier gibt es den sogenannten LLL-Algorithmus [30], der zunächst nicht viel mit dem Problem zu tun hat. Dieser Algorithmus konstruiert in einem ganzzahligen Gitter eine Basis, deren Vektoren eine möglichst kleine Länge haben. Der Zusammenhang mit unserem Problem ist nun wie folgt: Wir nehmen an, dass wir im zweiten Schritt des Algorithmus mit einem pk angekommen sind und einen Teiler g modulo p k gefunden haben. Gesucht ist ein Teiler h vom Grad höchstens r von f , so dass h von g modulo pk geteilt wird. Wir betrachten nun die Menge L = {u ∈ Z[x] | grad u ≤ r , g | u
(mod p k )}.
Sei ϕ die Abbildung, die jedem u ∈ L seinen Koeffizientenvektor zuordnet. Dann ist ϕ(L) ein ganzzahliges Gitter. Hierauf wird der LLL-Algorithmus angewandt. Dieser
Faktorisierung von Polynomen
235
liefert zum einen ein Kriterium für die Existenz von h, zum anderen ist der Teiler ein ggT von Urbildern gewisser Basisvektoren, die durch den LLL-Algorithmus konstruiert wurden. Der wesentliche Punkt ist, dass dieser Algorithmus polynomiell (in etwa Grad 6 im Grad von f ) ist. Damit haben wir einen polynomiellen Algorithmus zur Polynomfaktorisierung. Mehr Informationen über den LLL-Algorithmus und verwandte Fragen kann man in [42] finden. Wir wollen nun noch eine weitere Methode zur Polynomfaktorisierung betrachten, die auf H. Niederreiter und R. Göttfert [16], [39] und [40] zurückgeht. Die wesentliche Idee hierbei ist, dem Polynom f eine Differentialgleichung zuzuordnen. Diese muss dann gelöst werden. Unter günstigen Bedingungen führt dies wieder auf das Problem, ein System von homogenen linearen Gleichungen zu lösen. Satz 17.5. Seien K ein Körper mit char K = 2 und f ∈ K[x] ein normiertes Polynom (nicht konstant). Die Polynome h ∈ K[x], die die Differentialgleichung (f h) = h2
( ∗)
lösen, werden durch h=
f b b
gegeben, wobei b über alle quadratfreien normierten Teiler von f läuft. Ist f separabel, so liefern verschiedene b auch verschiedene Lösungen h, und (∗) hat genau 2m Lösungen, wobei m die Anzahl der irreduziblen Faktoren von f ist. Beweis. Die triviale Lösung h = 0 erhalten wir mit b = 1. Ist nun h ≠ 0 eine Lösung von (∗), so setzen wir a = ggT(f , h). Dann ist f = ab und h = ac mit ggT(c, b) = 1. Aus (∗) folgt (f /h) = 1. Also ist (b/c) = 1, was b c + bc = c 2
(1)
liefert. Somit ist c | bc . Da ggT(b, c) = 1 ist, folgt c | c . Da aber grad c < grad c ist, folgt dann c = 0. Nun ist c = b nach (1), also ist h = ac = (f /b)b . Ist umgekehrt h = (f /b)b , so gilt (f h) =
f 2 b
bb
=
f 2 b
(b )2 = h2 ,
wobei wir g = 0 für g ∈ K[x] und char K = 2 benutzt haben. Also ist h eine Lösung von (∗).
236
Faktorisierung von Polynomen
e
e
Sei f = g11 · · · gmm die Faktorisierung von f , wobei die gi normiert und irreduzi r bel seien. Sei b = ti=1 gi i , mit 0 ≤ ri ≤ ei für ein 1 ≤ t ≤ m, ein Teiler von f . Wir setzen h = (f /b)b . Dann gilt m g b h = = ri i . f b gi i=1
Da char K = 2 ist, kommt es bei ri nur auf die Parität an. Sei nun f separabel und h = (f /b)b , b wie eben. Es ist ggT(f , h) =
f f ggT(b, b ) = . b b
Also liefern verschiedene b auch verschiedene Lösungen h. Ist f nicht separabel, so ist gi = 0 für ein i. Wir erhalten für b = gi die Lösung h = 0, wie auch für b = 1. Somit ist die Voraussetzung „f separabel“ notwendig. Satz 17.5 besagt, dass die Lösungen der Differentialgleichung (∗) Teiler von f liefern. Das Problem ist nur, (∗) zu lösen. k Sei dazu f = dr=0 fr x r . Es ist offenbar grad h < d, also h = d−1 k=0 hk x . Da 2 char K = 2 ist, sind beide Seiten von (∗) Polynome in x . Nun können wir in (∗) einen Koeffizientenvergleich durchführen. Das liefert min(2j+1,d−1)
f2j+1−k hk = h2j ,
0 ≤ j ≤ d − 1.
(∗∗)
k=max(2j+1−d,0)
Wir betrachten den Spezialfall |K| = 2. Dann gilt h2j = hj . Damit haben wir in (∗∗) ein homogenes lineares Gleichungssystem. Sei M2 (f ) die Koeffizientenmatrix der linken Seite und E die Einheitsmatrix. Dann wird (∗∗) zu (M2 (f ) − E)h = 0.
(∗ ∗ ∗)
Damit haben wir das Problem auf die Lösung eines homogenen linearen Gleichungssystems zurückgeführt. Dieses Verfahren hängt natürlich stark davon ab, dass (∗∗) linear ist, was nur für |K| = 2 gilt. Es gibt Varianten dieses Algorithmus, die sogenannte Normalbasen benutzen, so dass man wieder bei einem linearen Gleichungssystem landet. Wir wollen dies nicht weiter verfolgen, sondern eine andere Verallgemeinerung angeben. Dazu betrachten wir den sogenannten Potenzreihenring und den Ring der formalen Laurentreihen, wie sie in Kapitel 15 Seite 191 beschrieben wurden. Wir ersetzen in K((x)) die Unbestimmte x durch x −1 und definieren dann für ∞ −n ∈ K((x −1 )) die sogenannte Hasse-Teichmüller-Ableitung H (k) der Ordn=t an x nung k durch ∞ ∞ −n (k) −n an x −n−k . H an x = k n=t n=t Offenbar ist H (k) linear. Da jedes h ∈ K(x) eine Laurententwicklung in x −1 hat, ist H (k) auch auf K(x) definiert. Es gilt:
Faktorisierung von Polynomen
237
Lemma 17.6. Sind K ein Körper, a ∈ K , k ≥ 0 und r ≥ 1, so ist −r (k) −r H ((x − a) ) = (x − a)−r −k . k Beweis. Wir haben H
Nun ist
(k)
−r
((x − a)
n − 1 n−r −n )=H x a n=r r − 1 ∞ −n n − 1 n−r −n−k = a x k r −1 n=r ∞ k − n n − k − 1 n−r −k −n a = x . k r −1 n=r +k (k)
∞
n−k−1 −r n−1 = , r −1 k r +k−1
k−n k
also ist
−r k
H (k) ((x − a)−r ) = =
∞ n=r +k
n−1 an−r −k x −n r +k−1
−r (x − a)−r −k . k
Seien K ein Körper und K1 = GF(q) ein Teilkörper von K . Wir betrachten die Differentialgleichung H (q−1) (y) − y q = 0.
( +)
Da L(y) = H (q−1) (y) − y q linear ist, bilden die Lösungen von (+) in K(x) einen K1 -Vektorraum. Wie üblich definieren wir für y ∈ K(x) den Grad als die Differenz von Zählerund Nennergrad. Es ist grad(H (q−1) (y)) ≤ grad y − q + 1.
Ist y eine Lösung von (+), so gilt q grad y ≤ grad y − q + 1,
also grad y ≤ −1.
Sei jetzt f ∈ K[x] das zu faktorisierende Polynom. Wir betrachten alle Lösungen von (+) der Form y = h f mit h ∈ K[x]. Auch diese bilden einen K1 -Vektorraum. Es gilt dann:
238
Faktorisierung von Polynomen
Satz 17.7. Seien K ein Körper mit char K = 2 und K1 = GF(q) ⊆ K . Seien weiter e e f ∈ K[x] ein normiertes separables Polynom mit grad f ≥ 1 und f = g11 · · · gmm die h Faktorisierung. Dann haben alle Lösungen y = f von (+) die Form y=
m
ci
i=1
gi , gi
c 1 , . . . , cm ∈ K 1 .
Weiter ist jedes solche y ist eine Lösung. Beweis. Zunächst einmal ist natürlich jedes solche y eine Lösung von (+). Sei jetzt umgekehrt y = fh eine Lösung von (+). Da grad( h f ) ≤ −1 ist, ist grad h < grad f . Sei R die Menge der Nullstellen von f in einem Zerfällungskörper E von f über K . Das liefert die folgende Partialbruchzerlegung von y : y=
e(β) γ(β, r ) (x − β)r β∈R r =1
mit γ(β, r ) ∈ E , wobei e(β) die Vielfachheit von β als Nullstelle von f ist. Nach Lemma 17.6 gilt e(β) −r γ(β, r ) (q−1) H (y) = . (++) q − 1 (x − β)r +q−1 β∈R r =1 Wir wollen nun annehmen, dass es ein β0 ∈ R gibt, so dass für r ≥ 2 wir γ(β0 , r ) ≠ 0 haben und wählen r maximal für dieses β0 . Da (+) von y gelöst wird und γ(β0 , r )q (x − β0 )−r q in y q vorkommt, muss es auch in (++) vorkommen. Es ist aber r + q − 1 < r q für r ≥ 2. Somit gilt y=
γ(β) x−β β∈R
und
H (q−1) (y) =
β∈R
γ(β) . (x − β)q
Da y eine Lösung von (+) ist, folgt γ(β)q = γ(β), was γ(β) ∈ K1 liefert. Nun sind alle Nullstellen von gi unter der Galoisgruppe konjugiert. Das liefert γ(β1 ) = γ(β2 ), falls β1 und β2 Nullstellen des gleichen irreduziblen Faktors von f sind. Somit ist y=
m i=1
ci
β∈R gi (β)=0
m g 1 = ci i . x − β i=1 gi
Ist p = 2 = q, so ist H (q−1) (y) = −y . Also haben wir −y − y 2 = 0.
Ist y =
h f,
so ist y =
f h+h f f2
und f h + h f = h2 . Das liefert (f h) = h2 .
Damit sind wir wieder bei der eingangs betrachteten Differentialgleichung.
( ∗)
Faktorisierung von Polynomen
239
Wie können wir nun (+) lösen? Wir können (+) umschreiben in f q H (q−1)
h f
= hq .
(+++)
Ist grad f = d, so folgt, dass die linke Seite von (+++) ein Polynom vom Grad höchstens (d − 1)q ist, was für die rechte Seite auch gilt, da grad h ≤ d − 1 ist. Weiter ist die rechte Seite ein Polynom in x q . Dies gilt auch für die linke Seite. Wir machen somit den Ansatz ∞ h =y = sn x −n−1 . f n=0
Dann ist H (q−1) (y) =
∞ n=0
=
∞
∞ −n − 1 n+q−1 sn x −n−q = sn x −n−q q−1 q − 1 n=0
snq x −nq−q .
n=0
Nach einem Satz von Lucas1 [31] gilt
n+q−1 q−1
⎧ ⎨1 ≡ ⎩0
q|n qn
(mod p).
Koeffizientenvergleich von x jq , 0 ≤ j ≤ d − 1, liefert nun d Gleichungen für die Unbekannten h0 , . . . , hd−1 . Dabei ist h=
d−1
hi x i .
i=0
Sei Nq (f ) die d × d-Koeffizientenmatrix für die linke Seite von (+++). Dann gilt Nq (f )g = hq
mit
⎛
h0
⎞
⎜ ⎟ ⎜ . ⎟ h = ⎜ .. ⎟ ∈ K d , ⎝ ⎠ hd−1
⎛
q
h0
⎞
⎜ ⎟ ⎜ . ⎟ hq = ⎜ .. ⎟ . ⎝ ⎠ q hd−1
1 É. Lucas, * 1842 Amiens, † 3. 10. 1891 Paris, arbeitete als Gymnasiallehrer in Paris, Arbeitsgebiet Zahlentheorie. Lucas entwickelte eine Methode, Zahlen der Form 2p − 1 auf Primalität zu testen. Damit bewies er 1876, dass 2127 −1 prim ist. Außerdem beschäftigte er sich viel mit Unterhaltungsmathematik. Von ihm stammt das Spiel „Die Türme von Hanoi“.
240
Faktorisierung von Polynomen
Dies ist natürlich kein lineares Gleichungssystem. Ist aber K = K1 , so ist h = hq , und wir haben das homogene Gleichungssystem (Nq (f ) − Ed )h = 0
(H)
Damit haben wir das Faktorisierungsproblem wie im Fall |K| = 2 auf das Lösen eines linearen Gleichungssystems zurückgeführt. Es gilt nun: Satz 17.8. Sei K = GF(q) und f ∈ K[x], f normiert mit grad f = d ≥ 1. Hat f genau m verschiedene irreduzible Faktoren, so ist rang(Nq (f ) − Ed ) = d − m.
Beweis. Die Lösungen von (H) sind in Satz 17.7 beschrieben. Da für irreduzibles gi mit gi | f nach Korollar 8.7 stets gi ≠ 0 ist, sind wegen der Eindeutigkeit der Partialg
bruchzerlegung die gii , 1 ≤ i ≤ m, in Satz 17.7 linear unabhängig über K . Also hat der Lösungsraum von (+) die Dimension m. Somit hat auch der Lösungsraum von (H) die Dimension m. Korollar 17.9. Seien K = GF(q) und f ∈ K[x] ein normiertes Polynom. Dann ist f genau dann irreduzibel in K , falls ggT(f , f ) = 1 und rang(Nq (f ) − Ed ) = d − 1 ist. Das liefert den folgenden Algorithmus für f = dj=0 fj x j : (1) Wir setzen ⎞ ⎛ ... fd f1 ⎟ ⎜ ⎜ f2 . . . fd 0 ⎟ ⎟ ⎜ G(f ) = ⎜ . .. ⎟ ⎟ ⎜ .. . ⎠ ⎝ fd 0 . . . 0 Wir bilden die Matrix Nq (f ). Dazu berechnen wir zuerst bj durch x jq ≡
d−1
bje x e
(mod f ),
0 ≤ j ≤ d − 1.
e=0
Dies liefert die Berlekamp-Matrix B , die wir in Definition 17.2 eingeführt haben. Dann ist Nq (f ) = G(f )BG(f )−1 . (2) Wir lösen (H). Jede Lösung liefert ein Polynom h. (3) Sei h ≠ 0 aus (2). Wir berechnen ggT(f , h). Für mindestens ein h ist dann ggT(f , h) ≠ 1. Es ist ggT(f , h) ein nichttrivialer Teiler von f . Nach Satz 17.7 liefert jede Lösung ungleich Null einen Teiler, falls f nicht quadratfrei ist. Ist f quadratfrei, so liefert h genau dann einen nichttrivialen Teiler, falls in der Formel in Satz 17.7 ci = 0 für ein, aber nicht alle i gilt. In diesem Fall erhalten wir dann genau qm − (q − 1)m − 1 Lösungen h mit ggT(f , h) ≠ 1.
Faktorisierung von Polynomen
241
Wir werden also zunächst ggT(f , f ) berechnen. Falls f quadratfrei ist, so ist ggT(f , f ) = 1. Dann berechnen wir Nq (f ) − Ed . Ist der Rang hiervon gleich d − 1, so ist f irreduzibel, und wir können aufhören. Das Problem dieses Algorithmus liegt im Schritt (3). Selbst wenn wir für das Polynom f = g1 · · · gm alle 2m Teiler kennen, so ist nicht klar, wie wir möglichst effektiv die irreduziblen gi finden. Wir wollen hierfür noch eine recht gute Methode vorstellen. Wir gehen davon aus, dass wir (H) gelöst, und damit eine Basis des Lösungsraums L von (+) bekommen haben, die wie folgt aussieht: B=
h
1
f
,...,
hm . f
,...,
gm . gm
Gesucht ist aber die Basis B0 =
g
1
g1
1 um hi Sei B1 = u v1 , . . . , vm die Basis, die aus B entsteht, indem man f durch die gekürzte ui Form vi ersetzt. Wichtig für das Weitere ist die folgende Feststellung: Für u v ∈ L mit 1 = ggT(u, v) haben wir stets m gj u = αj v gj j=1
mit geeignetem αj ∈ K . Da ggT(gi , gi ) = 1, i = 1, . . . , m, ist, folgt v=
m
gj .
(1)
j=1 αj ≠0
Für die
ui vi
gilt m gj ui = αij , vi gj j=1
1 ≤ i ≤ m.
Da (αij ) eine Basistransformation beschreibt, ist (αij ) regulär. Somit gilt nach (1), dass jedes gi mindestens eines der v1 , . . . , vn teilt. Sei w ein normierter Teiler von f . Indem wir die Anordnung der gi ändern, können wir w = g1 · · · gk ,
1≤k≤m
annehmen. Wir wollen nun ein Verfahren angeben, das entweder einen nichttrivialen Faktor von w findet oder zeigt, dass w irreduzibel ist.
242
Faktorisierung von Polynomen
Wir berechnen dazu zunächst ggT(w, vi ), i = 1, . . . , m. Ist einer dieser ggT(w, vi ) ungleich 1 oder w , so haben wir einen Faktor gefunden. Sei also stets ggT(w, vi ) ∈ {1, w}. Nach (1) ist ggT(w, vi ) ≠ 1 für mindestens ein i. Wir setzen I(w) = {1 ≤ i ≤ m : ggT(w, vi ) = w} = {1 ≤ i ≤ m : w | vi }.
Es ist I(w) ≠ ∅. Für i ∈ I(w) und β ∈ K betrachten wir vi ggT(ui + βw , vi ). w Dann gilt: Lemma 17.10. Ist ggT(w, vi ) = w , so ist ggT(ui + βw vwi , vi ) für alle β ∈ K ein Teiler von w . Ist k ≥ 2, d. h. w ist nicht irreduzibel, so ist für ein i ∈ I(w) und β ∈ K dieser ggT ein nichttrivialer Teiler von w . Beweis. Nach der Produktregel gilt k gj w = . w g j=1 j
Also gilt für jedes i ∈ I(w) und β ∈ K ui + βw vwi vi
=
k m gj gj ui w = +β (αij + β) + αij . vi w gj j=k+1 gj j=1
(2)
Betrachten wir die gekürzte Form auf der linken Seite von (2). Diese hat den Zähler vi . v ggT(ui + βw wi , vi ) Auf der rechten Seite von (2) haben wir k
gj
j=1
αij+β≠0
m
gj ,
j=k+1 αij ≠0
da ggT(gj , gj ) = 1 ist. Da w | vi erhalten wir mit (1) w
m
gj = vi
j=k+1 αij ≠0
und dann k
gj = ggT(ui , +βw
j=1 αij +β=0
Dies beweist den ersten Teil des Lemmas.
vi , vi ). w
(3)
Faktorisierung von Polynomen
243
Sei nun k ≥ 2. Ist i ∈ I(w), so ist ggT(w, vi ) = 1. Da vi = αij ≠0 gj ist, folgt αij = 0 für 1 ≤ j ≤ k. Da (αij ) regulär ist, muss es ein i ∈ I(w) mit αi1 ≠ αi2 geben. Wir setzen β = −αi1 . Dann liefert (3), dass ggT(ui + βw vwi , vi ) durch g1 , aber nicht g2 teilbar ist.
Wir können jetzt unseren Algorithmus angeben. (1) Wir berechnen ggT(w, vi ), i = 1, 2, . . . , m. Sowie wir einen nichttrivialen Faktor finden, beenden wir das Verfahren. Sonst gehen wir zu (2). (2) Wir berechnen ggT(ui + βw vwi , vi ) für i ∈ I(w) und β ∈ K ∗ . Dies ist nach Lemma 17.10 stets ein Teiler von w . Sowie wir einen nichttrivalen Faktor finden, beenden wir das Verfahren. Ansonsten ist w irreduzibel. Durch wiederholte Anwendung dieses Verfahrens erhalten wir ausgehend von der Basis B1 die irreduziblen Teiler g1 , . . . , gm von f . Übrigens liefert dieses Verfahren auch den gewünschten Erfolg, falls f ≠ g1 · · · gm ist. Da g = g1 · · · gm = kgV(v1 , . . . , vm ) ist, können wir das Verfahren auf g anwenden und erhalten so die gi . Um die αi mit giαi | f zu finden, müssen wir ggT(gi , f ) berechnen. Bemerkungen. Es gibt eine Reihe von Algorithmen zur Faktorisierung von Polynomen f über endlichen Körpern, die auf folgenden drei Schritten beruhen (wir betrachten hier einen Körper mit q Elementen): – Wir reduzieren das Problem auf quadratfreie Polynome f . – Wir faktorisieren f in Polynome f1 , . . . , fr , wobei jedes fi nur aus irreduziblen Polynomen besteht, die alle den gleichen Grad haben. – Wir benutzen Algorithmen, die Polynome faktorisieren, welche nur aus irreduziblen Polynomen gleichen Grades bestehen. Wie der erste Schritt geht, haben wir bereits gesehen. Für den zweiten Schritt berechj nen wir f1 = f und für alle j ≥ 1 berechnen wir uj = ggT(fj , x q − x) und setzen fj+1 = fj u−1 j . Dies endet, wenn fj+1 ein konstantes Polynom ist. Es ist uj das Produkt aller irreduziblen Polynome vom Grad j , die f teilen. Dahinter steht folgendes leicht zu beweisende Resultat: i j Seien i, j ≥ 0 ganze Zahlen, so ist x q − x q genau durch die Polynome in GF(q)[x] teilbar, deren Grad i − j teilt. Der klassische Algorithmus für den dritten Schritt geht auf D. Cantor und H. Zassenhaus [8] zurück. Eine Weiterentwicklung durch E. Kaltofen und V. Shoup findet man in [25].
244
Faktorisierung von Polynomen
Übungen 1. 2. 3. 4. 5.
Faktorisiere in GF(2) das Polynom x 12 + x 7 + x 5 + x 4 + x 3 + x 2 + 1. Faktorisiere in GF(3) das Polynom x 7 + x 6 + x 5 − x 3 + x 2 − x − 1. Zeige, dass x 6 − x 3 − x − 1 irreduzibel über GF(3) ist. Zeige, dass x 4 + 3x 3 + 4x 2 + 2x − 1 irreduzibel über GF(13) ist. Faktorisiere das folgende Polynom in Z[x]: x 11 + 3x 10 + 5x 9 + 7x 8 + 9x 7 + 11x 6 + 13x 5 + 12x 4 + 8x 3 + 5x 2 + 3x + 1.
18 Galoisgruppen Wir haben in diesem Buch zunächst die Galoistheorie als abstrakten Teil der Mathematik entwickelt. In Kapitel 12, Kapitel 16 und Kapitel 17 haben wir uns dann auch den Fragen der praktischen Berechenbarkeit zugewandt, also der Berechnung von Kreisteilungspolynomen, des größten gemeinsamen Teilers und von Faktorisierungen. Übrig bleibt aber die Frage, wie man die Galoisgruppe eines konkret vorgegebenen Polynoms berechnen kann. Diese wollen wir jetzt zumindest teilweise beantworten. Wir werden eine allgemeine Methode zur Berechnung der Galoisgruppe vorstellen. Man wird aber sehen, dass diese bei größeren Graden sehr schnell so komplex wird, dass selbst mit Computereinsatz ein Erfolg nicht immer garantiert ist. Auf der anderen Seite werden wir sehen, dass es relativ leicht ist, die Galoisgruppe zu berechnen, falls sie eine sehr spezielle Struktur hat (An , Σn , auflösbar). Bei Polynomen, die nicht in diese eben genannten Kategorien fallen, muss man häufig zusätzliche Tricks anwenden, die von den jeweiligen Gegebenheiten abhängen. Wir haben davon zwei in Kapitel 7, Aufgabe 4 und Kapitel 10, Aufgabe 8 bereits gesehen. Neben diesen konkreten Fragestellungen wollen wir in diesem Kapitel noch die bekannten Auflösungsformeln für die Gleichungen vom Grad höchstens 4 herleiten. Weiter wollen wir zeigen, dass es stets eine Körpererweiterung von Q gibt, deren Galoisgruppe die symmetrische Gruppe Σn ist. Als Beispiel werden wir ein Polynom mit Gruppe Σ6 angeben. Sei K ein Körper und f ∈ K[x] ein normiertes Polynom vom Grad n. Seien weiter F ⊇ K der Zerfällungskörper von f und a1 , . . . , an die Nullstellen von f in F . Dann definieren wir die Diskriminante von f als D = Df = (ai − aj )2 . 1≤i<j≤n
Falls f keine mehrfachen Nullstellen hat, ist D ≠ 0. Dann ist insbesondere K ⊆ F galoissch. Sei G = G (F /K) die Galoisgruppe. Dann permutiert G die Nullstellen von f und somit ist Df invariant unter G, was Df ∈ K liefert. Wir können Df als eine Funktion in den n Variablen a1 , . . . , an auffassen, die unter Σn invariant ist. Solche Funktionen spielen bei der Nullstellenberechnung eine wichtige Rolle, weshalb wir sie zunächst studieren wollen. Definition 18.1. Seien R ein Ring und f ∈ R[x1 , . . . , xn ]. (1) Ist f (x1 , . . . , xn ) = f (xσ (1) , . . . , xσ (n) )
für alle σ ∈ Σn , so heißt f eine symmetrische Funktion über R in n Variablen. (2) Für J = {j1 , . . . , jr } ⊆ {1, . . . , n} setzen wir τJ = xj1 · · · xjr und σr (x1 , . . . , xn ) = τJ . J⊆{1,...,n} |J|=r
246
Galoisgruppen
Wir nennen σr das r -te elementarsymmetrische Polynom in den xi , σ1 = x1 + x2 + · · · + xn ,
σn = x1 x2 · · · xn .
Die eben definierten elementarsymmetrischen Polynome erzeugen die symmetrischen Funktionen im folgenden Sinne: Satz 18.2. Seien R ein Ring und f ∈ R[x1 , . . . , xn ] eine symmetrische Funktion. Dann gibt es ein g ∈ R[y1 , . . . , yn ] mit g(σ1 , . . . , σn ) = f und grad g ≤ grad f . Insbesondere sind die symmetrischen Funktionen in R[σ1 , . . . , σn ] enthalten. j j Beweis. Sei f = ki1 ,...,ik ,j1 ,...,jk xi11 · · · xikk . Wir ordnen die Exponenten lexikographisch. In dieser Ordnung sei (a1 , . . . , an ) der größte eines Monoms mit nicht verschwindendem Koeffizienten. Wegen f (x1 , . . . , xn ) = f (xπ (1) , . . . , xπ (n) ) für π ∈ Σn folgt, dass a
a
xπ1(1) · · · xπn(n)
einen von Null verschiedenen Koeffizienten hat. Also ist a
a
a
xπ1(1) · · · xπn(n) = x1 π
−1 (1)
a
· · · xnπ
−1 (n)
.
Da dies für alle π ∈ Σn gilt, ist auch (aπ (1) , . . . , aπ (n) )
ein vorkommender Exponent. Insbesondere ist (aπ (1) , . . . , aπ (n) ) ≤ (a1 , . . . , an )
für alle π ∈ Σn .
Indem wir dies mit π = (i, i + 1) anwenden, erhalten wir (a1 , . . . , ai−1 , ai+1 , ai , ai+2 , . . . , an ) ≤ (a1 , . . . , an )
für alle i.
Dann folgt ai+1 ≤ ai
für alle i.
Wir setzen nun a −a2
h = σ1 1
a −a3
σ2 2
a
n−1 · · · σn−1
−an
a
σn n . (a −a
)
Da die σi homogene Polynome vom Grad i sind, sind die σi i i+1 homogen vom Grad i(ai − ai+1 ). Somit ist h ein symmetrisches Polynom vom Grad (a1 − a2 ) + 2(a2 − a3 ) + · · · + nan = a1 + a2 + · · · + an .
Galoisgruppen
247
Der lexikographisch größte Exponent von σi ist (1, 1, . . . , 1, 0, . . . , 0). i (ai −ai+1 )
Also ist der lexikographisch größte Exponent von σi
(ai − ai+1 , . . . , ai − ai+1 , 0, 0, . . . , 0). i
Somit ist der lexikographisch größte Exponent von h (a1 − a2 , 0, . . . , 0) + (a2 − a3 , a2 − a3 , 0, . . . ) + · · · · · · + (an , an , . . . , an ) = (a1 , a2 , . . . , an ). a
a
Sei nun r der Koeffizient von x1 1 · · · xnn in f . Wegen grad h = a1 + · · · + an hat das Polynom f − rh
die folgenden Eigenschaften: (1) grad(f − r h) ≤ grad f . (2) Alle in f − r h vorkommenden Exponenten sind echt kleiner als (a1 , . . . , an ). (3) f − r h ist symmetrisch. Nun liefert eine Induktion die Existenz eines g1 ∈ R[y1 , . . . , yn ] mit g1 (σ1 , . . . , σn ) = f − r h.
Setzen wir a −a2
g = g1 + r y1 1
a −a3
y2 2
a
· · · yn n ,
so ist g(σ1 , . . . , σn ) = f . Wir kommen wieder zu unserer Diskriminante D von f zurück. Es war D ein symmetrisches Polynom in a1 , . . . , an . Somit gilt nach Satz 18.2, dass D ein Polynom i in den elementarsymmetrischen Polynomen in a1 , . . . , an ist. Ist also f = n i=0 αi x , r mit αn = 1, so ist bekanntlich αn−r = (−1) σr (a1 , . . . , an ). Somit ist D ein Polynom in den Koeffizienten von f . Um D aus den Koeffizienten von f berechnen zu können, benötigen wir noch einige Vorarbeiten. Lemma 18.3. Sei
Dann ist d2 = D .
! ! 1 ! ! ! a1 ! ! a2 d = df = ! ! 1 ! . ! .. ! ! n−1 !a1
... a2 a22
... ... ...
an−1 2
...
! ! ! ! ! ! ! !. ! .. ! . ! ! ! ! an−1 n 1 an a2n
248
Galoisgruppen
Beweis. Es ist d eine Vandermondesche Determinante. Nun folgt die Behauptung mit der bekannten Formel. Statt D zu berechnen, werden wir d berechnen, was, wie wir noch sehen werden, nicht sehr schwierig ist. Dazu definieren wir zunächst einige Hilfsgrößen. Definition 18.4. Seien f = definieren Sk , k ∈ N, durch
n
i=0
αi x i ∈ K[x] und a1 , . . . , an die Nullstellen. Wir
Sk = ak1 + ak2 + · · · + akn . i Lemma 18.5. Seien f = n i=0 αi x ∈ K[x], F ein Zerfällungskörper für f und a1 , . . . , an die Nullstellen von f in F . Dann gilt ⎧ ⎪ Sk−1 σ1 (a1 , . . . , an ) − Sk−2 σ2 (a1 , . . . , an ) + · · · ⎪ ⎪ ⎪ ⎪ ⎪ ⎨+(−1)k S1 σk−1 (a1 , . . . , an ) + (−1)k+1 kσk (a1 , . . . , an ) Sk = ⎪S ⎪ k−1 σ1 (a1 , . . . , an ) − Sk−2 σ2 (a1 , . . . , an ) + · · · ⎪ ⎪ ⎪ ⎪ ⎩ + (−1)k+1 Sk−n σn (a1 , . . . , an )
für k ≤ n, für k > n.
Beweis. Sei R = K[a1 , . . . , an ] ⊆ F . Wir definieren σ ∈ R[z] durch σ (z) =
n
(1 − ai z).
i=1
Nun ist σ (z) = 1 − σ1 z + σ2 z2 · · · (−1)n σn zn , wobei wir σi (a1 , . . . , an ) mit σi abkürzen. Es ist weiter σ (z) = −
n i=1
ai
n
(1 − aj z).
j=1 j≠i
Wir setzen S(z) =
∞
Sk zk ∈ R{z}
(vgl. Kapitel 15, Seite 191).
k=1
Dann gilt n n ∞ −zσ (z) ai z = = aki zk σ (z) 1 − ai z i=1 i=1 k=1
=
∞ n
∞ aki z k = Sk zk = S(z).
k=1 i=1
Dies waren rein formale Rechnungen. Also gilt in R{z} S(z)σ (z) = −zσ (z).
k=1
Galoisgruppen
249
Mit σ0 = 1 haben wir dann ∞ n n Sk zk (−1)i σi zi = (−1)j+1 jσj zj . k=1
i=0
j=1
Koeffizentenvergleich liefert nun die Behauptung. Lemma 18.6. Es ist
! ! n ! ! ! S1 ! ! S D=! ! 2 ! . ! .. ! ! !Sn−1
Beweis. Sei A die Matrix mit aij =
aij .
S1 S2 ...
... ... ...
...
...
! Sn−1 ! ! ! Sn ! ! Sn+1 ! !. ! .. ! . ! ! ! S2n−2 !
Dann ist det A = d nach Lemma 18.3 und
D = d2 = det A det At = det(AAt ).
Aber AAt ist genau die obige Matrix. Damit haben wir nun eine Möglichkeit, die Diskriminante D aus den Koeffizienten zu berechnen. Dies wollen wir anwenden, um für die Gleichungen vom Grad höchstens 4 die bekannten Auflösungsformeln zu beweisen. Beispiele 18.7. (1) Sei f = x 2 + bx + c ∈ K[x] mit char K ≠ 2. Es seien a1 , a2 die Nullstellen in einem Zerfällungskörper. Dann ist σ1 = σ1 (a1 , a2 ) = −b,
σ2 = σ2 (a1 , a2 ) = c.
Es sind S1 = σ1 und S2 = S1 σ1 − 2σ2 = σ12 − 2σ2 = b2 − 2c nach Lemma 18.5. Also gilt ! ! ! 2 −b ! ! ! ! = b 2 − 4c. D=! !−b b2 − 2c ! √ Nun ist D = (a1 − a2 )2 und dann a1 = a2 + D . Aus −b = a1 + a2 folgt a1 = −b − a2 , d. h. √ −a2 − b = a2 + D oder
√ D), √ 1 a1 = 2 (−b + D).
a2 = 12 (−b −
Dies sind die bekannten Formeln für die quadratische Gleichung.
250
Galoisgruppen
(2) Sei f = x 3 + ax 2 + bx + c ∈ K[x] mit char K ≠ 3, 2. Wir ersetzen x durch a y − 3 . Das liefert f (x) = g(y) = y 3 + py + q
und Df = Dg . Für g erhalten wir so σ1 = 0,
σ2 = p,
σ3 = −q.
Mit Lemma 18.5 folgt S1 = 0,
Also gilt
S2 = −2p,
! ! 3 ! ! D=! ! 0 ! !−2p
0 −2p −3q
S3 = −3q
und S4 = 2p2 .
! −2p ! ! ! 3 2 −3q ! ! = −4p − 27q . 2! 2p !
Für eine Nullstelle a von g machen wir einen Ansatz a=u+v
mit 3uv = −p.
Dann gilt: a3 = u3 + v 3 + 3uv(u + v) = u3 + v 3 + 3uva.
Da g(a) = 0 ist, folgt u3 + v 3 = −q.
Wir betrachten nun das Polynom h(z) mit h(z) = (z − u3 )(z − v 3 ) = z2 + qz −
p3 . 27
Nach (1) ist Dh = q2 +
und q u =− + 2 3
−Dg , 108
−Dg 4p 3 = 27 27 q v =− − 2 3
−Dg . 108
Das ergibt nun aber jeweils 3 Werte für u und v . Diese müssen allerdings so gepaart werden, dass 3uv = −p
gilt.
Galoisgruppen
251
Sei u1 , v1 eine solche Wahl. Dann sind auch wu1 , w 2 v1 und w 2 u1 , wv1 , wobei w eine primitive 3-te Einheitswurzel ist, eine solche Wahl, und das sind auch alle Möglichkeiten. Also gilt für die Nullstellen a1 , a2 , a3 von g : a1 = u1 + v 1 , a2 = wu1 + w 2 v1 , a3 = w 2 u1 + wv1 .
Dies sind die sogenannten Cardanoschen Formeln1 . Lemma 18.8. Sei char K ≠ 2. Das Polynom f ∈ K[x] habe in einem Zerfällungskörper F paarweise verschiedene Nullstellen. Die Galoisgruppe Gf = G (F /K) betrachten wir als Untergruppe von Σn mit n = grad f und setzen Hf = Gf ∩ An . Dann ist k (Hf ) = K(df ). Beweis. Ist π ∈ Σn eine Transposition, so vertauscht π in der Matrix in Lemma 18.3 genau zwei Spalten. Also ist π (df ) = −df . Damit ist σ ∈ Gf genau dann in Hf , falls σ (df ) = df ist. Somit erhalten wir k(Hf ) ⊇ K(df ) und G (K(df )) ⊆ Hf . Da K ⊆ F nach Korollar 8.12 galoissch ist, ist k(Hf ) ⊆ k(G G (K(df ))) = K(df ),
was dann k (Hf ) = K(df ) liefert. Korollar 18.9. Sei char K ≠ 2. Das Polynom f ∈ K[x] habe in einem Zerfällungskörper F paarweise verschiedene Nullstellen. Dann ist die Galoisgruppe G = G (F /K) genau dann in An enthalten, wenn Df ein Quadrat in K ist. Beweis. Dies folgt sofort aus Lemma 18.3 und Lemma 18.8.
1 G. Cardano, * 24. 9. 1501 Pavia, † 21. 9. 1576 Rom, Arzt, Philosoph, Techniker, Mathematiker, 1523 Gymnasiallehrer für Mathematik, 1525 Rektor der Universität Padua, 1543 Professor für Medizin in Pavia, 1562 Professor in Bologna, 1570 wegen Ketzerei eingesperrt. Cardanos mathematisches Hauptwerk besteht in den Auflösungsformeln für kubische Gleichungen, was ein 2000 Jahre altes Problem löste. Weiteres Arbeitsgebiet sind Anfänge der Wahrscheinlichkeitsrechnung. Philosophisch stand er Galilei sehr nahe. Er hat auch viele technische Erfindungen gemacht. Die kardanischen Aufhängungen, obwohl nach Cardano benannt, sind aber vermutlich älter.
252
Galoisgruppen
Lemma 18.10. Seien char K ≠ 2 und f ∈ K[x] ein irreduzibles separables Polynom vom Grad 3. Dann ist die Galoisgruppe Gf von f isomorph zu A3 , falls Df ein Quadrat in K ist, sonst ist Gf zu Σ3 isomorph. ! Beweis. Da Gf transitiv auf den 3 Nullstellen von f ist, ist 3 ! |Gf |. Also ist Gf A3 oder Σ3 . Nun folgt die Behauptung mit Korollar 18.9. Damit ist die Gleichung vom Grad drei vollständig behandelt. Wir wollen ein ähnliches Resultat für Polynome von Grad vier beweisen. Seien char K ≠ 2 und f = x 4 + b1 x 3 + b2 x 2 + b3 x + b4 ∈ K[x]. Wir ersetzen x durch x − b1 /4. Das ergibt f (x) = x 4 + bx 2 + cx + d ∈ K[x].
Seien a1 , a2 , a3 , a4 die vier verschiedenen Nullstellen. Auf diesen operiert Σ4 , indem es die Indices permutiert. Wir fassen wieder G = Gf als Untergruppe von Σ4 auf. In A4 haben wir einen Normalteiler V = {id, (12)(34), (13)(24), (14)(23)}. Wir setzen jetzt α1 = a1 a2 + a3 a4 ,
α2 = a1 a3 + a2 a4 ,
a3 = a1 a4 + a2 a3 .
Jedes αi wird von V festgelassen. Es gilt sogar: Lemma 18.11. Mit den eben eingeführten Bezeichnungen ist k (G ∩ V ) = K(α1 , α2 , α3 ).
Beweis. Es ist α1 fest unter V , (1, 2) = H1 . Nun ist Σ4 = H1 ∪ H1 (1,3) ∪ H1 (1, 4).
Weiter ist (1, 3)α1 = α3 ≠ α1 und (1, 4)α1 = α4 ≠ α1 . Also ist H1 der Stabilisator in Σ4 von α1 . Genauso sind H2 = V , (1, 3) der Stabilisator von α2 und weiter H3 = V , (1, 4) der von α3 . Da H1 ∩ H2 ∩ H3 = V ist, gilt, dass für σ ∈ G mit σ αi = αi , i = 1, 2, 3, wir σ ∈ G ∩ V haben. Das ist die Behauptung. Beispiel 18.12. Wie wir gesehen haben, werden die αi unter Gf permutiert. Das zeigt, dass das Polynom g(x) = (x − α1 )(x − α2 )(x − α3 )
Koeffizienten in K hat, also g(x) ∈ K[x] ist. Wir wollen die Koeffizienten von g(x) bestimmen. Es gilt σ1 = 0,
σ2 = b,
σ3 = −c,
σ4 = d.
Galoisgruppen
253
Der Koeffizient von x 2 in g(x) ist −(α1 + α2 + α3 ) = −(a1 a2 + a3 a4 + a1 a3 + a2 a4 + a1 a4 + a2 a3 ) = −σ2 = −b.
Der Koeffizient von x ist α1 α2 + α1 α3 + α2 α3 = a1 a2 a3 (a1 + a2 + a3 ) + a1 a2 a4 (a1 + a2 + a4 ) + a1 a3 a4 (a1 + a3 + a4 ) + a2 a3 a4 (a2 + a3 + a4 ) = −4a1 a2 a3 a4
(da σ1 = 0 ist)
= −4σ4 = −4d.
Der Koeffizient von x 0 ist −α1 α2 α3 = −σ32 + 4σ2 σ4 = −c 2 + 4bd.
Also ist g(x) = (x − α1 )(x − α2 )(x − α3 ) = x 3 − bx 2 − 4dx − c 2 + 4bd.
Man nennt g(x) die kubische Resolvente von f . Sei L = K(α1 , α2 , α3 ) der Zerfällungskörper von g . Also L = k (Gf ∩ V ). Dann ist G (L) = Gf /Gf ∩ V . Gg = G (L/K) Gf /G
Da α1 − α2 = (a1 − a4 )(a2 − a3 ) und α1 − α3 = (a1 − a2 )(a3 − a4 ) ist, folgt, dass Dg = Df ist. Damit lassen sich nun Formeln für die ai aufstellen. Es gilt: (1) a1 + a2 + a3 + a4 = 0, (2) (a1 + a2 )(a3 + a4 ) = α2 + α3 , (3) (a1 + a3 )(a2 + a4 ) = α1 + α3 , (4) (a1 + a4 )(a2 + a3 ) = α1 + α2 . Also haben wir ' a1 + a2 = −(α2 + α3 ), ' a1 + a3 = −(α1 + α3 ), ' a1 + a4 = −(α1 + α2 ). D. h.
' ' ' −(α2 + α3 ), + −(α1 + α3 ) + −(α1 + α2 )), ' ' ' a2 = 12 ( −(α2 + α3 ), − −(α1 + α3 ) − −(α1 + α2 )), ' ' ' 1 a3 = 2 (− −(α2 + α3 ), + −(α1 + α3 ) − −(α1 + α2 )), ' ' ' a4 = 12 (− −(α2 + α3 ), − −(α1 + α3 ) + −(α1 + α2 )).
a1 = 12 (
Will man die Nullstellen einer Gleichung vierten Grades berechnen, so muss man zunächst die kubische Resolvente berechnen. Deren Nullstellen findet man mit den
254
Galoisgruppen
Cardanoschen Formeln. Hiermit können dann mit den obigen Formeln die a1 , . . . , a4 berechnet werden. Diese obigen Formeln gehen auf Ferrari2 zurück. Wir wollen nun das Lemma 18.10 entsprechende Lemma für Polynome vom Grad 4 beweisen. Sei dazu f irreduzibel, also Gf ist transitiv. Die möglichen Ordnungen für Gf sind demnach 4, 8, 12, 24. Natürlich sind Σ4 und A4 transitiv und es gibt nur jeweils eine Gruppe dieser Ordnung. Gruppen der Ordnung 8 sind Sylow-2-Untergruppen. Es gibt genau 3 davon, die alle konjungiert und transitiv sind. Weiter ist V transitiv. Ist G ≠ V und |G| = 4, G transitiv, so ist G zu (1234) = C konjugiert. Also bis auf den letzten Fall enthalten alle transitiven Gruppen V . Sei m = [L : K] mit L = K(α1 , α2 , α3 ). Es ist m = |Gg | ein Teiler von |G| und ! Gg Gf /Gf ∩ V . Also ist Gf ∩ V ≠ 1, da 4 ! |Gf | ist. Das liefert Gf Σ4
genau für m = 6,
G f A4
genau für m = 3,
Gf V
genau für m = 1.
Sei H1 eine Sylow-2-Untergruppe von Σ4 . Da V ⊆ H1 und |C ∩ V | = 2 ist, ist m = 2 für Gf C und Gf H1 . Im ersten Fall sind [F : K] = 4 und [L : K] = 2, also ist [F : L] = 2. Weiter ist f reduzibel über L in diesem Fall. Ist Gf H1 , so sind [F : K] = 8 und [L : K] = 2, also ist [F : L] = 4. In diesem Fall ist f irreduzibel über L. Wir fassen dies zusammen: Lemma 18.13. Seien char K ≠ 2 und f ∈ K[x] ein separables und irreduzibles Polynom vom Grad 4. Seien weiter g die kubische Resolvente von f und L ⊆ F der Zerfällungskörper von g mit m = [L : K]. (1) Ist m = 6, so ist Gf Σ4 . (2) Ist m = 3, so ist Gf A4 . (3) Ist m = 2 und f irreduzibel über L, so ist Gf eine Sylow-2-Untergruppe von Σ4 . (4) Ist m = 2 und f reduzibel über L, so ist Gf zyklisch von der Ordnung 4. (5) Ist m = 1, so ist Gf = V . Wir wollen nun noch zeigen, dass alle Möglichkeiten aus Lemma 18.13 wirklich vorkommen.
2 L. Ferrari, * 2. 2. 1522 Bologna, † Oktober 1569 Bologna, Schüler Cardanos. Ferrari war Lehrer für Mathematik, Vemessungsingenieur und ab 1564 Professor für Mathematik in Bologna. Er entdeckte das Lösungsverfahrens für die Gleichung 4. Grades.
255
Galoisgruppen
Beispiele 18.14. (1) Sei f = x 4 − x + 1 ∈ Q[x]. Dieses Polynom modulo 2 gelesen ist f2 = x 4 + x + 1. Es ist f2 weder ein Quadrat in GF(2)[x] noch hat f2 eine Nullstelle in GF(2). Also ist f2 irreduzibel in GF(2)[x], d. h. f ist irreduzibel in Q[x]. Die kubische Resolvente von f ist g = x 3 − 4x − 1.
Modulo 3 gilt g3 = x 3 −x−1. In GF(3) hat g3 keine Nullstelle, also ist g irreduzibel in Q[x]. Es ist Df = Dg = 44 − 27 = 229. Somit ist nach Lemma 18.8 Gg Σ3 . Damit ist m = 6 und Gf Σ4 . (2) Sei f = x 4 − 6x 2 + 8x + 28 ∈ Q[x]. Ist x eine Nullstelle in Z, so ist x ein Teiler von 28. Durch Einsetzen der Werte sehen wir, dass f keine Nullstelle besitzt. Sei f = (x 2 + ax + b)(x 2 + cx + d). Modulo 3 ist f3 = x 4 − x + 1. Also ist dann a + c = 0 als Koeffizient von x 3 , bd = 1, also b = d und dann b(a + c) = −1 als Koeffizient vor x , ein Widerspruch. Somit ist f3 irreduzibel und dann auch f . Es ist g(x) = x 3 + 6x 2 − 112x − 736. Wir ersetzen x durch y − 2. Das liefert h(y) = y 3 −124y −496. Modulo 3 folgt h3 (y) = y 3 −y −1. Es ist h3 irreduzibel, da es keine Nullstelle in GF(3) besitzt. Also ist h irreduzibel in Q[x]. Wir haben Dg = Dh = 4 · 1243 − 27 · 4962 = 984064 = (31 · 32)2 .
Also ist Gg A3 , was m = 3 und Gf A4 liefert. (3) Sei f = x 4 − 2x 2 + 4x − 2 ∈ Q[x]. Nach Satz 1.48 mit p = 2 ist f irreduzibel. Es √ ist g(x) = x 3 + 2x 2 + 8x = x(x 2 + 2x + 8). Die Nullstellen sind 0, −1± −7. √ √ Also gilt m = 2 und L = Q( −7). Der Ring der ganzen Zahlen in Q( −7) ist √ R−7 = {(a + b −7)/2 | a, b ∈ Z, a ≡ b (mod 2)} (siehe Beispiel 1.29). √
Es ist R−7 ein ZPE-Ring nach Beispiel 1.29(1). Man rechnet nach, dass 1+ 2 −7 ein √ √ Primelement in R−7 ist. Da 1+ 2 −7 · 1− 2 −7 = 2 ist, ist dann f nach Satz 1.48 irre√ duzibel über Q( −7). Also ist Gf eine Gruppe der Ordnung 8 nach Lemma 18.10. (4) Sei f = x 4 + 5x 2 + 5 ∈ Q[x]. Nach Satz 1.48 mit p = 5 ist f irreduzibel. Es sind g(x) = x 3 − 5x 2 − 20x + 100 = (x − 5)(x 2 − 20)
√ und L = Q( 5), d. h. m = 2. Nun ist f (x) = [x 2 + (5 − 5)/2][x 2 + (5 + 5)/2]
in L[x].
Also ist Gf zyklisch von der Ordnung 4. (5) Sei f = x 4 + 1 ∈ Q[x]. Es ist f (x + 1) irreduzibel nach Satz 1.48. Weiter ist g(x) = x 3 − 4x = x(x − 2)(x + 2).
Also ist m = 1 und wir erhalten Gf V . Damit haben wir gesehen, dass alle Fälle aus Lemma 18.13 vorkommen.
256
Galoisgruppen
Das nächste Ziel ist, zu zeigen, dass es für jedes n ∈ N eine Körpererweiterung Q ⊆ K gibt, so dass G (K/Q) Σn ist. Die wesentliche Idee hierbei ist auch von unabhängiger Bedeutung. Wir betrachten Reduktionen des zu untersuchenden Polynoms f modulo Primzahlen p . Sei fp das zugehörige Polynom. Nach Satz 8.18 ist die Galoisgruppe von fp zyklisch. Das wird dann liefern, dass es ein σ in der Galoisgruppe Gf zu f gibt, das ein Produkt von Zyklen σi der Längen ni ist, wobei ni die Grade der irreduziblen Teiler von fp sind. Wenn man dieses Verfahren für verschiedene Primzahlen p anwendet, so erhält man Informationen über die Gruppe Gf , die es manchmal erlauben, sie eindeutig zu identifizieren. Wir werden das Verfahren anwenden, um zu zeigen, dass unter gewissen Bedingungen Gf Σn ist. Sei R ein ZPE-Ring mit Quotientenkörper K und f ∈ R[x] ein normiertes Polynom mit grad f = n. In einem Zerfällungskörper F habe f die n paarweise verschiedenen Nullstellen a1 , . . . , an . Wir setzen Θ=
n
ai xi ∈ F [x1 , . . . , xn ].
i=1
Für τ ∈ Σn definieren wir Θτ =
n
aτ(i) xi
i=1
und setzen
g(z) =
(z − Θτ ) ∈ F [x1 , . . . , xn ][z].
( ∗)
τ∈Σn
Die Koeffizienten von g sind Polynome über Z in den ai . Da offenbar alle Permutationen vorkommen, sind sie symmetrische Polynome in den ai , d. h. Polynome in den Koeffizienten von f nach Satz 18.2, d. h. g ∈ R[x1 , . . . , xn ][z].
Wir setzen nun R1 = R[x1 , . . . , xn ], F1 = F (x1 , . . . , xn ) und K1 = K(x1 , . . . , xn ). Dann ist F1 Zerfällungskörper von f über K1 . Sei G = G (F1 /K1 ) die Galoisgruppe. Durch σ → σ|F wird ein Homomorphismus G → G (F /K) definiert, der offenbar ein Epimorphismus ist. Ist σ|F = id, so ist, wegen σ (xi ) = xi , dann auch σ = id. Also ist Gf G.
Seien nun α = α(x1 , . . . , xn ) ∈ F1 und τ ∈ Σn . Wir definieren ατ = α(xτ(1) , . . . , xτ(n) ).
Offenbar ist (ατ )σ = ασ τ . In diesem Sinne ist Θτ = Θτ −1 . Wie üblich setzen wir die Operation von τ auf F1 [z] durch τ(z) = z fort. Dann ist gτ = (z − Θσ )τ = (z − Θσ −1 )τ = (z − Θσ ) = g. σ ∈Σn
Also ist g unter Σn invariant.
σ ∈Σn
σ ∈Σn
Galoisgruppen
257
Wir haben nun jedem f in (∗) ein gf zugeordnet. Mit den eben eingeführten Bezeichnungen gilt: Satz 18.15. Seien R ein ZPE-Ring und f ∈ R[x] ein normiertes Polynom. Es habe f paarweise verschiedene Nullstellen in einem Zerfällungskörper, der R enthält. Seien gf ∈ R[x1 , . . . , xn ][z] wie eben konstruiert und g1 ein irreduzibler Faktor von gf . Dann ist StabΣn (g1 ) = {τ | τ ∈ Σn , (g1 )τ = g1 } Gf .
Beweis. Wir bestimmen zunächst die irreduziblen Faktoren von gf . Sei φ ∈ Gf . Dann haben wir eine natürliche Operation von φ auf F1 , in der φ(xi ) ≠ xi ist. Ist α ∈ F1 , so ist im Allgemeinen φ(α) ≠ αφ . Aber sind φ ∈ Gf und σ ∈ Σn , so ist φ(Θσ ) = φ
n
n n aσ (i) xi = φ(aσ (i) )xi = aφσ (i) xi = Θφσ .
i=1
i=1
( ∗)
i=1
Ist insbesondere σ = 1, so folgt φ(Θ) = Θφ .
Sei ¯σ = g
(z − φ(Θσ )) =
(∗)
φ∈Gf
(z − Θφσ )
¯σ ∈ F1 [z]. Sei nun ψ ∈ Gf , dann gilt so ist g ¯σ ) = ψ(g (z − φ(Θφσ )) = (z − Θ(ψφ)σ ) = φ∈Gf
(∗)
für jedes σ ∈ Σn ,
φ∈Gf
φ∈Gf
¯σ . (z − Θ(ψφ)σ ) = g
ψφ∈Gf
¯σ ∈ K1 [z]. Es ist [F1 : K1 ] = |Gf | = grad g ¯σ ¯σ . Die Wurzeln von g Also ist sogar g ¯σ irreduzibel sind paarweise verschieden und Gf ist transitiv auf diesen, also ist g über K1 und F1 = K1 (Θσ ) = K1 (Θ). Sei nun σ1 , . . . , σk ein Nebenklassenvertretersystem von Gf in Σn , also Σn = {φσi | φ ∈ Gf , 1 ≤ i ≤ k}.
Dann ist g=
k
¯σi . g
i=1
¯σi irreduzibel ist, ist dies die Primfaktorzerlegung von g in K1 [z]. Da g Da jedes g normiert ist und auch alle gσi normiert sind, folgt mit Lemma 1.43, dass diese Zerlegung schon eine in R1 [z] ist.
258
Galoisgruppen
Sei nun h ein irreduzibler Faktor von g . Dann enthält h einen Linearfaktor (z − Θσ ) für ein σ . Indem wir die ai geeignet anordnen, können wir annehmen, ¯σi für ein σi , d. h. dass (z − Θ) ein Teiler von h ist. Nun ist h = g
h=
(z − Θφσi ).
φ∈Gf
Da Θφσi = Θ für ein φ ∈ Gf gilt, folgt σi ∈ Gf . Also ist h = φ∈Gf (z − Θφ ). Ist τ ∈ Σn mit hτ = h, so ist (z − Θφ ) = h = hτ = (z − Θφ )τ = (z − Θφτ −1 ). φ∈Gf
φ∈Gf
φ∈Gf
Also ist τ ∈ Gf . Ist umgekehrt τ ∈ Gf , so ist h = hτ . Das ist die Behauptung. Der nächste Satz ist ein wesentlicher Schritt zur Berechnung der Galoisgruppe eines Polynoms f . Er ist unter dem Namen van der Waerden-Kriterium bekannt (siehe auch [55, § 66]). Satz 18.16. Seien R ein ZPE-Ring mit Quotientenkörper K und ρ ein Primideal in R, ˜ einen Quotientenkörper von R ˜ = R/ρ und bezeichnen mit K ˜ . Seien ρ ≠ 0. Wir setzen R ˜ ˜ f ∈ R[x] ein normiertes Polynom und f ∈ R[x] das Polynom zu f modulo ρ gelesen. Beide Polynome mögen keine mehrfachen Nullstellen in den Zerfällungskörpern F bzw. F˜ ˜ = G (F˜/K) ˜ zu ˜ die zugehörigen Galoisgruppen, so ist G haben. Sind G = G (F /K) und G einer Untergruppe von G isomorph. Beweis. Wir bilden wie zuvor gf . Sei gf = ri=1 gi ∈ R1 [z], die Primfaktorzerlegung. Modulo ρ gelesen liefert das ˜f = g
r
˜ 1 [z]. ˜i ∈ R g
i=1
˜i . Da gf = σ ∈Σn (z − Θσ ) ist und Jedes τ ∈ Σn permutiert die gi , also auch die g ˜f = gf˜. die Koeffizienten von gf Polynome in den Koeffizienten von f sind, ist g ˜i nicht notwendig die Primfaktoren von gf˜. Sei also h ein irreduzibler Nur sind die g ˜. ˜ der Stabilisator von h in Σn . Sei nun ψ ∈ G ˜1 . Dann ist nach Satz 18.15 G Teiler von g ˜1 )ψ , g ˜1 ), also Dann permutiert ψ die gi , i = 1, . . . , r . Es ist h ein Teiler von ggT((g 8 ˜ ) = g . Da sowohl g als auch g aber paarweise verschiedene Nullstellen ist (g 1 ψ 1 f f˜ ˜ ⊆ G. haben, folgt nun (g1 )ψ = g1 . Also ist ψ ∈ G nach Satz 18.15. Das liefert G
Im Spezialfall der Polynome mit ganzzahligen Koeffizienten erhalten wir dann (siehe auch [42, Kapitel 2.9, Abschnitt 8])
Galoisgruppen
259
Korollar 18.17. Die Voraussetzungen seien wie in Satz 18.16 mit R = Z. Es sind ρ = pZ ˜ . Sei f˜ = f˜1 · · · f˜m eine Faktorisierung ˜ = Z/pZ = K für eine Primzahl p, K = Q und R von f˜ in (Z/pZ)[z] in irreduzible Faktoren f˜i mit grad f˜i = ni ≥ 1. Dann enthält Gf ein Produkt σ1 σ2 · · · σm von disjunkten ni -Zyklen σi . ˜ = σ zyklisch. Da G ˜ transitiv auf den Wurzeln von f˜i ist, Beweis. Nach Satz 8.18 ist G ˜ enthält G einen ni -Zyklus σi . Also ist σ = σ1 · · · σm . Nach Satz 18.16 ist σ ∈ G.
Indem wir Korollar 18.17 mit verschiedenen Primzahlen anwenden, können wir, einige Kenntnisse über die Untergruppen von Σn vorausgesetzt, manchmal recht einfach die Galoisgruppe eines Polynoms berechnen. Dies werden wir jetzt anwenden, um die volle Σn über Q als Galoisgruppe zu realisieren. Wir können n ≥ 4 annehmen und wählen f1 , f2 , f3 ∈ Z[x] normiert mit grad fi = n derart, dass (1) Ist f˜1 das Polynom f1 modulo 2, so ist f˜1 irreduzibel in (Z/2Z)[z]. (2) Ist f˜2 das Polynom f2 modulo 3, so ist f˜2 ein Produkt eines Linearfaktors und eines irreduziblen Polynoms von Grad n − 1 in (Z/3Z)[z]. (3) Ist f˜3 das Polynom f3 modulo 5, so ist f˜3 ein Produkt von einem quadratischen Polynom und einem oder zwei (verschiedenen) irreduziblen Polynomen ungeraden Grades in (Z/5Z)[z]. Wir setzen f = −15f1 + 10f2 + 6f3 ∈ Z[x]
und behaupten, dass G = Gf = Σn ist. Da f˜ = f˜1 modulo 2 ist, ist f irreduzibel und somit ist die Galoisgruppe G transitiv auf den Wurzeln. Da f˜ = f˜2 modulo 3 ist, enthält nach Korollar 18.17 die Gruppe G einen (n − 1)Zyklus. Da f˜ = f˜3 modulo 5 ist, enthält G das Produkt von einer Transposition σ und einem oder zwei Zyklen ungerader Länge nach Korollar 18.17. Also ist σ eine Potenz hiervon. Damit enthält G einen (n − 1)-Zyklus und eine Transposition. Nach Lemma 5.61(2) ist G Σn . Es bleibt zu zeigen, dass es die Polynome f1 , f2 , f3 , immer gibt. Dazu genügt es zu zeigen, dass es irreduzible Polynome über GF(p), p = 2, 3, 5, zu vorgegebenem Grad gibt. Sei m vorgegeben und sei K = GF(p m ). Nach Satz 5.40 ist K = GF(p)(a) für geeignetes a. Sei g = ma das Minimalpolynom von a über GF(p). Dann ist g irreduzibel und grad g = m. Damit haben wir bewiesen: Satz 18.18. Ist 0 < n ∈ N. Dann gibt es ein f ∈ Q[x] mit Gf Σn .
260
Galoisgruppen
Beispiele 18.19. (1) Wir wollen f mit Gf Σ6 angeben. Wir gehen dafür wie eben vor und beginnen mit f1 = x 6 + x + 1. Es ist f1 irreduzibel modulo 2. Wir wählen jetzt f2 = x 6 + 2x 2 + x . Es ist f2 ≡ (x 5 + 2x + 1)x (mod 3). Wir zeigen, dass x 5 + 2x + 1 irreduzibel ist. Offenbar hat x 5 + 2x + 1 keine Nullstelle. Sei x 5 + 2x + 1 = (x 2 + ax + b)(x 3 + cx 2 + dx + e). Dann ist x 5 + 2x + 1 = x 5 + (a + c)x 4 + (b + ca + d)x 3 + (e + ad + cb)x 2 + (ae + db)x + eb.
Also sind e = b und 2 = e(a + d), a = −c , b − a2 + d = 0, e + a(b − d) = 0. Diese Gleichungen haben aber keine Lösung. Somit ist x 5 + 2x + 1 irreduzibel. Schließlich wählen wir f3 = x 6 + x 4 + 2x 3 − x 2 + x . Wir erhalten die Zerlegung f3 ≡ (x 2 − 2)x(x 3 + 3x + 2) (mod 5). Beide x 2 − 2 und x 3 + 3x + 2 haben keine Nullstelle in GF(5), sind also irreduzibel. Nun setzen wir f = −15f1 + 10f2 + 6f3 = x 6 + 6x 4 + 12x 3 + 14x 2 + x − 15.
Dann ist Gf Σ6 . (2) Sei f = x 5 − x − 1. Wir betrachten f modulo 3. Es hat f keine Nullstelle in GF(3). Angenommen, f habe über GF(3) einen quadratischen Faktor. Der Zerfällungskörper dieses quadratischen Faktors ist dann GF(9). Also hat f in GF(9) eine Nullstelle. Andererseits ist nach Satz 8.18 GF(9) auch der Zerfällungskörper von x 9 − x . Dies liefert, dass x 5 − x − 1 und x 9 − x eine gemeinsame Nullstelle haben. Somit haben wir ggT(x 5 − x − 1, x 9 − x) ≠ 1.
Nun ist x 10 − x 2 = (x 5 − x)(x 5 + x).
Also ist ggT(x 5 − x − 1, x 5 − x) ≠ 1
oder ggT(x 5 − x − 1, x 5 + x) ≠ 1.
Da (x 5 − x − 1) − (x 5 − x) = −1
und (x 5 − x − 1) − (x 5 + x) = −2x − 1
ist, ist beides nicht möglich. Also ist f über GF(3) irreduzibel. Dann ist f auch über Z irreduzibel und somit ist Gf transitiv auf den Nullstellen von f , was liefert, dass ein 5-Zyklus (12345) in Gf enthalten ist.
Galoisgruppen
261
Wenn wir f modulo 2 lesen, so erhalten wir f2 = (x 2 +x +1)(x 3 +x 2 +1). Wegen dieser Zerlegung enthält Gf nach Korollar 18.17 ein Element vom Typ (ij)(klm). Damit enthält Gf auch die Transposition (ij). Nach Lemma 5.61(1) ist Gf Σ5 . Beachte, dass das Polynom x 5 − x − 1 vier nicht reelle Nullstellen besitzt. Somit ist Satz 10.11 nicht anwendbar. Wir wollen uns nun der Berechnung von Galoisgruppen allgemein zuwenden. Hierzu stellen wir ein Verfahren vor, das von R. Stauduhar [51] vorgeschlagen wurde. Dieses beruht darauf, dass wir Gf als Permutationsgruppe auf den Nullstellen betrachten und annehmen, dass wir genügend Information über Σgrad f haben. Wir wollen der Einfachheit halber annehmen: (1) f ∈ Z[x]. (2) f ist irreduzibel. (3) Der höchste Koeffizient von f ist Eins. Nur die zweite Bedingung ist wirklich wesentlich, da für f = f1 · f2 aus der Kenntnis von Gf1 und Gf2 nicht notwendig die von Gf folgt. Der zu beschreibende Algorithmus benutzt wesentlich Eigenschaften ganz algebraischer Zahlen, d. h. Nullstellen von Polynomen f mit (1)–(3). Diese wollen wir zunächst herleiten. Lemma 18.20. Seien p ∈ Z[x] ein normiertes Polynom und q ∈ Q mit p(q) = 0. Dann ist q ∈ Z. Beweis. Sei q =
a b
mit a ≠ 0, b > 1 und ggT(a, b) = 1. Ist p = x n + cn−1 x n−1 + · · · + c0 ,
so ist an = −b
n−1
cj aj bn−1−j .
j=0
Sei r ein Primteiler von b. Dann ist r ein Teiler von an . Also ist r | a, und dann ist r | ggT(a, b) = 1, ein Widerspruch. Satz 18.21. Seien u, v ganz algebraisch über Z, so sind auch u ± v , uv ganz algebraisch. Beweis. Wir machen zunächst eine Vorbemerkung. Ist u ganz algebraisch, so gibt es ein p ∈ Z[x] mit höchstem Koeffizienten 1, p=
n
ai x i ,
i=0
so dass p(u) = 0 ist. Also ist un = −
n−1 i=0
ai ui .
262
Galoisgruppen
Wir betrachten die Menge M ={
j
ci ui | ci ∈ Z, j ≤ n − 1}.
i=0
Es ist M = Z + Zu + Zu2 + · · · + Zun−1 eine Untergruppe von C+ und uM ⊆ M . Weiter ist 1 ∈ M . Wir können also sagen, dass, falls ein Element u ∈ C ganz algebraisch ist, es eine Untergruppe M von C+ mit M = Zu1 + · · · + Zuk , für geeignete u1 , . . . , uk ∈ C, uM ⊆ M und 1 ∈ M gibt. Wir zeigen nun die Umkehrung: Ist u ∈ C und gibt es eine Untergruppe M = Zu1 + · · · + Zuk von C+ mit 1 ∈ M und uM ⊆ M, so ist u ganz algebraisch.
(∗)
Da uM ⊆ M ist, gilt uui =
k
cij uj ,
1 ≤ i ≤ n, mit cij ∈ Z.
j=1
Wir betrachten das folgende lineare Gleichungssystem: (c11 − u)x1 +
c12 x2 + · · · +
c1k xk = 0
c21 x1 + (c22 − u)x2 + · · · +
c2k xk = 0
.. .
.. . ck1 x1 +
(L)
ck2 x2 + · · · + (ckk − u)xk = 0
Dieses System hat die Lösung (x1 , . . . , xk ) = (u1 , . . . , uk ). Da 1 ∈ M ist, ist eines der ui nicht Null. Also ist (u1 , . . . , uk ) ≠ (0, . . . , 0) und det(C − uE) = 0,
wobei C = (cij )i,j=1,...,k die Koeffizientenmatrix ist. Damit ist u Nullstelle des charakteristischen Polynoms fC , welches in Z[x] liegt, da alle Koeffizienten von C in Z sind. Das ist (∗). Nun können wir unseren Satz beweisen. Seien u, v ganz algebraisch. Nach (∗) gibt es Untergruppen N und M von C+ mit 1 ∈ M ∩ N , uM ⊆ M , vN ⊆ N und M = Zu1 + · · · + Zuk , N = Zv1 + · · · + Zvt . Wir setzen R=
t k
Zui vj .
j=1 i=1
Es ist R = Mv1 + · · · + Mvt = Nu1 + · · · + Nuk . Damit erhalten wir jetzt, dass {mn | m ∈ M, n ∈ N} in R enthalten ist. Dies liefert 1 ∈ R . Sind r1 , r2 ∈ R , so ist t rj = i=1 mij vi , j = 1, 2.
Galoisgruppen
263
Also ist r1 + r2 = ti=1 (mi1 + mi2 )vi ∈ R , da M eine Gruppe ist, und somit gilt mi1 + mi2 ∈ M für alle i. Genauso folgt −r1 ∈ R . Also ist R eine Untergruppe von C+ . Nun gilt (u + v)R = uR + vR = u(Mv1 + · · · + Mvt ) + v(Nu1 + · · · + Nuk ) = (uM)v1 + · · · + (uM)vt + (vN)u1 + · · · + (vN)uk ⊆ Mv1 + · · · + Mvt + Nu1 + · · · + Nuk = R + R = R
und (uv)R = uv(Nu1 + · · · + Nuk ) = u((vN)u1 + · · · + (vN)uk ) ⊆ u(Nu1 + · · · + Nuk ) = uR = (uM)v1 + · · · + (uM)vt ⊆ Mv1 + · · · + Mvt = R.
Nach (∗) sind somit u + v und uv ganz algebraisch. Definition 18.22. Seien fˆ ∈ Z[x1 , . . . , xn ] und G ≤ Σn . (1) Für σ ∈ Σn setzen wir σ (fˆ) = fˆ(xσ (1) , . . . , xσ (n) ). (2) Ist G = {σ | σ ∈ Σn , σ (fˆ) = fˆ}, so sagen wir, dass G zu fˆ gehört und umgekehrt. Lemma 18.23. Seien G, H ≤ Σn . Es gehöre G zu fˆ ∈ Z[x1 , . . . , xn ]. Dann ist |{π (fˆ) | π ∈ H}| = |H : H ∩ G|.
Beweis. Seien π1 , π2 ∈ H . Dann ist π1 (fˆ) = π2 (fˆ) genau für π2−1 π1 (fˆ) = fˆ, also π2−1 π1 ∈ G ∩ H . Dies ist genau für π1 (H ∩ G) = π2 (H ∩ G) erfüllt. Satz 18.24. Ist G ≤ Σn , so gibt es ein fˆ ∈ Z[x1 , . . . , xn ], so dass G zu fˆ gehört. Beweis. Wir setzen fˆ∗ = x1 x22 · · · xnn und fˆ = σ ∈G σ (fˆ∗ ). Sei π ∈ G. Dann ist π (fˆ) = π σ (fˆ∗ ) = σ (fˆ∗ ) = fˆ, σ ∈G
σ ∈G
da mit σ ∈ G auch π σ alle Elemente von G durchläuft. Sei andererseits π ∈ G, so wird π (fˆ) = σ (fˆ∗ ). σ ∈π G
Nun sind aber alle Summanden von π (fˆ) von denen von fˆ verschieden, da zu fˆ∗ die Gruppe id gehört, und nach Lemma 18.23 somit fˆ∗ genau n! viele Bilder hat.
264
Galoisgruppen
Definition 18.25. Seien G, H ≤ Σn . Es gehöre G zu fˆ ∈ Z[x1 , . . . xn ]. Ist W = G ∩ H , so sagen wir, dass fˆ zu W in H gehört. Lemma 18.26. Seien G, H ≤ Σn mit G ≤ H . Es gehöre fˆ ∈ Z[z1 , . . . , xn ] zu G in H . Ist π ∈ H , so gehört π (fˆ) zu π Gπ −1 in H . Beweis. Sei τ = π σ π −1 ∈ π Gπ −1 und σ ∈ G. Dann ist τ(π (fˆ)) = π σ π −1 (π (fˆ)) = π σ (fˆ) = π (fˆ).
Ist weiter τ ∈ H mit τ(π (fˆ)) = π (fˆ), so ist π −1 τπ (fˆ) = fˆ,
also ist π −1 τπ ∈ G. Sei wie in Lemma 18.26 G ≤ H ≤ Σn mit |H : G| = k. Weiter gehöre das Polynom fˆ ∈ Z[x1 , . . . , xn ] zu G. Ist {π1 , . . . , πk } ein Nebenklassenvertretersystem von G in H , so sind nach Lemma 18.23 die π1 (fˆ), . . . , πk (fˆ) paarweise verschieden. Die Idee unserer Vorgehensweise ist die folgende. Sei f ∈ Z[x] mit grad f = n. Seien r1 , . . . , rn die n verschiedenen Nullstellen von f in einem Zerfällungskörper, auf denen Gf operiert. Zu Gf gehört nach Satz 18.24 ein Polynom fˆ ∈ Z[x1 . . . , xn ]. Wir wollen das Polynom fˆ benutzen, um die Galoisgruppe Gf zu berechnen. Ein Problem hierbei ist, dass die Gruppe Gf nicht eindeutig in Σn festgelegt ist. So hängt sie z. B. von der Anordnung der Nullstellen ab. Sie ist also nur bis auf Konjugation bestimmt. Wenn wir nun die verschiedenen Bilder π (fˆ) betrachten, so ergibt sich das Problem, dass diese gleiche Werte auf den Nullstellen von f annehmen können, also auch keine kanonische Auszeichnung möglich ist. Sei z. B. f = x 4 − 2 mit den Nullstellen (r1 , r2 , r3 , r4 ) =
√ 4
√ √ √ 4 4 4 2, − 2, i 2, −i 2 .
Wir betrachten das Polynom fˆ(x1 , x2 , x3 , x4 ) = x1 x 2 + x2 x 2 + x3 x 2 + x4 x 2 . 2
3
4
1
Dann gehört fˆ zu (1234) = G. Weiter ist {id, (12), (13), (23), (123), (132)} ein Nebenklassenvertretersystem von G in Σ4 . Aber (23)fˆ(r1 , r2 , r3 , r4 ) = 0 = (123)fˆ(r1 , r2 , r3 , r4 ).
Wie vorher werden wir nun dem Polynom f ein Hilfspolynom q zuordnen, das wir dann zur Berechnung der Galoisgruppe Gf benutzen.
Galoisgruppen
265
Satz 18.27. Sei f ∈ Z[x] mit den Nullstellen r1 , . . . , rn in dieser Anordnung. Seien Gf die Galoisgruppe von f in Σn bezüglich obiger Anordnung und H eine transitive Untergruppe von Σn , die Gf enthält. Sei G eine Untergruppe von H mit Nebenklassenvertretersystem π1 , . . . , πk . Zu G gehöre ein fˆ ∈ Z[x1 , . . . , xn ]. Setzen wir qH,G (y) =
k
(y − πi (fˆ)(r1 , . . . , rn )),
i=1
so ist qH,G ∈ Z[y]. Beweis. Die ri sind ganz algebraische Zahlen. Anwendung von Satz 18.21 liefert, dass auch die πi (fˆ)(r1 , . . . , rn ) ganz algebraische Zahlen sind. Also sind die Koeffizienten von qH,G ganz algebraische Zahlen. Sei nun σ ∈ Gf ⊆ H . Dann ist σ (qH,G (y)) =
k
(y − σ πi (fˆ)(r1 , . . . , rn )).
i=1
Da die σ π1 , . . . , σ πk Nebenklassenvertreter von G in H sind, permutiert σ nur die Nullstellen von qH,G . Die Koeffizienten sind aber symmetrische Funktionen in den Nullstellen, bleiben somit unter σ fest. Damit liegen die Koeffizienten im Fixkörper von Gf , d. h. in Q. Nach Lemma 18.20 sind diese dann in Z. Satz 18.28. Seien die Bezeichnungen wie in Satz 18.27. Es ist fˆ(r1 , . . . , rn ) eine Nullstelle von qH,G . Ist darüber hinaus fˆ(r1 , . . . rn ) sogar eine einfache Nullstelle, so ist Gf genau dann in G enthalten, wenn fˆ(r1 , . . . , rn ) ∈ Z ist. Beweis. Ist π1 G = G, so ist π1 (fˆ)(r1 , . . . rn ) = fˆ(r1 , . . . , rn ). Also ist fˆ(r1 , . . . , rn ) eine Nullstelle. Sei nun Gf ⊆ G. Ist σ ∈ Gf , so ist σ ∈ G, also σ (fˆ) = fˆ. Damit ist fˆ(r1 , . . . , rn ) unter Gf fest, d. h. fˆ(r1 , . . . , rn ) ∈ Q. Mit Satz 18.21 und Lemma 18.20 erhalten wir fˆ(r1 , . . . , rn ) ∈ Z. Sei umgekehrt fˆ(r1 , . . . , rn ) ∈ Z. Dann ist fˆ(r1 , . . . , rn ) unter Gf fest. Da aber, wie wir wissen, fˆ(r1 , . . . , rn ) keine mehrfache Nullstelle ist, sind die πi (fˆ)(r1 , . . . , rn ) paarweise verschieden. Also ist G = {σ | σ ∈ H mit σ (fˆ)(r1 , . . . , rn ) = fˆ(r1 , . . . , rn )}.
Das liefert Gf ⊆ G. Dieser Satz und die beiden folgenden Korollare sind der Schlüssel zur Galoisgruppenberechnung.
266
Galoisgruppen
Korollar 18.29. Die Bezeichnungen seien wie in Satz 18.27. Es habe qH,G die einfache Nullstelle πi (fˆ)(r1 , . . . , rn ). Dann ist Gf genau dann in πi Gπi−1 enthalten, falls πi (fˆ)(r1 , . . . , rn ) ∈ Z ist. Beweis. Die Behauptung folgt sofort aus Satz 18.28 und Lemma 18.26. Korollar 18.30. Seien die Bezeichnungen wie in Satz 18.27 und Korollar 18.29 und sei πi (fˆ)(r1 , . . . , rn ) eine einfache Nullstelle von qH,G in Z für ein i. Wir ordnen die Nullstellen von f neu durch rj = rπi (j) . Dann ist fˆ(r1 , . . . , rn ) ∈ Z. Bezüglich der neuen Ordnung ist dann Gf ⊆ G. Wir wollen aus Satz 18.27–Korollar 18.30 einen Algorithmus zur Berechnung von Gf herleiten. Dazu setzen wir voraus, dass wir Df und df kennen (Lemma 18.6) und die Nullstellen von f mit hoher Genauigkeit bekannt sind. Diese seien r1 , . . . , rn . Bezüglich dieser Anordnung sei Gf ≤ Σn . Wir wählen zunächst eine von An verschiedene maximale transitive Untergruppe M von Σn . Es sei |Σn : M| = k und fˆ ∈ Z[x1 , . . . , xn ] sei eine zu M gehörende Funktion. Wir bestimmen qΣn ,M . Wie das gemacht werden kann, das werden wir später beschreiben. Dann testen wir qΣn ,M auf ganzzahlige Nullstellen. Gibt es keine, so ist nach Korollar 18.29 Gf in keinem Konjugierten von M enthalten. Nun wählen wir eine neue maximale Gruppe und fahren fort. Sei πi (fˆ)(r1 , . . . , rn ) eine ganzzahlige Nullstelle von qΣn ,M . Ist diese eine einfache Nullstelle, so ist Gf ⊆ π Mπ −1 nach Korollar 18.29. Nach Umordnung der Nullstellen ist Gf ⊆ M , siehe Korollar 18.30. Wir wählen nun M ∗ ⊂ M maximal transitiv und berechnen qM,M ∗ . Wir testen auf ganzzahlige Nullstellen und ordnen neu, usw. Dieses Verfahren kann aus mehreren Gründen abbrechen: (1) qA,B hat keine ganzzahligen Nullstellen für alle transitiven B . (2) Es gibt keine echten transitiven Untergruppen von A. In beiden Fällen ist dann Gf = A. (3) Alle ganzzahligen Nullstellen von qA,B sind mehrfach. Dann wählen wir eine neue Funktion fˆ für A und starten wieder. Die Diskriminante wird benutzt, um zu entscheiden, ob Gf in An liegt oder nicht. Wir werden natürlich auch nicht in jedem Schritt alle maximalen Untergruppen durchsuchen. Ist z. B. Gf M1 , aber Gf ⊆ M2 , so werden wir nie mehr Untergruppen in M1 ∩ M2 betrachten. Wir wollen nun noch einige Worte zur Berechnung der q s und der ganzzahligen Nullstellen sagen. Nach Satz 18.27 wissen wir, dass q ∈ Z[y] ist. Es genügt also, die Koeffizienten mit einer Genauigkeit kleiner als 1/2 zu berechnen. Da wir annehmen, dass wir die r1 , . . . , rn genügend genau kennen, ist dies möglich. Nun können wir die Nullstellen von q mit hoher Genauigkeit berechnen. Ist eine Nullstelle möglicherweise
Galoisgruppen
267
in Z, so kann sie gerundet werden und ein einfacher Test gibt dann die gewünschte Auskunft. Um das Verfahren wirklich durchzuführen, benötigen wir viel Information über die Gruppe Σn . Hier sind dem Verfahren natürlicherweise Grenzen gesetzt. Wir benötigen Vertreter für alle Konjugiertenklassen von transitiven Untergruppen von Σn , Nebenklassenvertreter und zu den Untergruppen gehörige Funktionen. Diese Informationen können ein für alle Mal abgespeichert werden, müssen also nicht immer neu berechnet werden. Für manche Gruppen benötigt man allerdings keine Information. Seien z. B. n = 5 und M ≤ Σ5 mit |M| = 20 und Gf ⊆ M . Ist Df ein Quadrat, so ist Gf ⊆ An ∩ M , sonst ist Gf = M . Es ist also niemals notwendig, qM,An ∩M zu berechnen. Wir wollen zwei Beispiele für n = 6 durchrechnen. Hierzu benötigen wir Informationen über die Untergruppen von Σ6 , Nebenklassenvertretersysteme und die zugehörigen Polynome. Diese Informationen sind in den folgenden Tabellen zusammengestellt. Das Schaubild zeigt die Inklusionen der einzelnen Untergruppen von Σ6 . Die Tabellen und Beispiele stammen aus [51].
Σ6
G48
G72
2 G36
1 G12
G18
G61
1 G36
G62
1 G24
2 G24
G120
3 G24
2 G12
G60
268
Galoisgruppen
Einbettung
Nebenklassenvertreter
G72 ⊂ Σ6
id, (2543), (236)(45), (25436), (25)(34), (2453), (25),(2345), (24536) (3645) id, (56) id, (12)(45), (56), (12)(465) id, (123),(132) id, (123),(132) id, (123), (132), (56), (123)(56), (132)(56) id, (24635), (26)(35), (354), (2345), (253), (345) (256)(34), (26435), (2346), (234), (25)(36), (2435), (24)(35), (26543) id, (12) id, (13)(24) id, (13)(24) id, (13), (23), (123), (132), (12)
2 G36 ⊂ G72
G18 ⊂ G72 G61 ⊂ G18 G62 ⊂ G18 G12 ⊂ G72 G48 ⊂ Σ6 1 G24 ⊂ G48 2 ⊂ G48 G24 3 2 G12 ⊂ G34
G120 ⊂ Σ6
Gruppe enthalten Funktion in G72
Σ6
x1 x2 x3 + x4 x5 x6
G72
(x1 − x2 )(x2 − x3 )(x3 − x1 )
1 G36 2 G36
Beschreibung (123), (456), (12), (45), (14)(25)(36) G72 ∩ A6 (123), (456), (12)(45), (14)(25)(36)
(x4 − x5 )(x5 − x6 )(x6 − x4 ) G18
2 G36
(x1 − x2 )(x2 − x3 )(x3 − x1 )
(123), (456), (14)(25)(36)
+(x4 − x5 )(x5 − x6 )(x6 − x4 ) 1 G12
2 G36
x1 x4 + x2 x5 + x3 x6
(123)(456), (12)(45), (14)(25)(36)
G61 G62
G18
x1 x4 + x2 x6 + x3 x5
(123)(465), (14)(25)(36)
G18
x1 x62 + x2 x42 + x3 x52
(123)(456), (14)(25)(36)
+x4 x32 + x5 x12 + x6 x22 G48
Σ6
x1 x2 + x3 x4 + x5 x6
(12), (34), (56), (135)(246), (13)(24)
1 G24
G48
(x1 + x2 − x3 − x4 )
(12)(34), (34)(56),
(x3 + x4 − x5 − x6 )
(12)(56), (135)(246), (14)(23)(56)
(x5 + x6 − x1 − x2 )(x1 − x2 ) (x3 − x4 )(x5 − x6 ) 2 G24
G48
(x1 + x2 − x3 − x4 )
(12)(34)(56), (34)(56), (56),
(x3 + x4 − x5 − x6 )
(135)(246)
(x5 + x6 − x1 − x2 ) 3 G24
G48 ∩ A6
2 G12
3 G24
G120
Σ6
(12)(34), (34)(56), (12)(56), (135)(246) (x1 x2 + x3 x5 + x4 x6 )
(126)(354), (12345), (2354)
(x1 x3 + x4 x5 + x2 x6 ) (x3 x4 + x1 x6 + x2 x5 ) (x1 x5 + x2 x4 + x3 x6 ) (x1 x4 + x2 x3 + x5 x6 ) G60
G120 ∩ A6
Galoisgruppen
269
Beispiele 18.31. (1) Sei f = x 6 − 42x 4 + 80x 3 + 441x 2 − 1680x + 4516. Es ist D < 0, also kein Quadrat. Insbesondere ist Gf A6 . Die Nullstellen von f sind in etwa r1 =
4,392 − 1,570i,
r2 = r¯1 ,
r3 = −5,490 − 0,780i,
r4 = r¯3 ,
r5 =
r6 = r¯5 .
1,098 − 2,355i,
Wir wählen zunächst die Gruppe G72 . Diese hat in Σ6 die folgenden Nebenklassenvertreter: π1 = id,
π4 = (25436),
π7 = (25),
π2 = (2543),
π5 = (25)(34),
π8 = (2345),
π3 = (236)(45),
π6 = (2453), ,
π9 = (24536),
π10 = (3645).
Wir setzen fˆ = x1 x2 x3 + x4 x5 x6 und erhalten q = y 10 + 80y 9 − 59166y 8 − 4390320y 7 + 1200615393y 6 + 88076918880y 5 + 7198940057856y 4 − 388801984512000y 3 + 20193311991398400y 2 + 595967000182784000y − 4689149328097280000.
Die Genauigkeit bei diesen Rechnungen war 2−96 . Dann hat q die einfache Nullstelle −80, was π3 (fˆ) entspricht. Also ist Gf ⊆ π3 G72 π3−1 .
Wir ordnen die Nullstellen neu, indem wir π3 benutzen: r1 = 4,392 − 1,570i,
r2 = −5,490 − 0,780i,
r3 = 1,098 + 2,355i,
r4 = r¯3 ,
r5 = r¯2 ,
r6 = r¯1 .
Dann ist Gf ⊆ G72 . 1 2 1 Es hat G72 die beiden maximalen Untergruppen G36 und G36 . Da G36 ⊆ A6 ist, 1 2 ist Gf G36 . Das Polynom zu G36 ist
q = (y + 137376)(y − 137376).
Also ist 2 Gf ⊆ G36 .
270
Galoisgruppen
2 Die Gruppe G36 enthält zwei Untergruppen G18 , die in G72 konjugiert sind, aber 2 nicht in G36 . Wir berechnen
qG72 ,G18 = (y + 360i)(y − 360i)(y + 648)(y − 648).
Damit erhalten wir Gf ⊆ (56)G18 (56).
Nun werden die Nullstellen wieder neu geordnet, indem wir die Permutation (56) benutzen: r1 = 4,392 − 1,570i,
r2 = −5,490 − 0,780i,
r3 = 1,098 + 2,355i,
r4 = r¯3 ,
r5 = r¯1 ,
r6 = r¯2 .
Dann ist Gf ⊆ G18 .
Es ist G61 ⊆ G18 und das zugehörige q ist q = y 3 − 1323y + 7722 = (y − 33)(y − 6)(y − 39).
Also ist Gf ⊆ G61 .
Da G61 minimal transitiv ist, ist Gf = G61 , d. h. Gf Σ3 .
(2) Es sei jetzt f = x 6 − 32x 4 + 160x 3 − 320x 2 + 384x − 256. Dann erhalten wir D = (635437056)2 . Also ist Gf ⊆ A6 .
Die Nullstellen sind näherungsweise r1 = 1,587,
r2 = 0,517 − 1,342i,
r3 = r¯2 ,
r4 = 2,534 − +1,927i,
r5 = r¯4 ,
r6 = −7,690.
Wir berechnen wieder qΣ6 ,G72 = y 10 + 160y 9 + 12544y 8 + 761856y 7 + 35586048y 6 + 1375731712y 5 + 39845888000y 4 + 935765999616y 3 + 15169824489472y 2 + 172073569746944y + 30786325577728.
Galoisgruppen
271
Dieses Polynom hat keine ganzzahligen Nullstellen. Also liegt Gf in keinem Konjugierten von G72 . Als Gruppe wählen wir nun G48 . Dann erhalten wir qΣ6 ,G48 = y 15 + 96y 14 + 4992y 3 + 171520y 12 + 4546560y 11 + 99237888y 10 + 1895104512y 9 + 31199136000y 8 + 448874414080y 7 + 5653059376768y 6 + 63843346677760y 5 + 606767209775104y 4 + 4504321181876224y 3 + 28162341078040576y 2 + 71405583642656768y.
Dieses Polynom hat die einfache Nullstelle 0, welche zu (23456)fˆ gehört, wobei fˆ = x1 x2 + x3 x4 + x5 x6 ist. Wir ordnen die Nullstellen neu, indem wir (23456) benutzen: r1 = 1,587,
r2 = 0,517 + 1,342i,
r3 = 2,534 + 1,927i,
r4 = r¯3 ,
r5 = −7,690,
r6 = r¯2 .
Dann ist Gf ⊆ G48 . 3 3 Also ist Gf ⊆ G48 ∩ A6 = G24 . Es gibt nur eine transitive Untergruppe von G24 , 2 die nicht in G72 liegt, nämlich G12 . Weiter ist
qG3
2 24 ,G12
= y 2 − 103424.
Dieses Polynom hat keine ganzzahlige Lösung. Das liefert 3 Gf = G24 ,
d. h. Gf Σ4 .
Das hier vorgeschlagene Verfahren ist von verblüffender Einfachheit. Im Wesentlichen müssen nur ganzzahlige Nullstellen von Polynomen berechnet werden. Der Nachteil ist sicherlich, dass man viele Polynome betrachten muss. Man kann dies natürlich durch Reduktion modulo verschiedener Primzahlen (siehe Korollar 18.17) abkürzen, da diese die Existenz gewisser Zyklen in Gf liefert und somit nicht mehr alle Untergruppen untersucht werden müssen. Wir wollen nun noch kurz ein Verfahren skizzieren, das mit nur einem Polynom auskommt. Die Idee ist wieder, dass Gf auf den Nullstellen {x1 , . . . , xn } operiert, also eine Untergruppe von Σn ist. Wir betrachten jetzt r -Teilmengen oder r -Folgen in {x1 , . . . , xn }, also Teilmengen oder Folgen mit r Elementen, und berechnen die
272
Galoisgruppen
Bahnlängen von Gf auf diesen. Mit dieser Information hoffen wir dann, Gf eindeutig unter den transitiven Gruppen vom Grad n identifizieren zu können. Natürlich wird man zunächst wieder die Diskriminante berechnen, was Gf ≤ An entscheidet. Die zentrale Frage ist, wie man die Bahnenlängen bestimmen kann, ohne die Gruppe zu kennen. Sei dazu g = e1 x1 + · · · + er xr ∈ Z[x1 , . . . , xn ], ei ≠ 0, i = 1, . . . , r . Sei g Σn die Bahn von g unter Σn , wobei Σn auf Z[x1 , . . . , xn ] operiert, indem die Indices der Variablen permutiert werden. Wieder betrachten wir Gf als Untergruppe von Σn . Sind alle ei gleich, so werden die Bahnlängen auf den r -Teilmengen von {x1 , . . . , xn } bestimmt; sind alle ei paarweise verschieden, so werden die Bahnlängen auf der Menge der r -Folgen in {x1 , . . . , xn } bestimmt. Um nun die Bahnenlängen zu berechnen, konstruieren wir ein Polynom R(g, f ) = (x − h(x1 , . . . , xn )). h∈g Σn
Gehört H zu g , so ist R(g, f ) = qΣn ,H . Hat R(g, f ) verschiedene Nullstellen, so ist die Operation von Gf auf diesen äquivalent zu der Operation von Gf auf g Σn . Also sind die Grade der irreduziblen Faktoren gerade die gesuchten Bahnlängen. Es ist also sehr wichtig, Faktorisierungen wirklich durchführen zu können. Algorithmen dazu haben wir in Kapitel 17 gesehen. Der Fall, dass R(g, f ) mehrfache Nullstellen hat, kann mit einer sogenannten Tschirnhaus Transformation behandelt werden, die die Irreduzibilität von f nicht verändert, also Gf erhält. Beispiel 18.32. (1) Sei n = 7. Die transitiven Untergruppen von A7 sind A7 ;
GL(3, 2);
G1 mit |G1 | = 7 · 3;
G2 mit |G2 | = 7.
Die Bahnenlängen auf den 3-Teilmengen sind in obiger Reihenfolge: 35;
7, 28;
7, 7, 21;
7, 7, 7, 7, 7.
Also können die Galoisgruppen mit den 3-Mengen unterschieden werden. Übrigens wäre dies mit den 2-Mengen nicht gegangen, da A7 und GL(3, 2) beide transitiv auf den 2-Mengen sind, d. h. nur eine Bahn haben. Sei jetzt f = x 7 − 7x 3 + 14x 2 − 7x + 1.
Wir wollen Gf berechnen. Es ist f irreduzibel nach Satz 1.48 (wir ersetzen x durch x − 1). Die Diskriminante ist 78 · 172 , also ist Gf ≤ A7 . Wir setzen g = x1 +x2 +x3 und berechnen R(g, f ), ein Polynom vom Grad 35. Faktorisierung dieses Polynoms liefert zwei irreduzible Faktoren vom Grad 7 und 28. Also ist Gf GL(3, 2). (2) Man kann dieses Verfahren auch dazu benutzen, neue Galoisgruppen zu realisieren [50]. Wir werden das eben betrachtete Polynom benutzen, um die affine
Galoisgruppen
273
Gruppe AG(3, 2), also eine Erweiterung einer elementar abelschen Gruppe der Ordnung acht mit der Gruppe GL(3, 2), als Galoisgruppe über Q zu realisieren. Sei f wie in (1). Die Nullstellen von f sind näherungsweise α1 ≈ −0,401 − 1,76i, α2 ≈ −1,99, ¯1, α3 = α α4 ≈ 1,06 − 0,544i, ¯4, α5 = α α6 ≈ 0,406, α7 ≈ 0,263.
Mit diesen Nullstellen erhält man Gf = (1, 2, 3,4, 5, 6, 7), (1, 3)(4, 5).
Wir betrachten h(x) = f (x 2 ). Eine Reduktion modulo 3 zeigt, dass h irreduzibel 1/2 ist. Seien {β1 , . . . , β14 } die Nullstellen von h mit β2i = αi und β2i−1 = −β2i , i = 1, . . . , 7. Bezüglich dieser Anordnung ist Gh eine Untergruppe von H = A, B, C mit A = (1, 3, 5, 7, 9, 11, 13)(2, 4, 6, 8, 10, 12, 14), B = (1, 5)(2, 6)(7, 9)(8,10)
und C = (1, 2).
Man überlegt sich leicht, dass H einen elementar abelschen Normalteiler N mit |N| = 27 , hat, so dass H/N GL(3, 2) ist. Faktorisierung von h modulo 59 liefert mit Korollar 18.17 ein t ∈ Gh vom Zyklentyp (2,34 ). Also ist t 3 eine Transposition. Nun müssen die Konjugierten von t genau die folgenden sein: {(2i − 1, 2i) : 1 ≤ i ≤ 7}.
Das liefert H = Gh . Es hat H eine Untergruppe K = A, B, D, E mit D = (1, 2)(3, 4)(5, 6)(7, 8)(9, 10)(11, 12)(13, 14), E = (1, 2)(7, 8)(11,12)(13, 14).
Es ist |N ∩ K| = 24 . Sei F der Zerfällungkörper von h und γ ∈ F mit Hγ = K . Also z. B. γ= β2i β2j β2k β2l . {i,j,k,l}∈Gf {1,4,6,7}
274
Galoisgruppen
Dann hat γ unter H genau 8 Bilder γ1 , . . . , γ8 . Hierbei ist γi = (2i − 1, 2i)γ , 8 i = 1, . . . , 7 und γ8 = γ . Wir setzen s = i=1 (x − γi ). Da H die γi permutiert, ist s ∈ Q[x]. Nun rechnet man u(x) = s(2x)/256 = x 8 + 14x 5 + 7x 4 − 14x 3 + 4x + 14 ) −1 nach. Weiter ist Gu = H Kσ eine Erweiterung einer abelschen Gruppe σ ∈H σ der Ordnung 8 mit GL(3, 2). Somit haben wir ein Polynom vom Grad 8 gefunden, dessen Galoisgruppe eine Erweiterung einer abelschen Gruppe E der Ordnung 8 mit GL(3, 2) ist.
Bemerkungen 18.33. (1) Der hier vorgestellte Algorithmus hat zum einen das Problem, dass man die transitiven Untergruppen von Σn kennen muss. Diese sind bis n = 31 bekannt [20]. Eine Weiterentwicklung des vorgestellten Algorithmus kann man in [13] und der Dissertation von Frau Geißler [14] finden. Hier werden die Abschätzungen der Nullstellen, die wir als komplexe Zahlen vorgenommen haben, durch p -adische Approximationen ersetzt. (2) Im Allgemeinen ist die Berechnung der Galoisgruppe Gf eines Polynoms f über K , K eine algebraische Erweiterung von Q, ein sehr schwieriges Problem. Es ist kein polynomieller Algorithmus bekannt. Sei M der Zerfällungskörper von f . Nach Satz 8.14 ist M = K(α) für ein α. Ist mα das Minimalpolynom von α, so können wir G (M/K) mit der Methode aus Aufgabe 14 in Kapitel 6 bestimmen. Das Hauptproblem liegt somit in der Bestimmung von M . Ein prinzipiell einfacher Algorithmus wäre der folgende: (a) Wir faktorisieren f über K mit der Methode aus Kapitel 17. (b) Sei g ein irreduzibler, nichtlinearer Faktor von f . Wir setzen L = K[x]/gK[x].
Nach Satz 3.13 hat g eine Nullstelle in L. Nun gehen wir wieder nach (a) mit L statt K . Der Algorithmus endet, wenn alle irreduziblen Faktoren von f linear sind. Er entspricht der Konstruktion des Zerfällungskörpers in Satz 3.14. Man kann zeigen, dass die Laufzeit dieses Algorithmus durch ein Polynom in |Gf | beschränkt ist. Leider wissen wir nur, dass |Gf | ≤ n! ist, mit n = grad f . Also haben wir, dass die Laufzeit durch ein Polynom in n! beschränkt ist, was den Algorithmus für praktische Anwendungen uninteressant macht. Die Schwierigkeit scheint von den großen Gruppen zu kommen. Dies ist allerdings nicht ganz richtig. Die größten möglichen Gruppen sind An und Σn . Es gibt einen sehr guten Algorithmus, der testet, ob Gf An oder Σn ist.
Galoisgruppen
275
Sei n ≥ 8. Wir wenden den eben beschriebenen Algorithmus zur Berechnung des Zerfällungskörpers M von f sechsmal an. Das liefert uns Körper L1 , . . . , L6 . Sei nun Gf = An oder Σn . Dann muss zunächst f irreduzibel sein, also haben wir [L1 : K] = n. Ist α1 eine Nullstelle in L1 , so setzen wir f1 = f /(x − α1 ). Es ist M der Zerfällungskörper von f1 über L1 und f1 hat Galoisgruppe An−1 bzw. Σn−1 . Also gilt [L2 : L1 ] = n − 1. Nun bilden wir f2 = f1 /(x − α2 ) mit einer Nullstelle α2 von f2 usw. Also gilt [L6 : K] = [L6 : L5 ][L5 : L4 ][L4 : L3 ][L3 : L2 ][L2 : L1 ][L1 : K] = (n − 5)(n − 4)(n − 3)(n − 2)(n − 1)n.
Sei nun umgekehrt [L6 : K] = n(n − 1)(n − 2)(n − 3)(n − 4)(n − 5).
Dann ist Gα1 = {g | g ∈ Gf : g(α1 ) = α1 } die Galoisgruppe von f1 . Diese ist noch transitiv auf den Nullstellen von f1 , da f1 irreduzibel ist. Allgemein gilt Gα1 ,α2 ,...,αi = {g | g ∈ Gf , g(αj ) = αj , 1 ≤ j ≤ i}
ist transitiv auf den Nullstellen von fi , i ≤ 6. Das liefert aber, dass Gf transitiv auf den 6-Tupeln von Nullstellen von f ist. Man nennt eine solche Gruppe auch 6-fach transitiv. Ein tiefliegender Satz der Gruppentheorie, der die Klassifikation der endlichen einfachen Gruppen benutzt, besagt, dass jede endliche 6-fache transitive Gruppe vom Grad n entweder An oder Σn ist. Also haben wir Gf An oder Σn genau für [L6 : K] = n(n − 1)(n − 2)(n − 3)(n − 4)(n − 5).
Ob Gf An oder Σn ist, können wir nach Korollar 18.9 mit der Diskriminante testen. Man kann das eben beschriebene Verfahren sogar noch verbessern, indem man nur die ersten beiden Schritte durchführt. Erhält man dann nach zwei Schritten [L2 : K] = n(n − 1), so ist die Galoisgruppe 2-transitiv. Eine Folgerung aus der Klassifikation der endlichen einfachen Gruppe ist, dass man eine vollständige Liste der 2-transitiven Gruppen hat [7]. Da zusätzlich noch n bekannt ist, gibt es dann nur noch wenige Möglichkeiten, die man leicht testen kann. Die Motivation für die Galoistheorie war die Frage nach der Auflösbarkeit durch Radikale, also nach der Auflösbarkeit von Gf . In der Tat gibt es einen polynomiellen Algorithmus, der dies entscheidet. Wie wir gesehen haben, ist der oben angegebene Algorithmus zur Berechnung des Zerfällungskörpers von f nicht effektiv. Dies ändert sich aber, wenn wir irgendeine Abschätzung der Form |Gf | ≤ p(n), p ein Polynom, haben. Nehmen wir an, dass f irreduzibel und Gf auflösbar ist. Dann ist Gf eine auflösbare transitive Gruppe von Grad n. Es kann allerdings vorkommen, dass kein Polynom p mit |Gf | ≤ p(n) existiert, wie das Beispiel der Sylow-2-Untergruppe
276
Galoisgruppen
von Σn mit n = 2k zeigt. Andererseits gibt es ein Resultat von Palfy [41], das von L. Pyber und A. Shalev auf Gruppen verallgemeinert wurde, die keine alternierende Gruppe Ad involvieren [43]. Bei dieser Verallgemeinerung hängt der Grad des Polynoms dann allerdings von d ab. Das Resultat von Palfy besagt: Ist Gf auflösbar und operiert G primitiv auf den Nullstellen von f , so gibt es ein Polynom q(n) mit |Gf | ≤ q(n). Hierbei bedeutet primitive Operation, dass Gα = {g | g ∈ Gf , g(α) = α},
f (α) = 0,
eine maximale Untergruppe von Gf ist. Nach Aufgabe 8 in Kapitel 8 ist das äquivalent zu: Ist K ⊆ L ⊆ K(α), so ist L = K oder L = K(α).
( ∗)
Es gilt also, einen Turm von Körpern zu konstruieren, so dass K ⊂ K1 ⊂ K2 ⊂ · · · ⊂ Kr = K(α)
und Ki ⊂ Ki+1 die Bedingung (∗) erfüllt. Denn Gf ist auflösbar genau dann, wenn der normale Abschluss von Ki ⊂ Ki+1 eine auflösbare Galoisgruppe hat. Dazu muss nur Kr −1 ⊂ K(α) gefunden werden, so dass das Paar Kr −1 , Kr (∗) erfüllt. Danach können wir per Induktion fortschreiten. Dies sieht konkret wie folgt aus. Wir faktorisieren f über K(α). Sei g ein irreduzibler Faktor von f mit g ≠ x − α. (a) Ist g = x − β, so hat K(α) einen K -Automorphismus σ mit σ (α) = β. Wir setzen dann Lg = k (σ ).
(b) Ist grad g > 1, so sei β eine Nullstelle von g in einem Erweiterungskörper von K(α). Dann setzen wir Lg = K(α) ∩ K(β).
Mit der Galoistheorie folgt, dass die Lg alle maximalen Teilkörper von K(α) enthalten. Wir haben hierzu nur zu zeigen, dass die Ug = G (Lg ) alle Obergruppen von U enthalten, in denen U maximal ist. Dies folgt aber aus der folgenden Bemerkung: Ist U ⊂ W und U maximal in W , dann ist entweder U W und somit ist W = U, σ für ein σ ∈ W \U , was (a) entspricht, oder W = U, σ −1 Uσ für ein σ ∈ W \U , was (b) entspricht. (3) In Beispiel 6.26 hatten wir gesehen, dass jede endliche Gruppe Galoisgruppe einer geeigneten Körpererweiterung ist. Wie sieht das aber aus, wenn wir als Grundkörper Q festlegen? Sei also G eine endliche Gruppe. Gibt es eine Galoiserweiterung K von Q mit G (K/Q) G? Diese Frage ist bisher noch völlig offen. Für auflösbare Gruppen wurde sie positiv durch Shafarevich [49] beantwortet. Eine ganze Reihe von Mathematikern
Galoisgruppen
277
(besonders Matzat, Thompson, Beyli, Völklein, Fried und viele andere, die hier nicht erwähnt wurden) arbeiten daran, einfache Gruppen als Galoisgruppen zu realisieren. Viele Gruppen, aber bei weitem nicht alle, konnten bereits realisiert werden. Diese Untersuchungen führen zu tiefliegenden Fragestellungen über die Darstellungstheorie und die innere Struktur der endlichen einfachen Gruppen. Sollte man alle einfachen Gruppen realisieren können, so ist es trotzdem noch ein nichttriviales Problem, aus einfachen Gruppen zusammengesetzte Gruppen zu realisieren. Weitere Informationen zu diesem Themenkreis kann man in dem Buch von H. Völklein [57] finden. Die Galoistheorie ist, insbesondere wegen der enormen Fortschritte in der Gruppentheorie, ein sehr aktives Forschungsgebiet.
Übungen 1.
Das Polynom x 4 + bx 2 + cx + d habe vier paarweise verschiedene Nullstellen a1 , . . . , a4 . Seien α1 = a1 a2 + a3 a4 , α2 = a1 a3 + a2 a4 , α3 = a1 a4 + a2 a3 und σi , i = 1, . . . , 4, die elementarsymmetrischen Polynome in den aj , j = 1, . . . , 4. Zeige: −α1 α2 α3 = −σ32 + 4σ2 σ4 .
2. 3.
4. 5. 6.
7. 8. 9.
Schreibe i≠j≠k≠i xi2 xj2 xk ∈ Z[x1 , . . . , xn ], n ≥ 5, als Ausdruck in den elementarsymmetrischen Polynomen. Berechne die Galoisgruppe über Q von (a) x 4 + 3x 3 − 5x − 2, (b) x 4 + 8x + 12, (c) x 4 − 4x + 2. Berechne die Galoisgruppe über Q für f = x 4 + 4px + 3p , p Primzahl. Berechne die Diskriminante von f = x 5 + ax + b. Bestimme den Isomorphietyp der Galoisgruppe über Q für (a) x 5 + 20x + 16, (b) x 5 + 719x − 2876. Sei k ∈ Z mit k ≡ ±1 (mod 3) und k ≡ 1 (mod 7). Setze m = 5k2 − 1. Dann hat das Polynom f = x 5 + 5mx + 4m über Q eine zu A5 isomorphe Galoisgruppe. Bestimme ein Polynom in Q[x] mit einer zu Σ7 isomorphen Galoisgruppe. Das Polynom f habe die paarweise verschiedenen Nullstellen a1 , . . . , an . Zeige: (a) Df = (−1)n(n−1)/2 n i=1 f (ai ). (b) Sei p eine Primzahl. Dann ist φp + (x − 1)φp = px p−1 .
(c) Sei f = φp , p > 2, p Primzahl. Dann ist Df = (−1)(p−1)/2 p p−2 .
10. Gib eine notwendige und hinreichende Bedingung dafür, dass f = x 4 + px 3 + qx 2 + r x + s
eine Nullstelle α ∈ C hat, so dass auch −α eine Nullstelle ist.
278
Galoisgruppen
Sei f ∈ R[x] mit grad f = 4. (a) Ist f (a) ≠ 0 für alle a ∈ R, so ist Df > 0. (b) Ist Df < 0, so hat f genau zwei reelle Nullstellen. 12. Seien α, β, γ die Nullstellen von
11.
x 3 + px 2 + qx + r .
Finde ein kubisches Polynom, dessen Nullstellen α2 , β2 , γ 2 sind, und gib dessen Koeffizienten als Funktionen in p , q , r an. 13. Sei f ∈ Q[x]. In C gelte: Ist f (α) = 0, so ist auch f (α−1 ) = 0. (a) Zeige: |Gf | ≤ 2m m!, wobei grad f = 2m oder 2m + 1 ist. (b) Bestimme die möglichen Galoisgruppen von f für grad f = 4. 14. Bestimme die auf den 3-Teilmengen von {1,2,3,4,5,6} transitiven Untergruppen von A6 und ihre Bahnlängen. 15. Bestimme die auflösbaren transitiven Untergruppen von A8 . Welche sind primitiv? 16. Bestimme die primitiven Untergruppen von Σ5 . 17. Bestimme alle maximalen Untergruppen von Σ5 .
19 Angeordnete Körper In diesem Kapitel wollen wir neben der reinen algebraischen Betrachtung von Körpern, wie es bisher geschehen ist, noch einer mehr analytischen Betrachtungsweise nachgehen. Im Zentrum stehen die sog. formal reellen Körper. Das Standardbeispiel dafür sind die reellen Zahlen R. Wir werden in Analogie zu algebraisch abgeschlossenen Körpern auch reell abgeschlossene Körper behandeln und zeigen, dass der algebraische Ab√ schluss eines reell abgeschlossenen Körpers K von der Form K( −1) ist. Die Theorie der formal reellen Körper, d. h. Körper, in denen −1 keine Summe von Quadraten ist, geht auf E. Artin und O. Schreier zurück [5]. Sie war ein wesentlicher Baustein bei der Lösung von Hilberts 17. Problems durch E. Artin 1927, dessen Aussage ist, dass jede rationale Funktion f (x1 , . . . , xn ) mit reellen Koeffizienten, die für alle (a1 , . . . , an ), für die die Funktion f definiert ist, stets f (a1 , . . . , an ) ≥ 0 erfüllt, eine Summe von Quadraten ist. Die im Folgenden gegebene Darstellung der Theorie der formal reellen Körper orientiert sich mehr oder weniger an derjenigen in [22] und [23]. Definition 19.1. Ein angeordneter Körper K ist ein Körper mit einer Teilmenge P (genannt Menge der positiven Elemente), so dass die folgenden Eigenschaften erfüllt sind: (1) 0 ∈ P . (2) Ist 0 ≠ a ∈ K , so ist entweder a ∈ P oder −a ∈ P . (3) Sind a, b ∈ P , so auch a + b und ab. Wir schreiben dann auch (K, P ), wenn wir P besonders hervorheben wollen. Setzen wir N = {−a | a ∈ P },
so erhalten wir K = P ∪ {0} ∪ N mit P ∩ N = ∅.
Es ist zwar N unter Addition abgeschlossen, aber nicht unter Multiplikation, da aus a, b ∈ N dann −a, −b ∈ P und ab = (−a)(−b) ∈ P folgt. Wie man sieht, ist die additive Gruppe von K eine angeordnete Gruppe im Sinne von Definition 15.7. Definition 19.2. Ist (K, P ) ein angeordneter Körper, so definieren wir für a, b ∈ K : a < b, falls b − a ∈ P ist.
Es gilt offenbar, dass für a, b ∈ K stets a < b, b < a oder a = b gilt. Also ist a < b eine Ordnungsrelation auf K .
280
Angeordnete Körper
Diese Definition zeigt, warum wir von angeordneten Körpern reden. Es ist R mit P = R+ = {r | r ∈ R, r > 0} ein angeordneter Körper. Dabei ist < die übliche Ordnung. Für die in Definition 19.2 eingeführte Ordnung gelten die folgenden Regeln: Lemma 19.3. Ist (K, P ) ein angeordneter Körper und sind a, b, c ∈ K , so gelten: (1) Ist a > b, so ist a + c > b + c . (2) Ist a > b, so ist ap > bp für alle p ∈ P . (3) Ist a > b, so ist −b > −a. (4) 1 > 0. (5) Ist a > 0, so ist a−1 > 0. (6) Ist a > b > 0, so ist b−1 > a−1 > 0. Beweis. (1) Es ist (a + c) − (b + c) = a − b ∈ P . (2) Es ist ap − bp = (a − b)p . Da a − b ∈ P ist und P multiplikativ abgeschlossen ist, ist (a − b)p ∈ P . (3) Es ist a − b ∈ P . Dann ist auch (−b) − (−a) ∈ P . (4) Es ist −1 ∈ P ∪ N , also ist 1 = (−1)(−1) ∈ P , d. h. 1 > 0. (5) Wäre a−1 < 0, so wäre nach (3) −a−1 > 0 und dann −(aa−1 ) > 0, also −1 ∈ P , ein Widerspruch zu (4). (6) Es ist a = (a − b) + b ∈ P . Somit ist a > 0. Nach (5) ist dann auch a−1 > 0. Angenommen a−1 − b−1 ∈ P . Dann ist auch b − a = a(a−1 − b −1 )b ∈ P . Da aber a − b ∈ P ist, ist dies ein Widerspruch. Somit ist b−1 > a−1 > 0. Nun können wir wie in der Analysis einen Betrag einführen. Definition 19.4. Sei (K, P ) ein angeordneter Körper. Wir setzen |a| = a für a > 0 oder a = 0 und |a| = −a für a < 0. Lemma 19.5. Seien (K, P ) ein angeordneter Körper und a, b ∈ K . Dann gilt |a + b| ≤ |a| + |b|
und |ab| = |a||b|.
Beweis. Wir zeigen zuerst |ab| = |a||b|. Sind a, b ∈ P oder a, b ∈ N , so ist ab ∈ P . Also ist |ab| = ab und |a| = ±a, |b| = ±b, wobei die Vorzeichen gleich sind, d. h. ab = |a||b|. Sind a ∈ P und b ∈ N , so ist −b ∈ P , also −ab ∈ P , d. h. ab ∈ N . Dann ist −ab = |ab| = a(−b) = |a||b|. Wir zeigen nun |a + b| ≤ |a| + |b|. Offenbar ist |a| = |−a|. Also können wir annehmen, dass a + b ∈ P ist. Dann ist (|a| + |b|) − |a + b| = |a| + |b| − (a + b). Sind a, b ∈ P , so ist |a| = a, |b| = b , also |a| + |b| − |a + b| = 0 und wir sind fertig. Somit können wir a ∈ P und b ∈ N annehmen. Nun ist |a| = a und |b| = −b. Also ist |a| + |b| − |a + b| = a + (−b) − (a + b) = |b| + |b|. Da |b| ∈ P ist, ist |b| + |b| ≥ 0 und wir sind wieder fertig.
Angeordnete Körper
281
Lemma 19.6. Sei K ein Körper mit einer Ordnungsrelation <, die Lemma 19.3(1) und (2) erfüllt. Wir setzen P = {p | p ∈ K, p > 0}.
Dann ist (K, P ) ein angeordneter Körper. Beweis. Da p > 0 ist für p ∈ P , ist 0 ∈ P . Sei 0 ≠ a ∈ K . Ist a ∈ P , so ist a < 0. Dann ist nach Lemma 19.3(1) 0 = a + (−a) < −a, also ist −a ∈ P . Sind a, b > 0, so ist nach Lemma 19.3(2) dann ab > 0b = 0, also ist ab ∈ P . Definition 19.7. (1) Sei (K, P ) ein angeordneter Körper und K ⊆ K ein Teilkörper. Mit P = P ∩ K wird (K , P ) zu einem angeordneten Körper. Wir nennen P die von P auf K induzierte Ordnung. (2) Seien (K, P ) und (L, Q) angeordnete Körper. Ein Isomorphismus σ : K → L heißt Ordnungsisomorphismus, falls σ (P ) ⊆ Q gilt. Bemerkung 19.8. Seien (K, P ) und (L, Q) angeordnete Körper und σ : K → L ein Ordnungsisomorphismus. Es ist σ (0) = 0. Ist p ∈ P , so ist −p ∈ N . Also haben wir 0 = σ (p) − σ (p) = σ (p) + σ (−p).
Da σ (p) ∈ Q ist, erhalten wir −σ (p) ∈ Q, d. h. σ (−p) ∈ Q. Das liefert dann σ (N) ∩ Q = ∅. Da σ ein Isomorphismus ist, folgt nun σ (P ) = Q. Lemma 19.9. Sei (K, P ) ein angeordneter Körper. (1) Sind a1 , . . . , ar ∈ K \ {0}, so ist ri=1 a2i ≠ 0. (2) char K = 0. (3) Es ist −1 ≠ a2 für alle a ∈ K . (Insbesondere ist C nicht angeordnet.) Beweis. (1) Ist a ≠ 0, so ist a2 ∈ P , also ist ri=1 a2i ∈ P . Insbesondere haben wir r 2 i=1 ai ≠ 0. (2) Ist char K = p > 0, so ist 0 = 1 + .. . + 1 = 12 + . . . + 12 ein Widerspruch p−mal zu (1). (3) Sei −1 = a2 . Dann ist 12 + a2 = 0, ein Widerspruch zu (1). Definition 19.10. Sei K ein Körper. (1) Wir nennen K formal reell, falls aus ri=1 a2i = 0, mit a1 , . . . , ar ∈ K , stets ai = 0 für alle i folgt. (2) Wir setzen (K) = { ri=1 a2i | r ∈ N, ai ∈ K}.
282
Angeordnete Körper
Bemerkung 19.11. Es ist K genau dann formal reell, wenn −1 ∈ (K) ist. Nach Lemma 19.9 ist jeder angeordnete Körper formal reell. Unser nächstes Ziel wird sein zu zeigen, dass jeder formal reelle Körper auch angeordnet ist. Lemma 19.12. Sei K ein Körper. Dann ist (K) unter Multiplikation und Addition ab geschlossen. Ist 0 ≠ β ∈ (K), so ist auch β−1 ∈ (K). Ist K nicht formal reell und char K ≠ 2, so ist (K) = K . Beweis. Die erste Aussage ist klar. Sei β = ri=1 a2i ∈ (K). Dann ist β−1 = β(β−1 )2 =
r
(ai β−1 )2 ∈
(K).
i=1
Ist K nicht formal reell, so ist −1 ∈ (K). Für jedes α ∈ K gilt dann & & % % 1+α 2 1−α 2 α= + (−1) ∈ (K). 2 2
Entsprechend zur Definition 3.15 (algebraisch abgeschlossen) wollen wir jetzt auch reell abgeschlossen definieren. Definition 19.13. Ein Körper K heißt reell abgeschlossen, falls K formal reell ist und keine echte algebraische Erweiterung von K formal reell ist. Satz 19.14. Ist K reell abgeschlossen, so ist jedes α ∈ K entweder ein Quadrat oder das Negative eines Quadrates. √ Beweis. Sei α ∈ K, α kein Quadrat. Wir setzen L = K( α). Dann ist L ≠ K . Nach Annahme ist L nicht formal reell. Also gibt es βi , γi ∈ K, i = 1, . . . , n, wobei nicht alle n √ βi , γi gleich Null sind, mit i=1 (βi + γi α)2 = 0. Das liefert n
n √ 2βi γi ) α = 0. β2i + γi2 α + (
√
i=1
i=1
n
n
Da α ∈ K ist, folgt 2βi γi = 0 und
i=1
(β2i + γi2 α) = 0.
i=1
n 2 2 Ist n i=1 γi = 0, so ist auch i=1 βi = 0. Da K formal reell ist, ist dann γi = 0 = βi n für alle i. Also ist i=1 γi2 ≠ 0. Dann ist % &−1 n n −α = β2i γi2 . i=1
i=1
Nach Lemma 19.12 ist −α ∈ (K). Da −1 ∈ (K) ist, folgt α ∈ (K). Somit haben wir gezeigt: Ist α kein Quadrat, so auch keine Summe von Quadraten. Da −α ∈ (K) ist, ist also −α ein Quadrat.
Angeordnete Körper
283
Satz 19.15. Sei K reell abgeschlossen. Dann gibt es genau ein P ⊂ K , so dass (K, P ) ein angeordneter Körper ist. Jeder Automorphismus von K ist ein Ordnungsisomorphismus. Ist weiter α ∈ K mit α > 0, so gibt es ein β ∈ K mit α = β2 . Beweis. Sei P = {a2 | a ∈ K, a ≠ 0}. Nach Satz 19.14 folgt aus α ∈ P dann −α ∈ P . Also gilt Definition 19.1(2). Seien nun α = a2 und β = b2 beide in P . Ist α + β ∈ P , so ist α + β = −ε2 , d. h. a2 + b2 + ε2 = 0, ein Widerspruch. Also ist P addidiv abgeschlossen. Da a2 b2 = (ab)2 ist, gilt auch Definition 19.1(3) . Somit ist (K, P ) ein angeordneter Körper. Sei P ⊂ K , so dass (K, P ) ein angeordneter Körper ist. Ist α ∈ P , so gibt es ein β ∈ K mit α = β2 . Da sowohl für x, y ∈ P also auch x, y ∈ P , x ≠ 0 ≠ y , stets xy ∈ P gilt, folgt nun α ∈ P . Damit ist P ⊆ P . Sei a ∈ P \P . Dann ist −a ∈ P , also ist −a ∈ P . Aber es ist entweder a ∈ P oder −a ∈ P , ein Widerspruch. Dies liefert P = P . Sei σ ein Automorphismus von K . Dann ist σ (a2 ) = σ (a)2 . Somit ist σ (P ) = P . Ist nun a > b, d. h. a − b ∈ P , so ist σ (a − b) ∈ P , d. h. σ (a) > σ (b). ¯ einen reell abgeschlossenen Teilkörper R Satz 19.16. Sei K formal reell. Dann enthält K mit K ⊆ R . ¯ . Da K ∈ S ist, ist Beweis. Sei S = {L | K ⊆ L, L ein formal reeller Teilkörper von K} ˜ ˜ formal reell ist. S ≠ ∅. Sei K eine Kette in S. Wir setzen L = L und zeigen, dass L L∈K
Sei n
˜. xi2 = 0 mit xi ∈ L
i=1
Dann gibt es L1 , . . . , Ln ∈ K mit xi ∈ Li , i = 1, . . . , n. Da K eine Kette ist, können wir xi ∈ Ln für alle i = 1, . . . , n annehmen. Aber Ln ist formal reell und dann ist ˜ ist formal reell, also L ˜ ∈ S. Nach dem Lemma von Zorn xi = 0 für alle i, d. h. L gibt es ein maximales Element R in S. Sei R nicht reell abgeschlossen. Dann gibt es ˜ von R , die formal reell ist. Nach Lemma 19.9 und eine algebraische Erweiterung R ˜⊆K ¯ annehmen, was der Maximalität von R widerspricht. Korollar 3.22 können wir R Also ist R reell abgeschlossen. Korollar 19.17. Jeder formal reelle Körper kann in einen reell abgeschlossenen Körper eingebettet werden. Korollar 19.18. Jeder formal reelle Körper ist angeordnet. ¯ einen reell abgeBeweis. Sei K ein fomal reeller Körper. Nach Satz 19.16 enthält K schlossenen Teilkörper R mit K ⊆ R . Nach Satz 19.15 gibt es ein P , so dass (R, P ) ein angeordneter Körper ist. Dann ist (K, P ∩ K) ein angeordneter Körper.
284
Angeordnete Körper
Beispiel 19.19. (1) Wir haben in Satz 19.15 gesehen, dass jeder reell abgeschlossene Körper genau eine Ordnung hat. Dies gilt für formal reelle Körper im Allgemeinen nicht. √ Sei K = Q( 2) ⊆ R. Dann ist K formal reell. Wir definieren auf K eine Ordnung >1 durch: √ √ Es ist a + b 2 >1 0 in K genau dann, wenn a + b 2 > 0 in R gilt. Hierbei ist > die übliche Ordnung auf R. Wir definieren nun eine weitere Ordnung >2 auf K durch: √ √ Es ist a + b 2 >2 0 in K genau dann, wenn a − b 2 > 0 in R ist. √ √ Da in R stets x − y 2 > 0 oder −x + y 2 > 0 für x ≠ 0 oder y ≠ 0 gilt, gilt √ √ auch x + y 2 >2 0 oder −(x + y 2) >2 0. √ √ √ √ Seien nun x + y 2 und z + t 2 in K mit x − y 2 > 0 und z − t 2 > 0. Dann √ √ √ ist (x + z) − (y + t) 2 > 0. Also ist (x + y 2) + (z + t 2) >2 0. Weiter ist √ √ √ 0 < (x − y 2)(z − t 2) = (xz + 2yt) − (zy + xt) 2. √ √ Also ist (x + y 2)(z + t 2) >2 0. √ √ Damit ist >2 eine Ordnung. Es ist >1 ≠>2 , da 2 >1 0 aber 2 >2 0 ist. (2) Nicht nur reell abgeschlossene Körper besitzen genau eine Ordnung. Seien dazu K = Q und P ⊆ K , so dass (K, P ) ein angeordneter Körper ist. Wegen 1 = 12 ist 1 ∈ P . Dann ist N ⊆ P . Nach Lemma 19.3(5) ist dann 1/z ∈ P , für z ∈ N. Da P mulitplikativ abgeschlossen ist, ist dann a/b ∈ P mit a, b > 0. Also ist P = {r ∈ Q | r > 0}. Damit ist die Ordnung eindeutig bestimmt. Wir wollen nun zeigen, dass sich reell abgeschlossene Körper K wie R verhalten. Insbesondere gibt es eine Erweiterung L von Grad zwei, die algebraisch abgeschlossen ist. Es verhält sich somit K zu L wie R zu C. Satz 19.20. Sei K reell abgeschlossen. Dann hat jedes Polynom f ∈ K[x] von ungeradem Grad eine Nullstelle in K . Beweis. Sei grad f = n. Wir beweisen den Satz durch Induktion nach n. Für n = 1 ist die Aussage klar. Sei ab jetzt n > 1. Ist f reduzibel, so hat f einen Faktor ungeraden Grades, der per Induktion eine Nullstelle hat. Also können wir annehmen, dass f irreduzibel ist. Sei u eine Nullstelle von f in einem Zerfällungskörper und L = K(u). Da f irreduzibel ist, ist L ⊃ K . Weiter ist L nicht formal reell. Jedes Element aus L ist ein Polynom in u mit Koeffizienten in K vom Grad höchstens n − 1, wobei n = [L : K] ist. Also gibt es i ∈ K[x], i = 1, . . . , n, mit n i=1
i (u)2 = −1.
Angeordnete Körper
285
2 Dann ist u eine Nullstelle von n i=1 i (x) + 1 ∈ K[x]. Dies liefert, dass das Polynom n 2 i=1 i (x) + 1 von f geteilt wird. D. h. n
i (x)2 = −1 + f (x)h(x) mit h(x) ∈ K[x].
i=1
2 In der Ordnung auf K ist der führende Koeffizient von n i=1 i (x) positiv, da er eine n 2 Summe von Quadraten ist. Weiter ist grad( i=1 i (x)) ≤ 2(n − 1), da für alle i stets n grad i < n ist. Schliesslich ist der Grad von i=1 i2 (x) gerade. Es ist grad(−1+f (x)h(x)) = grad f +grad h. Damit ist grad h ungerade. Weiter ist grad h ≤ 2(n − 1) − n = n − 2. Per Induktion gibt es ein t ∈ K mit h(t) = 0. Das liefert nun n
i (t)2 = −1.
i=1
Dies ist eine Relation in K , was einen Widerspruch zu K formal reell liefert. Satz 19.21. Sei K ein angeordneter Körper. Gelten: (1) Jedes positive Element hat eine Quadratwurzel in K . (2) Jedes Polynom ungeraden Grades in K[x] hat eine Nullstelle in K . √ √ Dann ist −1 ∈ K und K( −1) ist algebraisch abgeschlossen. Beweis. Da K angeordnet ist, ist 1 ∈ P nach Lemma 19.3(4). Also ist −1 ∈ P , d. h. √ −1 ∈ K . Wir setzen i = −1 in einem Zerfällungskörper von x 2 + 1 und L = K(i). ¯ = a für alle a ∈ K . Nach Weiter sei − der Automorphismus von L mit i¯ = −i und a Satz 3.20(3) genügt es zu zeigen, dass jedes f ∈ K[x] eine Nullstelle in L hat. Dies gilt nach der Voraussetzung (2), falls grad f ungerade ist. Wir zeigen zunächst: √
Jedes α ∈ L hat eine Quadratwurzel in L. Insbesondere kann es keine Körpererweiterung M von L mit [M : L] = 2 geben.
(∗)
Zum Beweis von (∗) sei zunächst α ∈ K . Ist α > 0, so gibt es nach (1) ein β ∈ K mit β2 = α. Ist α < 0, so ist −α > 0, also gibt es ein β ∈ K mit β2 = −α. √ Dann ist α = ( −1β)2 . D. h. jedes Element aus K ist ein Quadrat in L. Sei nun α = α1 + iα2 ∈ L beliebig mit α1 , α2 ∈ K und α2 ≠ 0. Für a + bi ∈ L ist immer (a + bi)2 = a2 − b2 + 2abi. Wenn wir zeigen wollen, dass α ein Quadrat ist, müssen wir die Gleichungen a2 − b 2 = α1 2ab = α2
lösen.
286
Angeordnete Körper
Wir können nach Multiplikation mit einem geeignetem Element aus K annehmen, dass α2 = 2 gilt. D. h. es gilt, ab = 1 zu erfüllen. Also müssen wir b = a−1 haben und a muss a2 − a−2 = α1
erfüllen. Mit λ = a2 folgt dann λ2 − α1 λ − 1 = 0.
(∗∗)
Es ist α1 2 + 22 > 0 in K . Also gibt es nach (1) ein μ ∈ K mit μ 2 = α21 + 4. Dann rechnet man leicht nach, dass λ=
1 (α1 + μ) ∈ K 2
eine Lösung von (∗∗) ist. Wir müssen für diese Lösung noch λ = a2 , d. h. λ > 0, zeigen. Seien α1 + μ ≤ 0 und α1 − μ ≤ 0. Dann ist α1 2 − μ 2 ≥ 0, also ist α1 2 ≥ μ 2 = α21 + 4. Das liefert 4 ≤ 0, ein Widerspruch. Indem wir eventuell μ durch −μ ersetzen, können wir α1 + μ > 0 annehmen. Da 1 ∈ P ist, ist auch 2 > 0. Nach Lemma 19.3(5) ist 12 > 0. Somit ist λ > 0. Damit haben wir (∗) gezeigt. Sei nun f ein beliebiges Polynom aus K[x] und E der Zerfällungskörper von f (x)(x 2 +1) über K . Dann können wir o.B.d.A. L ⊆ E annehmen. Nach Lemma 19.9(2) ist char K = 0. Also ist nach Satz 8.6 und Satz 8.10 K ⊆ E galoissch. Sei G = G (E/K) die Galoisgruppe. Es ist |G | = 2e · m, m ungerade. Da [L : K] = 2 ist, ist e > 0. Nach dem Satz von Sylow (Satz 5.46) hat G eine Untergruppe U mit |U| = 2e . Sei F = k(U ) der Fixkörper von U . Nach Lemma 6.16 ist |E : F | = 2e und [F : K] = m. Da K nach (2) keine echten Erweiterungen ungeraden Grades hat, folgt F = K , d. h. m = 1. Sei zunächst e > 1. Wir setzen U1 = G (L). Nach Satz 6.24(1) ist |U1 | = 2e−1 . k(U2 ) : L] = 2, Satz 5.53 liefert eine Untergruppe U2 von U1 mit |U2 | = 2e−2 . Dann ist [k √ ein Widerspruch zu (∗). Also ist |G| = 2 und E = K( −1) = L. Somit hat f eine Nullstelle in L. √ Korollar 19.22. Ist K reell abgeschlossen, so ist K( −1) algebraisch abgeschlossen.
Beweis. Nach Satz 19.15 und Satz 19.20 erfüllt K die Voraussetzungen von Satz 19.21. Also folgt die Behauptung mit Satz 19.21. Es gilt aber auch die Umkehrung.
Angeordnete Körper
287
√ √ Satz 19.23. Seien K ein Körper mit −1 ∈ K und C = K( −1). Ist C algebraisch abgeschlossen, so ist K reell abgeschlossen.
Beweis. Seien a, b ∈ K . Wir wollen zeigen, dass a2 + b2 ein Quadrat in K ist. Dazu √ setzen wir i = −1. Da C algebraisch abgeschlossen ist, gibt es ein u ∈ C mit u2 = a + bi. Dann ist ¯ 2, ¯ 2 = (uu) a2 + b2 = (a + bi)(a − bi) = u2 u ¯ ein Fixpunkt wobei − der Isomorphismus von C mit a + bi = a − bi ist. Da uu − 2 2 ¯ ∈ K . Also ist a + b ein Quadrat in K . Per Induktion folgt nun, dass von ist, ist uu die Summe von Quadraten in K ein Quadrat ist. Da −1 kein Quadrat ist, ist −1 auch keine Summe von Quadraten. Nun liefert Definition 19.10, dass K formal reell ist. Da C algebraisch abgeschlossen ist, ist keine echte Erweiterung von K formal reell. Also ist K reell abgeschlossen.
Nicht nur R ist reell abgeschlossen. Betrachten wir z.B. den algebraischen Ab¯ von Q in C. Dann ist Q ¯ ∩ R reell abgeschlossen. schluss Q Eine weitere interessante Eigenschaft, die in [5] bewiesen wurde, ist der folgende Satz. Wir folgen hier dem in [23] angegebenen Beweis. Satz 19.24. Sei C ein algebraisch abgeschlossener Körper und K ⊂ C ein Teilkörper mit √ [C : K] < ∞. Dann ist K reell abgeschlossen und C = K( −1). √ Beweis. Wir setzen L = K( −1) und zeigen L = C . Dann folgt die Behauptung mit Satz 19.23. Es ist C ein algebraischer Abschluss von L. Also ist jede algebraische Erweiterung von L zu einem Zwischenkörper von L ⊆ C isomorph. Sei zunächst L nicht vollkommen. Nach Satz 8.16(1) ist dann char L = p > 0. Weiter gibt es nach Satz 8.16(2) ein u ∈ L, so dass u keine p -te Potenz in L ist. Wir bee e e trachten das Polynom x p − u für ein e ∈ N. In C[x] gilt x p − u = (x − r )p e für ein r ∈ C . Wir wollen zeigen, dass x p − u irreduzibel in L[x] ist. Die Teie ler von x p − u haben die Gestalt (x − r )k . Sei also für ein k < p e das Polynom e (x − r )k in L[x]. Dann ist insbesondere r k ∈ L. Weiter ist auch r p = u ∈ L. Ist jetzt f e f e f e p = ggT(p , k), so ist p < p und p = mp + nk für geeignete m, n ∈ Z. Also f e f e−f ist r p = (r p )m (r k )n ∈ L. Dann ist aber u = (r p )p , d. h. u ist eine p-Potenz in e L, ein Widerspruch. Somit ist das Polynom x p − u ∈ L[x] für alle e irreduzibel. Wir wählen nun e so, dass p e > [C : L] ist, was dann aber offenbar einen Widerspruch liefert. Somit ist L vollkommen. Dann ist L ⊆ C eine endliche Galoiserweiterung. Sei G = G (C/L). Wir wollen L ≠ C annehmen. Dann ist G ≠ 1. Sei p ein Primteiler von |G|. Nach dem Satz von Cauchy (Satz 5.52) enthält G eine Untergruppe H mit |H| = p .
288
Angeordnete Körper
Setzen wir E = k (H), so ist [C : E] = p.
Ist p = char L > 0, so ist nach Satz 13.9 und Definition 13.8 dann C = E(r ), mit mr = x p − x − a, wobei a ∈ E ist. Wir setzen jetzt b = ar p−1 und betrachten das Polynom x p − x − b . Da C algebraisch abgeschlossen ist, hat dieses eine Nullstelle u in C . Da die r 0 , . . . , r p−1 eine E -Basis bilden, ist u = u0 + u1 r + · · · + up−1 r p−1 mit geeigneten ui ∈ E.
Da r p = r + a ist, folgt: p
p
p
p
u0 + u1 (r + a) + u2 (r + a)p + · · · + up−1 (r + a)p−1 − u0 − u1 r · · · − up−1 r p−1 = ar p−1 . p
Koeffizientenvergleich liefert nun up−1 − up−1 = a. Dann hätte aber mr eine Nullstelle in E , ein Widerspruch. Damit haben wir char L ≠ p gezeigt. Es sind [C : E] = p und ϕ(p) = p − 1 (ϕ die Eulerfunktion). Somit enthält E alle p - ten Einheitswurzeln. Nach Satz 13.9 und Definition 13.8 ist nun C = E(r ) mit mr = x p − a für geeignetes a ∈ E . 2 2 Wir betrachten jetzt das Polynom x p − a. Ist s eine Nullstelle, also s p = a und 2 u eine primitive p -te Einheitswurzel, so gilt 2
2
xp − a =
p
(x − ui s).
i=1
Ist ui s ∈ E für ein i, so ist auch (ui s)p ∈ E . Da aber ((ui s)p )p = a ist, hätte dann mr = x p −a eine Nullstelle in E , ein Widerspruch. Also sind die irreduziblen Faktoren 2 von x p − a alle vom Grad p . Sei f ein solcher und b = f (0). Dann ist b = s p v , wobei v eine Potenz von u ist. Da s p ∈ E ist, ist C = E(s p ) = E(bs −p ) = E(v).
Da E alle primitiven p-ten Einheitswurzeln enthält, ist v eine primitive p2 -te Einheitswurzel. Sei P der Primkörper von C und Pe der p e -te Kreisteilungskörper über P . Ist P = Q, so ist [Pe : P ] = ϕ(p e ). Ist char P = q > 0, so enthält Pe mindestens pe viele Elemente. In beiden Fällen haben wir [Pe : P ] −→ ∞. e→∞
Es existiert also ein e, so dass P (v) eine primitive p e -te Einheitswurzel enthält, aber keine primitive p e+1 -te Einheitswurzel. Da v eine p 2 Einheitswurzel ist, ist e ≥ 2.
Angeordnete Körper
289
Sei nun w ∈ C eine primitive pe+1 -te Einheitswurzel. Ist |P | < ∞, so ist nach Satz 8.18 G (P (w)/P ) zyklisch. Ist P = Q, so liefern Satz 12.6 und Aufgabe 13 aus Kapitel 12, dass G (P (w)/Q) zyklisch ist oder p = 2 und e ≥ 3 ist. Ist G (P (w)/P ) zyklisch, so gibt es höchstens eine Untergruppe der Ordnung p . ˜ mit [P (w) : L ˜] = p. Wir zeigen nun, Also gibt es höchstens einen Zwischenkörper L dass es mindestens zwei solche Zwischenkörper gibt, was dann p = 2 und char L = 0 erzwingt. Sei dazu h = mw ∈ E[x]. Da v ∈ E ist, ist auch w ∈ E . Also ist C = E(w) pe+1 e+1 und dann grad h = p . Weiter ist h ein Teiler von x p − 1 = i=1 (x − w i ). Also ist ˜ = P (z) mit z = w p , so h ∈ D[x], D = E ∩ P (w). Es folgt [P (w) : D] = p . Sei D ˜ . Ist ξ eine primitive p -te Einheitswurzel, ist w eine Nullstelle von x p − z ∈ D[x] ˜ ein so ist mit der Nullstelle w auch ξw eine Nullstelle von x p − z. Also ist D(w) p p Zerfällungskörper von x −z, d. h. ist x −z nicht irreduzibel, so liegen alle Nullstellen ˜ und D ˜ , aber dann ist w ∈ D ˜ = P (w). Da z ∈ P (v) ist, folgt dann bereits in D ˜ = P (v) = P (w), ein Widerspruch zur Wahl von e. D ˜ = p. Sei nun zunächst D ˜ = D. Ist also x p − z irreduzibel, so folgt [P (w) : D] Dann enthält D eine primitive p-te Einheitswurzel, also gilt dies auch für E , d. h. ˜ ≠ D und wir haben zwei Zwischenkörper mit v ∈ E , ein Widerspruch. Also ist D ˜ = p = [P (w) : D]. [P (w) : D] Somit haben wir char L = 0 und p = 2 gezeigt. Nun ist C = E(v), v eine primitive √ √ 4-te Einheitswurzel. Also ist o. B. d. A. v = −1. Da −1 ∈ E war, haben wir einen Widerspruch. Also ist G = G (C/L) = 1, d. h. L = C . Wir wollen das Kapitel mit einem Resultat, üblicherweise der Analysis, abschließen. Satz 19.25 (Zwischenwertsatz). Seien K ein reell abgeschlossener Körper und f ∈ K[x]. Sind a, b ∈ K mit a ≤ b und f (a)f (b) < 0, so gibt es ein c ∈ K mit a ≤ c ≤ b und f (c) = 0. Beweis. Sei f = g1 · · · gt eine Zerlegung von f in irreduzible Polynome in K[x]. Nach Korollar 19.22 ist grad gi ≤ 2 für alle i = 1, . . . , t . Sei zunächst gi (x) = x 2 + ci x + di .
Es ist gi (x) = (x + c2i )2 + 14 (4di − ci2 ). Ist 14 (4di − ci2 ) ≤ 0, so ist gi offenbar nicht irreduzibel. Also ist 14 (4di − ci2 ) > 0. Nach Satz 19.15 ist dann 14 (4di − ci2 ) = ei2 für geeignetes ei ∈ K . Also ist ci 2 gi (x) = x + + ei2 . 2 Insbesondere ist gi (u) > 0 für alle u ∈ K . Also gilt f =
s i=1
(x − ri ) h mit h ∈ K[x] und h(u) > 0 für alle u ∈ K.
290
Angeordnete Körper
Wären für alle i = 1, . . . , s entweder a < ri und b < ri oder a > ri und b > ri , so wäre für alle i dann (a − ri )(b − ri ) > 0. Das liefert den Widerspruch f (a)f (b) > 0. Also gibt es ein ri mit a ≤ ri ≤ b . Wir setzen c = ri . Dann ist f (c) = 0.
Übungen 1. 2. 3.
4.
√ Zeige, dass es auf Q( 2) genau zwei Ordnungen gibt. Seien K ein reell abgeschlossener Körper und f ∈ K[x]. Ist a < b mit f (a) = 0 = f (b). Dann gibt es ein c ∈ K mit a < c < b und f (c) = 0. Seien K ein angeordneter Körper und a, b ∈ K . Dann gilt: a b (a) Ist 0 ≤ a < b , so ist 1+a < 1+b . |a+b| |a| |b| (b) 1+|a+b| ≤ 1+|a| + 1+|b| . Seien K ein angeordneter Körper, X = {x ∈ K | − 1 < x < 1} und f : X → K definiert durch
f (x) =
5.
(a) Zeige, dass f bijektiv ist. (b) Bestimme f −1 . Sei K ein angeordneter Körper. Ist
f g
∈ K(x) mit f = f
6. 7.
x für x ∈ X. 1 − |x|
n
i=0
ai x i , g =
m
i=0
bi x i , grad f = n,
grad g = m und f ≠ 0, so setzen wir g > 0, falls an bm > 0 in der Ordnung auf K ist. Zeige, dass dadurch K(x) zu einem angeordneten Körper wird. Zeige, dass K = Q(x)( −(1 + x 2 )) kein angeordneter Körper ist. Seien K ein Körper mit char K ≠ 2 und 0 ≠ a ∈ K . Dann sind gleichwertig: (a) a > 0 in jeder Ordnung auf K . (b) a ist eine Summe von Quadraten.
20 Der Satz von Sturm Der im vorherigen Kapitel bewiesene Zwischenwertsatz (Satz 19.25) macht es möglich festzustellen, ob ein Polynom f in einem Intervall [a, b] eine Nullstelle hat. In diesem Kapitel wollen wir einen Satz beweisen, der die Anzahl dieser Nullstellen angibt. Dieser wurde von J. C. F. Sturm1 1836 bewiesen und wohl zum ersten Mal durch M. Weber in einem Lehrbuch publiziert. Wir folgen dieser Darstellung [59], siehe auch [22, §5.2]. Wir beginnen mit einer Definition. Definition 20.1. Seien K ein reell abgeschlossener Körper und f ∈ K[x] ein Polynom. (1) Eine Kette von Polynomen f = f0 , . . . , fs ∈ K[x] heißt Sturmsche Kette für ein Intervall [a, b] = {u | a ≤ u ≤ b}, falls die folgenden Eigenschaften erfüllt sind: (a) fs hat keine Nullstelle in [a, b]. (b) f (a)f (b) ≠ 0. (c) Ist c ∈ [a, b] mit fj (c) = 0 für ein 0 < j < s , so ist fj−1 (c)fj+1 (c) < 0. (d) Ist f (c) = 0 für ein c ∈ [a, b], so gibt es offene Intervalle (c1 , c) und (c, c2 ), so dass f0 (u)f1 (u) < 0 für alle u ∈ (c1 , c) und f0 (u)f1 (u) > 0 für alle u ∈ (c, c2 ) gilt. (2) Seien f0 , . . . , fs eine Sturmsche Kette für das Intervall [a, b] und c ∈ [a, b]. Wir bezeichnen mit Vc die Anzahl der Vorzeichenwechsel in der Folge f0 (c), . . . , fs (c), wobei die fi (c) mit fi (c) = 0 nicht mitgezählt werden. Beispiel 20.2. Sei (f0 (c), . . . , fs (c)) = (1, 0, 0, +2, −1, 0, 3, 4, −2), so ist Vc = 3. Hier nun der angekündigte Satz. Satz 20.3. Seien K reell abgeschlossen, f ∈ K[x] mit grad f > 0 und f0 , . . . , fs eine Sturmsche Kette für [a, b]. Dann ist die Anzahl der verschiedenen Nullstellen von f in (a, b) gleich Va − Vb . Beweis. Wir zerlegen zunächst das Intervall [a, b] in Teilintervalle a = a 0 < a 1 < . . . < am = b
derart, dass kein fj eine Nullstelle in irgendeinem der (ai , ai+1 ) hat. Dies bedeutet: Ist j ∈ {0, . . . , s} und a ≤ u ≤ b mit fj (u) = 0, so ist u = ai für geeignetes i.
1 Jacques C. F. Sturm, * 29. 9. 180 Genf, † 18. 12. 1855 Paris. Nach dem Studium wurde Sturm Hauslehrer bei Madame de Staël. 1830 erhielt er eine Professur am Collège Rollin, wurde 1836 in die Akademie der Wisssenschaften aufgenommen und war ab 1840 Professor an der Sorbonne. Sein Name gehört zu den 72 Namen, die auf dem Eiffelturm verewigt wurden. Mathematisch beschäftigte er sich im Wesentlichen mit Fragen der Mechanik.
292
Der Satz von Sturm
Wir wählen nun ein i mit 1 ≤ i ≤ m und halten dieses zunächst fest. Sei (ai−1 , ai ) ein Intervall und c ∈ (ai−1 , ai ). Ist 0 ≤ j ≤ s , so hat fj keine Nullstelle in (c, ai ). Nach dem Zwischenwertsatz (19.25) ist dann fj (ai )fj (c) ≥ 0. Ist fj (ai−1 ) ≠ 0, so ist fj (ai−1 )fj (c) > 0. Also trägt fj zu einem Vorzeichenwechsel in Vai genau dann bei, falls fj in Vc einen Vorzeichenwechsel hat. Sei nun fk (ai ) = 0 für ein k. Da fs (ai ) ≠ 0 ist, ist k < s . Wir betrachten zuerst den Fall, dass 0 < k ist. Nach Definition 20.1(1)(c) ist dann fk−1 (ai )fk+1 (ai ) < 0. Weiter sind aber fk−1 (ai )fk−1 (c) > 0 und fk+1 (ai )fk+1 (c) > 0 nach dem Zwischenwertsatz, da fk−1 (ai ) ≠ 0 ≠ fk+1 (ai ) ist. Somit ist fk−1 (c)fk+1 (c) < 0. Damit liefern fk−1 (ai ), 0, fk+1 (ai ) und fk−1 (c), fk (c), fk+1 (c) jeweils einen Vorzeichenwechsel. Dies zeigt: Ist (ai−1 , ai ) ein Intervall mit f (ai ) ≠ 0 und c ∈ (ai−1 , ai ), so ist Vc = Vai . Ist f (ai−1 ) ≠ 0, so ist Vai−1 = Vc .
( ∗)
Sei nun f (ai ) = 0. Dann ist i < m. Also können wir auch das Intervall (ai , ai+1 ) betrachten. Wir wählen nun c ∈ (ai−1 , ai ) und d ∈ (ai , ai+1 ). Nach Definition 20.1(1)(d) sind f0 (c)f1 (c) < 0 und f0 (d)f1 (d) > 0. Dann hat f0 (c), f1 (c) einen Vorzeichenwechsel und f0 (d), f1 (d) hat keinen. Da alle anderen fj zu den Vorzeichenwechseln von Vc und Vd gleich betragen, gilt dann: Ist f (ai ) = 0 und sind c ∈ (ai−1 , ai ) und d ∈ (ai , ai+1 ), so ist Vc − Vd = 1.
(∗∗)
Wir wählen nun aus jedem Intervall (ai−1 , ai ), i = 1, . . . , m, ein ai . Dann folgt mit (∗) und (∗∗) Va − Vb = (Va − Va1 ) +
m−1 i=1
(Vai − Vai+1 ) + (Vam − Vb ).
Die Differenzen sind dabei 0 oder 1. Weiter ist eine Differenz genau dann 1, falls f (ai ) = 0 ist. Also ist Va − Vb die Anzahl der Nullstellen von f in (a, b).
Es bleibt das Problem, woher wir eine Sturmsche Kette bekommen können. Definition 20.4. Sei K reell abgeschlossen und f ∈ K[x]. Wir definieren eine Standardkette durch f0 = f , f1 = f und f0 = q1 f1 − f2
mit
grad f2 < grad f1 ,
mit
grad fi+1 < grad fi ,
.. . fi−1 = qi fi − fi+1
.. . fs−1 = qs fs .
Die fi , i > 1, sind also die Reste im euklidischen Algorithmus bei der Berechnung von ggT(f , f ). Es ist fs = ggT(f , f ) und fs teilt fi für alle i = 0, . . . , s .
Der Satz von Sturm
293
Beispiel 20.5. Sei K = R und f = x 3 + x + 1. Es sind f0 = f , f1 = 3x 2 + 1. 1 2 f = ( x)f1 − (− x − 1), 3 3 27 9 31 f1 = (− x + )f2 − (− ), 2 4 4
d. h. d. h.
2 f2 = − x − 1 3 31 f3 = − . 4
Somit ist die Standardkette x 3 + x + 1, 3x 2 + 1, − 23 x − 1, − 31 . 4 Lemma 20.6. Sei f0 , . . . , fs eine Standardkette zu f . Wir setzen gi = fi fs−1 . Dann ist g0 , . . . , gs eine Sturmsche Kette zu g0 für jedes Intervall [a, b] mit g0 (a)g0 (b) ≠ 0. Beweis. Nach Voraussetzung gilt zunächst Definition 20.1(1)(b). Da gs = 1 ist, gilt auch Definition 20.1(1)(a). Wir wollen Definition 20.1(1)(c) nachweisen. Es ist gj−1 = qj gj − gj+1 für alle j = 1, . . . , s.
Sei gj (c) = 0. Dann ist gj−1 (c)gj+1 (c) = −gj+1 (c)2 ≤ 0. Weiter ist gj−1 (c) = 0 genau dann, wenn gj+1 (c) = 0 ist. Das liefert dann aber gk (c) = 0 für alle k ≥ j , was gs (c) ≠ 0 widerspricht. Also ist gj−1 (c)gj+1 (c) < 0 und damit ist Definition 20.1(1)(c) gezeigt. Für Definition 20.1(1)(d) sei g0 (c) = 0 für ein c ∈ [a, b]. Dann ist f = (x − c)e h mit e > 0, h ∈ K[x] und h(c) ≠ 0. Weiter ist f = (x − c)e h + e(x − c)e−1 h. Da fs = ggT(f , f ) ist, ist fs = (x − c)e−1 k mit k ∈ K[x], k(c) ≠ 0, wobei k ein Teiler von h ist.
Das liefert dann h = kp mit p ∈ K[x] und p(c) ≠ 0.
Weiter ist h = km mit m ∈ K[x].
Also sind g0 = (x − c)p
und
g1 = (x − c)m + ep.
Dabei ist g1 (c) = ep(c) ≠ 0.
Wir wählen nun ein Intervall [c1 , c2 ] mit c ∈ [c1 , c2 ], so dass g1 p ≠ 0 auf [c1 , c2 ] ist. Das geht, da g1 p nur endlich viele Nullstellen hat. Nach dem Zwischenwertsatz (Satz 19.25) ist dann g1 (u)p(u) > 0 oder g1 (u)p(u) < 0 für alle u ∈ [c1 , c2 ]. Es ist g1 (c)p(c) =
1 g1 (c)2 > 0. e
294
Der Satz von Sturm
Damit ist g1 (u)p(u) > 0 für alle u ∈ [c1 , c2 ]. Das liefert, dass g0 g1 = (x − c)g1 p das gleiche Vorzeichen wie x − c in [c1 , c2 ] hat. Also erhalten wir g0 (u)g1 (u) < 0 für c1 < u < c und g0 (u)g1 (u) > 0 für c < u < c2 . Insbesondere gilt Definition 20.1(1)(d). Bemerkung 20.7. Ist f0 , . . . , fs eine Standardkette und hat f keine mehrfachen Nullstellen, so ist ggT(f , f ) = 1. Also ist dann {fi } eine Sturmsche Kette. Hat f mehrfache Nullstellen, so ist dies nicht mehr der Fall. Dennoch kann man auch dann mit der Standardkette die Anzahl der Nullstellen bestimmen. Satz 20.8 (Sturm). Seien K reell abgeschlossen und f ∈ K[x] mit grad f > 0. Sei f0 , . . . , fs eine Standardkette zu f und [a, b] ein Intervall mit f (a) ≠ 0 ≠ f (b). Für c ∈ [a, b] bezeichnen wir mit Vc die Anzahl der Vorzeichenwechsel in f0 (c), . . . , fs (c). Dann ist die Anzahl der verschiedenen Nullstellen von f in [a, b] gleich Va − Vb . Beweis. Wir setzen wie in Lemma 20.6 gi = fi fs−1 . Dann haben g0 und f bis auf die Vielfachheiten die gleichen Nullstellen in [a, b]. Nach Lemma 20.6 bilden die g0 , . . . , gs eine Sturmsche Kette. Wir bezeichnen mit Va (g) bzw. Vb (g) die Anzahl der Vorzeichenwechsel in g0 (a), . . . , gs (a) bzw. g0 (b), . . . , gs (b). Nach Satz 20.3 ist die Anzahl der Nullstellen von g0 und damit auch die von f in [a, b] gleich Va (g) − Vb (g). Es ist fi (c) = gi (c)fs (c) für alle c ∈ [a, b]. Weiter haben wir fs (a) ≠ 0 ≠ fs (b). Das liefert Va (g) = Va und Vb (g) = Vb . Also ist die Anzahl der verschiedenen Nullstellen von f in [a, b] gleich Va − Vb . Beispiel 20.9. Sei f = x n + a1 x n−1 + · · · + an mit ai ∈ K . Nach Satz 16.4 liegen alle Nullstellen von f im Intervall [−μ, μ], μ = 1 + |a1 | + . . . + |an |. Ist f0 , . . . , fs die Standardkette, so ist die Anzahl der Nullstellen von f gleich V−μ − Vμ . Damit können wir jetzt leicht die Anzahl der Nullstellen von f bestimmen. Sei f = x 3 − 7x − 7. Wir wollen bestimmen, wieviele reelle Nullstellen f hat. Dazu berechnen wir zunächst die Standardkette. Es ist f0 = x 3 − 7x − 7 = f , f1 = 3x 2 − 7 = f , 1 14 f = q1 f − f2 = ( x)(3x 2 − 7) − ( x + 7), also 3 3 14 x + 7, f2 = 3 14 f1 = q2 f2 − f3 = 3x 2 − 7 = q2 ( x + 7) − f3 3 27 14 1 9 )( x + 7) − , d. h. =( x− 14 28 3 4 1 f3 = . 4
295
Der Satz von Sturm
Die Anzahl der Nullstellen von f ist V−15 − V15 . Wir rechnen nach: f (−15) = −3277, f1 (−15) = 668, f2 (−15) = −63, f3 (−15) =
1 . 4
Also ist V−15 = 3. Weiter ist f (15) = 3262, f1 (15) = 668, f2 (15) = 77, f3 (15) =
1 . 4
Also ist V15 = 0. Somit hat f genau drei reelle Nullstellen. Wollen wir feststellen, wieviele davon im Intervall (−2, −1) liegen, so bestimmen wir V−2 : −1, 5, − 73 , 14 , also V−2 = 3 und V−1 : −1, −4, 73 , 14 , also V−1 = 1. Somit liegen genau zwei der drei Nullstellen in (−2, −1).
Übungen 1. 2.
Zeige, dass x 6 + 6x + 10 keine reellen Nullstellen hat. Sei f = x 4 − 5x 2 − 2x + 3. Bestimme die Anzahl der reellen Nullstellen in jedem der folgenden Intervalle: [−2, −1], [−1,0], [0,1], [1,2], [2,3].
3.
Für jedes n ∈ N sei fn (x) =
n−1 i=0
(−1)i i+1 x . i+1
Zeige, dass fn außer Null bei ungeradem n keine und bei geradem n genau eine weitere reelle Nullstelle hat.
A Der Körper der komplexen Zahlen In diesem Kapitel werden wir einen elementaren Beweis dafür geben, dass C algebraisch abgeschlossen ist. Dieser folgt einem Beweis von M. Kneser [28]. Einen weiteren Beweis, der die Galoistheorie benutzt, hatten wir bereits in Satz 19.21 gegeben. Beachte, dass die Voraussetzung, dass jedes positive Element ein Quadrat ist, in R offensichtlich erfüllt ist. Weiter folgt aus dem Zwischenwertsatz, dass jedes Polynom ungeraden Grades in R[x] eine Nullstelle in R hat. i Lemma A.1. Sei f (x) = n i=0 ai x ∈ C[x] ein normiertes Polynom. Dann existiert ein 2 n u ∈ C mit |u| ≤ |a0 |, so dass für q = 12 31−n−n dann |f (u)| ≤ q|a0 | gilt.
Beweis. Ist a0 = 0, so setzen wir u = 0. Sei also |a0 | > 0. Für s > 0 definieren wir m(s) = max{|ai |s i | i = 1, . . . , n}.
Es ist m(s) stetig und monoton wachsend. Offenbar zerfällt (0, ∞) in Intervalle I1 , . . . , In mit m(s) = |ak |s k
für s ∈ Ik ,
wobei manche Intervalle auch leer sein dürfen. Sei nun t eine Lösung von m(t) = |a0 |.
Dann gilt für r ≤ t |ak |r k ≤ |ak |t n ≤ |a0 |
und
r n ≤ t n = |an |t n ≤ |a0 |.
( 1)
Wir definieren Indices k−1 , k0 , k1 , k2 , . . . durch 3−i t ∈ Iki . Dann gilt n ≥ k−1 ≥ k0 ≥ · · · ≥ 1.
Also gibt es ein j ≥ 0 mit kj−1 = kj = kj+1 = k. Wir wählen j minimal mit dieser Eigenschaft. Dann ist k2i−1 ≤ n − i für 2i − 1 ≤ j . Also ist j ≤ 2(n − k) und es gilt: Ist m(3x) = |am |(3x)m , so ist m(3x) = 3m |am |x m ≤ 3m m(x). Somit nimmt m(s) von 3−i t bis 3−i−1 t höchstens wie eine ki -te Potenz ab. Also erhalten wir für r = 3−j t dann m(t) = m(3j r ) ≤ 3h m(r )
mit h ≤ k + 2(k + 1) + 2(k + 2) + · · · + 2(n − 1) + n = n2 − k2 .
298
Der Körper der komplexen Zahlen
Das liefert 2
m(t) ≤ 3n
−k2
2
m(r ) ≤ 3n m(r ).
( 2)
Weiter gilt wegen k = kj+1 |ai |r i = 3i |ai |(3−1 r )i = 3i |ai |(3−(j+1) t)i ≤ 3i |ak |(3−(j+1) t)k = 3i |ak |(3−1 r )k = 3i−k |ak |r k ,
für alle i ≥ 1, also |ai |r i ≤ 3i−k |ak |r k , für alle i ≥ 1,
( 3)
und wegen k = kj−1 dann |ai |r i = 3−i |ai |(3r )i = 3−i |ai |(3−(j−1) t)i ≤ 3−i |ak |(3r )k = 3k−i |ak |r k für alle i ≥ 1.
Damit haben wir |ai |r i ≤ 3k−i |ak |r k für alle i ≥ 1.
Nun folgt
(3)
1≤i
=
und
|ai |r i ≤
(4)
=
2
1≤i
− 1 3−k |ak |r k = 12 (1 − 31−k )|ak |r k
3k−i |ak |r k =
k
n−k
=
3k−i |ak |r k
k
(3−1 )j |ak |r k =
j=1 1 (1 2
3i 3−k |ak |r k
1≤i
3k − 1
|ai |r i ≤
k
3i−k |ak |r k =
( 4)
(3−1 )n−k+1 − 1 |ak |r k 3−1 − 1
− 3k−n )|ak |r k .
Zusammengefasst gilt also |ai |r i ≤ 12 (1 − 31−k )|ak |r k 1≤i
und
|ai |r i ≤ 12 (1 − 3k−n )|ak |r k . (5)
k
Es ist |f (x)| ≤ |a0 + ak x k | +
|ai ||x|i .
i≠0 i≠k
Wir wählen u mit |u| = r , also u = r eiϕ . Sei a0 = aeiψ und ak = beiΘ . Dann ist ak uk = br k ei(Θ+kϕ) .
Nun wählen wir ϕ speziell mit Θ + kϕ = ψ + π ,
also ϕ = (ψ + π − Θ)/k.
299
Der Körper der komplexen Zahlen
Dann sind a0 und ak uk entgegengesetzt gerichtet. Somit gilt |a0 + ak uk | = |a0 | − |ak uk | = |a0 | − |ak |r k .
(6)
(1)
Das liefert |f (u)| ≤ |a0 | − |ak |r k + |ai |r i (6)
i≠0 i≠k
≤ |a0 | − |ak |r k + 12 (1 − 31−k )|ak |r k + 12 (1 − 3k−n )|ak |r k
(5)
< |a0 | − 12 31−k |ak |r k = |a0 | − 12 31−k m(r ) 2
2
1 1 ≤ |a0 | − 2 31−k 3−n m(t) = |a0 |(1 − 2 31−k−n )
(2)
≤ |a0 |q,
2
mit q = 1 − 12 31−n−n .
Weiter ist |u|n = r n ≤ |a0 |, die Behauptung. (1)
Satz A.2. C ist algebraisch abgeschlossen. i Beweis. Wir müssen zu jedem normierten Polynom g(x) = n i=0 bi x , n ≥ 1, bi ∈ C, eine Nullstelle in C finden. Ohne Beschränkung können wir b0 ≠ 0 annehmen. Wir definieren eine Folge (xm ) durch die folgende Festsetzung. Wir setzen x0 = 0. Ist xm bereits definiert, so definieren wir fm (x) = g(xm + x) und suchen ein um , das Lemma A.1 erfüllt. Dann setzen wir xm+1 = xm + um . Das absolute Glied von fm (x) ist n i n i=0 bi xm = g(xm ), also ist |f (um )| ≤ q|g(xm )| und |um | ≤ |g(xm )| mit q wie in Lemma A.1. Wir zeigen durch Induktion nach m, dass |g(xm )| ≤ q m |b0 | ist. Ist m = 0, so ist |g(0)| = |b0 | = q 0 |b0 |. Ist m > 0, so ist nach Wahl von um |fm (um )| ≤ q|g(xm )| ≤ qqm |b0 | = q m+1 |b0 |.
Es gilt fm (um ) = g(xm+1 ). Also ist |g(xm+1 )| ≤ qm+1 |b0 |.
Insbesondere haben wir |um |n ≤ qm |b0 |.
( ∗)
Da q < 1 ist, folgt g(xm ) → 0 mit m → ∞.
(∗∗)
Sei jetzt t ∈ N. Dann erhalten wir ! !t−1 ! !t−1 ! ! ! ! |xm+t − xm | = ! xm+i+1 − xm+i ! = ! xm+i + um+i − xm+i ! i=0
i=0
! !m+t−1 ! m+t−1 !t−1 ! ! ! ! um+i ! = ! ui ! ≤ |ui | ≤ =! i=0
i=m
i=m
(∗)
m+t−1 i=m
' qi |b0 |.
n
300
Der Körper der komplexen Zahlen
' n Da ∞ qi |b0 | nach dem Quotientenkriterium konvergiert, ist (xm ) eine Cauchyi=0 Folge. Also existiert y = limm→∞ xm . Da g als Polynom stetig ist, folgt g(y) = lim g(xm ) = 0. m→∞
(∗∗)
B Transzendenz von e und π Satz B.1 (Hermite1 ). e ist transzendent. Beweis. Sei e nicht transzendent. Dann ist am em + · · · + a1 e + a0 = 0
für geeignete ai ∈ Z mit a0 ≠ 0. Sei fp =
x p−1 (x − 1)p (x − 2)p · · · (x − m)p , (p − 1)! (mp+p)
mit einer Primzahl p . Es ist grad fp = mp + p − 1 und somit fp definieren das Polynom F (x) =
∞
= 0. Wir
fp(i) (x).
i=0
Nun ist (e−x F (x)) = e−x {F (x) − F (x)} = −e−x fp (x). Also ist für jedes j 9j aj
j
e−x fp (x) dx = aj [−e−x F (x)]0 = aj F (0) − aj e−j F (j).
0
Das liefert m j=0
9j (aj e
j
m
e−x fp (x) dx) = F (0)
aj ej −
j=0
0
=−
m
mp+p−1
j=0
i=0
m
aj F (j)
j=0
(1)
aj fp(i) (j).
Wir zeigen, dass fp(i) (j) ∈ Z ist, und außer für j = 0 und i = p − 1 stets (i) p | fp (j) gilt. Sei j ≠ 0. Dann trägt nur (x − j)p zu einem Summanden ungleich Null bei und auch nur dann, falls genau eine p -te Ableitung gebildet wird. (p) Wir rechnen nach, dass (x − j)p = p! ist Da p!/(p − 1)! = p ist, sind alle diese Terme durch p teilbar.
1 Ch. Hermite, * 24. 12. 1822 Dieuze, † 14. 1. 1901 Paris, Professor in Paris. Hermite arbeitete auf den Gebieten der Analysis, Algebra, Zahlentheorie, Invariantentheorie und löste als erster Gleichungen 5. Grades mt Hilfe elliptischer Funktionen. Er bewies 1873 die Transzendenz von e.
302
Transzendenz von e und π
Sei nun j = 0. Dann kommt der einzige von Null verschiedene Summand von (x p−1 )(p−1) . Also ist (p−1)
fp
(0) = (−1)p · · · (−m)p .
Damit haben wir mit (1) m
9j aj e
j=0
j
e−x fp (x) dx ≡ a0 (−1)p · · · (−m)p
(mod p).
0
Wir wählen nun p > max(m, |a0 |). Dann ist a0 (−1)p · · · (−m)p ≡ 0 (mod p). Somit gilt 9 m ! ! ! ! ! aj ej e−x fp (x) dx ! ≥ 1 j
j=0
für alle p > max(|a0 |, m).
(2)
0
Nun ist |f (x)| ≤ mmp+p−1 /(p − 1)!, für alle 0 ≤ x ≤ m. Dies ergibt die folgende Ungleichung 9 9 m m ! ! mmp+p−1 ! ! ! dx aj ej e−x f (x) dx ! ≤ |aj ej | (p − 1)! j=0 j=0 j
j
0
0
≤
m j=0
|aj ej |j
mmp+p−1 −→ 0, (p − 1)! p→∞
die aber (2) widerspricht. Satz B.2 (Lindemann2 ). π ist transzendent. Beweis. Ist π algebraisch, so auch iπ . Letzteres wollen wir zum Widerspruch führen. Sei f1 ∈ Q[x] mit den Nullstellen α1 = iπ , α2 , . . . , αn . Wegen eiπ + 1 = 0 gilt auch (eα1 + 1)(eα2 + 1) · · · (eαn + 1) = 0.
(1)
Seien γ1 , . . . , γs alle Summen der Länge r in den αi , die beim Ausmultiplizieren von (1) als Exponenten von e vorkommen. Wir setzen fr = (x − γ1 ) · · · (x − γs ).
2 Carl Louis Ferdinand von Lindemann * 12. 4. 1852 Hannover † 6. 3. 1939 München, Professor in Freiburg, Königsberg und München. Hauptarbeitsgebiete waren Differentialgeometrie, algebraische Geometrie und Zahlentheorie. Sein Hauptresultat ist der Beweis der Transzendenz von π , das das jahrtausende alte Problem der Quadratur des Kreises mit Zirkel und Lineal als unlösbar bewies.
Transzendenz von e und π
303
Dann ist fr symmetrisch in den αi . Nach Satz 18.2 ist fr ein Polynom in den elementar symmetrischen Polynomen in den αi . Diese sind aber Polynome über Q. Also ist fr ∈ Q[x]. Damit ist auch f1 f2 · · · fn ∈ Q[x].
Indem wir dieses Polynom durch eine geeignete Potenz von x dividieren und mit dem Hauptnenner der Koeffizienten multiplizieren, erhalten wir ein Polynom g ∈ Z[x], dessen Nullstellen β1 , . . . , βr , alle ungleich Null sind, so dass beim Ausmultiplizieren von (1) genau eβ1 + · · · + eβr + e0 + · · · + e0 = 0,
also e β1 + · · · + e βr + k = 0
mit geeignetem k ∈ Z
(2)
entsteht. Weiter ist k > 0, da 1 · 1· · · 1 als Summand vorkommt. n
Es ist
g = cx r + c1 x r −1 + · · · + cr
mit cr ≠ 0.
Für jede Primzahl p setzen wir c r (p−1) x p−1 g p (p − 1)!
hp =
und dann ∞
F (x) =
h(i) p (x).
i=0 (p−1+r p)
Wir haben grad hp = (p − 1) + r p , also ist hp
= 0. Es gilt
(e−x F (x)) = −e−x hp (x)
und e
−x
9x F (x) − F (0) = −
e−y hp (y) dy.
0
Wir setzen hierin y = λx ein und multiplizieren die Gleichung mit ex . Dann gilt 91 x
e(1−λ)x hp (λx) dλ
F (x) − e F (0) = −x 0
und weiter r j=1
F (βj ) + kF (0) = −
r j=1
91 e(1−λ)βj hp (λβj ) dλ.
βj 0
(3)
304
Transzendenz von e und π
Wir zeigen, dass die rechte Seite in (3) eine ganze Zahl ungleich Null ist. Es ist r
h(t) p (βj ) = 0
für 0 < t < p,
j=1 (t) da g alle h(t) p (x) für t < p teilt. Wir betrachten nun hp (βj ) mit t ≥ p . Es ist
c −r (p−1)
r
h(t) p (βj )
j=1
ein symmetrisches Polynom in den βj vom Grad höchstens r (p − 1). Nach Satz 18.2 ist es dann ein Polynom vom Grad höchstens r (p − 1) in den ci /c . Also ist r
h(t) p (βj ) ∈ Z.
j=1 (t)
Um in hp (βj ) einen Summanden ungleich Null zu erhalten, müssen wir g p mindestens p -mal differenzieren. Also erhalten wir einen Faktor p!/(p − 1)! = p . Das liefert nun r
h(t) p (βj ) = pkt
mit kt ∈ Z.
j=1
Weiter ist
⎧ ⎪ ⎪ ⎪0 ⎨ p (t) hp (0) = c r (p−1) cr ⎪ ⎪ ⎪ ⎩l p t
t ≤ p − 2, t = p − 1, t ≥ p, mit lt ∈ Z.
Das zeigt r
p
F (βj ) + kF (0) = Ap + kc r (p−1) cr
mit A ∈ Z.
( 4)
j=1 p
Wir wählen nun p > max(k, |c|, |cr |). Dann ist kc r (p−1) cr ≡ 0 (mod p). Also ist mit (3) und (4) 91 r ! ! ! ! ! βj e(1−λ)βj hp (λβj ) dλ! ≥ 1. j=1
0
Sei m(j) = sup |g(λβj )|. 0≤λ≤1
(5)
Transzendenz von e und π
305
Dann ist |hp (λβj )| ≤
Wir setzen B = |maxj
:1 0
|c|r (p−1) m(j)p . (p − 1)!
e(1−λ)βj dλ|. Dann erhalten wir
91 r r ! ! |βj ||c|r (p−1) m(j)p B ! ! ! −→ 0. βj e(1−λ)βj hp (λβj ) dλ! ≤ p→∞ (p − 1)! j=1 j=1
(6)
0
Dieser Widerspruch zwischen (6) und (5) liefert, dass π transzendent ist. Bemerkungen. Lindemann hat einen allgemeineren Satz bewiesen, der die Transzendenz von π impliziert: Seien z1 , . . . , zn verschiedene algebraische Zahlen ungleich Null. Ist c1 ez1 + c2 ez2 + · · · + cm ezm = 0
mit algebraischen Zahlen c1 , . . . , cm , so ist c1 = c2 = · · · = cm = 0. Insbesondere folgt daraus, dass ex transzendent ist, falls x ≠ 0 algebraisch ist. Ist x ≠ 1, x algebraisch, so ist log x transzendent. Weiter erhalten wir, dass für x algebraisch, x ≠ 0, sin x , tan x , cos x usw. transzendent sind. (2i sin x = eix − e−ix !) 1934 haben Gelfond [15] und Schneider [46] unabhängig voneinander bewiesen: √ Sind a, b algebraisch, b ∈ Q. Dann ist ab transzendent. Also ist insbesondere 2 2 transzendent. Dies war die Lösung des 7. Hilbertschen Problems.
C Triangulierung von Quadraten In diesem Kapitel wollen wir unsere Bewertungen auf eine geometrische Fragestellung anwenden. Wir werden beweisen, dass man ein Quadrat nicht in ungerade viele sich nicht überlappende flächengleiche Dreiecke zerlegen kann. Es ist überraschend, dass für diesen Satz kein Beweis bekannt ist, der nicht die Bewertungstheorie benutzt. Das wesentliche Resultat, das im Beweis benutzt wird, ist, dass es auf R eine Bewertung ϕ gibt, so dass ϕ(2) < 1 ist. Dies folgt aus Satz 15.21. Wir geben hier den Beweis von Paul Monsky wieder. Einen elementareren Beweis, der aber auch Bewertungstheorie benutzt, kann man in [1] finden. Satz C.1. (Monsky1 [35]) Es ist nicht möglich, das Quadrat Q = [0,1] × [0,1] in eine ungerade Anzahl von flächengleichen sich nicht überlappenden Dreiecken zu zerlegen. Beweis. Sei eine solche Zerlegung gegeben. Mit einer Ecke wollen wir eine Ecke eines der Dreiecke und mit einer Seite eine Seite eines Dreieckes oder eine der vier Seiten von Q bezeichnen. Zwei Ecken nennen wir verbunden, falls sie auf einer Seite liegen und dazwischen keine weitere Ecke ist, also b a
a und b sind verbunden.
b a
a und b sind nicht verbunden.
Die Strecke zwischen zwei Ecken nennen wir ein Basissegment. Wir wollen annehmen, dass die Ecken irgendwie in drei Mengen A, B, C eingeteilt sind. Wir nennen eine Seite oder ein Basissegment vom Typ AB , falls ein Endpunkt in A und der andere in B liegt. Entsprechend Typ AC , BC , AA, BB und CC .
1 Paul Monsky * 17. 6. 1936. Paul Monsky ist Professor an der Brandeis University. Seine Arbeitsgebiete sind Zahlentheorie, algebraische Geometrie und kommutative Algebra.
Triangulierung von Quadraten
307
Wir zeigen zunächst: Hat Q eine ungerade Anzahl von Seiten vom Typ AB und enthält keine Seite von Q oder eines Dreiecks Ecken aus allen drei Mengen, so gibt es ein Dreieck, dessen Ecken in jeder der drei Mengen A, B, C liegen:
(1)
Ist eine Seite vom Typ AA oder BB , so enthält sie gerade viele Basissegmente vom Typ AB . Weiter enthält jede Seite vom Typ AB ungerade viele Basissegmente vom Typ AB , da sie nur Ecken aus A oder B enthält. Es habe nun kein Dreieck D Ecken aus allen drei Mengen. Dann hat D keine oder zwei Seiten vom Typ AB . Also enthält jedes Dreieck eine gerade Anzahl von Basissegmenten vom Typ AB . Die Anzahl der Basissegmente in Q ist modulo zwei kongruent zur Summe der Basissegmente auf den Dreiecken, da jedes innere Basissegment zweimal gezählt wird, d. h. gerade oft. Aber die Anzahl der Seiten vom Typ AB von Q ist ungerade und jede Seite vom Typ AB hat ungerade viele Basissegmente vom Typ AB , d. h. die Anzahl der Basissegmente vom Typ AB ist ungerade, ein Widerspruch. Nach Satz 15.21 gibt es eine Bewertung ϕ auf R mit ϕ(2) < 1, nämlich die Fortsetzung der 2-adischen Bewertungen von Q. Es gilt weiter: Ist t ∈ N eine gerade Zahl, so ist ϕ(t) < 1 :
(2)
Dies ist richtig für t = 2, da ϕ(2) < 1 ist. Sei also t = 2y + 2. Per Induktion ist dann ϕ(t) ≤ max{ϕ(2y), ϕ(2)} < 1. Das ist (2). Wir teilen nun die Punkte des R2 in die folgenden drei Mengen A, B und C ein: (1) (x, y) ∈ A, falls ϕ(x) < 1 und ϕ(y) < 1 ist. (2) (x, y) ∈ B, falls ϕ(x) ≥ 1 und ϕ(x) ≥ ϕ(y) ist. (3) (x, y) ∈ C, falls ϕ(y) ≥ 1 und ϕ(y) > ϕ(x) ist. Man überlegt sich leicht, dass in der Tat R2 eine disjunkte Vereinigung von A, B und C ist. Als nächstes zeigen wir: Sind (x, y) ∈ B und (x , y ) ∈ C, so ist ϕ(xy ) > ϕ(yx ).
(3)
Es sind ϕ(x) ≥ ϕ(y) und ϕ(y ) > ϕ(x ). Also ist ϕ(xy ) = ϕ(x)ϕ(y ) > ϕ(y)ϕ(x ) = ϕ(yx ).
Sind P = (x, y) und P = (x , y ) zwei Punkte des R2 , so dass (x − x , y − y ) ∈ A ist, so liegen P und P in der gleichen Menge:
(4)
Da (x − x , y − y ) ∈ A ist, folgt ϕ(x − x ) < 1 > ϕ(y − y ).
( ∗)
308
Triangulierung von Quadraten
Ist P ∈ A, so haben wir ϕ(x ) = ϕ(x − x + x) ≤ max{ϕ(x − x), ϕ(x)} < 1 (∗)
und ϕ(y ) = ϕ(y − y + y) ≤ max{ϕ(y − y), ϕ(y)} < 1. (∗)
Also ist auch P ∈ A. Ist P ∈ B , so ist ϕ(x) = ϕ(x ), da wir sonst mit Lemma 15.23(1) den Widerspruch ϕ(x − x ) = max{ϕ(x), ϕ(x )} ≥ 1 zu (∗) erhalten. Nun ist ϕ(y ) ≤ max{ϕ(y − y), ϕ(y)} ≤ max{1, ϕ(y)} ≤ ϕ(x) = ϕ(x ).
Also ist auch P ∈ B . Ist P ∈ C , so ist ϕ(y) = ϕ(y ) wieder nach Lemma 15.23 (1) und (∗). Dann ist ϕ(x ) ≤ max{1, ϕ(x)} < ϕ(y) = ϕ(y ). Also ist P ∈ C . Damit ist (4) bewiesen. Eine Seite L kann nicht Ecken in allen drei Mengen haben:
(5)
Nach (4) können wir einen Punkt vom Typ A aus L durch Translation in (0,0) überführen. Da (0,0) in A ist, wird die Zugehörigkeit der anderen Punkte zu den Mengen dadurch nicht geändert. Also können wir (0,0) ∈ L annehmen. Seien (x, y) ∈ L vom Typ B und (x , y ) ∈ L vom Typ C . Da (x, y) und (x , y ) auf einer Geraden durch (0,0) liegen, ist xy = yx . Das widerspricht aber (3). Ist D ein Dreieck, das Ecken aus jeder der drei Mengen A, B, C hat, und sei u der Inhalt von D, so ist ϕ(u) > 1 :
(6)
Wir können wieder annehmen, dass (0,0) eine der Ecken von D ist. Seien jetzt (x, y) ∈ B und (x , y ) ∈ C die beiden anderen Ecken. Bis auf das Vorzeichen ist u = 12 (xy − x y). Nach (3) ist ϕ(xy ) > ϕ(yx ). Also gilt ϕ(xy − xy ) = ϕ(xy )
nach Lemma 15.23(1). Das liefert 1 1 1 ϕ( (xy − x y)) = ϕ( )ϕ(xy ) = ϕ( )ϕ(x)ϕ(y ). 2 2 2
Da ϕ(2) < 1 ist, ist ϕ( 12 ) > 1 nach Lemma 15.10. Also ist 1 ϕ( (xy − x y)) > 1. 2
Damit ist (6) gezeigt.
Triangulierung von Quadraten
309
Nun beweisen wir die Behauptung des Satzes. Sei m die Anzahl der Dreiecke. Dann hat jedes Dreieck den Inhalt 1/m, da alle flächengleich sind. Die einzige Seite auf Q vom Typ AB ist (0,0), (1,0). Also hat Q genau eine Seite vom Typ AB . Nach (1) und (5) gibt es ein Dreieck D , das Ecken von allen drei Typen hat. Nach (6) ist dann ϕ(1/m) > 1. Nun ist 1 = ϕ(1) = ϕ(m
1 1 ) = ϕ(m)ϕ( ) > ϕ(m). m m
Sei jetzt m ungerade. Dann folgt mit Lemma 15.23(1) ϕ(1 + m) = max{ϕ(m), ϕ(1)} = 1.
Da m + 1 gerade ist, widerspricht dies (2).
Literaturverzeichnis [1] [2] [3]
[4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31]
M. Aigner, G. Ziegler. Buch der Beweise, 3.Auflage. Springer, Heidelberg 2002. E. Artin. Foundations of Galois Theory. New York University Lecture Notes, New York 1938. E. Artin. Galois Theory. University of Notre Dame Press, Notre Dame-London 1942. dt. Übersetzung: Galoissche Theorie, Teubner, Leipzig 1959; Verlag Harri Deutsch, ZürichFrankfurt/Main 1968. E. Artin. The orders of the linear groups. Comm. Pure Appl. Math. 8: 355–365, 1955. E. Artin, O. Schreier. Algebraische Konstruktion reeller Körper. Abhandlungen Mathematisches Seminar Universität Hamburg 5: 85–99, 1927. E.R. Berlekamp. Factoring polynomials over finite fields. Bell System Tech. J. 46: 1853–1859, 1967. P. Cameron. Finite permutation groups and finite simple groups. Bull. Lond. Math. Soc. 13: 1–22, 1981. D. Cantor, H. Zassenhaus. A new algorithm for factoring polynoms over finite fields. Math. Comp. 36: 587–592, 1981. G. Cardano. Ars Magna or the Rules of Algebra. Dover Publications, Inc., New York 1993. J.H. Davenport, Y. Siret, E. Toumier. Computer Algebra. Academic Press, London 1988. H. M. Edwards. Galois Theory. Graduate Texts in Mathematics 101, Springer, New York 1984. W. Feit, J. Thompson. Solvability of groups of odd order. Pacific J. Math. 13: 755–1029, 1963. K. Geißler, J. Klüners. Galois group computation for rational polynomials. J. Symbolic Comput. 30: 653–674, 2000. K. Geißler. Berechnung von Galoisgruppen über Zahl- und Funktionenkörpern. Dissertation, Berlin 205 Seiten, 2003. A. Gelfond. Sur le septième problème de Hilbert. Dokl. Akad.Nauk 2: 1–6, 1934. R. Göttfert, H. Niederreiter. On a new factorization algorithm for polynomials over finite fields Math. Comp. 64: 437–353, 1995. P. Halmos. Naive Mengenlehre. Vandenhoeck und Ruprecht 1976. G.H. Hardy, E.M. Wright. Einführung in die Zahlentheorie. Oldenbourg 1958. I. N. Herstein. Topics in Algebra. John Wiley & Sons, Inc., New York 1975. dt. Übersetzung: Algebra, Physik Verlag, Weinheim 1978. A. Hulpke. Konstruktion transitiver Permutationsgruppen. Dissertation, Aachener Beiträge zur Mathematik 18: 159 Seiten, 1996. B. Huppert. Endliche Gruppen I. Springer 1967. N. Jacobson. Basic Algebra I. W. H. Freeman and Company, San Francisco 1974. N. Jacobson. Basic Algebra II. W. H. Freeman and Company, San Francisco 1980. M. Jarden. Infinite Galois Theory. Handbook of Algebra (ed. M. Hazewinkel), North-Holland 269–320, 1996. E. Kaltofen, V. Shoup. Subquadratic-time factoring of polynomials over finite fields. Math. Comp. 67: 1179–1197, 1998. I. Kaplansky. Fields and Rings. The University of Chicago Press, Chicago-London 1972. B. M. Kieman. The Development of Galois Theory from Lagrange to Artin. Archiv for History of Exact Sciences 8: 40–154, 1971. M. Kneser. Ergänzungen zu einer Arbeit von Hellmuth Kneser über den Fundamentalsatz der Algebra. Math. Z. 177: 285–287, 1981. S. Lang. Algebra. Addison-Wesley Publishing Company, Reading, MA 1965. A.K. Lenstra, H.W. Lenstra,Jr., L. Lovász. Factoring polynomials with rational coefficients. Math. Ann. 261: 515–534, 1982. E. Lucas. Sur les congruences des nombres eulériens et des coefficients différentiels des fonctions trigonométriques, suivant un module premier. Bull. Soc. Math. France 6: 49–54, 1878.
312
[32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63]
Literaturverzeichnis
H. Lüneburg. Galoisfelder, Kreisteilungskörper und Schieberegisterfolgen. Bibliographisches Institut, Mannheim-Wien-Zürich 1979. B. H. Matzat. Konstruktive Galoistheorie. Lecture Notes in Mathematics 1284, Springer, BerlinHeidelberg-New York 1987. J. McKay. Another proof of Chauchy’s group theorem. Amer. Math. Monthly 66: 119, 1959. P. Monsky. On dividing a square into triangles. Amer. Math. Monthly 77: 161–164, 1970. W. Narkiewicz. Global Class Field Theory. Handbook of Algebra (ed. M. Hazewinkel), NorthHolland 365–393, 1996. O. Neumann. Two proofs of the Kronecker-Weber theorem according to Kronecker and Weber. J. Reine Angew. Math. 323: 105–126, 1981. P. M. Neumann, G.A. Stoy, E.C. Thompson. Groups and Geometry. Oxford Science Publications 1994. H. Niederreiter. Factorization of polynomials and some Linear-Algebra problems over finite fields. Linear Algebra and its applications 192: 301–328, 1993. H. Niederreiter. Factoring polynomials over finite fields using differential equations and normal bases. Math. Comp. 62: 819–830, 1994. P. Palfy. A polynomial bound for the orders of primitive solvable groups. J. Algebra 77: 127–137, 1982. H. Pohst, H. Zassenhaus. Algorithmic algebraic number theory. Cambridge University Press, Cambridge New York, Encyclopaedia of Mathematical Sciences 30: 1989. L. Pyper, A. Shalev. Asymptotic results for primitive permutation groups. J. Algebra 188: 103– 124, 1997. H. W. Richmond, A construction for a regular polygon of seventeen sides. Quart. J. Pure Appl. Math. 26, 206–207, 1893. L. Toti Rigatelli. Evariste Galois 1811–1832. Birkhäuser Verlag, Basel 1996. T. Schneider. Transzendenzuntersuchungen periodischer Funktionen. I, II.. J. Reine Angew. Math. 172: 65–74, 1934. E. Scholz. Geschichte der Algebra. BI Wissenschaftsverlag, Mannheim-Wien-Zürich 1990. J. P. Serre. Topics in Galois Theory. Jones & Bartlett Publishers, Boston 1992. I.R. Shafarevitsch. Construction of fields of algebraic numbers with given solvable Galois group. Izv. Akad. Nauk. SSSR. Ser. Mat. 18: 525–578, 1954. Amer. Math. Soc. Transl. 4: 185–237, 1956. L. Soicher. An algorithm for computing Galois groups. Computational Group Theory (ed. M. D. Atkinson), Academic Press 291–296, 1984. R. Stauduhar. The determination of Galois groups. Math. Comp. 27: 981–996, 27. I. Stewart. Galois Theory, second edition. Chapman and Hall, London-New York 1989. M. Suzuki. Group Theory I. Springer, Heidelberg 1982. B.L. van der Waerden. A History of Algebra. Springer, Berlin-Heidelberg-New York 1985. B.L. van der Waerden. Algebra I, 9. Auflage. Springer, Berlin-Heidelberg-New York 1993. B.L. van der Waerden. Algebra II, 6. Auflage. Springer, Berlin-Heidelberg-New York 1993. H. Völklein. Groups as Galois Groups - An Introduction. Cambridge Studies in Advanced Mathematics 53, Cambridge University Press, Cambridge-New York 1996. Boto von Querenburg. Mengentheoretische Topologie. Springer, Heidelberg 2001. H. Weber. Lehrbuch der Algebra. Vieweg, Braunschweig 1895. F. Winkler. Polynomial Algorithms in Computer Algebra. Springer, Wien, Texts and Monographs in Symbolic Computation 1996. H. Zassenhaus. On Hensel factorization. J. Number Theory 1: 291–311, 1969. M. Zorn. A remark on methods in transfinite algebra. Bull. Amer. Math. Soc. 41: 667–670, 1935. K. Zsigmondy. Zur Theorie der Potenzreste. Monatshefte für Mathematik und Physik 3: 265– 284, 1892.
Stichwortverzeichnis An 87 Abel, N. ix abelsche – Körpererweiterung 175 abgeschlossen – algebraisch 286, 299 – reell 282, 286 Ableitung 118 Abschluss – algebraischer 46, 49 – rein inseparabler 126 – separabler 126 Absolutwert 180, 214 – archimedischer 181, 185 – nichtarchimedischer 187, 214 – trivialer 187 Adjunktion 35 algebraisch 40 – abgeschlossen 46, 286, 299 – ganz 261 algebraische – Erweiterung 40 algebraischer Abschluss 46, 49 Algorithmus – Berlekamp- 229 – euklidischer- 12 – Hensel- 232 – Lenstra, Lenstra, Lovász- 234 – Zassenhaus- 230, 232 alternierende Gruppe 76 angeordnet 188 archimedisch 181 arithmetrische – Progression 166 Artin, E. 97, 100, 169, 171, 279 auflösbar 85, 91 Automorphismus 67
Berlekamp – Algorithmus 229 – Matrix 229 Berlekamp, E. 229 Betrag 280 Bewertung 179, 180, 188 – p -adische 188, 190 – diskrete 190, 196 – exponentielle 189
– Ring 179, 190, 194 – triviale 189 Cameron, P. 275 Cardano, G. viii, 251 Cardano-Formel 251 Cauchy, L. 74 Cauchy-Folge 181, 202 Charakteristik 30 Chevalley, C. 196 Chinesischer Restsatz 175 Dezimalbruch 182 Diophantische Gleichung 180 Dirichlet, J. 166 diskret 190 – Bewertung 196 – Topologie 200 Diskriminante 245 Doppelnebenklasse 78 prim
En 148 einfach 35, 66, 88 – Erweiterung 40, 52 – Gruppe 91, 275, 277 Einheit 7 Einheitswurzel 130, 132, 134, 148, 172, 212 Einsetzungshomomorphismus 21 Eisenstein, F. 28 elementarsymmetrisch 246 Epimorphismus 2, 67 Erlangener Programm 93 Erweiterung – algebraische 40 – endlich erzeugte 35 – galoissche 95, 99, 100, 104, 105, 110, 117, 120, 121, 132, 150, 155, 169, 177 – normale 110 – Radikal- 129, 130, 132, 133, 172 – rein inseparable 125 – separable 117, 121 Erweiterungskörper 35 Euklid 10 euklidischer – Algorithmus 12 – Ring 10, 20 Euler, L. ix, 142
314
Stichwortverzeichnis
Eulerfunktion 149 Faktor – gruppe 66 – ring 66 Fermat, P. 142 Fermatprimzahlen 142 Ferrari, L. viii, 254 Ferrari-Formel 254 formal reell 281 formale Potenzreihen 191 Frobenius, G. 124 Frobeniusautomorphismus 124 Galois – Erweiterung 95, 99, 100, 104, 105, 110, 117, 120, 121, 132, 150, 155, 169, 177 – Gruppe 92, 107, 123, 134, 175, 177, 245, 261, 274 Galois, E. xi ganz algebraisch 261 Gauß, C. F. 11, 55, 137, 141 Gaußsche Zahlen 11, 32 Gelfond, A. 305 gerade Permutation 76 GF(p) 31 GF(p n ) 124 G (K/k) 92 GL(n, p) 79 Göttfert, R. 235 G (Qn /Q) 153 Grad 36 – Satz 36 grad f 19 Gruppe 61 – 2-transitive 275 – abelsche 176 – alternierende 76 – angeordnete 188, 214 – auflösbare 86, 91 – einfache 91, 275, 277 – Faktor- 66 – Galois- 92, 107, 123, 134, 175, 177, 245, 261, 274 – primitive 276 – Symmetrie- 64 – symmetrische 73, 107, 245 – transitive 89 – zyklische 70, 72, 77, 148
Hasse, H. 184 Hasse-Teichmüller-Ableitung 236 Hauptidealring 9, 10, 194, 196 hausdorffsch 200 Hensel, K. 207 Hensel-Algorithmus 232 Henselsches Lemma 207, 232 Hermite, Ch. 301 Hilbert, D. 171, 305 Hom(G, H) 67 Homomorphiesatz 69 Homomorphismus 2, 67 Ideal 1 – 2-seitiges 1 – Links-/Rechts- 1 – maximales 5 Index 62 inseparabel – rein 125 inseparabler – Abschluss 126 Integritätsbereich 4 irreduzibel 6, 21, 213 Isomorphismus 2, 67 – Ordnungs- 199, 281 k-Einbettung 104, 111 k-isomorph 44 k-Zyklus 73 Kern 2, 67 Kette – Standard 292 – Sturmsche 291 Klein, F. 76, 93 Kneser, M. 297 Körper 1, 3 – angeordneter 279 – endlicher 123 – Erweiterungs- 35 – Kreisteilungs- 148, 175, 177 – lokaler 205 – Prim- 30, 35 – Quotienten- 25, 40 – Restklassen- 190 – Schief- 166 – topologischer 200 – Unter- 35 – Zerfällungs- 46, 48, 51, 110, 117, 134
Stichwortverzeichnis
Körpererweiterung 35, 92 – abelsche 175 – algebraische 40 – einfache 35, 40, 52 – endlich erzeugte 35 – galoissche 95, 99, 100, 104, 105, 110, 117, 120, 121, 132, 150, 155, 169, 177 – Grad einer 36 – normale 110 – rein inseparable 125 – separable 117, 121 – transzendente 40 kompakt – lokal 202 Kongruenz 176 konstruierbar 137 Konstruktion – 17-Eck 143 – 5-Eck 147 Korrespondenz – Galois- 95 Kreisteilungs– körper 148, 175, 177 – polynom 148, 153, 158 Kriterium – van der Waerden 258 kubische Resolvente 253 Kürzungssatz 63, 69 Lagrange, J. ix, 62, 132 Lagrange-Resolvente 132, 171 Landau-Mignotte-Ungleichung 221 Laurent, R. 192 Laurentreihen 236 – formale 191, 192, 206, 210 Legendre, A. 156 Legendre-Symbol 156 Lemma – von Gauß 25 – von Hensel 207 – von Zorn 6 Lindemann, C. 302 Links– Ideal 1 – Nebenklasse 61 LLL-Algorithmus 234 lokal kompakt 202 Lokal-Global-Prinzip 184 lokaler Körper 205
Lucas, É. 239 Matrizenring 32 maximales Element 6 Mersenne, M. 147 Mersennezahlen 147 Minimalpolynom 41, 105, 120 Möbiusfunktion 158 Monomorphismus 2, 67 Monsky, P. 306 n-Eck 137, 140 Nebenklasse – Doppel- 78 – Links-/Rechts- 61 Nebenklassenvertretersystem 62 Niederreiter, H. 235 Norm 169 normal 110 normale Hülle 111, 129 Normalteiler 66, 76 Nullstelle 21, 117, 220, 284 Nullteiler 4
Ordnung 71, 188, 279 – einer Nullstelle 117 – induzierte 281 Ordnungs – Isomorphismus 199, 281 ϕ(n) 149 p -adisch 188, 190 p -adische Zahlen 179, 182 p -Gruppe 85, 87 p -Untergruppe 82 Palfy, P. 276 Permutation 73 – gerade, ungerade 76 Platon 55 Polynom 19 – elementarsymmetrisch 246 – Kreisteilungs- 153 Polynomring 18 Potenzreihenring 191, 214, 236 Prim – element 7 – faktorzerlegung 6, 23 – ideal 4 – körper 30, 35 – zahlen
315
316
Stichwortverzeichnis
Fermat 142 in arithm. Progression 166 Mersenne 147 primitive Operation 276 primitives Element 35 Punkte 55 Pyber, L. 276 Pythagoras 57, 60 Qab 155 Qp 33, 182, 211 Quadratur des Kreises 59 Quotientenkörper 25, 40
Radikalerweiterung 129, 130, 132, 133, 172 Raum – metrischer 202 Rechts– Ideal 1 – Nebenklasse 61 reell – abgeschlossen 282, 286 – formal 281 Resolvente – kubische 253 – Lagrange- 132, 171 Restklassen – Körper 190 Resultante 223 Richelot, F. 143 Ring – Bewertungs- 179, 190, 194 – euklidischer- 10 – Hauptideal- 9, 10, 194, 196 – Matrizen- 32 – Polynom- 18 – Potenzreihen- 191, 214, 236 – Unter- 30, 35 – ZPE- 13, 20, 26, 27 Ruffini, P. ix Σn 73 (K) 281 Satz – vom primitiven Element 122 – von Artin 100, 169 – von Artin und Schreier 171 – von Cauchy 85 – von Chevalley 196 – von Dirichlet 166
– von Eisenstein 28 – von Feit und Thompson 63 – von Galois 134 – von Gauß 141 – von Hilbert 171 – von Kronecker und Weber 155 – von Lagrange 62 – von Lucas 239 – von Monsky 306 – von Ostrowski 185 – von Sturm 291 – von Sylow 78, 80 – von Wedderburn 166 – von Zsigmondy 165 Schiefkörper 166 Schneider, T. 305 Schreier, O. 171, 279 separabel 117, 120 – Abschluss 126 Shafarevich, I. 177, 276 Shalev, A. 276 Signum 76 Soicher, L. 272 Spur 169 Standardkette 292 Stauduhar, R. 261, 267 Sturm 291 – Kette 291 Sylow, L. 80 Sylow-Gruppe 81, 82 Sylvester-Matrix 223 Symmetriegruppe 64 symmetrische – Funktion 245 – Gruppe 73, 107, 245 Tw 199 Teiler 6 – größter gemeinsamer 9, 217, 221 Thompson, J. 63 Topologie 199 – diskrete 200 transitiv 89 Translationssatz 113 Transposition 73, 89 transzendent 40
Ultranorm 181 Umkehrproblem
Stichwortverzeichnis
– der Galoistheorie xi, 277 ungerade Permutation 76 Unter – körper 35 – ring 30, 35 Untergruppe – normale 65, 76 – Sylow- 81, 82 unzusammenhängend – total 200 van der Waerden, B.L. 258 Vandermonde, A. T. 133, 248 verschränkter Homomorphismus 174 Vervollständigung 203 vollkommen 122, 206 vollständig 182, 202, 206 Wedderburn, J. 166
Wertegruppe 188, 199 Winkeldreiteilung 58, 59 Würfelverdoppelung 58 Zahlen – p -adische 179, 182 – ganz algebraische 261 Zassenhaus, H. 230 Zassenhaus-Algorithmus 230, 232 Zentrum 85, 90 Zerfällungskörper 46, 48, 51, 110, 117, 134 Zorn, M. 6 Zornsches Lemma 6 Zp 182 ZPE-Ring 13, 20, 26, 27 Zsigmondy, K. 165 Zwischenwertsatz 289 Zyklenzerlegung 73 zyklische Gruppe 70, 72, 77, 148
317
Weitere empfehlenswerte Titel Gernot Stroth Endliche Gruppen. Eine Einführung, 2013 ISBN 978-3-11-029157-5, e-ISBN 978-3-11-029165-0 Volker Diekert, Manfred Kufleitner, Gerhard Rosenberger Elemente der diskreten Mathematik. Zahlen und Zählen, Graphen und Verbände, 2013 ISBN 978-3-11-027767-8, e-ISBN 978-3-11-027816-3 Volker Diekert, Manfred Kufleitner, Gerhard Rosenberger Diskrete algebraische Methoden. Arithmetik, Kryptographie, Automaten und Gruppen, 2013 ISBN 978-3-11-031260-7, e-ISBN 978-3-11-031261-4 Paul E. Bland Rings and Their Modules, 2011 ISBN 978-3-11-025022-0, e-ISBN 978-3-11-025023-7 Celine Carstensen, Benjamin Fine, Gerhard Rosenberger Abstract Algebra. Applications to Galois Theory, Algebraic Geometry and Cryptography, 2011 ISBN 978-3-11-025008-4, e-ISBN 978-3-11-025009-1 Neil Hindman, Dona Strauss Algebra in the Stone-Cech Compactification. Theory and Applications, 2. Aufl., 2011 ISBN 978-3-11-025623-9, e-ISBN 978-3-11-025835-6
www.degruyter.com