Mathematisch für fortgeschrittene Anfänger
Martin Wohlgemuth (Hrsg.)
Mathematisch für fortgeschrittene Anfänger Weitere beliebte Beiträge von Matroids Matheplanet
Mit Beiträgen von Johannes Hahn, Florian Weingarten , Florian Modler, Martin Wohlgemuth, Manuel Naumann, Jens Koch , Thorsten Neuschel, Peter Keller, Norbert Engbers, Hans-Jürgen Caspar, Kay Schönberger, Deli Hafner, Reinhard Brünner
'''''+.'.'*1'
Mi'
Herausgeber Martin Wohlgemuth E-M ail : mail @m atro id.de www.mathepl anet.de
Wichtige r Hinweis für den Benutzer Der Verlag , der Herausgeber und die Auto ren haben alle Sorgfalt walten lassen, um voll ständige und akkura te Information en in diesem Buch zu publizieren. Der Verlag übernimmt wed er Garantie noch die juristische Verantwortung oder irgendeine Haftung für die Nutzung dieser Info rmationen, für de ren Wirtschaftlichkeit ode r fehlerfreie Funktion für einen bestimmten Zw eck. Fern er kann der Verl ag für Schäden, die auf einer Fehlfunktion von Programmen oder ähnliches zurückzuführen sind, nicht haftb ar gemacht werden. Auch nicht für die Verlet zung von Patent- und anderen Rechten Dritter, die daraus resultieren . Eine telefonische oder schriftliche Beratung durch den Verlag über den Ein satz der Programme ist nicht möglich. Der Verlag übernimmt keine Gew ähr dafür, da ss die beschri eb enen Verfahren, Programme usw. frei von Schutzrechten Dritter sind. Die Wiedergabe von Gebrauchsnamen. Handelsnamen. Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Nam en im Sinne der Warenzeichen - und MarkenschutzGesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag hat sich bemüht, sä mtliche Rechteinhaber von Abbildungen zu ermitteln. Sollte dem Verlag geg enüber dennoch der Nachweis der Rechtsinh aberschaft geführt werden, wird da s branchenübliche Honorar ge zahlt. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deuts chen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http ://dnb.d-nb.de abrufbar. Sp ringer ist ein Unternehmen von Springer Seience-Business Media springer.de © Spektrum Akademischer Verlag Heidel berg 20 I0 Spektrum Akademisch er Verlag ist ein Imprint von Springer 10
ll
12 13 14
54321
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Gren zen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervi elfältigungen, Übersetzungen , M ikroverfilmungen und die Ein speicherung und Verarb eitung in elektro nischen Sy stemen. Planung und Lektorat: Dr. Andreas R üdinger, Barbara L ühke r Herstellung: Cr est Premedia Solutions (P) Ltd , Pun e, Maharashtra, India Sat z: Ma rtin Wohlgem uth und die Autoren Umschlaggestaltung: SpieszDesign, Neu-Ulm Titelbild: © Jo s Ley s ISBN 978 -3-8274-2606-2
Vorwort
Nun liegt das zweite Buch mit Beiträgen von Matroids Matheplanet vor. Alles, was im Vorwort zum ersten Band über den Matheplaneten , seine Mitglied er und die do rtigen Gepflog enheiten gesagt worden ist , gilt weiterhin. Ich muss es nicht wied erholen . Der ers te Band hat den Titel "Mathematisch für Anfänger"; der neu e, hier vorgelegte Band wendet sich a n "fort geschrittene Anfänger". Diese Bezeichnung drückt für uns, die Autoren , zweierle i aus: Zum eine n b ehandelt dieser Band Themen, die a ufb aue nd auf den mathematischen Grundlagen , die im ers ten Band zusammengetragen worden sind , dem Leser abwechslungsreiche und inter essante E inblicke in ver schiedene weiterführende oder fortgeschrit tenere Gebiete der Mathematik geben. Zum zweiten ist es unser Ziel , dass alle s so ver ständlich ist , wie ein Anfänger im jeweiligen neuen Gebiet es sich wünschen wird . Doch so ver schi ed en und weit auseinander die Themen sche ine n, so haben Auswahl und Anordnung der Inhalte eine n roten Fade n. Der Leser wird - so hoffen wir - von Kapitel zu Kapi tel vorw ärts gehen und es wird ihm so vorkommen , al s ob alle s zu sammenhinge, weil nämlich das eine auf dem a nderen a ufbaut und in der Vielfalt de r Themen diese gemeinsamen Grundlagen und wiederkehrenden ma thematis chen Denkweisen gut zu erkennen sind . Am Beginn des Buches steht die Algebra. In sechs umfangreichen Kapiteln wird eine Einführung in die Gruppentheori e gegeb en , die von zyklische n Gruppen , Unterg ru ppe n und Faktorgrupp en üb er Homomorphism en , Isomorphiesätze und die Sylowschen Sätze bi s zur Auflö sbarkeit von Gruppen reicht . Dies entspricht et wa dem St off eine r Algebra I-Vorlesung. Gute Beispi ele und die ric htigen E rk lärungen an der richtigen St elle machen unseren Kurs zur Gruppentheorie zu etwas Besonderem. Daran ansch ließend folgt ein (er stes) Beispiel für die Anwendung von Gruppentheorie im "wirklichen Leben", nämlich be im Rubik 's Cube. De r Algebra-Teil endet mi t einer Darstellung zu endlichen Körpern , welche dann im vierten Tei l, in dem es um Kryp tographie und Fa kt oris ierungs verfa hren geht , ein e Ro lle spielen werden .
VI
Vorwort
Der zweite Teil gibt eine Au swahl von Them en der Diskr et en Mathematik; dazu gehören Beiträge zur Kombinatorik , aus der Graphentheori e und üb er ganzzahlige Optimierung. Es handelt sich hier aber nicht um eine n Grundkurs in elementarer Kombinatorik . Vielmehr erhält der Leser eine n Einblick , wie vielseitig, komplex und ideenreich die fortg eschritten e Kombinatorik sein kann . Wichtige Stichworte sind: Polya-Burnside-Lemma, Partitionszahlen , erzeugen de Funktionen , Heiratsproblem , Bernoulli-Zahlen , Satz von Lagrange, Permanenten und Fixpunkte sowie die Binomialmatrix und das Lemma von Gessel-Viennot. Die behandelten Problem e kann jed er "Anfänger" ver st eh en , denn sie sind an schaulich und auch im Klein en üb erprüfbar. Das ist ein Vorteil der Diskr et en Mathematik. Auch die Geometrie ist anschaulich . Es gibt a be r nicht nur die eleme nt a re Geometrie a us der Schule. Auch Geometrie kann man fortgeschritten be t re ibe n. Das zeigt zunächst ein Beitrag zur Geometrie des Origami , gefolgt von eine r geometrischen Konstruktion des regelmäßigen Sieb zehnecks , für die ganz erhe bliche algebraische Hilfsmittel herangezogen werden mü ssen . In b eid en Beiträgen geht es a uch darum , was man nicht kon struier en kann. Der darauf folgende Beitrag mit eine m Satz üb er ein Dr eieck verallgem ein ert eine n a us der Schule be kannten Sachverhalt. Den geometrischen Teil beschli eßt eine Kon struktion der Kardioide als Hüllkurve eine r Kurvens char. Die Kr yptographie ist das Gebiet der Ma thematik, das in den letz ten Jahrzehnten mi t den mei sten Auft rieb erfahren hat. Ohne Verschlüsselung geh t heute, im onlin e-Zei t alter , nichts mehr , und die Mat hematik liefert die Met hoden zum sicheren Verschlüsseln: die ellipti schen Kurven . In hohem Maße werden in diesem Teil E rgebnisse und Methoden de r Gruppentheorie und der Theorie endlicher Körper benutz t . Wa s der eine ver schlüsselt , das soll der andere nicht (leicht) unerlaubt en t schlüsseln können . Bei der Verschlüsselung spielen seh r große Zahlen mit sehr großen Primfak to ren eine en t scheidende Rolle . Ein a usführlicher Überblick, mi t welchen Methoden man Teiler großer Zahlen finden kann und wie effizient das geh t , schließt sich a n. Im vierten Teil wird damit das Thema Kr yp tographie von "b eiden" Sei ten be t rachte t. Die Sammlung wird im fünften Teil fortgese tz t mi t Beit rägen zur Fouriert ransformation und zu einem klassischen Problem der Vari ationsrechnung, das als Br achist ochronenproblem bekannt ist . Der Schwerpunkt im fünften Teil ist die Zahlentheorie mi t Beiträgen über die bekannte sten t ranszendenten Zah len der Welt , nämlich die Euler sche Zahl e und die Kreiszahl 7r. Zahlen sind t ranszendent , wenn sie eine bes timmte Eigenschaft ni cht haben . Wie beweist man die Nich t-Eigenschaft "Transzendenz"? Das ist t rickreich, also etwas für fortgeschrittene An fänger . In einem weiteren Beitrag a us dem Bereich der elementaren Zahlentheorie laden die repuniis zum Mitdenken ein .
Vorwort
VII
Die Autoren der Beiträge sind junge und alte Mat he mat iker , Physiker ode r Ingeni eure. Sie sch reibe n für die Leser , weil sie ihre p er sönliche Fa szination und Fr eude an der Mat he mat ik teilen und vermitteln wollen . Die Autoren hoffen auf viele Leser , die sich an schli eßend mit Neugi er und voller Begeist erung auf die Mathematik stürzen und den Weg vom mathematischen Anfänger zum Fort geschritten en beginnen und durchhalten . Das wär e ein Erfolg! Man mu ss wissen , was die Mathematik zu biet en hat , damit man sie richtig (ein- )schätzen kann. Matheplanet im Juli 2010
Martin Wohlgemuth {Matroid} aus Witten , Johannes Hahn au s Rostock , Florian Weingarten au s Aa chen , Florian Modl er aus Hannover , Manuel Neumann aus Zürich , Jens Ko ch aus Berlin, Thorsi eti Neusch el aus Tri er , P eier K eller aus Berlin, Norb eri Engbers a us Osn abrück, Hans-Jürgen Caspar aus HenstedtUlzburg, Kay S chönberger aus Berlin, Ueli Hafn er aus Winterthur, Reinhard Briinner a us Rei chert shofen.
D a nks agun gen
Her zlich en Dank an alle Autoren für die sehr gute und erfolgreiche Zusammenarbeit in unser em Team; in sb esonder e mein e ich damit die sachliche und an genehme Durchführung der wech selseitigen Korrekturen . Ganz besonders möchte ich mich b ei Thorsten und J ohannes bedanken , die sich vor allen ander en um die Qualität des ganzen Buchs verdient gem acht haben . Best en Dank den a nde re n Korr ektoren und Probelesern, die mit ihrer Anmerkungen ganz ent sche ide nd zu unser em Buch b eigetrag en haben : buh a us Berlin, Wally au s Dortmund, Curufin. a us Stuttgart, liuepj er au s Münster , xycolon aus Aachen , Mentat aus Heid elb erg, maroinius au s Ro stock, Spock au s Mannheim und Bilbo aus Heid elb erg. Vielen Dank an A ikee und da_bounce, die einze lne Autoren b ei der Er st ellung der t ex-D ateien unter stützt haben. Genau wie die Autoren sind sie alle Mitglied er von Mat ro ids Mat he pla ne t. Vielen Dank an den Sp ektrum Akademi scher Verlag , dort vor allem an den Leiter des mathematischen Programms Herrn Dr. Rüdinger für sein e guten Anregungen und an un sere Lektorin Frau Lühker für die sehr gute Betreuung.
Martin Wohlgemuth
Inhaltsverzeichnis Vorwort. . ... ... . ... .... . ...... . ... .... . .. .... . ... .... ... .... . ..
v
I
1
1 1.1 1.2
1.3
1.4
2 2.1
2.2 2.3 2.4 2.5
3 3.1
3.2
3.3 3.4 3.5 3.6
Algebra Gruppenzwang I - Wir r e chnen mit a llem . . . . . . . . . . . . . . . . Die graue Theorie zu Beginn .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Eine Hie rarchie mathematischer Strukturen Die bunte Praxis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 .1 Beispiele für Gruppen 1.2 .2 Gegenbeispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 .3 Kleingeld- und Uhrenarithrnetik Wieder Theorie: Ein paar Beweise als Grundlage. . . . . . . . . . . . . . . . . 1.3 .1 Einseitig- und Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 .2 Einfache Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 .3 Potenzen .. .... . ...... . ... .... . .. .... . ... .... ... .... . .. Abschluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3 4 4 7 7 10 12 15 15 19 21 24
Gruppenzwang 11 Anonyme M athematiker b ie ten Gruppenthera pie a n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Untergruppen 2.1.1 Das Untergruppenkriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2 Beispiele und Gegenbeispiele 2.1.3 Untergruppen von Z. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2.1.4 Erzeugendensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Nebenklassen und der Satz von Lagrange Normalteiler und Faktorgruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Uhrenarithmetik reloaded . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
25 25 27 28 29 29 33 38 41 42
Gruppenzwang 111 - Sensa tion: Homo Morphis m us ist e in Grupp entier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Gruppenhomomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.1.1 Strukturerhaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.1.2 Kern und Bild. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Mehr Homomorphismen. . .. .. .. . . .. .. . . . .. .. .. . . .. . .. . . .. .. .. 3.2.1 Isomorphismen De r Homomorphiesatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.3.1 Ei nmal mehr zyklische Gruppen. . . . . . . . . . . . . . . . . . . . . . . .. Charakteristische Untergruppen Direkte Produkte und direkte Summen von Gruppen. . . . . . . . . . . .. Abschluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
43 43 45 46 47 48 50 53 54 56 58
x
4
InhaItsverzeich nis
Grupp enzwang IV - Gruppencamp er brauchen Iso( morphie-) matten Hilfssät ze un d Konvent ion en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Der erste Isomor phiesat z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Der zweite Isomor phiesat z Der dr it t e Isomor phiesatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Eine Anwendung der Isom or phiesät ze Absch luss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
59 60 61 63 68 71 74
Grupp enzwang V - Dr, Cauchy und Dr. Sylow bitte zur Grupp en-OP Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Drei grundlegende Au ssagen Da s er ste Teilziel Da s Große Ziel: Die Sylow-Sätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5.4 .1 Der er ste Satz von Sylow , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5.4 .2 Der zweite Satz von Sylow 5.4 .3 Der drit t e Satz von Sylow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Anwen dungen der Sätze von Sylow , . . . . . . . . . . . . . . . . . . . . . . . . . . . . Abschluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75 75 77 80 81 82 85 86 86 89
6.5 6.6
Grupp enzwang VI - R andal e: Grupp endemo muss t e aufgelöst w erden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Und was hat das nun mi t Gruppen zu tun? 6.1.1 (Su b-)Normalreihen . ... . ... ... . ... . ... . .. . ... . ... . .. . .. 6.1.2 Faktoren von (Sub- )Normalreihen und Auflö sbarkeit . . . . . . . . Erste Schrit t e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2. 1 Isomor phie von Subnormalreihen . . . . . . . . . . . . . . . . . . . . . . . .. 6.2.2 Verfeinerungen.... . . ...... . ...... . . ..... . . ...... . . ..... Die Sät ze von Schreier und Jordan-Hölder Kornmut at oren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.4. 1 Die Kommutator-Reihe 6.4.2 Nützlich es für Gru ppentherapeuten . . . . . . . . . . . . . . . . . . . . . .. Nil potente un d p-G ru pp en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
91 91 92 93 94 94 95 97 99 100 102 104 106
7 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8
Ein Spielzeug mit Grupp enstruktur Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Speedcubing. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Gesetze des Würfels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Cubegruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Konj ugat ion und Kommut atoren Ein paar offene P robleme Weitere Inform a tionen
107 107 108 109 109 110 113 115 115
4.1 4.2 4.3 4.4 4.5 4.6 5
5.1 5.2 5.3 5.4
5.5 5.6 6
6.1
6.2
6.3 6.4
Inhaltsverzeichnis
XI
117 118
8.7 8.8
Endliche Körper Wi ederholung muss sein Kör p er haben Charakt er Frob enius mi scht sich ein Polynomringe Adjunktion Symbolische Adj unkt ion von Nullstellen Existen z und Eindeu tigkeit endliche r Körper Zusammenfassung, Literatur und Au sbli ck
11
D iskret e Mathematik
9 9.1 9.2 9.3
Über die Anzahl von Sitzordnungen am runden Tisch Die Frage Der Weg Ver st eh e das Problem 9.3.1 Beispi el 9.3.2 E rste, aber fal sche Lösung 9.3.3 Syst ematisches Probier en Su ch e Zusammenhänge, ersinne eine n Plan und führe ihn aus 9.4.1 Suche im Internet 9.4.2 Ei ne Wer tet abelle 9.4.3 Ei n Plan Üb erprüfe die Lösung 9.5.1 Das Burnsid e-Lemma 9.5.2 Anw endung des P olya -Burnsid e-L emmas 9.5.3 Die T (n , k) -Formel 9.5.4 Ver st eh e die Formel 9.5.5 Gruppe der Rotati on en 9.5.6 Untersche id ungen b ei der Fragestellung Am Ziel 9.6.1 Zwei verschiede ne Ber echnungsweisen ? 9.6.2 Zusammenfassung und Lösung der Aufgabe 9.6.3 Kon struktiver Algorithmus? 9.6.4 Nachbet rachtung
. . . . . . . . . . . . . . . . . . . . . .
141 141 141 142 142 143 143 144 144 145 146 147 147 147 149 150 152 152 156 156 156 157 157
S ummenzerlegungen Zählen kann doch jeder Äquival ente und verwandte Fragen Die Anzahl der Su mmenzerlegungen von n Rekursive An sätze 10.4.1 Su mmenzerlegungen nach Größe der Su mmanden 10.4 .2 Su mmenzerlegungen nach Anzahl der Summanden
. . . . . . .
159 162 162 163 164 164 166
8
8.1 8.2 8.3 8.4 8.5 8.6
9.4
9.5
9.6
10 10.1 10.2 10.3 10.4
. . . . . . . . .
120 123 125 127 129 135 137
139
InhaItsverzeich nis
XII
10.5 Du ali t ät . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.6 Leere Behälter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.7 Erzeuge nde Funkti on en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.7.1 Die Brüc ke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.7.2 Üb er die Brücke gehe n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.7.3 Der Baupla n ist klar. 10.7.4 Zurück zu Summen zerl egungen 10.8 Au sbli ck und Schluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
168 169 171 172 173 174 175 175
P entagon, Kartenhaus und Summenzerlegung . . . . . . . . . . . .. P en t agon alz ahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Ka rt enh aus-Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Erste s Wunder Verallgem ein erte P entagon alz ahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Euler und Kar t enhäu ser? Zweites Wunder Nachlese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
177 178 178 179 179 180 180 182
I)as II eiratsproblem Klein e mat he matische Hilfe für potenti elle Schwiegermüt t er Ein Dor f will heir aten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die gr aphe nt heoret ische Darst ellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . Graphen theor etischer Algori thmus für das P roblem des gewichtsmaximalen Matchings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 12.4.1 Beispiel: Un ser Dorf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 12.4.2 Su che ein optimale s Mateh ing 12.4.3 Der graphentheore t ische Algo rithmus kurz und knapp 12.5 Lösungsweg mi t lin earer Optimierung 12.5.1 Ein schö ne rer Lösungsweg? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.5.2 An satz mit linearer Opt imi erung . . . . . . . . . . . . . . . . . . . . . . . . . 12.5.3 Formulierung der konkreten linear en Optimierungsaufgabe . . 12.5.4 Ganzzahlige Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.6 Zurück ins Do rf. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
183 183 184 185 188 189 190 194 194 194 194 195 197 200
13
Über die Anzahl surjektiver Abbildungen
203
14
Potenzsummen
211
15 15.1 15.2 15.3 15.4 15.5 15.6 15.7
Berechnung großer Binomialkoeffizienten . . . . . . . . . . . . . . . . . . Rechnen gem äß Definition Rekursive Bere chnung Mult ip liziere in günstiger Reih enfolge Teile und (be-)herrsche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Sat z von Legendre Algorithmische Ber echnung Weiter es Anwendungsb eispiel
215 215 216 216 217 218 218 219
11 11.1 11.2 11.3 11.4 11.5 11.6 11.7 12 12.1 12.2 12.3 12.4
Inhaltsverzeichnis
XIII
16 16.1 16.2 16.3 16.4
Über Permanenten, Permutationen und Fixpunkte . . . . . . . . Einführung Das Prinzip der Inklusion und Ex klusion. . . . . . . . . . . . . . . . . . . . . . . . Perman enten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Ren contre-Problem
221 221 221 223 226
17 17.1 17.2 17.3 17.4 17.5
Zählen mit Permanenten Defini ti onen und Vorb ereitungen Zählen mi t P erman en ten und Det erminant en . . . . . . . . . . . . . . . . . . .. Der Satz Beweis der Au ssagen (17 .1) und (17 .2) Beweis de s Satz es
231 231 233 235 236 237
18 18.1 18.2 18.3 18.4 18.5 18.6
Binomialmatrizen und das Lemma von Gessel-Viennot Die Binomialmatrix Pfade und P fadsyste me . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Lemma von Gessel-Viennot Die Determinante der Binomialmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . LU -Zerl egung der Binomialmatrix Ein weit eres Beispi el - Spinne und Feind . . . . . . . . . . . . . . . . . . . . . . .
239 239 241 243 244 246 249
III 19 19.1 19.2 19.3 19.4
Geometrie und Konstruierbarkeit
253
Mathematik des Faltens Winkeldreiteilung und der Satz von Haga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Winkeldreiteilung Satz von Haga und Verallg emeinerung Kon struktion eines Silb ernen Re chtecks . . . . . . . . . . . . . . . . . . . . . . . . . Schlussb em erkung
255 255 257 261 264
20 Das regelmäßige Siebzehneck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 265 20.1 Das Problem und die Re chnung 20.2 Die Konstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 21 Ein Satz von Carnot 21.1 Satz von Carnot 21.2 Umkehrsatz von Carnot
273 273 275
22
277
IV
Die Kardioide als Hüllkurve
Elliptische Kurven und Kryptographie
23 Das Gruppengesetz elliptischer Kurven 23.1 l'vIot ivat ion 23.2 Definition ellipt ische r Kurven 23.3 Sin gul är e P unkte
281 . . . .
283 283 284 285
XIV
InhaItsverzeich nis
23.4 Das Gruppengeset z 23.4.1 Der un endlich ferne Punkt 23.4.2 Die ander en Fälle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 23.4 .3 Zusammenfassung der Definition . . . . . . . . . . . . . . . . . . . . . . . .. 23.5 Die Asso ziativität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 23.5.1 Vorb ereitung 23.5.2 Ausschluss der einfache n Fälle 23.5.3 Der let zte Fall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 23.6 Andere Ansätze 23.6.1 Projektive Geometrie 23.6.2 Divisoren 23.7 Abs chluss
288 289 291 293 294 294 295 298 301 301 303 303
24 24.1 24.2 24.3 24.4 24.5
. . . . . . . . . .
305 305 306 308 309 310 310 312 313 315
Primzahlen und elliptische Kurven 25 25.1 Mathematisches über elliptische Kurven 25.1.1 Ha sses Satz 25.1.2 Elliptische Kurven mod n 25.2 ECM - Faktorisierung mit ellipt ische n Kurven 25.3 Zertifizierung von Primzahlen 25.3.1 Was ist eigentl ich ein Zertifikat? 25.3.2 Das Goldwasser-Kilian-Zertifikat 25.3.3 Am Beispi el der vierten Fermat-Zahl 25.4 Abschluss . ....... . ...... . ....... ....... . ...... . ....... . .....
317 317 317 318 319 322 322 322 324 325
Primzahlen mit Abstand 26 26.1 Der Abstand zwis chen 2 Primzahlen wird beliebig groß 26.2 In jeder unbegrenzten arithmetischen Progression gibt es unendlich viele Primzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26.3 Es gibt a rit hmet ischen Progressionen beliebiger Länge, die nur a us Primzahlen bestehen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
327 327
ECC - Elliptic Curves Cryptography Einführung Da s Problem de s di skreten Logarithmus Schlüsseltausch nach Diffie-Hellman Public-Key-Verschlüsselung nach ElGamal Signi erung nach ElGamal und mit ECDSA 24.5.1 ElGamal-Signatur-Algorithmus 24.5.2 ECDSA 24.6 Index Ca1culus 24.7 Ab schluss
328 329
27 Faktorisierungsverfahren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 331 331 27.1 Einführung 332 27.2 Probedivision
Inhaltsver zeichnis 27.3 Fermat-Faktorisierung 27.4 Lehman-Algorithmus 27.5 Pollard-Rho-Verfahren 27 .6 (p - 1)-Verfahren 27.7 Elli pti sche-Kurven- Method e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27.8 Quadrat isches Sieb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xv
333 335 337 341 345 352
V
Ausblick auf Weiteres
28 28.1 28.2 28.3
28.5 28.6 28.7
Fouriertransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Motivat ion Zeit und Frequen zb er eich Der Weg zur Fourier tran sformation 28.3.1 Von den Fourierreih en zur Transformation 28.3.2 Tabelle zur Fourier transformation von Zeitsignalen . . . . . . . .. Beispi ele mit dem Oszilloskop 28.4 .1 Die Sinusfunktion 28.4 .2 Die Rechteckfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 28.4 .3 Die Dr eieckfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 28.4.4 Gauß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Die Faltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Systeme. . . . . ... . . . . . ... . . . . ... . . . . . .. . . . . . ... . . . . ... . . . . . .. Was es sonst no ch gibt
363 363 364 365 366 367 368 368 370 371 372 372 375 377
29 29.1 29.2 29.3 29.4 29.5
D as B rachist o ch ronenp ro b lem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einleitung Formalisierung des Problems Ein mächtiges Werkzeug : Variationskalkül . . . . . . . . . . . . . . . . . . . . . . . Bestimmen der optimalen Lösung Ab schluss
379 379 381 382 384 387
30 Repunits, geometrische Summen u nd Quadratzahlen . . . . . . 30.1 Einige Sp ezialfälle 30.2 Hilfsmi t t el . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30.2. 1 Die Pe llsehe Gleichung 30.2.2 Rekursive Folgen 30.3 Der Fa ll q = 3 30.3. 1 m geradzahlig . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30.3.2 m ungeradzah lig 30.4 Au sbli ck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
389 390 392 392 394 395 395 396 404
31 31.1 31.2 31.3
405 405 406 408
28.4
Irrat io n a li t ät von e und 7r Einleitung Die Irrationalität von e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Irrationalität von 7f . • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
361
InhaItsverzeich nis
XVI
32 32.1 32.2 32.3
Transzendenz von e und TI' • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • Ei nleitung Die Transzendenz von e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Tr anszenden z von 7r • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • 32.3.1 Vorb ereit ungen 32.3.2 Konj ugiert e von i . 7r •••••• ••••••• ••••••••••••••• ••••••• • 32.3.3 Zwei konträr e Abschätzu ngen
411 411 412 416 418 421 424
Literaturverzeichnis
429
Index
435
Teil I Algebra
1 Gruppenzwang I -
Wir rechnen mit allem
Übe rsicht 1.1
Die graue Theorie zu Beginn
4
1.2
Die bunte Praxis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.3
'N ieder Theorie: Ein paar Beweise als Grundlage . . . . . . . . . . . . . . . . .
15
1.4
Abschluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
24
eh st eh e an eine m Bahnhof mitten in Deutschland und muss möglichst schnell ein paar Fahrkarten kaufen, um meinen nächsten Zug zu sch affen . Mein Problem ist, dass ich zwa r genügend Fünfer- und Zehner-Scheine habe, aber wenig Kleingeld . Und der Automat gibt kein Rückgeld! Reicht mein Kleingeld , wenn die Fahrscheine 12,80 € , 18,60 € und 24,50 € kosten, oder muss ich schnell noch zum Sch alter flitzen und dabei zwei Euro Gebühr in Kauf nehmen? Ich rechne kurz nach : 12,80 + 18,60 + 24,50 = 2,80 + 3,60 + 4,50 = 6,40 + 4,50 = 10,90 = 0,90 Ja, 90 Cent habe ich klein , ich nehme also den Automaten und nicht den Schalter. Später. Ich habe die Bahnfahrerei annähernd unbesch adet überstanden und verabrede mich mit Freunden. Es ist 21 Uhr, und in fünf Stunden wollen wir gemeinsam die Clubs unsicher machen . Ich rechne also wieder kurz : 21 + 5
= 26 = 2
Pünktlich um zwei Uhr stehe ich also vor dem Club. Was hab en beid e Rec hnungen gem einsam? Zum eine n, dass sie a ugenscheinlich nicht richt ig sein können , und zum anderen , dass sie t rotzdem ein sinnvolles Ergeb nis liefern. Es ste llt sich die Frage, ob man diesen obs kuren Rech nungen eine sinnvolle mathematische Interpretation geb en kann .
4
Gruppenzwang I
Das m athem atische Geb iet Gruppentheori e gibt uns die Mittel in die Hand , b einahe beliebig defini erte "Re che nvor schriften" zu unter su chen . Zumindest sola nge diese "Rec he nvorschriften" sich weni gsten s in einigen Ec kpunkten ni cht vom uns gewohnt en Zahlenrechnen unt ers cheiden .
1. 1
Die graue Theorie zu Beginn
Diese E ckpunkte, die wir fest halten wollen , sind die soge nannten Gruppen axiome. Sie be schreiben fünf wesentliche Eigenschaften eines Kon zeptes von "Mult iplika tion" od er "Addit ion".
1.1 .1
Eine H ierarchie mathematischer St rukt uren
Wir gehen zunäch st davon au s, dass wir eine Menge G (wie "Grupp e") gegeben haben, de ren Elemente wir mit einer solchen verallgemeinerten Mult iplikation irgendwie verbasteln wollen . Für so eine Menge definier t man nun folgen de Axiome:
D e fin it ion 1. 1 (Gruppenaxiome ) Sei G eine Menge. E Existenz und Wohldefiniertheit einer Verknüpfung
Ei ne Verknüpfung ist eine Abbildung 0 : G x G -+ G . (Zur genauer en Ab gr en zung spri cht man manchmal präziser au ch von eine r inner en , binären Verknüpfung.) Sie ordnet al so einem P a ar von Elementen von G ein weitere s Element von G zu . Die se Verknüpfung soll unsere "Mult iplikat ion" modellieren. Daher schreiben wir sie au ch in einer Nota tion , die an die Multiplika tion erinnert : St att wie bei a nderen Abbildungen üblich o(a , b) zu schreib en, schreib en wir a 0 b für das Bild von (a, b) unter der Abbildung o. A Assoziativität Die Verknüpfung
0
heißt assoziativ , falls Va, b, cE G : a
0
(b
0
c)
=
(a
0
b)
0
c
gilt. Dieses Axiom sagt uns a lso, dass unser e Verknüpfung mit der gewöhnlich en Multi plikat ion von Zahlen die E igens chaft geme in hat , dass wir in komplizierter en Termen umklammern dürfen , wie wir wollen. Und weil wir das dürfen, ist uns die Klammerung so ega l, dass wir sie b ei assoziativen Verknüpfungen in den meist en F äll en gleich gänzlich weglassen .
1.1 Die graue Theorie zu Beginn
5
N Neutrales El em ent Man sagt, e E G sei ein neutrales Element der Verknüpfung, falls 'V gE G :eo g= g= go e
gilt . Auch dies wird von der Multiplikation reeller Zahlen erfüllt, denn für die reelle Zahl e = 1 gilt diese Eigenschaft. Aufgrund dessen heißt ein neutrales Element oft auch .Einselernent" oder kurz "Eins" der Verknüpfung. Dadurch erklären sich auch die üblichen Bezeichnungsweisen wie e oder 1 für solch ein Element . Wir werden vorerst bei der Bezeichnung e bleiben , a ber gebräuchlicher ist 1. Für eine n Einsteiger kann es ungewohnt sein, wenn ver schi ed ene Dinge (wie et wa die reelle Zahl 1 und neutrale El em ente von b eliebigen anderen Verknüpfungen) mit ders elben Bezeichnung vers eh en werden wie hier. Daher ist es zum Eingewöhnen vielleicht nicht die schlechteste Lösung, zunächst bei e zu bleiben und nach der Eingewöhnungsphase zu 1 zu wechseln. Inverse Elemente Eine weitere Forderung, die man an die Verknüpfung stellen kann , ist die, dass jedes Element 9 E G ein sogenanntes inverses Element g' E G besitzt . Darunter ist folgendes zu verstehen: 'Vg EG :3g' EG:g og' =g' og = e
e meint dabei das neutrale Element, dessen Existenz im vorherigen Axiom gefordert wurde . Wir werden spä t er einsehen, dass es nur ein einziges neutrales Element geben kann , daher benötigt man keinen klärenden Zus atz wie ,~nvers e El emente bzgl. e", um zwischen ver schi ed en en neutralen Elementen zu unterscheiden . Hier muss man zum erst en Mal Vorsicht walten lass en beim Vergleich mit der b ekannten Multiplikation von reell en Zahlen , denn nicht all e reellen Zahlen erfüllen diese Forderung. Die (ein zige) Ausnahme ist b ekanntlich die Zahl 9 = 0, denn, ega l welches g' E IR. wie betrachten , es ist stets 0 . 9' = 0 -::p 1. Alle anderen reellen Zahlen erfüllen dies jedoch. K Kommutativität
Die Verknüpfung heißt kommutativ oder auch abelsch , falls
'V g , h E G : g o h = h o 9 gilt . Di es wird von der uns bekannten Multiplikation reelle r Zahlen wied er uneingeschränkt erfüllt.
6
Gruppenzwang I
Ein Paar (C , 0) wird eine Gruppe genannt , falls es EAN1 erfüllt, d . h ., wenn 0 eine Verknüpfung ist (E) , die assoziativ (A) ist , ein neutrales El em ent besitzt (N) und bzgl. der er jed es El em ent ein inverses El em ent hat (I) . Falls (C , 0) zusätz lich auch K erfüllt, spricht man von eine r kommutativen Gruppe bzw. eine r abelschen Gruppe . Je nachdem, welche dieser Axiome erfüllt sind und welche nicht, vergibt man vers chiedene weitere Namen für solche Strukturen : Erfüllt (C , 0) nur E , so nennt man dies Gruppoid oder Magma . Da "G ru ppoid" eine zweite , wichtigere Bedeutung hat , ist der Begriff Magma im Zweifelsfall vorzuziehen. Jedoch ist eine Struktur, die keinerlei nützliche Eigenschaften hat , zu unspannend , um groß artig darüber zu reden , daher tritt das sowieso selten in E rscheinung. Erfüllt (C , 0) EA , so spricht man von eine r Halbgruppe . Erfüllt (C , 0) EAN, so spricht man von eine m Monoid. Sowohl Halbgruppen als auch Monoide können natürlich zusätz lich auch K erfüllen . Man nennt das ggf. dann eine kornmutative /abelsche Halbgruppe bzw. eine n kommutativen /abelsch en Monoid. Am Ende der Fahnenstange steht dann , wie schon gesagt, mit EAN1 bzw. EAN1K die (kommutative) Gruppe. • Noch ein Wort zur Notation: Mathematiker sind notorische Faulpelze und schreiben daher meist nichts mit auf, was sich vermeiden lässt . 'Wenn man sich an die Definitionen und Konzepte , die durch die Gruppenaxiome gegeben sind, erst einmal gewöhnt hat , geht man in der Regel schnell zu abkürzenden Notationen über. So ist es üblich , bis auf begründete Ausnahmen jed e Gruppenverknüpfung entwed er mit dem gewohnten Multiplikationspunkt (d . h . in der Form a . b) od er - was b esonder s bei abelschen Gruppen üblich ist - mit ein em Plus (d . h . in der Form a + b) zu schreib en . Man sagt auch, dass die Gruppe .multiplikativ" bzw. "addit iv geschrieben" sei . Bei multiplikativer Notation ver zichtet man dann sogar darauf, üb erhaupt ein Verknüpfungssymbol zu benutzen und schreibt nur noch ab für die Verknüpfung von a mit b. Es ist ab er wichtig, dass das ein rein kosm etischer Unterschied ist , denn wie immer sind Namen nur Schall und Rauch. Es kommt einzig und allein darauf an , was unsere Verknüpfung für Eigenschaften hat od er nicht hat , und nicht darauf, ob wir sie mit 0, " +, * od er irg endwie anders bezeichnen .
1.2 Die bu nte P raxis
7
1.2
Die bunte Praxis
1.2.1
Beispiele für Gruppen
B ei s p iel 1.2 (EANIK - gewöh n liche Zahlen) Wir haben bereits während der Definition der Gruppenaxiome gesehen, dass die Menge der von Null verschiedenen reellen Zahlen a lle fünf Axiome erfüllt, d . h. , (JE. \ { Ü} , ·) ist eine a belsche Gruppe. Das gilt , wie wir wissen , genau so für die Multiplikation komplexer und rat ionaler Zahlen , d . h ., (C \ {ü} , .) und (Ql \ { Ü } , .) sind ebenfalls abelsche Gruppen. Man schreibt a bkürzend a uch Ql x ,JE. x und C x für diese Gruppen. (M anchmal wird a uch ein Stern st at t eines Kreuzes benutzt .) E s muss jedoch nicht immer die Multiplikation sein. Wir können uns ganz leicht klarmachen , dass a uch die Addition Gruppen a us Ql, JE. und C macht , denn ...
E A
die Ad dition ist eine Abbildung JE. X JE. -+ JE. , ... die assoziativ ist, denn dass fü r reelle Zahlen
V a , b, c E JE. : a + (b + c) = (a
+ b) + c
gilt, ist uns schon a us der Schule und noch davor be stens bekannt, ... N ... die m it der reellen Zahl Ü ein neutrales Element hat , da
V aEJE.: a+ Ü= a= Ü+ a gilt, ... ... die zu jed er reellen Zahl a mit der reellen Zahl - a ein Inv erses ber eithält, da V a E JE. : a + (-a) = Ü = (-a) + a ist und ... K ... die b ekanntlich a uch kommutativ ist, den n auch
V a, b E JE. : a + b = b + a ken nen und b enut zen wir alle be reits seit vielen Jahren . Im Wesentlich en dasselb e Argument funktioniert nat ürlich auch für (Ql, + ), für (C , + ) und au ch für (Z , + ). Bei let zterem klappt das analoge Vorg eh en mit der • Mult iplika t ion j edoch nicht (siehe weiter unt en) .
B e ispiel 1. 3 (EANI - A ffine Abbildung en) Ei n sehr einfaches Beisp iel eine r Grupp e, die jedoch nicht kommutativ ist, sind sogenannte affi n e A bbildu ngen JE. -+ JE., d . h . Abbildungen der Form X H
ax +b,
Gruppenzwang I
8 wob ei a , b reelle Zahlen sind und a
i-
0 ist.
Wir setzen al so als zug ru nde liegende Men ge G := Aff(III?) := {
f : III? -+ III? I f
ist affin } .
Als Verknüpfun g b enut zen wir die Hintereinande rausfü hru ng von Ab bild unge n, d. h ., für zwei Ab bildungen f , 9 : III? -+ III? definier en wir f o g als die Abbild ung III? -+ III?
f o g := { x
I----t
f (g(x))
Wi r prüfen nach , dass es sich dab ei um eine G ruppe handelt : E Die Verknüpfung ist so defini ert , dass a us zwei affinen Abbildungen
i, 9
III? -+ III? (etwa mi t f (x) = ax + bund g(x) = cx + d) wieder eine Abbildung f og : III? -+ III? wird . Ist f og jedoch wieder eine affin e Abbildung? W ir überprüfen das: Für alle x E III? gilt :
(f 0 g) (x) = f (g(x))
nach Definition
+ d) = a(cx + d) + b = (ac) x + (ad + b) = f (cx
in 9 einges etzt f eingeset zt
Da nun a und c nach Vorau sset zung i- 0 sind, ist au ch ac i- 0, d . h ., f og hat ebe nfa lls die Gestalt , die affine Abbildungen defini eren . A Es gilt a llge mei n für all e Abbildungen f , g , h, die man überhaupt hintereinander au sführen kann, dass diese Hinter ein ander ausführung assoziati v ist:
((f og ) oh )(x ) = (f o g)(h( x)) = f (g(h(x))) = f((g oh )(x )) = (f o(g o h)) (x ) Dabei wurde in jedem Sch rit t nur die De fini t ion der Hintereinanderausführung benutzt. N Wenn m an irgendei nen Au sd ruck in die Abbildung III? -+ III? , e(x ) := x einsetz t , dann kommt der selbe Ausdruck wieder he raus , d . h ., es gilt
f( e(x)) = f (x)
===}
f
e(f( x )) = f( x)
===}
e
0
e= f
und 0
f = f.
Also ist die Abbildung e, die auch identische Abbildung od er kurz Identität genannt und als id IR gesc hriebe n wird , ein neutral es Eleme nt für die Hintereinande raus fü hru ng von Abbildungen .
1.2 Die bunte Praxis
9
Um zu b estimmen , ob alle affinen Abbildungen f : :IR --+ :IR inver se affine Abbildungen haben , schreib en wir uns zunäch st auf, was das heißt : Wenn 9 eine inver se Abbildung wäre, so mü sst en f og = e und also au ch
\/ x E:IR: x = e(x ) = (f
0
g)(x) = f(g(x))
wahr sein. Wenn wir also g(x) mit y abkürzen, dann mü ssen wir x = f(y) nach y auflösen , um herauszufinden , wie 9 denn au ssähe, falls es tatsächlich ein Inv er ses zu f gä be. Das Auflö sen ist einfach:
x= ay+ b
{==}
1 1 b y = -(x -b) = - x - a a a
Wenn es überhaupt eine inverse Abbildung 9 von
f
gäbe , dann mü sste sie
1 b g(x) = - x - a a
erfüllen . Das ist bis jetzt aber nur ein Verdacht , denn wir haben ja angenommen , das s 9 ein Inver ses von f ist, um dieses Resultat zu er halten. Um jet zt nachzuprüfen , dass f wirklich ein Inv er ses hat , gehe n wir den Weg rü ckwärts: Wir definieren 9 : :IR --+ :IR durch die obige Gleichung (und erken ne n jet zt, weshalb wir eingangs a -::P 0 gefordert haben, nämlich damit diese Definition eine n Sinn ergibt ) und prüfen nach , ob die Eigen schaft, die inver se El em ent definiert , wahr ist :
(f
0
g)( x ) = f(g( x))
= f (~X- ~) =
a(~x - ~) +
b
= (x- b)+ b = x=e(x )
===}
f og = e
===}
g of = e
(g 0 f)( x) = g(f( x)) = g(ax+ b) 1 a
= - (ax
+ b) -
b a
= (x+ ~)- ~ = x
= e(x )
Also ist 9 tats ächlich das Inverse von
f.
10
Gruppenzwang I
Damit hab en wir festgestellt, dass (Aff( JR) , 0) tatsächlich eine Gruppe definiert . W ir überz eugen un s jetzt noch davon , dass dies eine nic htabelsche Gruppe ist : Dazu mü ssen wir zwei affine Abbildungen h ,12 finde n, sodass h oh i- h oh ist . Es ist b einahe egal, welch e Abbildungen man da nun tatsäch lich wählt, fast alle Paare werden funk t ionier en und wen n man zufällig eines a uswählt , hat m an gute Chancen , dass es klappt . Ich wähle zufällig he x) = 2x + 1 und h ex) = 3x - 4 und rec hne nach , dass dieses Paa r tatsächlich zu der Ungleichhe it führt :
(h
0
h)(x) = h (3x - 4) = 2(3x - 4) + 1 = 6x -7
(12 0 h)(x ) = h (2x + 1) = 3(2x+ 1)- 4 = 6x - 1
Set zt man nun x = 0 in b eid e Gleichungen ein , sieht man , dass (h 0 12)(0) = - 7 i- - 1 = (12 012)(0) ist , d .h. , h oh und 12012 sind ver schied en e Abbild ungen . (Man b ea chte, dass m an tats ächlich eine Zahl einsetzen mu ss, denn nur weil zwei Abbi ldungs vorschrifte n verschieden sin d, heißt das nicht , dass die Abbildungen a uch verschieden sind, denn man kann ja ein und dieselb e Funkti on durchaus auch m it ver sch iedenen Abbildun gsvorschriften beschreib en .) • Beispiel 1.4 (EANI - Symmetrische Gruppen) Völlig analog lässt sich b eweisen , dass Sym (M ) :=
{I : M
-+ M I I ist bijekt iv }
für jed e Men ge NI zusamme n mit der Hin t ereinander au sführung von Abbildungen eine Gruppe ist. Die Arg ume nte für E , A und N sind dieselb en wie ebe n. Das neu t rale Element ist wie eben die Id entität , d . h .: idM: =
{M-+ M m >-t m
Jede bijekt ive Abbi ldung I die hier als Inverses dien t . Ist sp eziell M
1.2.2
:M
-+ M hat eine Umkehrabbildung 1 - 1 : M -+ M,
= { 1,2, .. . , n }, so schreibt m an auc h Sn statt Sym(M) .
•
Gegenbeispiele
Beispiel 1.5 (EAN - Monoide, die keine Gruppen sind) W ir haben festgeste llt , dass Mult iplikation und Addition b ei un s beka nn t en Zahlen sich oft wie (kommut at ive) Gruppen verhalt en. Das gilt jed och ni cht un ein geschrän kt . Die Tatsache, dass m an ni cht durch 0 te ilen darf, ist un s schon a ufgefallen . Es geht je doch auc h schlim mer:
1.2 Die bunte Praxis
11
So ist (Z \ {O} , ·) im Gegen satz zu (
1, so wü rde das labl = 1 widersprechen (an alog mi t b). Also kann nur lai = Ibl = 1, d . h . a = b = ± 1 sein. Ganze Zahlen wie ± 2, ± 3, ... haben also keine ganzzahligen Inversen. Mit einem ä hnlichen Ar gument kan n man sich auch überzeugen, dass (N, +) ein kommutativer Monoid ist, ab er kein e Gruppe, da außer dem neutralen El em ent o kein e natürliche Zahl ein Inv er ses in N hat . (Bei mir und den meist en ander en Algebraikern ist 0 eine natürliche Zahl. N erst b ei 1 beginnen zu lassen, macht die Algebra nur unnöti g kompliziert!) Wenn wir in obigem Beispiel Aff(lR) die Forderung a =I- 0 fallen lassen , dann st im men die Beweise für E, A und N natürlich ganz gen au so , denn do rt wurde a =I- 0 ja kein einziges Mal benutzt . Au ch K ist immer noch falsch , denn das Beispi el funktioniert ganz genauso. Damit haben wir au ch ein Beispiel für eine n Monoid gefunden , der wed er kommutativ noch eine Gruppe ist . Allgemeiner ist für jede Menge X die Menge Abb(X ) aller Abbildungen X -+ X ein Monoid. Dieser Monoid ist genau dann eine Gruppe , wenn lXI E {0,1 } ist , und genau dann kommutativ, wenn lXI E {0,1,2} ist . • B e is p iel 1.6 (E A - H alb g rup p en) Indem man st att (N, + ) einfach (N)o , + ) betrachtet , also das neutrale El em ent o entfe rn t, kann man sich eine Halbgruppe sch affen , die kein Monoid mehr ist , denn wenn a und b b eid e positive natürliche Zahlen sind , dann ist a + b > a /\ a + b > b, d. h ., die für ein neutrales El em ent notwendige Bedingung Va E N> o : a + e = a kann für kein Elem ent von N> o erfüllt werden. Vorsicht : Allein dadurch , dass man ein neutrales Elem ent aus einer Halbgruppe entfe rn t , kommt man noch nicht automatisch zu eine m Gegenbeispi el. Es gibt Bei spie le, wo der "Rest" wieder ein Monoid ist , d . h . ein neues Element plötzlich neutral wird . • B e ispiel 1.7 (E - V e rknüpfungen o hne A lles) Das Kreuzprodukt von Vektoren au s dem lR 3 ist ein Beispiel für eine Verknüpfung, die weder asso zia t iv oder kommutativ ist noch ein neutrales Element hat . (Von inve rsen Elementen zu sprechen ist natürlich ga r nicht sinnvoll, weil man ein neutrales Element braucht , um die ses Axiom überhaupt zu formulieren .)
12
Gruppenzwang I
Das sieht man schon an den aller einfachsten Vektoren : Für (0,1 ,0), e z := (0 ,0,1) gilt: ey
X
=
(ex x ex ) x e y = JR3 :
v
:= (1,0,0),
ey
:=
e x = -e z
e x x (ex x ey )
Vv E
ex
X
v =
ex x ez
° °
X
=
ey =
-ey
°
Die ersten b eid en Gleichungen zeigen , dass x nicht kommutativ ist , die dritte und vierte zeigen , dass es nicht asso ziativ ist , und die letzt e zeigt , dass kein Vektor neutral sein kann , denn wär e e E JR3 neutral , so müs st e ja insbesondere e x e = e sein , d . h . e = 0. e = erfüllt aber bei spielsweise die notwendige Gleichung e x x 0 = e x nicht .
°
Natürlich sind solche Verknüpfungen nicht unwi chtig, nur weil sie sich nicht den fünf Gruppenaxiomen unterordnen . Sie kommen halt nur in anderen Fragestellungen vor und haben dort ihre Dasein sb er echtigung. Nur untersucht man diese • nicht (immer) mit den Mitteln der Gruppentheori e.
1.2.3
Kleingeld- und Uhrenarithmetik
Die Frage, welch e Gruppe jet zt den Rech enbeispielen der Einleitung eine n sinnvollen Rahmen verleiht , st eht na türlich weiterhin im Raum . Darauf wollen wir nun eine Antwort finden . Beide Bei spiele basieren a uf demselben Prinzip, das man so zu sammenfas sen kann : Wenn zwei natürliche Zahlen, z. B. zwei Stundenzahlen oder zwei Centbeträge, gegeb en sind, so ist die Verknüpfung von beid em dadurch gegeb en, dass man die Zahlen erst wie gewohnt addiert. Falls das Ergebnis größer od er gleich eine r vorg egeb en e Grenze (z. B. 24 Stunden ode r 500 Cent) ist , so wird diese Gren zzahl wied er subtrahiert. Diese Zahl ist größ er oder gleich und klein er als die vorgegeb ene Gren ze und wird als das Ergebnis der Rechnung b enutzt.
°
Die ses Prinzip läuft un te r dem Sti chwort ,,modulo rechnen" natürlich mit be liebigen Grenzen ab . Eine mögliche Definition der Addition modulo n (wobei n eine po sitive, natürliche Zah l sei) ist die folgende : (Wir werden in einem weiteren Kapitel jedoch sehen , dass dies au s t heoret ischer Sicht nicht die sinnvollste ist . Sie ist jedoch zum konkreten Re chnen oder zum Programmieren sehr gut ein setzbar .)
D efinit io n 1.8 Ist x E N, so defini er e: xMODn := x - n
l~J
1.2 Die bunte Praxis
13
Dabei meint l·J die Abru nden-Funkt ion, d . h ., lr J ist die größte ga nze Zahl , die kleiner od er gleich r ist . Um x MOD n zu bestimmen , kann man also folgende Anl eitung b enutzen: Best im me das größt e Vielfach e von n , das noch klein er od er gleich x ist, und subtrahiere es von x . F ür Zahlen a , b, c E {0,1, . .. , n - 1 } definiere die Additio n modulo n durch : a EBn b := (a +b) MOD n
Wieder umgangssprachlich formuliert : Addiere erst wie gewohnt und reduziere dann modulo n , • Ich b ehaupte nun, dass die Menge G n := {0,1, .. . , n - 1 } zusam men mit der Verknüpfung EBn eine Gruppe ist. Das nur zu b ehaupt en reicht selbstverst ändlich nicht, es mu ss bewiesen wer de n:
E Ist no ch relativ einfach : Wenn a E G n und b E G n sind , dann ist a EBn b nach Definit ion schon einmal eine ga nze Zahl. Wegen n l'; ; J : : ; n ,;;; = x ist x MOD n st et s größer oder gleich O. Da n l,;;;J das größte Vielfache von n ist , das klein er od er gleich x ist , mu ss außerdem x - n l,;;;J < n sein , d . h . klein er od er gleich n - 1. Damit ist gezeigt , dass für alle a , b E G n au ch a EB n b E G n ist , dass EBn also eine wohldefinierte Verknüpfung ist . K Die Assozi a tivit ät vers chieben wir a uf das Ende und schauen un s zunächst die Kommut ativität a n : Da a EBn b mittel s der gewöhnlichen Summe a + b defini er t wurde , sollt e die Verknüpfung kommut a tiv werden . Wir pr üfen das nach : a EBn b = (a
+ b) -
n
l
a: b
J=
(b + a ) - n
l
b: a
J=
b EBn a
Also ist EBn kommutativ wie vermutet . N Sehen wir un s nun das neutrale E lement an . Wenn m an einmal raten mü sste , wie das neutrale Element einer Verknüpfung au ssieh t , die als "Addit ion" bezeichnet und durch "Addiere er st und tue dann etwas mi t dem E rgebnis." definiert wurde, dann kommt man relativ schne ll darauf, dass de r einzig naheliegende Kandidat für das neutrale Element 0 ist . P rüfen wir nach , ob das st immt :
Da nun nach Vorausset zung a E a; ist, ist 0 ::::; a < n , also 0 ::::; ;; < 1, J = 0 und somit 0 EBn a = a - nO = a . Da wir schon wissen , dass EBn also kommutativ ist, muss daher a uch a EBn 0 = a sein für alle a E G n .
l;;
14
Gruppe nzwa ng I Über di e Invers en muss man vielleicht einm al nachdenken , bevor da eine zünde nde Id ee kommt. Wenn man sich aber wied er das Uh re n- oder das Kl eingeldbeispi el vor Augen führt, dann sieht man schnell ein, dass man , um a EBn b = 0 zu erre iche n, b "komplem entär" zu a wählen muss, d . h ., b muss der Abstand zum nächstgrößer en Vielfachen von 24 Stunden bzw . 500 Cent sein. Oder allgem ein er : 0 EBn 0 = 0 und für a > 0 ist n - a das Inver se. Das prüfen wir nach: Wenn 0 < a < n ist , dann ist natürlich n > n - a > 0, d . h . n - a E G n . Damit haben wir also schon einm a l keinerlei Problem e. Auch di e Rechnung macht uns kein e Schwierigkeiten :
a EBn(n -a) =a +n -a -n la +~ -a J = n- l~J
= n- n· l= O
Aufgrund der Kommutativität ist a uch (n - a) EBn a = o. A Der letzte Punkt a uf unserer Agenda ist nun die Assozi ativität . Dafür müssen wir eine win zige Vorüberlegung über di e Abrundungsfunktion l·J machen: Egal, welche reelle Zahl x man dort einsetzt , da l·J immer auf di e nächstkleiner e ganze Zahl abrundet, ändert sich nicht viel , wenn wir um eine ganze Zahl vers chi eb en , d . h .:
Vx E IE.V k E Z : lk+xJ = k + lxJ Das b enutzen wir j et zt, um di e Asso ziativität nachzurechnen : Für all e a , b, c E G« gilt :
(a EBn b) EBn c = (a + b MO D n) EBn c
'Wertet man a EBn (b EBn c) genauso aus, so erhält man dasselb e Ergebnis . Das zeigt, dass a EBn (b EBn c) = (a EBn b) EBn e ist, d . h. , EBn ist ass oz iativ. Damit ist also bewiesen , dass (Gn , EBn) eine a belsche Gruppe ist . Ich möchte a nm er ken , dass di e Notation , die ich für die se Gruppe und ihre Ver knüpfung verwendet habe , weit weg davon ist , irgendwie verbreitet, m anchmal üblich oder außerhalb di eses Beispi els nur ein einzi ges Mal verwendet worden zu sein. Wir werden in eine m später en Kapitel no ch eine alternative Konstruktion kennenl ernen , di e uns im Wesentlichen di eselbe Gruppe liefert und mit Z/nZ b ezeichnet wird . Dies ist di e Standardb ezeichnung.
1.3 Wieder T heorie: Ein paar Beweise als Grundlage
15
Um dies e b eiden Konstruktionen aber nicht zu vermischen , solange wir noch nicht wissen , dass sie im Wesentlich en identisch sind, habe ich mich hier ent schi eden , eine ander e Bezeichnung zu wählen .
1.3
W ieder T heorie: Ein paar Bewe ise als Grundlage
E s lohnt sich , einen gen aueren Bli ck auf die Axiome zu werfen . Wenn man ein paar Übungsa ufgab en macht und öfter einmal nachweist , dass dieses oder jenes eine Gruppe ist , dann fällt einem vielleicht auf, dass viel Arbeit dabei ist , die zwa r in den Axiomen gefordert wird , aber in den Beispi elen für Gruppen eigent lich nicht no tw endig ersche int.
1.3.1
Einseitig- und Eindeutigkeit
Nun ist es so, dass man sehr oft doppelten Aufwand hat , um zu zeigen , dass das (vermutet e) neutrale Element e wirklich e· x = x und x . e = x für all e x E G erfüllt. E s sche int, als würde dort immer nur ein und dieselbe Rechnung auf zwei verschiedene Wei sen a ufgeschrieben . De rselbe Verdacht dr ängt sich einem beim Nachprüfen der Definition eines inve rsen E lem ents a uf. Es st ellt sich al so die Frage, ob es wirklich sein muss, dass man immer b eide Varianten der jeweiligen Gl eichung überprüfen mu ss. Gibt es vielleicht eine Gruppe, wo die eine Variante st ets funktioniert, die ander e jedoch nicht? Außerdem fällt auf, dass in den Axiomen nur geforde rt wurde, dass es ein (was ja a uf Mat he m at isch st ets "m indes tens ein" meint) neutrales Element gibt und pro Gruppen elem ent ein Inv er ses. Hier stellt sich die Frage, ob es vielleicht der Fall sein könnte, dass es genau ein neutrales E leme nt und für Gruppen elemente genau ein Invers es gibt . Beide Fragen wollen wir in diesem Abschnitt beantworten und dabei gleich den Umgang mit den Gruppenaxiomen in Beweisen einübe n .
D efinit ion 1.9 Seien X eine Menge und definieren dann :
X x X -+ X eine Verknüpfung a uf die ser . W ir
E in E lem ent e E X heiß t linksneutml , fall s
V xE X:e·x= x gilt , und rechtsneutml , fall s gilt :
VxE X: x ·e=x
16
Gruppenzwa ng I
Sei e E X ein rechts- oder linksneutral es E leme nt. Ein y E X heißt linksinvers zu x, falls y. x = e gilt, und ents pre che nd rechts invers zu x, falls
x· y
=e
gilt. Korrekterweise müsste m an eigentli ch sa gen, dass es sich um ein Linksbzw. Re chtsinverses bzgl. e handelt, sola nge wir no ch nicht bewiesen haben, dass neutrale Elemente eindeutig bestimmt sind . • Ein neutrales Element (ohne Seitenangabe) ist nach dieser Definition ein Ele ment , das links- und rechtsneutral ist , ein inverses El em ent von x ist eine s, das links- und rechtsinver s zu x ist . Man spricht deshalb zur Klarst ellung auch manchmal von "bei dse it ig" neutralen bzw. inv er sen Elementen. L e m m a 1.1 0 (Ein d eutigke it von neu tralen E lementen) Sei X eine Menge und· : X X X -+ X eine Verknüpfung auf X. Ist en ezn rechts - und et. ein linksneutrales El em ent, so gilt bereits en = et. . B eweis : Wir wer ten dazu ei. . en auf zwei ver schiedene Weisen aus: Es gilt
d enn e t. ist linksneutral. Es gilt j edoch auch
o
denn en ist rechtsneutral.
Wie folgt aus die sem Lemma nun die Eindeutigkeit von neutralen Elementen? Ein neutrales Element ist st ets von beiden Seiten neutral. Wenn also e und e l neutral sind , ist e rechts- und e l linksneutral (und a uch umgekehrt natürlich) und laut Lemma deshalb e = e' , Wichtig ist aber, dass es überhaupt ein rechts- und ein linksn eutrales E lem ent gib t . Man betrachte d afür folgendes Bei spiel: B eis piel 1.11 Betrachte eine beliebige Menge X mit mehr a ls einem Element und definiere d arauf eine Verknüpfung durch I;j a , b
E X :a
* b :=
b.
Diese Verknüpfung ist st ets asso ziativ, denn es gilt: I;j a , b, cE
X : (a
* b) * c =
c = b *c = a
* (b * c)
1.3 Wieder Theorie: Ein paar Beweise als Grundlage
17
Die Definition ist so gewählt , dass tats ächlich j edes E leme nt von X linksneu tral ist . Es kann also durchaus viele ver schi ed ene linksn eutrale Eleme nte gebe n . Das Lemm a sagt un s nur, dass dieser ob skure Fa ll höchst en s dann eintreten kann , wen n gleichze it ig kein E leme nt re chtsne ut ral ist . Ind em man umgekehrt a
* b := a
de finie rt , erhäl t man ein Bei spiel einer St rukt ur, die zwar ass oziativ ist , aber viele rec htsneutrale und kein linksneut rale s E lement be sitzt . • Lemma 1.12 (Eindeutigkeit von Inversen) S ei (X ,·) ein Monoid und x E X ein beliebiges El em ent . Ist a n ein rechts- und ai. ein linksinv erses Elem ent zu x , dann gilt o.« = a.t. . Beweis: Der Trick ist erneut , ein P rodukt au f zwei verschiedene Weisen a us zuwerten . Diesm al ist das das Produkt at. . x · a R. Bezei chne das neu t rale E lement (je tz t wirkli ch "das" neut rale Elemen t , weil wir jetz t wissen , dass es eindeutig be stimmt ist) mi t e. Zum einen gilt weil o n re cht sinvers zu x und e recht sneut ral ist . Zum anderen gilt jedoch a uch
weil at. linksinv er s zu x und e linksn eutral ist . Weil (X ,·) das Assoziativgesetz erfüllt, ist ab er c t.: (x· aR) = (a L ' x )· a R, d. h . an = ai.. D Weil das inverse Element zu einem festen x also eindeutig b estimmt ist, kann man sich dafür eine Bezeichnung einfallen lassen , die nur von x abhängt. Üblich ist dafür X- I bei multiplikativ geschriebenen und -x bei addit iv geschriebenen Verknüp fungen . Man beachte a ber , dass wir in die sem Beweis (im Gegensatz zu vorher) a usdrücklich die Assoziativität un d die Eigen schaften des neut ralen Element s benu tz t haben . Wenn m an au f Asso zia t ivität verzicht et und/oder nur ein ein seitig neut rales E lement fordert , dann gilt die E indeutigkeit inve rser Elemente i. A. nicht mehr . (Gleich wird es ein Beispiel dafür geben .) Was ist nun mit der Fr age, ob man den Beweisaufwand reduzieren kann? Folgender Satz zeigt un s, dass man das sehr wohl kann , solange man vorsi chtig ist :
18
Gruppenzwang I
Satz 1.13 (Abgeschwächte Gruppenaxiome) Sei G eine Menge. Folgend e drei A ussagen sin d äquivalent: 1. (G ,·) ist eine Grupp e, d. h. erfü llt EANJ. 2. (G , ·) erfüllt E . ist eine Abbildung G x G --+ G . A . ist assoziativ. NL Es existiert ein linksneutral es Elem ent e L E G . IL Jedes 9 E G hat ein linksinverses Elem ent g' E G .
3. (G , ·) erfüllt E . ist eine Abbildung G x G --+ G . A . ist asso ziat iv. NR Es existiert ein rechtsne utrales Element e L E G. IR Jedes 9 E G hat ein rechtsinverses El em ent g' E G .
B e w e is : Wi r zeigen nur, dass die er sten beiden Au ssagen äquivalent sind , dass die er ste und die dri t te äquivalent sind, beweist man völlig a nalog. Natürlich ist in jeder Gruppe NL und IL erfüllt , das sagen un s schon die Defini tionen . Wir mü ssen also nur die Umkehrung zeigen. Zunäch st überzeugen wir uns jet zt davon , dass jedes zu x E G linksinverse Element x ' au ch rechtsinvers ist . W ähle dafür ein linksinverse s Element x " von x ' (!). Da nn gilt für alle x E G :
x . x'
= et. . (x · x ')
da et. linksneut ral ist
= (x " . x') . (x · x ')
da x " linksinver s zu x '
= x " . ((x' . x) . x ' ) = x 11 . ( et. : x ' )
mehrmals Assozi ativgesetz
=
X
11
·x
I
da x ' linksinvers zu x da e t. linksneutral da x " linksinver s zu x'
Also folgt au s E, A , NL und IL die volle Stärke von 1. Das nutzen wir jet zt wied erum , um au ch N in voller Form zu zeigen : Für alle x E G gibt es ein (jetzt b eid seitiges!) Inv er ses x' und es gilt somit: x · et. = x · (x' . x )
da x' linksinver s zu x
= (x· x ' ) . x
Assoziati vgesetz da x ' au ch rechtsinvers zu x
=x
da et. linksneutral D
1.3 Wieder Theor ie: Ein paar Beweise als Grundlage
19
Unse re Antwortet lautet also : Ja, man kann die Beweisarbeit um die Hälfte reduzier en b eim Exi st en znachweis von neutralen und inver sen E leme nten, sola nge man sich auf eine Seit e (Rechts od er Links) festlegt. An folgendem Beispiel sehen wir , dass eine Struktur mit E , A , NL und IR (und wied er völlig analog a uch E , A , NR und IL) keine Gruppe zu sein braucht . Die Seiten mi schen darf man also nicht . Beispiel 1.14 Wi r be trachten wie vorhin eine beliebige Menge X mi t mindestens zwei Elementen und der Verknüpfung
Ya, b E X : a
* b := b
darauf. W ählen wir nun ein fest es e E X, so ist dieses linksn eutral, wie vorhin festgestellt . Die Defini tion de r Verknüpfung sagt un s, dass a * e = e ist , d . h ., dass jedes E lem ent von X ein Re chtsinverses bzgl. e hat . •
1.3.2
Einfache Rechenregeln
Mit den Axiomen und der Eindeutigkeit von neutralen und inver sen El em enten kann man nun sehr einfache Re chenregeln beweisen , die völlig einleuchtend sind und daher immer ohne Kommentar verw endet werden : Lemma 1.15 S ei G eine Gruppe. Wi r bezeichn en wie üblich das neutrale Elem ent mit 1 und das Inv ers e von x E G mit X- I. Mit diesen B ezeichnungen gilt: 1. 2. 3.
1- 1 =1
YXE G : (x- 1)-I=x Y x, Y E G : (xy) -1 = y - l x -l
Man beachte, dass im drit ten Punkt die Reihenfolge der Fak to ren ver t auscht wird beim Invertieren. Das ist wichtig und sollte stets beachte t werden. Da die gewöhnlichen Rechenoperationen für reelle Zahlen kommutativ sind , kann man die Gleichung für reell e Zahlen ohne schlechtes Gewi ssen a uch als (xy) - 1 = x- 1 y- l sch reiben. Da wir jedoch wissen , dass Gruppen au ch ni chtkommut at iv sein können , muss in allen allgem eine n Beweisen st ets die Reihenfolge de r Faktoren beachtet werden . B eweis: Da 1 neutral ist , gilt 1 . 1 = 1. Dies ist nun ab er a uch die Gleichung, die das Inv er se von 1 charakteri siert und wir wissen , dass es nur ein einz iges E leme nt von G gibt, das diese Gleichung erfüllt (nämlich ebe n das Inv ers e von 1). Also mu ss 1-1 = 1 sein.
20
Gruppenzwang I
Das Inv er se von x erfü llt nach Defini ti on die b eid en Gleichungen x x - 1 = 1 = x-l x. Dies sind nun jedoch a uch genau die b eid en Gleichungen , die das Inv er se von x - I zu erfüllen hat. Wi ed er au fgrund der Einde ut igkeit inver ser Elem ente muss also (x - 1)- 1 = x sein. Au ch hier wenden wir erneut die Eindeutigkeit des Inv ers en a n. (xy) - 1 ist dasjeni ge E leme nt von C , welch es 1 erg ibt, wenn man es mit xy multipliziert. Wir prüfen also, ob y- l x-l diese Eig enschaft hat : ( x y )( y - 1x - 1)
Also st im mt es: (xy) -1
= x (yy- 1) x - 1 = x 1x - 1 =
xx - 1 = 1
= y -1 X- 1.
o
Man beachte, dass m an , wollte man denselben Bewei s für x- 1 y-l führen , in dieser Rechnung die Reihenfolge von Fak toren ver tauschen müsste. In einer nichtkommutativen Gruppe ist das i. A . nicht mögli ch , also wü rde ein solcher Bewei s nicht funktionieren . In der Tat ist es so, dass kommutative Gruppen die einz igen sind, die diese andere Inv ers engleichung erfüllen : Satz 1. 1 6 Sei C ein e Gruppe. Es gilt:
C ist kommutativ {::::::} V x , y E C : (xy) -l = x- 1y- l. Dies zu beweisen ist au ch immer eine beliebte Übungsaufgabe zur Gruppen theorie . Fast jeder Student , der Gruppentheorie hatte, mu sste die se Aufgabe oder eine ähnliche mindestens einmal lösen.
Beweis: ,, ===?": Ist C kommutativ , so wissen wir b ereits, dass (xy) - l = y -l x -l = x- 1 y-l gilt. " {== " :
Ist umgekehrt die se Eigenschaft gegeben, so benutzen wir obiges Lemma und sch reiben x y = ( X - l )- l (Y - 1)- 1. Wenden wir jetzt die gegeb en e Eigens chaft für Inv erse an, so er halten wir ( X - 1)- 1(Y -1 )- 1 = (x -1 Y -1 )- 1,
was sich mit dem Lemma erneut umformen lässt zu ( X - 1Y - 1)- 1 = (Y -1) -1( x - 1)- 1 = yx .
Also gilt wie beh auptet x y = yx für alle x , y E C .
o
1.3 Wieder T heorie: Ein paar Beweise als Grundlage
1.3.3
21
Potenzen
E ine weitere Gelegenheit , den Umgang mi t den Gruppenaxiomen zu üben , ist die Beschäftigung mit Poten zen. Wir können in einer Gruppe ja nicht nur zwei Elemente multiplizieren, sondern beliebig viele Elemente: gl . g2 . g3 . g4 ist ohne Problem e mög lich . (Da wir das Assozia tivgesetz haben , ist es un s sogar egal, wie wir dies klammern.) Um sp eziell für Produkte der Form 9 . 9 . 9 . . .. , die recht häufig vor kom me n, abkürzende Schreib enweisen b enutzen zu können , führen wir Pot en zen ein nach dem Mus t er der schon b ekannt en Poten zen gewöhnlicher Zahlen : D efin it io n 1. 17 (Potenzen mit ganzzahligem Exponenten) Sei (X , ·) eine Gruppe und x E X b eliebig. W ir definieren für alle
ti
E
N. Für neg ative Exponenten definieren wir: X
- n- 1
:=
x
- n-1
·x
für alle n E N.
•
Die Definition folgt dem gewohnten Muster der Poten zgesetze, die wir kennen . Das folgende Lemma zeigt, dass auch die meisten ander en un s bekannten Pot en zgesetze erfüllt sind: Satz 1. 18 S ei (X,· ) eine Gruppe und x E X beliebig. Es gilt : 1. 2.
Vn , m E Z : V n ,m E Z :
x n +m = x n . x m x nm = (x n) m
Insb esondere schließt die zwei te Aussage X
-n
=
( X n) -l
=
( X -l)n
m it ein .
Der Bewei s kann sehr einfach sein , wenn man sich "Pünktchen-Beweise" erl aubt . Ein form eller Beweis wartet jedoch mit win zigen Fall en auf, in die man leicht tappen kann : B e we is : Der Beweis wird , wie gesagt, durch Induktion geführt. Wi r ent scheiden uns fü r Induktion nach m .
Der Induktionsanfang ist sehr einfach, denn
22
Gruppenzwang I
ist nach Defini t ion wahr. Für den Induktionsschrit t zeige n wir zunächs t , dass die Behauptung für alle n E Z und m = 1 wahr ist . Die Gleichung x n+ 1 = x n . x ist zwar für n ;::: 0, ab er ni cht für n < 0 durch die Definition gesiche rt. Es gilt dann jed och für n ;::: 0
J etz t üb erzeu gen wir un s genauso, dass die Beh auptung für m = - 1 wahr ist . F ür n :::; 0 ist das wied er per Definiti on gegeb en und für n > 0 gilt :
Also gilt :
(*) Neh me n wir nun an , dass
wah r ist. Dann folgt für alle n E Z: xn+(m±l)
=
x (n+m )±l
= x n +m . x±l = (x n . x m ) . X±l = x n . (x m . x ±l ) n
=x ·x
(*) LV . Assoziativität
m ±l
Also ist die Au ssage a uch für m m E Z wahr ist .
(*)
± 1 wah r . P er Induktion folgt , dass sie für alle
Auc h für die zweite Au ssage üb er zeu gen wir uns zue rst von der Gültigkeit des Induktionsanfangs m = 0:
Gu t , bis dahin kein e P robleme . Gen au wie vorher prüfen wir die F älle m = 1 und m = - 1. F ü r m = 1 ist das sofor t klar, denn nach Definition ist
Für m = - 1 wenden wir die Definition des Inver sen und die schon bewiesen e Gleichung a n:
0 1 ===} x - n =X (n) - l X - n · x n = x - n+n =X=
1.3 Wieder T heorie: Ein paar Beweise als Grundlage
23
Zusammenfassend gilt also schon einm al:
(*) Und das nutzen wir jet zt für den Induktionsschluss. Fall s
bereits gilt, folgt für alle n E Z: x n( m±l) = x nm ±n
siehe ob en
= (x "r" ·x ±n = (x n)m . (Xn) ±l = (x n)m ±l
LV .
(*) siehe ob en
Also folgt p er Induktion die Gültigkeit der zu zeigende n Gleichung Vm E Z. D Der Beweis ist natürlich nicht auf Gruppen beschränkt . Die Definitionen und P oten zgesetze gelten au ch unter geringeren Vorausset zungen , wenn man die Exponenten ent spreche nd einsc hränkt . So ist etwa die Definition
allen Monoide n sinnvoll. Selb st auf die neutralen El em ente kann man verzichte n , wenn man
In
definiert. Auch dann gelten die b eid en Poten zgeset ze
immer no ch für alle Exp on enten , für die die Au sdrücke sinnvoll sind, d . h . für n , m E N b ei Monoiden und n , m E N>o bei Halbgruppen . Die Beweise sind jeweils exakt dieselb en wie ob en skizziert , nur dass man ebe n auf die Verw endung von Inv ers en ver zichtet und ggf. den Induktionsanfang auf m = 1 stat t m = 0 festlegt .
24
1.4
Grupp enz wang I
Abschluss
Das soll es bis hierher zur Definition und zum Umgang mit Gruppen gewesen sein. Es ist nur ein winziger Einblick in die Gruppentheorie gewesen, aber ich hoffe , trotzdem den einen oder anderen für mehr interessiert zu haben , denn mehr wird es geben. (m jg) -l . Gockel
Johannes Hahn ( Gockel) ist Dipl.-Math. und promoviert in Jena.
2 Gruppenzwang 11 - Anonyme Mathematiker bieten Gruppentherapie an
Übersicht 2.1
Untergruppen
25
2.2
Nebenklassen und der Satz von Lagrange
33
2.3
Normalt eiler und Faktorgruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
2.4
Uhrenarithmetik reloaded . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
2.5
Abschluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
Hallo, G ru ppentheori e-Fans un d solch e, die es einmal werden wollen ! In diesem Kapitel der Gruppenzwang-Reihe soll es darum gehen, verschiedene Grundkonzepte de r Gruppentheorie einzuführen .
2.1
Untergruppen
D efinit ion 2. 1 (Untergrupp en) Sei G eine G ruppe. Eine Teilmenge U ~ G heißt Unte rgruppe von G, falls U zusammen mit der auf U eingeschränkten Verknüpfung selbst eine Gruppe ist . Ei ne übliche, abkürzende Notation für "U ist Untergruppe von G" ist U ::; G .
•
Zunächst übe rleg en wir uns ein paar elementare Dinge üb er Untergruppen. Was sagt uns b eispielsweise das erste Gruppenaxiom? Wi r erinne rn uns: E Existenz und Woh ldefiniertheit: Die Verknüpfung ist ein e Abbild ung U
X
U ---+ U.
26
Gruppenzwang 11
Die Verknüpfung hier ist laut Definition , d . h ., das das auch schon in G war. dieses Produkt wieder in unter der Multiplikation .
die Einschränkung der Gruppenverknüpfung von G Produkt zweier Elem ente von U ist dasselb e, wie es Die wesentliche Forderung b esteht jet zt darin , dass U landen muss . Man sagt dazu U sei abgeschlossen
Was sagt uns das zweite Gruppenaxiom? A Assoziativität : V a, b, cE U : (ab)c
= a(bc) .
Hier ist nichts passiert , denn das Assoziativitätsgesetz gilt ja schon für G und wenn die Gleichung für alle El em ente von G richtig ist , dann ist sie erst recht auch für alle El em ente von U richtig. Weiter zum nächsten Axiom: N Neutrales El em ent: :3 eu E U V u E U: eu . u = u. Jetzt wird es sch on spannender : Wir wissen , dass G ebe nfalls ein neutrales Elem ent besitzt . Aber sind das jetzt zwei verschied en e Elem ente od er ist es ein und dasselbe? Wir prüfen das nach: Es muss ja
eu eu = eu gelten. Wenn wir nun das Inv ers e (in G) von
e t]
benutzen, erhalten wir
- 1eu = eo. eu = (eu- 1eu ) eu = eu- I (eu eu ) = eu Also unterscheiden sich das neutrale Element von U und von G nicht voneinander. Das liefert eine weitere Begründung dafür, weshalb man neutrale Elemente meist ohne Unterscheidung für alle Gruppen als 1 (bzw. 0, falls es sich um additiv geschrieb en e Gruppen handelt) b ezeichnet. Was sagt uns das letzte der vier Gruppenaxiome? Inv ers e El em ente: V u E U :3 u' E U: u' u =
et] :
Auch hier stellt sich die naheliegende Frage: Ist das in G b erechnete Inverse von u dasselb e, wie das in U berechnete? Ja, das ist der Fall , denn
,
u u = eu = eo, wie wir uns eben überlegt haben. Das Inverse in der Gruppe G ist nun eindeutig durch diese Glei chung bestimmt, d . h., u' ist auch das Inverse von u bzgl. G . Dies wird auch als Abgeschlossenheit unter Inversenbildung bezeichnet. Dies liefert uns eine Rechtfertigung, alle Inv ers en stets mit X - I (bzw. ebe n - x b ei additiv geschrieb enen Gruppen) zu notier en, ungeachtet der Gruppe, auf die wir uns b ezieh en. Ab jetzt werden wir das auch tun.
27
2.1 Untergruppen
2.1.1
D as Untergruppenkriterium
Unsere Überlegungen fassen wir in folgendem Lemma zu sammen , das un s zugleich a uch eine Met hode in die Hand gibt , Teilmen gen darauf zu unter suchen , ob sie denn wirklich Untergru ppe n sind: Lemma 2.2 (Untergruppenkriterium) S ei C eine Gruppe und U <:;;; C eine Teilm enge. Äquivalent sin d: 1. 2.
U ::; C , d. h., U ist eine Untergruppe von C. U erfü llt:
a) b)
c) 3.
U erfüllt :
a) b) Beweis: ,,2.
V u , v E U : uv E U 1EU Vu E U: u - I E U
===}
U -::P 0 V u ,v EU : uv-I E U ,,1.
===}
2." haben wir un s eben üb erl egt.
1." folgt a us gen au den selben Überlegungen :
Wenn 2.a) gegeb en ist , dann ist die Multiplikation eine Abbildung U x U ---+ U , also ist E gegeb en . Die Assoziativität gilt sowieso, weil sie für C gilt. Also st im mt auch A. Ist 1 E U , so gilt V u E U : 1u = u , da das ber eits für alle E leme nt e von C gilt, also erst recht für die von U . Das zeigt N. Schli eßlich gilt Vu E U : u - I E U und u - Iu = 1, d.h ., a uch I ist für U erfüllt . Somit ist U eine Unt erg ru ppe. ,,2 . ===} 3." ist ebe nfalls sehr einfach : U -::P 0 gilt , da 1 E U . Sind u , v E U , so gilt nach 2.c) v -I E U und nach 2.a) uv - I E U , also ist 3.b ) erfüllt. ,,3 . ===} 2." Das ist der einzige Punkt , bei dem ein klein er Tri ck ver st eckt ist. Sei zunächst u E U ein b eliebi ges E lement. Nach 3.a) gibt es so et was . Dann gilt nach 3.b) : 1 = uu - I E U , also ist 2.b) erfüllt . Nun sind also 1 und u E lemente von U . Nach 3.b) gilt also u Damit haben wir 2.c) be wiesen .
1
=
lu -
I
E U.
Schließlich folgt a uch 2.a) , denn sind u , v E U beliebig, so gilt , wie eben gesehen, V- I E U und mi t t els 3.b) dami t : u v = u (V-1) -1 E U. D
28
2.1.2
Gruppenzwang 11
Beispiele und Gegenbeispiele
B ei spiel 2.3 (Triviale B e ispiel e ) In jed er G ruppe G sind { 1 } und G selbs t Untergru ppe n von G, denn natürlich sind b eid e nichtleer, abgesch lossen unt er Mult iplikat ion und unt er Inversenbildung. Es kann passieren , dass die s die einzigen Unt ergru ppen von G sind. Das trit t z. B . (gen auer gesagt: dann und nur d ann) ein , wenn G die Gruppe {O ,l , ... , p - 1 } mit der Addition modulo p ist , wobei p eine Primzahl ist . •
B ei spiel 2.4 (Modulorechnen) Erinnern wir uns an das Re chnen modulo n a us dem letzten Kapit el. Die "UhrenArithmetik", a lso {0,1,2, . . . ,23 } zusa mme n mit der Addition mod ulo 24, hat die Untergruppe U := { 0,6,12 ,18 }, denn wenn a und b durch 6 teilbar sind, so a uch a + b und au ch a + b - k · 24 für alle k E Z. Also ist (a + b) MOD 24 ebenfalls durch 6 teilbar , d . h. wieder eine von den vier Zahlen aus U. Also ist U unter Addition modulo 24 a bgeschlossen. U enthä lt auch das neutrale Element 0, es bleibt a lso no ch die Abgesch lossenheit unter Inversenbildung nachzuprüfen . ist das Inverse von 0. Für alle a nderen ist 24 - x das Inverse und , wenn 6 I x , dann ist au ch 6 I (24 - x ). •
°
B ei spiel 2.5 (Gewöhnliche Zahle n) Für die Gruppen bzgl. Addition gilt:
Für die Gruppen bzgl. Multiplikation gilt genauso
• B eispiel 2.6 (Gegenbe ispie le)
°
N ist keine Untergru ppe von Z. E s gilt zwar E N und auch V a, b E N : a + b E N, jedoch ist N nicht unt er Inv er sion abgesch lossen, den n es ist et wa - 1 ~ N.
{ - 1,0, + I} ~ Z ist unt er Inver sion abg eschlosse n und ent hält das neut rale Element , ist jedoch keine Untergruppe von Z, da z. B. 1 + 1 ~ { - 1,0, + 1 } ist .
oist unter Inversion und Mul t iplika t ion abgeschlossen , ist jedoch a uch keine Un tergruppe (ega l, von welcher Gruppe) , weil das neutrale E lement ni cht enthalten i~ . •
2.1 Untergruppen
2.1.3
29
Untergruppen von Z
Wir wollen ein klein wenig komplexeres , dafür aber um so wichtigeres Beispiel besprechen und alle Untergruppen von Z klassifi zier en:
Satz 2.7 Die Untergruppen von Z sind exakt die Teilmengen der Form n Z { nk I k E Z } für n E N. Beweis: Zunächst überzeugen wir uns davon , dass alle diese Teilmengen wirklich Untergruppen sind. Dazu benutzen wir natürlich wieder das Untergru ppenkriterium . Da 0 = n.- 0 E n Z ist, für jed es n, sind alle diese Mengen nichtleer. Sind nk und nm zwei beliebige Elemente von n Z , so ist nk - nm = n(k - m) E n Z, d . h ., n Z ist eine Untergruppe von Z. Es muss nun noch gezeigt werden , dass jede Untergruppe U ~ Z die Form n Z für ein geeignet zu wählendes n hat . Ist U = {O}, so ist nichts zu beweisen, denn {O} = OZ hat bereits die gewünschte Form. Ist U i- {O}, so gibt es also ein Element k E U, das ungleich 0 ist . Falls k < 0 ist, so liegt auch das Invers e - k in U (denn U ist eine Untergruppe) und - k wäre größer als O. Es gibt also in jedem Fall ein Element in U, das größer als 0 ist . Wir bezeichnen mit n nun das kleinste positive Element von U und behaupten , dass für diese natürliche Zahl U = n Z gilt. n ist ein Element von U , d . h ., n + n , n + n + n , n + n + n + n, ... und - n , (-n) + (-n) , (-n) + (-n) + (-n), ... sind ebenfalls Elemente von U , da U als Untergruppe unter Inversenbildung und Addition abgeschlossen ist . Damit haben wir schon n Z <;;; U gezeigt. Es muss also noch die umgekehrte Inklusion gezeigt werden . Sei dafür u E U ein beliebiges Element . Wir führen eine Division mit Rest durch , um u als u =
qn
+r
mit q E Z und r E {0,1, ..., n - 1 } zu schreiben . Nun ist u E U und qn E n Z <;;; U , d .h., u - qn = r ist auch in U. J etzt war n aber das kleinste positive Element von U und r ist nach Kon struktion echt klein er als n . r darf also nicht pos itiv sein . Es bleibt damit als einzige Lösung r = 0, d . h. u = qn übrig. Damit ist u E n Z und , weil u E U beliebig war, auch U = n Z gezeigt . D
2.1.4
Erzeugendensysteme
Es gibt eine allg em ein e Kon struktionsmöglichkeit für Untergruppen, die ich jetzt vorstellen möchte. Dazu üb erz eugen wir uns zunächst von folgendem Fakt :
30
Gruppenzwang 11
Lemma 2.8 S ei G ein e Gruppe und (Ui) iEI eine Familie von Untergruppen U; ::; G. Dann ist auch
Beweis: Der Beweis fällt uns nicht mehr schwer, jetzt, wo wir mit dem Unt ergruppenkriterium so gut umgeh en können : n i EI U, ist nichtleer, da alle U, das Element 1 ent ha lten. Sind x , y E n i E I U, beliebig, so gilt natürlich x, y E Ui für alle i E I. Da alle die se U; Untergruppen sind , gilt a lso x y- l E Us, Da i hier beliebig war , folgt a lso x y- l E n i E I U; wie gewünscht. 0
Damit können wir nun folgende Definition treffen : D e fin it ion 2 .9 Sei G eine Gruppe und E ~ G eine beliebige Teilmenge. Dann bezeichnen wir mit (E) die kleinste Untergruppe von G, die E en thält , d. h. :
(E) =
n
U
u< c
E~U
Dies e Untergruppe be zeichnet man auch als die von E erzeugte Untergruppe. Ist U ::; G eine Untergruppe und (E) = U , so nennt man E ein Erzeugendensystem von U . • Dies ist eine sehr nützliche, abstrakte Beschreibung der von E erzeugten Untergruppe. Genauso nützlich ist aber folgende konkret e Beschreibung: Le m m a 2 .1 0 Sei G eine Gruppe und E
~
G eine beliebige Teilmenge . Dann gilt :
B e w e is : Sei U die Menge auf der rechten Seite. Wir müssen nun zwei Dinge zeigen, wenn wir (E) = U zeigen wollen: 1.
2.
U ist eine Untergruppe, die E en thält , und jede a ndere Untergruppe, die E enthält , enthält auch U , d . h., U ist die kleinste Untergruppe mit dieser Eigenschaft.
Zu 1. U ist nichtleer, denn wenn wir n = 0 in der Definition wählen , ist e~ ' . e ~2 . . . .. e ~n das leere Produkt mit 0 Faktoren, welches definitionsgemäß gleich 1 ist , d .h. 1 E U .
31
2.1 Untergruppen , 1m 2 · d x , y E b e1·Je biJg, d . h . x -- eIk , . e 2k -z ... .. e kn " un d y - fm 1 . 2 Sm geeign et e ei, f i E E und geeignete Exponenten k i , m i E Z , so ist xy -
I _
- e kl
,
.
e 2k 2 .
. . ..
e nk "
.
r': I
. ... .
. . . ..
fm I l für
f 2-m2 . f 1-m, .
Dieses Gruppen elem ent ist von der in der Definition geforderten Form, also E leme nt von U. Damit ist U eine Untergru ppe. U ent hält definitionsgemäß auch alle El emente der Form e = e 1 mit e E E, d . h . E c;;. U.
Zu 2. Ist andererseits V ::; G eine Untergru ppe mi t E c;;. V , dann enthält V alle also au ch alle Potenzen e k , denn V enthält als Untergruppe 1 = eO und ist unter Multiplikation mit e und e- I E V abgesch lossen. Und weil V unter Multiplikation abgeschlossen ist , ent hält es au ch alle Produkte von Potenzen e ~1 . e~2 . . . . . e~". Das heißt also U c;;. V, und die Au ssage ist bewiesen . 0
e E E,
Es gibt natürlich immer Erzeugenden syst em e. Beispielsweise ist st et s U selbst ein Erzeu gendensyst em von U . Wir können selbs t verst ä ndlich auch klein ere Erzeugende nsyste me finden . Welch es Erzeugenden system geschickterw eise gewählt werden sollte , hängt st a rk vom Problem a b, das man lösen möchte. B e ispiel 2.11 E in Erzeugenden system der additive Gruppe
J ed e rationale Zahl (falls a ~ 0) bzw.
%mit
~
I n E N >o }
i,
a E Z , b E N>o kann ja als a . d. h . (falls a < 0) geschrieb en werden .
- i - i - ...
i + i + ...
Wir erkennen jedoch, dass die Darstellung mi ttels E lementen des Erzeugendensystems keinesfalls eindeutig zu sein braucht , denn es ist z. B . 2111111
- = - +- = - +- +- +-. 3336666
•
Für manche Gruppen gibt es besonder s einfache Erzeugendensysteme, mit deren Hilfe man viel üb er die Gruppe aussagen kann. Ein Beispi el dafür sind die sogen annten zyklische n Gruppen: D efinition 2.1 2 (Zyk lische Grup pen) Eine Gruppe, die ein Erzeugendensystem besi tzt , welches gen au ein Element hat , heißt a uch zyklisch. • Eine zykli sche Gruppe G = (g) be steht also nach obigem Lemma gen au aus allen ganzzahligen Potenzen von g: G = {g k I k E Z }.
32
Gruppenzwang 11
Beispiel 2.13 (Ganze Zahlen) Eine une ndliche, zykli sche Gruppe sind die ga nzen Zahlen , de nn {I } ist ein Erzeugen densystem: J ede ga nze Zahl k E Z kann a ls "P otenz" - aufgr und de r addit iven Schreibung ist es hier ein P rodukt - von 1, nämlich a ls k· 1 geschrieb en werden . Es ex istiert (genau) ein weiteres Erzeugenden system , nämlich { - 1 }. Die Unter gruppen n Z sind au ch zyklisch, sie werden erze ugt von { n } mit an a• loger Begründung. Ein weiter es Erzeu genden syst em wäre { - n }.
Beispiel 2.14 (Modulorechnen) Es gibt j edoch a uch endliche zyklische Gruppen . Un ser e Gruppen a us dem let zt en Kapitel {0,1,2, . .. , n - I} zu sammen mit der Addition modulo n bilden ein Beispiel dafür : Au ch hie r ist { 1 } ein Erzeugende nsystem , wie man sich leicht überzeug t . An die sem Beispi el wird a uch klar , weshalb man von "zyklischen" Gruppen spric ht , denn bestimmt man de r Reihe nach a lle "P ot enzen" - au ch hie r wieder a ls P rodukt e geschrieben - von 1 bz gl. der Addition modulo n , so ergibt sich : 0·1= 0 1·1= 1 2 ·1 = 2
(n - 1) ·1 = n - 1 n·1 = 0
(n
+ 1) · 1 =
denn wir rechnen modulo n !!
1
Die Un t er gruppe { 0,6,12,18 } für n = 24, die wir ob en al s Beispi el hatten , ist ebe nfalls zyklisch . Sie wird , wie man sich sofor t klar macht, von {6 } erzeugt .
•
Im Wesen tli chen waren das b ereits all e zyk lische n Gruppen , die es gibt . Wir werden das im näch st en Kap it el prä zise machen . Im vierten Kapitel werden wir dann au ch zeige n , dass die Unter gruppenbeispi ele nur Sp ezialfäll e eines a llgemeinen Prinzip s sind: Untergruppen zyklische r Gruppen sind immer selbs t zyklisch. Ein Wort noch zur Notation : Zwar haben wir die Symbolik (E) nur für Teilmen gen E ~ G de finie rt , benutzt werden jedoch a uch ver schiedene Abwandlungen die ser Nota tion , die nicht ganz unserer Definition en t sprechen .
33
2.2 Nebenklassen und der Satz von Lagrange
Will m an beispi elsweise die Ele me nte von E explizit a nge be n , so lässt m an ggf. auc h die Menge nkla mme rn weg und schreibt beisp ielsweise (x , y, z) st att ({x, y,z}) . In sb esonder e schreibt man b ei zyklische n Gruppen gern G = (g), um ausz udrücken, dass die eineleme ntige Menge {g} ein Erzeugenden syst em von G ist . Hat man die Eleme nte beispi elsweise durchnummeri ert , so schrei bt man a uch (ai li = 1 . .. n ) od er Ähnliches in Anl ehnung an die ent sprec he nde Men genschre ibweise {a i I i = 1 . .. n }. E ine Mischform ents teht , wenn man einfach Mengen und El em ente zusammenw ürfelt . So mein t (E l,E2,x, y ,z) etwa die von e , U E 2 U { x , y , z} erze ugte Untergru ppe . Es ergibt sich ab er üblicherw eise au s dem Kontext , welch e Menge von Erzeugenden jeweils gem eint ist .
2.2
N ebenklassen und der Satz von Lagrange
D efin it io n 2.15 (Nebenklassen) Sei G eine Gruppe, X , Y ~ G beliebi ge Teilmen gen . Dann defini eren wir XY := X . Y := { x y I x E X , Y E Y}
und X -l := { x - l I
x EX }
Ist X = { x} , so schreibe n wir abkürzen d au ch x Y und Y x statt { x} Y und Y { x} . Ist U :::: G eine Unt ergru ppe und 9 E G ein beliebiges E lem ent, dann hei ßt gU eine Linksn ebenklass e von U in G und analog U 9 eine Rechtsnebenklasse von U in G. Bei additiv geschrieb en en Gruppen schre ibt man Ne be nklassen entspre che n d au ch als 9 + U bzw . U + 9 a uf (wobei man die addit ive Notation fast nur bei ab elsch en Gruppen benutzt , wo die Unt erscheidung zwischen Re chts- und Linksnebenklassen dann überflüssig wird) . • W ir lassen bei dieser Schreibweise oft Klammerungen weg, da sich die Assoziat ivität von Elementen auf Teilmen gen von G übert rägt. Für alle X , Y, Z ~ G gilt nämlich : X (Y Z)
= {xa I x
E X ,a E Y Z }
= {x(y z) I x E X , Y E Y , z E Z}
= { (x y )z I x
E X , Y E Y , z E Z}
= { bz I b E XY, z E Z }
= (XY) Z
34
Gruppenzwang 11
Beispiel 2.16 Bet rachten wir die Ne be nklasse der b eid en t rivi alen Un t ergruppen { 1 } und G von G :
9 { 1 } = {g I} = {g}, d . h ., die Ne be nklassen von { 1 } in G sind die einelementigen Teilmen gen von G. { 1 } hat also gen auso viele Nebe nklassen in G wie G E leme nt e hat . Hin gegen ist gG = {gh I h E G } = { x I x E G } = G, denn jed es Eleme nt von G lässt sich als gh mit geeignet em h schreib en (nämlich h = g-I x ). Es gibt also ste ts nur eine Ne be nklasse von G in G . • Der Sinn der Definition eine r Neb enklasse erschließt sich nicht sofort , aber b etrachten wir einm al folgendes Lemma :
Lemma 2.17 (Gleichheit vo n Nebenklassen) Sei G ein e Gruppe, U ::; G und g , h E G beliebig. Dann sind folgende Aussagen äquivalent: 1. 2. 3. 4.
gU = h U gU n hU ih - Ig E U g-Ih E U
(/)
Für R echtsnebenkla ssen gilt Entsprechendes: 1. 2. 3. 4.
Ug = Ug n hg - I gh - I
Uh U hi- (/) EU EU
Lässt man sich die Au ssage des Lemmas etwas gen auer durch den Kopf gehen , dann kann man folgende In terpretation von Neb enklassen geben: 'Nenn man die Eleme nte der Untergru ppe U als "vernachlässigbar" (in welchem Sinne a uch imme r) auffas st , so sind zwei Nebenklassen gU und h U gen au dann gleich, wenn 9 un d h "im Wesentlichen" gleich sin d , d . h . bis a uf Mult ip likation eines Elemente s a us U. Die Elemente un te rscheiden sich also nur um etwas Vern achlässigb a res . Mit diesem Kon zept kommt man schon sehr weit . J e nach Problemstellung ergeb en sich oft ganz natürlich Situation en , in den en b estimmt e Elem ente der Gruppe kein e Rolle spielen und dann tret en oft a uch Neb enklassen auf. Das nützt jedoch alles gar nichts, solange wir das Lemma nicht b eweisen können . Also los:
B ewe is: ,,1. ===} 2.": Das ist trivial , denn natürlich ist jed e Neb enklasse eine nichtl eere Menge (gU en thält ja immer mindestens gl).
35
2.2 Nebenklassen und der Sat z von Lagrange
,,2. ===} 3 .": Das sieht m an wie folgt ein : Ist x E gU n hU , so gibt es E leme nte u , v E U mit x = gu und x = hv, also gu = hv ===} h - 1g = vu- 1 EU. ,,3. -{:::::::} 4.": g-lh ist das Inver se von h -
,,3.+4.
===}
1g.
1.":
Sei also Uo := h - 1g . Es gilt dann gu = h(h - 1g)u = h(uou) E hU für alle u E U . Daher ist gU <;;; hU . Au s Symmetriegründen gilt a ber a uch hU <;;; gU , d . h . gU = hU . D E ine wichtige Beob achtung, die a us diesem Lemma folgt : Zwei Linksneb enklassen sind ent wede r gleich od er disjunkt . Da jed es 9 E G in eine r Linksneb enklasse (sogar genau eine r, nämlich gU) ent halten ist , bild en die Linksneb enklassen von U in G eine Partition von G . Gen au dasselb e gilt natürlich a uch für Rechtsnebenklas sen . Ganz besonder s nützlich ist es oftmals, genau zu wissen , wie viele Neb enklassen es gibt. Daher treffen wir folgende Definition: D efinit ion 2 .18 (I ndex ) Sei G eine Gruppe und U ::::; G . Als neb enklassen von U in G .
IG: UI
definieren wir die Anz ahl der Links•
Dabei ist üb rigens mit keinem Wort au sgeschlossen worden, dass IG: UI unendlich ist . U kann durchaus unendlich viele Nebenklassen in G haben . In dieser Definition haben wir uns auf Linksneb enklas sen eingeschränkt , obwohl bis jetzt Rechts- und Linksn eb enklas sen ste ts gleichbe rec ht igt waren und im Wesen tlichen dieselb en Eig en schaften hatten. Nat ürlich ist a uch der Index für Re chts- und Linksnebenklassen gleich (sons t hätten wir a uch eine Not ation gewählt , die deutlich erkennbar recht s- oder linksseitig ist). Das sieht man wie folgt : Wenn wir die Inversion au f eine Nebenklasse anwenden , erhalten wir :
(gU) -l = { (gu) -l
luEU }
= {
u-
1g
-
1
luEU }
= {
vg -
1
Iv EU }
=
Ug- 1
Aus eine r Linksn eb enklasse wird so eine Rechtsneb enklasse. Wenn wir nun 9 E G laufen lassen, so durchl äuft au ch g-l alle El em ente von G . Damit liefer t das mengenweise Inv ertieren also eine Bijektion von der Menge der Links- auf die Men ge der Rechtsn eb enklassen und umgekehrt. Bevor wir uns dem Satz von Lagrange zuwen de n, wollen wir eine n weiteren Größenv ergleich machen : Nicht nur die Men gen der Links- und Rechtsneb enklassen
36
Gruppenzwang 11
sind gleich groß, es sind sogar die Nebenklass en selbst alle von iden ti scher Größe . Das sieht m an wie folgt :
G -+ G Ah := { 9
H
hg
ist eine Bijekti on von G auf sich selbst (die Umkehrabbildung ist Ah - 1 , wie man leicht übe rp rüft), genannt .Linkst ransla t ion'', Wendet man die se Abbildung auf eine Link snebenkl asse a n, so erhäl t m an : Ah (9U) = {h(gu)
luE U
} = { (h g )u I u E U } = (hg )U
Die Ab bildung schic kt also gU a uf h gU . Weil es sich um eine bij ekti ve Abbildung handelt , erkenne n wir , dass gU und h gU gleich groß sind . Da wir die freie Au swahl von h haben und jed es Gruppen elem en t g' E G als hg geschrieb en werden kann , wenn wir h geschickt wählen (n ämlich als h = g' 9 - 1), erkennen wir , dass wirkl ich alle Linksnebenklassen von U in G gleich gro ß sind. Gänzlich an alo g funktionier t das natürlich au ch für Recht sneb enklassen , wenn man die Rechtstranslati on Ph :=
{GH-+ghG 9
benutzt . Nun zum Sat z von Lagrange. Er zeigt un s die wesentliche Beziehung von Indizes ver schi ed en er Untergruppe n :
Satz 2.19 (Satz von Lagrange) S eien A , B , C Grup pen und A ::; B ::; C . Dann gilt
IC : AI = IC : BI. IB : AI und dam it ins beson dere auch
ICI
=
IC : BI· IBI·
Beweis: Wir wählen un s eine Familie (bi)iEI von Elem enten b, E B, sodass a us jed er Linksneb enklasse von A in B genau ein b, gewählt wurde. J ed es b, ist natürlich in der Neb en klasse biA und , weil wir das so gewählt haben, kommt jede Ne benklasse dabei genau einm al vor . Wir wählen a nalog eine zweite Fa milie ( Cj )j EJ von Elementen Cj E C für die Linksne benklass e von B in C.
Man nennt solche Familien übrigen s a uch vollstän dige R epräs entantensystem e der Linksn ebenklassen . Es gilt nun also:
37
2.2 Nebenklassen und der Sat z von Lagrange
(Der Punkt üb er dem Vereinigungssymbol zeigt a n , dass es sich um eine disjunkte Ver einigung handelt .) Und no ch einmal um formuliert sagt die Bedingung, mit der wir (bi) bzw. (C j) gewählt haben , dass Vi , i ' E I: biA = bi ,A {::::::::} i = i'
und analog
v j , j'
E J :
Cj
B =
c j' B
{::::::::} j =
j'
gilt . Wenn wir nun diese Gleichungen ineinander einsetzen, erh alten wir:
G
=
U (U biA) = U UCj (biA ) = U Cj
j EJ
iEI
j EJ iEI
(i,j)E l x J
(Cjbi )A
Wir haben also eine Familie (Cjbi) (i,j )EIXJ von E lementen a us G , sodass alle Linksnebenklassen von A in G die Form Cjbi A für geeignete i , j haben . Also kann es höchstens II x JI Neb enklassen von A in G geb en. Wir zeigen nun , dass das sogar eine disjunkte Ver eini gung ist :
Cj bi A ===}
cjB n cj' B
===} ===}
= cj ,bi,A
Cj
-::P (/)
da biA und bi,A
~
B
= Cj'
cj biA = cjbi,A
===}
biA = bi,A
===}
b, = bi ,
Also sind die Nebe nklassen paarweise disjunkt, und es gibt daher gen au 11 x JI = 111 . IJI Linksneb enklassen von A in G. Nach Konstruktion war nun 111 = wie gewünscht die Gleichung
IB : AI und IJI
=
IG: BI,
d . h ., wir erhalte n
IG: AI = IG: BI· IB : AI· Wenn wir nun speziell die Untergru ppe A = { 1 } be t rachten, dann haben wir uns vorhin überlegt , dass IG: { 1 }I = IGI und a nalog IB : { 1 }I = IBI gilt . Also ergibt sich als Spezialfall :
IGI = IG: BIIBI
o
38
Gruppenzwang 11
Interessant wird der Satz von Lagrange in sb esonder e dann, wenn es um endliche Gruppen geht, denn alle Indizes sind dann natürliche Zahlen größ er 0 und wir können folgern, dass beispi elsweise lAI ein Teiler von IBI und IBI ein Teiler von ICI sein muss , wenn A ::; B ::; C ist . Das ist eine sehr wichtige Erkenntnis! Dadurch werden die Eigens chaften von endliche n Gruppen und ihren Untergru ppe n stark eingeschrä nkt. Viele weitere Teilbarkeitsaussagen (die let ztendlich aber alle a us dem Satz von Lagrange gefolgert werden) bilden das Rückgrat der endliche n Gruppentheori e. Die erste, sehr wichtige Strukturaussage, die sich daraus folgern läs st , ist die folgende: Satz 2.20 (Gruppen mit Primzahlordnung) S ei G eine Gruppe, der en Ordnung IGI = p ein e Primzahl ist. Dann ist G zyklisch und j edes { g} mit 9 E G \ { 1 } ist ein E rz eugendensystem. Beweis: Betrachten wir die von {g} erzeugte Untergruppe, d. h . (g) = { gk I k E Z }. Ist 9 =I- 1, so enthält diese Untergruppe mindestens zwei Elemente, nämlich 1 und gl = g. Der Satz von Lagrange sagt uns jedoch, dass I(g) I ein Teiler der Gruppenordnung p sein mus s. Als Primzahl hat p nur zwei Teiler: 1 und p selbst . Die Ordnung der Untergruppe ist mindestens 2, also kommt nur no ch p in Frage. Da es insgesamt nur p Elemente in G gibt , muss daher G = (g) sein , d . h., G ist zyklisch. D
2.3
Normalteiler und Faktorgruppen
Eine ganz besondere Klasse von Untergruppen sind die sogenannten Normalteiler. Man kann ganz kurz formulieren, dass Normalteiler genau diejenigen Untergruppen sind , deren Rechts- und Linksneb enklassen sich nicht unters cheid en. Es gibt verschied en e äquivalente Formulierungen, die wir uns gleich zu Beginn anschauen wollen: Lemma und Definition 2.21 (Normalteiler) Sei G eine Gruppe und N ::; G eine Untergruppe. Dann sind folgende Bedingungen äqui valent: 2.
V g E G : gN = N 9 V g E G: gNg - 1 = N
3.
Vg E G: gNg -
4.
V 9 E G, n E N : gng -
1.
1
<;;; N 1
E N
Erfüllt N in dieser Situation eine Bedingung (und damit alle Bedingungen), so nennt man N ein en Normalteiler von G oder sagt auch , N sei normal in G . Man notiert dies auch kurz als N :=:J G .
39
2.3 Normaltei ler und Faktorgruppen
B eweis: (Beweis des Lemmas) ,,1. ~ 2 ." sieht man leicht durch Multiplikation mit gee igne ten E leme nten ein:
gN = N g ~ (gN)g - l = (Ng)g - l ~ gNg- 1
= N gg- 1 = N
,,3 . ~ 4. " ist offensicht lich , da 4. Vn E N : gng Version der Gl eichung gN g- l <;;;; N ist.
1
E N nur die au sformulierte
,,2 . ===} 3." ist au ch offensicht lich . E inz ig zu zeige n bleib t also ,,3 . ===} 2 ." : Dafür b enutzen wir , dass die Bedingung für alle 9 E G gelten soll, d . h ., in sb esonde re gilt sie au ch für 9 - 1 :
9 - l N (9 -1 )-1 C - N
===}
N
= (gg - l )N( gg -
1)
= 9 (9 -I N) 9 9 -1 C - 9 N 9 -1
Da die umgekehrte Inklusion gN g-l C N au ch vorausgesetz t ist , gilt also die Gle ichheit gNg - 1 = N. D Besonders der erste Punkt sagt uns , das s in a belschen Gruppen kein Un terschied zwischen gewöhnlichen Untergruppen und Norm alt eilern be steht. Nur in nichtabelschen Gruppen ist es sinnvoll, dazwischen zu unterscheiden. B e is p ie l 2. 22 (Triviale N o r m a lte il er) In jeder Gruppe G sind { 1 } und G no rmal , denn fü r alle 9 E G gilt natürlich s 1 . g-l = gg -l = 1 E { 1 } bzw. Vh E G : ghg - 1 E G . Es kann passieren , dass es keine anderen Normalteiler von G gib t . Man nennt G in diesem Fall eine einf ache Grupp e (man darf sich ab er vom Namen nicht verwirren lassen , denn die Theorie der ein fachen Gruppen kann ziemlich komplizie rt sein). • Besonder s interessant werden Normalteiler im Zusammenhang mit den sogenannten Faktorgruppen . Wir erinne rn uns an die Ver anschaulichung, die wir uns für Neb enklassen überl egt hatten . Eine Neb enklasse gU umfasst all e Elemente, die "im Wesentlichen" gleich 9 sind, wob ei das , was "unwesent lich" ist , durch U defini ert wird . Wenn wir j et zt zwei Elemente g , g' haben, die aus der selb en Neb enklasse sind , d . h. sich nur um (Rechts)Multiplika tion eines Elementes a us U unterscheiden, und zwei Elemente h , h' die ebenfall s a us einer Neb enklasse sind , dann ist es wünschenswert , dass dann a uch gh und g' h' au s derselben Neb enklasse sind , denn wenn 9 und g' sowie hund h' "im Wesentlichen gleich" sind , dann sollte das do ch a uc h auf ih re Produkte gh und g' h' zu treffen , oder? Nun, das ist nicht immer der Fall. Es ist ganz gen au dann der Fall , wenn U eine normale Untergruppe von G ist , wie wir jetzt sehen werden:
40
Gruppen zwang 11
Lemma 2.23 Sei G ein e Gruppe und N ::; G . Dann sind äquival ent: 1.
2.
N ist Normalteiler. Y g, g' , h, h'E G : gN= g' N /\ hN= h'N
===?
ghN =g'h'N .
Beweis: ,,1. ===? 2.": Seien also g,g' ,h,h' wie in 2. geg eb en . Dann gibt es n ,m E N mit g-Ig' = n und h -Ih' = m, d .h. g' = gn und h' = hm. Daraus ergibt sich :
g'h ' = (gn)(hm) = g(hh -I)nhm = gh(h -Inh)m Jetzt ist N a ber ein Normalteiler, d . h ., es ist h - In h E N. Da N auch eine Untergruppe ist, ist das Produkt (h -Inh)m wieder in N , d . h. , glh ' und gh unterscheiden sich nur um die Multiplikation eines Elements a us N und daher ist ghN = glh' N wie gewünscht. ,,2. ===? 1.": Dieser Beweis basiert auf demselben Gedanken: 9 und gn sind Elemente derselben Nebenklasse für 9 E G und n E N beliebig, d . h . gN = (gn) N. Natürlich ist auch 9 - I N = 9- IN . Also muss nach Annahme
(gn)g -I N
= gg -I N = IN
sein, d. h . gng - I = 1- 1. gng - I E N. Da dies nun für all e g E G und n E N gilt , muss also Nein Normalteiler sein. D Wo kommen nun die Faktorgruppen ins Spiel? Hier: D e fin it io n 2 .24 (Faktorgruppen) Sei G ein e Gruppe und N :::! G ein Normalteiler. Dann defini ere G IN als die Menge der (Links- oder Rechts-, das ist egal) Nebenklassen von N in G zus ammen mit der Multiplikation gN . hN := ghN. Das so defini erte G IN heißt Faktorgruppe von G nach N. Eine alternative Bezeichnung ist Quotient von G nach N . • Wenn etwas schon Faktorgruppe heißt , liegt die Vermutung nahe, dass es sich dabei wirklich um eine Gruppe handelt . Wir prüfen das nach : E Existenz und Wohldefiniertheit der Verknüpfung.
Das wird durch das obige Lemma sichergestellt . Es sagt uns ja ger ade, dass die ob en beschrieb en e Verknüpfung wirklich wohldefini ert ist: Egal , wie wir die Neb enklassen darstellen , ob als gN und hN od er mit ander en Vertret ern als g' N und h ' N schreib en, solange gN = g' N und h N = h' N ist , ist auch ghN = g'h' N.
41
2.4 Uhrenarithmetik reloaded
Alle weiter en Eig enschaften folgen, sobald man die Wohldefini ertheit erst einmal hat , direkt au s den Gruppenaxiom en für G : A Assoziativität :
(gI N· g2N) . g3N = 9lg2N· g3N
= (gIg2)g3 N = 91 (g2g3)N
= gIN· g2g3N = gIN· (g2N · g3N)
N Neutrales Element :
I N . gN = IgN = gN Inverse El em ente: Eine interessante Beobachtung üb er Faktorgruppen ist die Anwendung des Satzes von Lagrange auf sie. Da die zugrunde liegende Menge G / N die Menge der Neb enklassen von N in G ist , gilt :
IGI
=
IG/NI ·INI
Das heißt , falls G endlich ist, so gilt
IG/NI
=
IGI INI'
was die Notation G /N und die Bezeichnung Quotientengruppe zum Teil erklärt. Weitere Motivationen , inwiefern G / N einem Quotienten gleicht, werden in spät eren Kapiteln folgen .
2.4
Uhrenarithmetik reloaded
Kommen wir noch einmal auf das Hauptbeispiel aus dem ersten Kapitel zurück. Dort habe ich ber eits angedeutet, dass es für theor etische Überlegungen nicht ganz clever ist , die Gruppen auf die dortige Weise einzuführen, während dieses Vorgehen für Berechnungen von Hand und insbesondere a uch zum Programmieren besser geeignet ist . Die theoretisch günstigere Alternative ist die Konstruktion über Faktorgruppen . Dabei wird die Faktorgruppe Z/ nZ benutzt (das ist wirklich eine Faktorgruppe, weil Z ja abelsch ist und daher jede Untergruppe von der Form n Z ist) . Da dies sehr wichtige Gruppen sind, gibt es diverse Kurzschreibweisen dafür, die u . a . Z/ (n ), Z/n und Zn ent halte n. Let zteres birgt Verwech slungsgefahr, wenn man sich mit Mathematikern unterhält , die p-adische Zahlen benutzen , denn dies e werden auch als Zp be zeichnet. Die anderen b eid en Notationen sind mein es Wis sens kollisionsfrei.
42
Gruppenzwa ng 11
Wir wollen uns j et zt noch überl egen, dass Z/ nZ und di e im let zten Kapitel vorgestellte Gruppe mit n El em enten - sie wurde mit G n bezeichnet - für all e n E N>o im Wesentlichen dasselbe sind. Formal präzise machen können wir das noch nicht , das wird uns erst im nächsten Kapitel mit dem Begriff des Isomorphismus gelingen , aber einen Eindruck davon können wir uns verschaffen: Erster Schritt ist es, sich klarzumachen, dass Z/nZ genau n Elemente hat , d. h ., dass IZ : n Z I = n für a lle n E N> o ist . Clevererweise vermuten wir sofort , dass diese Elemente 0 + n Z , 1 + n Z , . .. , (n - 1) + n Z sind, denn dann hätten wir auch gleich die Entsprechung zu G n . Natürlich sind di es höchstens n El em ente. Wir wiss en jedoch erst einm a l nicht, ob nicht vielleicht einige di eser Restklass en id entisch sein könnten, Prüfen wir das nach: Angenommen , 0 :::: i < j :::: n - 1 sind natürliche Zahlen mit i + n Z = j + n Z , d.h . j - i E nZ ===} n ] j - i, Nun ist a ber 0 < j - i < n , d.h ., es ergibt sich ein Widerspruch . Daher sind die Restklassen 0 + n Z, 1 + n Z, . . . , (n - 1) + n Z paarweise verschieden , es sind qenau n Stück. Was jetzt noch schief gehen könnte : Wir könnten nicht all e vorhandenen Restklassen mit di esen n erfasst haben . Das ist jedoch nicht der Fall, denn wir wissen ja, dass i und i + kn di eselbe Restklasse von n Z in Z b eschreiben für alle k E Z. Insbesondere ist i + n Z = (i MOD n) + n Z, da i MOD n sich von i genau durch Subtraktion eines Vielfachen von nunterscheidet. Also haben wir tatsächlich a lle Restklassen erfasst, und weiter gilt mit derselb en Üb erlegung außerdem noch
(i + n Z)
+ (j + n Z) = (i + j) + n Z = ((i + j) MOD n) + n Z , Restklassen 0 + n Z , 1 + n Z , ... , (n - 1) + n Z verhalt en sich
d. h ., di e wie di e Elemente von G n , ein zig di e Bezeichnung ist ein e andere.
genauso
Wir werden im nächsten Kapi tel für einen solchen Sachverhalt die Sprechweise
"Z/nZ und G n sind isomorph" einführen. Hier soll es bei der Feststellung bleiben, dass beide Gruppen in ihren wesentlichen Punkten (d . h. dem Verhalten ihrer Elemente bzgl. der Gruppenverknüpfung) gleich sind. Alle Unt erschiede sind "kosmetischer Natur": Nur die Namen der Elemente unterscheiden sich.
2.5
Abschluss
Ich hoffe , eu ch hat a uch diese Gruppentherapie gefallen. Vielleicht hat der eine oder ander e ja sogar et was dabei über Untergrup p en, Quotienten , den Satz von Lagrange, Anwendungen davon sowie den Id een dahinter gelernt. Ich würde es mir wünschen . rnfg :::: Goc fk el
3 Gruppenzwang 111 Sensation: Homo Morphismus ist ein Gruppentier
Übersicht 3.1
Gruppenhomomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
43
3.2
Meh r Homomorphismen. . . . . . . . .. .. . . . . . . . .. . . . . . . . . . . . . . . . . .
47
3.3
Der Homomorphiesatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
3.4
Charakteristische Untergruppen
54
3.5
Direkte Produkte und direkte Summen von Gruppen . . . . . . . . . . . . .
56
3.6
Abschluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
Hallo, G ruppentheorie-Fans! Wir sin d nun schon im dritten Ka pit el der G ruppenzwang-Reihe angekommen. Diesmal soll es uns vor allem um Gruppenho momorphismen gehen , die es un s erlauben werden , Verbindungen zwischen verschiedenen Gruppen zu knüpfen. Dabei möchte ich euch grundsätzliches Handwerkszeug zur Arbeit mit diesen Abbildungen in die Hand geben .
3.1
Gruppenhomomorphismen
D efinition 3 .1 (G ruppenhomomorphismen) Seien G und H zwei Gruppen . Eine Abbildung f : G --+ H heißt Gruppenhomomorphismus oder einfach kurz Hom om orphismus von G nach H , falls
'i a , b EG : f(a· b) = f(a) . f( b)
gilt. Dabei ist auf der lin ken Seite mit . natürlich die Gruppenv erknüpfung von G und auf der rechten Seite die von H gem eint. •
44
Gruppenzwang
1I1
Au s dieser Gleichung leitet sich die Bezeichnung "Homomorphismus" a b: ,,homo" ist griechisch für "gleich , ähnlich" und ,,morph" ist das gri echi sche Wort für "Ges talt, Form". E in Homomorphismus ist - wörtlich üb er set zt - also eine ,,formähnliche" Abbildung. Moderner würde man "st r ukt urerhaltend" sage n : Ein Homomorphismus erhält die Struktur , die eine Gruppe auszeichne t, nämlich die Verknüpfung der Gruppe.
B e ispiel 3.2 (Poten zieren) Betrachten wir die Gruppen JR (wie immer mi t de r Addition) und JR x (mit der Mult iplikat ion ). Dann ist für jedes a > 0 die Abbildung
ein Homomorphismus zwischen die sen Gruppen , denn es gilt ja bekanntlich:
(Die Gruppenverknüpfung in JR ist die Addition!) Mit demselben Argument zeig t man , das s exp : C --t C x ein Homomorphismus i ~. •
B e isp iel 3.3 (Noch einmal P ot e n z ie r en) Ist G eine Gruppe und 9 E G ein beliebiges El em ent , so ist ja
d.h .,
ist ein Homomorphismus von Z nach G . Da wir für allgemeine Gruppen keine Definition über Potenzen gX mi t x t/:. Z getroffen haben (das ist au ch nur in Sp ezialfällen auf sinnvolle Weise möglich) , mü ssen wir uns hier im Gegen satz zum vorheri gen Beispi el auf ganzzahlige Ex ponenten b eschränken . •
B e isp iel 3.4 (D eter m ina nt e) Für quadratische Matrizen üb er dem Körper K gilt bekanntlich die Determinantenmultiplikationsformel : V A, B E
«r> :
:
det(A . B) = det(A) . det(B)
d . h ., die Determinante ist ein Homomorphismus GLn(K) --t K
X
•
•
3.1 Gruppenhomomorphismen
3.1.1
45
Strukturerhaltung
Da Homomorphismen mit der Gruppenverknüpfung verträglich sind , erhalten sie auch viele Strukturen , die von der Multiplikation abgeleitet sind. Wir wollen uns genauer ansehen, welche das sind: Lemma 3.5
Seien C und H Gruppen und f : C -+ H ein Homomorphismus. Dann gilt: 1.
f(l) = 1
2.
v o E C : f(g -I)
= f(g) -I
Man acht e wieder darauf, was gemeint ist : In der ersten Au ssage ist die 1 linker Hand das neutrale Element in C , die rechts das neutrale Element von H. Nur so ergibt die Aussage auch eine n Sinn. Beweis: Es gilt f(l) = f(1 ·1) = f(I) · f(1) . Wenn wir jetzt f(l) kürzen (d. h. mit dem Inversen multiplizieren), dann bleibt nur die gewünschte Gleichung f(l) = 1 übrig. Die zweite Glei chung geht genauso einfac h: 1 = f(l) = f(g ·g-I) = f(g) · f(g -I) . Also muss f (g -I ) das Inverse von f (g) sein. D Lemma 3.6 (Bilder und Urbilder)
Seien C und H Gruppen und f : C -+ H ein Homomorphismus . Dann gilt: 1.
2.
Ist U Ist V
< c , so ist f(U) < H . < H, so ist f -I(V) < C . Ist sogar V
~ H, so ist auch f -I(V) ~ C .
Man beachte die Asymmetrie zwischen Bildern und Urbildern: Urbilder erhalten auch Normalteiler, nicht nur Untergruppen. Für Bilder ist das i. A . fal sch . Beweis: Wir benutzen natürlich das Untergruppenkriterium . Wegen 1 f(l) E f( U) ist f( U) i= 0. Sind XI ,X2 E f(U) , so gibt es UI ,U2 E U mit XI = f(uI), X2 = f(U2) . Es gilt dann:
XI' X2 1 = f(uI) . f(U2 1 ) = f(ul . U2 1 ) E f(U) Genauso funktioniert der zweite Beweis. Es ist 1 E f -I(V) , da f(l) Sind XI, X2 E (V) beliebig, so gilt:
r:
=1
E V.
Ist nun V ein Normalteiler von H , so gilt weiter für a lle X E f -I(V) und a lle g E C: f(g xg - I) = f(g)f( x)f(g) -I E V ===} gxg - I E f -I(V) Also ist
r ' (V) ein Normalteiler.
D
46
Gruppenzwang 1I1
Das Lemma ist ganz b esonders nützlich, weil diese Situation sehr häufig auftritt. Die meisten Untergruppen und Normalte iler, die eine m so üb er den Weg laufen, sind Bilder od er Urbilde r unter bestimmten Homomorphism en . Man muss dann nur erkenne n, ob diese Situation vorli egt, wendet das Lemma an und hat auf eine n Schlag nachg ewiesen, dass es sich um eine Untergruppe od er ggf. soga r um eine n Normalteiler handelt.
3.1.2
Kern und Bild
Zwei Sp ezialfälle dieses Lemmas sind b esonders wichtig.
D efi n it io n 3.7 (Kern und B il d) Seien G und H Gruppen und f : G -+ H ein Homomorphismus . Wir defini eren das Bild von f als im(f) ker(f) := f -I({ 1 }).
f (G) und den Kern von f als
•
Mit obigem Lemma ist das Bild st ets eine Untergru ppe der Zielgruppe Hund der Kern ein Normalteiler von G , da { 1 } ein Normalteiler von H ist .
B e isp iel 3.8 (Kanonische H o m o m o rphism e n auf Fak t org ru p p e n ) Sei G eine Gruppe und N :'Sl G . Dann ist G -+ G IN { g HgN
ein Gruppenhomomorphismus. Das gilt einfach , weil WIr die Verknüpfung in G I N genauso defini ert hatten :
Dies er Homomorphismus wird als der kanonische Homomorphismus von G auf G I N be zeichnet. Dabei bedeutet ,,kanonisch" soviel wie ,,natürlich , naheliegend". Eben weil er so naheliegend ist , wird oft kein e eigene Bezeichnung für dies en Homomorphismus vergeb en. Wenn ein Homomorphismus G -+ G IN irg endwo auftaucht , handelt es sich in fast allen Fällen um den kanonischen Homomorphismus. Falls doch eine Bezeichnung gewählt wird, so ist es oftmals p od er 7r od er et was Ähnliches. Das kommt daher , dass ein alte rnat iver Name für dies en Homomorphismus Projektion von G auf GI N ist. Die dritte Bezeichnungsalternative ist die sogenannte Strich-Konvention, die oftmals dann angewandt wird, wenn man es mit nur eine m ein zigen Normalteiler N zu tun hat (der dann aus dem Kontext klar ist), aber dafür sehr viel in G IN arbeitet. Man b ezeichnet dann gN als 9, G IN als G et c.
47
3.2 Mehr Homomorphismen
Untersuc he n wir nun den Kern des kanonischen Homomorphismus. Es gilt nach Defin iti on , dass 9 E G genau dann im Kern liegt , wenn gN = I N {::::::::} 1- 1 g E N {::::::::} g E N , d . h ., der Kern ist genau N. Damit haben wir erkannt, dass jed er Normalteiler Kern mindest en s eines Homomorphismus und jed er Kern ein Normalteiler ist. • E ine äußerst an genehme E igenschaft des Kerns ist folgen de: Satz 3 .9 S eien G und H Gruppen und äquivalent:
f
G ---+ H ein Homomorphismus. Dann sind
f ist injektiv. ker(f) = {1 }.
1.
2.
B ewe is : ,,1. ===} 2 ". Ist f inj ektiv , so gilt : V x , y E G : f( x) = f(y) ===} x = y . Daraus erg ibt sich: x E ker(f) ===} f(x) = 1 = f(l) ===} x = 1. Da die 1 jedoch sowieso immer im Kern ent halten ist , mu ss also ker(f) = { 1 } sein . 1.": Ist a nde re rse its ker(f) = 1 b ekannt, so sieht man die Inj ektivität wie folgt: f(x) = f(y) ===} 1 = f(x)f(y) - l = f(xy - 1) ===} x y-1 E ker(J) ===} xy - 1 =
,,2.
1
===}
===}
3.2
x
=
y.
D
Mehr Homomorphismen
Weil Homomorphismen ein so wichtiges Konzept sind, gib t es ver schiedene Spezial isierungen des Begriffes: D efin it io n 3.1 0 Seien G und H Gruppen und
f : G ---+
H ein Homomorphismus.
f heißt Epimorphismus / Monomorphismus / Isomo rphi smus , falls / inj ektiv / bij ektiv ist. f
f
surje kt iv
heißt Endomorphismus, falls G = H ist .
f
heiß t Automorphismus , falls f ein Endomorphismus und ein Isomorphismus • ist , d . h . ein bijektiver Homomorphismus G ---+ G . Man spric ht im Falle eines Monomorphismus au ch manchmal von einer Einb ettung von G in H . Das basi er t dar auf, das s - da solch ein f ja inj ektiv ist G mit eine r bestimmten Teilm eng e von H identifiziert werden kann , nämlich mit im(J) . Da b ei dieser Id entifizierung die Mult iplikat ion erhalten bleibt (f ist ja ein Homomorphismus) , ide nt ifizieren wir G dabei nicht nur mit eine r bloß en Teilmenge, sonde rn soga r mit eine r Untergru ppe von H.
48
Gruppenzwang 1I1
Beispiel 3.11 (Einbettungen) Umgekehrt er hält man a us jeder Unt ergruppe U ::; G einen Monornorphismus, der von der ech ten Einbet tung von U in G herkommt , das ist die sogenannt e Inklusion sabbildung: i :=
{u
-+ G
U MU
•
Die se Abbildung ist offenbar ein Mo nomor phism us.
Beispiel 3.12 (Projektionen) Sei G eine Gruppe und N:::J G . Die Projektion G -+ G/ N ist nach Konst ruktion ein surjekt iver Homomorphismus. Wir werden im Zuge de s Homomorphiesatzes sehen , dass das au ch umgekeh rt richt ig ist und jeder E pimorphis mus im Wesentlichen eine solche Projektion ist .
•
3.2 .1
Isomorphismen
Von be sonderem In tere sse sind die Isomorphismen. Greifen wir die Überlegung von oben no ch einmal auf, so können wir einen Isomorphismus G -+ H als eine Id entifizierung von G mit ga nz H (da 1 surjekt iv ist) auffassen, b ei der die Mult iplikat ion res pekt iert wird. Etwas umformuliert : Wenn wir mit 1 von G nach H übergeh en , dann verpassen wir zwa r a llen E leme nten von G eine n neu en Name n (J (g) stat t g), ab er die Mult iplikat ion bleibt dieselbe. Da Na men bekanntlich nur Schall und Rauch sind , können wir daher zusa mmenfassen : Fall s ein Isomorphismus G -+ H exist iert, so sind G und H vom gruppentheoretischen Standpunkt a us b etracht et (d . h . in a llen Punkten , die die Mult iplikati on b etreffen) im Wesentlichen gleich . Formal ger echtfertigt wird dies durch folgendes Lemma:
Le m m a und Definition 3.13 (Isomorphie) Seien G und H Grupp en . G und H heiß en isomorph , geschri eben G es eine n Isomorphismus 1 : G -+ H gibt.
~
H , falls
E s gilt: 1.
2.
idc : G -+ G ist ein Isomorph ismus. In sbesondere ist G
~
G , d. li., die
R elation "isom orph zu" ist reflexiv. Ist 1 : G -+ H ein Isomorph ismus, so ist auch 1- 1: H -+ G (das existie rt, weil 1 nach Definition bijekt iv ist) ein Isomorphi smus. In sbesondere ist G ~ H ===? H ~ G , d. h., die Relation "is om orph zu" ist sym me trisch.
49
3.2 Mehr Homomorphismen
3.
Sind I : G --t H , 9 : H --t J Isomorphismen, so ist auch s v l : G --t J ein Isomorphismus. Es ist demnach G ~ H 1\ H ~ J ===} G ~ I , d. h., die R elation "isom orph zu" ist transitiv.
Beweis: Alle drei Behauptungen sind sehr einfach einz use he n . Dass die Id en t ität bijektiv und ein Homomorphismus ist , ist trivial.
r:'
bijektiv ist , wenn I es ist , ist au ch t ri vial. Da ss es ein HomomorphisDass mu s ist , wen n f eine r ist , wollen wir nachprüfen : Da f surje kt iv ist , lassen sich alle Eleme nte Yl ,Y2 E Hals u: = I( xl) , Y2 = f(X2 ) mit Xl ,X2 E G darstellen . Es gilt daher :
Also ist
I- I
wirklich ein Isomorphismus.
Sind fund 9 bijektiv, so trifft das natürlich a uch a uf go f zu . Nac hzu prüfen , dass dies ein Homomorphismus ist , falls fund 9 solche sind, ist auc h völlig problemlos:
(g 0 f)(Xl . X2) = g(f(Xl . X2)) = g(f(xI) . f( X2))
= g(f( x I)) . g(f (X2)) = (g
0
f)(xI) . (g 0 f)( xI) D
Also ist di e Relation ~ eine Äquivalenz relat ion. Das trifft un sere Erwartungen , denn wenn wir isomorphe Gruppen als "im Wesentli chen gleich" beschreiben , dann sollte die se Rel ation a uch die grundlegenden Eigenschaften der Gleichheit t eilen . Beispiel 3.14 (Potenzieren ) Der Homomorphismus
f .-
lR --t lR >o { x M ex px
von der additiven Gruppe lR in die Gruppe lR >o zusam me n mit der Multiplikation , den wir so ä hnlich schon zuvor betrachtet haben , ist bij ektiv. Sein e Umkehrabbil dung ist der natürliche Logarithmus In : lR >o --t lR. Das zeigt, dass die se beiden Gruppen isomorph sind.
-
B e is p ie l 3.15 (Z yklisch e G rupp en) Ber eit s im let zt en Kapitel haben wir nachger echnet, dass {0,1, ... , n - 1 } zusammen mit der Addition modulo n isomorph ist zur Gruppe Z/ nZ. Wir hatten nur da die BegrifHichkeiten no ch ni cht zur Verfügung, die wir jetzt haben . _
50
Gruppenzwang
1I1
Eine weit er e int eressante Beo bachtung ist , dass die Aut omorphis me n eine r Gruppe G, d . h . die Isomorphism en G --t G, eine Gruppe bilden :
Lemma und Definition 3 .16 (Automorphismengruppen) Sei G eine Gruppe. Dann ist die Au tomorphism en gruppe von G als Aut (G ) := {f : G --t G I fi st Automorphismus }
mit der Komposition
0
von Abbildungen als Verknüpfung defini ert.
B e w e is : Es muss gezeigt werden , dass die s wirkli ch eine Gruppe ist . Eine Verknüpfung haben wir gegeben , denn im eben bewiesenen Lemma haben wir uns davon überzeugt , dass die Komposition zweier Isomorphismen G --t G wieder ein Isomorphismus G --t G ist. Die Komposition von Abbildungen ist immer ass oziativ, auch das haben wir b erei t s früher na chgeprüft . Das neut rale Element ist uns ebenfall s schon einmal in dem obigen Lemma begegnet : id c ist ein Element von Aut(G) und wie immer gilt id 0 f = f fü r alle Abbildungen f : G --t G . Das inv er se El em ent wird uns ga nz gen auso vom obi gen Lemma geschenkt : Zu jedem f E Aut (G ) ist E Aut(G) , und natürlich gilt 0 f = id . D
r:'
r:'
Automorphism engruppen beschreiben in eine m gewissem Sinne die , ~ n ne re Symmetrie" der Gruppe G .
3.3
Der Homomorphiesatz
Es ist für die Theorie der Gruppen natürlich von Interesse, entscheiden zu können, ob zwei Gruppen isomorph sind oder nicht . Während das in die ser Allgemeinheit ein sehr schwieriges Problem ist (sogar so schwierig, dass es a lgor it hmis ch unlösbar ist ), gib t es do ch viele Sätze , die uns in speziellen Situa tionen die Sache wesentli ch erleicht ern . Der ers te und wichtigst e dieser Sätze ist der Homomorphiesat z: Sat z 3. 17 ( Homomorp hiesatz ) Sei en G und H Grupp en und f : G --t H ein Homomorphismus. Es gilt dann: 1.
Ist N ~ G ein No rmalteiler und 'iT : G --t G IN der kanonische Homomorphismus, so gibt es genau dann einen Homomorphi smus 1 : G IN --t H mit f = 1 0 it , fall s N <;;; ker(f) . Dieser Homomorphismus ist ggf. eindeutig bestimmt. Man sagt in diesem Zusamm enhang auch
f [akiorisieri über G IN .
51
3.3 Der Homomorphiesatz
f
G
.]
lH
:J !]
G IN Abb. 3.1: Die drei Abbildungen 2.
I, 1r
und
7
Es gilt GI ker(J) ~ im(J) . Ein Isomorphismus ist durch] aus der vorheri gen Aussage mit N = ker(J) gegeben.
Beweis: Sch auen wir uns zunächst einmal diese Abbildung] an . Wenn sie die Bedingung f = ] 0 1r erfüllt, dann heißt das ja:
\I x E G : f (x ) = ](1r(x)) = ](x N) Fall s ein Homomorphismus] : GIN -+ H mit dieser Eigenschaft exi stiert, so gilt für alle x E N: xN = I N ===? f( x) = ](x N) = ](1 . N ) = 1 ===? xE ker(J) . Also ist tatsächli ch N ~ ker(J) . Okay, das wa r der einfache P art . Jetz t müssen wir uns Gedanken darüber machen , wie wir die Exi st en z und Eindeutigkeit solch eines Homomorphismus beweisen, fall s N ~ ker(J) gegeb en ist. Dazu betrachten wir die obi ge Gleichung. Sie sagt uns gen au, wie ](xN) a usz usehe n hat , fall s so eine Abbildung üb erhaupt exist iert. Daraus folgt schon einm al, dass, wenn es üb erhaupt eine Abbildung gibt , diese einde ut ig bestimmt ist . Ande rerse its liefert un s das a uch eine Id ee, wie wir f zu defini er en haben, um die Exi st enz zu beweisen : Nämlich gen au durch diese Gleichung:
\Ix
E
G: ] (x N ) := f( x )
Natürlich ist das nicht ohne Weiteres möglich . Eine Neb enklas se x N kann ja bekanntlich durch ver schi ed en e x E G dargestellt werden . Woh er wissen wir , dass sich f (x ) nicht ändert , fall s wir zu eine r solche n alternativen Darstellung wechseln? Das sagt uns die gegeb en e Bedingung: Fall s xN = x' N ist , folgt x-lx, E N ~ ker(f) ===? 1 = f(x - Ix') = f(x) - l f( x') ===? f(x) = f(x') . Also ist die von uns getroffen e Defin it ion tatsächlich zuläs sig. Die Gleichung f = ] 0 1r ist für diese Abbildung] (von der wir jet zt wissen , das s sie t atsächlich ex ist iert ) nun durch die Konstruktion erfüllt. Das war der schwierige Teil. J etzt müssen wir no ch üb erprüfen , dass das so definierte] : GI N -+ H wirklich ein Homomorphismus ist . Das ist leicht :
](xN . x' N) = ]( x x'N ) = f( x x') = f(x)f( x') = ]( x N)]( x' N)
52
Gruppenzwang 1I1
Die zweite Aussage ist einfache r. K := ker(J) ist ein Normalteiler , der offensichtlich in ker(J) ent halte n ist . Also gibt es eine n Homomorphismus 1 : GI ker(J) -+ H , de r
\:Ix E G : l(xK) = f(x) erfüllt. Daher ist zum einen im(f)
!( xK) = 1
{==}
= im(J) gesichert und zum anderen
f (x) = 1
{==}
xE ker(J)
=K
{==}
x K = 1· K ,
d. h . ker (f) = { 1K }. Wir haben vorhin erst ein Lemma bewiesen, das uns zeigt, dass! daher injektiv ist. Wir fassen zusammen: Die durch! gegebene Abbildung GI ker(J) -+ im(J) ist ein Homomorphismus, surjektiv und injektiv . Also ist sie ein Isomorphismus 0 dieser Gruppen . Das wollten wir zeigen. Die Konsequenzen dieses Satzes sind weitreichend. Die Situation tritt so häufig (teilweise implizit hinter a nderen Sätzen versteckt) auf, dass man mit Fug und Recht behaupten kann, hier das wichtigste 'Werkzeug in der Hand zu haben, um Isomorphien zwischen Gruppen a ufzudecken . Eine interessante Konsequenz möchte ich direkt ansprech en: Da die Gruppen GI ker(J) und im(J) isomorph sind , sin d sie natürlich insbesondere gleich groß : IG/ ker (J )1 = lim (J)I. Daraus folgt mit Hilfe des Satzes von Lagrange: IGI
= IGI ker(J) I' lker(J) 1 = lim (J)I 'l ker (J)1
Diese Gleichung ist in gewisser Weise ein Cousin der Gleichung dim(V) = dim( im(J))
+ dim(ker(J))
für Vektorräume und Vektorraumhomomorphismen f : V -+ ~V. Im Fa lle endlich er Gruppen und endlicher Vektorräume (d. h . endlichdime nsional üb er endlich en Körpern) sind bei de Gleichungen tatsächlich äquivalent zueinande r. Eine weitere Konsequenz ist , wie ich oben schon andeutete, die Tatsache, dass jeder Epimorphismus "im Wesentlichen" eine Projektion ist . Wir können das nun ganz präzise formulieren mit unseren neuen Begriffii chkeiten: Ist f : G -+ Hein Epimorphismus, so gilt im(J) = H , d . h ., der Homomorphiesatz liefert uns mit ! einen Isomorphismus GI ker (J) -+ H , der x ker(J) mit f( x) identifiziert. Wenn wir die se Ident ifikat ion benutzen , dann entspricht f gen au der Abbildung G -+ G I ker (J) , x >--+ x N , d . h. der Projektion von G a uf ker(J) .
53
3.3 Der Homomorph iesatz
3.3.1
Einmal mehr zyklische Gruppen
Der Homomorphiesatz erla ubt uns, eine Behauptung zu beweisen , die ich bereit s im let zt en Kapitel in den Raum gestellt hatte:
Lemma und Definition 3.18 S ei G eine zyklische Grupp e, etwa G 1.
= (g). Es gilt:
Durch
f .·-
2.
und den Homomo rphie sat z wird ein Isomorphi smus 1 : Z j nZ -+ G fü r genau ein n E N bestimmt. Dies es n heißt auch Ordnung von g, wird m eist ens als ord (g) notiert und hat folg end e Eigenschaft:
Vk E Z: l
3.
Z -+ G { k H gk
= l ~ n lk
Im Falle n = 0 ist die Be zeichnung j edoch uneindeutig. Man schreibt statt ord(g) = 0 auch oft ord (g) = 00 . Mit dieser Symbolik wäre ord(g) = I(g) I die charakterisierende Eig enschaft der Ordnung von g. Es gibt bis auf Isomorphie gen au eine un endlich e, zyklische Grupp e (nämlich Z) und gen au eine zyklische Grupp e der Ordnung n für alle n E N> o (nämli ch Z j nZ).
B e we is : Dank de s Homomorphiesa tzes müssen wir gar nicht mehr viel machen , um die se Aussagen zu beweisen. Die Potenzgesetze fü r Gruppen sagen uns, dass f( k + m ) = gk+m = gm = f (k )· f(m)
l .
ist , d . h ., dass
f
ein Homomorphismus ist . Weil G
= (g) ist , ist f surj ekt iv .
Außerdem wissen wir , dass jede Unt ergru ppe von Z (al so in sbesondere ker(f)) die For m n Z für genau ein passendes n E N hat . Dami t ist dank de s Homomorphiesatzes die erst e Au ssage be rei t s vollständig bewiesen. Fall s G endlich war , so folg t IGI = IZjnZI = n , und falls G unendlich war, so folg t IGI = IZjOZI = IZI = 00 , d . h. , mi t der zwei ten Konvention ist t atsächlich ord(g) = l(g)l . Die Charakteri sierung der Ordnung durch die Teilbarkeitseigen sch aft (hi er mü ssen wir die Konvention b emühen, die ord(g) = 0 erla ubt ), folgt au ch völlig a us ber eit s bekannt en Tatsachen : 1=
l
= f (k ) ~ k E ker(f) = n Z ~ k in
54
Gruppenzwang 1I1
Die dritte Aussage ist eine Zusammenfassung der ersten. Wenn GI = (gI) und G2 = (g2) zwei zyklische Gruppen ders elben Ordnung ord(91) = ord(g2) = n E N>o U { 00 } sind , dann ist GI ~ Z/nZ ~ G2 (im endlichen Fall) bzw . GI ~ Z ~ G2 (im unendlichen Fall) . D Eine wichtige Konsequen z aus der Beobachtung l(g)1 = ord(g) für endliche Ordnungen ist , dass für endliche Gruppen st ets ord(g) ein Teiler von IGI ist , denn nach dem Satz von Lagrange ist l(g)1 ein Teiler von IGI. Wenn man jetzt das Lemma a uf diese Erkenntnis a nwende t , er hält man , dass in endliche n Gruppen stet s g lGI = 1 ist. Ebenfalls eine sehr einfache, a be r unschätzbar wertvolle Information.
3.4
Charakteristische Untergruppen
Mit Homomorphism en kann man sich in der Gruppentheori e vieles erle ichtern . Sie tret en oft genug auf, um viel Arbeitser sparnis zu bed euten. Eine Möglichkeit haben wir b ereits geseh en: K erne von Homomorphism en sind immer Norma lteiler , Bilder sind stet s Untergru ppe n. Eine weiter e, von Zeit zu Zeit nützliche Methode, sich Normalteiler zu b eschaffen , sind charakteristische Untergruppen:
D efin it io n 3. 19 Sei G eine Gruppe und U ::; G eine Untergruppe. U heißt charakteristische Untergruppe von G , fall s für alle f E Aut(G) stets f( U) ~ U gilt.
U heißt voll charakteristisch, fall s dies sogar für a lle Endomorphismen f : G gilt.
--t
Ganz allgem ein defini ert man entspreche nd fü r beliebige Teilmengen X E nd (G), dass U X -inuariant heißt, falls V f EX : f(U) ~ U ist .
G C
•
Wi e kommen da die Normalteiler ins Spiel? So:
Le m m a u n d D e fin it ion 3. 20 (Innere Automorphismen) Sei G eine Gruppe. Dann gilt: 1.
Sei 9 E G. Die Konjugation mit g, d. h.,
«« >
2.
{~:~q-'
ist ein Automorphismus von G. Automorphism en dieser Form heißen innere Automorphismen . Inn(G) := {/'l,g I 9 E G} ist ein Normalteiler von Aut(G) .
55
3.4 Charakteristische Untergruppen
3.
Eine Untergruppe N ::; G ist gen au dann eui Normalt eiler , wenn si e Inn( G) -invariant ist . In sbesondere sin d charakteristische und voll charakteristi sch e Untergruppen stets auch Normalt eiler.
Beweis: Die ersten beiden Punkte b eweisen wir geme insa m In mehrer en Schritten. Erster Schri t t : "' g ist ein Homomorphismus G --+ G . Das sieht man wie folg t ein:
Zweiter Schrit t: W ir schauen uns an , wie die inneren Automorphismen zueinander in Verbindung stehen. Für alle g , h , xE G gilt :
Also ist
"' g
0
"' h
=
"' g h.
Dritter Schritt : Weil offenbar "'1 = id c ist , ist "'g 0 "'g- 1 = idc = "'g-1 0 "'g, d . h ., alle "'g sind tats ächlich Automorphismen von G . Weiterhin zeig t uns die Glei chung a us Schrit t 2, das s r: :=
{G--+ Aut( G) 9
H
"'g
ein Homomorphismus von Gruppen ist . Also ist In n (G ) = im(",) schon einma l mindesten s eine Unterg ru ppe von Au t(G). Vierter Schritt: Inn(G) ist ab er sogar ein Normalteiler , denn es gilt für all e a E Aut(G) ,g,x E G:
d .h. a
0
"'g
0
a-
1
E Inn(G) . Also ist tatsächlich Inn(G) ~ Au t(G) .
Die dritte Au ssage ist nur eine Umformulierung des uns schon bekannten Krit eriums N ~G {::::::::} \l gE G: gN g-l~ N, denn gN g-1 ist natürlich nichts anderes a ls "'g(N) .
D
B eis piel 3. 21 (Das Z entr um) Ein be sonders in teressantes Beispiel, das zugleich eine nette Anwendung des Homomorphiesatzes bereithä lt , ist folgendes: Definiere das Zentrum der Grupp e G a ls Z(G) := {g E G I \Ix E G: gxg -
1
=
x },
Gruppenzwang
56
1I1
m an könnt e natürlich a uch umst ellen und
Z (G) = { 9 E G I \I x E G : gx = x g } sch reibe n . Das Zentrum b est eht also a us allen E leme nten von G, die mit allen a nde re n Elemente n von G kommut ier en. Ich behaupte nun , dass Z (G) eine charakterist ische Untergruppe von G ist, mithin also sogar ein Normalteiler. J et zt könnte man natürlich mit dem Untergru ppenkriterium anfangen und sich dann Schri tt für Schrit t alle s zus ammensa mmeln , was man braucht . Der wesentlich elegantere Weg ist a ber , sich einen geeigneten Homomorphismus zu besorgen und die se Arbeit von den Lemmata , die bereits bewiesen wurden , erle digen zu lassen . Wir benut zen dafür den Homomorphismus au s dem Lemma: I', : G --+ Au t(G) . Es gilt nämlich
g E ker(K,) {::::::::} K,g = id {::::::::} \I x E G : x = K,g(x ) = gxg - 1
{::::::::}
g E Z(G) ,
d. h . Z (G) = ker (1', ). Damit haben wir in nur einer Zeile bewiesen, dass Z (G) mindestens ein Normalteiler von G ist . Der Homomorphiesatz gibt un s direkt noch die schöne Zusatzaussag e, dass G jZ (G) ~ Inn( G) ist. Das einz ige, was jetzt no ch zu tun ist, ist zu b eweisen, dass Z(G) nicht nur no rm al (d . h . Inn( G) -invariant) , sondern sogar charakte rist isch (d . h . Aut( G)invariant) in G ist . Das sieht man wie folgt : Wenn a E Au t( G) ist, dann ist a insb esondere ein surje kt iver Homomorphismus, d.h ., jed es x E G lässt sich als a(y) schreibe n . Dann gilt für alle 9 E Z(G):
xa(g) = a(y)a(g) = a(yg) = a(gy) = a(g)a(y) = a(g)x Da x E G b elieb ig war , folgt , dass a(g) E Z( G) ist , d . h . a(Z(G))
<;;;;
Z(G) .
Genauer haben wir also gezeigt , dass Z(G) nicht nur unter allen Automorphis• men , sonde rn sogar unter allen E pimorphisme n G --+ G invariant ist .
3.5
Direkte Produkte und direkte Summen von Gruppen
Wir wollen zum Abschluss noch eine weitere Möglichkeit kennenlernen , sich au s vorh andenen Gruppen neue zu basteln.
57
3.5 Direkte Produkte und direk te Summen von Gruppen
D efinition 3.22 (Summen und Produkte) Ist (G i )i EI eine Familie von Gruppen, so definieren wir das direkt e oder auch kartesische P rodukt als die Menge
rr
G i: = { (gi )i EI
iEI
I s. E
G i} .
Die Gruppenver knüpfung ist komponentenweise defi niert, d . h.:
Die direkt e S umme dieser Gruppen ist nun definiert als
EB c , := {
(gi) i EI E
iEI
rr c ,
I gi = 1 bis auf endlich viele Ausnahmen } .
iEI
•
Ma n kann sich leicht a nhand der Axiome bz w. anhand des Untergruppenkriteriums davon überzeugen, dass TI i G; eine Gruppe und EB i G; eine Untergruppe davon ist . Offenbar unterscheiden sich dire kte Sum me und direkt es Produkt höchst en s da nn , wen n [ un endlich groß ist ; falls wir endlich viele Menge n bet rachten , sind beid e Gru pp en ide nt isch. Durch die Kon st rukti on als kar t esisches Produkt haben wir folgen de For me l für die Ordnungen a utom at isch sichergestellt :
rr Gi l = rr IGil
Ii EI
i EI
Von Zeit zu Zeit nü t zlich ist das folgen de Lem ma, das es uns erla ubt , zyklische Gruppen in b estimmten Fällen in direkt e Produkte zu zerlegen bzw. ein Produkt zyklischer Gruppen zu eine r zyk lischen Gru ppe zusammenz ufasse n: Lemma 3.23 Si n d G und H en dliche , zyklische Gr uppen , etwa mit Or dnu ngen n := IHI, so gilt : G x H zy klisc h {:::::::} ggT (n, m) = 1
IGI ,m
:=
Sp eziell gilt :
7l/n71 x 7l/m71 ~ 7l/nm71 {:::::::} ggT(n, m) = 1
.
~". B eweis: ,, ------,' Sei etwa x := (g, h) E G x H ein er zeugendes Element. W ir nutzen das Lemm a üb er die E lementordnungen un d seine Kon sequenz en a us und er halten: x n = (gn , h n) = (l , h n) und x m = (gm , h m) = (gm ,l). Dar aus folgt xkgV(n,m) =
(1 ,1). Wi e wir in diesem Lemma ebenfalls gesehen habe n , folgt dar aus, dass ord (x ) ein Teiler von kgV( n , m) I n m ist. Als erzeugendes E leme nt erfüllt x abe r a uch ord(x) = IG x HI = nm , d .h. kgV (n ,m) = n m ===} ggT(n , m) = 1.
58
Gruppenzwang
1I1
ß-- " .. ,, ""r-Ist umgekehrt ggT (n, m) = 1 und sind g E G bzw. h E Herze ugende El em ente, so gilt für alle k E N: 1 = (g, h) k {::::::::} 1 =
ll\ 1 =
hk
{::::::::} n = ord(g) I k 1\ m = ord(h) I k {::::::::} nm = kgV(n ,m) I k Daraus folgt , dass (g, h) mindestens die Ordnung nm hat , d . h ., die Un tergruppe ((g, h) ) :s; G x H hat mindestens die Ordnung nm. Weil nm a ber a uch die hö chstmögliche Ordnung ist , folgt G x H = ((g, h) ). Also ist G x J-I zyklisch wie behauptet . 0
3.6
Abschluss
Ich hoffe, ich konnte euc h in den bisher drei Teilen der Reih e eine n guten Eindruck von der Gruppentheori e vermitteln. Vielleicht t eilt ja jet zt der eine od er a nde re von euch mein Interesse und mein e Begeist erung für dieses Gebi et. Ich wünsche den Neu-Begeisterten no ch viel Spaß, und dass sie am Ende keine Gruppentherapie brauchen! mfg : G --+ ockel
4 Gruppenzwang IV - Gruppencamper brauchen Iso( morphie- )matten
Übe rsicht 4.1
Hilfssätze und Konvention en
60
4.2
Der erste Isomorphiesatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
4.3
Der zweite Isomorphiesatz
63
4.4
Der dritte Isomorphiesatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
68
4.5
Eine Anwendung der Isomorphiesätze
71
4.6
Abschluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
74
Hallo, Freunde der Gruppentheorie und -therapie! Es soll in diesem Kapitel um die sogenannten Isomorphiesätze gehen. Diese sind besonders interessant, wenn man (Na, was wohl?) Isomorphien von Gruppen nachweisen will (Na? Wen hat's überrascht?). Sie bieten einige Hilfsmittel und grundlegende Ideen zum Suchen und Finden von Isomorphien. Wir werden einige sehr nützliche Sätze und Lemmata kennenlernen , die vielseitig einsetzbar sind und ein tiefer gehendes Verständnis der Gruppen ermöglichen. Die Isomorphiesätze werden in Büchern und Quellen verschieden a ngegeben . Manchmal sind es drei, manchmal zwei Isomorphiesätze, einmal wird der Homomorphiesatz (siehe dazu das vorhergehende Kapitel der Gruppenzwang-Reihe) als erster Isomorphiesatz betitelt und einmal nicht . Ich werde hier drei Isomorphiesät ze vorstellen, von denen die ersten zwei die beiden bekannt esten Isomorphiesät ze sind, während der dritte Satz selten erwähnt wird, dafür ab er sehr interessant und sein Beweis vielleicht auc h lehrreich ist .
60
4.1
Gruppenzwang IV
Hilfssätze und Konventionen
In den folgenden Abschnitten werden bestimmte Konstrukte immer wieder auft a uchen. Die sollen hier noch einmal zusammengefasst werden , au ch wenn wir sie im zweiten Kapitel bereits definiert ha t t en : Wenn A und B zwei Teilmengen einer Gruppe G sind und g E G ein be liebiges festes Element , dann werden wir folgende Bezeichnungen benutzen:
gA
ga I a E A }
:= {
Ag := { ag I a E A } ab I a E A , b EB}
AB
:= {
1
:= {
A-
a- la 1
E
A}
Die Menge AB wird a uch Ko mplexprodukt von A und B gen annt, im Gegensatz etwa zum kartesischen oder direkten Produkt. Wir wollen jetzt no ch einige nützliche und vielseitig verwendbare Hilfssätze über Kom plexprodukte b ereit st ellen , die für unser e Beweise (insbesondere vom dritt en Isomorphiesat z) b enöt igt werden.
Le m m a 4 .1 (Tausch-Le mma) Sei G eine Gruppe , N:::J G ein Normaltei ler und X <;;; G eine beliebige Teilmenge . Dann gilt NX = XN. B eweis:
NX = UN x = U xN =XN x EX
D
x EX
Lemma 4 .2 (ABBA- Lemma) Sei G eine Gruppe un d A , B ~ G zwei Untergr uppen. Dann gilt:
AB = BA
AB ist Untergruppe
{==}
B ewei s: ,, ===}": A B enthält nach Definition das Element 1 = 1 . 1, ist also nichtl eer. Seien a1, oa E A, bi , b: E B beliebig. Dann gilt:
z z
Wei l AB = BA ist, gibt es a3 E A , b3 E B , sod ass (b1b 1)a 1 - was ja in BA liegt - a ls azbe geschrieben werden kann . Eingesetzt ergibt sich :
Also erfüllt AB das Untergruppenkriterium . " {== " :
Für jede Untergruppe U
U-
1
~
G gilt
= { u-
1
luE U }
= U,
61
4.2 Der erste Isomorphiesatz
da U al s Untergruppe gegenüber Inversenbildung abgeschlossen ist und jed es u das Inver se von u - 1 E U ist . Wenn nun AB eine Untergru ppe ist , d ann gilt a lso
o
da A und B j a selbst Untergruppen sind.
4 .2
Der erst e Isomorphiesatz
Dieser Satz ist relativ einfach zu beweisen . Er wird in em igen Quellen a uch als der zweite Isomorphiesatz bezeichnet. Das sind i. d. R. die Quellen, die den Homomorphiesatz zu den Isomorphiesätzen hinzuzählen und für diesen dann die Nummer Eins reservieren . Der Homomorphiesatz wird in jedem Fall essenziell sein für die meisten der folgenden Beweise, daher sollte man ihn zur Not im vorangegangenen Kapitel noch einmal nachlesen. Zunächst beweisen wir eine n kleinen, aber feinen Satz, der sich immer wieder als nützlich erweist:
Satz 4.3 Sei G eine Gruppe und U, V ::; G zwei Untergruppen . Dann gilt: lun vl ·l u vl =
IUI · IVI
Beweis: U V ist offenbar gleich UU E U uV . Wir wissen aus der Diskussion des Satzes von Lagrange in Kapitel 2, dass Nebenklassen einer Untergruppe paarweise disjunkt sind . Wir würden also gern IUVI = 1V1·(Anzahl dieser Nebenklassen) schreiben. Dafür müssen wir uns a ber überlegen, wie vie le dieser Nebenklassen es denn überhaupt gibt. Es könnte natürlich sein, dass für zwei u , u' E U der Fall u V = u'V eintritt .
Das geschieht aber gen au d ann, wenn U, -lU E V ist. Andererseits sind u ,u' E U ===} U, -lU E U, d . h. , das tritt gen au dann ein, wenn U, -lU E U n V ist . Das wied erum tritt genau dann ein, wenn u(U n V) = u' (U n V) ist. Daraus schlussfolgern wir: Es gibt genauso viele verschied en e Nebenklassen der Form uV, u E U, wie es Neb enklassen der Form u(U n V),u E U gibt. Weil U n V eine Untergruppe von U ist , ist uns diese zweite Anzahl als Index IU : U n VI bekannt . Alles zus ammen ergibt also:
===}
IU VI
IUVI = IVI· IU : U n VI ·I U n VI = IVI· ( lU: U n VI· IU n VI) = IVI· IUI
o
Gruppenzwang IV
62
Auch der erste Isomorphiesatz dr eht sich um Teilmengen der Form UV der Gruppe. Besonders interessant ist natürlich der Fall , wo dies nicht nur eine bloß e Teilmenge ist (was der Allg em einfall wär e) , sonde rn soga r eine Untergruppe von G . Der erste Isomorphiesatz zeigt dann , dass die ebe n b ewiesen e Gleichung für die Kardinalitäten der auftretenden Teilmengen kein bloß er arithmetischer Zufall ist , sondern von ein em Isomorphismus der Gruppe herkommt: Satz 4.4 (Erster Isomorphiesatz ) S ei G ein e Gruppe, H ::::; G eine Untergruppe und N :s:J G ein Normalteiler. Dann gilt : 1.
I-lN ::::; G und N:s:J I-lN .
2.
Nn H:s:J H u n d HN/N~ H/ ( Nn H ) .
Beweis: Die erst e Aussage ist relativ einfach : Da N ein Normalteiler ist , gilt nach Tauschlemma I-lN = N I-l und wegen des ABBA-Lemmas ist H N eine Untergruppe . Offenbar ist N = 1 . N ~ I-lN, also eine Untergruppe von I-lN . Da gN = N g für alle g E G gilt , gilt es natürlich auch für alle 9 E I-lN , d. h ., I-lN ist a uch ein Normalteiler. Die Isomorphie der Faktorgruppen folgt dann aus dem Homomorphiesatz. Dazu brauchen wir einen Homomorphismus H -+ H N / N , dess en Kern genau H n N ist. Ein Homomorphismus bietet sich regelr echt an , nämlich die Einschränkung des kanonischen Homomorphismus x H xN auf H:
rp
:= {
H -+ H N / N hHhN
Um den Homomorphiesatz anwenden zu können , müssen wir zeigen, dass rp surjektiv ist und ker( rp ) bestimmen . Den Kern zu bestimmen ist noch am einfachsten: Das neutrale El em ent der Faktorgruppe ist die Nebenklasse von 1 und es gilt: hN = s N {:::::::} h E N {:::::::} h E H n N, da h ja ein Element von H ist . Damit haben wir ker(rp) = H n N gezeigt. Insbesondere folgt daraus, dass H n N ein Normalteiler von H ist . Um die Surjektivität von rp zu üb erprüfen , schauen wir uns die Elem ente von HN/N einmal gen auer an . Das sind Nebenklassen der Form xN wobei x E HN ist. Die Elemente von H N haben nun die Form hn für bestimmte h E H , n E N , d. h., die Nebenklassen haben die Form ImN = hN , da nN = N für alle ti E N gilt. Das Bild von rp besteht nun aber genau a us allen Nebenklassen der Form hN mit h E H, also ist rp surjektiv. Mit dem Homomorphiesatz folgt jetzt die Behauptung.
D
63
4 .3 Der zweite Isomorphiesatz
Isomorphe Gruppen sind insbesonder e gleich groß, d . h ., es ergibt sich aus dieser Isomorphie, wie schon erwähnt, ein neu er Beweis der Gleichung aus dem vorherigen Satz: HNIN ~H /(H nN) ====}
IHNI·I Hn NI = IH NINI·I NI·I Hn NI = 111/(11 n N)I ' INI ·IH n NI =IHI ·INI
Allerdings mussten wir für die Isomorphie eine zusätzliche Voraussetzung hineinstecken , nämlich, dass N ein Normalteiler von G ist. Das obige Lemma setzt ja nur die Untergru ppe ne igenschaft voraus.
4.3
Der zweite Isomorphiesatz
Der zweite Isomorphiesatz (oder auch der dritte, das hängt, wie gesagt , von der Zählweise a b ) gehört zu einer Reihe von Eigenschaften, die einen sehr engen Zusammenhang zwischen der Faktorgruppe G IN und der Gruppe G herstellen und ist damit unverzichtbar für das Verständnis der Gruppentheorie. Es stellt sich nämlich heraus , dass viele der wichtigen Eig enschaften und Strukturen von G I N denen von G "ob erhalb von N" gleichen . Wir werden gleich sehen, wie das genau zu verstehen ist. Der zweite Isomorphiesatz selbst ist eine Art .Kürzungsregel" für Faktorgruppen und st ellt auf diese Weise eine n Zusammenhang zwischen Quotienten von G und von G IN her. Der Satz, der diesen Zusammenhang darstellt, hat keine einheitliche Bezeichnung in der Literatur und wird auch nicht immer in einem Satz zusammengefasst dargestellt. Manchmal wird er als Korrespondenzsatz bezeichnet. So werde ich das a uch handhaben: Satz 4.5 (K orre s p ondenzsa t z ) Sei G ein e Gruppe und N ::;J G ein Normalteiler von G. Bezeichne mit Jr : G --+ G IN den kanonischen Homomorphismus Jr(g) := gN . Dann gilt: 1.
Untergruppen von G IN entsprechen eindeutig Unteryruppen von G oberhalb von N . Präzise: { U ~ G I U Untergruppe, N { U >--+ Jr(U)
~ U } --+
{V
~ G IN
I V Untergruppe}
ist eine Bijektion. Die inverse Abbildung ist durch Bildung von Urbildern bzgl. Jr gegeben: V >--+ Jr - 1 (V) . Insbesondere hat jede Untergruppe von G IN die Form Jr(U) = UI N für eine geeignete Untergruppe U von G .
64
Gruppenzwang IV
2.
Di es e Korrespo nden z erhält alle Inklusionsbezi ehungen : F ür alle Unt ergruppen Us , U2 un d o, (i E I ) mit N ::; n, ::; G gilt :
a) Ui <;;; U2 b) 7T"
~
7T"(Ut} <;;; 7T" (U2)
(ni Ui) = n i 7T"(Ui) E I)) = (7T"(Ui) li
c) 7T"((Ui li
E I) (Dab ei is t auf der linken S eit e natürlich die erzeugte Unt ergruppe von G und auf der rechte n S eit e die erzeugte Untergruppe von G I N gem eint.)
3.
Indizes werden erhalte n: Für N
IV : U I = 17T" (U ) I = IU : NI.
4.
V
gilt :
17T" (V ) : 7T"(U ) I
In sbesondere ist Normalteiler von GIN entspreche n ein deu tig Normalt eilern von N bzgl. dies er Korresponden z: Für N < U < V < G gilt :
Insbesondere liefert die Ko rresponden z nicht nur eine Bij ektion zwische n den Untergruppen oberhalb von N mit den Un tergruppen von G I N , son dern au ch zwisc he n den No rmalteilern oberhalb von N und den Normalieilern von G I N.
5.
Zweiter Isomorphiesatz S ei N ::; NI ::; G und M eui Normalt eiler von G. Dann is t, wie eben gesehen , 7T" (M ) = M I N ein No rmalt eiler von 7T"(G) = G I N und f ür die Quotienten gilt: (GIN )/( MIN) ~ G IM
Der zweite Isomorphiesatz liefer t a lso eine .K ürzungsr egel" für Gruppenquotien t en und somit eine weiter e R echtfer tigung für die Verwendung dieser Schreibweise. Wenn m an no ch mehr gruppenthe or etische Strukt uren ken nt , dann stellt man immer wieder fest , dass no ch mehr die ser St rukturen von dieser Korresponden z erhalt en werden. So werden z. B. Konj ugati on sklassen von Unt ergruppen bijektiv a ufeinander a bgebildet unter dieser Ko rrespondenz . Alle rdings gib t es a uch Grenz en , so werd en bei spi elswei se Normalisatoren erhal ten , Zen t ralisa to ren jedo ch i. A. nicht . Kommen wir nun zum Beweis des Satzes: Beweis: (1. U >--+ 7T"(U ) ist bijektiv) Zunächst müssen wir uns überzeugen , dass die beiden Abbildungen überh aupt wohldefinie rt sind . Das ist einfac h, denn wir hat ten uns schon einmal überlegt , dass Bilder und Urbilder von Unt er gru pp en unter Homomorphism en selbst Untergru ppe n sind . Au ßerd em gilt für jed e Unter gruppe V ::; G IN natürlich I N E V ===} N = ker(7T") = 7T"- 1(1) <;;; 7T" -l (V) , d.h ., U >--+ (U ) und V >--+ 7T" - 1(V) bild en wirklich die a ngegebene n Me ngen ineinander a b.
65
4 .3 Der zweite Isomorphiesatz
J etzt müssen wir noch nachrechnen , dass es sich um invers e Abbildungen handelt .
7l"(7l" -1 (V)) = V gilt , weil 7l" eine surjektive Abbildung G --+ G / N ist und die entsprechende Glei chung für alle surjektiven Abbildungen richtig ist . Wir mü ssen un s also nur um die umgekehrte Glei chung kümmern . U ~ 7l" -I(7l"(U)) ist ebenfall s für alle Abbildungen richtig. Erst wenn wir ' ;;2 ' beweisen wollen , müssen wir benutzen, dass U eine Untergruppe mi t N ~ U ~ G ist : Sei nämlich x E 7l"-I(7l"(U)) b eliebig. Dann gilt also 7l"(x) E 7l"( U) ===} :3 u E U : x N = 7l"( x) = 7l"(u) = u N ===} :3 u EU: u - I x E N. Nun ist ab er N ~ U, d . h. u -I x E U===} x = u(u - Ix) E U. Also gilt auch 7l" - I(7l"( U)) ~ U und daher soga r die Gleichheit 7l" -I(7l"(U)) = U , was die erste unser er Behauptungen bewei st . D
Bisher ist ni cht viel gewonnen , denn 1. sag t un s nur , dass die beiden Mengen gleich viele E lemente haben. Punkt 2. sagt uns hingegen , dass a uch die Inklusionsb eziehungen erhalt en bleiben:
B e we is: (2. I n k lu s io n e n ) UI ~ U2 ===} 7l"(UI) ~ 7l"(U2) ist für jed e Abbildung richtig, gen au wie VI ~ V2 ===} 7l"-l(VI) ~ 7l" -I(V2). Wenn man jet zt in die zweite Gleichung Vi := 7l" (U i ) einse tzt , ergib t sich 7l"(UI) ~ 7l"(U2) ===} UI ~ U2, d . h ., der erste Teilpunkt gilt . Es gilt nun weiter : xN E
n
7l"(U;) -{::::::::} Vi E [ : x N E 7l"(U;)
iE I
-{::::::::} Vi E [ :3 Ui E U, : xN = Ui N -{::::::::} Vi E I :3 Ui E Ui : u ; I x E N -{::::::::} Vi E I : x E Ui -{::::::::} xE
nn,
iE I
Der vorletzte Schritt funk tioniert dabei gen auso wie vorher: 'Nenn U; I X E N ist , dann ist es a uch in Ui , also x E Us, Ist umgekehrt x E Ui , dann kann man umgekehrt Ui := x wählen , um U;I X E N zu errei chen. Die ebe n b ewiesen e Äquivalen z sagt uns a be r vor allem , dass 7l"(n i U;) i 7l"( U i) gilt.
n
Aus dem erste n und dem zweite n folgt auch der dritte Teilpunkt, denn
n n
7l"( (Ui li EI)) = 7l"(
X)
x< c
Ui ~ X
7l"(X)
x
Ui~ X
Gruppenzwang IV
66
n
7r(X)
7C (X ) :S;7C (C) 7C (U i ):S; 7C( X )
n
V
V :S;C/ N 7C (U i ):S; V
= (7r (Udl i E I) .
Der vorletzte Schritt basiert dabei darauf, dass jede Untergruppe von G/ N die Form 7r(X) für ein geeignetes X hat , d. h ., wir schneiden wirklich über dieselben Mengen in der zweiten und dritten Zeile von unten. D Beweis: (3. Indizes werden erhalten) Seien also U, V Untergruppen von G mit N ::; U ::; V ::; G . Wähle nun aus j ed er Linksnebenklasse von U in V genau ein El ement . V ist also die disjunkte Ver einigung
Dann gilt natürlich auch
7r(V) =
U7r(ViU) = U7r(Vi)7r(U). iEI
iE I
Die Behauptung ist nun , dass dies wieder eine disjunkte Vereinigung ist. Ist nämlich 7r(Vi)7r(U) = 7r(Vj)7r( U), so folgt 7r(Vj)-l7r(Vi) E 7r(U) ===} 7r(vj 1Vi) E 7r(U) ===} vjlVi E 7r - 1(7r( U)) = U ===} ViU = VjU ===} Vi = Vj, da die ursprüngliche Nebenklassenzerlegung disjunkt gewählt worden war. Also ist sowohl
IV: UI als
a uch 17r (V) : 7r( U)1gleich
IJI.
D
Bisher wurde immer nur über Untergruppen geredet, jetzt kümmern wir uns auch einmal um Normalteiler. Beweis: (4. U:::J V {==} 7r(U) :::J 7r(V)) Dieser Bewei s schreibt sich eigentlich von selbst : Seien also U, V wieder zwei Untergruppen mit N ::; U ::; V ::; G. Für alle 9 E G gilt wegen der Bijektivität 7r(gUg und daher gilt
U :::J V
wie behauptet.
1
)
= 7r(U)
't:/v
{==}
't:/ v E V : 7r(vUv- 1 ) = 7r(U)
{==}
't:/ v
{==}
7r(U) :::J 7r(V)
E
{==}
gUg - 1 = U
=U
{==}
E
V: vUv -
1
V: 7r(v)7r(U)7r(V) - l
= 7r( U) D
67
4.3 Der zweite Isomorphiesatz
Beweis: (5. Der zweite Isomorphiesatz) Sei nun 1\11 ein Normalteiler von G mit N ::; M ::; G . Dann beweisen wir (G/N) /(M/N) ~ G/M wied er einma l mit dem Homomorphiesatz. Die kanonischen Homomorphism en Jr : G -+ G / N und rjJ : G / N -+ (G/N) /(M/N) kann man natürlich verknüpfen, und weil b eid e surj ektiv sind, erhä lt man so eine n surjektiven Homomorphismus 'ljJ : G -+ (G/N) /(G /M) . Um unser e Isomorphie zu zeigen, bleibt noch zu zeigen, dass ker( 'ljJ ) = Mist . Es gilt g E ker('ljJ) ~ 1 = 'ljJ (g) = rjJ(Jr (g)) ~ Jr(g) E ker( rjJ) ker('ljJ) ist das Urbild Jr -l(M/N) = Jr - 1(Jr(M)) = M .
= M / N , d . h ., 0
Beispiel 4.6 Man denke sich eine Gruppe, deren Untergruppen wie in Abbildung 4.1 (links) angeordnet sind.
G /E
\~2
\ -.<.
DI/E D2/E D 3/E \
1
222
/
\1/ E /E
Abb. 4.1: Links: Eine Gruppe G, ihre Untergruppen und die gegenseitigen Indizes. Rechts: G/ E mit Untergruppen und Indizes.
In diesem sogenannten Hass e-Diagramm sind Untergruppen , die sich weiter unten befinden , kleiner als die, die weiter oben stehen. Eine Linie zwischen zwei Untergruppen bedeutet, dass die kleinere in der größeren enthalten ist. Inklusionen, die sich automatisch ergeben (weil z. B. { 1 } ~ F ~ E ist, ist natürlich auch {I} ~ E), wurden der Übersichtli chkeit halber weggel assen. Die Zahlen a uf den Linien geben den Index zwischen den jeweiligen Untergruppen an . (Solch eine Gruppe, wie sie hier dargestellt ist , existiert wirklich . Q s x Z/3Z ist
68
Gruppen zwang IV
ein Beispi el. Wir haben nicht b esprochen , was Qs ist , die gen aue Kon struktion solch eine r Gruppe ist jedoch sowieso unwi chtig im Mome nt. ) In jed er solche n Gruppe ist E:'::J G . (Das zu beweisen wär e zwar mögli ch , ist im Mome nt a be r ebe nfalls unwi chtig.) Wi chti g ist nun , wie sich die Fak torgruppe GIE verhält . Der Korrespondenzsatz sagt un s näm lich , dass wir das an aloge Diagramm für GIE direk t au s dem Diag ramm für G ablesen können : Es ist einfach der An teil , de r oberh alb von E liegt . Dabei werden alle Informati onen , die in obigem Diagr amm verzei chnet sind (und sogar einige mehr, wie bemerk t wurde) , a uf die Faktorgruppe übertragen , d . h ., das Hasse-Diagramm von GIE sieht au s wie Abbildung 4.1 (re chts) . •
4.4
Der dritte Isomorphiesatz
Das folgende Lemma werden wir für diverse Umformungen brauchen:
Lemma 4 .7 (De d ekind -Identität) Sei G eine Gruppe und U, V, W :::; G Utii erqruppen von G . Dann gilt:
U :::; W
===?
U (V n W) = U V n W
B ew eis : ,,<;; ; ": Seien also u E U , x E V n W b eliebig. Dann ist x E V ===? ux E UV . Wegen U <;; ; W und x E W gilt außerdem u x E W , also u x E UV n W . Weil u und x beliebig wa ren , sind also alle Elemente von U (V n W ) a uch in UV n W enthalten. ,, ;;2" :
Sei umgekehrt x E UV n W . Weil x E UV ist , gibt es u E U , v E V mit x = uu ===? v = u - 1x . Nun sind u EU <;;;; 1V und x E W , d . h . u -1 x E W ===? v E V n W . Also ist x = uv E U(V n W) . Da x beliebig war, folgt die zweite Inklusion. D Die Dedekind-Identität werden wir jet zt anwenden beim Beweis des dritten Isomorphiesatzes, welch er auch Schmetterlingslemma od er Zassenhaus-Lemma genannt wird :
Satz 4.8 (Dritte r I somo rphiesat z ) Sei G ein e Grupp e, U, V :::; G Unt ergrupp en und Uc dieser Untergruppen. Dann gilt: 1.
2.
~
U, Vo :'::J V No rmalteiler
U n Vo und Uo n V sind Normalteiler von U n V . Uo(U n Vo) :'::J Uo(U n V) und Vo(V n Uo) ~ Vo(V n U ).
69
4.4 Der dritte Isomorphiesatz
3.
(U n Vo)(Uo n V) :::J U n V, und für die Quotienten gelten die folgenden Isomorphien: (U n V)j(U n Vo)(Uo n V)
~
Uo(U n V) jUo(U n Vo)
~
Vo(V n U)jVo(V n Uo)
Es hilft, sich die Untergruppen - es sind j a doch ein paar mehr - in einem Hasse-Diagramm (siehe Abbildung 4.2) zu veranschaulichen , um zu erkennen , was in welcher a nderen Gruppe enthalten ist . Die Anordnung der Untergruppen hat dem Satz den Namen Schmetterlingslemma gegeb en .
U
V
Abb . 4.2: Die Untergrup pen des Schm etterlingslemm as
Man möge verzeihen , dass dieses Mal en tgegen der Konvention die größeren Gruppen weiter unten stehen als die kleineren, aber so kommt der Schmetterling einfach besser zur Geltung. B ewe is : Der erste Isomorphiesatz angewandt auf (mit den dortigen Bezeichnungen) G = V, H = U n V, N = Vo sagt uns, dass U n Vo = (U n V) n Vo ein Normalteiler von U n V ist . U n V und U n Vo sind Untergruppen und Uo ist ein Normalteiler von U. Im ersten Isomorphiesatz haben wir uns ebenfalls überlegt, dass damit Uo(U n Vo) und Uo(U n V) Untergru ppe n von U sind. Natürlich ist U n Vo <;;;; U n V ===} Uo(U nVo) <;;;; Uo(U nV) , d . h ., wir haben schon mal die Untergruppeneigenschaft .
70
Gruppenzwang IV
Das werden wir jetzt beides benutzen, um zu zeigen, dass Ua(U n Va) auch ein Normalteiler von Ua(UnV) ist . Wir nehmen uns also beliebige x E Ua, y E u nv und rechnen:
(xy)Ua(U n Va)(xy) -l = xyUay -ly(U n Va)y -1 x - 1 = xUay(U n Va)y-1x- 1 da y E U und Ua ::::J U und deshalb yUay -l = xUa(U
n Va)x -
= Ua ist .
l
da y E U n V und U n Va ::::J U n V ist. = Ua(U
n Va)x - 1
da x E Ua
= (U n Va)Uax-1 aufgrund des Tauschlemmas, da Ui, ::::J U
= (U n Va)Ua da x E Ua
= Ua(U n Va) wieder aufgrund des Tauschlemmas Völlig analog funktioniert natürlich der Nachweis, dass V n U» ::::J U n V und Va (V n Ua) ::::J Va(V n U) ist , denn das ist ja dieselbe Situation, nur mit vertauschten Bezeichnungen. Nun haben wir die zwei Normalteiler N := U n Va und NI := Ua n V von U n V . Das Komplexprodukt NM = (U n Va)(Ua n V) ist dann auch ein Normalteiler von U n V, denn es gilt natürlich:
Umjetzt letztendlich die Isomorphie der Quotienten zu zeigen, benutzen wir (Na ratet mal! Wer kommt drauf? Genau!) den Homomorphiesatz. Dafür betrachten wir den Homomorphismus:
cjJ := { U n V -t Ua(U n V) jUa(U n Va) x H xUa(U n Va) Das ist ein Homomorphismus , weil es die Einschränkung des kanonischen Homomorphismus Ua(U n V) -t Ua(U n V)jUa(U n Va) auf die Untergruppe U n V < Ua(U n V) ist. Bestimmen wir zuerst den Kern: Für alle x E U n V ist cjJ(x) genau dann das neutrale Element lUa(U n vo) , wenn x E Ua(U n V) ist , d. h. , wenn x E Ua(U n V) n (U n V) ist. Es gilt nun :
Ua(U n Va) n (U n V) = (Ua n (U n V))(U n Va) = (Ua n V)(U n Va)
71
4.5 Eine Anwendung der Isomorphiesätze
Beim ersten Gleichheit szeich en haben wir dabei die Ded ekind-Identität b enutzt . Sie ist hier a nwendbar , weil natürlich U n Vo ~ U n V ist . Nun mü ssen wir nachweisen , dass 4J surje kt iv ist. J ed es E leme nt von Uo( U n V) jUo (U n Vo) hat die Gest alt xyUo( U n vo) mit eine m x E Uo und y E U n V . Es gilt nun: x y Uo(U
n Vo)
= x UO y(U
n Vo)
da y E U und Ui, S! U ist .
= UOy (U n V ) da x E U«.
= y Uo( U n V ) = 4J(y) Also ist 4J t atsächlich surjekt iv und liefert un s damit via Homomorphiesatz einen Isomorphismus (U
n V) j(Uo n V)( U n Vo)
~ Uo(U
n V) j Uo(U n Vo) ,
Die let zt e Isomorphie (U
n V ) j(Uo n V)( U n Vo) ~ Vo(V n U )jVo(V n Uo)
folgt nun wieder aus der Symmetrie der Situation , da sich alles nur durch die 0 ver tauschten Bezei chnungen vom schon Bewiesenen unterscheidet .
4.5
Eine Anwendung der Isomorphiesät ze
Wi r wollen nun eine der unzähligen Anwendungen die ser Isomorphiesä tze vorst ellen . Es soll un s um folgenden Satz gehen:
Satz 4.9 S ei G eine zyklisch e Gruppe der Ordnung n E N, etwa G = (g) . G besitzt für jeden Teil er d I n exakt ein e Un te rgru ppe Ud der Ordnung d. Diese ist ebenf alls z yklis ch, und es gilt : Ud = (gn / d) . Nach dem Satz von Lagrange mu ss die Ordnung jed er Untergru ppe von G ein Teiler von n sein . Wir beweisen jet zt also, dass für zyklische Gruppen a uch eine Umke hru ng gilt. Beweis: Wir wissen b ereits, dass jed e zyklische Gruppe der Ordnung n zu ZjnZ isomorph ist (und der Isomorphismus von Z ---+ G , k s-» gk induziert ist) . Wir können und werden die Aus sage also nur für ZjnZ beweisen .
72
Gruppenzwang IV
Der Korr esp onden zsatz sag t un s, dass die Unterg ru ppe n von Z/nZ alle von der Form U / nZ sind, wob ei U ::::; Z eine Un t ergruppe von Z ist , die obe rhalb von n Z liegt. Wir wissen a ußerde m, dass alle Unterg ru ppe n von Z von der Form m Z für ein passendes m E N sind. J et zt ste llt sich also die Fr age, für welch e m dies eine Obergruppe von nZ ist . Natürlich mu ss n E nZ <;;; m Z sein , d . h. n = mk für ein geeignetes k E Z . Es muss also m I n sein. Umgekehrt folgt a us n E m Z au ch n Z <;;; mZ, weil n Z ja die von n erzeugte Untergruppe ist , d . h . die kleinste Untergruppe, die n enthält . m Z ist selbs t eine Unt ergru pp e und wenn sie n enthält , mu ss sie also a uch ganz n Z enthalten nach die ser Charak terisierung. Wie sieht es nun mi t der Ordnung von m Z /n Z au s? Wir wissen ja, dass für Indizes von Untergru ppen A ::::; B ::::; C gilt :
IC : AI = IC : BI· IB : AI Wenden wir das auf C n
=
= Z,
B
= m Z, C =
n Z an , so ergibt sich :
IZ : n Z I = IZ : m Z I . ImZ : n Z I = m . ImZ/nZI
===}
ImZ/nZI
n m
=-
Da nun jeder Teiler d von n die Gestalt ~ für ein einde ut ig bestimmtes m hat (nämlich m = ~) , können wir also zu jed em d gen au eine Untergru ppe von Z/nZ dieser Ordnung find en, nämlich ~ Z/nZ, und sie wird von der Restklasse von ~ erzeugt. D An schaulich wird das natürlich am bes ten klar , wenn man das geometrisch darstellt . Wir betrachten dazu ein regelmäßiges n-Eck, dessen Ecken eine zyklische Gruppe der Ordnung n repräsen ti eren . J ed e Ecke bekommt eine Numme r von Obis n - 1. Die Addition erfolgt durch Addition der Winkel, die die beiden Summanden-Ecken mit der O-t en Ecke einschließen. Hier sei das alles einm al an eine m 12-Eck vorg eführt , das in dieser Betrachtungsweise die zyklische Gruppe Z/12Z repräsentiert . (sieh e Abbildung 4.3) Der gestrichelte Winkel stellt 2 + 12Z dar, der dünn gezei chnet 5 + 12Z und der dick gezei chnet das Ergebnis ihrer Addition, nämlich 7 + 12Z. Jetzt wird a uch die An alogie mi t den Winkeln klar : Wir bezeichnen die Ecken einmal mi t den klein sten natürlichen Repräsentanten der Nebenklassen, sprich mi t den Zahlen Obi s 11. Der Winkel zwischen ,,0" und ,,1" be trägt gen au ~; = ~' da es sich um ein regelm äßig es 12-E ck handelt. Der Winkel, der von der ,,0" zur ,,2" führt beträgt ~ ' der von ,,0" zu ,,5" beträgt 5671" . So ist der Winkel ihrer Summe also die Summe der Winkel, sprich was genau dem Winkel der ,,7" ents pricht.
7;;,
73
4 .5 Eine Anwe nd ung de r Isomorphiesätze
3
o
6
8
9
Abb. 4.3: Eine geometrische Interpretation der zyklischen Gruppe Z/ 12Z
Diese geo me t rische Deutung ist als o gerec htfert igt. Analog kann man es für a lle endliche n zyklische n Gruppen der Ordnung n machen , indem man ein n- E ck betrachtet . Diese Veranschaulichung wird m an chmal auch al s ,,(ebene ) Dr ehgru ppe" b ezeichnet . Und wenn der eine ode r a ndere b ei obiger Darst ellung nicht an n-Ecke, sondern an komplexe Zahlen denkt , so hat a uch dieser Jemand recht , denn die zyk lische Gruppe der Ordnung n ist zur Gruppe der n -ten E inhe it swurzeln isomorph, der en Gruppen verknüpfung durch die komplexe Mult iplikation gegeb en ist . Und diese reduziert sich ja bei Einheitswurzeln genau auf die Addition der Winkel , wie wir sie eb en verw endet haben . 3
4
/
2
•• ,t • .
/
/
5
/ /
/ /
/ / /
0
6 -,
7
-,
-,
-,
-,
-,
•••• • • 'l.,• .
8
-,
9
Abb. 4.4: 2Z/1 2Z ~ Z/ 6Z (gepunkte t) und 3Z / 12Z gruppen von Z/ 12Z
~
Z/4Z (gestrichelt) als Unter-
Den entschei de nde n Teil kann man sich ab er dadurch besser vor Augen führen : Um nämlich eine Untergru ppe in eine m solche n n -E ck zu bekommen , braucht
74
Gruppenzwang IV
m an wiede r ein anderes (regelmäßiges) m- E ck , dessen Ec ken mit einigen Ec ken des n- Ecks übe reinstim me n . Dies ist a nhand von Abbild ung 4.4 dargest ellt .
4 .6
Abschluss
Isomorphiesät ze sind eine sehr nützliche Angelege nhe it , wenn man Isomorphien von Gruppen nachweisen will. Da sich die Gruppentheori e u. a . au ch lange Zeit damit besch äftigt hat , all e endliche n einfac he n Gruppen zu klassifizier en , waren Isomorphieunter su chungen natürlich unver zicht bar. Da sind die Isomorphiesät ze und insbesondere de r Homomorphiesa tz ein sehr wichti ges Werkzeug. Ich hoffe, ich konnt e euc h ein wenig für dieses Werkzeu g b egeist ern.
mfg
~
Gock el
5 Gruppenzwang V Dr. Cauchy und Dr. Sylow bitte zur Gruppen-OP
Übersicht 5.1
Einführung
75
5.2
Drei grundlegende Aussagen
77
5.3
Das erste Teilziel
80
5.4
Das Große Ziel: Die Sylow-Sätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
5.5
Anwendungen der Sätze von Sylow . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
86
5.6
Abschluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
Hallo, Algebra-Freunde! In diesem Kapitel möchte ich ein sehr wichtiges Konzept der Gruppentheorie vorstellen: Es soll um die sogenannten Gruppenoperationen gehen. Damit werden wir einige bekannte Sätze beweisen. Nämlich zum einen den Satz, dass jede p-Gruppe ein nichttriviales Zentrum hat , und zum anderen die berühmtberüchtigten Sätze von Sylow.
5.1
Einführung
Gruppenoperationen sind ein sehr mächtiges Hilfsmittel. Sie verallgemeinern viel bereits Bekanntes aus der Gruppentheorie und anderen Bereichen der Mathematik. Man sollte sie sich also auf jeden Fall einmal anschauen . Nun, wir tun gen au das : Wir sch auen sie uns a n .
D efinition 5. 1 Sei G eine G ruppe und n ein e beliebige nic htleere Menge. Eine Abbildung G X n -t n, geschrieb en (g, w) H gw, wird (Links-)Gruppenopemtion von G auf n genannt, wenn gilt:
76
1. 2.
Gruppenzwang V Vw E r2: 1w =w Vw E r2,g,h E G : 9(h w ) =
9
h
w
Man spricht hie r davon , dass G a uf r2 ope rie rt. Oder als alternative Sprechweise, dass r2 eine G-Men ge ist. Die Menge Gw := { 9 w I 9 E G} wird als Orbit od er a uch Bahn von w bezeichne t , die Mächtigkeit der Bahn als Bahnlänge. Die Me nge G w := {g E G I 9 w = w } wird als Stab ilisator von w bezeichnet .
•
Anmerkungen Die Bezeichnungen gehen j e nach Verwendungszweck der Opera t ion en in der Literatur stark a use inander. In vielen Fällen wird die Abbildung G x r2 --+ r2 a nders notiert . Zum Beispi el a ls gw , 9 . w ode r mi t einem anderen Verknüpfun gssymbol. Außerdem sind Re cht sop erationen gen auso üblich . Entspreche nde Schreibweisen wären dann w 9 , w· 9 etc. Die Not ati on en w 9 und g . w machen die beiden Forderungen an eine Gruppenop er ation besonder s intuitiv. .Expon entiation'' und "Mult ip likation" mit dem neutralen El em ent sollte nicht s ände rn, und auße rde m sollte das natürlich im obi gen Sinne assoziati v sein . Die Not ation 9 w , wie ich sie verwende n werde, hat hingegen den Vort eil , no ch nicht a nderweitig b eleg t zu sein , sodass zunächst keine große Verwe ch slungsgefahr be steht, sola ng e man sich noch an dieses neue Konzept gewöhnt. Au ch werde n Bahn und Stabilisator seh r ver sch ied en notiert. So sind für die Bahn eines Eleme nts au ch O rb G( w), G . w und für Rechtsop erationen entspreche nd au ch w G und w . G gelä ufig. Der Stabilisa tor wird oft al s StbG( w) , Stab (w) o. Ä. noti er t. Selb st der Name wird nicht einhe it lich gehandhabt . Die Begriffe "St and-", .Jsot ropie-", .Fixgrupp e" und viele weiter e werden ebe nfa lls häufig verwendet . Ich werde im Folgenden weiter 9 W , G w und G w b enutzen , sofern nicht eine an dere Bezeichnung offensich tlicher ist . Man sollte sich jederz eit bewusst sein , dass es da Un terschiede in den Bez eichnungen gibt. B e is p iel 5. 2 Sei 11 eine Unterg ru ppe von G. Dann operiert 11 auf G von link s durch Mult ipl ika t ion : (h , g) >--+ hg . An alog ist auc h eine Rechtsopera tion gegeb en . Die Bahn wird in die sem Fall e na türlich als Hg geschrieben und a ls Recht sn ebenklasse (bzw. Link snebenklasse) bezeichnet . Das kennen wird a lso schon . Man achte hier darauf, wie sich die Bezeichnung ä nde rt: Die Operation (h , g ) >--+ hg ist eine Linksop er ation, weil die El em ente der op eri erenden Gruppe, das ist hier H , links stehe n, Die Bahn 119 ist jedoch eine Rechtsn eb enklasse, weil der Neb enklassenvertret er 9 rechts steht .
5.2 Drei grundlegende Aussagen
77
Ebenfalls bekannt ist, dass der Stabilisator Hg in diesem Fall für alle 9 E G gleich { 1 } ist . • Beispiel 5.3 G operiert auf jedem Normalteiler
N::::J G (inkl. sich selbst) durch Konjugation:
\/ g E G,n E N : gn = gng -
1
Die Bahnen werden hier als Konjugationsklass en bezeichnet. Die Stabilisatoren die ser Operation von G auf sich selbst haben in diesem Sp ezialfall den Namen Zentralisator und werden (oft , aber au ch nicht immer) mit Cc(g) notiert. Ander e übliche Bezeichnungen sind Z(g) und C(g) . Diese werden wir später noch au sgiebig betrachten , denn die se Operation ist a uch die mit am häufigsten gebrauchte (und eine ä ußers t nützliche) Gruppenoperation . Es ist wied er Ob acht geboten, da eine Bezeichnung wie C(g) au ch für viele andere Gruppen st eh en kann und kein eswegs st anda rdisiert ist . • B e is p iel 5.4 G operiert auf seiner Potenzmenge P(G) (und diversen Teilmengen davon) ebenfalls durch Konjugation. Für eine Teilmenge A1 ~ G set zt man also: \/ g E G : gM := gMg -
1
Auch hier werden (oft , manchmal, selten, ..., sucht eu ch was a us) die Bahnen als Konjugationsklassen bezeichnet . Die Stabilisatoren haben hier a be r den Namen Normalisatoren und werden mit N c( l\!I) bezeichnet. Daneb en gibt es ab er noch ander e Bezeichnungen (Na, jet zt mal ehrlich: Wen hat das noch üb errascht?) wie Nor(M) und N (M ). • Also noch einm al zusam me nfassend: • • • •
Eine beliebige Gruppenoperation werde ich als Linksoperation und als (g, w) >--+ 9 W bezeichnen. St abilisatoren werde ich als G w schreiben. Bahnen werde ich als c w schreiben. Falls bei konkreten Operationen abweichende Bezei chnungen üblich sind , werde ich die se benutzen. Zentralisatoren werden etwa als Cc (g) und Normalisatoren als N c (M ) geschrieben.
5.2
Drei grundlegende Aussagen
J etzt werden wir nach, all den Verwi rrungen, zu den ersten Resultaten kommen , die wir beweisen wollen , als da wär en :
78
Gruppenzwang V
Lemma 5.5 Die Gruppe G operiere auf der M enge O. Dann gilt: 1.
2.
Jeder Stabilisator ist eine Untergruppe. Bahnlänge eines Elements = Index des zugehörigen Stabilisators.
oder in Formeln: 1.
2.
(Das
V w E 0 : c;
meint hier einfach nur "ist Untergruppe von ".)
B e w e is : Sei wein fixes Element von O. Für alle g, h E G w gilt dann und h w = w , d . h .: 9
- 1
W
- 1
=
9
==
g -lgw
9W
=w
(9 W)
= 1W = W ===}
g -l E 9h
w
c.,
= 9(h w ) = 9w =w
===}
gh E G w
Außerdem ist nach Definition 1 E G w . Nach dem Untergruppenkriterium ist also G w eine Untergruppe von G. Sei für 2. wied er w E 0 beliebig, ab er fest. Um zu zeigen, dass G w und die Menge der Nebenklassen von G w gleichmächtig sind, definieren wir eine Bijektion zwischen den beiden Mengen durch :
Natürlich müssen wir üb erprüfen , ob das wohldefiniert, inj ektiv und surjektiv ist. Es gilt:
Die Richtung ===} dieser Äquivalenz zeigt uns die Wohldefiniertheit, { : = die Inj ektivität der Abbildung. Dass f surj ektiv ist , ist klar, denn die Bahn von w ist ja ger ade als die Menge aller 9 w defini ert. D
79
5.2 Drei grundlegende Aussagen
Der eine od er andere mag bem erkt haben , dass da in der Übe rsc hrift von drei Au ssagen gesprochen wird ..., nun ja, Ihr wisst ja: "Es gibt dr ei Arten von Mathematikern: Die eine n können bis drei zählen, die anderen nicht ." Nein , einm al im Ernst : Der nächste Satz kommt sofort. Es handelt sich hierbei um die sogenannte Bahnenformel (od er Bahnengleichung od er Klass engleichung od er od er oder ... ): Sa t z 5.6 ( Bahnenformel) S ei n eine ni chtl eere M enge, auf der' die Gruppe G operiert . Dann gilt
Inl =
L
wEn
r- = L
IG : Gwl,
wE n
wobei n etn beliebiges Repräsentantensystem der Bahnen ist, d. h., aus jed er Bahn der Operation ist exakt ein Element auch in R. enthalten . B ewe is : Eine au ch son st ziemlich wichtige Beobach tung ist , dass für eine Gruppenoperation von G au f n durch W
rv
w' : {==} :3 9
E G : 9w
= w'
eine Äquivalenzrelation auf n definiert wird , wie man sich schnell überlegt : Die Wahl 9 = 1 und das erste unserer Axiome zeigen , dass die Relation reflexiv ist . Wegen des zweite n Axioms ist die Relation transitiv und wegen 9 w = w ' ===} - 1 W = 9 w ' sym me t risch . Offenbar sind die Äquivalen zklassen dieser Relation von der Form
[w] = {w' I :3 g E G:
«: =
w' } = {9 w I 9 E G} = Gw,
d . h. , die Bahnen von w ist exakt dasselb e wie die Äquivalen zklasse von w . Da die Äquivalen zkl assen eine r Äquivalen zrelation die zugru nde liegende Menge ste t s disjunkt zerle gen, trifft dies also a uch a uf die Bahnen zu . In sb esonder e folgt daraus a be r das erste behauptet e Gleichheitszeich en , da links die An zahl aller E leme nte von n gezählt wird und rechts die An zahl aller Elemente in all en Bahnen . Das zweite Gleichheitszeichen haben wir uns obe n ber eits üb erl egt . D Anmerkung Die verw endet e Zerl egung heißt au ch Bahnenz erlegung von
n.
Man nennt dies au ch die allg em ein e Bahnenformel. Es gibt noch eine "spez ielle", auf die ich gleich zu sprech en kommen werden . Wenn man von der Bahnenformel spricht, ist ab er in fast allen Fällen diese hier gem eint .
80
5.3
Gruppenzwang V
Das erste Teilziel
Wie eingangs vers proche n, wollen wir nu n den Satz beweisen , dass jede nicht triviale p-Gruppe ein nichttriviales Zen trum hat. Zunäch st klär en wir , was darunter zu verstehen ist : Definition 5.7 (p-Gruppen) Sei p eine Primzahl. Eine endliche Gruppe G heißt p-Gruppe , falls ein k E N gilt.
IGI
= p k für
•
Nun erinne rn wir un s zunächs t , dass das Zentrum als
Z (G)
:= { x E
G I y g E G : gxg -
1
x }
=
definiert war , un d bewei sen dann : Satz 5.8
Sei G eine Gruppe mit IGI = pk für p E lP', k E N und N ::::J G ein Normalteiler ungleich { 1 }. Dann gilt: Z (G) n N -1= {1 }
Insbesondere ist Z (G) -1= { 1 } . Dieser Satz ist in sofern int eressant , als dass er (als erst er in einer langen Reihe von Sätzen) allein aus der Ordnung eine r endliche n Gruppe schon ziemlich weitreichende St ru kt uraussagen üb er die Gruppe folgert . Beweis: Da zu b et rachten wir eine ga nz spez ielle Oper ation , nämlich die von G a uf N durch Konjugation . Ich hatte ja b ereits a nges proc he n , dass wir sie no ch brauchen werde n. Es ist also:
Wir ste llen zue rst fest , dass für ein E leme nt x E N gilt : x E
Z(G ) -{::::::::} Yg E G : gxg -
1
= x -{::::::::}
G
x = { x}
Das erst e ist hier natürlich per Defini ti on des Zen trums so festgelegt . Wichtig ist a ber die Äqui valen z dieser Definition zur Tatsache, dass die Bahn G x nur ein Elem en t hat. Nachdem wir das wissen , b et rachten wir die Bahnengleichung, die angewandt a uf un sere Oper ation dies hier sag t:
v:
:=
INI
=
L
x ER
r-
Wob ei a uch hier wied er R ein Repräsentanten syst em aller Bahnen der Oper ation sei.
81
5.4 Das Große Ziel: Die Sylow-Sätze
IGxl
J etzt ist ab er , wie wir festgestellt haben, für all e x E Z(G) n N stets = 1. Wenn al so der Durchschnitt trivial wäre (also 1 das einz ige El em ent wäre) , so wäre die Summe Folgende: pm = 1 +
L IGxl
IGxl>!
IGxl
IGxl
Jetzt t ut sich folgendes Problem auf: Da = IG: Gx l gilt, müssen alle die Gruppenordnung pk teilen . Das heiß t insbesondere, dass sie echte Potenzen von p sein müssen , wenn sie nicht glei ch 1 sind. Nun läs st sich ab er pm - 1 für kein m > 0 als Summe von echten Poten zen von p darstellen .
Daraus können wir schlussfolgern , dass es no ch mindesten s ein weiteres x geben mu ss, de ssen Bahnlänge gleich 1 ist . Die ses x ist dann a ber ein E lement von Z(G) . Demzufolge haben wir das Ziel err eicht. 0 Anme rkung : Wir haben hier die eben scho n erwähnte spezielle Bahnenformel bzw. Kl assengleichung verwendet , die sich au f gen au unsere Gruppenoperation bezieht . Sie ist nur eine Folgerung de r Äquivalenzenkette , die ich a m Anfang de s obigen Beweises notiert hatte:
IGI
=
IZ(G)I +
L
IG: Cc( x) I,
xER\ Z(G)
wob ei R wied er ein vollständiges Repräsentanten syst em der Konjugationsklassen sei.
5.4
Das Große Ziel: Die Sylow-Sätze
Im Gegensatz zum nun folgenden Satz haben wir bisher kleine Brö tchen gebacken. Ich will wirklich vorwarnen , dass der nun folgende Beweis nicht ohne ist . Es soll uns nämlich um die Sätze von Sylow gehe n , die P eter Ludwig Mejdell Sylow 1872 zum ers ten Mal b ewies und b enutzte. Konkret sind das dr ei Sätze, die in ver schi ed en st en Vari anten a uft a uche n und verw endet werden. Ich mö chte hier die allgem ein st e mir b ekannte Fassung dieser dr ei Sätze b eweisen :
82
Gruppenzwang V
Satz 5.9 (Sätze von Sylow) Sei im gesamten Folgend en G eine Grupp e m it IGI = m pk = : n , wobei m, k E 1'12: 1, P E lP' und p
tm sei . S ei weit er a eine natürliche Zahl mit 0 ::::; a ::::; k sowie
Za die Anzahl der Untergruppen von G m it K ardinalität pa, also
Es gilt mit diesen B ezeichnungen: Sylow 1 Za == I mod p . Sylow 2 A lle Unt ergrupp en der Ordnung pa sind in einer Unte rgruppe der Ka r-
dinalität pk enthalten. Sylow 3 A lle Unt ergrupp en der Ordnung pk sind zueinander konjugiert , d. h., sind U1 und U2 zwei dieser Unt ergrupp en, so gibt es ein g E G mit gUlg - 1 = U2. Außerdem ist Zk ein Teiler von m . Di e Untergruppen der Ordnung pk werden auch p-S ylowuntergruppen von G oder kurz einf ach p-S ylowgruppen genannt, fall s G klar ist . Die Sylow- Sätze st elle n m it de r Existen zaussage von Un tergruppen in ge wisser V/eise eine Umkeh rung zum Sat z von Lagrange d a r : 'Nährend d ieser b esagt , dass di e Ordnung eine r Unter gruppe d ie Gruppen ordnung teilen muss, sagen die Sä t ze von Sylow u. a . aus , d a ss es zu d en P rimzahlpot en zen , d ie die G rupp en ordnung teilen , a uc h Un tergruppen m it dieser O rdnung gibt. Di ese Sätze von Sylow di en en also zu m F inde n und Charakteri sieren von Un t er gruppen in gegebene n Gruppen . Di ese Sätze sind , wie gesagt , in den ver schi ed en sten Abwandlungen in Verwen dung. So wird oftmals beim erst en Satz nur bewi esen , dass es mindesten s eine Unter gruppe der Ordnung pk gibt. Di e Kongruen z selbs t wird dabei selten erwähnt , weil m eisten s nur das spezielle Resultat geb rauc ht wird, dass es mindest en s eine di eser Unter gruppen gib t. Oder aber di e Kon gruen z wird nur fü r di e Sylow gruppen bew iesen , d . h . für d en Spezia lfall a = k. E bens o wird m anchmal d er zweite Te il weggela ssen , weil er ni cht so oft Anwendung find et . Ich habe mich ent schied en , di e allgemeinst e , mi r b ekannte Ver sion d er Sylow-Sätze hi er zu b eweisen, auc h wen n di e a nde ren Ver sionen viell eicht einfac he r zu b eweisen sind.
5.4. 1
Der erste Satz von Sylow
Zum Beweis d es ersten Satzes von Sylow brauch en wir vier Hilfsaussag en: Lemma 5.10
Sei fh := { M <:;; G II MI = pa }. Dann operi ert G auf fh durch gM := gM .
83
5.4 Das Große Ziel: Die Sylow-Sätze 1.
2. 3.
Bzgl. der obigen Operation ist IGMI I p" , Die Bahn von AJ enthält genau dann eine Untergruppe, wenn IGMI = p": Ist U ::; G in der Bahn von NI enthalten, so ist diese Bahn gen au die Menge der Linksnebenklassen von U . U ist eindeutig bestimmt und IG : GM I =
IG: UI =
4.
(;)
==
mpk -a.
Za . mpk -a mod mpk -a+1 .
Beweis: (1. Hilfsaussage ) Es gilt für den Stabilisator H := GM bzgl. dies er Operation
U hM = U M =M.
H·M =
h EH
h EH
Also operiert H auf D z := M durch (h , m) >--+ hm. Das heißt , dass Hm die Bahn von m E M bezüglich dieser Operation ist. Dies wiederum heißt , dass alle Bahnen dieselbe Länge, nämlich IHml = IHI, haben . Da wir die Bahnengleichung kennen , gilt pa
= IMI =
L
IHml =
m E'R
L
IHI = IRI·I HI
m E'R
(für ein Repräsentantensystem R un ter der obigen Operation von H auf NI) . Das wiederum bedeutet
IGMI = IHII o" .
D
Beweis: (2. Hilfsaussage) Wenn mit obigen Bezeichnungen IHI = pa = IMI ist , dann gilt für jed es m E M : H m = M , denn H m ist die Bahn von m (unter der eb en beschriebenen Operation von H auf NI) und muss deshalb vollständig in M liegen. Da H bereits eine Untergruppe von G ist (denn es ist ja die StabilisatorUntergruppe von M unter der ersten Operation) , ist m- 1 M = m- 1 H m ebenfalls eine Untergruppe von G. Nun ist aber m - 1 NI = von G auf D1 .
m
- 1
NI ein Element der Bahn von NI unter der Op eration
Ist umgekehrt die Untergruppe U = gM = gM ein Element in der Bahn von M, so ist offenbar IUI = o" , da gM zu M gleichmächtig ist. Wegen g- lU = M ist aber auch g-l Ug <;;; GM . Aufgrund von 1. muss dann also IGMI = pa sein . D
B e w e is : (3 . Hilfsa u ssa g e ) Sei nun also U eine Untergruppe in der Bahn von M , d . h. U = h M = hM für ein geeignetes h E G. Dann gilt für die Linksnebenklassen von U:
{gU I 9 E G } = { ghM I 9 E G } = {gM I 9 E G } = { gM I 9 E G} = GM Aus dieser Identität folgt natürlich , dass au ch die Kardinalitäten gleich sind:
IG: GM I =
IGNII = IG: UI = mpk -a
84
Gruppenzwang V
Dass U die einzige Un t ergruppe in der Bahn G M ist , folgt ganz einfach daraus, dass die Bahn nun a us den Ne be nklass en von U b est eh t . Da diese alle di sjunkt sin d (sieh e Beweis zum Satz von Lagrange ), kann in kein em a nderen E leme nt der Bahn die 1 ent halten sein, also kann es a uch nur eine Un t erg ru ppe gebe n. D B e w e is : (4 . H ilfsaussage) Wi r hal t en zuerst fest , dass
ist. Wir unter scheid en nu n zwei F älle: Die Bahn von bzw, die Bahn ent hält eine .
]1;[
ent hält kein e Untergruppe
«:',
Im erste n Fall e gilt IGM I 1 da diese Ordnung nach 1. ein Teiler von pa sein mu ss, ab er wegen 2. nicht gleich pa sein kann . In diesem Fall e ist IG : GM k also ein Vielfaches von = mpk -a+l und daraus folgt
1
;:r:. !
IGMI
Im zweiten Fall ist = IG: GM I nach 2. gen au gleich mpk -a , und dieser Fall tritt für genau Za Bahnen ein, weil es nach Definition Za Untergruppen der Ordnung pa gibt und die nach 3. in je einer Bahn ent h alten sind. Wir betrachten nun also (;) =
(;)
=
1[211 modulo
mpk-a+l :
L IG]1;[ 1 == Za . mpk - a mod
mpk -a+l
MER
D
B e w eis : (1. Satz v on Sylow) Es gilt nun also für all e Gruppen der Ordnung = mpk die folgende Glei chung:
ti
n) ( pa
==
Za' mp k- a mo d
Betrachten wir nun zwei dieser Gruppen , nämlich Z/nZ und eine beliebige a ndere, dann gilt : _ (n) = _ Za . mp k -a mo d mp k- a+l ZaZ / nZ . mp k-a = pa
85
5.4 Das Große Ziel: Die Sylow-Sätze
Für Z/nZ gibt es genau eine einzige Untergruppe für jeden Teiler der Ordnung, weshalb auf der linken Seite das z'{;/ nZ gleich 1 ist . Aus dieser Gleichung folgt für alle Gruppen der Ordnung n : mpk - a {::::::::} mpk - a +1
Wenn wir auf beiden Seiten pI
1
== 1
mod
mpk - a +1
Za . mpk -a _ mpk -a
mpk -a Za -
Za . mpk -a
1
kürzen, st eht nur noch Folgendes da: ===}
Za
== 1 mod
p
D
5.4. 2
Der zweite Satz von Sylow
Beweis: (2. Satz von Sylow) Seien U und P Untergru ppe n von G mit IUI = und IPI = pk . P ist also eine p-Sylowgruppe von G . (Wegen des 1. Satzes von Sylow gibt es sowohl U als auch P .)
pa
Sei weiter [23 := {gPg - 1 I 9 E G }. Auf die ser Menge operiert G durch Konjugation , also xQ = x Qx- l . Man erkennt leicht , dass nach Definition [23 = c P ist , also a uch IG : Ne(P) 1gilt , da es hier nur eine Bahn gibt.
1[231
=
le pi=
Wenn nun X ein e Untergruppe von G ist, ist - wie man leicht einsieht X ein Normalteiler seines Normalisators N e(X): Da zu muss man sich nur die Definition Ne(X) := {g E G I gXg - I = X} anseh en. In der Tat ist Ne(X) die größte Untergruppe von G , in der X ein Normalteiler ist , daher auch der Name "Normalisat or". Weil P eine Untergruppe von Ne(P) ist, gilt also IPI 1 INe (P )1 ===} p f IG: N e(P) I, da I~I = m nicht von p geteilt wird nach unser er Definition ganz am Anfang. Als Zweites halten wir fest, dass a uch U auf [23 durch Konjugation operiert. Wir schränken also die Operation G auf U ein . Wor aus sich nach der Bahnengleichung 1[231
=
L IuQI
Q ER
ergibt , wobei R ein Repräsentantensystem der Bahnen unter der Operation von U ist. Da wir die Operation von G auf U eingeschrä nkt haben , müssen wir , um den Stabilisator eines Q E [2 3 zu erhalte n , auch den Normalisator einschränken auf U n N e(Q) . Nach dem Satz von Lagrange ist U = IU: (U n N e(U» 1 ein Teiler von IUI. IUI ist ab er t/' . Wir hatten jedoch festgestellt, dass p f 1[2 31 ist . I
QI
86
Gruppenzwang V
Daraus schluss folgern wir , dass für mi ndesten s ein Q E R dieser Index IU: (U n Nc(U ))1 = 1 sein mu ss. Das wiede r um heiß t , dass für dieses Q auch U n Nc (U ) = U ===} U <;; ; Nc (Q) gilt . Som it ist ===}
'V u E U : «o«:'
= Q.
Wir wissen a ber ebe nfalls, dass Q ein Norm alt eiler von Nc (Q) ist . Wenden wir also den erst en Isomorphiesatz an (siehe Gruppen zwang Kapitel 4) : Die ser be sag t zum einen , dass U Q eine Un tergruppe von N e (Q) , und zum a nde ren , dass UQ/Q ~ U/ (U n Q) ist . Daraus wiederum folgt :
IUQI =
IUQ : QI· IQI = IU : (U n Q) I· IQI
Das heißt vor all em , da IUI = pa und IQI = pk ist, dass IUQI ebe nfa lls eine Poten z von p ist . Da Q eine Untergru ppe von UQ ist und IQI die höchstmögliche P ot enz von p nämlich pk ist, mu ss IUQI = pk sein . Es ist al so vor all em UQ = Q. U mu ss daher eine Unter gru ppe von Q sein. Da Q E [23 und de shalb eine p-Sylowgruppe ist , haben wir den zwei ten Sa tz von Sylow al so b ewiesen . 0
5.4.3
Der dritte Satz von Sylow
Nachdem uns die ers ten beiden Sät ze viel An strengung und einiges Kopfzer brechen gekostet haben , bekommen wir den dritten Satz von Sylow praktisch geschenkt :
B eweis : (3. S at z von Sylow ) Wir set zen im vorherigen Beweis einfach IUI = pk und erhalten , dass U glei ch einer Untergruppe Q ist, welche wiederum in [2 3 = {gPg - 1 I 9 E G} ent halt en ist . Da alle Elemente von [2 3 zueinander konjugiert sind, sind a lso a lle p-Sylowgruppen zueinander konjugie rt und es gilt Zk = IG: Nc (P )I. Wege n P ~ N c (P ) ~ G ist IG: Nc (P )1 ein Teiler von IG: PI = IC;:I = m. 0 p
5.5
Anwendungen der Sätze von Sylow
Wir wollen uns jetzt einma l mit einigen ty pischen Anwendungen der Sätze von Sylow be schäftigen ... Die einfa chste Anwendung ist der sogen annte Satz von Cauchy:
87
5.5 Anwendungen der Sätze von Sylow
Satz 5.11 (Satz von Cauchy) Es gibt in einer Gruppe Gfür jeden Primteiler p von der Ordnung p.
Beweis:
IGI
mindestens ein Element
Der ist mit Kenntnis des ersten Satzes von Sylow denkbar einfach:
Es gibt nämlich für jeden Primteiler p I IGI nach diesem Satz au ch mindestens eine Untergruppe U ::; G mit der Ordnung p . Und da jede Gruppe mit primer Ordnung zyklisch ist , muss es einen Erzeuger dieser Untergruppe geben. Und dieser hat wiederum die Ordnung IU I = p. D Eine weitere oft benötigte Anwendung ist die Bestimmung der Gruppenstruktur mit Hilfe von Sylow . So gibt es z. B. (bis auf Isomorphie) nur eine einzige Gruppe der Ordnung 1729 7·13 · 19.
=
Beweis: Aus den Sylowsätzen können wir schlussfolgern, dass es genau eine 7-Sylowgruppe N7 , genau eine 13-Sylowgruppe N1 3 und genau eine 19Sylowgruppe N19 in solchen Gruppen G gibt : Das folgt aus dem dritten und dem ersten Satz von Sylow , denn die Anzahl der 7-Sylowgruppen zum Beispiel muss sowohl ein Teiler von 13 . 19 sein als auch kongruent 1 mod 7. Dafür kommt nur 1 in Frage, da 13 == 6 =I'- 1 mod 7, 19 == 5 =I'- 1 mod 7 und 13 ·19 == 2 =I'- 1 mod 7 ist . Analog kann man sich auch davon üb erzeugen, dass dies für 13 und 19 zutrifft. Diese Sylowgruppen sind insbesondere Normalteiler , denn gNpg - 1 ist ja ebe nfalls eine Untergruppe der Ordnung p, also eine p-Sylowuntergruppe, also gleich Np . Ebenfalls sind sie (bis auf das neutrale El em ent) paarweise disjunkt, da die Ordnung eines gemeinsamen Elements jeweils 7 und 19, 7 und 13 bzw . 13 und 19 teilen müsste. Die einzige Zahl , die das tut, ist der triviale Teiler 1 und das einzige Element der Ordnung 1 ist das neutrale. Es gilt nun für solche Gruppen :
Da je zwei der Sylowgruppen N7 , N 13 und N 19 Normalteiler von G und bis auf 1 disjunkt sind, kommutieren ih re Elemente, denn es gilt beispielsweise für alle x E N7 und alle y E N 13: xyx -1y -l = (xyx -1)y -l = x(yx - 1y -l)
Da für alle Normalteiler gilt , dass sie unter der Konjugation abgeschlossen sind, ist dieser Ausdruck eine Element von N7 n N1 3 also gleich 1. Daraus wied erum folgt:
Gruppenzwang V
88
Analog kann man das für die ande ren b eid en Kombin at ion en b eweisen ode r indukt iv für eine b eliebi ge (endliche) Anzahl von Normalt eilern, die paarweise t rivialen Durchschnit t haben . Mit diesem 'W issen können wir einen Homomorphismus kon struier en, nämlich: N 7 X N 13 X N 19
-+ G
(x , y , z ) >--+ x y z
Dass es ein Homomorphismus ist, folgt direkt a us der Vertauschbarkeit von x ,y, z : ep(X , y,Z )ep (XI , yl ,Z / ) = x yzx' y'z' 1
1
= x yx zy z
1
= ( xx ' ) y zy 1 z 1 = (xXI)(yy/)( ZZ/)
= ep(XXI , y y l ,ZZ / ) = ep( (x , y , z ) (XI , y ' , Z/)) Außerd em ist ep injektiv . Dazu zeigen wir, dass der Kern t rivial ist . Sei nämlich 1 = ep(x , y ,z) = xyz . Dann gilt x y = z-l . Nun ist z E N 19 und x y E N 7 ' N 13 und , weil beid es gleich ist , mu ss daher beid es in N 19 n N7 . N 13 sein . Im Zusammenhang mit dem erste n Isomorphiesatz haben wir gezeigt , dass N7 ' ist . Der Schnitt von N 19 N 13 eine Untergruppe der Ordnung li~:I~I:,':11 = mit dieser Untergru ppe mu ss wied er trivial sein , weil die Ordnungen t eiler fremd sind . Das hatten wir un s ja ebe n b ereits üb erl egt . Also mu ss z = 1 sein ===}
7,;3
xy
=
1
===}
x
= y -l
Damit haben wir x
E
N 7
n N 13
=y=z=
=
1
===}
x
=y=
1.
1 gezeigt und ep ist inj ektiv.
Da die Ordnungen von N 7 x N 13 X N 19 und G üb erein stimmen und b eid e endlich sind, ist ep ni cht nur inje kti v, sondern a uch surje kt iv und damit ein Isomorphismu s. G ist also tats ächlich isomorph zum direkten Produkt seine r Sylowgruppen . Da diese wied erum von Primzahlordnung sind , sind sie isomorph zu 7./77.,7./137. bzw. 7./1 97.. Und das direkte Produkt aus ihnen ist wiederum isomorph zu 7./ (7· 13 · 19)7. = 7./ 17297.. D Das konnte man b er eits in Kapitel 2 nachl esen . Da wurde b ewiesen , dass Grupp en von Primzahlordnung zyklisch sind, was wir hier ja mehrmals verw endet haben. Auß erdem wurde dort b ewiesen , dass das direkte Produkt zyklische r Gruppen genau dann zyklisch ist , wenn die Ordnungen t eilerfr emd sind (was 7, 13 und 19 ja offen sichtlich sind ).
89
5.6 Abschl uss
5.6
Abschluss
Mit den Sätzen von Sylow hat man ein mächtiges Mi ttel zur Unt ersuchung von Gruppen gefunden. Mit ihrer Hilfe sind vielseitige Untersuchungen von Gruppen möglich. Die Bestimmung der möglichen Isomorphietypen , wie wir sie durchgeführt hab en , wäre ohne Sylow praktisch nicht möglich. Und nach den vielen , vie len , vielen Namensverwirrungen möchte ich nur noch sagen :
mf9 = Zm j g
G ock el
== Gockel mod
Imf 91 =
p
2..: IGockell xE R
mf9
~
N G x No x N;
X
Ni,
X
Ne
X
Ni
6 Gruppenzwang VI - Randale: Gruppendemo musste aufgelöst werden
Übersicht 6.1
Und was hat das nun mit Gruppen zu tun?
91
6.2
Erste Schritte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
94
6.3
Die Sätze von Schreier und Jordan-Hölder
97
6.4
Kommutatoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
6.5
Nilpotente und p-Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.6
Abs chluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 106
Hallo, Gruppentheoretiker ! Als groß es "Üb erz iel" über den me ist en Algebra-Vorlesungen an de r Uni st eht nicht selten die sogenannte Galoistheorie, mit deren Hilfe es u . a. möglich ist zu bestimmen, ob eine gegebene Po lynomgleichung durch Radikale auflösbar ist oder nicht , d . h ., ob sich die Nu llstellen des Polynoms mit den vier Grundrechenarten und Wurzelausdrücken darstellen lassen . Genau die se Eigenschaft wollen wir in diesem Kapitel des Gruppenzwangs unter die Lupe nehmen, auch wenn (und gerade weil) es a uf den ersten Blick nichts mit Gruppen zu tun hat.
6.1
Und was hat das nun mit Gruppen zu tun?
Diese Eigenschaft der Auflösbarkeit von Polynomen ist eng a n die sogenannten Galoisgruppen geknüpft. Insbesondere ist nämlich ein Po lynom gen au dann durch Radikale a uflösbar, wenn die zugehörige Galoisgruppe "auflösbar" ist. Diese Beziehung zu beweisen liegt außerhalb de r Mögli chkeiten dieses Kapitels, weil die gruppentheoretischen Grundlagen allein dafür nicht ausreichen. Man b enötigt weit eres , algebraisches Grundwissen, z. B. über Polynomringe und Körperer-
92
Gruppen zwang VI
weiterungen . Wi r können und werden uns aber mit der Gruppen eigenschaft der "Auflösbarkeit" b eschäftigen. Fangen wir einfach an ..., was bedeutet Auflösbarkeit eigentlich??
6.1 .1
(Sub-)Normalreihen
Definition 6.1 Eine endliche Folge von Untergruppen
heißt Subnormalreih e, wenn gilt:
(Hierbei meint das :::)-Zeichen ,~st Normalteiler von", ähnlich wie die Zeich en ::; und ~, die ein "ist Untergru ppe von"-Verhältnis b ed euten) Wenn sogar immer gilt :
v0 ::; i < k : Ni
:::) G
spricht man von einer Normalreihe. nicht nur von einer Subnormalreihe. Die Zahl keiner Subnormalreihe wird au ch als Länge der Subno rmalreihe be• zeichnet.
B e isp iel 6.2 Z r:::: 5Z r:::: 15Z r:::: 30Z r:::: 60Z r:::: { 0 } ist eine Subnormalreihe und a uch eine Normalreihe, weil Z a belsch ist und de shalb alle Untergru ppe n a uch Normalte iler sind. Betrachten wir als nächs te s Permutati on sgruppen. (Für nähere Informationen über Permutationsgruppen und die Definitionen von A n und V4 verweise ich a uf das en ts prechende Kapitel der Gruppenzwang-Reihe [41.)
ist ebenfalls eine Normalreihe, obwohl 8 5 nicht a belsch ist .
ist a uch no ch eine Normalreihe, wäh rend
zwar eine Subnormal-, a ber keine Normalreihe mehr ist , denn ((1,2)(3,4 )) ist kein Nor m alteiler von 8 4. •
6.1 Und was hat das nun mit Gruppen zu tun?
6.1.2
93
Faktoren von (Sub- )Normalreihen und Auflösbarkeit
D efinition 6.3 Die Faktorgruppen N i /Ni+1 in einer Subno rmalreihe werden auch einfach Faktore n der Reihe genannt . Hat eine Gruppe eine Subnormalreih e, in der ausschließlich abelsche Faktoren vorkommen, spricht man von einer auflösbaren Gru ppe. •
B ei spiel 6.4 (5 4 und 5 5) 54 ist a uflösbar , denn die Subnormalreihe
besitzt Faktoren, die allesamt ab elsch sin d : 5 4/A4 ~ 7./27. A4 /V4 ~ 7./37. V4/ { 1 } ~ V4 ~ 7./27. X 7./27. Dass diese Isomorphien gelten, sieht man sofort anhand der Ordnungen ein : Die erst en beiden Quotienten haben aufgrund des Satzes von Lagrange die Ordnungen i~ = 2, 142 = 3, welch e Primzahlen sind. Grupp en mit Primzahlordnung sind zyklisch , wie wir wissen (siehe Kapitel 2), un d zyklische Gruppen sind zu den Quotienten von 7. isomorph (sieh e Ka pit el 3). Dass V4 zu 7./27. x 7./27. isomorph ist , sieht man auch leicht ein , da man nach kurzem Überlegen eine n Isomorphismus leicht hinschreib en kann (beispielsweise (12)(34) M (1,0), (13)(24) M (0 ,1) , (14)(23) M (1 ,1)) .
55 dagegen ist nicht mehr a uflösbar , denn die b eiden einzigen Subnormalreihen von 5 5 55 12: { 1 } und
5 5 12: A 5 12: { 1 } besitzen nichtabelsche Fa ktoren , nämlich 55 /1 ~ 55 sowie A 5 / { 1 } ~ A 5 . Dass dies die einzigen Subnormalreihen von 5 5 sind , folgt u . a. daraus , dass die alternierende Gruppe An für n ~ 5 einfach ist , also überhaupt kein e nichttrivialen Norm alteiler besitzt, die in einer Subnormalrei he vorkommen könnten . Für n ~ 4 sind a ußerdem alle altern ierenden Gruppen nichtabelsch, sodass 5 n und An für n ~ 5 niemals auflösbar sind. (Siehe dazu a uch [4], wo die Nichtauflösbarkeit ganz explizit bewiesen wird .) Außerd em ist natürlich je de a belsch e Gruppe a uflösbar, denn die triviale Nor malreih e
G I2:{1 }
besit zt den abe lschen Fa ktor G/ { 1 }
~
G.
•
94
Gruppenzwang VI
6.2
Erste Schritte
Für die Untersuchung der Auflösbarkeit sind einige Definitionen sehr wichtig und nützlich:
6.2.1
Isomorphie von Subnormalreihen
Dem wollen wir uns zuerst widmen , denn wie bei anderen Objekten in der Mathematik gibt es an Subnormalreihen interessante und weniger interessante Aspekte , von denen der Mathematiker natürlich am liebsten die interessanteren betrachtet. Dies sind b ei Subnormalreih en die Faktoren , den n sie ent scheide n übe r die Auflösb ar keit. Wi e wir ob en definiert haben , ist die Auflö sbarkeit nur von de r Struktur dieser Faktoren abhängig , nicht von ihrer Rei henfolge. Was liegt also näher als Isomorphie für Subnormalreihen zu definieren , wenn sie sich nur in der Reihenfolge der Faktoren unterscheiden?
D efinition 6. 5 Gegeben seien zwei (Sub-)Normal reihen der Gruppe G : G
=
G
= Mo ~ JIIh
No ~ NI ~ ~
~ Nk ~
= {1}
MI = { 1 }
Diese heißen isomorph , wenn 1.
2.
k = I ist , d . h ., wenn sie die gleich e Länge hab en , und eine Pe rmutation a E Sk exist iert mit N i /Ni+I ~ Ma( i )/Ma (i )+1 für alle i < k.
•
B e ispiel 6.6 (2:/ 62:) N o = 2:/ 62: ~ N I = 32:/62: ~ N 2 = 62:/62: = { 0 }
und
Mo = 2:/ 62: ~ u, = 22:/62: ~ JIIh = 62:/62: = { 0 } sind zwei isomorphe Normalreih en, denn b eid e haben wie in 1 gefor dert drei Folgenglieder un d a = (0,1) ist die in 2 geforderte P ermutation, denn es gilt No /NI ~ 2:/ 22:, NI /N2 ~ 2:/ 32:
sowie
95
6.2 Erste Schritte
wie man wied er anhand der Primzahlordnungen der Quotienten leicht einsieht .
•
Beispiel 6.7 (A4 x Z/4Z ) Ein komplexeres Beispiel: Sei G die Gruppe A4 x Z/4Z. Dann gib t es (u . a .) diese beiden Normalreihen : N := A 4 x Z/4Z ~ A4 x Z/2Z ~ A 4 x { 1 } ~ V4
X {
1}~ {1}
M := A 4 x Z/4Z ~ V4 x Z/4Z ~ { 1 } x Z/4Z ~ { 1 } x Z/2Z ~ { 1 }
Hier tret en folgende Faktoren auf:
N o/ NI ~ M2 / Nh ~ Z/2Z NI/N2 ~ Nh /M4 ~ Z/2Z N2 / N 3 ~ Mo /lviI ~ Z/3Z N 3/ N4 ~ Nh /Nh ~ V4 Das entsp richt also der Permutation a
= (02)(1 3) .
Insbesondere haben wir damit (fast nebenbei) gezeigt , dass A4 x Z/4Z a uch auflö sbar ist, da sowohl Z/2Z, Z/3Z als auch V4 ~ Z/2Z x Z/2Z ab elsch sind .
•
Wi e au ch b ei a nde re n Strukturen ist der Isomorphieb egriff eine Äquivalen zr elation, was man leicht nachrechnen kann , wenn man möchte. Ich mö chte ab er nicht , also machen wir weiter .
6.2 .2
V erfeinerungen
Wie wir gesehen haben , kann eine Gruppe mehrere Subnormalreihen haben. Einige davon sind isom orph, andere sind wiederum sogenannt e ,,ver feinerungen". Eine Verfein erung ist im Prinzip nichts ander es als das Einfügen von zusätz liche n Folgenglied ern , sodass die Subnormalreih e verlängert wird . Formal bed eutet das:
D efinit io n 6.8 Eine Subnormalreihe G = Mo ~ u, ~ ... ~ M m = { 1 } nennt man Verfein erung ein er Subnormalreihe G = N o ~ N I ~ ... ~ N n = {1} , wenn eine injektive Abbildung f : { 1,2, .. . , n} --+ { 1,2, ... , m} exi stiert mit Ni = M/ Ci)' (Anmerkung: Manchmal werden Unterscheidungen getroffen , ob m = n zugelass en wird . In eine m solch en Fall ist natürlich jed e Subnormalreihe eine Verfein erung ihrer selbs t . Fall s nun tatsächlich m > n gilt , spricht man au ch von eine r "echte n" Verfein erung, an alog zu Begriffen wie der echten Teilmenge.)
96
Gruppenzwang VI
Gilt in eine r Subnormalreih e an irg endeiner St elle N i = N i +! , so spricht man auch von eine r Subnormalreih e mit Wi ed erholungen . Indem man Wi ed erholungen einfügt, kann man eine Subnormalreihe natürlich b eliebig oft verfein ern. Ab er das macht ja keinen Spaß. Eine Subnormalreihe, die selbs t keine Wi ed erholungen hat und auch nicht verfeinert werden kann , ohne Wi ed erholungen einz ufügen, nennt man auch Kompositionsreihe. • Beispiel 6.9 Zu 5 4 gibt es (wie zu j ed er ander en Gruppe au ch) die triviale Normalreih e
Diese können wir schrittweise immer mehr verfeinern: 54 ~ V4 ~ {I} 54 ~ A 4 ~ V4 ~ { 1 } 5 4 ~ A4 ~ V4 ~ ((1,2)(3,4)) ~ { 1 }
Nach dem zweiten Isomorphiesatz ent spre che n die Normalteiler in eine r Faktorgruppe U/ V gen au den Normalteilern in U, die den "herausfakt orisiert en" Normalteiler V enthal ten . Da die Faktoren der letzten Subnormalreihe isomorph zu Z/3Z bzw . Z/2Z sind (siehe oben) , welche beide einfach sind und keine nichttrivialen Normalteiler en thalten , können wir a lso schlussfolgern , dass die letzte Reihe sich nicht weiter verfeinern lässt , ohne zu wiederholen. Es handelt sich also um eine Kompositionsreihe. Die Subnormalreihe
kann man immer verfeinern zu
Da 2n iZ eine echte Untergruppe von n iZ ist , können wir schlussfolgern, dass man eine Subnormalreihe von Z immer verfeinern kann , ohne dass Wiederholungen a uft ret en , sodass Z a lso keine Kompositionsreihe besitzen kann . •
In einer endlichen Gruppe kann man natürlich immer eine Kompositionsreihe finden, da man die triviale Subnormalreihe G ~ 1 nur endlich oft ohne Wiederholungen verfeinern kann aufgrund der Endlichkeit von G .
97
6.3 Die Sätze von Schreier und Jordan-Hölder
Es stellt sich her aus, dass bei en dliche n, aufl ösbaren Gruppen eine Kompositionsreih e stets zyklische Fa kt oren hat. In der Gal oistheori e entspreche n diesen zyklische n Faktor en (im Wesen tli chen) die Körper er weit erungen der For m K( va) . Die Komposit ion sreih e a uf Seit en der Galoisgruppe ents pricht so eine m Turm von Radikalerw eiterungen a uf der Körper seit e. Auf diese Weise wird der eingangs erwähnte Zu sammenhang von auflö sbaren (Galois)gruppen und a uflösbaren Polynomen hergestellt .
6.3
D ie Sätze von Schreier und Jordan- Höld er
Mit dem Wi ssen über Isomorphien und Verfeinerungen können wir nun zwei wichtige Sätze üb er Subnormalreih en formulieren und b eweisen :
Satz 6.10 (Satz von Schreier) Je zwei Subnormalreihen besi tz en is om orphe Verfein erungen . Sind also C = No ~ N I ~ .. . ~ n; = { I} und C = M o ~ !vII ~ .. . ~ u.; = {I} zwei Subnormalreih en eine r Gruppe C , dann gibt es j eweils eine Verfeinerung, sodass beide Verf ein erungen zuein an der isom orph sin d. B e we is: Wir verfein ern zunächst un ser e beiden Subnormalreihen etwas: Au s der Folge No ~ N I ~ . . . ~ n; kon struieren wir
für 0 < i :s: n und 0 :s: j :s: m . Diese Gruppen liegen nach Konstruktion jeweils zwische n N i- 1 = Ni, o und Ni = Ni,m. Wi r er halte n also folgende Subnormal reih e: C = N I,O ~
~
N I ,m
= Ns »
~
Nz,m
~
= N n- I ,O ~
~
N n- I ,m
= Nn,o ~ ... ~ N n ,m
= {1} Die se Folge ist a ufgru nd Ni ,j ~ N i ,j+ I eine Subnormal reihe und wegen Ni, O = N i - I eine Verfeinerung un serer er sten Reihe . Die Eigenschaft Ni,j ~ N i, j+ I folgt aus dem dri t ten Isom orphiesatz , welcher in Gruppenzwang Kapitel 4 bewiesen wurde (wenn m an mi t den dortigen Bezeichnungen U = Ni- I, Uo = Ni, V = M j und Va = M j +I setzt ).
98
Gruppenzwang VI
Ganz an alo g können wir die zweite Subnormalreih e verfein ern , indem wir die Gruppen u ., := Mj (Mj- 1 n Ni ) definier en für alle 0 ::; i ::; n und 0 < j ::; m . Ganz ähnlich zu obe n ist dann M O,j
und
=
Mj-
l ,
M n ,j
=
M,
u ., ~ M i +l ,j '
Somit haben wir auch hier eine Subnormalreih e als Verfein erung: G
=
MO , 1 ~
= M O,2 ~
~ Mn , l ~
M n, 2
= MO, m -1 ~ ... ~ lVln ,m- 1
= Mo ,m = {1}
~ ... ~ M n,m
Der nächste Schritt b est eht nun in der Isomorphie dieser b eid en Verfein erungen. Zunäch st erkenne n wir , dass b eid e Verfein erungen die Länge n · m haben, denn die Indizes i und j laufen in der erst en Kon st ruktion von 1 bis n bzw . 0 bis m und im zweiten Fall von 0 bis n bzw . von 1 bis m. In der Subnormalreihe st ehen a ber m ehrere Indizes für die selbe Gruppe, d. h ., wir müss en n bzw. m wieder a bziehen, um die korrekte Anzahl zu erh al ten . Somit haben wir n(m + 1) - n = nm bzw . (n + l)m - m = nm Gruppen in beiden Ke tten . Wenn man je tzt den dritten Isomorphiesatz noch einmal anwendet, erhält man a ußerde m , dass N-I/N t, ) t, ] . ~ M t -I ,]·IM1,,). für alle 0
::; n , 0
< j ::; m gilt.
Daraus folgt also au ch die zweite Bedingung für Isomorphie. Die beiden Verfei0 nerungen sind isomorph. Mit Kenntnis dieses Satzes können wir ein weiteres wichtiges Ergebnis formulieren und b eweisen , nämlich den Satz von Jordan-Höld er.
Satz 6.11 (S a t z von Jordan-Hölder ) J e zw ei Kompositionsrei hen ein er Gruppe sin d isomorph. Vor allem sagt dieser Satz, dass eine Gruppe bis a uf Isomorphie nur eine Kom po sition sreih e hab en kann , falls sie denn üb erhaupt eine hat . In sb esondere sind die Faktoren der Kompositionsreih en (auf die es uns ja eigent lich ankommt) nur durch die Gruppe selbs t schon eindeut ig b estimmt.
99
6.4 Kommutatoren B eweis:
Nehme n wir a lso an , es gä b e zwei Kompositionsreihen .
Nac h dem Sat z von Schreier gibt es Verfeinerungen der jeweiligen Komposition sre ihe, die zu einander isomorph sind. Da m an Kompositionsreihenlaut Definition nicht verfeinern kann , ohne Wiederholungen einzufügen , sind die se Verfeinerungen mögli che rwei se mit Wiederholungen behaft et . Wenn wir die se in bei den Reihen wieder streichen , bleibt die Isomorphie erh alt en , obwohl wir wieder au f die ursprüngliche Kompositionsreihen red uzier en. Also sind a uc h die b eid en ursp rünglichen Reihen isomorph . D
6.4
Kommutatoren
Wie so oft führen viele Wege zum Ziel. Einer der wichtigsten Wege zur Un tersuchung von auflösbaren Gruppen sind Kommutatoren . Sch auen wir uns do ch gleich einmal an , was das ist und was das bringt : D efinition 6. 12 Wi r definieren den Kommutator [a , b] zweier Gruppenelemente a und b wie folgt :
(Wie so oft , wenn man zwei gleichberechtigte Varianten hat , ist au ch hier die andere Definition als a - 1 b- 1 ab im Umlauf. Alle Sä tze und Bewei se gelt en sinngemäß au ch für die se Definition .) • Was zuerst einmal nicht so ganz naheliegend erscheint, ist in de r Tat a ber di cht mit unserem Thema verbunden , wenn m an die folgende Definition für Tei lmengen eine r Gruppe U und V kennt : D efi nit io n 6.13 Sei G eine Gruppe. U, V ~ G seien b eliebige Teilmen gen . Wi r defini er en die Unt ergru ppe [U, V ] durch : [U, V ] := ([u,v] lu E U, v E V)
Nicht über zeu gt? Na gut : Dann wird dieser Satz b est im mt helfen:
•
Le m m a 6 .14 V A, B ~ G : [A , B ] = { I} -{:::::::} Va E A , b EB : ab = ba
E r besagt also , dass zwei Teilm eng en genau dann eleme nt weise kommutier en, wenn ihr Kommutator gleich 1 ist. Schreiten wir zum Beweis :
100
Gruppenzwang VI
Beweis: ,, ===}": Sei [A , B ] = { 1 }, dann gilt insbesondere für alle a E A , b EB : aba-1b- 1 [a, b] = 1, denn sonst gäbe es noch ein weiteres El em ent im Erzeugnis aller Kommutatoren . Daraus folgt vor allem : aba-1b- 1 = 1 ===} ab = ba. " {::::= " :
'Nenn wied erum alle Kommutatoren [a, b] = 1 sind, dann kann das Erzeugnis 0 aller dies er Kommutatoren auch nur { 1 } sein. Immer no ch nicht ganz üb erz eugt? Nun denn, betrachten wir eine Gruppe G und die Kommutatorgruppe I G := [G, G]. Wenn f : G ---+ H nun ein Gruppenhomomorphismus ist, so gilt ja offensichtlich f(aba -1b- 1) = f(a)f(b )f(a) -lf(b) -l und daher
f(G
I)
= f( ([g ,h] Ig, h =
E
(I( [g , h]) I g, h
G ))
E G)
= ([j (g), f(h) ] I g,
ue G)
= [j (G ), f(G) ]
In sbesondere ist f ([G , G]) = [j(G) , f (G) ] ~ [G , G] für einen Endomorphismus f : G ---+ G . Das heißt also , dass GI eine voll charakteristische Untergruppe von G und damit insbesondere ein Normalteiler von G ist. Was liegt bei Normalteilern näher, als ihre Faktorgruppe zu betrachten? Schauen wir uns also GI G I an . Da in einer solch en Gruppe für alle g, h E G gilt: ghg -1 h -1G I GI, ist vor allem ghG I = hgG I, womit GI GI insbesondere abelsch wird . Man kann es sogar noch weiter fas sen , denn eine Faktorgruppe G IN ist genau dann a belsch, wenn [G, G] ~ N ist , wegen der Beziehung [g, h]N ghg -1h - 1N = N , die in diesen Gruppen ja gelten muss . Wir halten fest: Le m m a 6. 15 Sei N :::! G . Dann ist G IN abelsch -{::::::::} [G, G]
6.4. 1
~
N.
Die Kommutator-Reihe
"Mome nt !" wird der eine oder andere jetzt denken , .abelsche Faktorgruppen? Da war doch et was ..." J a, ganz richtig ged acht: Abelsche Faktorgruppen in einer Subnormalreihe sind essenziell dafür, dass eine Gruppe auflösbar ist . Wir können mit der Kommutatorgruppe immer eine abelsch e Faktorgruppe erreiche n . Was liegt also näher , als unser e ebe n gewonnen en Erkenntnisse an zuwenden und eine Kette von Kom mutatorgruppen zu defini er en :
101
6.4 Kommutatoren
D efinition 6.16 Die sogenannten höh eren Kommutatorgruppen einer Gruppe C sind rekursiv definiert durch :
c
•
J etz t ist eine a bst eigende Folge von Subnormal t eilern (in der Tat malt eilern , da alle a» charakterist isch in C sind) . Sie Subnormalreih e nach un serer ob igen Definition , wenn die wird , d . h ., wenn es ein k E PT gibt mi t 1 = C ( k ) = C( k +l)
eine Folge von Norist gen au dann eine Folge bei 1 st ationär = .. .
Ins bes ondere sind in eine m solche n Falle also alle Faktoren abe lsch , wie wir gese he n haben , sodass C in diesem Fall e als o a uflösbar wäre. Man kann sogar noch eine n Schritt weitergeh en und sagen : Satz 6.17 Eine Gruppe C ist auflösbar {::::::::} :3 k E PT : C
(k )
= 1.
In der Tat wird nicht selten Auflö sbarkeit üb er diese Kommutatorreih e defini er t. Das kleinste k , für das C(k) = { 1 } gilt, wird au ch Auflösbark eitsstufe von C genannt. Offen sichtlich haben abelsche Gruppen die Auflö sbarkeitsstufe < 1 (wob ei 0 gen au für die triviale Gruppe eintrit t). Beweis: (Beweis des Satzes) ,, ===}" : Da C a uflösbar ist , exist iert eine Subnormalreihe
C
= N o ~ NI
~
... ~
n; = { 1 }
mi t a belschen Fa kt oren . Es reich t zu zeige n, dass in eine m solche n Fall c'» = 1.
C (i ) <:;;;
Ni ist , denn dann wär e
Wir machen das am best en p er Induktion nach dem Index i . Ein Induktion sanfang dr ängt sich mit C( a) = C = N o praktisch auf. Der Induktionsschritt ist au ch nicht so schwer , denn nach Induktion svoraussetzung ist o» <:;;; Ni, sodass au ch C(i+l) = [C (i), C(i) ] <:;;; [N i, Ni ] ist . Da vor allem die Faktorgruppe N;fNi + 1 abelsch ist (das ist ja un ser e Bedingung an die Subnormalreih e) , ist [N i , N ;] in N i+1 ent h alten , wie wir ob en festgest ellt haben . So gilt also C(i+l) <:;;; [N i , Ni ] <:;;; N i+1 , womit wir in sgesamt Vi E PT : C(i) <:;;; N i bewiesen haben .
102
Gruppenzwa ng VI
ß-- " .. ,, "r-Die Rückrichtung gestaltet sich viel einfache r, denn wir wissen ja b ereits, dass die Faktorgruppen C (i ) I C(i+1)) immer ab elsch sind und C deshalb auflösbar ist, da die Kommutatorreih e b ei { 1 } ende t.
D
B e is p iel 6. 18 Betrachten wir wieder unsere liebgewonnene Gruppe 84 . Dort ist die Kommutatorreihe folgende:
• 6.4.2
Nützliches für Gruppentherapeut en
Zum Schluss wollen wir noch schne ll ein paar Lemmata b eweisen, die man für das Arbeiten mit auflö sbaren Gruppen immer wied er gebrauchen kann . Le m m a 6.19 Ist U ::; c, so ist u (i ) ::; c». B eweis : Da s ist wirklich trivial (wir haben es au ch oben schon benutzt): Da U <;;; C , ist { [U1,U2] U1 ,U2 E U} <;;; { [g l ,g2] gl ,g2 EC} , weshalb [U,U] = ([U1, U2] IU1, U2 E U) ::; ([gl, g2] Ig1, g2 E C ) = [C, C] ist . Induktiv folgt die allg em ein e Aussage. D 1
1
Lemma 6 .20 V i ,j E N : (C(i )) (j)
= C (i +j )
B eweis : An diesen Beweis kommt man auch recht einfach heran: Für j = 0 ist das klar, denn wir hatten den Kommutator O-t er Stufe als mit der Gruppe identisch definiert , also haben wir den Induktionsanfang (C(i )) (0)
=
C (HO) .
Der Induktionsschritt ist einfach :
D
Le m m a 6.21 Sei N :::! C . Dann gilt: V i E N: (C IN) (i) =
(d i )NIN )
103
6.4 Kommutatoren
Beweis:
Der Beweis ist hier eine schnell gemachte Umformung:
Mit (C / N) (O ) = C /N = CN/ N = C(O )N/N haben wir eine n Induktionsanfang gefunden. Außerdem können wir feststellen , dass gilt :
(C / N) (i+1 ) = [(C / N )(i), (C /N) (i)]
= [C< i)N/N, C< i) N / N]
n e C (i)N ) ([gN, hN] I g, n e C (i»)
= ([gN , hN] I g, =
= ([g, h ]N I g, h
E C (i»)
1
= C< i+ ) N/N
o Und zum Schluss noch ein unschätzbar wertvolles Werkzeug in der Theorie auflösbarer Gruppen:
Satz 6.22 Ist N ~ C , so ist C auflösbar {::::::::} C / N und N sind auflösbar. Beweis: en:
Hier kann man den Beweis auf dem ebe n bewiesen en Lemma aufbau-
" ===} " :
Das ist trivial, d enn für a» = {I} gilt natürlich auch N( i) (C /N) (i) = C (i)N /N) = IN/N ~ {I}.
"
{ 1 } und
{== " :
Die ander e Richtung ist auch machbar, d enn wenn C / N und N auflösbar sein sollen, gibt es ein i und ein j mit
(C /N)( i) = N /N und N (j ) = { I} . Wegen erstere m gilt
(C /N)( i) = C(i) N /N = N /N , also insbesondere C (i) N ~
N
===}
C (i) ~ N . Zus ammen mit N(j ) = {I}
können wir sagen , dass C(i +j) = (C (i») (j)
~
N(j) = { 1 } ist , C also auflösbar höchstens mit der Auflösbarkeitsstufe i + j ist. 0 Besonders letzteres wird oft für Beweise verwendet , sodass es sich damit geradezu aufdrängt , eine Induktion über die Ordnung der beteiligten Gruppe(n) durchzuführen . Wenn man zeigen möchte, dass ein bestimmter Typ von Gruppen auflösbar ist (üblich sind z. B. die Vorgabe bestimmter Arten von Primfaktorzerl egungen der Gruppenordnung) , dann kann man das dadurch tun , dass
104
Gruppenzwang VI
m an a nnim mt , alle Gruppen dieses T yp s mit einer Ordnung klein er als IGI wären bereit s als auflösbar erkannt, und dann einen nicht tri vialen Normalteiler 1 < N < G kon struiert. Sind dann G j N und N ebenfalls von diesem spez iellen Typ , so sind sie echt klein er und dah er nach Indukt ion sannahme auflösb ar , also ist auch G a uflösbar und die Indukti on vollst ändig.
6.5
Nilpot ent e und p-G ruppen
Wir wissen aus vorgeh enden Kapit eln des Gruppen zwan gs be re its , dass durch Z( G ) := { g E G
I Vu e G
: gh = hg}
ein Normalteiler von G definiert wird, de r "Zent rum von G" gen an nt wird . Eine besonder es interessante Sicht darauf hat m an , wenn man die Faktor grupp e G jZ (G) betrachtet. Denn diese hat au ch wiede r ein Zentrum. Aufgrund des zweiten Isomorphiesatzes können wir dann vor allem schlussfolgern , dass Z (G j Z (G)) zu ein er Un tergruppe U (gen auer gesagt ein em Normalteiler ) von G gehört, die Z (G) ent hält un d U j Z (G) = Z (G j Z (G)) erfüllt . Und weil U wied er ein Nor m alteiler ist , kann man das Spi el natürlich fortset zen und a uch hie r wieder den Normaltei ler suche n, de r die En t sp re chung zu Z( G jU ) ist. Das ganze führt un s schließlich und endlich zu folgender rekursiver Defini ti on :
D e fin it io n 6.23 Die auf st eigende Z entralreih e de r Gruppe G ist definier t durch Zo = { 1 } Zn+l/Zn
=
Z(GjZn )
Oft wird a uch die Gruppe dazugeschrieb en , a uf die m an sich b ezieh t. Man sch reibt also Zn( G ), wenn man das a uf die Gruppe G bezieh t . • Wir sehe n natürlich, dass dann Z l (G ) = Z( G) das Zentrum der Gruppe ist und Z2 (G) un ser er Gruppe U von ob en ent spricht . Da das insb esondere Normalte iler sind , dr ängt es sich geradez u auf, daraus eine Normalreih e zu bilden:
Besonders inter essant sind für un s diejenigen Gruppen , bei den en für ein k E N der Fall G = Zk (G) eint rit t . Solche Gruppen werden au ch nilpotent gen annt . Die klein st e natürliche Zahl k mit Zk( G) = G wird auch N ilpotenz-Klasse von G genannt.
6.5 Nilpotente und p-Gruppen
105
Und wie b ereits ob en gesagt , sind nilpotente Gruppen ein Spezialfall von a uflösbaren Gruppen : Da für die Faktorgruppen Zn+l /Zn <:;;; Z(G /Zn) gilt , sind alle Faktorgruppen in der aufst eigenden Zentralreih e abelsch . Das sieht man sehr einfach, wenn man sich klarmacht, das s in der Reih e
die Faktoren immer per definitionem das Zentrum eine r Gruppe sind und daher garantiert a uch immer ab elsch . Allein mi t die sem Wissen können wir wunderbar einen sehr wichtigen Satz beweisen:
Satz 6.24 Endliche p-Gruppen sin d nilpoten t. Beweis: Es ist also IGI = pk für ein p E lP' und ein k E N. Au s dem vorigen Kapitel des Gruppenzwangs kennen wir be rei ts den Satz , dass jede endliche, nichttriviale p-Gruppe ein ni cht triviales Zentrum hat . Mehr brauchen wir ni cht , denn an genommen, n E N wär e ein Index, für den Zn = Zn+l = ... -I G gilt. Dann ist G /Zn eine nichttriviale, endliche p-Gruppe, d. h ., sie hat ein nichttriviales Zentrum. Ande re rseit s ist Z(G /Z n) = Zn +1/Zn = 1 nach Annahme. Das ist ein Widerspruch , also kann sich die Zen tralreihe nicht unterh alb von G st abilisieren . Sie mu ss sich aber stabilisier en, weil G ja en dlich ist . Also mu ss das E nde der Fahnenstange bei G selbst liegen. D Das heiß t vor allem na türlich , dass Gruppen de r O rdnung pk a uch a uflösbar sind . Mit etwas mehr Au fwand kann man a uch beweisen , dass Gruppen de r Ordnung pk q fü r zwei Primzahlen p und q a uflösbar sind. Es gibt viele weitere Kriteri en , die allein a nhand der Gruppen ordnung üb er Auflö sb arkeit Au skunft geben . Mit Hilfe der sogena nnten Dar st ellungstheori e kann man da z. B . relativ einfach den Satz von Burnsid e beweisen , der b esagt , dass jed e Gruppe der Ordnung pul a uflösbar ist . Dar st ellungstheori e wird au ch im (sehr, sehr schweren !) Satz verw endet , dass sogar jed e Gruppe unger ader Ordnung a uflösbar ist. Dieser Satz wurde 1963 von J . Thompson und W . Feit auf 254 Seiten bewiesen. Während der pUl -S atz von Burnside a uch einen (rel ativ um st ändlichen) gruppentheore ti schen Bewei s hat , ist für den Satz von Feit- Thompson bisher nur der darstellungstheoretische Beweis bekannt .
106
6.6
Gruppen zwang VI
Abschluss
So, ich hoffe , ich habe euch einen kurzen Einstieg in die Theorie der Subnormal-, Normal- und Zentralreihen gegeben. Wie gesagt , spielt die Auflösbarkeit und die Nilpotenz von Gruppen in der Algebra eine sehr wichtige Rolle. Mit dem hier (hoffentlich) erworbenen Wissen hat man a uf jeden Fall einen Einstieg in die Vielzahl der Theoreme, die sich da vor einem auftun . Wer Spaß an Algebra hat , dem sei dieses Gebiet auf j ed en Fall empfohlen , es bietet sehr viel Interessantes . An Literatur wird empfohlen : •
•
•
Die Theorie der endlichen Gruppen von Kurzweil und Stellmacher [1] enthält eine knappe Einführung in die Gruppentheorie, die die Ergebnisse des Gruppenzwangs komprimiert darlegt. Außerdem sind viele interessante Themen enthalten, die man nach dem Gruppenzwang untersuchen kann . Ist auch sehr gut geschrieben, finde ich. Wirklich fortgeschritten von der Thematik und Stilistik ist Finite group theory von Aschbacher [3]. Das ist schon eine Perle, man muss es aber mögen, wie Aschbacher schreibt. Das Gruppentheoriekapitel in Artin [2] ist für Anfänger geeignet, enthäl t abrundende Informationen und die Übungsaufgaben sind auch prima.
So das war's erst einmal von mir zu den Gruppen . Weitere Kapitel des Grupp enzwangs gibt es auf dem Matheplaneten [sieh e 5]. mfg = G ~ 0 ~ C ~ K ~ E ~ L = {1}
Johannes Hahn (Gockel) ist Dipl.-Math. und promoviert in Jena.
7 Ein Spielzeug mit Gruppenstruktur
Übersicht 7.1
Einleitung
107
7.2
Sp eedcub ing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 108
7.3
Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 109
7.4
Die Gesetze des Würfels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 109
7.5
Die Cubegruppe
7.6
Konjugation und Kommutatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.7
Ein paar offene Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
7.8
Weitere Informationen
110
115
"T here is a new craze going around th e world: to turn the cube. l hav e don e it myself and discov ered Rubik 's cube as a won derfu l
instrument of demonstrating some basic facts of group theory an d their application to Euclidean geometry. " Hans Julius Zassenhaus
7.1
Einleitung
Der Ru bik's Cube, in Deut schland b esser bekannt als Zauberwürfel, ist wohl das bekannteste Spi elzeug a us den 80er-Jahren . Es handelt sich um eine n kleinen Würfel (siehe Abbildung 7.1), besteh end au s dr ei Eben en, mit jeweils neun farbigen Aufkleb ern pro Seite, wob ei die Aufkleb er eine r Seite gleich gefärbt sind. Jede Ebene lässt sich dreh en . Das Ziel ist klar : Den Würfel, nachdem er verdreht wurde, zurück in die Ausgangsposition bringen . In diesem Kapit el möchte ich eine klein e Einführung zu diesem sehr interessant en Spielzeug geb en und kurz ansch neiden , wie man ihn mathematisch beschreiben kann . Es st ellt sich nämlich heraus, dass der Zauberwürfel ein sehr schönes
7 Ein Spielzeug mi t Gruppenstruktur
108
Abb. 7.1: Rubik's Cube oder Zauberwürfel
anschauliches Beispiel für eine Permutationsgruppe ist , nämlich eine Untergruppe der symmetrischen Gruppe auf 48 bzw. 54 E lementen. Er eignet sich daher sehr gut dazu , gruppentheoretische Konzepte wie z. B. das der Ordnung, Konj ugation , Kommutatoren oder viele weitere kennenzulernen. Außerdem stellt er ein nettes Beis piel fü r das Phänomen der kom bina torisc hen Exp losi on dar. Um diesem Beitrag folgen zu können , sollte der Leser ideal erw eise selbst eine n Zauberwürfel zur Hand ha ben . Wi e ma n eine n W ürfel genau löst, werd e ich hier all er dings nicht er kläre n , da es dazu b er eit s genügen d Material im Internet gibt. Ich wer de a uf einige Eig enschaften des W ürfels eingehe n und a uch ein paar interessante Sätze der "Cubet heorie" (ohne Beweis) zitieren.
7.2
Speedcubing
Unter Speedcu bing ver steht man, wie der Name bereits suggeriert, das Lösen von Zauberwürfeln und anderen ä hnlichen P uzzles a uf Zeit . Es gibt dafür (sowohl in Deutschland als auch welt weit) eine enorm schnell wachsende Community, und es ist t atsäch lich nicht so schwer zu lern en , wie manch einer vielleic ht denkt . Nach weniger als ein paa r Wochen Übung kann jeder a uf Zeiten von unter einer Minut e komme n , nach ein paar Monat en durchaus a uch deutlich darunter . De r aktuelle offizielle Welt rekord liegt bei einer Dur chsch nit t szeit von unt er 10 Sekunden . Mehr Informati onen : www .speedcubing . com/
7.3 Notat ion
7.3
109
Notation
Der Würfel besteht aus drei unterschiedlichen und nicht a ust auschbaren Arten von Steinen: Ecken, Kanten und Mitten. Eine Mitte ist ein Stein mit genau einem Aufkleber (davon gibt es sechs Stück) , eine Kante hat gen au zwei Aufkleber (zwölf Stück) und eine Ecke hat gen au drei Aufkleber (acht Stück) . Der Typ der Steine kann offen sichtlich durch die Drehungen nicht geändert werden , d. h. , es ist z. B . nicht möglich , einen Kantenstein mit einem Eckenst ein zu t auschen usw . Eine weitere zum Verständnis des Würfels sehr wichtige E igenschaft ist , dass die Mittelsteine fest sind: Auf einem üb lichen Zauberwürfel ist z. B. der weiße Mittelstein gegenüb er von dem gelb en un d es gibt kein e Dreh ung, die das änd ert . Die sechs Seiten des W ürfels ents preche n de n sechs Basisdreh ungen , die durchführbar sin d ..Jede Seite lässt sich dreh en un d die Drehungen werden wie folgt bezeich net: U (Up) , D (Dow n), B (Back) , F (Front) , R (Right) und L (Left) , jeweils um 900 im Uhrzeiger sinn (b ei Draufsicht a uf die jeweilig e Seite) . J ed er Kanten- und jed er Eckenstein des Würfels hat genau zwei Paramet er die ihn einde ut ig beschreib en : Sein e Pe rmutation, d . h. sein e Position auf dem Würfel, und sein e Orientierunq. Ecken haben dr ei mögliche Ori entierungen (z. B. gelber Aufkleber oben/vorne/rechts) , Kanten haben zwei mög liche Orientierungen (gekippt od er nicht gekippt) . Mehr Infor m at ionen : www .cos i ne - sy stems. com/cube stati on/ cube notation. html
7.4
Die Gesetze des Würfels
Offensichtlich ist nicht jed e P ermutation der Aufk leb er möglich, z. B. wird man durch kein e Drehung eine n St ein dazu bringen können, zwei Aufkleb er mit der gleich en Farbe zu hab en. Ab er auch ander e Konfigurationen, die auf den ersten Blick erreichb ar erscheine n, sind a uf eine m korrekt zusam me ngebaute n Würfel nicht herstellbar. Wird ein Würfel in seine Einzelteile auseinander genommen und zufällig wieder zusammengebaut, so ist dieser nur mit einer Wahrscheinlichkeit von 1 : 12 t atsächlich lösbar . Grund dafür sind die folgenden Geset ze: 1. Nur die Hälfte der Permutationen ist möglich . Die An zahl der Vertauschungen von St ein en ist immer eine gerade Zahl. 2. Nur die Hälfte der Kantenorientierungen ist mög lich . Die An zahl der Kanten, die von eine m Zug umorientiert ("gekippt") werden , ist immer eine gerade Zahl , d. h., wenn eine Kante geki ppt wird, dann immer auch noch eine zweite.
110
7 Ein Spielzeug mit Gruppen struktur
3. Nur ein Drittel der Eckenorientierung en ist möglich. Mehr Informationen: www.ryanheise.com/cube / cube_laws. htrnl
7.5
Die Cubegruppe
Wie schon erwähnt, besteht der Za uberwürfel aus sechs Seiten mit jeweils neun Aufklebern, also au s insgesamt 54 Aufklebern. Die Mittelstücke sind fix, d. h . können nicht untereinander permutiert werden und sollen daher im Folgenden ohne Einschränkung der Allgemeinheit ignoriert werden . Alle übrigen Aufkleber werden wir durchnummerier en, z. B . nach folgendem Schema:
1
2
3
4
U
5
6
7
8
9
10
11
17
18
19
25
26
27
33
34
35
12
L
13
20
F
21
28
R
29
36
B
37
14
15
16
22
23
24
30
31
32
38
39
40
41
42
43
44
D
45
46
47
48
Jedem Aufkleber wird a lso genau eine natürliche Za hl zwisc hen 1 und 48 zugewiesen. Die sechs Basisdrehungen de s Würfels lassen sich nun bereits a ls P erm ut ation der Aufkleber beschreiben. In disjunkter Zykelschreibweise laut en die se: • • • • • •
F = B = L = R= U = D =
(17 ,19,24 ,22)( 18,21 ,23,20)(06 ,25,43,16)(07 ,28 ,42,13)(08 ,30,41 ,11) (33 ,35,40 ,38)(34,37 ,39,36)(03,09,46 ,32)(02 ,12 ,47,29)(01 ,14,48 ,27) (09 ,11,16 ,14)(10,13 ,15,12) (01 ,17,41,40) (04,20,44,37) (06 ,22,46 ,35) (25 ,27 ,32,30)(26 ,29,31 ,28)(03,38 ,43,19)(05 ,36,45 ,21)(08,33,48,24) (01,03 ,08,06)(02 ,05,07 ,04)(09 ,33 ,25,17)(10,34,26 ,18)(11 ,35 ,27,19) (41 ,43,48 ,46)(42,45 ,47,44)(14 ,22,30,38)(1 5,23 ,31,39)(16 ,24,32 ,40)
Es ist klar , dass keine der sechs Basisdrehungen eine Wirkung hat , falls sie viermal wiederholt wir d . In der Sprache der Gruppentheorie: Die Basi sd rehungen haben eine Ordnung von 4. Allgemein versteht m an unt er der Ordnung eine s Zuges die kleinst e An za hl an Wi ederholungen, die auf einem ber eits gelösten W ürfel d urchgefü hrt werden muss, um wied er zu diesem zu gelangen .
111
7.5 Die Cubegruppe
Wir haben durch unsere ModelIierung als P ermutationen der Aufkleb er nun ber eits eine einfache Mögli chkeit , um die Ordnung eines b eliebigen Zuges zu bestimmen , da die Ordnung eine r P ermutation in disjunkter Zykelschreibw eise bekanntlich genau das klein st e gem einsame Vielfache der Zykellängen ist . Zur konkreten Rechnung bemüht man am besten ein Computeralgebrasystem wie z. B . GAP: Order(U) Order(UD) RU
4
Order(DU) = 4
(1,3,38 ,43,11 ,35,27 ,32,30 ,17,9,33,48,24,6) (2 ,5,36,45 ,21,7,4) (8 ,25,19) (10 ,34,26 ,29,31 ,28,18)
Order(RU) A
Order(A)
kgV(l 5,7,3,7) = 105 R 2 U - 1 R -1 U - 1R U RU R U - 1R Order((2 ,4,5)(10,26 ,34)) = 3
Der Zug R U muss also z. B. 105-mal wiederholt werden , um wieder zum gelösten Würfel zurück zu gelangen. Bei dem zu letzt genannten Zug handelt es sich um einen sogenannten Kanten 3-Cycle, eine Zugfolge , die drei der vier Kanten der oberen Ebene zykli sch vertauscht, ohne die Orientierung zu ä ndern. Solche Zugfolgen, di e nur sehr wenige Teile b eeinflussen , spi elen beim Lösen des Würfels (durch eine n Menschen , et wa beim Sp eed cubing) eine sehr wichtige Roll e. Mehr Informationen: www.gap -system. org /D oc /Exampl es / rub ik . ht ml
D e fin it ion 7.1 (Cub eg r oup) Sei NI := {I , 2, ... , 48} die Menge der Aufkleb er des Zauberwürfels und R , L , U, D , F, B E SM seien die sech s Basisdrehungen. Dann heißt die Permutationsgruppe C , die von den sechs Basi sdrehungen erzeugt wird, die Cubeqroup : C: = (R, L,U, D, F, B) Es gilt C e SM = S48.
•
Wi e die meist en P ermutationsgruppen ist auch C kein e ab elsche Gruppe, d . h ., nicht alle Züge kommutieren miteinander (C hat soga r fast triviales Zentrum , sieh e unten) , d . h . im Allgem ein en ist es wichtig, in welch er Reih enfolge zwei Zugfo lgen au sgeführt werden . Die Zuordnung zwische n St ellungen des 'W ürfels und Zugfolgen ist natürlich nicht einde ut ig, d. h ., es gibt für jed e St ellung eine Vielzahl von Zügen, die diese St ellung auf eine m gelöst en Würfel herbeiführen .
112
7 Ein Spielzeug mit Gruppenstruktur
Es stellt sich nun die Fr age, wie viele Eleme nte es in der Gruppe G gibt, d . h ., welche Ordnung G hat .
Satz 7.2 G hat die Ordnung 43252 0032 74489856 000.
Es gibt al so et wa 43. 10 18 ver schi ed en e Art en, au f die ein Würfel verdreh t werden kann .
Beweis: Diese Zahl ist unmitt elb ar a us den Gesetzen des Würfels herl eitbar: Es gibt 8! Pe rmut a tionen de r Ecken , 38 mögli che E ckenorient ierungen , 12! mögliche Permutatione n der Kanten , 2 12 mögli che Kant enorientierungen , allerdings sind nur die Hälfte der Kant en orientierungen , die Häl ft e der P ermutationen und ein Drittel der Eckenorientierungen mö glich. Zusammen erg ibt das: ordG
= __1_ . 8!. 38 . 12!. 2 12 2 ·2 · 3
= 22 7 . 3 14 .5 3 . 72 . 11 1 = 43 252 003 274 489 856 000
D
Die se Zahl ist übrigens um 1 größer al s eine P rimzahl , d . h ., die Anzahl der ung elösten Stellungen des W ürfel s ist prim . De r Satz von Lagrange , ein bekannter Satz au s der Gruppentheorie, be sagt, dass die O rdnung jedes E lementes einer endlichen Gruppe die Gruppen ordnung teilt. De r Satz von Cauchy be sagt , dass zu j edem P rimteiler p von IGI ein Element exist iert , dessen Ordnung gleich p ist . Damit lässt sich z. B . folgern , dass es eine Zugfolge mit Ordnung 11 gebe n mu ss, ab er dass kein e exist iere n kann , der en Ordnung gleich 13 ist . Da G selbst endlich ist , folgt außerdem , dass die Ordnung jedes Elementes endlich sein muss. Tat sächli ch ist die maximale Ordnung eines E leme nt es a ber deutlich kleiner a ls die Gruppenordnung.
Sa t z 7.3 Der Zug RU 2 tr:' BD - 1 hat Ordnung 1260. Es exist iert kein Zug mit größerer Ordnung. Ebe nfa lls inter essant ist die Fr age, wie ,,nichtkommutativ" eine Gruppe ist. Ein Maß dafür ist die Größe des soge nannten Zentrums.
113
7.6 Konjugation und Kommutatoren
D efinition 7.4 (Zentrum) Das Zentrum Z(G) eine r Gruppe C ist diejeni ge Untergrupp e von C, die gen au die E lement e von C en thäl t , die mi t allen anderen kommutieren , d .h.: Z (C) := { z E C: zg = gz Y g E C}
•
Es stellt sich her aus, dass nur sehr wen ige Züge im Zentrum der Cubegroup liegen.
Satz 7.5 Sei C die Cubegroup, dann gilt : Z(C) = {id , superflip} , wobei supe rflip
R - 1U 2 BL - 1PU - 1BDPUD - 1 LD 2P - 1RB - 1DP-1U - 1B - 1UD -
1•
Die ser Zug kippt alle Kanten (ohne sie zu permutieren) und behält alle E ckenkonfi gura tionen bei. Er ist al so, neben de r Identi tät , de r einzige , der mit a llen ander en Züg en vertau schbar ist .
Isomorphieklassen von Untergruppen Viele kleine Unterg ru ppe n der Cubegroup lassen sich relativ einfac h durch allgemein b ekannte Gruppen a us d rücken. Au f diese Weise lassen sich diese Gruppen sehr schön mit Hilfe de s W ürfel s veran sch aulichen , z. B . ist jede Untergru ppe, die von einer 180'-Drehung erzeugt wird, isomorph zur zykli schen Gruppe mi t zwei E lemente n (C2 ~ (':2/ 2':2, + )) und die von R 2p 2R 2p2 und R 2 erzeugt e Unt ergru pp e ist isomorph zur sy mmetrischen Gruppe auf d rei Elementen (83). Ei ne au sführliche Liste mi t in tere ssanteren Un tergruppen findet sich im In ternet au f Ja aps P uzzle Pag e: www.geocit ies.com/j aapsch/puzz l esl subgroup . h t rn.
7.6
Konjugation und Kommutatoren
Die zwei wichtigst en gruppentheor eti schen Kon zepte, die dazu dien en , neu e Zugfolgen zu find en od er ber eits b ekannt e Zugfolgen sinnvoll anwenden zu können , sind die Konjugation und die Bildung von Kommuta toren. In sb esonder e beim Blindlösen des Würfels spielen sie eine enorm gro ße Roll e.
114
7 Ein Spielzeug mit Gruppenst rukt ur
Beim Blindlösen geht es in erster Lini e darum, sich den kompletten Würfel (bzw. dessen Lösungsweg) in eine r vorh eri gen Einprägephase a us wendig zu merken . An schli eßen wird bei verbunden en Augen gelöst, ohn e dass der Würfel nach trägli ch no ch einmal a nges chaut werden dar f. Der a kt ue lle Weltrekord (St and Juli 2010) liegt bei 30,94 Sekunden (Einprägen und Lösen) .
D efin it io n 7.6 (Konjugation) Seien g, u e C, dann heißt h· g . ti:' die Konjugation von 9 mit h.
•
Die Konjugation mit eine m Elem ent ist ein Automorphismus der Gruppe, d. h . ein bijektiver Gruppenhomomorphismus der Gruppe in sich selbs t. In der Sp eed cubing Community bezeichnet man Konjugati onen treffend als S etup Mo ves, d . h ., es sind Züge , die Ste ine in Posit ion bringen (h), a nschließend eine Zugfolge ausfü hren (g) und dan ach die Po sitionierung rückgä ngig machen (h - I ) . Der Effekt wird also der glei che sein wie der von g, nur dass er sich au f andere Steine a us wirkt. Mit diesem Kon zept las sen sich leicht a us ber eits b ekannten sinnvollen Zugfolgen neu e herleit en . Angenom me n wir kennen b ereits einen Zug der dr ei Kanten st ein e der ob er en Eben e zyklisch vertauscht (ein en 3-C ycle, siehe ob en) . Mit Hilfe die ser Zugfolge ist es uns nun be reits mögli ch , drei b eliebige Kantensteine zu permutie ren . Wir mü ssen die drei St eine, die wir t ausc hen wollen , ledi glich no ch "p er Setup" in die Positionen bringen , von der a us wir be reits wissen , wie man die Steine tauscht . Ein weiteres wichtiges Kon zept ist das des Kommutators.
D efinition 7. 7 (Kom m u tato r ) Seien g, h E C, dann nennt man [g, h] = g-Ih -Igh den Kommutator von 9 und h , • Kommutatoren sind in gewisser Weise ein Maß dafür , wie sehr zwei Elemente das Kommutativgesetz verle tzen. Wenn 9 und h kommutieren , ist de r Kommutator das neutrale E lement . Für den Cube sind solche Züge oft sehr nü tzlich . W ählt man z. B. zwei "fast kommutierende" E lem ente 9 und h so ist [g, h] sehr oft ein Zug , der "wenig ä nde rt" und "nütz liche Auswirkungen" hat . Ein kurzes Beispiel soll diese Idee demonst rieren : Seien 9 und h zwei beliebige Basiszüge an benachbarten Seiten, dann ist [g, h]2 ein Zug , der drei Kanten pe rmu tiert und keine Ecken , und [g, h]3 ist ein Zug, der gen au zwei P aare von Ecken permu tiert und keine Kanten. Die beid en Konzepte lassen sich natürlich au ch kombinier en .
115
7.7 Ein paar offene Probleme
Satz 7.8 Kommutatoren sind verträglich mit Gruppenhomomorphismen, also insbesondere mit Konjugation. Seien g , x, y E G, dann gilt: 9-
7.7
1[x , Y]9
= [-1 9 xg , 9 - 1] yg .
Ein paar offene Probleme
Das wichtigste und bekannteste offene Problem ist die Frage nach dem sogenannten Durchmesser des Cayley-Graphen der Cubegruppe. Diese Zahl gibt die An zahl der Züge der bestmöglichen Lösung für die schlechtest mögliche Verdrehung an . Bis heute ist diese Zahl nicht bekannt, man weiß lediglich, dass sie mindesten s 20 beträgt (d . h ., es gibt St ellungen, die sich nicht in weniger als 20 Zügen lösen lass en) und dass sie nicht größ er als 22 ist (d . h ., man kann zeigen, dass man jed e St ellung in 22 od er weniger Zügen lösen kann). Ob es in 21 od er sogar in 20 geht, ist nicht bekannt. Das nächst schwi eriger e Problem ist die Suche nach God 's A lgorithm. Gesucht ist ein effizienter Algorithmus (im Sinne der theoretischen Informatik) der zu einer beliebigen Stellung eine op timale (d . h . kürzeste) Lösung generiert . Ebenfalls unbeantwortet ist die Frage, ob der Cayley-Graph der Cubegroup eine n Hamiltonkreis ent h ält , od er anders au sgedrückt: Gibt es eine Zugfolge, bei deren schrit t weiser Au sführung jed e mögliche St ellung genau einmal eingenommen wird? Mehr Informationen: cubezzz . h omel i nux. org/drup a l / ? q=nod e / v i ew/121
7.8
Weitere Informationen
Ich hoffe , ich habe mit diesem Beitrag ein klein es bisschen Interesse wecken können . Wer weiter e Informationen haben möchte, dem sei das Bu ch Adventures in Group Theory von David Joyner [6] em pfohlen , welch es a uch die Beweise zu den von mir vorg est ellten Sätzen ent hält. Eb enfalls interessant ist der Artikel Rubik 's Cube: A toy, a galois iool, group theory [or everybody von Hans Julius Zassenhaus [7]. Floruni Weingarten studiert Mathematik und Informatik in Aachen.
8 Endliche Körper
Übersicht 8.1
Wiederholung mu ss sein
118
8.2
Körper haben Charakt er . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
8.3
Frobenius mi sch t sich ein
123
8.4
Polynomringe
125
8.5
Adjunktion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.6
Symbolische Adjunktion von Nullste llen
129
8.7
Existenz und Eindeutigkeit endlicher Körper
135
8.8
Zu sammenfassung, Lit eratur und Au sbli ck . . . . . . . . . . . . . . . . . . . . . . 137
Schon im er sten Semester begegnet dem Studenten de r Begriff des Körpers. Eventuell kommt man au ch schon dort in den Genuss der Bekannt schaft mi t sogenannt en endlichen Kö rpern , die wir in die sem Kapitel behandeln werden . W ir werden sehen, dass die endlichen Körper gu t "in den Griff" zu bekommen sind und wir alle Körper mit endlich vielen Elementen klassifizieren können . Bem erken swert sind dabei die folgenden b eid en Tatsachen :
1.) Die Anz ahl der Elem ente von endliche n Körpern ist eine Primzahlpoten z. 2.) Für jed e P rimz ahl p und jed e natürliche Zahl n > 0 gibt es bis auf Isomorphie gena u eine n Körper mit p" E leme nten . Ziel ist es , diese beid en Eig enschaften zu beweisen , da durch sie die endliche n Körper klassifizier t sind . An Voraussetzungen sollt e der Leser ein weni g Algebra-Gefühl mitbringen , wobei wir ab er alle Begriffe, die wir ben ötigen , a n passender St elle zusammengest ellt haben .
118
8.1
8 Endliche Körper
Wiederholung muss sein
D efinit ion 8. 1 (Körper) Ein Körper ist ein Tupel (K , +,. ) bestehend aus einer Menge K sowie zwei Verknüpfungen +,' : K x K -+ K , sodass: 1. (K , + ) ist eine abelsche Gruppe. Ihr neutrales Element wird mit 0 bezeichnet .
2. (K \ {O} , ') ist eine a belsche Gruppe. Ihr neutra les Element wird mit 1 bezeichnet . 3. Es gelten die Distributivgesetze, d. h . für alle a , b, c E K gilt : a. - (b + c)
= a - b + a- c
(a + b) . c = a - c + b· c
•
Der kleinste endliche Körp er ist lF2. Di eser Körp er b est eh t nur aus den E lem en t en 0 und 1, wob ei 0 i- 1 ist . 1 ist das Ei ns elem ent und 0 das Null element des Körp ers . Daher gelt en die folgenden Aussagen für die Addition: • • •
0 +0 =0 0 +1 =1 +0 =1 1 + 1 = 0, denn die Annahme 1 + 1 = 1, welche die einzige andere Möglichkeit wäre, fü hrt nach Subtraktion von 1 a uf b eiden Seiten auf den Widerspruch 1 = O.
Für die Multiplikation gilt : • •
1 ·1 = 1 0· 1 =1 ·0 =0
•
0·0 =0
Fertig! Die Körperaxiome legen also eindeutig fest , wie Addition und Multiplikation bei nur zwei Elementen auszusehen haben . Umgekehrt kann man prüfen, dass diese Festlegungen die Körp eraxiome erfüllen. Es gib t also t atsächlich bis a uf Isomorphie genau einen Körper mit zwei E lementen . Diesen nennt man lF 2 . Die interessante Eigenschaft, die lF 2 von den "gewöhnlichen" Körpern wie Ql, IR oder C unterscheidet, ist a lso , dass in diesem Körper 1 + 1 = 0 gilt . Die einfachsten endlichen Kö rper sind, wie wir seh en werden , die Restklass en ringe 71.,/p71." wenn p eine P rimzahl ist . Es ist übrigens lF2 der gleiche Körper wie (d . h . ist isomorph zu) 71.,/ 271.,. Schauen wir uns dies noch einma l an : Sei p E N. Dann definiert a
==
b mo d p : {::::::::} p I a - b
eine Äquivalenzrelation auf 71.,. Die Äquivalen zk lassen sind die Restklass en ader For m a = a +p71.,.
119
8.1 W iederholung muss sein
Die Abbildung Z -+ Zj pZ, welch e durch a M (i gegeb en ist , nennt man auch Reduktion modulo p. Die Menge aller Äquivalen zklassen b ezeichnen wir mit ZjpZ. Sie best eht gerade aus allen Restklassen und man kann zeigen, dass Zj pZ genau p Elem ente hat, nämlich Zj pZ =
{O,T, ... , p -
1}.
Im Kapitel 2 wird der Beweis dieser Tatsache auch vorgeführt . Mit der Addition (i+b: = a + b und der Mul tiplikation (i·b := ab wird (Z jpZ , +, .) zu einem kommutativen Ring mit Einselement T und Nullelement O. Wir bemerken : Die Operationen a uf den Re stklassenringen sind wohldefinier t . Satz 8. 2 Für p E N sin d die folg enden drei Aussagen äquivalent:
a) (Z jpZ , +,. ) ist ein Körp er . b) (Z jpZ , +,. ) ist null teilerjvei. c) p ist eine Primzah l. B ewe is : Zunächst zu "a) ===} b)": Sei (ZjpZ, +,. ) ein Körper. Es seien nun (i i- 0 und b i-O Element e in ZjpZ mi t ab = O. Multipliziert man die se Gleichung mit (i- I , so er hält man den Wider spruch b = O. Den Beweis der Ri chtung "b ) ===} c)" führen wir durch Widersp ruch : Angenommen , p ist keine Primzahl. Dann besitz t p nichttriviale Teiler a und b, also p = a . b. Es ist nun Da ab er 1 < a , b < p , ist wed er (i = 0 noch b = O. Nach Vorausset zung ist (Z jpZ , +,.) a ber nullteilerfrei. Nun no ch zur Richtung "c) ===} a)": Sei p eine Primzahl und ii i- O. Da p nicht a teilt und p eine Primzahl ist, erhalten wir ggT (a, p) = 1. Das Lemma von Bezout für ganze Zah len impliziert, dass es Zahlen b, k E Z gib t mit 1 = ba + kp, und die Reduktion modulo p liefer t
T = b ·(i +p · O. Also ist b = (i- I , das heiß t (Z jpZ , + , ') ist ein Körper , da zu jedem von Null D verschied en en E lem ent ein Inver ses exist iert. Nun noch etwas zu Körpererweiterungen und zur Notation , die wir verwenden werden . D efinition 8 .3 (Körpererweite rung) Sei K ein Körper. Eine Körpererweiterung von K ist ein Körper L , in welchem K ent halten ist . •
120
8 Endliche Körper
Wir schreiben hierfür L I K . In der Lit er atur find et m an a uch oft L : K . Die ersten Be ispiele von Körpererweit erungen , die eine m in den Sinn kommen, sind iC/lR und lR/Q. Dab ei erhält man durch "Hinz ufüge n" der im aginären E inheit i zu lR gerade iC. Obwohl gerade dieses Beispiel jed em Mat he mat iker sehr früh b egegn et, hat es wegen seine r Einfa chhe it den Nachteil, kein ,,repräsentatives" Beispi el zu sein . Es sei no ch a ng eme rkt , dass sich scho n a llein aus Kardinalit ätsgründen die Kör p ererweit erung lR/ Q ni cht b esonders gut durch "Hinzufügen" von Eleme nten b eschreib en lässt und von grundsä tz lich a nde rer Art als die in die sem Kapitel b etrachteten Körpererweit erungen ist . Man sollt e sich daher nicht darauf versteifen und sich einen reic heren Fundus a n Beispielen zul egen , um sich in de r Theorie von Körpere rwei terungen , die wir hier nur fü r endliche Körper en twickeln wollen, siche r b ewegen zu können . Wir werden später no ch eine exakte mathematisch e Beschreibung für das "Hinzufüge n" von El em enten zu Körpern a nge be n. Ist nun L I K eine b eliebige Körper erw eiterung, so besitzt L in natürlicher Weise die Struktur eines K - Vektorraums . Die zu Grunde liegende ab elsche Gruppe ist hierbei (L , + ). Die skala re Mu ltiplikation K x L --+ L ist gegebe n durch die Einsch ränkung der Mult iplikation in L auf E lemente a us K. Di e Vekto rraumaxiome prüft man leicht nach, sie folgen sofort a us den Körpereigenschaften. Wir wissen aus der linearen Algebra , das s jeder Vektorraum ein e Basis be sitzt . Zwei Basen eines Vektorraums haben die selbe Kardinalität . Damit kann jedem Vektorraum einde ut ig eine Dimen sion zugeord ne t werden, nämlich die Kardinalität eine r Basis. Dies rechtfertigt folgende
D efi nition 8. 4 (Grad e iner K örp e r erwei t erun g ) Der Grad ein er Kiirpereruieit erunq L I K , geschrieb en [L : K lo ist defini ert a ls Dimen sion dimK(L) von L aIs K-Vektorraum. Im Fall von [L : K ] < 00 heißt • die Körper erw eiterung en dlich .
8.2
Körper haben Charakter
Es seien L ein Körper und K; (i E 1) ein Tei lkörper von L. Dann ist der Schnit t i E I K, nicht leer , da {O,l} ~ Je für alle i E J. Man verifiziert schnell, dass mi t a , b E i K; sicherlich auch a + bund a . b im Schnitt liegen . D aher ist i K; ein Tei lkörper von L .
n
n
Mit dieser Erkenntnis ist folgende Definition sinnvoll:
n
121
8.2 Körper haben Charakter Definition 8.5 (Primkörper) Sei K ein Körper . Es sei
F=
n
M
!vI CK
!vI ist T eilkörp er
de r kleinste Teilkörper von K . Dann heiß t F Primkörper von K .
•
D efin it io n 8 .6 (Charakteristik) Für alle x E Kund n E Z ist das Körperelement n . x definiert a ls x + x +...+ x , wob ei die se Summe gen au n Summanden hat , fall s n ?: O. Für n < 0 ist n· x := Inl . (- x) = (- x) + (- x ) + ...+ (- x) , wobei es gen au Inl Summanden sind. Die Charakteristik eine s Körpers K , gesch rieben char (K ), ist die kleinste positive natürliche Zahl n, sodass n . 1 = 0 ist , wob ei 1 das Einse leme nt au s dem Körper ist . Falls es kein solches n gibt , so ist char(K ) = O. • Satz 8. 7 Die Charakteristik eines Körpers ist entw eder null oder eine Primzahl p. Beweis: Sei ch ar(K) = p i= 0 und angenommen , p sei keine P rimzahl. p = 1 kann nicht ein treten . Denn das hieße 1 = 1·1 = O. In a llen Körpern gilt jedoch 1 i= O. Ist P > 2 und kein e Primzahl , so be sitzt p eine Darstellung p
= t . s mit 1 < t , s < p .
Es ergib t sich dann
o=
p . 1 = (ts) . 1 =
Da ein Körper aber nullteilerfrei ist, folgt t ·l de r Minimali t ät von p.
(t . 1) (s . 1).
= 0 oder s -I = O. Die s widerspricht 0
B e is p iel 8.8 Schauen wir uns ein paa r einfache Bei spiele an: • • •
Der Körper JF2 besitzt die Charakteri stik char(JF2 ) = 2, denn hier gilt 2 ·1 = 1 + 1 = O. Allgemeiner haben die Körper JF p die Charakteri stik p . Un ser e "gewohnten" Körper Q, IR od er C haben die Ch arakteri stik O.
•
Der kommende Satz ist be sonders wich tig und zeigt, dass es im Wesentlichen nur zwei F älle für Primkörper gibt. Zuvor geben wir ab er eine Bemerkung, die für den Bew eis entscheidend sein wird. Wenn ein Körper die Charakt er ist ik 0 besit zt , dann ist der Homomorphismus Z -+ K , der durch n H n . 1 gege be n ist , inj ektiv . Da es (für j ed en Ring) nur eine n Ringhomomorphismus dieser Art gibt, können wir in diesem Fall das Bild von Z in K ganz natürlich wied er mit Z identifizier en .
122
8 Endliche Körper
Satz 8.9 (Satz über Prirnkörper) S ei K ein beliebig er Körper und F sein P rimkorper . Dann tret en zwei F älle auf: a) cha r( K ) = 0 {::::::::} F ~ Q b) char( K ) = p -::p 0 {::::::::} F ~ Z/ pZ . Beweis: In beiden F ällen wird nur die Richtung " ===? " bewiesen . Die Umkeh rungen sind t rival. Zunächs t zu a .) Da für n -::P 0 auc h n· 1 ein von Null ver schi edenes E lement von F ist , liegt au ch (n · 1) -1 in F. Somi t ist
p i := {(m ' l)(n . 1)-1 : m, n E Z, n -::p O}
<:;;;
F.
Da ab er p i be rei t s ein Körper ist , offen sichtli ch isomorph zu Q, folgt F Q.
= pi
~
Nun zu b .) Sei 4J : Z --+ K der eindeutige Ringhomomorphismus, d . h . 4J (n ) := n · 1. Es ist ker(4J) = pZ mit p = char (K) eine Primzahl. Der Homomorphiesatz zeigt Z/pZ = Z/ ker (4J) ~ 4J(Z ) = {O , 1, 2, ... , (p - 1) ·1 } . Da 1 in jed em Teilkörper liegt und Teilkörper b ezü glich der Addition ab gesch lossen sind , liegt a uch 4J (Z ) in jed em Teilkörper. Nun ist Z/ pZ ~ 4J(Z ) ab er b ereits selbst ein Körper , d . h . 4J(Z ) = F . Der Primkörpe r von K ist also zu Z/pZ isomorph . D K orolla r 8 .10 E s sei K ein en dliche r Körper. Dann is t char (K )
> O.
Beweis: W är e char (K ) = 0, dann besäß e K den Teilkörper Q. Dieser ist jedoch ni cht endlich . D Es sei jedoch a ngemerkt , dass es au ch unendliche Körper der Charak teristik p gib t , et wa den algebraischen Ab schluss von Z/ pZ. Die se Körper sind jedoch
ni cht Gegenst and die ses Kapitels und sollen daher nicht ein gehender be sprochen werden . Das folgende Lemma ist der er ste Sch ritt zur Klassifikation endlicher Körper. Satz 8.11 Ist K ein en dlicher Körper, so ist IKI
=
pn mit p
= char (K ) > 0
und n ?: 1.
Beweis: Sei F <:;;; K der Primkörper von K. Nach dem vorheri gen Korollar und Satz 8.9 gilt F ~ Z/ pZ mit p = ch ar(K) > 0 prim. Es liegt nun eine Körpererweiterung K / F vor . Die se mu ss eine endliche Erweit erung sein, denn jed e Basis des F- Vektorraums K mu ss eine Teilmenge von K und daher endlich sein . Es folgt nun mit lin earer Algebra , dass K aIs Vektorraum zu F" isomorph ist für n = dimj- K = [K : F ], also IKI = IFln = pn . D
123
8.3 Frobenius mischt sich ein
Wir wissen nun über die Anzahl der Elemente von endlichen Körpern, dass sie immer eine Primzahlpotenz ist . Beispiel 8.12 Man kan n a uf einer 6-elementigen Men ge kein e Addition und Mult iplikation defini eren , sodass die Menge mi t den Verknüpfungen einen Körper bildet . Wi r haben ja gerade gezeigt , dass ein endlicher Körper P rimzahlpotenzordnung hat .
•
W ir können a be r noch mehr a us der Betrachtung de s Primkörpers he rausfinden:
Satz 8.13 (Körper mit Primzahlordnung) Ist K ein Körp er und IKI = p eine Primzahl, so ist K
~
Z/pZ.
Beweis: Wi r haben bereits eingeseh en , dass K ein en zu Z/pZ isomorphen Primkörper haben mu ss. Da nun a ber K und die ser Teilkörper die selbe Ordnung haben, mü ssen sie berei ts gleich sein. Also ist K selbs t zu Z/pZ isomorph. 0 Es gibt bis auf Isomorphie also nur einen Körper de r Ordnung p für jede Primzahl p . Es wird sich am Ende des Kapitel s sogar herausstellen , dass die Ordnung eines endlichen Körpers die sen bis a uf Isomorphie be stimmt . Es ist daher üblich , den endliche n Körper mit q Elem enten als JF q zu b ezeichnen . Das JF steht dabei für das englische Wort .fi eld", das im E nglische n für Körper verw endet wird (und nicht et wa "body"), und wurde von E. H. Moore einge führt, der die endliche n Körper als Erst er klassifizierte.
8.3
Frobenius mischt sich ein
Viel e Besonderheiten von Körpern der Charakteristik p =I- 0 lassen sich durch das Verhalten der sogenannten Frobenius-Abbildung b eschreib en . Wir defini eren diese Abbildung wie folgt:
Definition 8.14 (Frobenius-Abbildung) Die Abbildung x f-t x P wird als Frobenius-Abbildung bezeichnet .
•
Der folgende Satz zeigt, dass die Frobenius-Abbildung ein Körperhomomorphismu s ist .
Satz 8.15 S ei K ein K örper der Charakt eristik p =I- O. Dann gilt für alle x, y E Kund
n EN
8 Endliche Körper
124
Im Englischen heißt dies er Satz .Freshmarr's dr eam", da einige Leute so rechnen , als ob das in jed em Körper gelte (sprich : Leute, die die binomischen Form eln nicht können) . Die erste Au ssage ist klar, da Körper kommut ative Ringe sind. Zum Bewei s der zweiten Au ssage wenden wir den binomischen Lehrsatz an . In jedem Körper K gilt :
Beweis:
Für die Binomialko effizienten, welch e ganze Zahlen sind, gilt definitionsgem äß , dass
p! =
(~) . k! . (p -
k)!.
Da aber für 1 :s: k :s: p - 1 wed er k ! noch (p - k)! den Fak tor p enthält , dieser ab er a uf der linken Seit e vorkommt , mu ss (~) durch p t eilbar sein . Wegen char(K) = p sind all diese Terme ide nt isch O. Es bleib t daher (x +y)P = x P+ yP übrig. Induktiv folgt daraus a uch (x + y)P" = x P" + yP" für alle n E N wie behauptet . D Der folgende Satz zeigt , dass die Frobeniusabbildung sogar ein Körper automorphismus ist .
Satz 8.16 In ein em endlichen Körper der Charakteristik p x M x P ein Automorphismus.
-::P 0
ist die Frobeniu sabbildung
Der Satz 8.1 5 liefert die Homomorphieeigenschaft der Frobeniusabbildung. Da diese ni cht die Nullabbildung ist , ist sie als Körperhomomorphismus b ereits inj ektiv. Nun ist ab er eine inj ektive Abbildung einer endliche n Menge in D sich surjekt iv, zusam me n also bij ektiv , sprich ein Automorphismus. Beweis:
Treiben wir das Spielchen no ch ein wen ig weite r :
Satz 8.17 Sei K ein K örper der Charakteristik p prim. Dann gilt a llFp K örperautomorphismus a : K --+ K .
id lFp für je den
Jeder Körperautomorphismus a : K --+ K ist die Identi t ät a uf dem P rimkörper, denn für a E JF p gilt
Beweis:
a(a) = a(l
+ ... + 1) =
'----v-----' a -m a l
Also folgt die Behauptung.
a( l)
'
+ ... + a(l), =
a.
a- ~a l
D
125
8.4 Polynomr inge
Satz 8.18 (Der k leine Satz von Fermat) S ei p eine Primzahl und ggT (a, p) = 1, das heißt, p teilt ni cht a , Dan n ist aP -
1
== 1 mod
p.
B ewe is: Der kleine Fermat folgt sofort a us dem obigen Satz 8.17, denn CiP liefert CiP-l = 1 in lF p , falls Ci =I- 0 ist .
8.4
= Ci D
Polynomringe
Wir werd en un s im Folgenden einige nützlich e Eigen schaften von P olynomringen üb er Körpern zu Nutze machen , die in diesem Ab schnitt zusamme ngefass t werden sollen. Dafür wied erholen wir zunächs t eine Definition, die in allen Ringen anwendbar ist :
Definition 8.19 (Einheiten und irreduzible Elemente) E ine Einheit de s Rings R ist ein invertie rbare s E leme nt 1 E R , d . h ., 1 ist genau dann eine Einheit , wenn ein g ER ex ist iert mit 1 = i o = g f . Die Men ge aller Einhe iten von R wird als Einh eit engruppe von R und mit dem Symbol R X bezeichnet (bzgl. der Multi plikation von R ist das tatsächlich eine Gruppe) . Ei n E leme nt f E R heißt irreduzibel , falls f nicht Null und kein e E inhe it ist und fall s gilt: vg, h ER : f = gh ===} 9 E R X V h E R X
•
Zentral für die Untersuchung von Polynomringen üb er Körpern ist die Mögli chkeit , die Division mit Rest durchführen zu können :
Satz 8. 20 (Polynomdivision) S eien g, u e K [X ] gegeben und h =I- o. Dann existi eren Polynome q, r E K [X ]' sodass 9 = qh + rund deg(r) < deg(h) . Der Algorithmus, um q und r für gege be ne s 9 und h zu find en, ist sogar schon au s dem Schulunterricht bekannt . Er funktioniert un abhängig von K stets auf dieselb e Weise. Hat man diesen Satz erst einm al verinnerlicht, kann man mit seine r Hilfe weitere wichtige Aussagen üb er P olynomringe herleiten , wie etwa diese beiden:
126
8 Endliche Körper
Satz 8 .21 (Größter g e m e in sa mer T e il e r ) Zu j e zwei Polynom en g, h E K [X ] exis tie rt ein größt er gem ein sam er Teiler ggT (g, h) , welcher bis auf Multiplikation mit Einh eit en eindeutig bestimmt ist. Satz 8.22 (Lemma von Bezout) Zu je zwei Polynomen g, h E K [X ] und j edem größt en gem einsamen Teiler d = ggT (f, g) gibt es Polynome s, t E K [X ] mit
d = sg + t h. Beide Au ssagen sind mi t einem Algori thmus verbunden: ggT (g , h) lässt sich mi t Hilfe des euklidischen Algori thmu s ermit teln. ggT(g , h), sund t zugleich kann der erweiterte euklidische Algorithmus berechnen. Beide sind ganz allgemein funktionstüchtig und wied er in ihrer Anw endung für alle Koeffizientenkörper gleich . In der Tat kann m an sie in jed em sogenannte n euklidische n Ring a uf dieselb e Weise anwenden . Ein Ri ng ist dabei euklidisch , falls er eine Divi sion m it Rest nach obi gem Sch em a erlaubt, wenn die Grad-Funktion dabei durch ein geeign et es P endant erse tz t wird . (Ein Beisp iel für so einen Ring ist Z mit dem Abso lut be t rag als Ersatz für die Grad-Funktion. Das liefert die bekannten Variationen der beiden obigen Sätze für Z. ) B e w e is : Beide Sätze b eweist man kon struktiv, indem man den erweite rten euklidi schen Algori thmus a ufschreibt und bewei st , dass die ser Algorithmus nach endlich vielen Schritten beendet ist und die Elemente, die dabei he rauskommen , die geforde rten Eigenschafte n haben . Das wird üblicherw eise induktiv b ewiesen und zwar mit den selb en Met hode n, die für die analog en Sätze für Z verw endet wurden . 0 Wa s ebe nfalls in jed em euklidische n Ring funktioniert , hier aber wie zuvor nur für den un s inter essierenden Fall der Polynomringe formuliert sein soll, ist Folgendes: Le m m a 8. 23 (Z e rleg u n ge n in irreduzible Elemente) Sei K ein Körper und f E K [X ] ein Polynom, das nicht null und kein e Einheit ist. Dann exis tie ren irreduzible Polynome [s , ... , !k, sodass k
f = II h i= 1
und die Zerlegung ist ein deutig bis auf Einh eit en und R eih enfolg e in dem Sinne, dass für jed e weitere Zerlegung in irreduzible Faktoren m
gilt, dass k = m ist und nach geeign eter Umnumm eri erunq der Faktoren Einheiten Ui E R X mit Ji = Uigi existieren.
127
8.5 Adjunktion
Beweis: Auch hier ist der Beweis nur eine beinahe wortwörtliche Üb ertragung des Beweisprinzips von z::. auf den allgemeinen Fall. 0
8.5
Adjunktion
Wir wissen nun einiges über die Eige ns chaften von Körpererweiterungen und kennen die en dliche n Körper lFp . Wir haben jedoch noch keine Möglichkeit kennengelernt , Körper erw eiterungen zu konstruier en , um aus lFp größere, endliche Körper zu bekommen . Gibt es et wa eine n Körper mit 2 2 = 4 El ementen ? B e is p iel 8.24 (Körper mit vier E lementen) Übe rle gen wir zunächst, welche Eigen schaften solch ein hypothetischer Körper J{ = { 0,1, a , b } mi t vier El em enten haben müsste. Weil 4 eine Poten z von 2 ist, wissen wir , dass die Charakteri stik dieses Körper s 2 und sein Primkörper lF2 = { 0,1 } sein müsste. Überlegen wir , wie die Addition in die sem Körper fu nkt ionier en mü sste. Was ist etwa a + 1 ? Dafü r gibt es nur vier Mögli chkeiten : • •
•
+ 1 = O. Das führt a + 1 = 1. Das führt a + 1 = a. Das führt a
zu a zu a zu 1
= a + 1 + 1 = 0 + 1 und zum Wider spruch a = 1. = 0, was ebenfall s ein Widerspruch ist . = 0, worin au ch ein Widerspruch zu erkennen ist .
Also bleibt al s einzige Option a+ 1 = b übrig. Ganz a nalog mu ss b+ 1 = a gel ten. Daraus sch lussfolgern wir a uch me sser scharf, dass a + b = a + a + 1 = 0 + 1 = 1 ist . Damit können wir die Verknüpfungst abelle für die Addition a ufsch reiben:
+
0
1
a
b
o
0
1
a
b
1
lOb
a
a
abO
1
b
b
0
a
1
Wi e sieht es a be r mit der Mult iplikat ion au s? Wi e mü sste J{ beschaffen sein? Was die Multiplikation mit 0 und 1 b ewirkt, sagen uns die Körperaxiome. Wir müssen a lso fragen , was a . a sowie a . b ergeb en. Wi eder gibt es nur wenige Mögli chkeiten dafür: • • •
a - a = O. Dann wä re a = 0, da Körper nullteilerfrei sind. Ein W ider spruch . a· a = 1. Dann ergä be sich 0 = 1 + 1 = a 2 + 1 = (a + 1)2 ===} a + 1 = 0, was wir ber eits als Wider spruch erkannt hatten. a- a = a. Das hieße a = 1, was der selb e Widerspruch wie zuvor ist.
8 Endliche Körper
128
Also bleibt nur a 2 = b = a + 1 als einzige Option übrig. Völlig analog muss b2 = a sein . Daraus schlussfolgern wir auch zugleich , dass a- b = a- (a + 1) = a 2 + a = (a + 1) + a = 1 gelten muss . Die Verknüpfungstabelle für die Multiplikation in K sähe also wie folgt aus: 0
1
a
b
0
0
0
0
0
1
0
1
a
b
a
0
a
b
1
b
0
b
1
a
Die Fr age, ob ein Körper mi t vier Elementen existiert, ist damit immer noch nicht beantwortet, aber wir wissen jetzt genau, wie er aussehen müsste, wenn es ihn denn gäbe. Nun könnten wir einfach nachprüfen, dass die beid en Verknüpfungen , wenn man sie wie in den Tabellen angegeb en defini ert, wirklich die Körperaxiome erfüllen .
•
Eine interessante Beobachtung an diesem Körp er ist, dass das Elem ent a (und völlig analog auch b) die Gleichung a 2 + a + 1 = 0 erfüllt, d . h. eine Nullstelle des Polynoms X 2 + X + 1 E lF2[X] ist. Dieses Polynom hat in lF2 kein e Nullstellen , wie man leicht durch Einsetzen von 0 und 1 einsieht . Dieser Effekt ist uns auch schon bei anderen Körpererweiterungen a ufgefallen. So hat X 2 + 1 E !E.[X] keine Nullstellen in !E., sehr wohl jedoch in der Körpererweiterung
8.6 Symbolische Adjunktion von Nullstellen
129
Definition 8.25 (Adjunktion von Teilmengen) Sei L I Keine Kö rpererweiterung, A ~ L eine b eliebige Teilmenge. Dann sagt man , de r Körper K( A) := JvJ
n
Mr;;,L Teilkö r per KUAr;;,M
entstehe durch Adjunktion von A zu K . Fa lls man di e Elemen t e von A ex plizit aufzählen mö chte, schreibt man der Kürze halber a uch K (a, b, c) stat t K ({ a, b, c }) usw. Man lässt al so Me ngenkla mme rn • weg, wenn sich keine Un eindeutigkeiten erge be n können . Wenn es sich b ei der Teilmen ge A speziell um die vollständige Nullstellen me nge eines Polynoms f E K [X ] handelt , dann ist K( A) die kl einste Körpererw eiterung von K , über der f vollst ändig in Linea rfak toren zerfäll t . F ür solch einen Körp er vergibt m an ein en speziellen Namen :
Definition 8.26 (ZerIällungskörper) Sei K ein Körper , f E K [X ] ein P olynom und L I Keine Körpererweiterung. L heiß t Z erfällungsk örp er von f über K , falls :
• f
über L vollständig in Linearfaktoren zerfäll t . Mit anderen Worten : Es gibt X mit
c i , ... a n E L und u E K
u TI (X - ad, n
f(X) =
i= l
•
L ist der kleinste Körper, über dem das der Fall ist, al so L = K(al , .. . , an) .
8.6
•
Symbolische Adjunktion von Nullste llen
Nun gut, a b er das klärt immer no ch nicht, wie man solche Körper finden kann , wenn man ni cht gerade einen großen Körper wie
130
8 Endliche Körper
b egin nen zu lassen . Ei nige di eser polynomiellen Aus d rücke würden jedoch das Körper elem ent 0 darst ellen m üssen . So soll beispi elsweise f (z ) null ergeb en. Die Id ee ist daher , f und a lle seine Vielfachen mit dem Nullp olyno m zu id en tifi zieren, d . h . zum Quotien t enring K [X ]/(f) über zu geh en . Der nun folgen de Satz klärt , in welchen F äll en di eses Vor geh en den gewüns chten Effekt hat:
Satz 8.27 Sei K ein Körper und f E K [X ] ein beliebiges Polynom. Setz e L := K [X ]/ (f) , und bezeichn e das Bild des Polynoms 9 E K [X ] unter dem kanonisch en Homo morphismus K [X ] -+ K [X ]/(f) mit g. Dann gelten folg end e Aussagen: 1.
2. 3. 4.
a r l ii ist ein injekti ver Homomorphismus K -+ L , wenn f kein e Einheit ist . Man identifizi ert K üblich erw eise mit seinem Bild, fasst K also als Teilm enge von Lauf. f hat eine Nullstelle in L, nämlich X. Ist f -I 0, so ist Lais K - Vektorraum deg(f)-dim ensional. Falls K endlich war, ist in sbesondere auch L en dlich. Folgend e Aussagen sind äquivalent :
a) L ist ein Körper. b) f ist irredu zibel. 5.
Se i nun f irreduzibel. LI K ist dann die bis auf Isomorphie eindeutige klein st e Kö rpererw eit erung, in der f ein e Nullst elle hat. Genau er: Ist L' I K eine weit ere Körpererweit erung und o' E L' eine Nullst elle von t , so ist
rP : L -+ L' , rP(g) := g(a ) ein Homomorphismus mit rP lK = id K
,
dessen Bild gen au K(a') <:;; L' ist .
Beweis: Punkt 1. folgt leicht daraus, dass di e E inbet t ung K -+ K [X ] und di e Projektion K [X ] -+ K [X ]/(f) Homomorphismen sind . Die Abbildung K -+ K [X ]/(f) ,a r l 7i ist a ls Komposition der beiden auch ein Homomorphismus. Weil K ein Körper ist, ist der Homomorphismus ent wede r inj ektiv oder kon stant gleich O. Falls letzt er es der Fall wäre, so wäre also auch T = 0, d. h . 1 E (f) . Das hi eße wied erum, es gibt ein 9 E K [X ] mit 1 = f · g , also mit ander en Worten : f ist ein e Einheit. Punkt 2. ist einfac h , denn das kann m an einfach nachrechnen . Sei f(X) 2:~ o
s.x' . Dann gilt :
f (X ) , weil wir a lle a E K mi t ii identifizieren. , weil K [X ] -+ K [X ]/(f) ein Homomorphismus ist . = f( X ) =
0
, weil
f
E (f) ist .
8.6 Symbolische Adjunktion von Nullstellen
131
Punkt 3. folgt , wenn man die Division mit Rest benutzt: Jedes Polynom 9 lässt sich als 9 = qf + r mit geeigneten q, r E K [X ] darstellen , wobei deg(r) < deg(f) ist . Für die Restklassen heißt das 9 = (j1 + 'F = (j0 + 'F = 'F. Also hat jede Restklasse eine n Vertret er vom Grad klein er d := deg(f) . Wären rund r' zwei solche Vertreter, würde 'F = r' , also r - r' E (f) , gelten . Das hieße, dass f ein Teiler von r - r' wäre. Falls nun aber r - r' l' 0 wäre, so würde das wiederum deg(r - r') ~ deg(f) heißen im Geg ensatz zur Annahme, dass rund r' beid es Polynome vom Grad ::; d - 1 sind. Jedes Element von K [X ]/(f) lässt sich deshalb eindeutig als ~t~~ tu X ! = d l ' EI emente -1 = -=Ü . eme . X , Xl , .. . , X - b 1'lden d amit sc hreib rel en. D le K-Basis von K [X]/(f) . Diese Basis hat d Elemente, also ist dim K K [X]/(f) = d wie behauptet.
",d - l ai D i =ü
»:
Der vorl etzte Punkt lässt sich nun wie folgt beweisen: Ist K [X]/(f) ein Körper , so ist darin I l' 0, d . h. 1 t/:. (f), weshalb I kein e Einheit sein kann. Wäre 1 = 0, so wär e (f) = {O} , also K [X]/(f) ~ K [X] kein Körper. Nehmen wir also an , dass I wed er eine Null no ch eine Einheit ist und I = gh für Polynome g, h E K [X] gilt. Daraus folgt 0 = 1 = g . h, also 9 = 0 oder h = O. Wir nehmen o. B. d . A . 9 = 0, d. h. 9 E (f) a n . Dann ist 9 ein Vielfaches von I , etwa 9 = I s. Dann folgt aber I = gh = I sh ===} 1 = sh , d . h., h ist eine Einheit. " ===} " :
{::= ": Ist andererseits I irreduzib el, dann ist jed es von Null verschied en e Element in K [X]/(f) invertierbar. Um das einz usehe n , betrachte man d := ggT(f,g) . Weil d I f ist , gibt es ein h mit hd = I, womit h od er d eine Einheit ist. Wäre h eine Einheit, wär e d = f I g, also mü sst e 9 ein Vielfaches von d und somit auch von I sein . Das hieße ab er 9 = 0 ent gegen unser er Vorausset zung. Also mu ss d = ggT(f, g) die Einheit gewesen sein, o. B . d . A . also 1 = ggT(f, g) (der ggT ist ja nur bis auf Multiplikation mi t Einheiten eindeutig) . Nun wenden wir das Lemma von Bezout an und erhalten Polynome s , t mit 1 = s] + tg , woraus sich I = sI + tg = sO + tg ergibt. Also hat 9 tatsächlich ein Invers es in K [X ]/(f), nämlich I.
"
*
Zu guter Letzt b eweisen wir den letzt en Punkt mittels des Homomorphiesatzes: In der gegeb enen Situation f(o:') = 0, d. h . a uch h(o:)l(o:) = 0 für alle u e K [X ]. Wenn man also den Ringhomomorphismus K [X ] ---+ L' ,g(X) H g(o:') defini ert , dann werden alle Elem ente von (f) a uf 0 abgebildet. Der Homomorphiesatz sagt uns , dass die angegebene Abbildung q; : L ---+ L' wohldefiniert ist . Sie hat offenbar die b ehauptet e Eig enschaft q;1 K = id K , denn wenn man das kon stante Polynom a an irgendein er St elle auswertet , kommt natürlich a her aus, weil es eb en das konstante Polynom ist . Weil nun L ein Körper ist nach Annahme, ist das Bild q;( L) ein Körper. Er ist in L' ent h alten, ent hält 0:' und K . Also muss schon einm al K (0:') ~ q;(L) sein. Ander ers eits muss jed er Körper, der
132
8 Endliche Körper
(XI und K ent hält, auch { 2::r=o ai(Xli I n E PT, a.; E K } = 4>(L) ent halt en , d . h . 4>( L) = K «(XI) wie b ehauptet . 0 Diese allg em ein e Konstruktion können wir nun anwenden , um Existen z und Eindeutigkeit von Zerfällungskörpern zu beweisen : S a t z 8.28 (Existenz von Ze r Iällu n g skö r p e r n ) Sei K ein Körper, j E K [X ] ein beliebiges nichtkonstantes Polynom. Dann gibt es einen Z erfällungskörper NI von j über K . B e w eis : Die Idee ist, den Körper schrit t weise um je eine Nullstelle von vergrößern. Daher beweisen wir die Auss age per Induktion über deg(f) .
f
zu
Ist deg(f) = 1, so ist nicht viel zu zeigen , denn jed es Polynom f = aX + b vom Grad 1 ( ===} a -::p 0) hat die Nullste lle - ~ E K , also ist K ein Zerfällungskörper für solch ein j . Sei j nun ein Po lynom vom Grad d > 1. Sei j =fI ·/z·····!k
eine Zerlegung von f in irreduzible Fak toren . Wenn f nicht bereits vollst ändig in Linearfaktoren zerfäll t, dann ist unter den j i mindestens ein irreduzibles Polynom vom Grad > 1 vorhanden. O . B. d . A . sei dies fI. Dann ist nach obigem Satz L := K [X ]/(fI) ein Erweiterungskörper von K , in dem fI eine Nullst elle (Xl hat. Man kann j also üb er L zerle gen in j (X ) = (X - (XI) . g(X) mit deg(g) = d - 1. P er Induktionsvoraussetzung können wir nun annehmen , dass es eine n Zerfällungskörper NI für g mit L ~ NI gibt. Dann ist K ~ L ~ M . Seien (X 2, .. . , (Xd die Nullst ellen von g in M . Dann ist d
g(X)
=
TI (X -
(X i)
M
und
= L«(X2, . . . , (X d)
i= 2
Nach Konstruktion ist auch L = K«(X1) , woraus sich d
f(X)
TI (X -
=
(X i)
und
M
= K«(X 1,(X2 , ... , (Xd)
i= l
ergibt. Damit ist Mein Zerfällungskörper von
f
über K.
o
Für die Eindeutigkeit beweisen wir folgenden Satz: S a tz 8. 29 (Ein de utigkeit v on ZerIällungskörp ern) S ei en L / Kund L/K Korpereruieit erunqen , 4> : K --+ K ein Isomorphismus, f =
2:: id=o cuX ?. E
.
-
K [X ] ein Polynom und f :=
2:: id=o 4>(ai )X t.EK [X ].
133
8.6 Symbolische Adjunktion von Nullstellen 1. Ist dann f ir reduzibel, a E L ein e Nullst elle von fund
aE L
eine N ullste lle
von f , so gibt es eine n Isomorphismus
-+ K( a) ,
: K(a)
a
der 4J fortsetzt (d . h. ( a) = 4J(a) für alle a E K) und ( a) = erf üllt. 2 . Ist L ein Zerfällungskörper von f über Kund L ein Z erfällungskörper von f über K , so gibt es eine n Isomorphismus : L -+ L , der 4J forts et zt . 3 . Insbesondere ist der Zerfällungskörper von f ein deu tig bis auf Isomorphie bestimmt. ~
B e w e is :
~
~
Die Abbildung K [X ] -+ K [X ]' n
n
LaiXi H L i=O
4J(a;)X
i
i=O
ist ein Isomorphismus der Polynomringe, wie man sich leicht üb er zeu gt. Wir werden ihn der Einfachheit halber a uch mit 4J b ezeichnen . Als Isomorphismus bildet 4J irre duzible E leme nte a uf irreduzibl e Elem en t e ab, also ist mit fa uch = 4J(f ) irreduzib el. Auß erdem bildet 4J alle Vielfachen von f (also die Men ge (f) ~ K [X ]) auf Vielfache von J (also die Men ge (1) ~ K [X ]) ab und induziert daher a uch eine n Isom orphismus
J
Auß erdem haben wir in Satz 8.27 vor kurzem b ewiesen, dass es Isomorphism en K(a) -+ K [X ]j(J) mit o H X undK [X ]j (1) -+ K( a) mit X H a gibt. Set zen wir diese drei Isomorphism en zusamme n, er halten wir eine n Isomorphismus : K( a)
-+ K [X ]j(f) -+ K [X ]j(J) -+ K( a)
mit a Ha
H
4J (a ) H 4J (a )
für alle a E K sowie a HX HX H a .
Die s ist also de r gewünschte Isomorphismus. Der zweite Teil der Au ssage wird p er Induktion üb er den Grad d := deg(f) = deg(J) bewiesen . Für d = 1 ist nichts zu zeigen, denn wir haben un s im vorangegangen en Beweis davon üb er zeu gt , dass der einzige Zerfällungskörper eines linearen P olynoms üb er K der Körper K selbst ist und wir ber eits eine n Isomorphismus K -+ K haben .
8 Endliche Körper
134 Wir wählen für d
> 1 eine
Zerl egung
f =!I·!2 ···· ·ik
J = 4J(f ) = 4J(!I ) . 4J(h ) . .. . ·4J(ik )
==?
mi t irreduziblen f i E K [X ]. Da 4J : K [X ] --+ K [X ] j a ein Isomorphismus ist , sind au ch die 4J(fi) irreduzible Element e von K [X ]. Sind nun L und L Zerfällungskörper für das jeweilige Pol yn om , so zerfallen !I und 4J(!I ) über L vollst ändig in Linea rfak to ren , weil f bzw . 4J(f ) das tut und !I bzw . 4J (fI) ein Teiler davon ist . Es gibt a lso Nullstellen 0:1 E L und 0:1 E L. Dann liefert uns der erste Teil des Satzes eine Fortset zung 'lj; : K(O:I) --+ K( iii) von 4J, die 0:1 a uf iii schickt. Um nun die Indukt ion svor aussetzung anwenden zu können , betrachten wir das Polynom
g: = X
f
- 0:1
E
K( O: I) [X ].
Dass dieses Pol yn om wirklich in K( O: I) [X ] lieg t , erkennt man , wenn man es sich als das Ergebnis de s Polynomdivisionsalgorithmus vergegenwärti gt . De r Algorit hmus benutzt nur die vie r Grundre chenarten und die Koeffizienten von fund X - 0:1 und bleibt daher in K(o:I) [X]. Weil L j a ein Zerfällungskörper von f über K ist, exist ier t eine Zerlegung
f = u(X für gewi sse O:i E L , u E K
X
- 0:I) . (X - 0:2 ) . . .. . (X - O:d)
und L
= K( O: I , 0:2, ... , O:n ).
Daher gilt g = u(X - 0:2) . .. . . (X - O:d)
und L = K( 0:1,0:2, ... ,O:n ) p er für 9 über K(O:I) .
= K (0:1)(0:2,. . . , O:n). Also ist Lein Zerfällungskör-
Es gilt ganz an alog
f und
L ist
ein Zerfällungskörper für
9 über K(O:I).
Weil wir schon einen Isomorphismus 'lj; : K(o:I) --+ K(O:I) haben und deg(g) = de g(g) = d -I < d ist , können wir 'lj; induktiv fortsetzen zu einem Isomorphismus \V : L --+ L wie gew ünscht . Die letzt e Au ssage des Satzes ist j et zt ein einfac he r Sp ezialfall der zweiten, denn sind L und L zwei Zerfällungskörper von f über K, so kön nen wir 4J := id K : K --+ K wählen , den zweiten Teil a nwende n und erhalten eine n Isomorphismus : L --+ L . D Wir können - und werden - a lso ab jetzt ohne schlechtes Gewissen von "de m" Zerfällungskörper eines P olynoms spre che n.
8.7 Existe nz und Eindeutig keit e ndlicher Körper
8.7
135
Existenz und Eindeutigkei t endlicher Körper
Das war ein ganz schönes Stück Arbeit , nicht wahr? Aber jetzt können wir endlich d ie endlichen Körper kon struieren, die wir uns schon die ganze Zeit gewünscht haben . 'Nenn wir einen Körper K mi t q = pn E lement en kons truieren wollten , wie würde die ser a uss ehen? Nun , zum Bei spiel wä re seine Einheitengruppe K X = K \ { 0 } eine Gruppe mit q - 1 El em enten . Der Satz von Lagrange sagt uns als o, dass v x E K \ { O} : x q - 1 = 1 sein mü sste. Multiplizier en wir beide Seiten mit x , so erhalten wir eine Gl eichung , die auc h für x = 0 wahr ist: Vx E K: x
q
=x
Mit anderen Worten: Die q Elemente von K müssen gen au die Nullstellen von X " - X sein. Insbesondere mü sste K der Zerfällungskörper von X " - X über jedem Teilkörper sein. Unser An satz wird al so sein , K aIs Zerfällungskörper von X'! - X zu kons truieren . Welchen Grundkörper sollten wir dabei benutzen ? Natürlich den einz igen, den wir mit Sich erheit in K haben , den Primkörper lF p . W ir wissen , dass es einen Zerfällungskörper von X" - X E lFp[X ] gibt und dass er bis auf Isomorphie eindeuti g be stimmt ist . Dami t sind wir schon fas t am Ziel, die Eindeutigkeit de s Körpers mi t q Elementen folg t a us unseren Überlegungen bis hierhin schon : Jeder Körper mi t q E lem ent en ist ein Zerfällungskörper von X" - X über lF p , und die ser Zerfällungskörper ist bis auf Isomorphie eindeutig . Es st ellt sich jetzt die Frage, ob der Zerfällungskörper von X" - X wirklich die Umkehrung liefert, d . h. ob er wirklich genau q E lem ente hat . Überlegen wir uns zunächst , dass er nicht mehr a ls die a ngepeilten q Elemente haben kann :
Lemma 8.30 S ei p prim und q := pn mit n E N> o. D er' Zerjällungskörper K von X " - X über lFp hat höchstens q El em ente. B e we is : Seien (x, ß E K zwei Nullstellen von X " - X. Weil q = pn ist , gilt dann (siehe de r Ab schnitt über den Frobenius-Homomorphismus) :
und
8 Endliche Körper
136
Also sind a + ß und aß ebenfalls Nullstellen von X" - X . Wa s bringt un s das? Nun , die Nullstellenme nge von X" - X bildet auf Grund dessen einen Teilk örper von K, und weil K der von allen Nullst ellen erzeugt e Teilkörper ist , mu ss die Nullste llenme nge sogar mit K üb er ein stimmen . J etzt sind wir am Ziel: X" - X ist ein P olynom vom Grad q , kann also höch st en s q Nullstellen in jed em Körper D haben . Daher mu ss IKI ::; q sein . J et zt fra gt sich , ob a uch IKI ~ q gilt , denn das fehlt un s ja no ch zu un ser em Glück. Dann hät te n wir eine n Kör per mit q Elem enten für jed e Primzahlpoten z q kon struiert und seine Eindeutigkeit sicher gest ellt. Das war un ser Ziel. F ür die se Ab sch ätzung geb rauchen wir das nun folgende Lemma : Le m m a und D efin it ion 8 .3 1 S ei K ein Körper. D efin iere die for m ale Ableitung eine s Polynoms aus K [X ] durch :
E s gilt : K [X ] -+ K [X ] ist K -linear, d. h. für alle [i , 12 E K [X ] und alle a1 , a 2 E K gilt : (al' h + a 2 . 12)' = a l . f{ + a2 . f~
1.
1 :
2.
1
ist ein e Derivation, d. h. für alle
t, g E
(f . g)' =
K [X ] gilt die Produktregel:
J' . g + f · 9'
Allgem ein er gilt die Leibni z-Regel, d. h. für alle k
(!I . ... . fk )' =
L f: i= l
3 . Falls ggT(f, 1' ) = 1 ist , hat Nullst ellen .
f
h ,.. . ,fk E
rr
K [X ] gilt :
fj
j =l... k
N i
in sein em Zerfällungskörper kein e m ehrfachen
B e w eis : Die Punkte 1. und 2. sind einfache s Nachrech ne n mittels der Definition und werden daher hier nicht vorgeführt . Die Leibnizr egel folgt induktiv durch mehrfache s Anwenden de r P roduktregel für zwei Fak to ren (und zwar wor t wörtlich mi t demselben Induktionsb eweis wie für gewöhnliche Ableitungen a us der An al ysis) .
Kümmern wir un s also um Punkt 3. Ist L der Zerfällungskörp er von f üb er K , so seien a 1, . . . ,ak E L die paarweise ver schi ed en en (!) Nullst ellen von f und ei E N>o die dazug ehörigen Vielfachheiten , d . h ., es gibt eine Kon stante u E K X mit
rr k
f(X)
=u
i= l
(X -
air
i
•
8.8 Zusammenfassung, Literatur und Ausblick
wr- b erechnen
daraus
137
l' zu k
!'(X) =U2..: ei (X - a i) ei -1 i= l
TI
(X -aj) ej
Ni
Angenommen , es gäbe eine mehrfache Nullstelle von d . h . e r > 1. Dann gilt: k
f' (aI) = u 2..: ei (al - a i) ei-l i=l
= U . el ( al -
al ) e , - l
•
j =l...k
TI
f . O . B . d . A.
ist das o i
,
(al - a j) ej
j=l.. . k
Ni
TI (al -
aj )e·.1
j = 2 ... k
k
TI
+ u 2..:ei (a l- ai )ei- 1 (a l -aj) ej i=2 j= l.. .k Ni
= 0 Das wird null, weil im ersten Summanden «i - «i = 0 mit dem positiven Exp one nte n e i - 1 poten zier t wird (man b ea chte, dass 0 0 = 1 gewesen wär e) , während in allen folgenden Summanden das Produkt den Faktor al - a l = 0 mi t po sitivem Exponenten ei enthält . So sind alle Summanden null und somit j'(aI) = O. Damit ist also X - al ein Teiler von j'(X). Das wiederum heiß t, das s X -al ein Teiler von ggT (f, j') sein mu ss. Dann kann der ggT aber unmöglich 1 sein .
o Wenden wir das nun auf K = JF p und f = X" - X a n , so erhalten wir = qXq -1 - 1 = -1, da q ein Vielfach es der Charakteri stik char ( K) = p ist und daher der erste Summand null wird . Die einzigen Teiler von J', also insbesondere au ch alle gem ein samen Teiler mit I , sind a be r Einheit en , d . h . ggT (f, J') = 1. Das Lemma sagt un s desh alb , dass die Null st ellen von f im Zerfällungskörper paarweise ver schi ed en sind , insbes onde re gibt es gen au q Nu llstellen im Zerfällungskörper.
r
8.8
Zusammenfassung, literatur und Ausblick
Das war je tzt eine Menge neuer Stoff. Ich denke, es ist ganz gu t , wenn wir die wichtigsten Dinge, also das , was man auf jeden Fall wissen sollt e, no ch einmal zusammenfas sen.
138
8 Endliche Körper
Satz 8.32 (Endliche Körper - Zusammenfassung) • Ist K ein endlicher Körper mit q Elementen, so ist char (K ) zahl. • • •
•
lFp ist der Primkörper von K . q ist ein e Potenz von p, gen au er q
= p ein e Prim-
= IKI = p [K: lF p ] .
Die Frobenius-Abbildunq K -+ K , x >--+ x P ist ein Kiirperauiomorphismus von K. Für j ede Primzahlpotenz q = pn existiert bis auf Isomorphie qenau ein Körper der Ordnung q. Es ist der Zerfällungskörper von X" - X E lFp[X].
Endliche Körper haben viele interessante Anwendungen , etwa in der Kryptographie. Der 4. Teil dieses Buches bes chäftigt sich mit solchen Anwendungen.
Florion Modl er studiert Mathematik in Hannover, Johannes Hahn ist Dipl.-Math. und promoviert in J ena.
Teil 11 Diskrete Mathematik
9 Über die Anzahl von Sitzordnungen am runden Tisch
(Eine Recherche)
Übersicht 9.1
Die Frage
9.2
Der \iVeg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
9.3
Verstehe das Problem
142
9.4
Su che Zusammenhänge, ersinne eine n P la n un d führe ihn aus
144
9.5
Überprüfe die Lösung
147
9.6
Am Ziel
156
9.1
141
Die Frage
Um einen K reis solle n m Elemente der ein en Art un d f Elemente der and eren Art angeordn et werd en . Kom binationen, die durch Drehung auf sich selbst abgebildet werd en kön n en, werd en nur einm al gezählt. Wie viele Möglichkeiten gibt es ? Für diese Frage mache ich mich a uf die Suche nach eine r Antwort . Ich möchte hier b erichten, wie ich vorgegangen bin und die Lösung angeb en und erklä ren .
9.2
Der Weg
George Polya (1887- 1985) hat in seinem Buch .How to solve it" [22] einige Regeln a ufgestellt, die beim plausiblen Schli eßen eine groß e Hilfe sein können . Kurz gefasst lauten diese Rege ln :
142
• • • •
9 Über die Anzahl von Sitzordnungen am runde n Tisch
Versteh e das Problem . Suche Zusam menhänge un d ersinne eine n P lan. F ühre den Plan aus . Üb erprüfe die gefunden e Lösu ng.
Das ist ein seh r allgem einer Weg. Aber wie es so ist , ist der Weg das Ziel und ich b egeb e m ich a uf den Weg.
9.3
Verstehe das Problem
9.3.1
Beispiel
Für 3 Männer und 3 Frauen probiere ich einige mög liche Sitzordnungen a us. Einige Beispiele für Sitzordnungen zeigt Abbildung 9.1. Ich stelle schnell fest , dass ich leicht die eine oder a ndere Drehungsmöglichkeit übersehen kann , wenn ich nicht ein sicheres Unterscheidungsmerkmal für die Anordnungen finde . m
In
f
f
Beispi ell
Beispiel 2
f
f
f
f
Beispiel 3
Beispi el 4
Abb. 9.1: Beispiele für Sitzordnungen mit 3 Männern und 3 Frauen
W ir sehen, die Anordnung a us Beispi el 2 kann durch eine Drehung um 60" (im Uh rzeiger sinn) in die Ano rdnung des Beispiels 4 üb erführt werden. Für unser e
143
9.3 Verstehe das Problem
AufgabensteIlung dürfen also nicht alle Anordnungen gezählt werden . Wir dürfen nur die Anordnungen zä hlen, die nicht durch Drehungen deckungsgleich mit ber eits gezählten Anordnungen gemacht werden können .
9.3. 2
Erste, aber falsche lösu ng
Folgender vielleicht naheliegender Gedankengang zur Zählung im vorigen Beispi el ist falsch : Zähle alle Anordnungen von 3 + 3 El ementen und t eile diese An zahl durch 6, denn 6 ist die An zahl der Drehungen (nämlich: 60°, 120", 180°, 240", 300" und 360" oder 0" als identische Abbildung) . Im Fall e m =
f
= 3 ergibt sich so:
- 6!_ . -1 3!·3!
6
20 6
Aber das ist keine ganze Zahl. Etwas stimmt ni cht bzw . so einfach ist es nicht.
9.3.3
Systematisches Probieren
Die Gleichheit von Anordnungen bis a uf Dr ehungen kann als Äquivalen zr elation beschrieb en werden : Zwei Anordnungen a und b sind äquivalent, wenn es eine Drehung gib t , die die eine in die andere überführt. In dieser Äquivalen zrelation ist m m m f f f ein Repräsentant für die Äqui valenzklasse mi t den folgenden 6 Anordnungen:
mmmf f f mmf f f m mf f f mm f f f mmm f f mmmf f mmmf f Diese 6 Anordnungen können durch Dr ehungen aufeinander abgebildet werden . Der Repräsentant m f m f m f repräsentiert 2 Anordnungen (inkl. sich selbst ), nämlich:
mf mf mf f mf mf m
144
9 Über die Anzahl von Sitzord nungen am runden Tisch
Tab. 9.1: Alle Möglich keiten für m =
f
= 3
Äquiva lenzkla sse / Anordnung N r .
R eprä sent a nt
A nzahl versch ie dene r R epräsentanten
1
m m m f f f
2
m m f f m f
3
m m f m f f
6 6 6
4
m f m f m f
2
Durch systematisches Probieren finde ich für m = f = 3 die in der Ta be lle 9.1 a ufgeführten Äquivalenzklassen . Für jede Äquivalenzklasse nennt die Tabelle einen Repräsentanten und die Anz a hl der Repräsentanten in der Klasse. Das sind alle Anordnu ngen mit m = f = 3, den n ent wede r sitzen die drei Frauen zusammen (Anordnung 1) oder Männer un d Frauen sit zen abwechseln d (An ord nu ng 4) oder es sitz en 2 Frauen neben eina nd er und die drit t e sitz t zwisch en Männern . Im let zt eren Fa ll mu ss ma n die Fälle unt erscheid en , dass hint er zwei Frauen ein Ma nn (Anordnung 3) oder zwei Mä nn er (An ord nu ng 2) sit zen . In sgesamt 4 Möglich keiten . Nun versteht man auch , warum die erst e Lösungsidee (Abschnitt 9.3.2) nic ht funktioniert: Die ges uchte Anz a hl ist 4, a ber nicht jed e Klass e ent hält genau 6 An ordnungen.
9.4
Suche Zusammenhänge, ersinne einen Plan und führe ihn aus
9.4.1
Suche im Internet
Bei der Suche im Int ernet sti eß ich auf [191. Dor t war die gleiche Frage gestellt. Die Antwort ent sprach genau meiner falsche n Lösungsidee. Der Fragen de hat t e das auch b em erk t und ein ige Nachfragen gestellt . Schließlich war nur so viel klar : • •
Man kann nic ht die Sitzordnungen a n einem geraden Tisch zählen und durch die Anzahl der Pe rsonen t eilen . Wenn man statt eine r nicht ga nzzahligen Lösung die nächst größ ere ganze Za hl als Lösung vermutet, dann st im mt das zwa r für m = f = 3, ab er nicht allg emein.
Auf m an chen Seit en im Int ernet konnte ich die Frage noc h als Rät sel finden, et wa mit den Zahlen m = f = 3. Prinzip ielles üb er das Lösungsv erfa hren od er eine Formel zur Anzahlb erechn ung wurden da ab er nicht gegeb en .
9.4 Suche Zusamm enhänge, ersinne einen Plan und füh re ihn aus
9.4.2
145
Eine Wertetabelle
Die Anzahl der Anordnungen von m Mä nnern und f Frauen um einen runden Tisch , bei der d ur ch Drehungen aufeinander a bbild bare Anordnung en als gleich angeseh en wer den , b ezeichne ich im Folgen den m it A(m , f) . Für verschi ed en e Wert e von m und f habe ich eine Wertetab elle aufgestellt, vor allem , um meh r üb er das Problem zu lernen . Das Problem ist offensichtlich sy mmetrisch , d . h . A(m , f) = AU, m). Darum kann man die Tab elle lesen , wie man möcht e. Ich selbst halt e es so, in den Zeilen die Anzahl der Männer zu suche n und in den Spalten die Anzahl der Frauen . Tabe lle 9.2 zeigt die Wer t e A( m, f) für alle Gesellschaft en au s bis zu 8 P ersone n . Tab. 9.2: A( m, f)
A (m, J)
0
1
2
3
4
5
6
0
1
1
1
1
1
1
1
7 1
1
1
1
1
1
1
1
1
1
2
1
1
2
3
3
4
3
1
1
2 2
4
5
7
4
1
1
5
10
5
1
1
3 3
6
1
1
4
7
1
1
8
1
8 1
7
Es ist A(5,0) = 1, denn es gibt nur eine Möglichkeit 5 Männer an eine n ru nden Tisch zu set zen. Es ist A(3,3) = 4, wie ob en gezeigt . Die Anzahl A( O, 0) dacht e ich mir a us Gewohnheit als 1, weil es in der Mathem atik i. d . R. eine Möglichkeit gib t, die leer e Menge zu bilden . (Man den ke a n O! .) Die 10 Anord nung en für A(4 ,4) ha ben Repräsen t ant en :
f f f f f f m f f m f f m f f f m f m f m f m m f m f f m
m m m m m m m m m m m m
f
f f m
m m m m m m m m m
f
m m
f m
f
f f m f m f m f m f f f f f f f f f m f
9 Über die Anzahl von Sitzordnungen am runden Tisch
146
Wer möchte, soll die Vollst ändigkeit und Richtigkeit dieser 10 Anordnungen üb er prüfen .
9.4.3
Ein Plan
Durch eigene Bemühungen fand ich kein e schlüss ige Zählweise. Da erinne rte ich mi ch an eine wunderbare Int ernet seit e, nämlich Th e On-Lin e Encyclopedia of In teger S equenc es [20]. Das ist eine Reposit or y mi t Suchmaschine für Int egerFolgen . Ich habe nach der Folge ges ucht. Quadratisch ange ordne te Zahlen wer t e sucht man dort durch Ane inande rre ihung der Werte der Gegendiagon alen . Ich suchte also nach 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 3, 4, 3, 1, 1, 1, 1, 3, 5, 5, 3, 1, 1, 1, 1, 4, 7, 10, 7, 4, 1, 1, 1, 1 und wurde fündig: Die do rt als A047996 [21] verzeichnete Folge passt e genau . Der Name der Folge ist dort
"Tr i angl e of circular binomial coefficients T(n,k), O<=k<=n" und die Beschreibung laut et :
"T(n , k ) =number of necklaces with k black beads, n-k white beads". Dazu war noch eine Formel ange gebe n:
T(n,k)=(l/n) * Sum_{d I (n ,k)} phi(d)*binomial(n/d ,k/d)} Also geh t es um Hal sb änder (neeklaces ), die man aus Perlen (beads) von verschiedenen Farben m acht . Wa s sag t mir diese For mel. Wo ist die Theorie dazu ? Ich vermutete, dass T (n , k ) mein em A(m , f) entspricht, wenn man n = m + fund k = f setzt, also T( m
+ I ,1)
= A(m , 1) .
Das hat sich dann später a uch als richti g erwiesen. Immerhin , was ich gefunden hat t e, passt e zur Aufg abe und ließ mi ch mi t neu en Stichwort en weitersuc he n . Un d ich habe an ob en gen anntem Dr. Math geschrieb en . In der wirklich hilfreich en An twor t war dann vom Burnsid e-Lemma die Red e - und von "dihedral groups", also Died er-Gruppen . Siehe au ch [13, 141 .
147
9.5 Überprüfe die Lösung
9.5
Überprüfe die Lösung
9.5.1
Das Burnside-Lemma
Mit neu en Suchworten ver seh en , fand ich einmal den mehrfachen Hinweis, dass das Burnside -Lem ma b esser .Polya-Bumsid e-Lemma'' od er "Lem ma von Cauchy-Froben iu s" zu nennen sei; siehe dazu [18, 17]. E ine für mein en Fall gut geeignet e Darst ellung des P olya- Burnsid e-Lemmas nennen wir es jet zt so - fand ich b ei McGowan [12] und diese zit iere ich :
Satz 9.1 (Polya Burnside Lemma) If you have a set, S , and a group, G, acting on th e se t. For each elem en t 8 in S , cons ider G(s) th e orbit of 8 as th e se t {g( 8) : 9 in G} . Say two elements, 81 and 82 , in S are " equivalen t" (under G) if th ere exis ts a 9 in G with g( SI ) = S2. The equivalen ce classes under this relati on are j us t th e orbit s. Th e number of equiv alence classes is given by: 1
TGT' L
# (g )
gEG
whe re # (g ) is th e number of elements, s , in S satisf ying g(s) = s (the size of 9 's .fiaed sei"] and IGI is th e ord er (size) of th e group G.
E in Bewei s finde t sich b ei Be t ten et al . [16].
9.5.2
Anwendung des Polya-Burnside-Lemmas
Klassen und Repräsen t anten ha tte ich im Zus ammenhang mi t dem gestellten Problem schon eingeführt : Zwei Anordnungen sind äquivalent , wenn es eine Gruppenoperati on gib t , die die eine auf die ande re a bbildet. Das Polya-Burnsid e-Lemma besagt , dass die An zahl der ver sch ied en en Äquivalen zklassen bzgl. dieser Relation gleich der Summe der An zahlen der Anordnungen ist, die von einer Gruppen op eration auf sich selbs t ab gebildet werden - get eilt durch die Ordnung der Gruppe. Die Men ge der Anordnungen , die unter su cht wird, ist die Menge der n- Tupel au s Männe rn und Frauen . Die Gruppen op erationen sind Drehungen . In dem Art ikel von Mc Gowa n [12] wird u. a. folgende Formel gegeben , die ich ebenfall s zitiere :
148
9 Über die Anzahl von Sitzordnungen am runden Tisch
SUM[k-GCD(j ,n) :j=O,1 ,2 . . . (n-l )J /n (Polya Burnside Lemma using the rotation group)
Darin ist GCD der Greatest Common Divi sor, also der größte gemeinsame Tei ler (ggT) . Das k ist die Anzahl der Farben , die zur Verfügung st ehen. Diese Formel berechnet aber nic ht, was ich suche, sondern stattdessen die Anzahl der bis a uf Drehungen verschiedenen Halsbänder a us n Perlen von k Farben. Wenn das aber so ist , da nn sollte die von dies er Formel b er echnete Anza hl für ein bestimmtes n gleich der Summe der Anzahlen aus meiner A( m , f) -Tabelle fü r n = m + f sein . Ich rechne (m it k
= 2 und n = 8) :
SUM[2-GCD(j , 8) :j=O,1,2 ... 7J /n
288 /8
36
Dab ei verwende ich folgende Wer t e für GCD(j, 8) = ggT(j , 8) (Tabelle 9.3): Tab. 9.3: ggT(j,8)
i
ggT (j, 8 )
0
8
1
1
2
2
3
1
4
4
5
1
6
2
7
1
+ 2 1 + 22 + 2 1 + 24 + 2 1 + 22 + 2 1 = 288 . lese ich die Werte fü r A( m , f) m it m + f =
Die Summation erg ibt 28
Für die Gegenprobe A (m , f) -Tabelle 9.4 a b (unterstrichene Felder) . Tatsächlich ist die Sum me der A(m , f) mit m
8 aus der
+ f = 8 genau 36 . Seh r gut !
9.5 Überprüfe die Lösung
149
Tab. 9.4: A(m, f) mit markierter Diagonale
A(m ,f)
0
1
2
3
4
5
6
7
8
1
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
1
1
2
2
3
3
.1
3
1
1
2
4
5
I
4
1
1
3
5
10
5
1
1
3
I
6
1
1
.1
7 8
1
1
1
Die T(n , k)- Formel
9.5.3
Nachdem ich wusste, dass ich erstens auf der ric htigen Sp ur war und zweitens, dass meine A(m , f) -Tabelle anschei nend richt ig ist , wagte ich m ich auch an die T(n , k)-Formel aus A047996 [21].
Satz 9 .2 (T (n , k)-Formel)
T (n , k) =
~. L d
I (n,k )
(:~;)
Die Summe lä uft üb er d I (n, k), das meint a lle gemeinsamen Tei ler von n und k. Beis pie l: Für n = 6 und k = 3 sin d das die Zahlen 1 und 3.
n 1
'!J(n) 1
2
1
3
2
4
2
5
4
Erläute rung 1 ist zu 1 relativ prim, weil 1 keine Primzahl ist. nur die 1 relativ prim sind 1 und 2 relativ prim sind 1 und 3 relativ prim sind 1, 2, 3 und 4
150
9 Über die Anzahl von Sitzordnungen am runden T isch
Beispiel 9.3 Ich b er echne zur Übung 1'(6,3 ). Es sollte sich 4 erge be n.
1'(6, 3) =
~. ~
cp (d) ·
d E{ 1 ,3 }
Somit :
1'(6, 3) =
~ . ( cp(l)' (~) +cp(3)· (~)) 1
24
6
6
= - . (20 + 4) = - = 4
•
Und das st immt über ein mit dem erwarteten A (3, 3) = 4. B e is p iel 9.4 Die Be rechnung für T(8 , 4):
~
1'(8 , 4) = 8 .
'" Z::
d E{ I ,2 ,4 }
cp(d) .
(8/d) 8/d
1
80
8
8
= - . (70 + 1 . 6 + 2 . 2) = - =
10
Au ch diese Rechnung erg ibt das erwünschte Ergebnis .
•
Schön! Aber wa rum?
9.5.4 F ür m
Verstehe die Formel
= f = 3,
also n
=
6, möcht e ich die verwendete Formel begründen.
Für m = f = 3 find et man 20 P ermutation en (b ei Zählung von Dr ehungen) . Davon sind höchsten s 6 in eine r Kl asse (d . h . sind bis a uf Drehungen äquivalent ). Wi e viele Klassen gibt es mit gen au 6 Eleme nten? Klassen mit 6 E leme nten sind solche, der en Repräsentant en in sich kein e Symmetrien durch Dr ehungen a ufweisen. Beispiel 9 .5 Di e Anordnung m f m f m f weist eine interne Dr eh symmetrie a uf, nämlich um 120 Dagegen weist m m m f f f keine interne Dr eh symmetrie a uf. • 0
•
Die Länge einer in t ernen Drehsymmetrie sei die mini male Länge de s sich in der Anordnung wied erholenden Musters. Ich nenne eine n minimal en internen dr eh symmetrische n Abschnitt eine r Anordnung ein Must er. Die An zahl der Wi ed erholungen des Mu st er s in der gesamten Anordnung nenne ich die P eriod e des Musters .
151
9.5 Überprüfe die Lösung
Beispiel 9.6 In m f m f m f Mu st er s ist 3.
ist das Mu st er m f , dessen Länge ist 2 und die P eriode dieses
•
Die Länge des Mu st er s mu ss ein Teiler von 6 sein ! Folglich kann es nur interne Dreh symmetrien der Länge 2 ode r 3 geb en . Es mu ss gelten: Länge . Periode = m
+f
= n
Die interne Drehsymmetrie einer Anordnung erfo rdert a ber au ch, dass die Summe de r Anzahlen von Männern und Frauen in dem Muster mit Periode d jeweils genau m/d bzw. t]« ist . Für m = f = 3 mu ss die An zahl der mund f in eine m Mu st er mit Pe riode 2 gleich m/2= 3/2 bzw. f /2 = 3/2sein. Das ist nicht möglich , denn Anz ahlen sind ganze Zahlen . Daran sieht man , dass es kein Muster der Länge 3 gibt . Es gib t Muster de r Länge 2. Deren Periode ist 3 und
m/3 =
1 bzw. f /3
=
1.
Wie viele vers chiedene Mus ter a us 2 Person en, einem Mann und einer Fr au, gibt es? Es sind 2, nämlich m fund f m. Die Anordnungen von 3 Männe rn und 3 Fr auen , die kein e Muster (als o a uch kein e P eri odizität) a ufweisen, ergebe n unter allen möglichen Drehungen jeweils 6 ver schi ed en e Repräsentant en . Die Anordnu ngen mit periodischen Mus tern, haben weniger als 6 ver schiedene Repräsen tanten in ihrer Klasse.
B e is p iel 9. 7 Die Klas se mi t m f m f m f hat nur 2 st at t 6 Repräsentanten. Es fehlen 4 Repräsentanten , um er folgreich durch 6 teilen zu können. • Der Sinn de r obigen Formel ist nun , die Anz ahl der für die Divi sion durch 6 fehlenden Repräsen tanten zu er gänzen . Für Klassen mit p eriodischen Rep räs entanten kommen nur solch e in Frage, deren P eri ode ein gem ein samer Teiler von n = m + fund k = fist . F ür n = 6 und k = 3 ist die Men ge der gem ein samen Teiler {I , 3}. Es fehlt di e 2 als Teiler. Durch Addition von ip(3) . An zahl der fehl enden Repräsentanten ergä nz t.
(i)
wird an schein end die
Soweit mein e Üb erl egung zur Plausibilisierung der Formel.
152
9.5 .5
9 Über die Anzahl von Sitzordnungen am runden Tisch
Gruppe der Rotationen
Das P olya-B urn side-Lemma sagt etwas üb er ein e Gruppe au s. Im bisher bet rachte ten Fall ist es die Gruppe der Rot ationen eines regelm äßi gen n-Ecks. Die Ordnung dieser Gruppe ist n, denn die Gruppe hat das erzeuge nde El em ent r = 360 o/ n . Es ist r 2 die Drehung um 2 · 3 6 0 o/ n usw ., schließlich ist die ide ntische o o Abbildung gege ben durch 360 / n ode r n· 360 / n • ü
-
Nach dem Lemma von Pol ya-Burnsid e ist die An zahl der Äquivalen zklassen gleich 1 TGT · # (g).
L
gEG
Zu bestimmen ist für jed e Gruppenoperation die An zahl der Anordnungen , die durch diese Op eration a uf sich selbst abgebildet werden . Für m =
f
= 3, also m Männern und
f
Frauen, gibt es 3 ~ k ! = 20 Anordnungen.
Durch die iden ti sche Abbildung werden alle Anordnungen auf sich selbst a bgebildet . Durch eine Dr ehung um 60' wird keine Anor dnung auf sich selbs t a bgebildet , denn dann mü sst e das Geschl ech t aller Persone n mit dem des Nachba rn , auf den gedre ht wird , üb er ein stimmen . Damit wär en a be r alle P er son en ent wede r Männer od er Frauen . Durch eine Drehung um 120' können Anordnungen mi t Mu stern der Länge 2 a us jeweils einem Mann und einer Frau au f sich selbst a bgebildet werden. Von die ser Ar t gibt es 2 Anordnungen , denn von den 2 Pl ätzen des Musters ist einer mi t eine m Mann oder einer Frau zu be setzen und de r an der e mi t einer Person de s anderen Ge schlecht s. Die übrigen 2 mal 2 Pl ä tze müssen mit dem gleichen Muster aus m und f be setz t werden . Das ergibt 2! mögliche Ano rdnungen. Durch eine Dr ehung um 180" können kein e Muster auf sich selbst a bge bilde t werden, weil unter 3 P er son en a us 3 Männern und 3 Fr auen nicht die Hälfte Männe r und die Hälfte Frauen sein können. Für die Dr ehung um 240" gibt es wied erum 2! Möglichkeiten , denn die Drehung um 240" ist das invers e Elem en t zur Drehung um 120' . Die Summe der E leme nte aller Äquivalenz klasse n durch Drehungen ist 20 + 2 + 2. Dies dividiert durch die Ordnung der Gruppe ergibt 4.
9.5.6
Unte rscheidungen bei der Fragestellung
Die am Anfang gest ellte und bisher untersu chte Frage (Abschnitt 9.1) betrifft Männer und Frauen an eine m runden Ti sch . Den Ti sch betrachtet man von ob en ,
153
9.5 Überprüfe die Lösung
niem als von unten . Nur durch Drehungen wird die Äqui valenz von An ordnungen defin iert . Betrachtet man dagegen ein Hal sband mit farbigen P erl en , so hat man die Möglichkeit das Hal sband "umz udre he n", geometrisch gesprochen : eine Spi egelung an zuwenden . Dann wär en zwei Hal sbänder bbrbrr und brbbrr au s 3 rot en und 3 blauen Kugeln nicht zu unter scheid en und gehöre n folgli ch zu eine r Äqui valen zkl as se. Wenn bei den Ti schordnungen bisher nur Drehungen als Gruppenoperationen in Be tracht kamen , dann erl aub t eine Hal skette a uch Spiegelungen. Mer ke 1 :
Wenn man Halsbänder zählt und neb en Drehungen auch Spi egelungen als Operationen erlaubt sind, dann bilden alle dies e Op erationen eine Died er-Gruppe (dihedral group) der Ordnung 2n (n die An zahl der P erl en) . Die Dieder-Gruppe der Ordnung 2n ist die Gruppe der ebenen Symmetrieoperationen a us Drehungen und Spiegelungen, angewendet a uf die n Ecken eines regelmäßigen n-Ecks. Mer ke 2:
Wenn man Sp iegelungen nicht erlaubt (wie bei Männern und Fr auen am runden T isch) , hat man nur die Dr ehungen zu betrachten . Mit dem Polya-Burnside-Lemmas können wir Sitzordnungen und Halsb änder zählen . Die Gruppe G ist eine andere, das Prinzip bleibt . Es folgen zwei Beispiele. B e is p iel 9.8 Für 4 Männer und 4 Fr auen , in sgesamt 8 Personen, bestimme man die Anzahl de r möglichen Sitzordnungen an einem runden Ti sch. Zu b estimmen ist für jed e Gruppenoperation die An zahl der Anordnungen , die durch diese Op eration auf sich selbs t abgebi ldet werden . Für die Dr ehungen um Vielfache von 360 °/8 = 45° zeigt Tabelle 9.6 die Möglichkeiten. (8 ist die Ordnung der Gruppe der Rotationen ein es regelm äßig en 8-E cks .) Durch die id entische Abbildung werden alle Anordnungen, a uf den en die Gruppe op eri ert , auf sich selb st abgebildet. Für m
= 4 und f = 4 ist die Anz ahl der Anordnungen gleich
4~~ !
= 70.
Du rch eine Drehung um 45' wird keine Anordnung a uf sich selbst a bgebildet, denn dann mü sste das Ge schlecht aller Personen mit dem de s Nachbarn , auf den gedreht wird , übereinstimmen. Damit wären aber alle Personen entweder Männer oder Fr auen .
154
9 Über die Anzahl von Sitzordnungen am runden Tisch
Tab. 9.6: Mögliche Drehungen des Tisches bei 4 Männern und 4 Frauen Drehung um ...
o·
Anzahl der invarianten Anordnungen 8! 4!.4!
= 70
Identität
= 45° = 900 ".3 = 1350 ".4 = 1800 ".5 = 2250 ".6 = 2700 = (". 2) -1 ". 7 = 3150 r
nicht möglich
".2
2! = 2 nicht möglich 4! 2!.2!
=6 nicht möglich 2! = 2 nicht möglich
Durch eine Dr ehung um 90· können An or dnungen m it Mustern der Län ge 2 a us je weils einen Ma nn und einer Frau a uf sich selbst a bgebildet wer de n . Von die ser Art gib t es 2 Anordnunge n , denn von den 2 Pl ätzen des Musters ist einer m it einem Mann od er einer Fr au zu b esetzen und der a ndere mi t einer Person des anderen Ge schle cht s. Die üb rig en 3 mal 2 Pl ätz e mü ssen mi t dem glei chen Muster aus mund f be setz t wer den . Kombinato risch : 2! Mögli chke it en . Durch eine Dr ehung um 135· werde n kein e Mu st er au f sich selbst abgebildet . Durch eine Dr ehung um 180· können Anordnungen mit Mu st ern der Län ge 2 od er 4 auf sich selbst a bgebildet wer de n . Die möglichen Must er der Län ge 2 sind m fund f m. Ein Must er der Länge 2 ergibt a ber a uch ein Muster der Länge 4, nämli ch m f m fund f m f m. Die weiteren möglichen Muster de r Länge 4, ohne Un termu ster de r Länge 2, sind m m f f , f f m m, m f f mund f m m f . Diese 6 sind alle Mög lichkeit en , denn es gibt = 6 Möglichkeit en au s den 4 Pl ätzen eines Must ers der Län ge 4 zwei P lätze für Frauen a usz us uchen ; die a ndere n b eid en Pl ätze werden dann mi t Männern beset zt. Diese 6 Möglichkeiten haben wir gefunde n .
m
Durch eine Dr ehung um 225· werden kein e Mu st er auf sich selbst ab gebildet . Die Dr ehung um 270" ist das Inv er se zur Drehung um 90· . Es gibt som it a uch hier 2 Möglichkeit en . Schließlich gib t es für die Drehung um 315· wiederum keine invaria nte n An ordnungen . Die Summe der Elemente aller Äquivalenzklass en durch Drehungen dividiert durch die Gruppenordnung ergi bt:
,
,) -
.!..(~ ~ 8 4! . 4! + 2. + 2! . 2! + 2.
- 10
•
155
9 .5 Überprüfe die Lösung
Beispiel 9.9 Bestimme die An zahl ver schi ed en er Halsb änder mit 4 blauen und 4 roten P erl en.
Zu be stimmen ist für jede Gruppenoperation der Dieder-Gruppe für ein 8-Eck die Anza hl de r Ano rdnungen , die durch die se Opera tion au f sich selbs t a bgebilde t werden . Die O rdnung der Dieder-Gruppe für ein 8-Eck ist 2n = 16. Zu diesen Op er ationen geh ören die Drehungen, die schon im vori gen Beispi el 9.8 b etrachtet word en sind . Außerdem sind Spi egelungen zu betrachten . Da die An zahl der P erl en ger ade ist , gibt es zwei ver schi ed en e Art en , die Spi egelach se zu legen (sieh e Ab bildung 9.2) , nämlich einmal durch zwei gegenübe rliegende P erlen (T yp 1) und zum a nde re n durch zwei gegenübe rliege nde Zwischenräume (Typ 2) . Für beid e T yp en gibt es jeweils 4 Möglichkeiten , die Spi egelachse zu legen.
Sp iegelung Typ 1
Spi egelung Typ 2
Abb. 9.2: Typ en von Spiegelung en bei einer Halskette au s gera de vielen Perlen
F ür eine Spiegelung vom T yp 1 gibt es 24 An ordnungen , die a uf sich selbst abgebildet werden: Die beiden Perlen a uf de r Spiegelachse mü ssen von de r gleiche n Farbe sein (2 Möglichkeit en ). Von den drei Pl ätzen a uf einer Seit e der Spi egelachse wird eine r au sgewählt , der die gleiche Farbe erhält, wie die P erl en a uf der Spiegelachse (3 Möglichkei ten) . Ins gesamt gib t es 4 Spiegelachsen . Somi t lassen Spi egelungen vom T yp 1 insgesamt 2 . 3 . 4 = 24 Anordnu ngen unver ändert . Betrachten wir nun Spi egelungen vom T yp 2. Auf jed er Seite der Spi egelachse müssen sich gleich viele rote und bl au e Kugeln befinden , also jeweils 2. Es gibt 6 Möglichkeit en , solche Anordnungen a us 2 roten und 2 blauen P erl en zu bilden . Weil es 4 Spiegelachsen gibt , wird mit 4 multipliziert , das erg ibt 6 . 4 = 24 Möglichkeit en . Die Summe der je Gruppen operation (Drehung od er Spiegelung ) a uf sich selbst ab geb ild et en Anordnungen ist :
~ 1 ~ 1 .~ . ~4! . 4! + 2. + 2! . 2! + 2. + 4 2! . 2! + 4 2! . 2! -
70 + 2 + 6 + 2 + 24
= 128
+ 24
156
9 Über die Anzahl von Sitzordnungen am runden Tisch
Die Ordnung der Gruppe ist 16. Die Anzahl der Äquivalen zkl ass en bzgl. der Gruppenoper ationen ist
12 8/16
= 8.
Es gibt 8 verschiedene P erl enketten aus 4 roten und 4 blauen Kugeln .
9.6
Am Ziel
9. 6.1
Zwei verschiedene Berechnungsweisen?
•
Oben hatte ich zunächst die T(n , k)-Formel zur Berechnung der Anzahl der Sit zordnungen benutzt . An schli eßend hatte ich die gleich e An zahl üb er die Auflistung der Gruppenoperationen und die Anz ahl de r jeweils auf sich selb st a bgebildeten Anordnungen be stimmt . Die Ergebnisse st immen überein . Die T( n , k)-Formel ergibt für m
1'(8, 4) =
= f = 4, also
~ . (70 +
ti
= 8:
1 ·6 + 2 . 2)
0
= 88 = 10
Bei der Zählung über die Aufli stung der Gruppenoperationen hatte ich mit Teilbarkeiten und Nicht -Teilbarkeit en a rgume nt iert. Die T(n , k)-Formel form ali siert diese Teilbarke it sargumente für den Fall der Rotationsgruppe.
9.6.2
Zusamm enfassung und Lösung der Aufgabe
Satz 9. 10 (T( n , k)- Formel) Die Anzahl der Sit zordnungen von n Personen mit k Frauen und n - k Männ ern am runden Tis ch ist gleich
T (n , k) =
~. L d
I (n ,k)
(:~~) .
Die Summ e läuft über d I (n , k), das meint alle gemeinsamen Teiler von n und k.
9.6 Am Ziel
9.6 .3
157
Konstruktiver Algorithmus?
Ich suchte noch einen Algori thmus , der alle mögli chen Sitz ordnungen bzw . alle möglichen P erl enketten erze ugt . Schli eßlich habe ich eine n gefunden (sieh e cas [26]) und in PHP neu implem enti ert . Dieser klein e 'Halsba nd-Ge ne rator' ist auf dem Matheplanet en verfügbar (siehe [25]) , man kann ihn dort gern ausprobieren und den Source-Cod e einse hen .
9.6.4
Nachbetrachtung
Die Aufgabe führt e mich in die Algebraische Kombinatorik ode r Polya-Theorie . Zit at au s eine r Vorlesungsankündigung zu diesem Gebi et von P. Paule [23]:
Viele kombinatorisch e Situationen und Objekte könn en durch Operationen von Gruppen auf M engen in natürlich er' Weis e beschrieben werden. Anwendungen dieses vereinh eitlichenden algebraischen Konzeptes (sogen annte Polya-Theorie) ergeben sich sowohl für Abzählungs- und Kla ssijikationsproblem e (z . B . chem isch e Mol eküle) als auch für die Konstruktion bzw . Aufiistung komb inatorischer Obj ekt e (z. B . Li stingalgorithmen fü r P ermutation en , Pa rtitionen , Graph en u. s. w.) . Ich hab e die T heorie nur so weit angesproche n, wie es für diese Aufgab e erforderlich war. Die von mi r herangezogenen Quellen sind im Lite ra turverz eichnis aufgeführt . Mehr üb er Gruppenoperat ionen findet der Leser hie r im vorliegenden Buch in Kapit el 5.
Martin Wohlgemuth ist Dipl.-Math. und Bet reib er der Mat he pla ne te n .
10 Summenzerlegungen
Übersicht 10.1 Zählen kann doch jeder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 10.2 Äquivalente und verw andte Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 10.3 Die An zahl der Summen zerl egungen von n
163
10.4 Rekursive An sätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 10.5 Dualität. . . . . ... . . . . . ... . . . . ... . . . . . .. .. . . . ... . . . . ... . . . . . .. 168 10.6 Leer e Beh älter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 10.7 Erzeugende Funktionen
171
10.8 Au sblick und Schlus s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
Ein Ausflug in die Kombinatorik Wir starten mi t der Frage:
Auf wie viele Arten kann man eine Zahl als Summe von Zahl en schreiben? Diese Fr age ist nicht einde ut ig zu beantworten . Die Präzision in der Fragest ellung mu ss verbessert werd en .
Auf wie viele Arten kann man eine nat ürlich e Zahl als Summe natürlicher Zahlen schreiben ? Au ch dies lässt Raum für Interpretationen . Nächster Versuch:
A14 wie viele A rt en kann man eine natürliche Zahl als Summ e beliebig vieler positi ver natürlicher Zahl en darstellen, wobei zwei Darstellungen nur dann als versc hieden gelten, wenn sie sich hin sichtlich der vorkommend en verschiedenen Summanden oder der Vielfachheit der versc hiedenen Summanden unterscheiden ? Eine Dar st ellung in diesem Sinne heißt Summenzerl egung od er a uch numerische Partition.
160
10 Summenzerlegungen
B eispiel 10.1 Die Dar st ellungen von 17 als 5+5+3+ 4 od er 4+3+5+5 sind nicht ver schi ed en , denn beide Darst ellungen verw enden die gleiche n Summanden (die 3, die 4 und die 5), die 5 kommt in b eid en Darst ellungen 2-mal vor, die 3 und die 4 kommen jeweils I-m al vor. Dagegen sind die Darst ellungen 17 = 10 + 3+4 und 17 = 3+5+5+4 ver schi ed en , denn ein Summand (etwa die 10) kommt nicht in b eid en Darst ellungen vor. Au ch die Dar st ellungen 17 = 5 + 4 + 4 + 2 + 2 und 17 = 5 + 4 + 2 + 2 + 2 + 2 sind ver schi ed en . Zwar sind die ver schi ed en en Summanden in b eid en Fällen die 2,4 und 5, jedoch die Vielfachheiten de r Summanden sti m me n ni cht üb erein einmal kommt die 4 2-mal, das ande re Mal nur I-mal vor . •
Zwei Summenzerlegungen sind also gleich , wenn die eine Darst ellung zur a nderen umsortiert werden kann .
Es ist gewollt , dass die Darst ellung von 17 = 17 eine Summen zerl egung ist . Die Au sdrucksweise 'beliebig viele positive Summanden ' erla ubt die 1 für die Anzahl de r Summanden. Die 1 ist mit Ab sicht eingeschlo ssen . Das mu ss man nicht so machen , ab er es ist mein e Entscheidung und ich b egründe sie damit , dass es dadurch leichter (i. S. v. üb ersi chtlicher, weniger Fallunter scheidungen) wird , die Summen zerl egungen zu zä hlen . Nun denkt man sich bei eine r Summe a be r do ch ehe r mindest en s zwei Summanden . Ich mus s die Aufgab en st eIlung no ch genaue r formulier en und komme nun nicht mehr umhin , die sprachliche Fassung des Problem s durch eine form ale zu erse tzen:
D e fin itio n 10 .2 (Mul t im e nge) Eine Multim enge a uf ein er Menge A ist eine Menge geordneter Paare (v, a) , wob ei a a us A und v ein e natürliche Zahl oder das Symbol 00 mi t der Bedeutung "unendlich" ist . •
Beispiel 10.3 Eine Multimenge soll man sich als Men ge mit Vielfa chheiten vor st ellen . Folgen des ist ein Beispi el für eine Mul timenge: {(4, Glas Wein) , (3 , Col a) , (8, Bie r) , (2 , Wasser )} (J a , Kellner müs sen mit Mult imengen umgehen können!)
•
161
Definition 10.4 (Summenzerlegung) Eine Summ enz erlegung eine r natürlichen Zahl n ist eine Mult ime nge
mi t ver schiedenen
ti ,
E
N, für die gilt : r
LVi· n i = n i= l
für r
> 0, Vi> 0, n i > 0, i = 1, . . . , r.
•
Die Meng e aller Summ enzerlegungen einer natürlichen Zahl n ist eine Menge , de ren Elemente Multimengen sind. Wir wollen die Anz ahl der Elemente der Menge der Summenzerlegungen von n be stimmen.
Beispiel 10.5 Bei spiel für eine Summenzerlegung der Zahl 9: {(1 ,5) , (1 ,2) , (2,1)} Zu lesen: ,,I-mal 5, I-mal 2, 2-mal 1". Dies ist eine Summen zerl egung der natürlich en Zahl 9, weil 1 ·5 + 1 ·2 + 2 · 1 = 9 ist . Eine a nde re Summen zerl egung der 9 ist {( 1,5) , (2,2)} • Wenn man weiß , was man mein t , dann kann man auch gerne wied er mit weniger form alem Aufwand schreibe n. Die ver schi ed en en Summen zerl egungen der 9 sind: 9 =9 9 = 8 +1 9 =7 +2 9 =7 +1 +1 9 =6 +3 9 = 6 +2 +1 9 =6 +1 +1 +1 9 = 5 +4 9 =5 + 3 +1 usw . Die Fr age , die wir beantworten wollen , lautet also:
Frage 1: Wi e viele verschiede ne Summen zerl egungen gibt es für eine natürliche Zahl n?
162
10.1
10 Summenze rlegungen
Zählen kann doch jeder
Das sagt man so leicht! Es ist aber kein Kinderspiel , die Kombinatorik. Bei der ersten Bekanntschaft mit der Kombinatorik lern t man Permutationen , Kombinationen und Variationen. Dafür werden Formeln gelehrt , die Potenzen, Fakultäten und Binomialkoeffizienten enthalten. Das ist die elementare Kombinatorik. Das hier gestellte Problem kann man damit nicht lösen . Was ist das Ziel der Kombinatorik? Nun , Formeln für An zahlen zu geben, ist die falsch e Antwort . Richtig ist : Ziel der Kombinatorik ist die Lösung von Abzä hl problem en . Alle rdings ist eine Lösung nicht notwendig eine Formel, sondern allg emeiner , eine Lösung ist eine Methode, mit der Ab zählungen vorg enommen werden können. Das ist allgemein ein Algorithmus , denn a uch eine Formel mit Fakultäten ist nic ht s anderes als die komprimierte Fassung eines Algorithmus. Die Kombinatorik ist die Wissenschaft von diesen Methoden , von den Denkweisen und Wegen , auf denen man zu einer Lösung gelangt . Manche glauben , dass Kombinat orik kein wesentliches Feld der Mathematik sei. Meiner Meinung nach ist Kombinatorik eine Methode des mathematischen Den kens , die sich als unsagbar pr oduktiv erwiesen hat und dab ei häufig höc hst intuitive und vom ästhetischen Standpunkt (des Mathematikers ) schöne E rgebnisse hervorbringt - Ergebniss e, die a ußerdem für die Ber echnung m it Computern unmittelbar einsetzbar sind. J ede Beschäftigung mit eine m Abzählproblem b eginnt dam it , die Aufgab ensteIlu ng zu versteh en, nöt igenfalls zu präzisieren un d präzise auszudrücken (sieh e ob en) . Es macht sch ließlich eine n wesentlich en Unterschied , ob man die Reihenfolge der Summand en in eine r Summen zerl egung un t erscheidet od er nicht.
10.2
Äquivalente und verwandte Fragen
Die Fr age 1 ist äquivalent zur Frage 2 (d . h ., wenn man das eine zählen kann, dann kann man a uch das andere zählen) : Frage 2: Auf wie viele verschied ene Weisen lassen sich n nicht unt er scheidbar e
Kugeln in nicht unterscheidbare Behälter vert eilen, so dass kein Behälte r leer bleibt ? Dieses Problem ist wiederum nahe verwandt mi t dem Folgenden: Frage 3: Auf wie viele verschieden e Weisen las sen sich n nicht un t er scheidba-
re Kugeln in k nicht unterscheidbare Behälter verteilen , so dass kein Behälter leer bleibt? Äq uival ent zu Frage 3 ist:
10.3 Die Anzahl de r Summenzerlegungen von n
163
Frage 4: Wi e viele Summenzerl egungen m it genau k El em enten hat eine natürliche Zahl n ? Und eine n aheliegende Variation von Frage 3 ist diese: Frage 5: Auf wie viele verschiedene Weisen lassen sich n nicht unterscheidbare Kugeln in k nicht unterscheidbare Behälter verteilen? (Behälter dürfen also leer bleib en .)
Die Anzahl der Summenzerlegungen von n
10.3
Die Anzahl der Summenzerlegungen einer natürlichen Zahl n wird mit p(n) bezeichnet. Man nennt die p(n) die P artitionszahlen. Dieser Name geht zurück auf Euler [29]. Wir wollen nun unsere Frage 1 a ngehen. Das Angenehme bei den kombinatorischen Problemen ist , dass man zum Warmwerden das P ro blem mi t kleinen Zahlen für n oder k betrachten kann . Nach einigem Probieren und Nachdenken hat man schnell eine kleine Wertetab elle und bereits etwas von der Struktur des Problems begriffen. Bei manchen Proble men findet man nun schnell eine Vermutung für eine Anzahlformel (als geschlossener Ausdruck unter Verwendung von elementaren An zahlbegriffen) . Bei den Summenzerlegungen bzw . numerischen Partitionen ist aber keine geschlossene Formel be kannt . Hier ist eine Wertetabelle (Tabe lle 10.1) für die Anzahl der Sum menz erlegungen p(n) bis n = 29: Tab. 10.1: Wertetabelle für die Anzahl der Summenzerlegungen p(n) für n :::; 29
n 0 1 2
p(n ) 1 1 2
n 10 11 12
3 4
3
13 14 15
5
5 7 11
p(n ) 42 56 77 101 135 176
16
231
17 18
297
8
15 22
9
30
19
6 7
385 490
n 20 21 22 23 24 25 26 27 28 29
p(n) 627 792 1002 1255 1575 1958 2436 3010 3718 4565
Um diese Tabelle so weit und a uch noch weit er zu füllen , muss es eine genügen d einfache Ber echnu ngs met hode geb en . Um unterschied lich e Berechnungsmethoden soll es im Folgend en gehen . Wi r b eginnen mit rekursiven Ans ätzen .
164
10 Summenze rlegungen
10.4
Rekursive Ansätze
Der Grundgedanke für die Su che nach rekursiven Beziehungen ist : Finde geeignete disjunkte Auft eil ungen der zu zä hlende n Gesamtheit und versuche, die Mächtigkeit der Teilmengen zu bestimmen . (Zwei Mengen heißen disjunkt, wenn sie keine gemeinsamen Elemente haben .] Für die Summenzerlegungen bie ten sich zwei mögliche Ansätze an. Gruppier e die Summenzerl egungen
I. 11.
nach ih rem größten Summanden , nach der An zahl der Summanden .
Beide werden zum Ziel führen .
10.4.1
Summenzerlegungen nach GröBe der Summanden
Ich b ezeichne die An zahl der Summenzerl egungen von n , in denen der größte vorkommende Summand gleich m ist , mit b(n,m) . Die Aufteilung der Summenzerlegungen für n nach dem größten vorkommenden Summanden ist disjunkt . In Tabelle 10.2 sind a lle Summenzerlegungen der 7 und der jeweils größte Summand dargestellt. Es ist
p(n) = b(n,l)
+ b(n,2) + ... + b(n, n) .
Weiter muss man nicht gehen , denn b(n, n + 1) , b(n, n führt auf die Fr age nach der Berechnung der b(n, m) .
+ 2)
(10.1 ) usw . sind O. Das
Wi e man sich leicht überzeugt, gelten die Anfangsbedingungen :
= 0, wenn m > n ~ O. b(n,O) = 0 fü r all e n > O. b(n,l) = 1 für a lle n > O. b(O ,O) = 1, allein a us logis chen Erwägungen .
b(n ,m)
'Wenn eine Summenzerlegung einen maxima len Summanden m hat , dann ergibt sich daraus durch Weg lassen dieses Summanden eine Summenzerlegung von n - m , in der der größte vorkommende Summand m' höchstens gleich mist . Hat man zwei verschiedene solche Summenzerlegungen von n , dann erhäl t man nach die sem Verfahren verschiedene Summenzerlegungen von n - m (mit maximalem Element kleiner oder gleich m). Es ist somit
b(n ,m) :::; b(n - m , 1) + ... + b(n - m ,m - 1) + b(n - m ,m) .
(10.2)
165
10.4 Rekursive Ansä tze
Tab. 10.2: Summenzerlegungen der 7 und grö ßter Summ and Größter Summand
Ifd. Nr. 1 2
3 4 5
6 7 8 9 10
11 12
13 14 15
••••••• •••••• ••••• ••••• •••• •••• •••• ••• ••• ••• ••• •• •• ••
•
7
•
••
•
• •• ••
6 5
•
• • • • •• • •• ••
•
•• ••
• •
5 4 4
•
4
3
••
• •
• • •• • • • • • • •
3 3
• • • • • • •
3 2 2 2 1
Umgekehrt: Ausgehend von einer Summenzerlegung von n - m mit maximalem Summanden kleiner od er gleich m bildet man eine Summen zerl egung von n mit maximalem Summanden m, indem man eine n Summanden m hinzufügt. Hat man zwei ver schi ed en e solche Summen zerl egungen von n - m , dann erhält man nach diesem Verfahren verschiedene Summenzerlegungen von n (mit maximalem Element m) . Es gilt :
:s: b(n ,m)
(10.3)
b(n - m , 1) + .. .+ b(n - m ,m - 1) + b(n - m ,m)
(10.4)
b(n - m , 1) + ... + b(n - m ,m - 1) + b(n - m ,m)
Aus (10 .2) und (10.3) folgt Gleichheit: b(n ,m)
=
Dieses erste Ergebnis ermöglicht schon die Ber echnung der b(n , m) mit eine m Computer. Unschön ist hierbei all erdings die variable Länge der Rekursion. Wir b et racht en das Problem nun von einer ander en Seite. Wesentlich ist folgende Übe rle gung: Die Summenzerlegungen von n in Summanden kleiner m kann man disjunkt aufteilen nach der Häufigkeit des Summanden m. Wenn der Summand m genau einma l vorkommt , dann kann man eine Summenzerlegung von n - 1 mit größtem Summanden m - 1 konstruier en , indem man von dem Summanden m eins wegnimmt. Wenn der Summand m aber mehrfach vorkommt, dann ergibt das Streichen dieses Summanden eine Summen zerl egung von n - m , in der der größte vorkommende Summand immer noch mist.
166
10 Summenzerleg ungen
Somit gelangt man zu der Gleichung:
b(n,m)
= b(n - l, m - 1) + b(n - m ,m)
(10. 5)
Gleichung (10 .5) ist das Erkennungsmerkmal vieler Varianten von Summenzerlegungen . Wir werden dieser Identität noch mehrmals begegnen. Anmerkung: Gleichungen wie (10.5) werden a ls DijJerenzengleichungen be zeichnet. Für bestimmte T ypen von Differenzengleichungen sind Verfahren b eka nnt , eine explizite Form der durch die Differenzengleichung und die Anfangswerte implizit gegebenen Funktion zu be stimmen. Diese Verfahren ä hneln oft den Methoden zur Lösung von Different ial gleichungen . Wa s für stetige Funktionen die Differentialgleichungen, sind in der Kombi nat orik die Differenzengleichungen! Und genau wie nich t jede Differentia lgleichung eine explizit b ekannt e Lösung ha t , ist es auch hier : F ür die Differenzengleichung (10.5) ist keine explizite Form der Lös ung b ekan nt .
10.4.2
Summenzerlegungen nach Anzahl der Summanden
Ich verwende weiter die Bezeich nung p( n) für die An za hl der Summenzerlegungen und b ezeichne die An zahl der Summenzerlegungen von n in genau k Summanden mit a(n , k). Tab. 10.3: Summenzerlegungen der 7 und Anzahl der Summanden Ifd. Nr.
Anzahl Summanden
1 2
•••••••
3 4
••••• •••••
5
6 7 8 9 10
11 12 13 14 15
•••••• •••• •••• •••• ••• ••• ••• ••• •• •• ••
•
1
•
••
•
• •• ••
2 2
•
• • • • •• • •• ••
•
•• ••
• •
2 3 3 3
•
3 4 4
••
• •
• • •• • • • • • • •
•
4
• • • • • •
6 7
5 5
Die Auft eilung der Summen zerl egungen für n nach der An zahl der Summanden ist disjunkt .
167
10.4 Rekursive Ansätze
In Tabelle 10.3 sind alle Summen zerl egungen der 7 und jeweils die Anz ahl der Summanden dar gest ellt . Es gilt: p(n)
=
a(n ,l ) + a(n ,2)
+ ... + a(n ,n)
(10.6)
Mit der Erfahru ng au s dem vori gen Abs chnitt wag e ich sogleich folgenden Ansatz : Die Summen zerl egungen von n in genau k Summanden kann man di sjunkt a uft eilen nach dem klein st en Summa nd en . Der klein st e Summand ist ent wede r eine 1, oder er ist größer als 1. Wenn der kleinste Summand größer als 1 ist , dann kann man von jedem Summanden eins wegn ehmen und es ergibt sich eine Summen zerl egung von n - k mi t genau k Summanden . 'Wenn der klein st e Summand 1 ist , dann kann man eine n Summanden 1 weglassen und es verbleibt eine Summen zerl egung von n - 1 in k - 1 Summanden . Das bed eutet: a(n , k) = a(n - 1, k - 1) + a(n - k , k)
(10.7)
Für die Berechnung de r a(n , k) nach Beziehung (10.7) benötig en wir die Anfangswer te : a(O,O) = l.
o.
a(n ,O)
0 für n >
a(n ,l)
1 für n > O.
a(n , k) = 0, wenn k
>n
~
o.
Es ist st ets a(n , k) = b(n , k) , denn die Rekursion en (10.5) und (10.7) sind gleich und die Anfangswerte ebe nfalls. E ine Tabelle der a(n , k) ist zugleich eine Tabelle der b(n ,m) (Tabelle 10.3): Tab. 10.4: Tabelle der a(n , k) bzw. b(n, m ) k (m)
n 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 3 1 1 2 3 4 5 7 8 10 12 14 16 19 21 24 27 4 1 1 2 3 5 6 9 11 15 18 23 27 34 39 47 5 1 1 2 3 5 7 10 13 18 23 30 37 47 57 6 1 1 2 3 5 7 11 14 20 26 35 44 58 7 1 1 2 3 5 7 11 15 21 28 38 49 8 1 1 2 3 5 7 11 15 22 29 40 9 1 1 2 3 5 7 11 15 22 30 10 1 1 2 3 5 7 11 15 22
Mit (10.1) und (10.5) bzw. (10.7) lassen sich die p(n) ber echnen .
19 20 1 9 30 54 70 71
65 52 41 30
1 10 33 64 84 90 82 70 54 42
168
10 Summenzerlegungen
10.5
Dualität
Die Beziehung a(n , k) = b( n , k) signalisiert eine Dualität der beiden Probleme. Es gibt einen einfachen und a nschaulichen Weg , die zueinander dua len Summenzerlegungen gemäß I. oder 11. (aus Abschnitt 10.4) zu bestimmen. Ab bi ldung 10.1 zeigt eine Summenzerlegung der 7 im sog . Ferrers -Diaqramm. Die Zerlegung 7 = 4 + 2 + 1 wurde in den Zeilen eingetragen. Dreht man das Diagramm um 90' od er liest die Anzahl der gefü llten Kästchen in den Spalten, dann erhä lt m an 7 = 3 + 2 + 1 + 1. 4 2
1 3
2
1
Abb. 10.1: Ferrers-Diagramm zu r Verdeutlichung der Dualität der Probleme I und 11
Die eine Zerlegung hat das maxima le Element 4 und die andere hat 4 Summanden . Zwei Summen zerl egungen, die durch diese Oper at ion aus einander hervo rgehen, nennt man konjugiert. Summenzerlegungen sind eelbetkonjuqiert, wenn das Konjugierte einer Summenzerlegung mit der Summenzerlegung übereinstimmt. Mit Hilfe der Duali t ä t lässt sich die Anza hl der "Summenzerlegungen in lauter verschiedene ungerade Summanden" a ngeben . Sie ist nämlich gleich der An za hl der selbstkonjugierten Summenzerlegungen. Man ka nn nämlich eine Bijektion zwischen beiden herstellen , die a uf der in Abbildung 10 .2 gezeigt en Idee beruht. 4
7
2
1
1 1
Abb. 10.2: Aus dem Ferrers-Diagramm einer selbstkonjugierten Summenzerlegung von
n = 8 entsteht eine Summenzerlegung mit verschiedenen ungeraden Summanden.
Ge zeigt werden Ferrers-Diagramme einer selbstkonjugierten Summenzerleg ung von n = 8 und einer Summenzerlegung von 8 in vers chiedene ungerade Summanden. Das rechte Diagra mm entsteht a us dem link en , indem man die Käst chen
169
10.6 Leere Behälter
aus Zeilen und Spalten mit eine m gem ein samen Diagon alfeld in Zeilen a nordne t. Das linke Diagramm ents teht aus dem rechten , indem man die Zeilen 'ze nt riert' und dann ent la ng der Mittellinie zum rechten 'W inkel 'knickt'. E rwähne n möchte ich auch asymptotische Formeln für die An zahl der Summen zerl egungen p(n) und die An zahl P( n) der Summen zerl egungen in lauter ver schi ed en e Summanden:
Sie stammen von Hardy und Ramanujan [31] und sind Beispi ele für viele b eachtliche und zugleich ungeheure E rgebnisse, die der geniale indische Mathem atiker Srinivasa Ramanuj an (1887-1920) gefunden hat. In [30] find et sich der Beweis.
" A symptotis che Formel" bed eutet, dass für wach sende n die prozentuale Abw eichung der Nähe ru ng vom tatsächlichen Wert gegen 0 geht. So ist z. B . p(lO) = 42 und die Nähe ru ng ergibt 48,1. Es ist p(lOO) = 190569292 und die Näherung liefert 199280893 .
10.6
Leere Behälter
Die bish erigen Üb erl egungen ga lte n Summen zerl egungen mit po sitiven Summanden . Nun noch ein Blick auf Zerl egungen in nichtnegative Summanden . Zur genauen Unte rsche idung nenne ich diese Surnmen zerlegungen" . Nun macht es keinen Sinn, nach de r Anz ahl der Sumrnenzerlegungen" einer natürlichen Zahl n zu fragen , denn schließlich kann m an durch Hinzufügen von weiteren Nu llen beliebig viele a ndere Summenzerlegungen" erzeugen . Ich will a b er die Anzahl de r Sumrnenzerlegungen" betrachten , die eine natürliche Zahl n in gen au k ni chtnegative Summanden zerlegt . Die se Anzahl nenne ich c(n, k) . Es ist
c(n , k) = a(n
+ k , k) ,
(10.8)
denn a us einer Sumrnenzerlegung" von n mi t k nicht negativen Summanden wird eine Summenzerlegung von n + k mi t k po sitiven Summanden, wenn man zu jedem Summanden 1 addiert und vice ver sa . Unmit telba r haben wir damit die Rekursion :
c(n, k) = c(n, k - 1) + c(n - k , k)
(10.9)
170
10 Summen zerlegungen
Diese Bezi ehung lässt sich nach dem ob en schon vorgeführten Muster auch direkt zeigen: Eine Sumrnenzerlegung" von n in k Summanden enthält eine Null oder enthält keine Null . Die Anzahl der Sumrnenzerlegungen" von n ohne eine Null ist gleich der Anzahl der Sumrnenzerlegungen" von n - k in k Summanden. Die Anzahl der Sumrnenzerlegungen" mit einer Null ist gleich der Anzahl der Sumrnenzerlegungen" von n in k - 1 Summanden . Die Anfangswerte für c( n , k) sind:
c(O ,k) = 1
(k
c(n,O) = 0
(n > 0)
c(l, k) = 1
(k > 0)
c(n ,l) = 1
(n > 0)
~
0)
Die erst en Werte für c(n , k) zeigt Tabelle 10.5. Tab. 10.5: Tabelle c(n,k) k
n 0 1 2 3 4 5
0
1
2
3
4
5
6
7
8
1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1 1 1 1 1 1
2 2 3 3 4 4
2 3 4 5 7 8 10
2 3 4 6 9 11 14
2 3 4 7 10 13 17
3 3 4 7 11 14 19
3 3 4 7 11 15 20
3 3 4 7 11 15 21
6 7 8
5
Aus jed er Summen zerl egung von n in weniger als k Summanden erhält man eine Summen zerlegung" von n in k Summanden, indem man die erforde rliche An zahl Nullen hinzufügt . Darum gilt
k
c(n, k) =
L a(n , i).
(10 .10)
i= l
Mit (10 .8) wird daraus k
c(n, k) =
L c(n -
i, i) .
(10 .11)
i= l
Interessanter ist nun , dass man a uch mit den c(n , k) die p(n) berechnen kann . Es gilt:
p(m) =
L n +k =m
c(n, k)
(10 .12)
171
10.7 Erzeugende Funktionen Beweis : Zur Übung überlassen .
Das b ed eutet: Die Summe der m-ten Gegendiagonalen in der Tabelle der c(n, k) (Tabelle 10.5) ist gleich der An zahl der Summenzerl egungen von m . Die Beziehung (10.8) zwische n den a(n , k) und den c(n, k) ist aufschlussreich , denn sie zeigt , wie m an et wa die Frage nach den Summenzerlegungerr' angehen kann . Mit Summenzer legung' meine ich Zerlegungen von n in Summanden, die all e mindestens 2 sind. Im nächsten Abschnitt werde ich über die erzeugenden Funktionen für die Summenzerlegungen berichten und erklären , welche zusätzlichen Aufschlüsse man durch erzeugende Funktionen über die Struktur des Problems erhält . Wer mag , kann sich vor ab selbst mit folgender Frage beschäftigen: Frage 6: Wi e viele Möglichkeiten gibt es, eine n Betrag von 1 Euro in Münzen
zu zahlen ?
10.7
Erzeugende Funktionen
D efin it io n 1 0 .6 (Erzeugende Funkt io n ) Als erzeugende Funktion eine r reellen Zahlenfolge an be zeichnet man die formale Potenzreih e 00
2..::: a n x n
(10 .13)
n =O
bzw . die durch diese Reihe in ihrem Konvergenzintervall dargestellte Funktion (falls Konvergenzradius r > 0). •
Wir wollen nun die erzeugende Funktion der p( n) und einiger a nderer Folgen bestimmen und sehen , was wir davon haben.
Sat z 1 0 .7 Die erzeugende Funktion der Anzahl der Summenzerlegungen p(n) lautet: 00
TI 1 -
i=O
1 xi
(10.14)
172
10 Summenzerlegungen
Der Herkunft, Relevanz und Nützlichkeit dieses Ergebnisses werden wir nun nachgeh en . Beim Um gang mit Poten zreih en ist es zweckmäßig, die alg ebraischen Rech enregeln von Konv erg en zfragen zu trennen . Für zwei form ale Poten zreih en
2:: 00
P :=
n
anx
und
n =O 00
definiert man eine Addition und eine Mul tiplikation: P
+ Q :=
2:: 00
(a n n=O
2::
+ bn) x n
(10.15)
2::
00
p . Q :=
c nx
n
mit
Cn
n=O
=
a ibj
(10.16)
i+j=n
Die derart defini erte Addition und die Multiplikation st imme n im Fall e konv ergenter Poten zr eih en mit den dort beweisbaren Rech enregeln üb er ein . Eine formale Poten zreih e ist eine Schreibw eise, die man ohne Rücksicht auf mögliche Konvergen z verw endet. Die formalen Poten zreih en sind nicht mehr als eine Wäscheleine, an der die Folgenglieder aufgehängt , platziert werden. In formalen Potenzreihen wird niemals ein x eingesetzt . In der form alen Potenzreihe der Folge p(n) ist der Koeffizient der n-ten Potenz der Unbestimmten x das Folgenglied p(n), d .h., der Platz von p(n) ist bei z ".
10.7.1
Die Brücke
Um eine Brücke zum Verständnis der erze ugende n Funktionen zu bauen , b etrachte ich für ein fest es m die Folge
g( n , m) := An zahl der Summen zerl egungen von n in Summanden gleich m. Für m = 1 ist für alle n g(n ,I) = 1, denn ist nur der Summand 1 erla ubt , so gibt es nur eine Möglichkeit die Zahl n als Summe (von Einse n ) darzu st ellen . Die Poten zr eih e
2:: g(n ,l)x 00
P :=
n=O
2:: x 00
n
=
n
n =O
ist für lxi< 1 konv ergent und ste llt die Funktion l~ X dar. (Hinweis: L: ~=o x n ist eine geome t rische Reih e, deren Konvergen zverhalten und Gren zwert l~ X bekannt sind. )
10.7 Erzeugende Funktionen
173
g(n ,l) hat som it die erzeugende Funktion _ 1_ . I - x
Für m = 2 ist g(n ,2) = 0 für un ger ade n und g(n ,2) = 1 für gerade n , denn es gibt kein e Möglichkeit , eine un gerade Zahl als Summe von Zweien dar zust ellen , und es gibt genau eine Möglichkeit , eine ger ade Zahl als Summe von Zweien zu schre ibe n. Die P otenzreihe
L
CXJ
P :=
n=ü
ist für
lxi<
L
L (x t
CXJ
n
g(n ,2)x =
CXJ
x
2n
2
=
n=ü
n=ü
1 konv ergent und stellt die Funktion
1!x 2
g(n ,2) hat also die erze uge nde Funktion _1_
I - x2
dar.
,
Es ist scho n zu raten , wie die erze ugende Funktion von g(n ,3) lautet , nämlich 1!X3 ' und dass g(n , m) für m > 0 die erze ugende Funktion l -~ ~ hat.
10.7.2
Über die Brücke gehen
Wir betrachten nun für feste s m folgende Folge
h(n ,2) := An zahl der Summen zerl egungen von n in Summanden klein er od er gleich 2. B ehaup t u n g : Es ist :
L
CXJ
L
CXJ
h( n ,2)x n =
n=Ü
n=Ü
Plausibilisierung von ( 10.17):
L
CXJ
g(n ,l)x n
.
g(n ,2)x n
(10.17)
n =Ü
Berechne das Produkt
(1 + x + x +x 3 +x +x 5 +x 6 +x 7 +x 8 +x 9 +x lO ) . (1+x +x +x 6 +x 8 +x 2
4
2
4
Ergebnis:
Man liest ab , dass h(7 ,2)
= 4 ist .
Tatsächlich gibt es 4 Summen zerl egungen mit Summanden 1 od er 2: 7 =2 +2 +2 +1 7 =2 + 2 +1 +1 +1 7 =2 +1 +1 +1 +1 +1 7 =1 + 1 +1 +1 +1 +1 + 1
1Ü
) .
174
10 Summen zerlegungen
Beweis von 10.17. Das Produkt I:~=og(n,l) xn . I: ~= og(n,2) x n ist eine formale P otenz reihe I: ~=o c(n )x n. Der Koeffizien t c(n ) von x n in diesem Produkt ist gleich der An zahl der Mögli chkeiten , das x n als Produkt von ver schi ed en en x-Poten zen zu erhalten. Genau die Produkte g( i ,l )x i ·g (j ,2)x j mit i+ j = n ergeb en die Poten z z " . Der Koeffizient von x n ist gleich der Summe der g(i ,l) ·g(j ,2) mit i + j = n . Folglich ist c(n) = I:i+j =n g(i ,l) . g(j,2) . Die c(n) sind wohldefiniert, denn die rech t e Summe hat nur endlich viele Summanden . D In der An schauung der Kombinatorik bedeute t diese Formel: Man erhäl t alle Summenzerlegungen von n in Summanden a us {1,2}, indem man zu einer vorgegebenen Anzahl E insen (nämlich i Einsen) die erfo rderliche Anz ahl Zweien a uffüllt. Es gib t g(i ,l) · g(n - i ,2) Summenzerlegungen mi t gen au i Einsen . Man beachte, dass g(n - i ,2) gleich 0 ist , wenn n - i eine ungerade Zahl ist .
10.7.3
Der Bauplan ist klar
Nach diesem Bauplan ist es nun leicht, die erze uge nde Funktion für die Folge
d(n)
:=
Anz ahl der Summenzerlegungen in Summanden {2,3}
a nz ugebe n . Sie lautet: 1 1 - x2
.
1 1 - x3
(10 .18)
Au ch die weiter ob en gest ellte Fr ag e 6; Wie viele Möglichkeit en gibt es, 1 E uro in Münzen zu zahlen? kann ich nun beantwo rt en. Die einsetz bare n Münzwerte sind (in Cen t) : 1,2,5 , 10,20,50, 100. Sei e(n) die An zahl der Mög lichkeiten, n Cent in Münzen zu za hlen. Die erzeugende Funktion von e( n) ist 1 1 1 - x . 1 - x2
.
1 1 - x5
.
1 1 - x lO
1
1
1 - x 20
1 - x 50
1 1 - x lO O '
(10 .19)
Gut und schön , was ist nun e(100)? Ist man nicht genauso schlau wie zuvor? Ich sage : "Schlaue r!", denn: 1.
2.
Mit erzeugenden Funktionen können viele P roblem e sehr sch nell au f die Berechnung der Koeffizienten von Potenzreihen zurückge füh rt werden . (Siehe das Problem de s Geldwechsels.) Ein einfache s Bere chnungsverfahren für die Koeffizienten ist leicht anzugeb en und zu programmier en .
10.8 Ausblick und Sch luss
175
Der Koeffizient von x lO O in der erze ugende n Funktion von e(n ) gibt die Antwort auf die Frage:
1 Euro od er 100 Cent können auf 4563 ver schi ed en e Weisen m Münzen bezahlt werden! Die Berechnung habe ich mit einem P rogramm durchgeführt , das der Leser auch selbst a usprobier en kann , siehe [33]. Die Folgenglieder werden über die erzeugende Funktion (10.19) berechnet. Dabei mü ssen mehrere Polynome bis zu eine m m aximalen Grad, der durch den zu zerlegende n Betrag b estimmt ist , multipliziert werden.
10.7.4
Zurück zu Summ enzerlegungen
Sei p(n) di e An zahl der Summen zerl egungen der natürlichen Zahl n. Die erzeugende Funktion de r p(n) lautet: 00
TI 1 -
i=O
1 xi
(10.20)
Das sollt e nun plausibel sein . Für jede gegebene Zahl n kann das unendliche Produkt auf das Produkt der Faktoren l!xi mit i ::; n einge schränkt werden . Mit dem Programm für Münzzerl egungen kann man die Anza hl der Summen zerlegungen eine r natürlichen Zahl n ber echnen : Set ze bei den Münzwerten alle Zahlen klein er od er gleich n ein , dann sind die vom Programm geliefer t en Anza hlen bis einschließlich n gen au die An zahl der Summen zerl egungen für die jeweilige Zahl. Einige ander e, in mein en Augen effekt ivere Ber echnungsmethoden war en schon weiter ob en genannt worden, z. B. (10.12) .
10.8
Ausblick und Schluss
Mit et was Geschi ck holt man aus eine r erze ugende n Funktion auch noch explizite Formeln für die Koeffizienten her aus . Für die Summen zerl egungen ist aber kein e explizite Formel bekannt . Im folgenden Kapitel über P entagonalzahlen wird no ch eine weitere, ganz unglaubliche Rekursionsb ezieh ung für die An zahl der Summen zerl egungen p(n) hergeleitet werden . Martin Wohlgemuth aka Mai roid.
11 Pentagon, Kartenhaus und Summenzerlegung
Übersicht 11.1 Pe ntagonalza hlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 11.2 Ka rt enhau s-Zahlen . . . . .. . . . . . ... . . . . . .. . . . . . ... . . . . ... . . . . . .. 178 11.3 Erstes Wunder
179
11.4 Verallgemeinert e Pent agonalz ahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 11.5 Euler und Kartenhäuser ?
180
11.6 Zweite s Wunde r
180
11.7 Nachlese
182
Abb. 11 .1: Kartenhaus, gebaut von meiner Tochter Antonia.
Was hab en P entagon alzahlen mit Kartenhäu sern zu t un? Und in welch er Weise helfen b eide bei der Frage nach den möglichen Sum menze rlegungen einer natürlichen Zahl? Mathe mat ik bringt oft un glaubliche Beziehungen zut age.
178
11 Pentagon , Kartenhaus und Summ enzerlegu ng
11.1
Pentagonalzahlen
Für die P ythagoräer war alles Zahl. Besondere Beach tung wurde den figurierten Zahlen gegeben (siehe Gärtner [36]) . Man untersuchte Dreieckzahlen , Quadratzahlen , Fünfeckzahlen usw . Aus Fünfeck- oder P entagonalza hlen lassen sich in rege lm äßiger Weise Figuren zu Fünfecken legen. Die folgende Abbildung 11.2 zeigt die ers ten 4 Pentagonalzahlen, nämlich 1, 5, 12 und 22. Mit 5 Punkten kann man ein regelmäßiges Fünfeck legen . Mit 12 Punkten kann man in der gezeigten Weise zwei Fünfecke legen.
(]
•
k= l f(k )
=1
k =2 f(k)
=5
Gi
k =4 f (k) = 22
k =3 f( k ) = 12
Abb. 11.2 : Visualisierung der ersten Pentagonalzahlen
Sei f (k ) die k-te Pentagonalzahl. Für die Pentagonalza hlen gilt die Berechnungsformel
= k. 3k - 1
(11.1 )
= 3f (k - 1) - 3 f (k - 2) + f (k - 3).
(11.2 )
f (k)
2
un d die Rekursion
f (k)
11.2
Kartenhaus-Zahlen
Kartenhaus-Zahlen hab en keinen antiken Hintergrund. Die erst en 4 KartenhausZa hlen zeigt Ab bildung 11.3. Es sei g(m) die Anzahl der Kart en (oder Bierdeckel) , die man für ein Ka rte nhaus mit m Etagen benötigt - wenn man es in der gezeigten Weise errichtet. Für ein Kartenhaus mit 5 Stockwerken , wie es meine Tochter gebaut hat (siehe Ab bi ldung (11.1)), benötigt man 40 Karten (oder Bierdeckel) . (Ri chtig vermutet : während mei ne Tocht er Karten häuser baute, ha be ich mic h der Frage gewidmet, wie viele Deckel sie für eine weitere Etage benötigt .) Sin d die P entagonalza hlen eine Spi elerei für Za hlenmyst iker? Sin d die Kartenhauszahlen eine Spie ler ei für Wirtshaustische?
179
11 .3 Erst es Wunder
/\ m = 1
g(m) = 2
JA
m =2 g(m) = 7
m= 3 g(m) = 15
m= 4 g(m) = 26
Abb. 11.3: Visua lisierung der ersten Karten hausza hlen
Für die Kartenhauszahlen gilt die Formel
g(m) =m .
3m
+1
(11.3)
2
und die Rekursion
g(m) = 3g(m - 1) - 3g(m - 2) + g(m - 3) .
11.3
(11.4)
Erstes W unde r
Für P entagonalzahlen und Kartenhaus-Zahlen gilt die gleiche Rekursion ((11.2) und (11 .4))! Und nicht nur das, die eine Folge ist in bestimmter Weise die Fortsetzung der anderen . Set zt man nämlich in (11.1) k = - m , find et man:
f( - m ) = (-m) . 3( - m) - 1 = m . 3m 2
+1
2
(11.5)
Man erh äl t die Kartenhaus-Zahlen, wenn man in der Formel der Pentagonalzahlen (11.1) neg ative Zahlen ein setz t . Die ser Zusammenhang war schon Euler bekannt . Die Zahlen g(m) werden üblicherweise als .Pentagonalzahlen zweit er Art" oder a uch als ,,negative Pentagonalzahlen" bezeichnet .
11.4
Verallgemeinerte Pentagonalzahlen
Die Folge
3n - 1
h(n) = n· - 2- ' für n = 0, ± 1, ± 2, ±3, ± 4, . . .
(11.6)
180
11 Penta gon, K art enhaus und Summ enzerlegung
beginnt : 1, 2, 5, 7, 12, 15, 22, 26, 35, 40. Man nennt sie die verallgem einerten P entagonalzahlen, engl.: generalized pentagonal numbers. Sieh e dazu auch A001 318 [371 in th e On -L ine En cyclopedi a 0/ Integer S equen ces.
11.5
Euler und Kartenhäuser?
Die Deutung der P entagonalzahlen zweite r Art als Kartenhaus-Zahlen ist mein es Wissen s ni rgendwo erwähnt . Ich weiß nicht, wie ich das a nsc haulich deuten soll. Den Formeln nach gehören die Zahlen h( n) und h ( - n ) zusamme n. Es ist h(3) = 12 un d h ( -3) = 15. Dazu gehören die Bilder (sieh e Abbildung 11.4):
h (3) = 15
h( - 3) = 12
Abb. 11.4 : V isualisierung von h(3) und h(-3)
Das eine hat so viel von eine m Fünfeck, wie das andere mit Dr eiecken zu tun hat. Vielleicht find et ein Leser eine "Dualität".
11.6
Zweites Wunder
Eu lers Ergebnis bzg l. de r Anz ahl der Su mmenzerlegungen (siehe Kapitel 10) laut et : 00
00
n= I
n=-(X)
(11.7) In de r Summe recht s st ehe n die verallgeme ine rten P entagonalzah len im Exponenten . Um zu sehe n, dass diese Formel vernünft ig ist , multip liziere m an einige Fak to reIl. Dann ste llt man fest , dass die ers ten Ex ponenten t atsächlich mit den verallgem einert en Pent agon alzahlen üb erei nstimmen. Den Beweis findet ma n z. B . in Hitz ier [351 . Die linke Seite in Euler s Pentagonalzahlen satz ist der Kehrwert der erzeuge nde n Funktion der P a rt itionszahlen bzw. der Summen zerl egungen (sieh e (10 .14).
181
11.6 Zweites Wunder Die direkte Folgerung daraus ist : Für die An zahl der Summen zerl egungen p(n) der natürlichen Zahl n gilt
f
p(n) x n = (1 - x - x 2
+ x5 + x7
_
x 12
_
x 15
+ ... )-1
(11.8)
n=1
und som it gilt auc h (11.9) Durch Vergleich der Koeffizienten der x-Poten zen in der Gleichung (11.9) find et man schließlich 1
= l +(p(l) - p(O» . x + (p(2) - p(l) - p(O» . x 2
+ (p(4) - p(3) p(3) + p(O» . x 5 + ...
+ (p(3) - p(2) - p( l» . x + (p(5) - p(4) -
3
(11.10) p(2» . x
4
und das b ed eutet:
p(l) = p(O)
+ p(O) p(3) = p(2) + p(l) p( 4) = p(3) + p(2) p(5) = p(4) + p(3) p(2) = p(l)
p(O)
In allgemei ne r Formulierung:
Satz 11 .1 (Allge m eine Rekursion fü r d ie P art it ionszahlen p(n»
Für die Partitionszahlen p(n ) gilt: 00
p(n) =
2:)
_ 1)k+1 (p(n - h(k»
+ p(n -
h( - k» )
(11.11)
k =1
Für n < 0 definiere p(n) = O. h(k) ist definiert als h(k) = k .
3k; 1 .
Anmerkung: Die hier notierte Reihe ist immer eine endliche Summe, denn a b einem ko , das groß genug ist , sind alle weiteren Summanden null. Nun st ellt sich die Frage, ob die se Formel nützlich ist , und ob sie verglichen m it den a nder en Formeln (10.6) oder (10 .12) a us Kapitel 10 einen Vorteil hat?
182
11 Pentagon, Kartenhaus und Summenzerlegung
Die Beziehungen (10 .6) und (10 .12) haben die gesuchte An zahl p(n) mit eine n Umw eg üb er andere Folgen b erechnet. Die Rekursion (11.11) ist eine Rekursion der p(n) untereinander! Wa s so unhandlich aussieht wie (11.11) , ist dennoch einfach zu verwenden . Die ersten Summanden lauten :
p(n) = p(n - 1) + p(n - 2) - p(n - 5) - p(n - 7)
+ p(n
- 12)
+ p(n
- 15) - p(n - 22) - p(n - 26)
+ ...
Man berechnet also die P artitionszahl p( n), indem m an gen au die p( n - h(k)) für 0< h(k) ::; n addiert bzw. subtrahiert , jeweils 2 mal positives Vor zeich en, dann zweim al negativ usw. Aufhören kann man, sobald die nächste ver allg em ein erte Pentagonalzahl h(k) größ er ist als n . B e is p ie l 1 1. 2 Man ber echnet p(lOO) wie folgt:
p(100) = p(99) + p(98) - p(95) - p(93)
+ p(88) + p(85) + p(65) + p(60) + p(30) + p(23) -
p(78) - p(74) p(49) - p(43) p(8) - p(O)
• In Hassen [34] ist der Algorithmus für diese Rekursion in Basic implem entiert. Er hat nur weni ge Zeilen.
11.7
Nachlese
Wa s bedeutet es, das s die Pentagonalzahlen bzw . Kartenhauszahlen die entscheid ende Roll e in der allgem ein en Rekursion für die Part it ionsz ahlen haben ? Weil diese üb errasch ende Beziehung wahr ist, kann es kein Zufall sein. Ein a nsch auliches Argument, warum es gerade die verallgem ein erten Pentagonal zahlen sein müs sen, kenne ich nicht . Mögliche rweise hatten die Pythagoräer doch recht : "Alles ist Zah l". Ma rt in Woh lgemuth aka Matro id.
12 Das Heiratsproblem
Übersicht 12.1 Kleine mathematische Hilfe für potentielle Schwiege rmüt te r . . . . . . . 183 12.2 Ein Dorf will heir aten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 12.3 Die gr aphentheoreti sche Dar stellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 12.4 Graphentheoreti sche r Algori thmus für das Problem de s gewichtsm aximalen Matchi ngs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 188 12.5 Lösungsweg mit linear er Op timierung
194
12.6 Zurück ins Dorf. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
12.1
Kleine mathematische Hilfe für potentielle Schwiegermütter
Sehr geehrte potentielle Schwiegermütter, dieser klein e B eitrag soll Ihn en helfen, die liebreizend e Tochter bzw. den werten S ohn endlich zufr iedenstellend unter die Haube zu bringen. Dabei wird nur- erklärt werden, wie man solch ein zufr iedenst ellend es Schwiegerkind find et. Die Aufgabe, das eigene Kind von dieser Wahl ans chließend zu überzeugen, obliegt Ihn en und den Fr-ücht en Ihrer Erziehung . Die Frage laut et, wie find en Sie , wert e potentielle Schwieg ermutter, aus den Unverheirat eten Ihres Dorfes den zufriedenstellendsten Partner für Ihr Kind ? Aus ein er subj ektiven Sich t ist diese Frage oftmals leicht zu beant worten. N atürlich ist der ledige Dorfarzt dem Trink erhannes vorzu ziehen; die Miiller-Ediili mit ihrer hoh en Aussteuer allen and eren Jungfern . Leider bringt eine Ehe, die nach solch subjektiven Kriteri en gestifte t wurde, oftmals N eid und Gerede im Dorf m it sich. Die positiven Eigenschaft en des Schwiegerkind es werden dann mit j ahrelan-
184
Das Heiratsproblem gern Nachbarschaftsstreit aufgewogen. Das ist natürlich nicht wünschenswert.
12.2
Ein Dorf will heiraten
Un s st ellt sich also die Aufgabe: Wie findet man das optimale Schwiegerkind und erhält gleichzeitig den Dorffrieden? Zur Lösung dieser heikl en Aufgabe schlagen wir vor, regelmäßig eine Konfer en z der potentiellen Schwi egermütter des Dorfes (kurz: Koschwi) ab zuhalten. Die Beratungen der Koschwi legen die Grundlage, um anschließend mit ein paar mathematischen Tricks festlegen zu können, wer mit wem zu verheiraten ist , um alle rel ativ glü cklich zu machen und so den Dorffrieden zu wahren. Die Koschwi hat die Aufgabe , a lle denkbaren potentiellen Ehen zwischen einem unverheirateten Mann und einer unverheirateten Frau des Dorfes zu bewerten. Die Bewertung sollte objektiv erfolgen. Um dies zu gewährleisten , ist zu Sitzungsbeginn ein Punktekatalog zu ver abschieden. Die Bewertung jedes Paares erfolgt nach diesem Katalog. Pluspunkte werden beispielsweise für sozia le Stellung, eingebrachtes Vermögen, erle rn t e Berufe, Ausbildung, Kochkünste et c. ver geb en , Minuspunkte für zu großen Altersunterschied, zu nahen Verw andtschaftsgrad und ander es mehr. Die Dorfgemeinschaft könnte auch "Liebe", "Schönheit" und "Cha rakter" bepunkten, wenn sie dafür eine n an erkannten Bewertungsmaßstab find en kann . Schli eßlich , wie immer zustande gekommen, hat j ed es Paar eine Punktzahl. Machen wir es an einem Beispiel fest. Nach der Bewertung der Koschwi kann das Ergebnis beispielsweise so aussehen wie in Tabelle 12.1.
Tab. 12.1: Präferenzentabelle, Beispiel
~ Bernd ~ Hans I Horst I Hugo ~ OUo I Peter I Anna Brit Edith
60
Franzi Moni Uta
13
-2
43
-32
13
57
-10
39
62
9
0
12
-50
28
43
12
-41
19
20
-22
13
-11
15
2
45
-11
59
60
3
65
71
21
-23
44
30
34 5
8
4
Die leeren Felder in der Tabelle zeigen an, b ei welchen Paaren sich unser e Bei spiel-Koschwi einfach keine Ehe vorstellen kann , z. B . weil die b eiden poten ti ellen Eheleute Geschwister sind od er es aus irg endwelchen ander en Gründen völlig undenkbar ist.
12.3 Die graphentheoretische Darstellung
185
W ir möchten den Dorffried en wahren, indem wir durch geschickte E hesc hließungen alle möglich st zufrie de nstelIen. Die Schwiegermütter sind zufriede n, fall s die Heir at ihres Sprösslin gs eine möglichst hoh e Punktzahl laut Tab elle bringt . Das Dorf ist zufriede n, wen n die Summe der Punktzahlen aller E hesc hließunge n möglichst hoch ist . Das heißt a ber, dass Paare mit eine r negativen Punktzahl ebe nfalls ni cht in Betracht kommen . Eine negative Punktzahl macht wed er eine Schwi egermutter glüc klich, no ch hilft eine zum Scheitern verurteilte Ehe dem Dorffried en weiter. Es ergibt sich also sinnvollerweise eine neu e modifizierte Tabelle (12.2) . Tab. 12.2: Modifizierte Präferenzentabelle
~ Bernd ~ Hans Anna Brit Edith
I Horst I Hugo
~ Otto
I Peter I
12
43
-
-
13
2
45
-
-
57
-
-
39
59
60
3
60
62
9
-
-
65
71
21
Franz i
0
12
-
19
20
-
44
30
Moni
28
43
-
-
13
-
34
-
Uta
13
-
-
-
15
5
8
4
Nach Fertigst ellung der Tabelle ist der wirklich schwierige Teil der Aufgabe der Ko schwi schon beendet . Vielleicht t rinkt man jet zt ein T ässchen Kaffee und tauscht die allern euesten Ne uigkeit en a us. Natürlich kann man a uch ein wenig üb er die Planlosigkeit der Eheschli eßungen in Nachbardö rfern herzieh en. Klüger als die war man ja schon allem al! Die Arbeit mit den Zahlen , daraus eine optimale Lösung zu b estimmen , die kann die K oschwi nun den Mat he mat ikern üb erlassen .
12.3
Die graphentheoretische Darstellung
Das in der Einleitung sp ielerisch dargest ellte Heirat sprobl em ist ein sp ezielles Ma tchingproblem . "Mat ch" kommt au s dem Englischen und bedeutet in die sem Fall "P aa r". Philip Hall (en gl. Ma thematiker, 1904-1982) zeigte 1935 im sogenannten Heirat stheo rem ; dass für das Heirat sproblem für n Männer und n Fr auen genau dann eine Lösung exist iert , wenn es zu jed er b eliebi gen Teilmenge von Männern mindest ens ebe nso viele Fr auen gibt, die eine n der Männe r dieser Teilmen ge heiraten würden (sieh e [41]). Dieses Ergebnis wird im Folgenden ab er nicht verwendet, die darin ent haltene Bedingung "gleich viele Männe r und Fr auen" wird un s aber noch beschäftigen . Für eine n Graphen G = (V, E ) mit eine r Knotenmenge V und eine r Kanten menge E defini eren wir : Ein Matching (auf deutsch : Paarung) ist eine Au swahl
186
Das Heiratsproblem
111 der Kant en von C , so dass kein e zwei Kan t en a us NI adjazent sind , d . h ., keine zwei Kant en b esit zen einen gemeinsamen Knot en . Abbild ung 12.1 zeigt eine n Graphe n mi t einem Matchi ng. Kanten im Matehing sind fet t eingezeichne t. Dieses Mat ching ist maximal, denn es deckt a lle Knoten a b und durch Hinz unahme jeder weiteren Kan t e würd e gegen die Ma t chingEige nsc haft versto ßen .
Abb. 12.1 : Ein Graph. Die fett eingezeichneten Kanten bilden ein Matching.
F ür die ModelIierung als Matehingproblem ab strahier en wir nun die Unverheirateten unseres Dorfes zu Kno ten eines Gra phen . Eine Ka nte symbo lisiert die De nkbarke it der Eheschließ ung und jede Ka nte ist mit einem Gewicht verseh en . F ür unser Heirat sp ro blem sind die Gewichte die von de r K oschwi zu gesp ro chenen Punk tzahlen fü r ein mögliche s P aar . Der so ent st andene Graph gehört einer b esonder en Sorte von Gr aphen an , denn unsere Knot en können wir in zwei Kl assen aufteilen (Männlein und Weiblein) . Jede Kant e verbindet nur Knoten verschied en er Klassen . Ei nen Graphen mi t dieser E igensc haft nennt man bipartiten Graph en:
Abb. 12.2: Bipartiter Graph mit Kantengewichten und einem Matching
Für unser Beispi el mi t der P räfere nz t ab elle 12.2 ist die Darst ellung a uf Grund der nicht ga nz geringen Kno t en anza hl do ch et was unübersichtlich. Deswegen gibt Ab bildung 12.2 ein et was klein er es Beispi el eines bipartiten Gr aphen mi t
12.3 Die graphentheoretische Darstellu ng
187
Kantengewichten . Darin ist ein Matehing eingeze ichne t (fette Kanten) . Dieses Matehing ist nicht maximal, denn es besteht nur aus 2 Kanten und es gibt hier auch Matchings mit 3 Kanten . Obwohl das eingeze ichnete Matehing nicht maximal ist , kann es nicht einfach durch Hin zunahme einer anderen Kante zu einem maximalen Matehing erweit ert werden. Dennoch kann der Leser sich erlich recht schnell ein maximales Matehing selbst find en . Das eingeze ichnete Matehing ist ab er gewichtsmaximal. Die Summe der Gewichte der Kanten dies es Matchings ist 51. Die maximalen, aus 3 Kanten bestehenden Matchings haben kleineres Gesamtgewicht. Der Leser üb erz euge sich auch davon selbst . Auf einem solchen Graphen suchen wir nun ein gewichtsmaximales Matehing. Die Bipartität garantiert un s P aare aus Mann und Fr au. Die Eigenschaften eines Matchings ga rantieren uns , dass wir niemanden doppelt verheiraten. Jedes Matehing beschreibt also einen zulässigen ,,verheiratungsplan". In der Literatur wird die Suche nach einem gewichtsmaximalen Matehing auf einem bipartiten Graphen oft durch das Beispiel Arbeiter-Maschine illu striert . Jeder Arbeiter (=die erste Knotenklasse) hat gewisse Erfahrungen (=Kantengewichte) mit der Bedienung einer Maschine (=andere Knotenklasse). Welcher Arbeiter sollt e jetzt welche Maschine bedienen? Oftmals ist man nicht auf der Suche nach eine m gewichtsmaximalen Matching , sondern einfach nach einem maximalen Matching: Man sucht die maximale Kantenanzahl, die ein Matehing haben kann . Das ist aber kein gänzlich anderes Problem. Setzt man alle Kantengewichte auf 1, liefert das gewichtsmaximale Matehing ein maximales Matehing und der Wert des gewichtsmaximalen Matchings verrät , wie viele Kanten ein maximales Matching bilden. Nicht garantiert ist , dass ein gewichtsm aximales Matehing auch maximal ist . Das zeigt schon das Beispiel in Abbildung 12.2. Für unser Dorffriedensoptimum suchen wir ein gewichtsmaximales Matching. Es werden nun zwei Lösungswege vorgestellt. Der erste Lösungsweg ist ein graphentheoretischer Algorithmus . Das ist naheliegend b ei eine r graphentheoretisch formulierten Aufgabenstellung. Der zweite Lösungsweg ist der eigentliche Grund für dies en Beitrag. Die Lösung kann auch mit lin earer Optimierung gefunden werden. Als der Autor erstmals damit in Berührung kam, war er ganz fasziniert davon - vielleicht kann der Leser das am Ende nachvollziehen.
188
12.4
Das Heirat sproblem
Graphentheoretischer Algorithmus für das Problem des gewichtsmaximalen Matchings
Um besser arbeiten zu können, müssen wir jetzt ein wenig Notation einführen. Gegeben sind ein bipartiter Graph C = (VI + Vz , E) mit den beiden (disjunkten) Knotenklassen VI und Vz und der Kantenmenge E <;;; VI X Vz sowie eine Gewichtsfunktion w : E -+ lE.+ . Gesucht wird ein gewichtsmaximales Matehing NI. Wir erweitern unseren Graphen C nun, denn wir möchten erreichen , dass lVI I = IVz l = n ist . Diese Bedingung kann durch Einführung neuer, künstlicher K not en sichergestellt werden. Des Weiteren forde rn wir, dass ein vollständiger bipart it er Graph vorli egt , d . h ., jeder Knot en aus VI ist mit all en K not en aus Vz ver bunden (und damit auch jeder Knot en aus Vz mit a llen aus VI). Um diese Bedingung zu erfü llen , wer den gege benenfalls ne ue kü nstliche Ka nt en eingeführt und mit einern Kantengewicht von 0 versehen . Den so entstandenen Graphen ne nnen wir Cl. Man m uss sich überlegen, dass ein gewichtsmaximales Mat ching auf dem erweiterten G raphen Cl und ein gesuchtes Mat ching auf dem Originalgraphen C einander entsprechen, da die neuen O-Kantengewichte das Gesamtgewicht nicht verä ndern . Dafür überlegt man sich einerseits, dass in Cl jedes gewichtsmaximale Matchi ng M; von C durch Hinzunahme von Kanten mit Gewicht 0 immer zu einem gewichtsmaximalen Matehing Mz von Cl ergänzt werden kann . Das Gewicht b eider Matchings ist gleich . Da in Cl nur Kanten mit Gewicht 0 hinzugenommen worden sein können, ist NIz gewic htsmaximal auch in Cl . Das Matching M', kann in Cl sogar immer zu einem maximalen Matching ergänzt werden, de nn Cl ist ein vollständige r bi partiter Graph . Andererseits ergibt ein gewichtsmaximales Matehing Mz von Cl auch ein gewichtsmaximales Matching M; von C, denn man lässt die Kanten weg , die ergänzt worden sind. Deren Gewicht ist O. Für unser Heiratsproblem heißt das nichts anderes, als dass wir bei gleicher Anzahl n von Männern und Frauen im vollständigen Heiratsplan auch n Paare haben. War es notwendig, künstliche Knoten oder Kanten einzuführen, dann bedeutet die P aarung mit einem solchen Knoten oder über eine solche Kante leider die Ehelosigkeit. Bevor wir zum eigentlichen Algorithmus kommen können , müssen wir noch et was rumbastein. Es ist notwendig, aus unserem Maximierungsproblem ein Minimierungsproblem zu machen. Das erreichen wir, indem wir die Gewichte manipulieren: Ist v das größte Gewicht einer Kante im Graphen Cl , so ersetzen wir für jede Kante k von Cl ihr ursprüngliches Gewicht w(k) durch w/(k) := v - w(k).
Graphentheore tischer Aigorithmus
189
E in gewichtsm inimales Matehing im so modifizier t en Graphen C ' liefer t uns das ges uchte gewichtsmaximale Matehing in C , denn d urch die Tr ansformation der Gewi cht e er hält man neu e nichtnegative Gewicht e, wob ei a us dem grö ßten Gewi cht das kleinst e gewor de n ist usw. So wie unser Gr aph C nun zum Graphen C' erwe itert ist , ist er ein vollständiger bipart it er Graph mi t gleich vielen Knot en in den beiden Knot enklassen . Zur Repräsen t a ti on des Graphen C' und seiner modifizier t en Gewi cht e verwende n wir eine qu adrati sche Matrix , der en E inträge die Kantengewi chte w ' (k) sind . 'Wenn wir im Folge nde n eine solche Ma trix b ezeichnen wollen , nennen wir sie W .
W ist die Knoten-Knoten-Inzidenzmatrix m it de n Kantengewi cht en . W stellt unser P roblem dar. Die Lösung ist ein Ma t ching. E in Matehing M , das fü r n konkret e P aare (Frau i mi t Mann j ) st eht , lässt sich a ls eine P ermut a tionsm a trix X d arst ellen : X
~ (x'j)",j~" . .
,n) ,
wobei X; j
~ {~
für (i, j ) E M sons t
Am Besten ist es wohl, wir vers uc hen das an unserem Bei sp iel nachz uvollziehen.
12.4.1
Beispiel: Unser Dorf
In unserem Do rf leben ac ht unverheira tet e Mä nne r , aller di ngs nur sechs Frauen . W ir füh re n a lso zwei künstliche , "weibliche" Kno ten ein. Den bipa rt it en Graphen m ach en wir nun noch vollständi g, indem wir die von der K oschiui nicht vorgeseh en en Paa rungen mi t 0 be wert en. Es ergibt sich analog zur Tab elle 12.2 die folgende Gewi cht sm at rix . 12
43
0
0
13
2
45
0
0
57
0
0
39
59
60
3
60
62
9
0
0
6.5
71
21
0
12
0
19
20
0
44
30
28
43
0
0
13
0
34
0
13
0
0
0
15
5
8
4
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Die größte P unktzahl haben Edit h und Otto m it 71 P unkten erreicht , a lso ist v = 71. Um a uf unser Minimierungsproblem zu t ransfor miere n, werd en nun a lle Gewi chte j eweils von 71 subt rahiert.
190
Das Heirat sproblem
Wir erhalten die im vorigen Abschnitt beschriebene Matrix:
w=
59
28
71
71
58
69
26
71
71
14
71
71
32
12
11
68
11
9
62
71
71
6
0
50
71
59
71
52
51
71
27
41
43
28
71
71
58
71
37
71
58
71
71
71
56
66
63
67
71
71
71
71
71
71
71
71
71
71
71
71
71
71
71
71
Wir suchen ein optimales Matching, d . h ., es sollen Zuordnungen getroffen werden fü r Paare , die vor den Traualtar treten sollen . Was können wir mit dies er Matrix nun anfangen?
12.4.2
Suche em optimales Matching
In der zuletzt aufgestellten Matrix gehört jede Zeile zu einer Frau und jed e Spalte steht für einen Mann. Wählt man ein Matrixelement aus, ist damit auch ein Brautpaar ausgewählt . Natürlich d arf a us jeder Zeile und aus jeder Spalte nur je ein Element gewählt werden. Eine Auswahl, die diese Bedingung erfüllt , soll Diagonale der Länge n heißen. Es gibt n! solche Diagonalen. Für n = 8 macht das 40320 Mög lichkeiten. Unter a ll diesen Kombinationsmöglichkeiten suchen wir diejenige, bei der die Summe der ausgewählten Elemente minimal ist. Ein gewichtsminimales Mat ehing ist unser Ziel und optimal wäre es, wenn es eines gäbe, das nur Kanten mit Gewicht Null ent hä lt . Und dies können wir a uch tatsächlich erreiche n, denn es gilt die praktische Eigenschaft, dass Addition einer Konstanten p zu jedem Element eine r Zeile od er zu j edem eine r Spalte das optimale Mat ehing nicht verändert, son dern nur dessen Gewicht um p erhöht. Wird nämlich für eine b eliebi ge Zahl p (für die wir p E lII? vorauss etzen können, obwohl wir dies e Eigenschaft tatsächlich nur für p E Z verwenden wer den) zu jed em El em ent der h-t en Zeile der Matrix W der Wert p addiert , so ergibt sich eine ne ue Mat rix W' mit Einträgen W;j = W ij fü r all e i i- h sowie Whj = Whj + p , und fü r das Gesamtgewicht eine s b eliebi gen Matchings NI, welch es von der P er mutationsmatrix X repräsentiert werd e, gilt
w' (M )
=2..: i, j
W;j X ij
=2..: i, j
W ij X ij
+ P 2..: X h j j
=w(M) + p.
Graphentheoretischer Aigorithmus
191
Die Hauptidee unseres Lösungsalgorithmus ist die Ausnutzung dieser Eigenschaft: Durch Subtraktion in eine r Zeile bzw . Spalte werden Nullen erzeugt. Dabei ist darauf zu achten , dass keine Einträge negativ werden . Dies wird solange wiederholt , bi s eine Diagonale der Länge n ausgewählt werden kann , für deren El emente das Gewicht j eweils 0 ist . Di e zugehörigen Paarungen bilden offensichtlich das gesuchte Matehing minimalen Gewichtes . Wenden wir das au f unsere Matrix W a n. Zunächst ziehen wir von allen Ele menten einer Zeile h das jeweilige Zeilenminimum Ph ab . Also konkret PI
= 26,
PZ
= 11,
P3
= 0,
P4
= 27,
P5
= 28,
P6
= 56,
P7
= Ps = 7l.
Damit ergibt sich die neue Matrix:
33
2
45 45 32 43 0 45
60
3
60 60 21
1
0 57
11
9
62 71 71
6
0 50
44 32 44 25 24 44 0
14
15
0
43
2
15 15
15
0
10 7 11
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
43 43 30 43 9
Nun könnte man ebenfall s von den Spalten einen entsprechenden Wert qh abziehen. Da sich a ber in jeder Sp alte schon bereits eine 0 befindet , ist qh stets O. Damit kommen wir al so nicht weiter . W ir benötigen eine neue Idee. Halten wir zunächst einmal fest , dass man in unser er aktuellen Matrix eine O-Diagonale höchstens der Länge 5 find en kann , z. B. durch W]7 , W5Z, W65 , W71 , W S 3 . Es gilt : Falls eine Matrix ein e O-Diagonale der maximalen Länge m hat , existi eren r Zeilen und s Spalten mit r + s = m , so dass all e (!) Nullen der Matrix durch diese Zeilen und Spalten abgedeckt werden . Der Beweis dafür soll hier nur kurz skizziert werden. In der Graphentheorie lernt man , dass die Größe des minimalen Tr ägers gleich der Größe eines maximalen Matchings eines Graphen ist. (Anmerkung: Eine Menge U E V ist ein Träger de s Graphen G , falls jede Kante aus G mit einem Knoten aus U inzident ist . In einem bipartiten Graphen ist z. B . jede Knotenklasse ein Tr äger.) Wir konstruieren eine n Hilfsgraphen , der all e Knoten des ursprünglichen Graphen ent hält und Kanten dort , wo der ents pre che n de Matrixeintrag 0 ist . Ein Mat ehing in diesem Graphen ent spricht eine r O-Diagonalen in der Matrix, ein Träger ent spricht eine r Auswahl von Zeilen und Spalten.
Das Heiratsproblem
192
In unserem Beispiel decken beispielsweise Zeilen 5, 7 und 8 sowie di e Spalten 5 und 7 all e Nullen der Matrix. Da wir noch kein e vollständige O-Diagonale haben, können durch di e ausgewählten Zeilen und Spalten nicht alle Matrixelemente abgedeckt werden. Sei w das kleinste nicht abgedeckte Matrixelement. Wir subtrahieren w von all en Elementen nicht abgedeckter Zeilen , anschließend addieren wir 1/) zu allen abgedeckten Spalten. Dieses Subtrahieren und Addieren verändert ein optimales Matehing wiederum nicht , nur sein Gewicht. Für die neuen Matrixelemente W~j gilt: W
W ij
ist unbedeckt
+W
Wij
von Zeile und Spalte bedeckt
Wij -
W~j: =
Wij {
sonst
W ij
Nach dieser Transformation liegt also wiederum eine Matrix mit nichtnegativen Einträgen vor. Insgesamt gibt es r . s doppelt bedeckte und n 2 - n . (r + s) + r . s gar nicht bedeckte Einträge. Sei W g := 2: i ,j Wij das Gesamtgewicht der alten Matrix und W~ analog das der neuen, dann gilt mit den Vorüberlegungen
W; - W g = (eJ)w - (n 2 da ja laut Annahme r
+s < n
-
n(e
+ J) + eJ)w
=
(n( e + J) - n 2)w < 0,
ist.
Das Gesamtgewicht hat also abgenommen , es bleibt aber stets nichtnegativ. Da alle Matrixeinträge ganzzahlig sind, folgt daraus, dass dieses Verfahren, endlich oft angewendet, schließlich zum Ziel führt und eine O-Diagonale der Länge n erzeugt. Was heißt das für unsere Beispielmatrix? Wir überdecken di e Zeilen 5, 7, 8 und die Spalten 5 und 7. In der Restmatrix befinden sich keine Nullen.
33 60 11
44
Xi: 2
>0: >0:
2
45 45 ~ 43 >0: 45
)( 0
>0: 57 62 71 )( 6 >0: 50 9 32 44 25 X 44 >0: 14 >0: :;W::;W::ßQ:;W: )( :;w: 15 15 15 >0: 10 ';J( 11 >0: >0: >0: >0: >0: >0: >0: >0: >0: >0: >0: >0: >0: >0: 3
60 60
Das kleinste unbedeckte Element ist
w=
W26
= 1.
Graphenth eoret ischer Algorith mus
193
Durch Subtraktion der 1 von allen unbedeckten Zeilen und Addition zu allen bedeckten Spalten erhält man eine neu e Matrix:
32
1
44 44 32 42
0
44
59
2
59 59 21
0
0
56
10
8
61 70 71
,5
0
49
43 31 43 24 24 43
0
13
43 43 31 43 10 43
1,5
0
1
14 14 14
0
9
7
10
0
0
0
0
1
0
1
0
0
0
0
0
1
0
1
0
Im nächsten Schrit t kann man nun zusätzlich die zweite Zeile oder die sechste Spalte a b decken. Anders gesagt, man hat nun schon eine O-Diagonale der Länge 6 innerhalb der Matrix. Man kommt nach zwei weiteren It erationen zum Ziel, falls man die Spalten 2, 5 un d 6 und die Zeilen 6, 7 und 8 abdeckt und w = W 31 = 10 wählt . Im let zten Schritt lass en sich die Spalt en 1, 2, 5, 6, 7 und die Zeilen 7 un d 8 abdecken und w = W48 = 3 wäh len . Man erhäl t :
@
31
0
43
,5
0
36
33 31 30 11 14 43
@
5
@
0
30 30 21 43
10
30
1
24
17
7
3
13
@
19
4
13 14
0
3
13
0
4
13 14
0
22
1
31 31 22 42
49
2
46 46 11
@
8
48 57 61
@
11 11 0
@
@
Das Problem ist gelöst , und wir geb en hie rmit folgende Vermählungen bekannt : Edith und Bernd (60 Punkte) Moni und Fred (43 Punkte) Ut a und Hugo (15 Punkte) Brit und Kar! (59 Punkte) Anna und O tto (45 Punkte) Fr anzi und Peter (30 Punkte) Die Gesamtpunktzahl b eträgt 252. Ha ns un d Horst geh en leider leer aus . Sie werden J unggesellen bleib en .
194
12.4.3
Das Heirat sproblem
Der graphentheoretische Algorithmus kurz und knapp
Gegeben sei eine n x n-M atrix der Gewichte
W ij E
No.
Erstens
Subtrahiere für i = 1, . . . , n von allen Elemente n der i-t en Zeile das kleinste Elemen t P i = min(j , W i j ) dieser Zeile . Subtrahiere für j = 1, . . . , n von allen E lement en de r j-ten Sp al te das kleinste Element qj = min (i , W ij ) dieser Sp al te.
Zweitens
Su che eine minimale Üb erdeckung der Nu llen, das ist eine Ausw ahl der Zeilen und Spalten , so dass alle Nullen der Matrix darin ent halte n sind. Hat die Üb erdeckung weniger als n Zeilen und Sp alten, gehe zu Dritten s, sons t zu Viert en s.
D rittens
Sei 11) der klein st e unbed eckte Eint rag. Subtrahier e 11) von allen unbedeckten Einträg en , addiere 11) zu Einträgen , die von eine r Zeile und eine r Spalte bed eckt werden . Geh e zu Zweitens .
Viertens
Bestimme O-Diagon ale der Länge n .
12.5
Lösungsweg mit linearer Optimierung
12 .5 .1
Ein schönerer Lösungsweg?
Schönheit ist rela t iv. Vie lleicht ist dieser Lösu ngsweg nicht schöner, a be r es ist inter essant und für den einen od er a nde ren sogar übe rrasche nd , dass es üb erhaupt so funkti oni ert . Un ser Hei ratsproblem ist op t im ierungst echnisch gesehen ein Maximie rungsproblem. W ir mö chte n schließlich das Gl ück des Dorfes maximieren . Vielleicht geling t es uns ja, das Ganze als 0815-0ptimierungsaufgabe darzust ellen, d . h. eine schön e Zielfunkti on , ein paar nette Neb enbedingungen , alles möglichst lin ear. Wenn uns das gelingt , haben wir die Hilfsmittel der linearen Optimierung zur Verfügung , um das Problem zu lösen . Und es geht tatsächli ch , ist sogar recht unkompliziert, wie wir im Folgenden sehe n werden .
12 .5.2
Ansatz mit linearer Optimierung
Die übli che Form einer linear en Optimi erungsaufgab e (LP ) lautet: max w T x
(LP)
x
A x ::; b,
x ~ 0
195
12.5 Lösungsweg mit linearer Optimierung
W ir werde n unser e Aufgaben st ellung nun als solches (LP) formulier en und erklären dafür , wie A, bund w sich a us dem Problem heraus ergebe n . Das so formulierte (LP) können wir dann mi t dem a us der Optimierung bekannten Sim plexalgorit hm us lösen . Wir stellen uns vor , wir hab en a lle Kanten des biparti ten Graphen , der a us der Koschwi hervor geh t , von 1 bis m nummeri ert. Das heißt, jed e potentiell denkbar e E heschließung b ekommt eine Num me r zwische n 1 und m . x ist nun ein m-dimen sionale r Vekt or , de ssen Komponenten nur die Werte oder 1 annehmen sollen , a lso x E {O,l}In. Der Wert wird a ngenom me n, wenn wir die entsprechende Kante nicht in unser Ma tehing aufnehmen , der Wer t 1, wenn dieses P aa r den Segen der Kos chwi erhäl t.
°
°
Mom ent , das geh t doch nicht! Wir sch ränken unsere zul ässigen Lösungen von vornherein nur a uf ganzzahlige Werte ein . Das ist etwas, was der Simplex algorithmus nicht ver sp richt . Wir können uns zwar wünschen , dass unsere Optimallö sung ganzzahlig sein soll, ab er der Simplexalgorithmus liefert uns i. A . irgendeine reelle, nicht notwendig ganzzahlige Lösung. Das Optimum unter den ganzzah ligen zulässigen Lösungen zu find en , könnte darum schwieriger sein und nicht so billig, wie wir es uns er hofft haben . Ver schi eb en wir dieses Problem auf sp äter. Ich versprech e (und das ist das Übe rraschende an diesem Weg) , alle s wir d sich in Wohlgefallen auflösen. Modellieren wir also weiter.
12.5.3
Formulierung der konkreten linearen Optimierungsaufgabe
Der Vektor w E IRIn ver sammelt die Kantengewi chte, d . h . die Punktzahlen , die die Koschwi vergeben hat . Die oben geforderten E igensc haft en unseres Lösungsvektors x vorausgesetzt , be schreibt die Zielfunktion das Gewicht de s Matchings - eben die Summe der Gewichte der Kanten , die das Matehing bilden. Angenommen unser bipartiter Graph be steht a us n Knoten, d . h ., wir haben n Unverheiratet e im Dorf. Die n x m- Matrix Knoten i gehört zu Kante j son st heißt Knot en-Kanten-Inzidenzmatrix des Graphen . Dabei geh en wir davon aus , dass wied erum all e Knoten von 1 bi s n durchnummeri ert sind. Übe rle gen wir uns, was passiert , wenn wir nun A und x multiplizier en . Es wird ein n-elementiger Sp al tenvektor en ts tehen. Bei spielsweise ist das erste E lem ent die ses Vektors das Produkt a us er st er Zeile de r Matrix A und dem
196
Das Heiratsproblem
Vektor x . Die erste Zeile von A "gehört" zum ersten Knoten , dies e Zeile besteht aus Einsen und Nullen , je nachdem ob der erste Knoten zur ent spreche nde n Kante gehört od er nicht . Machen wir ein einfaches Beispiel für das Produkt ein er Matrixzeile mit dem Vektor x :
1
(1
0 1 0) .
1 0
= 1+ 0+ 0+ 0= 1
0 Wir erhalten einen Summanden 1, falls der Knoten zur akt uellen Kante gehört und die Kante ins Mate hing aufgenommen wird ; eine Null erhält man in allen ander en Fällen , d . h ., falls die Kante au sgewählt wird , ab er der Knoten gar nicht zur aktuellen Kante gehört, od er falls zwar der Knoten zur Kante gehört , ab er diese Kante kommt nicht in s Matching, od er falls die Kante nicht ausgewählt wird und der Knoten ihr au ch nicht angehört. Da wir ein Matehing su chen , heißt das ab er au ch, dass unser Produkt aus Matrixzeile und x-Vektor nur 0 od er 1 ergebe n darf. Ist das Ergebnis größer , b efind en sich mehrer e Kanten in der Au swahl, die von ein und demselb en Knoten a usgehen, damit liegt a ber kein Matehing mehr vor . Folglich ist b ein Vektor, der komplett a us Einsen besteht. Damit sind alle Komponenten des linearen Programms erklä rt. Die Neb enbedingungen ste llen sich er , dass ein Matehing vorli egt, falls x a ußerde m ganzzahlig ist ; die Zielfunktion beschreibt das zu maximierende Gewicht des Matchings.
Das lin eare Optimierungsproblem (LPH) zur Bestimmung eines gewichtsmaximalen Matchings für das Heiratsproblem lautet: max w T x x
Ax
:s;
(LPH)
e
x ~o
Es ist A die Knot en-Kanten-Inzidenzmatrix des bipartiten Graphen C, der n Knoten und m Kanten hat , welch e jeweils von 1, ... , n bzw. 1, ... , m nummeri ert sind . w ist der Vektor der m Kantengewichte. e ist ein Vektor der genau n Einsen ent hält .
Es bleibt die Frage, warum die Simplexmethode nur ganzzahlige Lösungen für die Optimierungsaufgabe (LP H) erzeugt .
197
12.5 Lösungsweg mit linearer Optimierung
Das ist ni cht sofort einz usehe n, hängt ab er damit zusam me n , dass die Knoten Kanten-Inzid en zm atrix eines bipartiten Graphen eine sehr spez ielle Struktur hat . Wir mü ssen dazu etwas weiter au shol en .
12.5.4
Ganzzahlige Lösungen
Unimodularität
D e fin it io n 12.1 (unimodular) Eine Matrix A E Z m x n mit vollem Zeilenrang heißt unimodular , fall s die Determinante jeder a us m linear un abhän gigen Sp al ten be stehenden Submat rix be tragsm äßig glei ch 1 ist . •
Anmerkung: Unimodula r wird oft nur für qu adrati sche Matrizen de finie rt , so z. B. in Schrij ver [40]. Hier erfolgt die Definition für m x n-Matrizen.
Satz 12 .2 Sei A E Z m x m regulär. Dann ist A - 1 b für alle b E Z m ganzzahlig gen au dann , wenn A unimodular ist .
B eweis:
,,::::}": Zu zeigen ist , dass die Determinante von A b etragsm äßi g 1 ist.
Sei e; ein m -dimensionaler Vektor , de ssen i-te Komponente 1, alle anderen Komponenten 0 sind. A - lei liefer t die i-te Sp al te von A - I und ist laut Voraussetzung ganzzahlig, som it ist A - I eine ganzzahlige Matrix. Des Weiter en gilt 1 = det I = det A -det A - 1 . Da die Determinanten ganzzahliger Matrizen ganzzahlig sind , mu ss die Det erminante von A (und a uch die von A - I ) betragsmäßig 1 sein . ,,~" :
Die Cramer sche Regel liefert sofort die Ganzzahligkeit .
Satz 12.3 A E Zm x n habe vollen Zeilenrang und es sei b E Z m . Alle zulässigen Ba sislösung en von {x ?: 0 : A x dann , wenn A unim odular ist .
= b} sind ganzzahlig gen au
o
198
Das Heiratsproblem ,,=?" : Wir mü ssen zeigen , dass A unimodular ist.
Beweis:
Sei B eine beliebige Basis von A , dann genügt es wegen Satz 12.2 zu zeigen , dass AB - 1 b für a lle ga nzz ahligen b ganzzahlig ist . Dabei ist AB die quadratische Matrix, die au s den Spalten , die in B sind, b est eh t. Sei a lso
s « zm. Wir wählen c E zm so , dass c +
Dann ist
b=
A B(c + (A B) -lb)
=
(A B ) - l b ?: O.
A BC + b E Zm .
Setzen wir XB := c + (A B) -lb und XN = 0, dann ist ii: = (XB , XN ) zulässige Basislösung von { x ?: 0 : A x = b}. Also ist
x nach
Vorau ssetzung ganzzahlig und damit auc h (A B) -lb
x eine mi t x =
=
XB -
C.
,,{=": Ist A unimodular , b E Z m und
zul äs sige Basislösung von {x ?: 0 :
A x = b} , dann gibt es ein e Basis B
(XB , XN ) = ( (A B) -lb ,O).
Nach Sa tz 12.2 ist XB ganzzahlig. Daraus folgt
xE
Zn .
o
Wir haben nachgewiesen , dass, falls A unimodular ist, die Basislösungen de s Systems A x = b für ganzzahlige b ganzzahlig sind . Das ist ja schon etwas. Es gib t aber noch zwei klein e Haken . Zum einen wissen wir noch nicht , ob unsere Knoten-Kanten-Inzidenzmatrix irgendetw as mit Unimodularität zu tun hat , zum a ndere n t reten in unser em Matehing-Problern al s Ne be nbe dingunge n keine Gleichungen , sonde rn Ung leichungen auf. Wenden wir uns dem zwei ten Haken zuerst zu .
Schlupfvariablen De r Simplexalgorithmus verl angt Gleichungsnebenbedingungen oder einfache Ungleichungsbedingungen in Form von Vorzeichenbesch ränkungen der Variablen. Au s allgemeinen Ungleichungen werden Gleichungen durch Einführen von Schlupfvariablen s. Au s A x
~
b entsteht a lso ein neues System
mit der Vorzeichenbeschränkung s ?: O.
199
12.5 Lösungsweg mit linearer Optimierung
Totale Unimodularität Na ch Satz 12.3 muss (A ,1) unimodular sein, damit die ses System nur ganzzahlige Basislösungen hat. Wa s bedeutet nun die Unimodularität der erweiterten Matrix (A ,1)7 Mit Hilfe des Laplaceschen Entwicklungssatzes kann man leicht zeigen , dass die Determinante jeder qu adratischen Untermatrix von A, gleich welch er Dimen sion , den Wert 0, 1 od er - 1 haben mu ss. Das ist offensichtlich eine stärker e Forderung und Anlass für eine weit ere Defin ition.
D efin it io n 12.4 (total unimodular) Eine Matrix A E Z m x n heißt total unimodular , wenn jede quadratische Untermatrix die Determinante 0, 1 oder - 1 hat . •
Eine leicht einzusehe nde Folgerung ist, dass eine total unimodulare Matrix A E {0,1, _ l }m x n sein muss . Des Weiteren gilt auch: A ist total uni modular genau dann , wenn (A, 1) uni modular ist . Diese Folgerung unter Verwendung des Entwicklungssatzes und mi t Induktion zu bewiesen, wird dem Leser überlassen . J etzt kommt der Knackpunkt Nummer 1:
Satz 12.5 (Satz von Hoffman und Kruskal) Sei A E Z m x n total unimodular und b E Z m. Dann sind alle (optimalen) Basislösungen von max c'» unter den Nebenbedingungen Ax ::; b, x ~ x ganzzahlig.
°
~b
Beweis:
Die Neb enbedingungen sind äquivalent zu (A , I). ( :)
mit x , s
0. (A , I) ist aufgrund der vorangegangen en Bem erkungen unimodular.
~
Wegen Satz 12.3 sind die Basislösungen des neu en Optimierungsproblem s mit den Variablen x und s ganzzahlig, und der x-Anteil ist optimal für das Ausgangsproblem . D Wir sind fast fertig . Uns fehlt noch ein einfacher Weg , um herauszufinden, ob unsere Inzidenzmatrix total unimodular ist. Es ist nämlich unpraktisch, für eine Matrix die Determinanten aller qu adratischen Submatrizen nachzuprüfen . Abhilfe schafft folgender Satz , der hier unbewiesen bleiben soll.
200
Das Heiratsproblem
Satz 12.6 (Satz von Heller und Tompkins) Sei A E {O,1, - 1}mX n mit höchst ens zwei von Null verschieden en Einträgen pro Spalt e.
A ist genau dann total unimodular. wenn sich die Zeilen von A in zwei Kla ssen einteilen lassen, so dass zwei Zeilen, die in einer Spalt e beide eine +1 oder beide eine - 1 haben, zur gleichen Kla sse gehören und zwei Zeilen, von denen die eine in einer Spalt e eine +1 und die and ere in der' gleichen Spalt e eine - 1 hat, zu versc hiedenen Kla ssen gehören,
Man üb er zeugt sich leicht , das s unsere Inzidenzma trix die se Bedingung erfüllt . Die Spalten de r Ma t rix sym bolisier en j eweils eine Kante . An gen au zwei Stellen jeder Sp al te steht eine 1, sonst Nullen. Alle Zeilen lassen sich a lso in die er ste Klasse einordnen.
12.6
Zurück ins Dorf
Wenden wir die ses Verfahren auf unser Beispieldorf a n. Wir nummerieren zunächst die Knoten (=die Unverheirateten) von 1 bis 14 und die Kanten (=potentielle P aarungen) von 1 bi s 30 (wie in Tabelle 12.3) :
Tab. 12.3: Präferenzentabelle mit Nummerierung der ' Knoten' und ' Kanten'
Anna
Bernd
Fred
Hans
Horst
Hugo
Kar!
OUo
Pet er
7
8
9
10
11
12
13
14
12
43
-
-
13
2
45
-
3
4
5
-
-
39
59
60
3
7
8
9
10
-
-
65
71
21
14
15
16
-
44
30
20
21
34
-
1
1
2
Brit
-
57
2
6
Edith
60
62
9
3
11
12
13
-
12
-
Franzi
17
4
Moni
28
43
5
22
23
Uta
13
-
6
26
-
19
20
18
19
-
13
-
25
24 -
-
15
5
8
4
27
28
29
30
Damit erg ibt sich die folgende ganz au sführlich a ufgesc hriebe ne Gest alt für das lin eare Programm:
201
12.6 Zurück ins Dorf
+ 43x 2 + 13 x 3 + 2X4 + 45 x5 + .57x 6 + 39x 7 + 59x8 + 60 X9 + 3X lO + 60xl1 + 62x12 + 9X13 + 6 5x14 + 71 x1 5 + 21 x16 + 12x17 + 19x18 + 20X19 + 44 x2 0 + 30 X21 + 28 x 22 + 43x23 + 13x 24 + 34x25 + 13x26 + 1.5X27 + 5X28 + 8X29 + 4 X30
max 12 x l
1 0 0 0 0 0 1 0 0 0 0 0 0 0
1 0 0 0 0 0 0 1 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 0 1 0 0 0
1 0 0 0 0 0 0 0 0 0 0 1 0 0
1 0 0 0 0 0 0 0 0 0 0 0 1 0
0 1 0 0 0 0 0 1 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0 1 0 0 0
0 1 0 0 0 0 0 0 0 0 0 1 0 0
0 1 0 0 0 0 0 0 0 0 0 0 1 0
0 1 0 0 0 0 0 0 0 0 0 0 0 1
0 0 1 0 0 0 1 0 0 0 0 0 0 0
0 0 1 0 0 0 0 1 0 0 0 0 0 0
0 0 1 0 0 0 0 0 1 0 0 0 0 0
0 0 1 0 0 0 0 0 0 0 0 1 0 0
0 0 1 0 0 0 0 0 0 0 0 0 1 0
0 0 1 0 0 0 0 0 0 0 0 0 0 1
0 0 0 1 0 0 0 1 0 0 0 0 0 0
0 0 0 1 0 0 0 0 0 1 0 0 0 0
0 0 0 1 0 0 0 0 0 0 1 0 0 0
0 0 0 1 0 0 0 0 0 0 0 0 1 0
0 0 0 1 0 0 0 0 0 0 0 0 0 1
0 0 0 0 1 0 1 0 0 0 0 0 0 0
0 0 0 0 1 0 0 1 0 0 0 0 0 0
0 0 0 0 1 0 0 0 0 0 1 0 0 0
0 0 0 0 1 0 0 0 0 0 0 0 1 0
0 0 0 0 0 1 1 0 0 0 0 0 0 0
0 0 0 0 0 1 0 0 0 0 1 0 0 0
0 0 0 0 0 1 0 0 0 0 0 1 0 0
0 0 0 0 0 1 0 0 0 0 0 0 1 0
0 0 0 0 0 1 0 0 0 0 0 0 0 1
·x :::; e
x ?: O Dieses lineare Problem ist nun also mittels Simplexmethod e zu lösen . Wer schon einmal die Simplexmethode von Hand ger echnet hat , wird zusam me nz uc ken : Das sieht nach einer verdammt mühsamen und langwierigen Re chnung aus. Aber a uch h ier gibt es E nt warnung . Die Uni modularität der Systemmatrix bewirk t , dass alle s immer schön ga nzzahlig bleibt . Und die vielen Nu llen in de r Mat rix sor gen a ußerdem dafür , dass in jeder Iteration nur ganz wenige Zeilen neu b ere chnet wer den mü ssen. Nichtsde stotrotz , die K oschwi wartet ungeduldig auf die Best ä tigung der mi t de r ersten Method e gefundenen Lösung. Desh alb sollten viellei cht doch lieber ein Computer und geeignete Software zum Eins atz kommen . Mit welch en Mit te ln a uch immer , der Simplexalgorithmus liefert die einde ut ig bestimmte optimale Lösung:
x =( 0
0
0
0
1
0
0
1
0
0
1
0
0
0
0
0
0
0
0
0
1
0
1
0
0
0
1
0
0
0)
Die zur Erzeugung der Normalform eingefüg ten Schlupfvariablen haben im Op timum die Werte: s
=( 0
0
0
0
0
0
0
0
1
1
0
0
0
0 )
Der optimale Wert der Zielfunktion ist 252. Die beid en positiven Schlupfvariablen gehören zu den zu Hans und Horst geh örenden Zeilen im Ungleichungssys te m Ax :::; e. Sie zeigen an , dass das Produkt Ax in diesen beid en Zeilen den Wer t 0 hat. Diese b eid en bleib en ohne Partner.
202
Das Heiratsproblem
Die Einsen im x-Vekt or geb en die Kant en bzw. Paarungen a n , die in s op t imale Matehing aufzunehmen sind . Schli eßlich kann die K oschwi also das Resultat ihrer Bem ühungen verkünden .
Sehr geehrte potentielle Schwiegermütter! Wi ssenschaftl iche Untersuchu ngen haben ergeben, dass fü r eine bestmöglich e Weit erentwicklung un serer Dorfgem eins chaft die Eh eschließ ungen A nn a + Otto Brit -s- Kar!
Ed ith + B errul Franzi + P eier Moni + Fred Uta + Hugo zu erf olgen haben . Wir dank en allen B etroffen en für" die un verzügliche Um setzung dieses Beschlusses. Un d Sie, liebe potentielle Schwiegermüt te r aus allen a ndere n Dörfern , werden mit dem hier neu erwo rbe ne n Wi ssen für sich und Ihr Dorf hoffentlich ebe nso zielst re big die opt imalen P aar e zusam me nstellen können . Viel Erfolg!
Manuel N aum ann ist Dipl. -M athematiker und arbe ite t in Züri ch .
13 Über die Anzahl surjektiver Abbildungen
Im Folgenden zeige ich m it dem Prin zip von Inklusion-Exklusion , dass für die Anza hl T( n , k) surjekt iver Abbildunge n aus ein er Menge mit n E lementen in eine Menge m it k E leme nt en gilt: T (n, k ) =
L
0-::; i-::; k
(-I r·
(~) . (k -
it
(13 .1)
Zu diesem Ergebnis gelangen wir in me hre ren Schritten . Wir beginnen mit der Wi ed erholung der folgenden Definition .
Definition 13.1 (surjektiv) Eine Abbildung f einer Men ge M in eine Men ge N heißt surje ktiv, wenn jed es Eleme nt n E N in der Menge der Bilder von Eleme nte n a us NI unter dieser Abbildung vorkommt . Kurz geschriebe n : f : M =} N heißt surjektiv :q Vn E N :3 m E M:f( m) = n
•
Wie viele verschiedene surjektive Abbildungen gibt es, wenn Mund N endliche Mengen sind?
Was wir suc he n, ist das Bildungsgesetz ode r eine Rekursion für die Folge T( n , k) . Wer öfte r nach Folgen sucht , kennt Sloan e's On-Line Encyclopedia 01 Int eger S equen ces (www . research . att. com/r nj as/ sequences / ). Dort , in Sloan e 's On-Line E nc yclopedia 01 Integer Sequenc es find et man die gesuchte Folge als A019538 (http : / /www . research . att . com/r nj as / sequences / A019538) .
Über die Anzahl surjektiver Abbildungen
204
Da heißt es u . a.: A019538 Triangle of numbers T( n,k)
= k! *Stirling2(n,k) read by rows
Number of onto fun ct ions from an n- element set to a k-element s et .
r o., k ) T(n , k) wi th - Hen ry
= Sum_{ j=O . . k} (-1)-j* c o., j)*(k- j)-n . = k*(T(n-1, k-1)+T(n-1, k)) T (O , 0) = 1 [or TU, 1) = 1] Bottoml e y , Ma r 02 2001
See also the two closely related trian gles A008277(n, k) = T(n, k) /k! Anmerkung : C( n , k) st eht für den Binomialkoeffizienten "n üb er k". Die im Zitat zuerst gen annte Summenformel ist das Gleiche wie (13.1). Diese wollen wir zuerst erklären und beweisen . Der Beweis der als zweites a ngegebenen Rekursionsgleichung folgt danach . Die erste, bereit s in der Überschrift genannte Ident it ät sagt, dass die gesuchte Anz ahl surje ktiver Abbildung von M --+ N eng verw andt ist mit den kP artitionen.
D efinit ion 13 .2 Ei ne P artition ist eine Äq uivalen zr elation a uf eine r Men ge 111 . Eine k- Pa rtit ion ist eine Partition m it der Mächt igkeit k , also m it genau k Äquivalen zklass en.
•
Die Anz a hlen der k-P artitionen einer n-elementigen Menge werden StirlingZa hlen zweiter Art gen annt und üb licherweise mit S(n , k ) abgekürzt (und bei Sloan e's mit Stirling2(n, k ) be zeichnet). Das ist für das Folgende nic ht wichtig, es sei aber erwähnt . Für die Stirling-Za hlen zweiter Art gilt :
S(n ,k) =
~! . I:
(_1)i.
(~) . (k -
i )n
(13.2)
O ~ i ~k
Die For meln (13.1) und (13.2) un t er scheiden sich durch eine n Faktor 1/k!. Bei der Zähl ung von k-P ar ti t ion en kommt es nämlich nicht a uf die Reihenfolge der k
Über die Anzahl surjektiver Abbildungen
205
Äquivalenzklass en an. Bei der Frage nach verschiede nen surj ektiven Abbi ldungen macht es a ber schon einen Untersch ied , welch e Äquivalen zklass e auf welches E lement a us 1, ... , n a bgebil det wird . Das (-1) i deu t et a uf den Urs prung der For mel (13.1) hin . Sie wur de mit dem P rinzip von In klusion und Exklusi on gefun den . Dieses möcht e ich nun erklären .
Das Prinzip von Inklusion und Exklusion Mit dem P rin zip von Inklusion und Exklusi on lassen sich diejenigen E lem ente eine r gegebe ne n Menge zählen , die mi ndestens eine von meh reren vorgegebene n E igensc haft en a ufweisen.
A
Abb. 13.1: Drei sich schneidende Mengen
B eispiel 13.3 Wie viele natürliche Zahlen zwischen 1 und 1000 werden von mindestens einer de r Zahlen 2, 3 oder 5 geteilt? Sei A die Menge der durch zwei te ilbaren Zahlen , B die der durch 3 tei lbaren und C die der durch 5 tei lbar en Zahlen . Es gilt (vgl. Ab bild ung 13.1) :
IA u B u CI = lAI + IBI + ICI - IA n BI - IA n CI - IB n CI + IA n B n CI Dieses elementare und de nnoch starke P rinz ip wird in der Kombinatorik oft angewendet, nämlich immer dann, wen n ein Ab zä hlproblem unü bersicht lich wird . Es beruht darauf, dass die Elem ente des Dur chsch nit t s von A und B bzw. A und C usw . zun ächst doppelt gezählt werden und dann dieser Fehler wied er ausg eglichen wir d , indem die doppelt addierten E lemente einfach subtrahiert werd en . Man mu ss a ber b eachten , dass dadurch wiederu m Elem ente meh rfach subtrahiert werd en , nämlich die E lement e des gem einsamen Durchschnit t s der Men gen A , B un d C . Das muss durch ent sprechende Ad dition ausg eglic he n wer den . _
206
Über die Anzahl surjektiver Abbildungen
Was für drei Mengen gilt , kann man all gemein a uch für n Men gen formulier en : D a s Prinzip von Inklusion und Exklusion lautet:
2..:
1
1
(_1) 1 1+ I
O# 1<;;{1 ,2 ,.. . ,n }
n
Ai I
(13.3)
iE 1
Mit di esem Prinzip zeigt man nun:
Satz 13.4 Die Anzahl der surje ktiven Abbildungen von {I , ... , n} -+ {I , . .. , k} ist gleich
(13.4)
B e w e is : F ür j ed es j E {I , . . . , k} sei A j die Menge a ller Abbildungen f von {1 ,2, ... , n} nach {1,2, . . . , k} , di e j nicht treffen , d . h . für kein i E { I , . . . , n} ist f(i) = j. A j hat so viele Elemente, wie es Abbildungen von
{1 ,2, . .. , n} nach {1 ,2 , ... , j - l ,j + 1, . . . , k} gibt, al so (k - I}" . Für den Durchschnitt zweier Men gen A j l und A h gilt, dass di es di e Anzahl a ller Abbildungen ist, di e j 1 und i z nicht treffen. Da s sind (k - 2)n Stück. Man erkennt, dass der Durchschnit t von t: di ese r Mengen genau (k - r) n verschiedene Abbildungen ent hält, die bestimmte r Elemente ni cht al s Bild haben. Diese Formel zählt a lso ers taunliche rweise das Gegenteil von dem , wa s wir wollt en, nämlich sie zä hlt di e nicht surjektiven Abbildungen . Aber da s hat Me t hode, denn zum Schluss bilden wir das Komplement! Die Me nge de r surj ektiven Abbildungen ist gleich der Menge aller Abbildungen abzüglich de r ni cht sur j ektiven Abbildungen.
Wi e gro ß ist di e An zahl all er Abbildungen von { I , ... , n} -+ {I , ... , k}? Es sind k"; ode r - um in der Sys t ematik zu bleiben - es sind (k - O)" . Anmerkung: Den Summanden (k -O)n ent hält di e zu b eweisende Summenformel für i = O.
207
Über die Anzahl surjektiver Abbildungen Bleibt zu zeigen , dass die übrigen Terme (für i surj ektiven Abbildungen ergebe n.
> 0)
gerade die An zahl der nicht
Somit zurück zur Inklusion-Exklusion: In der Summe der Mächtigkeiten der A j sind alle die Abbildungen doppelt gezählt, die mehr als 1 El em ent a us {I , ... ,m } nicht als Bild (irg end) eines Elem ents a us {I, ... , n} haben . Dieser Fehl er muss durch Addition der Mächtigkeiten der Schnittmengen von jeweils zweien der A j wied er wettgem acht werden. Allerdings haben wir damit zuviel des Guten getan . Die Abbildungen, die mindestens 3 E lemente au s {I , ... , n } ni cht zum Bild haben , sind nun mehrfach sub t rahiert worden . Die ser Fehler wird au sgeglichen durch Addition der Mächtigkeiten der Durchschnitte von jeweils dreien de r A j . Nun darf ich "usw." sagen, einverst anden? Was fehlt denn no ch? Ach ja, " k üb er i", was hat es denn damit auf sich? Wir lesen noch einmal einige Zeilen zur ück: Ich sagte: "von jeweils zweien der Al' und "von jeweils dr eien der Al'. Es kommt darauf an, von welch en 2 od er 3 od er r Me nge n man die gem ein same Schnittmen ge bildet bzw. auf wie viele verschied en e Weisen man solche Durchschnitte von jeweils r Mengen bilden kann . Man kann a uf "n über 2" Weisen zwei ver schiedene der A j au ssu chen, um sie zu schneiden. Man kann auf "n über 3" Weisen drei ver schiedene der A j aussu chen, um sie zu schneid en . Ich erlaube mir ein let ztes "usw." und bitte den Leser , zur Kon trolle no ch einmal a uf die Formel zu bli cken . Nun , ist alles klar?
D
W ie angekündigt werde ich jet zt au ch die zweite bei Sloan e 's angegeb en e Formel, die Rekursion , näher erklä ren und beweisen .
S atz 13 .5 Fü r die Anzahl '1'(n , k) der surje ktive n Abbildungen eine r n- elementigen Menge auf eine k- elementige M eng e gilt : T tn, k) = k · '1'(n - 1, k - 1) + k · '1'(n - 1, k) m it '1'(0,0)
=
1
[oder '1'(1 ,1 )
=
(13.5)
1]
und '1'(n, k) = 0 fü r n < k .
B ewe is : Zunächst sei festgestellt , dass '1'(n, k) = 0 für n < k richtig ist . Es gibt kein e surje kt iven Abbildungen a us eine r endliche n Menge auf eine andere endliche Me nge, die mehr El em ente hat.
208
Über die Anzahl surjektiver Abbildungen
Ist k = n , haben also beide Mengen gleich viele Elemente, so ist die An zahl der surjektiven Abbildungen gleich k! , denn dem erst en Element aus 111 wird eines von k Elementen aus N zugeord ne t, dem nächsten Element aus NI wird eines der verblieb en en k - 1 Elemente zugeord ne t. Dies wird fortgeset zt , bis schli eßlich dem letzt en El ement aus M das einz ig noch verblieb en e Element aus N zugeord net werden muss. Für k! =: fak(k) gilt die Rekursion fak(k) = k· fak(k - 1) und da n - 1 < k , so ist T(n - 1, k) = O. Die Rekursionsformel
T(n , k) erweist sich im Fall n
= k· T(n - 1, k - 1) + k- T(n - 1, k)
(13.6)
= k a ls ri chtig.
Es sei nun n > k. Betrachte nun die Menge F aller surj ekt iven Abbildungen von M nach N. Diese Menge kann man in 2 Teilmengen U und V di sjunkt aufteilen . Dazu wähle ich ein beliebiges x E NI aus, halte es fest, und unterscheide danach, ob dieses x für die Surjektivität der Abbildungen wirklich notwendig ist oder nicht . Nämlich:
U := {f E F I f(M \{x}) = N}
(13.7)
V := {f E F I f(M \{x}) C;; N}
(13.8)
Also - entweder hat das eine beliebig a ber fest ausgewählte x ein Bild in N, a uf das a uch mindestens ein anderes Element a us M abgebildet wird - oder nicht . Die Menge U enthält genau die surjektiven Abbildungen f von M auf N, die eingeschränkt auf die Menge M\ {x} auch eine surjektive Abbildung von M\ {x} a uf N ergeben. Die Anzahl der surjektiven Abbildungen von M \ { x} --+ N ist T(n - 1, k). Aus jeder dieser surjektiven Abbildungen kann man eine surjektive Abbildung von M --+ N machen, indem man für das zuvor ausgewählte x E M ein beliebiges von k möglichen Elementen a us N als Bild festlegt. Darum ist
IUI = k· T(n -
1, k) .
Die Menge V ent hält genau die surjektiven Abbildungen f von M auf N, die eingesch ränkt auf die Menge M \ {x} nicht mehr surj ektiv sind. Da F ab er nur surjektive Abbildungen ent h ält und wir nur das eine Element x aus NI entfern t haben , kann auch nur genau ein Element y aus N nun ohne Urbild sein. Insofern ist f als Abbildung von M\ {x} --+ N\ {y} wied er surj ektiv. Die Anzahl der surjektiven Abbildungen von M \ {x} auf N\ {y} ist T( n - 1, k - 1). Jede surjektive Abbildung von M\ {x} auf N\ {y} kann zu ein er surjektiven Abbildung von NI auf N ergänzt werden, indem man dem fest gewählten x ein weiteres Element y EN zuordnet.
209
Über die Anzahl surjektive r Abbildungen
Sofern dieses y E N fest stünde, machte man also aus T ( n - 1, k - 1) surjektiven Abbildungen von M \ {x} au f N\ {y} gen au T (n-1, k - 1) surje kt ive Abbildungen von NI a uf N. Ab er das y E N ste ht nicht fest , es ist b eliebig a us N, denn V ent hält die Abbildungen f E F , für die f (M\ {x}) <;; N ist, also irg end eines der E leme nte au s N im Bild von M \ {x} fehlt . Für die Wahl des 'fehlenden' Elements a us N gib t es k Mögli chkei ten. Darum ist IVI = k · T(n - 1, k - 1). Wem das zu schnell war, der überlege es sich so: Es ist V glei ch der disjunkten Vereinigung der Mengen V y := {f E F I f (M\ {x }) = N\ { y } } für y E N .
(13 .9)
J ed es Vy hat T(n -1 , k -1) Elem ente. Es gibt k verschie de ne Mengen Vy.
D
Zusammenfassung:
Es wurde di e Menge F aller surje kt iven Abbildungen disjunkt zerle gt. (13.10) Weil die Zerlegung disjunkt ist , erhält m an :
IFI = IUI +
2:= lVyl ·
(13.11)
yEN
Mit IUI = k · T( n - 1, k) und schli eßlich :
T(n , k )
lVyl = T(n -
1, k - 1) sowie
INI = k
erh al ten wir
= IFI = k - T(n - 1, k) + k · T (n - 1, k - 1).
Für die sen Beitrag habe ich In ternet-Quellen [44, 45] zu Rate gezogen. Martin Wohlg emuth (Matroid)
14 Potenzsummen
Die Geschi chte des neunjährigen Gauß und seine r cleveren Addition der natürlichen Zahlen von 1 bis 100 hat , glaube ich , jed en jungen MathematikIn teressierten a nim iert, au f diesem Feld ebenfall s nach Tricks und Lösungsformeln zu suc hen . La nge vor Gauß, zu Begin n de s 17. J a hrhundert s, hat te es die a ufkomm ende Infinitesimalrechnung erfo rderlich gem acht, Summen von Potenzen aufeinander folgender natürlicher Zahlen zu ber echnen . Solch e Summen t reten z. B. bei der näherungsweisen Ber echnung der F läche unter Polynomfunktionen durch Oberund Untersum me n auf. Man kannte bald Formeln für kleine Exp onenten, z. B .: n
Lk
1
k= l n
Lk 2
k =l n
Lk L k4 3
k= l n
k= l
L k5 n
k= l
1 2 1 -n + -n 2 2 1 3 1 2 1 -n +-n + -n 32 6 1 4 -n 4
1 3 1 2 + -2 n + -n 4
1 1 1 5 1 4 - n + - n + - n3 - - n 5 2 3 30 1 6 1 1 5 5 - n + - n + - n4 - - n2 6 2 12 12
Jede die ser Formeln kann man mi t vollständiger Induktion beweisen . Aber wie finde t man eine solche Formel, wenn man sie no ch nicht kennt ? Ansche inend ist die Summe der i-t en P ot en zen der Zah len 1 bis n ein Polynom in n vom Grad i+ 1, dessen Leitkoeffizient i~ l laut et . Der nächst e Koeffizien t ist ~ ,der darauf folgende ist li2 , der dann folgende ist O. Das sind alles Vermutungen, die durch gen au es Hinseh en gefunden werden .
212
Potenzsum men
Es war J akob Bernoulli (1654-1705) , der das allgeme ine .Bildungsgeset z" solcher Summenformeln erkannte und damit eine Met hode fand , durch die zu jed em gegeb en en Exponenten i eine Berechnungsformel für die Poten zsumme n
L
ki
k =l
a ngegeben werden kann . Die von ihm zu die sem Zwecke eingeführten Größen t ragen heute seinen Namen: Die B ernoulli-Zohlen , Zur Definition und für den Umgang mi t die sen Zahlen ist es zweckmäßig, sich des Kon zepts der erzeug enden Funktion en zu b edi en en : Wir betrachten die Funktion x f( x) = - , x E JR , eX - 1 wob ei sich der Funktionswert im Punkt x = 0 durch st etige Fortsetzung ergibt. Die Funktion f lässt sich um den Punkt x = 0 in eine Poten zr eih e mit Kon vergen zradius 2Jr ent wickeln (zur b equem en Begründung benötigt man et was Funktionentheorie) . Die Koeffizienten dieser P otenzreihe dienen uns nun zur Defini tion :
D efi nit io n 14.1 (Be rn oulli-Zahle n) Die Folge der Bernoulli-Zohlen B n , n ~ 0, sei defini ert durch die Gleichung x 00 Bn n e X -1 -- 'L" -n! x '
lxi < 2Jr.
n =O
•
Es gilt demnach : B
(~)n _ x
_
dx
n -
I e X - 1 x=o
Durch Differenzieren er halte n wir leicht die 'Wert e der ersten beiden BernoulliZahlen Bi, = 1, Bet rachten wir nun die Funktion x g(x) = - - eX - 1
B I X
x e - 1
= X
+ -x2 ,
so ergibt eine einfache Rechnung g(x) = g( - x ),
d . h ., die Funktion 9 ist ger ade. Damit wissen wir, dass alle Koeffizienten mit ungeradem Index in der Potenzreihenentwicklung von 9 um den Ur sprung verschwinden . Das bedeutet für die Bernoulli-Zahlen B Zn + 1
= 0 für n
~ 1.
Bevor wir die Bernoulli-Zahlen mit Poten zsummen in Verbindung bringen, be weisen wir eine nützliche Formel:
213
Potenzsummen Satz 14.2 Es gilt für n
Beweis:
~
Für
1:
lxi < 21r gilt : 00
'\"" B n x n = _ x_ = e -x - x o n! eX - 1 e-X- I
n=O
(~ (-~r x n) (~ (-~r Bn x n) =
~ (-~r (~(~) Bk) x
Damit folgt durch Koeffizientenv ergl eich für n
~
n
0 (14 .1)
was sich umstellen lässt zu
Wegen B2n+l = 0 für n ~ 1 verschwindet die linke Seite der letzt en Gleichung für alle n ~ 2, woraus sich die Behauptung ergibt. D
Beispiel 14.3 Berechne B 2 mittels Satz (14.2) :
B o + 3B 1 + 3B2 = 0
=?
B2 =
•
1
- 3 . (B o + 3BI)
Damit lassen sich die Bernoulli-Zahlen leicht rekursiv berechnen: 1
Bo
1
BI
- "2
B2
1 (;
Ba
0
B4
1 - 30
B5
0
B6
1 42
B7
0
usw.
Nun kommen wir zu der gesuchten allg em ein en Formel für Poten zsummen: Satz 14.4 Für j eden Exponenten i E PT gilt
~ki s: k=1
= _ 1_ i +1
~ 0
k=O
(i +k 1) B kn ( + 1)i+ 1 - k , n_. >1
214
Pote nzsumme n
Beweis:
Es gilt für x
> 0:
f ~ (t ki) xi t f i=ü
7.
(k~)i
=
k =ü
=
7.
k= ü i= ü
t
ek x
k= ü
e ( n +l )x - 1
eX - 1 - 1
x
e(n+l )x
x
e - 1 X
(~ ~~: ~~~ (~ ~~ ~ (~(i + 1) ~(i + l )! t:a k k
= =
Es folgt für i
~
x
)
1
k
x
B ( k
)
n+
l) i +l - k)
xi
1 durch Koeffizientenvergleich
D
Damit haben wir einen üb er sichtlichen Weg kennengelernt , um weitere Formeln zur Bere chnung von Pot enz summen zu finden . Zum Ab schluss sei erwähnt, dass die Berechnung solcher Po tenzsummen ein Spezialfall der Frage st ellung nach de r Au swertung von Summen der allgem einen Ges talt ~~=ü f(k) ist , wob ei f eine geeigne te Funktion darstellt . Die Unt ers uchung dieser Frage führt auf die sogenannt e Eulereche Summenform el. J ens Koch, Physiker , Berlin
15 Berechnung großer Binomialkoeffizienten
Übersicht 15.1 Rechnen gemäß Definition
215
15.2 Rekursive Berechnung
216
15.3 Mul tipliziere in günstiger Reihenfolge
216
15.4 Teile und (b e-)herrsche
217
15.5 Der Satz von Legendre
218
15.6 Algorithmische Berechnung
218
15.7 Weiter es Anw endungsb eispi el
219
Wi e ber echnet man
(~) , sprich "n üb er k"? Das ist doch einfach, könnte man
sagen.
15.1
Rechnen gemäß Definition
Die bekannte Definition lautet:
D efinition 15.1 (Binom ialkoeffizie nt ) Für n , k E No, n >= k , definiert man den Binomialkoeffizienten als:
n) n! ( k .- k!·(n -k)! Dabei ist n!
= n - (n - 1) . (n - 2) .... ·2 ·1 für n
Also muss man nur diese Formel ausrechnen.
E
N und O!
=
1.
•
216 Für
15 Berechnung großer Binomialkoeff izient en
C3 0
)
ergibt sich : 10 ·9·8·7 ·6 ·5 · 4 ·3 ·2 · 1 3 ·2·1 · 7 ·6 · 5·4·3· 2·1
(Ta sch enrechn er)
120
Man hätte vorher au ch kürzen können: 10 ·9·8·7·6·5 ·4 · 3 ·2 · 1 3· 2· 1· 7 ·6· 5 ·4 · 3 ·2·1
10 . 9 . 8 = 5 . 3 . 8 = 120 3·2
Diese Rechung ist kein Problem. Aber wie ist es mit e~9\O) ? Wie riesig ist 2010! ? Mein Taschenrechner kann das nicht mehr .
15.2
Reku rsive Berechnung
Binomialkoeffizienten kann man rekursiv b er echnen . Es gilt
(n) (n -1) + (n -1) k
k -l
k
.
(15.1)
Also beispielsweise 2010) = (2009) 890 ( 891
+
(2009) . 891
Diese Rekursionsformel ist für viele formale Re chnungen der Schlüssel, für unsere Ber echnung t aug t sie a ber nicht , denn der Sp eicherb ed arf eine s Programms nach diesem Rekursionsverfahren ist groß und außerdem gibt es besser e Möglichkeiten .
15.3
Multipliziere in günstiger Reihenfolge
Zwar ist 201O! sehr groß, zu groß für den Taschenrechner, ab er die se Zahl mü ssen wir a uch ga r nicht berechnen. Vie l günstiger und schon um einiges gen auer re chnen wir in folgender Weise :
2010) ( 891
= 2010 . 2009 . . .. . 2010 - 891 + 1 891
890
1
15.4 Teile und (be-)herrsche
217
Man fass t jeweils eine n Faktor im Zähler und eine n im Nenne r zu eine m Bruch zusamme n und multipliziert die Qu otienten . Damit erreicht m an , dass die Zah len, mit den en man rechnet (hier sind das die Quotient en) alle eine ä hnliche Größenordnung haben . Für manche Zahlen ist das noch ein beherrschbarer Ausdruck. Führen wir diese Re chnung nun für große n wie 2010 durch , so ist au ch die se Re chnung zwecklos. Das Ergebnis liegt ganz grob in de r Größenordnung von Unendlich (sagt mein Taschenrechner) . Ein prinzipi eller Nachteil dieses Verfahren s ist zude m, dass die Zwischen ergeb nisse Dezimalbrüche sind , obwohl wir eine ganze natürliche Zahl als Gesamtergebnis erwarte n. Wir handeln un s somit unnötig Abbruch- und Rundungsfehl er ein .
15.4
Teile und (be- )herrsche
Es gibt ein ander es, exaktes und von der Rech en zeit schnelles Verfahren . Dabei ber echn et man die Primfaktorzerl egung von n !, k! und (n - k)! und kürzt die Exp one nte n. B e is pie l 15.2
27! 15! ·12!
-:-=-----,--,:-;-
= 22 ·3 2 ·5· 13 · 17 · 19 ·23
denn
= 223 .3 13 . 56 . 73 . 112 . 13 2 . 17· 19·23 15! = 2 11 . 36 . 53 . 72 . 11 . 13
27!
12! = 2 10 . 3 5 . 52 . 7 . 11
•
Es bleibt die Frage, wie man zu den Primzahlexponenten in der Zerl egung der Fakultäten kommt . Zum Glück gibt es dafür eine Formel aus der Zahlentheori e, die auf Leg endre zur ückgeht. Wi r wissen , das s jede positive ganze Zahl eine eindeutige Primfaktorzerlegung hat. Das bedeutet : Es gibt zu einer po sitiven ganzen Zahl m P rimzahlen P1, P2, ... , Pk und Exponenten e(pi ), i = 1, . . . , k, für eine (bi s auf die Reihenfolge der P i) eindeutige Darstellung der Form
TI k
m =
P i e (P;) .
i= 1
Die Faktorisierung groß er Zah len ist im Allg em ein en nicht leicht zu find en . Ab er die Primfak toren von n! sind leicht zu b erechnen .
218
15.5
15 Berechnun g großer Binomialkoeffiziente n
Der Satz von legendre
Sat z 15.3 (Le g endre) In der Primjaktorzerlequnq von m
e(p) =
[~] + [;
= n! (n
E
N) gilt für alle Primzahlen p:
] + [; ] + [; ] + ...
Hier ist [ ] die Gaußklammer; diese steht für " die größte ganze Zahl kleiner gleich ".
Anmerkung: Von den Summanden [ ~] sind nur endlich viele ungleich 0, nämlich die für i E No mit pi ::; n . Wir pro bieren diese Form el an Beispielen mit kleinen n un d paus: B eispiel 1 5 .4 Die 2 hat in der P rimfaktorzerlegung von 27! den Exponenten :
e(2)= [2;] + [2 :] + [2n + [ ~~] = 13 + 6 + 3 + 1 = 23 Die 3 hat in der Primfaktorzerlegung von 27! den Exponenten:
e(3) =
[2;] + [2;] + [ ~~] •
= 9 + 3 + 1 = 13
B eweis : (L egendr e) Kein Primteiler von n ! ist größer als n . Von den n Faktoren in n! sind [ ~] Faktoren einmal durch p t eilbar. Durch p2 sind Faktoren
[?]
teilbar, durch p3 sind [;; ] Faktoren tei lbar usw . Die Anz ahl der Faktoren p in der Primfaktorzerlegung ist also gleich der (endlichen) Summe dieser Anzahlen. D
15.6
Algorithmische Berechnung
Für ein Verfahren, das den Satz von Legendre ben utzt, ist es erforde rlich , die Primzahlen bis n zu kennen.
15.7 Weiteres Anwendungsbeispiel
219
Ein Programm zur Faktorisi erung von n! muss darum zuerst eine Primzahltabelle erstellen , et wa mit dem (b ekannten) Si eb des Eratosthenes. Dann durchläuft man die Liste der Primzahlen und ber echnet die e(p) für alle p klein er oder gleich n. Berechne weiter die Primzahlpoten zen pk und die Quotienten [;] solange, bis pk > n wird. Die Summe der Quotienten ist der Exponent der Primzahl p in der Faktorisierung von n! . Gleichwertig dazu , jedoch mit weniger Rechenoperationen, teilt man n zunächst durch p und dann den jeweils ganzzahlig a bgeru ndet en Quotienten wiederum durch p und bricht a b, wenn der Quotient kleiner 1 ist . Die Summe der ganzzahlig abgerundeten Quotienten ist e(p). Man vermeidet auf diese Weise die explizite Berechnung der Potenzen pk , denn hat man bis zum Abbruch k-fach durch p dividier en können, dann ist pk ::; n und pk+l > n . Diese zul etzt b eschriebene, optimierte Variante des Algorithmus lautet also :
Algorithmus zur Faktorisierung von n! 1:
2: 3: 4:
5: 6: 7: 8: 9: 10: 11: 12: 13: 14:
Eingabe: n Bestimme die Menge P(n) aller Primzahlen j; n . for all p E P(n) do quotient := Abrunden(njp) sum := quotient while do quotient := Abrunden(quotient jp) if quotient < 1 then Abbruch end if sum := sum + quotient end while Ausgabe: p "~,, sum end for
Den beschrieb en en Algorithmus kann der Leser im Internet ausprobieren , siehe [51]. Die Funktion "Abrunden" realisiert für positive Argumente die Gaußklammer .
15.7
Weiteres Anwendungsbeispiel
Gelegentlich werden Aufgaben wie diese gestellt: Auf wie viele Nullen endet 2010!?
220
15 Berechnung großer Binomialkoeffizienten
Antwort: E ine Null am E nde b edeutet , dass die Zahl durch 10 t eilbar ist . Wi e oft ist 2010! durch 10 t eilb ar ? Sie ist so oft durch 10 t eilb ar, wie in der P rimfaktorzerl egung genügend Zweien und Fünfen vorkommen , um den Faktor 10 zu bilden . Weil es häufiger den P rimfak tor 2 als den Fa kt or 5 gibt , ist diese Anza hl allein durch die An zahl der Fünfen b estimmt . Wi e viele F ünfen sind in der Primfaktorzerl egung von 2010! ? Es sind 2010 ] [ 5
+
[ 2010] 25
+ [ 2010] 125 +
[ 2010] 625
= 501
Fünfen . Also endet 2010! au f 501 Nullen.
Martin Wohlgemuth aka Matroid.
16 Über Permanenten, Permutationen und Fixpunkte
Übersicht 16.1 Einführung
221
16.2 Das Prinzip der Ink lusion und Exklusion . . . . . . . . . . . . . . . . . . . . . . .. 221 16.3 Permanenten . ... . . . . . .. . ... . . ... . . . . . . . .. . . . .. . . .. .. . . .. . . .. 223 16.4 Das Rencontre-Problem
16.1
226
Einführung
In diesem Kapitel wollen wir den Begriff der Permanente und eine Verbindung zu einer speziellen kombinatorischen Fragestellung namens "Renc ont re-P roblem" vorstellen . Unter dem Rencontre-Problem versteht man die folgende klas sische Frage: n Ehepaare veranstalten einen gemeinsamen Tan zabend. Wie viele Tanzpaarungen aller 2n Pe rsonen sin d möglich, bei den en keine Frau mit ihrem Mann tanzt '? (Frauen tanzen nur mit Männernf) Zur Untersuchung dieser Frage ste llen wir vorber eitend das sogena nnte Prinzip der Inklusion und Exklusion vor , welch es sich hier und au ch im Allg em ein en oft als nützliches Hilfsmittel er weist. Anschließend führen wir den Begriff der Permanente eine r Matrix ein und b eleuchten einige allgem ein e Eigens chaften , um sch ließlich auf die Ver bindung zum Rencontre-Problem einz ugehe n.
16.2
Das Prinzip der Inklusion und Exklusion
Sind A und B endliche Mengen , so gilt beka nntlich die Anzahlformel:
IAU BI = lAI + IBI-IAn BI
222
16 Über Permanenten. Permutationen und Fixpunkte
Diese Formel find et im Prinzip der Inklusion und Exklusion eine wesentliche Ver allgem ein erung. Zur Formulierung ben ötigen wir einige Definitionen : Sei N eine endliche nichtleere Menge. Eine Funktion w : N --t ce nennen wir Gewichts/ unktion und w( x) heiß t Gewicht von xE N. Sind NI, . .. , N; Teilmengen von N, so set zen wir
n k
NV1" ..,Vk :=
NVi
i =1
und w V l""
für Indizes 1 ::; VI
.-
w(x)
,Vk . -
< V2 < ... < vk
::; r (mi t k ::; r) . Weiter setzen wir
W(O) :=
L
w( x)
x EN
und W(k) :=
für 1
< k < r, Ist 1 < k < r , so definieren wir l\!h := {x
E N I x ist in genau k der Menge n N I, ... , N; ent halte n}
und schließlich sei V(O) := und
\/(k) :=
w (x )
L
w(x)
« e t«;
für 1
< k < r,
Damit können wir das Prinzip formuliere n:
Satz 16.1 (Prinzip der I n klu s io n und Exklusion ) Unter den obigen Vorau ssetzungen gilt
für 0 ::; s ::; r .
Der Beweis, auf dessen Dar st ellung wir hier ver zichten , kann geführt werden , indem für alle x E N das Gewicht w(x ) au f b eid en Seiten gezählt wird . In den nächst en Ab schnitten wird dieses wichtige Prinzip Anwendung find en .
223
16.3 Permanenten
16.3
Permanenten
Im Folgende n füh ren wir den Begriff der P erm ane nte eine r Matrix ein. Man könnte die Permane nte als die klein e kombinatorische Schwest er der Det erminante bezeichnen , wob ei b eid e Begriffe ihrerse its einen Spez ialfall der soge nannt en Immanen t e darst ellen . Obwohl P erm ane nten ni cht den St ellenwer t von Det erminanten b esit zen , spielen sie zum Beispi el eine wicht ige Roll e in der kombinatorischen Theori e der Repräsentanten syst em e (dazu sei zum Be ispiel das Buch "Co mbi natorial Mathe matics" von H . J . Ryser em pfohlen [52]) , und sie t reten sogar in der Quant enmech anik zur Besch reibung bo soni scher Teilchen zust ände a uf [53].
D e fin it io n 1 6 .2 (Permanente) Es sei n eine natürliche Zahl und M (n , lE.) bezeichne die Menge aller (n , n)Matrizen mi t Ei nträgen aus den reellen Zahlen. Für ein e Matrix A = (ai,k) a us M (n , lE.) hei ßt die Zahl n
per(A) :=
2..: TI ai ,o- (i) = 2..:
o- ESn
a l ,o-( l )a2,o-(2)' " an ,o- (n)
o-ES n
i= 1
die P ermanente von A , wob ei S n wie üblich die Menge aller P ermutationen der Men ge {I , ... , n} b ezeichnet. •
Zunächst b etrachten wir einige element are E igensc haft en :
Satz 1 6 .3 E s sei A = (a i,k) eine Ma tri » aus M( n , lE.). Dann gilt : 1. Di e Abb ildung per : M (n , lE.) --+ lE., A M per (A) ist lin ear in j eder Spalt e. 2. E s gilt per(A) = per(A T ) . 3. Fü r 1 :::; j :::; n lässt die P erman ente eine Entwicklung na ch der j -t en Sp alt e zu: n
per(A) =
2..: ai ,j per(Ai,j) , i =1
wobei die Matrix A i,j E M(n - 1, lE.) aus der' Matrix A en ts te ht, indem die i-te Z eile und die j -t e Spalt e weggelassen we rden.
224
16 Über Permanenten, Permutationen und Fixpunkte
Beweis: Der Nachweis der ersten b eid en Ei gen schaften verl äuft ga nz an alo g zu den Beweisen der ents prec hende n E igensc haften bei Det erminanten . Für den Nachweis der dritten Eig en schaft defini eren wir zunächs t für i , j E {I, . . . , n} die Menge n M i ,j :=
{f : {I , .. . , n} \ {j} --+ {I , . .. , n} \ {i} I fi st bijektive Abbildung} .
Für j E {l , ... ,n } gilt dann: per(A)
=
L
al ,o-(l )a 2 ,o-(2 ) ' " an, o-(n )
a ESn
=
L
ao- (I ) ,l ao- (2 ) ,2' " ao- ( n ), n
a ESn
n
=
n
L L TI
ao- (v ) ,v
i = 1 o-E S " v = 1
O-(j) =i
n
n
=L
ai ,j
i= 1
=
L TI
ao- (v ) ,v
o-EMi,j v =1
v of-]
n
~ L....J a 2,' ) . per(A2, ) .) i= 1
Damit ist die dritte Eigenschaft gezeigt .
D
Definition 16.2 und die Aus sagen von Satz 16.3 zeigen eine enge Verwandtschaft zwischen Permanente und Determinante a uf. Die Abbildung det : J\;I( n , JR) --+ JR, A >--+ det(A) ist bekanntlich durch die folgenden drei Eigenschaften vollst ändig be stimmt : 1. det(En ) = 1, wob ei E n E l\!I (n , JR) die Einheitsmatrix b ezeichnet , 2. Die Abbildung det : M(n , JR) --+ JR, A >--+ det(A) ist line ar in jeder Sp al te , 3. det ist altern ier end .
Da die P ermanente die erst en beid en Eigenschaften b esitzt , kann die dritte Eigen schaft folgli ch nicht für Permanenten gelten . Ferner gibt es a uch kein Analogon zum Det erminantenmultiplikationssatz, was sich am Beisp iel der Matrizen
und
:)
R ~(:
schnell einsehen lässt : per(A) per(B) = 10
i-
18 = per(AB)
225
16.3 Permanenten
Es gibt j edoch eine weiter e Formel zur Ber echnung von P ermanenten, welche wir mit Hilfe des Prinzip s der In - und Exklusion b eweisen werd en . Zur Formulierung benötigen wir einige Bezeichnungen : Sind eine Matrix A = (a i,k) a us M(n , lE.) und Spaltenindizes 1 ::::; kl < .. . < k v ::::; n vorgegeben, so verstehen wir unter A (kl , . .. , k v) diejenige Matrix, welche aus A entsteht , indem die Spalten mit den Indizes k» , . . . , k v durch Nullspalten ersetzt werden . Ferner definieren wir
T(A) :=
TI (~ ai'k)
,
sowie
1'0 := T(A) und für 1 ::::; v ::::; n
1'v
'[ ' (A (k l , .. . , k v)) .
:=
Mit diesen Bezeichnungen gilt der folgende Satz:
Satz 16.4 Für A = (ai ,k) E M(n , lE.) gilt : n
per(A) = I: (- 1t 1'v v=o
B ewe is : Wir wollen Satz 16.1 a nwenden. Dafür setzen wir N := {1, . . . , n} n , W(j l , . .. , j n ) := al,j l" 'a n,j" fü r (jl , .. . , j n ) E N , und für 1 ::::; v ::::; n sei
Dann gilt Sn
= N\ U ~= I N v, und es folgt a us Satz 16.1 n
per(A ) = V(O) =
I:(-1t W(v)
v=o mit
W(O) = (Ji ,... ,j ,, ) E N
=
(t
)1 =1
n
al ,jl ) . ..
(I:. an, j,,) ) ,, =1
226
16 Über Permanenten. Permutationen und Fixpunkte
= 1'0, und für 1
~
v
W( v)
~
n
~ <~k",n C,,.. ,j"~N',,,," >
'"(h, ...., j n ))
Damit ist die Forme l b ewiesen .
16.4
D
D as Rencontre-P roblem
Das in der Einleitung be sch riebene Problem lässt sich folgende rm aßen ma themati sch formulie ren : Wie viele P ermutation en der M eng e {I , . .. , n } gibt es, welch e kein e Fixpunkt e besit zen ? Ein i E {I , .. . , n} he ißt Fixpunkt der Pe rmut a tion a E Sn , falls a (i)
= i gil t.
Wir fragen gleich et was Allgemeiner : W ie viele P ermutationen der Menge {I , .. . , n} gibt es, welche genau k Fixpunkte besitzen ?
D efin it io n 16.5 (Rencontre-Zahlen) Seien n E 1'1, k E No mit k ~ n . W ir setzen D( n , k) := I{(j E Sn ja be sitzt gena u k Fixpunk te} I . Die Zahlen D(n) := D(n ,O) heißen R en contre-Zahlen , sie werden jedoch • a uch oft D erang ement-Zahlen genannt .
Um eine Verbindung zwis chen die sen Zahlen und den Pe rm anenten zu formulieren , betrachten wir die folgenden spe ziellen Matrizen : Für ti E 1'1 , k E No mi t k ~ ti sei En ,k diejenige Matrix , welche a us der Einhei tsm at rix E n E M(n , R ) entsteht , indem die letz ten n - k Spalt en durch Nullsp alten er setzt wer den. Ferner sei M n = (m i ,k) E M (n, R ) definiert durch m ik =
,
o
{1
falls i = k fall s i
i- k
227
16.4 Das Rencontre-Problem
und lVln, k be zeichne diejenige Matrix, welch e aus lVln ent steht, indem die ersten k Spalten durch Nullspalte n ersetz t werden . Damit gilt :
Satz 16.6 Für n E N, k E No mit k
D(n , k) =
(~)
~
n gilt:
per (En ,k + Mn ,k)
=
(~)
per (Mn- k)
=
(~) D(n -
k)
Beweis: Zunächst beobachten wir, dass die Zahl per (En,k + Mn,k) nach Definition der P ermanente genau der An zahl der P ermutationen a E S n ent sp richt , für welch e die Bedingung a(i) = i für i E {1 , . .. , k} und a(i) =I- i für i E {k
+ 1, . . . , n }
gilt. Es folgt demnach :
D(n - k) = per (En ,k + Mn ,k) Betrachten wir allgemeiner für beliebige Indizes 1 ~ V I < ... < V k ~ n die Menge aller P ermutationen a E Sn, welche gen au an den Stellen VI , ... , Vk Fixpunkte besitzen, so ents pricht deren An zahl gerade der An zahl D( n - k) der fixpunktfreien P ermutation en der verbleib enden n - k Zahlen {1, . .. , n} \ { VI , ... , Vk} ' Damit folgt :
D(n , k) =
L
I{a E
Sn Ia besitzt gen au a n
VI, ···, Vk
Fixpunkte j ]
I :<:;V l <"'
L
D(n -k)
I:<:;Vl<" '< Vk:<:;n
(~)D(n -k) (~) per (E n,k + M n,k) ' Die Glei chheit per (En ,k + Mn,k) = per (Mn - k) folgt dann leicht durch eine schrittweise Anwendung von Satz 16.3, Teil 3. D Der letzt e Satz besagt, dass das Auffinden eine r expliziten Formel für die Ren contre-Zahlen gleichw ertig zur Frage nach eine m explizit en Ausdruck für die P ermanenten ob en genannter Matrizen ist. Zunächst find en wir eine Darst ellung der Rencontre-Zahlen durch Anw endung des Prinzips der In - und Exklusion .
228
16 Über Permanenten. Permutationen und Fixpunkte
Satz 16.7 Fü r n E N, k E No mit k
n gilt:
~
D(
, n - k ( L)" k) = n . ~ _- _ n, k! L...J v!
v=o
W ir zeigen die Behauptung zunächst für den Fall k = O. Sei dazu N := S n , w (a ) := 1 für alle a E Sn und für 1 ~ v ~ n sei
Beweis:
N ; := {a E S n I a(v) = v}. Nach Satz 16.1 gilt dann: n
D(n)
= V(O) = L( -l)k W (k ) k=O
m it
W(O ) =
L
1
= n!
a ES n
und für 1
L L
W(k) =
INv1" ..,Vk I
l :S=;Vl < " '< Vk:S=; n
(n -k)!
l :S=;Vl < " '< Vk:S=; n
=
(~) (n -k) ! n! k! .
Daraus folgt : D(n) =n !
l) k LT n
(
k =O
Die allgemeine Formel folgt damit au s Satz 16.6:
D
229
16.4 Das Rencontre-Problem
Eine weiter e Darstellung der Rencontre-Zahlen erhalten wir durch eine Anw en dung des Satzes 16.4. Dabei ist zu beachten, dass Poten zen mit Exponent Null hier ste t s der 'Wert 1 zugeordne t wird .
Satz 16 .8 Für n E N, k E No mit k
~
n gilt:
Beweis: Wie im Bewei s zu Satz 16.7 genügt es , die Behauptung für den Fall k = 0 zu zeigen , denn der allgemeine Fall folgt dann a us
D(n ,k) =
(~)D(n -k).
Aus Satz 16.6 wissen wir, dass gilt: D(n) = per(Mn ) . Berechnen wir die se Permanente mit Hilfe von Satz 16.4 , so ergibt sich n
D(n) =
2:)
v=o
- 1t 1~
mit 1~
=
wobei man leicht nachrechnet , dass gilt:
T(Mn(k l , . . . , k v ) ) = (n -vt(n -v -1t - V Damit folgt dann n
D(n) = 2:) - 1t v=o
2:
(n - vt (n - v - 1t - V
1 :S;k 1 <...
o Die Sätze 16.7 und 16.8 liefern eine n kombinatorischen Nachweis für die Glei chheit
(-1)" n I. ~ 0 I - = ~( 0 - 1 )V v. v=o v=o
(n) ( v
n - v )V (n - v - 1)n-v .
230
16 Über Perman enten , Permutationen und Fixpu nkte
Zum Abschluss wollen wir erwähne n , dass dies e Identität ein Spezialfall des folgenden interessanten Zusammen hangs ist (siehe auch H . \ V. Go uld , Combinat ori al Identities [54]): Für x,y , z E C und n E N gilt:
~ (x + Iy )" z n- I/ = ~ n.I L...J L...J v. 1/=0 1/= 0
(n) ( + V
x
z v )1/ ( Y
_
z v ) n - I/ .
Thor sien Neus chel, Dipl. -Mat h ., promoviert a n der Uni Trier.
17 Zählen mit Permanenten
Übersicht 17.1 Definitionen und Vorbereitungen
231
17.2 Zählen mit P ermanenten und Determinanten
233
17.3 Der Satz
235
17.4 Beweis der Aussagen (17 .1) und (17.2)
236
17.5 Beweis des Satzes
237
E inig e Beiträge im Internet-Forum von Matroids Matheplanet (Anmerkung: geschrieb en 2003) haben mich dazu anger egt, eine Verbindung von Kombinatorik, Permutationen, Matrizen, Determinanten und Permanenten zu erkennen und darüber zu schreiben. Nach den notwendigen Vorbereitungen beweise ich das Hauptergebnis:
Die Anzahl der ungeraden Permutation en ohne Fixpunkt ist gleich der Anzahl der P ermutationen mit gena u zwei Fixpunkten.
17.1
Definitionen und Vorbereitungen
D efinition 17.1 Ein Derangement ist eine Permutation von n Elementen, in der kein Element auf sich selbst abgebildet wird . Die Anzahl solcher P ermutationen, also der Derangements von 1, . . . , n, b ezeichn et man mit D n . Die D n heißen Derangement-Za hlen od er a uch Rencontre-Zahlen . • Es gilt (b ekanntlich) :
D n = (n - 1) . (D n -
!
+ (-
1
Dn = n .Dn-
!
+ Dn - 2 )
t
(17.1) (17.2)
232
17 Zählen mit Permanent en
Ich werde diese beiden Au ssag en weiter unten b eweisen . Die Folge der Derangement-Zahlen ist kat alogisier t in "T he On-Line Encyclopedia of Integer Sequences" (kurz: Sloane's) als A000166 , siehe [55].
D e fin it io n 1 7 .2 (Fixpunkt) Ein i aus 1, ... , n heißt Fixpunkt der Permutation Ir, wenn Ir(i)
z.
•
Anmerkungen: Ein Derangement ist eine fixpunktlo se Permut ation . 'Derangement ' kann man mit 'U nordnung' übersetzen . Sei f(n , k) die Anzahl de r Permutationen von n Elementen mi t genau k Fixpunkten. Es gilt (nach Defini tion) : Dn
= f(n , 0)
(17.3)
Gerade und ungerade Permutationen Man un terscheidet gerade und ungerade Permutationen . Eine Permutation ist gerade , wenn sie das Produkt von gerade vielen Trans p osit ione n (Ver tauschungen zweier E leme nte) ist . An sonsten ist sie ungerade . Man weiß, dass sich jed e Permutation in ein Produkt von Tr anspositionen zerlege n lässt , und hat man zwei Zerl egungen , dann ist die Länge bei b eid en ent wede r gerade od er un gerade. Die Permutati onen mi t gen au k Fixpunkten kann man sortieren (d . h . disjunkt a uft eilen ) in gerade und ungerade Permutati on en mi t genau k Fixpunkten . Ich führe Bezeichnungen ein: Eine n-Permutation ist eine P ermutation von n Elementen. f +(n , k) bezeichne die Anz ahl der ger aden n-Permutationen mi t gen au k Fixpunkten . f - (n , k) bezeichne die Anz ahl de r ungeraden nPe rmut ationen mi t genau k Fixpunkten. Offensi chtlich ist :
f(n , k) = f + (n , k)
+r
(n , k)
(17.4 )
Zur weiteren Motivation Die Folge f -(n , 0) ist bei Sloane's regist riert als A000387 . Die Folge f +(n , 0) ist bei Sloane's regist riert als A003221. Zu A000387 sagt die dortige Beschreibung, dass es sich um die An zahl der Pe rmutat ione n mit genau zwei Fixpunkten handelt . Nicht erwähnt ist , dass A000387 zugleich die An zahl der unger aden P ermutationen ohne Fixpunkte ist . Diese Lü cke mö chte ich nun sch ließen, indem ich den Beweis geb e.
233
17.2 Zähl en mit Pe rmanenten und Determinanten
Die Summe A000387(n)
+ A 0032 21(n)
ist also gleich D n .
Wiederholung bekannter Definitionen Ich b eginne mit einigen weiter e Definitionen und Schreibweisen , die ich verw en den werde: I.
Das S ignum einer Permutation Ir ist 1, wenn Ir gerade ist, sonst - 1; a bgekürzt : Ir gerade sign(Ir) = { 1 - 1 Ir ungerade
11 .
Die D e t erminante eine r Matrix A = lAI := det(A) :=
L
(a i,j)nxn
ist gleich:
sign(Ir) al ,1r(1 )a2,1r (2 )
' " a n ,1r(n )
1T E S n
S n ist die Symmetrische G ruppe vom Grad n ; das ist nichts Ander es als die Menge der n -P er mut at ionen . 111.
Die P e rmanente eine r Matrix A =
L
per(A) :=
(a i, j) n
x n ist gleich:
al, 1r(1 )a2 ,1r(2 ) ' " a n, 1r(n )
1TES n
17.2
Zählen mit Permanenten und Determinanten
Ich werde Permutationen und Derangements mit Hilfe von Matrizen darstellen und zählen. Die Anz ahlberechnung benutzt Determinanten und Permanenten dieser Matrizen.
Aussagen über Permutationen und Matrizen Sei An die Matrix (a', j)" x n
o ausg eschrieb en: A n =
~ {~
1
i =j
i i:j
1
1
101
1
1
1
0
1
1
1
1
0
234
17 Zählen mit Permanenten
Dann ist : (17. 5)
f +(n , 0) - f - (n, 0) = (_1) n-l . (n - 1) = det(A n) f +(n , k) - f - (n, k) =
(~) . det(A n-k)
(17.6) (17 .7)
Beweis (17.5): Eine P ermutation Ir zä hlt in per(A n) genau dann , wenn alle a i ,1r(i) gleich 1 sind. Da die Diagonaleinträge a i ,i gleich 0 sind, zählt keine P ermutation , die ein El em ent auf sich selbst abbildet , aber es zählen all e P ermutationen , die kein Element auf sich selbst a bbilde n. D Beweis (17.6): In der Determinante zählen die geraden Permutationen ohne Fixpunkt mi t + 1 und die ungeraden Pe rmut a tionen mit - 1. Für k = 0 gilt somit f +( n, 0) - r(n , 0) = det(A n). Nun ist noch der Wert der Determinante zu b erechnen . Bekanntlich ist die Det erminante eine in j ed er Zeile lineare Abbildung, und ihr Wert ändert sich nicht , wenn man das Vi elfache eine r Zeile zu eine r ander en Zeile addiert. Addiert man in An (für n ?: 3) das - n ~ z -fache de r Zeilen 2 bis n zur er sten Zeile, dann wird (exemplarisch für n = 5) 0
1
1
1
1
1
0
1
1
1
1
1
0
1
1
1
1
1
0
1
1
1
1
1
0
- 3"
4
0
0
0
0
1
0
1
1
1
1
1
0
1
1
1
1
1
0
1
1
1
1
1
0
zu
Es ist somit
det(A n)
=
n -1 -2 . det(A n n-
- -
1) .
Die Anfangswerte der Folge der Determinantenw erte sind
det(AI)
=0
wor aus sich die Beh auptung ergibt.
und det(A z)
=
- 1, D
235
17.3 Der Satz
Beweis (17.7): Für k > 0 betrachte man Permutationen mit genau k Fixpunkten . Unte r den n El em enten der Grundmenge kann man auf Weisen genau k El em ente aussuchen , die auf sich selbst a bgebilde t werden.
G)
Die übrigen n - k Elemente dürfen nicht a uf sich selbst abgebildet werden, d . h ., eingeschränkt a uf die se n - k Elemente liegt ein Derangement vor . Die folgende Matrix be schreibt die Permutationen mit genau k (ausgewählten) F ixpunkten (0. B . d . A. seien die Elemente 1,2, ... ,k fix) :
A( n,k )
=
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
1
1
1
1
0
1
1
1
1
0
1
1
1
1
0
Die Determinante die ser Matrix ist gleich det(A n - k ) , und wenn man in die zuvor schon bewiesenen Gleichung (17.6) nun n - k für n einsetzt, finde t man:
f +(n - k , 0) - f -(n - k , 0) =
( _l) n -k -l .
(n - k - 1) = det(A n _ k ) .
Mit dem Faktor G), der die verschied en en Möglichkeiten angibt, genau k EleD mente fix zu halten , folgt die Behauptung.
17.3
Der Satz
Die bisherigen Vorbereitungen dienen dem Ziel, folgenden Satz dig te Hauptergebnis - zu bewei sen :
das a ngekün-
Satz 17.3 Für n E N gilt
r (n, 0) = f(n, 2) , d. h., die Anzahl der P ermutationen mit genau zwei Fixpunkten ist gleich der Anzahl der ung eraden P ermutationen ohn e Fixpunkt.
17 Zählen mit Permanent en
236
17.4
Beweis der Aussagen (17.1) und (17.2)
Als Hilfsmittel für den Beweis des Satzes 17.3 zeige ich nun (17.1) und (17.2). B e w e is (1 7. 1 ): Behauptung: D.; = (n - 1) . (D n-l
+ D n - 2)
Nach (17.5) ist D n = per(A n ) . Die Permanente kann man - ähnlich wie von der Det erminante bekannt - nach eine r Zeile od er Spalte ent wickeln . Ab er die Determinante 'alt ern iert ' , das tut die P ermanente nicht: Alle Vorzeich en b ei der En twicklung sind positiv. Bei Entwicklung nach der ersten Zeile ergibt sich : 1
1
1
1
1
0
1
1
0
1
1
0
1
D n = (n - 1) . per
1
1
(n - l) x( n -l)
Nun steckt hinter dieser Permanente ein kombinatorisches Problem. Es geht um Permutationen, und in der ersten Spalte stehen nur Einsen , d . h. , diese P ermanente zählt die Möglichkeiten, das Elem ent 1 b elieb ig und kein es der Elem ente 2 bis n auf sich selbst abzu bilden . Die hier auftretenden P ermutationen kann man disjunkt aufteilen auf die Fälle
a.
P ermutationen , die 1 auf 1 abzubilden, und
b. P ermutationen , die 1 nicht auf 1 abzubilden. Ausgedrückt in P ermanenten b ed eutet das:
per
1
1
1
1
1
0
0
0
0
1
1
1
1
0
1
1
0
0
1
1
1
0
1
1
1
1
0
1
0
1
0
1
1
1
0
1
1
1
1
0
0
1
1
1
1
0
= per
Die erste P ermanente hat den Wert D n Dn - 1•
+ per
0 2.
Die zweit e Pe rmanente hat den Wert
Eingesetzt in (17.4) ist das die Behauptung: D n
= (n - 1) · (D n - 2 + D n -
B eweis (17.2) : Aus (17.1) folgt durch Umordnen
D n = n.- D n -
1
+ n.- D n - 2 -
Dn-
1 -
D n- 2 ,
l)
D
237
17.5 Beweis des Satzes und weiter D n - n · D n - 1 = - D n - 1 + (n - 1) . D n - 2 .
(17.8)
bn :=D n - n ·D n - 1,
(17.9)
Set zt man
dann laut et (17 .8) nun
b«
=
(17.10)
- s .;. «.
Es ist b1
= D 1 - 1 . Da = 0 - 1 = - 1,
(17.11)
und som it (17.12)
o
Aus (17.9) und (17.12) folgt die Behauptung.
17.5
Beweis des Satzes
W ir kommen nun zum Beweis des Satzes 17.3:
j -(n , 0) = j (n , 2) Es geh en all e zuvor bewiesen en Aus sag en in den Beweis ein. B e w eis : W ir schreib en gemäß (17.4) un ter Verwendung von (17 .3) sowie (17 .6) un terein ander :
j +(n , 0) + r (n , 0) = D n
(17.13)
f +(n , 0) - r (n , 0) = ( _1)n - 1. (n - 1)
(17.14)
Subtrahiert man (17 .14) von (17 .13) , erhält man:
2 · r ( n , 0) = D n - ( _1) n- 1 . (n - 1)
= Dn
- ( _I) n - n. ( _l) n-l
(17.15) (17.16)
E inse tzen von (17 .2) in (17.16) ergibt: (17.17) Nochmaliges Einsetzen von (17.2) erg ibt :
=
Tt :
(n - 1) . D n -
2
(17.18)
238
17 Zählen mit Permanenten
Zusammenfassend:
Arg ume nt iert man wie im Beweis von (17 .7) , find et man :
G). D n - 2 ist gleich der An zahl der P ermutati on en m it gen au zwei Fi xpunkt en . D
Der Beweis ist st rec kenweise t echnisch, hat ab er au ch a usgep rägte kombinatorischen Argument e. Es mag andere Beweise gebe n, ab er ich wollt e das verwende n, was zuletzt im Forum von Matroid s Mat he pla ne t eine Roll e ges pielt hat . Fall s sich jemand fra gt, wozu P ermanenten gut sind, hier hat er ein Beispi el. Mar tin Wohlgemuth , Dipl.-Ma th . au s Wi t ten a n der Ruhr .
18 Binomialmatrizen und das lemma von Gessel-Viennot
Übersicht 18.1 Die Binomialmatrix
239
18.2 Pfade und Pfadsysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 241 18.3 Das Lemma von Gessel-Viennot
243
18.4 Die Determinante der Binomialmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . 244
18.5 L U -Zerlegung der Binomialmatrix 18.6 Ein weiteres Beispiel -
246
Spinne und Feind . . . . . . . . . . . . . . . . . . . . . . . 249
Was haben Determinanten und gerichtete Graphen gem einsam? Auf den erst en Blick scheinen beide Obj ekte nur wenig miteinander zu tun zu ha ben . Das Lemma von Gessel-Viennot st ellt jedoch ein e interessante Ver bindung her , die auf der Interpretation einer Matrix als gewichtete Inzidenzmatrix beruht . Es wird sich herausstellen, dass die Determinante einer Matrix durch Au szählen bestimmter gewichteter Pfade berechnet werden kann .
18.1
Die Binomialmatrix
Mit Hilfe des Lemmas wird gezeigt, dass für b eliebig es n E N die sogenannte Binomialmatrix (od er Pascal -Matrix) Pn = (Pij) ij mit n X nEinträgen
.._(i+ 2)
P'J -
j -
J. - 1
die Eig ens chaft
det(Pn ) = 1 hat .
240
18 Binomi alm atrizen und das Lemm a von Gessel-Viennot
Anmerkung: W ir verwenden es hier nic ht , aber es sei erwäh nt: Die Bi nomialmatrix ist unimodular. Die Matrix Pn ent h ält di e Zeilen des Pascalseh en Dreiecks in den Gegendiagona len . 1 2
CD
Zum Beispiel ist P4 =
4
1
CD
CD 4
6
10
10
10
Die eingekreisten Zahlen stehen im P ascal sehen Dreieck in der vierten Zeile . Die Determinante einer Binomialmatrix auf naive Weise zu berechnen ist für große n recht aufwändig. Für n = 3 ist es dank der Regel von Sarrus noch einfach:
m ) (~ ~ ~) m = det
136
= 1 · 2· 6+ 1 · 3 · 1+ 1· 1· 3- 1 · 3 ·3- 1 · 1 · 6- 1 · 2· 1 = 12 + 3 + 3 - 9 - 6 = 1 Den Beweis , dass det Pn = 1 fü r alle n E N, kan n man mit einigem Aufwand m it dem Gaußschen Algo rithmus schaffen . Das ist aber hi er nicht unser Ziel. Das Lemma von Gessel-Viennot bietet einen ganz unerwarteten und vie l einfacheren Weg zu diesem Ergebnis . Ma n kann nämlich Eintrag P ij der Binomia lm a t rix a ls die Anzahl gerichteter Pfade von A i na ch B i in einem gerichteten Graphen ident ifizieren. Wir er klären das a nhand von P3 und dem folgenden Graphen 18.1.
A3
~---~~---~
Abb. 18.1: Gerichteter Graph !h zum P3
Von A l na ch B j gibt es stets nur eine n P fa d . Auch von A i nach B I gibt es stets nur eine n Pfad. Die Anzahl der möglich en Pfade von A i nach B j kann
18.2 Pfade und Pfadsysteme
241
man rekursiv zä hlen. Nennen wir die An zahl der Wege von A i nach B j für den Moment c(i,j) . Von A i kann man zunächst eine n Schritt nach ob en , also nach A i - l , geh en oder man geht eine n Schritt nach rechts. Die An zahl der Weg e von A i - l nach B j ist c(i - 1,j) . Ist man aber einen Schritt nach rechts gegangen, so hat man von dort c(i ,j - 1) Möglichkeiten, denn es gibt von dem erre icht en Knoten nach B j eb enso viele Möglichkeiten wie von A i nach B j - l ; das Problem wird als o einfach ein Kästchen nach links verschoben . Somit ist : c(i, j )
= c(i - 1,j) + c(i, j - 1) c(l , j ) = c(i,l) = 1
(18.1)
Diese Rekursion gilt a uch für die Matrixelemente, denn dort stehen die Binomialkoeffizienten des Pascalsehen Dreiecks in den Gegendiagonalen. Bezogen auf die se Indizierung ist die gefundene Rekursion identisch mit der des Pascalsehen Dreiecks. Da a uch die Anfangswerte, nämlich Einsen an den Außenseiten des Dreiecks bzw. der Matrix, übereinstimmen, ist klar, dass die Matrixelemente P ij und die Wegezahl von A i nach B j in einem solchen Graphen gleich sind. Jetzt wollen wir aber erfahren , auf welche Weise das Lemma von Gessel-Viennot aussagt , dass die Determinante der Matrix Pn gleich eins ist. Auf dem Weg zu di esem Ergebnis brauchen wir einige Definitionen , die im folgenden Abschnitt gegeben werden .
18.2
Pfade und Pfadsyst eme
Wir betrachten von jetzt a n einen endlichen , gerichteten , azyklischen, gewichteten Graphen 9 = (V, E) mit der Eckenmenge V (engl: vertices) und der Kantenmenge E (engl: edges) . Außerdem seien noch zwei Mengen A , ß <;;; V mit jeweils genau n Elementen festgelegt , wobei die beiden Mengen nicht notwendigerweise disjunkt sein müssen.
Definition 18 .1 (Pfad) Sei A i E A und B j E B . Ein gerichteter Kantenzug von A i nach B j in 9 heiße Pfad. Einen konkret festgelegten Pfad von A i nach B j notieren wir kurz als • A i -+ B j . D efinitio n 18 .2 (Pfadsy stem zu Sn) Es sei a eine Permutation aus Sn . Ein Pfadsystem Pfaden
Al
-+
Ber (l ) "'"
An
-+
Ber (n)'
P er
ist eine Sammlung von n •
242
18 Binomialmatrizen und das Lem ma von Gessel -Viennot
Natürlich wird es im Allg emein en zu jed er P ermutation a mehr er e oder a uch einm al kein e ver schiedenen P fadsysteme geb en. Abbi ldung 18 .2 gibt zwei verschi edene Pfadsystem e zur identischen Permutation id an (d . h ., es müssen dr ei Pfade Al -+ B I , A2 -+ B2 und A 3 -+ B 3 existieren , dafür gibt es mehrere Mög lichkeiten) .
BI I I I I I
I I I I I
----- 1
Al i - - - - 1
I I I I
A 2 +----.+- - - - - -
I
BI
-----1
Al i - - - - -
I I I I
1 1
I
-!
1
A2
-----3~ -
+ 1 -
- - -
~
I I
I 1
I
I
I
A 3 l...
A 3 l... - - - - ~ - - - - ~
I
~ - - - - - -J
Abb. 18.2: Zwei verschiedene Pfadsysteme zu P3: Im erste n berüh ren sich die einzelnen Pfade nicht , im zweit en gibt es eine gem einsame Ecke, solche Pfad e werden später durch das Lemma aussortiert.
Wir wollen jedem solchen Pfadsystem ein Gewicht zuordnen:
D efinition 18.3 (Pfadgewicht ) Das Pfadgewicht des P fades A i -+ B j ist defin iert als Produkt der Kan tengewichte in diesem P fad . Wir schreiben dafür w (A i -+ B j ) . Ist A i -+ B j der triviale Pfad , d. h. A i
= B j , so sei das P fadgewicht
1.
•
Diese Definit ion weiten wir a uf Pfadsysteme a us:
D efinition 18.4 (Gewicht e ines Pfadsyste m s ) Das Gewic ht w( P er) des Pfa dsys tems Per ist definiert als w (P er) :=
TI
w(Ai -+ Ber(i))'
A i -+B~ ( i ) EP~
das ist das P rodukt der P fadgewichte der enthaltenen Pfade.
•
D efinition 18.5 (Signum e ines Pfadsystems) Für ein P fadsyst em Per zu einer P ermut at ion a E Sn ist das Signum des Pfadsystems definiert als sign (P er ) := sign (a ), d . h., das Signum des P fadsyst ems ist das Signum der Permutation. Sch ließlich definieren wir :
•
243
18.3 Das Lemma von Gessel-Viennot
D efinition 18.6 (Pfadmatrix) F ür den Graphen 9 und die Eckenmengen A und ß mi t jeweils n Ecken A i und B j definieren wir die Pfadmatrix M = (rnij ) durch
rnij:=
2::
w(A i --+ B j)
Ai-+ B j
für i , j E {I , . . . , n} . rnij ist also die Summe der Pfadgewichte aller Pfade von A i nach B i - Sind alle Kant engewichte gleich 1, so ist rnij gerade die An zahl der • P fad e von A i nach e. . Nun kann die Leibniz-Formel für die Berechnung der Determinante eine r quadratischen Matrix M
2:: sign(a) · rnlo-(l) .... . rnno- (n)
det(M) =
(18.2)
a ESn
umformuliert wer den , denn wir können die in de r Summe auftauchenden Matrixeint räge nun als Pfadgewichte von Pfadsystemen zur Permutation a inter preti eren . Mit den obigen Bezeichnungen gilt demnach
(18.3)
sign(a) . w( Po-) .
det (M ) = P fadsystern e P a
Definition 18.7 (eckendisjunkt) E in Pfadsystem, in dem die Pfade keine gemeinsamen Ecken haben , heißt eckendisj unkt. •
18.3
Das lemma von Gessel-Viennot
Das Lemma la utet : Satz 18 .8 (L emma von G ess el-V ie n n o t ) S ei 9 = (V, E ) ein endlicher geri chteter azyklischer gewichteter Graph. Seien A = {Al , . .. , An} un d ß = {B I , .. . , B n } zwei n -elem entig e M engen mi t A, ß <;;;; V gegeben und sei M die zugehörige Pfa dm atrix .
Dann gilt: sign(P) . w( P)
det M =
(18.4 )
P e ckendisjunk t
Den vollen Beweis dieses Lemmas findet man in
T HE B O OK
[561.
Im Beweis zeig t man, dass nur die eckendisjunkten Pfadsysteme etwas zur Summe beitragen .
244
18 Bino m ia lmat rize n und das Lemma von Gessel-Viennot
Bet rachten wir nämlich ein Pfadsyst em mit zwei Pfaden , die nicht eckendisj unkt sind , so gibt es eine erste Ecke, an der die b eid en Pfade sich berühren . Dann kann man a be r bei diesen beid en P fad en den "Schwa nz" tauschen (en gl. tail swap, d . h ., a b dieser Ecke setz t man Pfad 1 fort mit Pfad 2 und um gekehrt (sieh e Abbildung 18 .3) . Zu den b eid en nicht eckendisjunkten P fade n gibt es damit zwei andere ebe nfalls nicht eckendisj unkte Pfade, die in sgesamt üb er dieselb en Kanten füh ren, a be r sie haben ein ander es Signum. Folglich wird der Beitrag eines nicht eckendisj unkten Pfadsyst em s durch ein anderes ebe nfalls nicht eckendisj unkte s Pfadsyst em gleich en Pfadgewichts, das mit ander em Vorzeichen b ewertet wird, a usgegliche n. Ai
Ai
.- - - - ~.....
.- - - - ~.....
-,
.....
.....
.....
.....
.....
.....
..... "-
"-
"- -,
~-
- -
~. B(j (j )
Abb. 18.3: Beisp ielhafte r tai/swap. Die Ecke X se i die erst e, an der sich die Pfad e Ai --+ B U(i) und Aj --+ B u(j) berühren . Durch die Operation tt wird der "Schwanz getausch t".
18.4
Die Determinante der Binomialmatrix
Um nun det(P3) zu ber echnen , b enutzen wir das Lemma von Gessel-Viennot und sum miere n üb er die signierte n Gewichte aller eckendisj unkten Pfadsystem e. Wi e viele eckendisj unkte Pfadsyst em e gibt es für den Graphen a us Abbildung 18.1 ? Nur eines, nämlich Al --+ B1 ,A2 --+ B 2,A3 --+ B 3; dieses ist in Abbildung 18.4 mit fetten Kanten eingezeichne t.
Würde nämlich ein Pfad von Al nach B2 od er B 3 führen , so mü sst e ein Pfad zu B1 diesen Pfad berühren. Somit muss in eine m eckendisj unkte n Pfadsyst em
245
18.4 Die Determinante der Binomialmatrix
BI
AI 1 - - - - -
Bz
I I I I I
Az + - - - -...f- - - - - -
Abb. 18.4: Der Graph zu P3 mit dem einzigen eckendisjunkten Pfadsystem
der Pfad Al -+ B I en thal ten sein. Würde dann ein Pfad von A z nach B 3 füh ren , so müsste ein Pfad zu B z die sen Pfad be rühren . Somit muss in einem eckendisjunkten Pfadsystem der P fad A z -+ B z en thal ten sein. Dann bleib t noch der Pfad A 3 -+ B 3 zur Vervoll st ändigung de s P fad systems. Zu dem Pfadsystem Al -+ BI , A z -+ B z , A 3 -+ B 3 gehört die identische Permutation id . Der en Signum ist 1. Wenn wir a ußerde m alle Kantengewichte als 1 festl egen, dann ist bei allen dr ei Pfaden in diesem Pfadsyst em das P fadge wicht gleich 1. Es ergibt sich demnach : sign (P ) w (P ) P e c ke nd is ju n k t
sign (id) . w(A I -+ B I) . w( A z -+ B z ) . w (A 3 -+ B 3 )
z
1 ·1 · 1 ·1
4
1
Die Verallgemeinerung auf beliebiges n ist völlig a nalog, indem man den Graphen um weite re Ecken und Kanten erweitert . Wieder kann es nur ein eckendisjunktes Pfad system geben , woraus sofort die Behauptung folgt : det(Pn
)
=1
Die Wahl des Graphen in diesem Beispi el ist entsche ide nd für die Komplexität der durch zuführenden Berechnungen . Der hier gewählt e Graph stellt sich als sehr güns t ig heraus, da es nur ein eckendisj unktes Pfadsyst em gibt . Im Allgem ein en ist die Su che nach geeignet en Graphen keine einfache Aufgabe.
246
18.5
18 Binomialmatrizen und das Lemm a von Gessel-Viennot
L U-Zerlegung der Binomialmatrix
Teilen wir den Graphen entlang der Diagonalen , so wie in Abbildung 18.5.
,,
,,
,,
,,
,
,,
,,
,,
,,
,
'.
Abb. 18.5: Geteilte r gerichteter Graph zum P3
Den linken , unteren Teil des Graphen nennen wir L n . Den rechten , oberen Teil nennen wir Un . Für beide Graphen stellen wir die Pfadmatrizen auf. Ln = (lij) sei die Pfadmatrix zu L n (L für .Lower") und Un = (Uij) die zu Un (für "Upp er"). Die Knoten auf der Diagonalen nennen wir für den Moment D l (links oben) , D 2 (Mitte) und D 3 (rechts unten). Wir zählen nun in L n die Pfade von A i zu den Ecken auf der eingezeichneten Diagonalen: Von Al gibt es nur einen Pfad, nämlich zu D l . Von A 2 gibt es genau einen Pfad nach D'; und genau einen Weg nach D l . Von A 3 gibt es genau einen Pfad nach D l , zwei Pfade nach D 2 und einen Pfad nach D 3 . Es ist
Dann zählen wir in Un die Pfade von den Diagonalknoten zu den B i: Von D l gibt es nur einen Pfad, nämlich zu B I. Zu B 2 gibt es genau einen Pfad von D l und genau einen Weg von 02 . Zu B 3 gibt es genau einen Pfad von 01, zwei Pfade von 02 und ein en Pfad von 0 3. Somit ist
Jeder Pfad von A i nach B i führt üb er die Diagonale. Die Anzahl der Pfade, die von Ai nach B j führen , ist gleich der Anzahl der Pfade, die von A i zu einem
247
18.5 LU-Zerlegu ng der Binomialmatrix
Diagonalknoten Di; führen , multipliziert mit der Anzahl der Pfade, die von dem erreicht en Diagonalknoten Di; zu B i führen . Diese Anzahl ist also gleich l il . Ulj + lcz . UZj + Iss : U3 j + .. ., für all e i ,j E {I, . . . , n} . Das bed eutet: (18.5) Nun ist Ln eine untere Dreiecksmatrix und Un eine obere, somit ist det Ln = det Un = 1, denn in beiden Matrizen sind alle Diagonalelemente gleich 1. Weil nach den Rechenregeln für die Determinante det Pn = det Ln ·det Un gilt , haben wir, ganz unerwartet , einen zweiten Beweis für die Behauptung det P n = 1. Zudem haben wir eine sogenannte L U-Zerlegung für die Matrix Pn gefunden . Es ist immer ein wichtiges Ziel bei der numerischen Lösung von Gleichungssystemen oder für die Invertierung von Matrizen, dass man Probleme so aufbereitet, dass sie numerisch stabil lösbar sind. Eine gefundene LU-Zerlegung vereinfacht die Rechnung wesentlich. In numerischen Berechnungen treten Binomialmatrizen in a llerlei Zus ammenhängen auf, u. a . im Zusammenhang mit Berechnungen von Fouriertransformation und bei der "f ast multipole method (FFM)" , eine m Verfahren zur Beschleunigung gewisser Berechnungen , die im Zusammenhang mit dem N-Körper-Problem auftauchen . Betrachten wir noch einmal die Matrix Ln. Welche Eigenwerte hat sie ? Da es sich um eine untere Dreiecksmatrix handelt , stehen die Eigenwerte a uf der Diagonalen, es ist somit 1 der einzige Eigenwert. Unt er den Eigenvektoren zum Eigenwert 1 findet sich ein ganz besonderer, nämlich der, in dem die Bernoulli-Zahlen (siehe Kapitel 14) stehen. Für die Bernoulli-Zahlen gilt (sieh e (14 .1) im Beweis von Satz 14.2): (18.6)
Schreiben wir (18.6) a ls Matrixgleichung (am Beispiel n 1
0
0
0
- 1
- 1
0
0
1
2
1
0
- 1
-3
-3
- 1
BI Bz B3 B4
= 4) :
B1 Bz B3 B4
so hat das bis auf die Vorzei chen die gleiche Gestalt wie das Eigenvektorproblem für Ln . Für einen Eigenvektor v zum Eigenwert 1 muss nämlich L 4 ·v = v gelten.
248
18 Binomialmatrizen und das Lemm a von Gessel-Viennot
Am Beispiel n = 4:
L4' Y =
1
0
0
0
VI
VI
1
1
0
0
V2
V2
1
2
1
0
V3
V3
1
3
3
1
V4
V4
= Y
Mit Hilfe eine r n x n Mat rix J n = (jk lh l, jk l = ( _l)k-l für k = 1 und 0 sonst , können wir sch reiben:
J« : L 4 ·
y
=
1
0
0
0
1
0
0
0
VI
VI
0
- 1
0
0
1
1
0
0
V2
V2
0
0
1
0
1
2
1
0
V3
V3
0
0
0
- 1
1
3
3
1
V4
V4
=
y
Die Zeilen der Matrix J n . L n enthalten genau diese Bedingungen . Die Bernoulli- Zahlen als Eigenvektor , das ist ein int er essanter Ged anke, denn mit Hilfe von Eige nvekt ore n lassen sich Lösungen für Gleichungen leichter errechnen . Die Mat rix J n mu ss dabei nicht störe n, denn sie hat nur gute Eigensc haften, wie et wa detJn = 1, J;; 1 = J n und = E n (di e n x nEinhe its mat rix).
J;,
Die Matrizen L n und Un wer den für gewöhnlich eb enfall s Binomialmatrizen gen a nnt, denn auc h da rin st ehe n die Zahlen de s P ascal sehen Dreiecks, ledi glich in anderer R ichtung. Die Binomialmatrix hat no ch weiter e inter essante E igensc haft en , siehe [57] und [58]. Ger ade in der an gewandten Mathematik find et die Binomialmatrix erneut e Au fmerksamkeit . Ich bin kein Sp ezialist für diese Themen , darum zit iere ich Aburden e und Dorband [59]:
Pas cal's matrix plays an important role in the computaiion of the dis cret e Legend re, Laqu erre, Hermite, and binomial tran sforms . In parti cular, Pas cal's matrix helps to un ify the [ormulaiion of these orthogonal transforms an d demonstrate th e similarity of the computat ion of the transform m atrices. It also allouis the ident ijication of the id entical computations needed f or th ese transform s. Th e fundam ental jinding is based on th e discovery of the relationship beiuieen Pas cal's matrix and th e binomial coeffic ient.
18.6 Ein weit eres Beispiel -
18.6
249
Spinne und Feind
Ein weiteres Beispiel -
Spinne und Feind
Zum Abschluss dieses Kapit els geben wir ein weiteres Beispiel für eine Anwendung des Lemmas von Gessel-Viennot. Angenommen , zwei Wanderer, nennen wir sie Spinne und Fein d, starten gemeinsam a n einem Ort . Beide hab en das gleiche Ziel und gehen gleich schnell. Sie hassen sich aber so sehr, dass sie weder den gleichen Weg gehen noch es ert ragen , des ander en Weg a uch nur zu ber ühren . Dass die beiden am Start und am Ziel zusammentreffen , ist nicht zu verhindern, es ist ab er auch akz eptabe l, den n dort , am Start und am Ziel , ist durch die Anw esenheit a nder er Men schen ein spontanes Aus brechen des Streits ausgeschlossen . Die bei den Wanderer sollen sich auf einem rechteckigen Gitter bewegen , dessen Kant en gerichtet sin d und st ets nur nach Norden oder O st en führen . Sie starten in der linken unt er en Ec ke. In Abbi ld ung 18.6 sind in einem 8 x 5 Sch ritte großen Gebiet zwei einander nic ht kreu zende und (mit Ausnahme von Start und Ziel) einander ni cht b er ührende Wege eingezeichnet . Ziel
:
Start
:
:
Abb. 18.6: Ein möglicher Wegverlauf für die beiden Wanderer
Wir wollen der Frage nachge hen , wie viele verschiedene einander außer an St a rt und Ziel nicht berührende oder überkreuzende Wege es für die Wa nderer in einem gegebenen rec hteckigen Gebiet gibt. Um so ein P roblem zu lösen , bietet sich das Lemm a von Gessel-Viennot an . E s be sagt , dass die An zahl eckendisjunkter (a lso einander nicht berührender) P fade gerade die Determinante einer bestimmten Ma t ri x ist .
250
18 Binomialmat rizen und das Lemma von Gessel-Viennot
Bezeichnet man mit N die Anzahl st reitfreier Wege für ein n x m groß es Gebi et, dann wir d sich herausst ellen, dass
N
=
~ n
(n + 1)(n+ 2). m -
m -
n -l
n -l
Gegeben sei also ein festes Ge biet der Größe n x m , n und m be liebige natürliche Za hlen . Wi r konst ruieren einen endlichen gerichteten azyklischen, gewic hteten Graphen , so wie in Abbildung 18.7 bei spie lhaft gegeben. Die Ka nte ngewichte setzen wir alle auf 1. B1
A2 Abb. 18.7: Ein Beispiel für einen Graphen, wie er zur Verwendung des Lemmas von Gessel-Viennot für das Wandererproblem in einem 4 x 3 Gebiet notwendig ist .
Die beiden Ecken für St art und Ziel sind in Abbildung 18.7 entfernt . Den Start müssen Spinne und Feind über vers chiedene Kanten verlassen , da sie sich sonst schon nach dem er sten Schritt wiederträfen . Der eine geh t nach Ost en , der a ndere nach Norden (od er umgekehrt). Ab de r nächsten Ecke, die sie er reichen (A l bzw. A 2 ) werden zwei eckendisjunkte Pfade nach B 1 bzw . B 2 gesucht. Von B 1 oder B 2 führt der let zte Schritt zwangslä ufig ins Ziel. Für den oben eingefü hrten Graphen mit A wir die Pfadmatrix
!vI
=
(
m ij
{ A l , A 2 } und B
m mll
m21 a uf und best immen die Anzahlen
=
= {B 1 , B 2 } st ellen
12)
m22
(a nhand von Abbi ldung 18.7) wie folgt:
Alle Wege von Ai nach B j hab en die Länge n
+m
- 2 .
Für je den Weg von A l nach B 1 sin d n - 1 Schritte in Ost richtung und m - 1 Schrit t e in Nor drichtung zu abso lvieren . Man b est immt alle möglichen Wege, indem m an von den n + m - 2 Schritten, die m an machen mu ss, diejen igen n - 1 a uswählt , die nach Nor den führen sollen . Das geht a uf mll = (n ~:;-2) Weisen . Analog für die Wege von A2 nach B2.
18.6 Ein weiteres Beispiel -
251
Spinne und Feind
Hin gegen ent halten die Wege von Al nach B2 genau m - 2 Schritte in Nordrichtung und n Schritte in Ostrichtung. Die An zahl dieser Wege ist gleich der An zahl Möglichkeiten m - 2 Schritte au s n + m - 2 Schritten auszuwählen, die nach Norde n führen sollen . Alternativ kann man au ch die n Schritte nach Osten au swählen . Für die Wege von A 2 nach B I sind m Schritte nach Norden und n - 2 Schritte nach Os ten notwendig. Wir haben also :
Daraus folgt mit Hilfe der Regel von Sarrus:
(n +m -2)!
(n +m -2)!
(n - 1)! (m - 1)!
(n - 1)! (m - 1)!
(n +m -2)! ( (n - l)!(m - 1)! =
)2
(n +m -2)! (n -2)!m!
(n +m -2)! n! (m - 2)!
n +m -1 mn
~(n ::;l) (n ::;2)
Damit ist die Anzahl N der Wege mi t gemeinsamem Start- und Endpunkt ohne Streit (d . h ., ohne dass sich Spinne und Feind unterwegs treffen) gegeben durch
N
=
2.det
M =
~ n
(n + 1) (n +n -1 2) . m -
n -l
m -
(18 .7)
Der Fak tor 2 trägt dem Umstand Rechnung, dass Spinne und Feind a uf 2 Weisen auf die beiden Knoten Al und A 2 verteilt werden können . Im Beispiel aus Abbildung 18.7 ist n = 4 und m = 3. Es ist
M=
10 ( 10
und somit ist N = 2· det(M) = 2· (100 - 50) = 100.
Peier Keller ist Dipl.-Math. und lebt in Berlin.
Teil 111 Geometrie und Konstruierbarkeit
19 Mathematik des Faltens Winkeldreiteilung und der Satz von Haga
Übersicht 19.1 Winkeldreiteilung
255
19.2 Sa tz von Haga und Verallgemeinerung
257
19.3 Konstruktion eines Silbernen Rechtecks. . . . . . . . . . . . . . . . . . . . . . . .. 261 19.4 Schlussbem erkung
264
Bei Falten denkt sicherlich der eine oder andere sofort an Alterserscheinungen, doch soll es hier um Origami gehen, die japanische Kunst des P apierfaltens . Das Wort Origami setzt sich a us den Teilen "ori" und "kam i" zus ammen (das k des zweit en Wortteils wird in der Zusammens et zung wie ein g ausgesp ro chen) und bed eutet sch licht Papierfalten. Mit den Mitteln, die Origami bietet, wollen wir im Weiteren zeigen, wie man einen beliebigen Winkel in drei gleich große Stücke teilt . Anschließend werden wir mit Hilfe des noch zu formulierenden Satzes von Haga ein Silbernes Rechteck in ein Quadrat einbeschreiben. Die Arbeiten von Kazuo Haga umfassen noch weitere Sätze, insbesondere Alternativen zu der hier vorgestellten Konstruktion, siehe z. B. [62] oder den Artikel Fold Pap er and enjoy Math: Origamics [61].
19.1
Winkeldreiteilung
Das klassische Problem der Winkeldr eiteilung mit Zirkel und Lin eal beschäftigt auch heut e noch viele Schüler (und auch so manchen Erwachs enen) , den n es klingt auf den erst en Blick unglaublich, dass m an den dritten Teil eines beli ebi gen gege be nen Wi nk els so nicht kon struieren kan n .
256
Winkeldreiteilung und Satz von Haga
Die Un möglichkeit liegt ab er in der Natur der erlaubte n Hilfsmittel und wurde schon in der Antike vermutet, konnte aber erst im 19. Jahrhundert von Pi erre Laurent Wen zel bewiesen werden . Der Beweis verlangt et was ti efere Kenntnisse der Algebra, er soll deswegen hier ausgelassen werden. Einen vollständigen Beweis find et man z. B . in [601 . Die Beschränkung der Hilfsmittel für die Kon struktion ist sogar notwendig, um die Unmöglichkeit der Kon struktion sicher zu ste llen. Läs st man zu, dass das Lin eal mi t Markierungen ver seh en werden darf, so gibt es eine Kon struktion. Diese hat Ar ehirned es vor et wa 2200 J ahren gefunde n. Die Markierungen dienen dabei ab er nicht zum Abmessen , vielmehr muss das Lin eal ent lang eines fest en Punktes so gedreht und vers chob en werden , dass zwei Markierungen auf bestimmten Lini en zu liegen kommen . Es wird nun eine Mögli chkei t vorgestellt, eine Winkeldreiteilung allein mi t einem Blatt P apier und ein paar Falten (sprich: Faltvorgängen) zu bewerkstelligen. Alles, was man zum Nachfalten benötigt , ist ein rechteckige s Blat t P apier (handelsübliches DIN A4 Kopierp apier) ; es geh t natürlich a uch qu adrati sches Orig amipapier . Die genaue Anleitung gibt Abbildung 19.1.
Schritt 1: Wir falten zunächst zwei zur P apierkante parallele Hilfslinien ins P apier , wob ei die ent ste he nde n Rechtecke gleich groß sein mü ssen , d. h ., die Strecken AB und B C mü ssen gleich lang sein, die t atsächliche Länge spielt kein e Ro lle. Schritt 2: In diese Konstruktion hin ein falt en wir eine n b eliebigen Winkel a. Schritt 3: Als näch st es falt en wir den linken Rand des Papier s so um , dass Punkt D a uf de r St recke E B und Punkt P auf der St re cke DG zu liegen kommt . Schritt 4: Die Punkte P, E und D b estimmen nun neu e Punkte tr, E ' und D' . Wir markieren die Gerade durch diese Punkt e durch eine n weiteren Knick. Schritt 5: Falte Knicke durch D und D' sowie D und E' . Dann drittelt der "Knick" durch DD' und der durch DE' den Winkel a . Das sechste Bild zeigt alle Falten und die Ben ennungen der Punkte. Wir wollen nun b eweisen, dass die Kon struktion t atsächlich den Winkel a dritt elt. Satz 1 9 .1 Der in Abbildung 19.1 gegeben e Wink el zwischen den Stre cken DG und DC wird durch die St recken DE' und DD' in drei gleich groß e Wink el zer legt. B eweis : Bezeichne [ den Punkt, der durch das von D' auf die Strecke DC gefällte Lot ents te ht. Dann sind nach Kon struktion die Dreiecke DP' E ', DE' D' und DD'[ kongruen t und der Winkel ist damit exakt gedrittelt . D
19.2 Satz von Haga und Verallgemeinerung
~I 1-_-___-_-_---1-:
I, eD
I I
I
I
I
I
I
257 I
,
I
I~\
t-t'-y-~--1 B
Abb. 19.1: Die Anleitung zum Falten der Dreiteilung eines beliebigen Winkels o . Man wähle s beliebig, die genaue Länge der Strecke spielt keine Rolle, der Winkel wird unabhängig von der Wahl von s stets korrekt gedrittelt.
B eme rkung: Der wesentlich e P unkt der Konstruktion ist Schritt 3, in dem eine Falt e so gelegt wird , dass zwei Punkte geeignet zu liegen kommen . Dieser Schritt ist mit klassisch en Mit t eln (also mit Zirkel und Lin eal) nicht konst rui erbar, a uch nicht mit einem markierten Lineal. Es stellt sich also insbesondere heraus, dass mit Origami Konstruktionen möglich sind, die in der klas sischen Geometrie so nicht au sführbar sin d. An ders heru m kann man a ber mit Origami alle Konst ruktionen der klassischen Geometrie durchführen . Ori gami ist damit ein wenig ,,mächt iger" als die klas sische Geometrie.
19.2
Satz von Haga und Verallgemeinerung
Der Satz von Haga t rifft in sein er klassischen Form zunächst eine Aussage üb er die Ähnlichkeit von Dreiecken, die nach eine r noch vorzustellenden Faltseq uen z ents te he n . Er erlaubt insbesonder e eine gegeb en e Quadratseite in drei gleich große St reckenabschnitte zu t eilen . Zum Nach- un d Mitfalt en ist nun ein qu a-
258
Winkeldreiteilung und Satz von Haga
dratisches Blatt Papier notwendig. Die genaue Faltanleitung find et sich in Abbildung 19.2. Schritt 1: Man faltet ein qu adrati sches Blatt Papier zunächst in der Mitte, so dass zwei kon gruente Rechtecke ent st ehe n. Schritt 2: Fa lt e A auf B . Schritt 3: Markier e die Punkt e D , F , G und I. Das let zte Bild in der Sequen z zeigt alle Falten und die Ben ennungen der Punkte. I-- ~ - l B
A
CD
E
D
B
c
D F
G
G
H
8)
A
Abb. 19.2: Die Anleitung zum Nachfalte n des Sat zes von Haga Im Folgenden sei die Seitenlän ge des Qu adrate s ste t s ein s. Der Satz von Haga laut et :
Satz 19.2 (Haga) Di e Dreiecke [HG, BDG und BEF in Abbildung 19.2 sind ähnlich zueinander und es gilt das S eitenv erhältnis
IBDI : IB GI : IGDI
= 5 : 4 : 3.
259
19.2 Satz von Haga und Verallgemeinerung
Beweis: Aus Schritt 2 der Konstruktion ergibt sich sofort die Ähnlichkeit der Dreieck e. Man b enutze die Winkelsätze, um das einzusehe n. Am besten sieht man es, wenn man das Quadrat wie in Schritt 2 der Anl eitung gefaltet lässt .
Nach Konstruktion ist nun Strecke BC ist ~ .
IBDI
=
IDAI , ICDI + IDAI
= 1 und die Länge der
Da das Dreieck BDC rechtwinklig ist, kann der Satz von Pythagoras angewendet werden. Sei hierzu zunächst x die Länge der Strecke CD und y die Länge der Strecke BD .
+ y = 1 und y2 a us x + y = 1 au ch
Daraus folgt x Nun folgt
x2
= :i-.
x = 1 - y,
dies eingesetzt in die Gl eichung y2 - x 2 =
"41 =
y2 -
(
1 - Y )2
= Y2
:i-
ergibt
- 1 + 2y - Y 2
=
2y - 1,
woraus y = ~ folgt und damit x = ~ . Somit ist weiter
1 513 y: -: x = -: -: - =5:4:3 2
8
2
8
o
und damit das behauptete Verhältnis gezeigt. Bemerkung: Aufgrund der Ähnlichkeit der Dreiecke folgt auch
IBDI: IBCI : ICDI = !FBI : IEFI : IE BI = ICfl : IH fl : ICHI = 5 : 4 : 3. Aus diesem Satz kann man noch weitere Schlussfolgerungen ziehen: Korollar 19.3
Die Strecke FE hat eine Länge von ~ . B ewe is : Aus dem Satz von Haga folgt zunächst, dass FE : EB = 4 : 3 gilt. Nun ist aber nach Konstruktion schon IEBI = ~ .
Daraus folgt
!FE I =
.! ·4
_2 -
3
2
o
= - .
3
Insbesondere ist es dank des Korollars 19.3 möglich , die oben erwähnte Dreiteilung der Quadratseite vorzunehmen. Man konstruiert also zunächst den Punkt F und erhält IFE I = ~ und IFH I = 1 - ~ = Daher ist nur noch die Strecke EF zu halbier en . Das geht, indem der Punkt E mit dem Punkt F zur Deckung gebracht und das Papier ent spreche nd gefaltet wird. Die ent st andene Gerade t eilt die Strecke EF nach Konstruktion genau in zwei gleich lange Strecken zu j e eine m Drittel der Länge der Quadratseite.
k.
260
Winkeldreiteilung und Satz von Haga
Die entstande ne Einteilung kann b eispi elsweise als Ausgangs punkt für die Faltung eines 3 x 3 Gitternet zes verw endet werden. Die Seitenverhältnisse in den Dreiecken erge be n no ch mehr konkret e Werte für die Seitenl ängen, ins bes onde re auc h für das kleine Dreieck G H I : Korollar 19.4 Die Strecke G H hat eine Läng e von
i.
Beweis: Au s Lemma 19.3 erg ibt sich die Länge von FB zu ~ . Nun gilt nach Kon struktion 1 IHII = 1 -!FBI = - . 6
Damit folgt aus den im Satz von Haga b ewiesen en Seitenverhältnissen
I GHI= ~ .
o
Eben haben wir nur be t rachtet , was der Satz von Hag a liefert , wenn man von einer in iti alen Teilung der Quadrat seite in zwei Hälften a usgeht . (Zur Erinnerung: Die Strecke EE en t sprach in der Länge der halben Quadratseite) . Man kann dies jedoch a uf b eliebige Längen der St rec ke EB verallgem ein ern. Das Faltmuster, das dabei en t steht , un te rscheidet sich im Wesen tlichen nicht von dem zuvor vorge stellten , es werden nur die einzelnen Punkte etwas verschob en . Das mach t man sich am Besten durch einfaches Nachfalt en klar . Satz 19.5 Sei die Länge der Strecke B C glei ch nungen aus dem Satz von Haga :
±für z E ~ + . Dann folgt mit den B ezeich-
(i) Di e Dreiecke F E B, BC D und HG I sind ähnlich zu einander . (ii) Es gilt das Teilungsverhältnis der Seiten BD : B C : C D = z2
+ 1: 2z
: z2_ 1.
B e m e rkung : Der P ar ameter z a us dem Satz kann nun eine b eliebige reelle Zahl größer 1 sein. Der Grenzfall , wenn z gegen unendlich strebt, ist mit ein er Teilung der Qu adrat seite in unendlich viele Teilstücke äquivalent . Es passiert a ber ni cht s Aufregendes, es wird dabei lediglich A a uf C gefal te t und damit das Qu adrat in zwei gleich große Hälften geteilt . Alle im Satz be trachteten Dreie cke sind dann verschwunden, denn die Dreieckspunkte liegen dann a uf einer Ge raden.
±
B ewe is : Es gilt an alog zum Satz von Haga x + y = 1, IEFI = und 1/ z2 = y2 _ x 2, dabei ist wie vorhin wied er x := ICDI und y := IBDI. Mit eine r einfache n Rechnung analog zum Satz erg ibt sich das allgeme ine Teilungsverhältnis. 0
261
19.3 Konstruktion eines Silbe rne n Rechtecks
Mit z = 2 erhä lt man dann wied er den ursprünglichen Satz von Haga. Analog lass en sich auch di e Folg erungen für b eliebiges z formulier en . Tabelle 19 .1 listet , ohne ausführliche R echnung, di e exakten Längen all er Strecken in Abhängigkeit von z auf. Zusätzlich sind noch einm al all e Längen für z = 2 angegeben. Ta b. 19.1: Die Seiten längen der einzelnen Strecken in Abhängigkeit von z
I Strecke(n) I Länge allg . BC
1
CD
2Z"2
AD ,DB
2"Z""2
1
"2
z
z2_ 1
z 2+ 1
3
"8 5
"8 1
EB
~
FE
7=l
"3
Al ,BF
z 2+ 1 z( z+ l)
"6
"2
z
2(z- 1)
( z _1)2
GH
19.3
1z = 2 1
2
5
1
~
"8
Hl
z- l z (z+ l)
"6
FG,lG
(z2+ 1 )(z- 1) 2 z 2 (z+ l)
24
GD
IVZ2+1 z
~V5
1
5
Konstruktion eines Silbernen Rechtecks
Wir werden jetzt den Satz von Hag a benutzen, um ein Silbernes Re chteck zu konstruieren . Während der bekanntere Goldene Schnitt das Verhältnis zweier Strecken durch 1+ 2
V5 ~ 1 618
' beschreibt , ist es beim Silbernen Schnitt das Verhältnis
1
V2
~
0,707.
Ein Rechteck mit solchem Seitenverhältnis nennt man Silbernes Rechteck .
262
Winkeldreiteilung und Satz von Haga
Ein solches Seitenverhältnis ist die Grundlage des DI N A4 Format s (ein DI N A4 Blatt ist 210 x 297m m groß) , Nachrechne n erg ibt 210 ~ 0 707. 297 ' Die Kon struktion eines solchen Re chte cks nur m it Hilfe von P apier erfordert ein bissehen mehr Vorlei stung, daher verfolgen wir zunächst allgemeinere Fragen, die später wieder auf das gew ünschte Resultat zurückführen werden . Für den Satz von Hag a ist es nun eine int eressant e Frage , was passiert , wenn die Strecken B C und C D gleich lang sind , das Dr eieck B C D also gleichsche nklig ist. Zunäch st sind dann auch die anderen beid en Dreiecke wegen der Ähnlichkeits bez iehung ebenfall s gleichschenklig und die Forderung ist äquivalent zu der Bedingung (siehe den Satz von Haga in de r allgemeinen Form) 2z
=
1
Z2 -
od er umgeformt 0=
Z2 -
2z - 1.
Diese quadratische Gleichung hat nur eine positive Lösung, nämlich z = 1 + V2.
Mit Hilfe der Tabelle 19.1 und des b erechneten z = 1 +
V2 folgt
nun
1
V2 ' Das heißt, die b eid en Strecken BD und F B st eh en im Verhältnis des Silbernen Schnittes zueinande r , wenn das Dreieck B C D gleichschenklig ist . Es bleibt nun nur noch die Frage, wie man ~ = l+1y'2 = V2 - 1 kon struiert. Eine Mögli chkei t ist in Abbildung 19.3 gegeben. Dort wird zunächst die Länge der Quadratseite a uf eine der Diagonalen üb ertragen . Der ents tehe nde Punkt t eilt die Diagonale in zwei Teilstrecken . Die länger e hat eine Gesamtlänge von 1 und die kürzer e eine Länge von V2 - 1. Durch eine weiter e Faltung wird diese Länge auf eine der Quadratseiten üb ertragen . Mit klassischen Hilfsmitteln könnte man das mit eine m Zirk el schnell bewerkst elligen , hier ist es die in Abbildung 19.3 gegebene Origami-Konstruktion , die das bewerkstelligt . Zum Verglei ch sind au ch die nötigen Zirkelkreisbögen eingetragen (gestrichel t) . Der in der Abbildung kon struierte Punkt B' ist dann als Au sgangspunkt für die zum Satz von Hag a gehörende Kon st ruktion zu seh en . Die Faltung liefert a ber nur zwei der Re chteckseiten. Es sollte dem aufmerksamen Leser a be r leicht fallen , die letzt en beid en Seiten zu ergänze n . Ein klein er Tipp: Kein esfall s sollte man die ebe n vorgestellte Kon struktion von V2 - 1 ein zweite s Mal anwenden . Abbildung 19.4 liefert dann (nach Entfernen der Lini en aus der Hilfskonstruktion) das Ergebnis der Konstruktion .
263
19.3 Konstrukt ion eines Silbernen Rechtecks
J2 -
1
o Abb. 19.3: Faltanleitung zur Konst ruktion von
J2 -
1 an einer de r Quadratseiten
Abb. 19.4: Nach Ergänzung sollte das Faltmuster zur Konstruktion eines Silbernen Rechtecks in etwa so aussehen (plus einiger Extra-Falten aus de r Hilfskonstruktion, die hier aber wegge lassen wurden).
264
19.4
Winkeldreiteilung und Satz von Haga
Schlussbemerkung
Die beiden vorgestellten Sätze sind nur ein kleiner Ausschnit t a us dem Katalog möglicher Kon st ruktionen mi t Hilfe einfacher Fal t ungen . Fa szinierenderwei se sind unte r diesen Konstruktionen au ch Lösungen andere r klassischer Probleme , wie etwa die Konstruktion de r drit ten Wurzel a us 2, die ebenfall s mi t klassischen Mitteln nicht durchführbar ist . Mit t lerweile ist Origami ni cht nur ein probates Mitt el für den Schulunterricht zum spielerischen Erle rnen der Grundlagen der Geometrie, es gibt sogar schon Mat he mati ker , die die Geometrie der Origamifaltungen vollständig axiom at isiert und zu eine m, wenn a uch no ch kleinen , Teilgebi et der Mathe mat ik gemacht haben . Wer sich für eine axiomat ische Beschreibung des Origami a ls eigenst ändige Geometrie intere ssiert, sei a uf Origami and Geometri e Const ru etions von Robert La ng [62] verwiesen. Wer nun no ch denkt , Origami sei trot z a llem nur Spielerei oder bes tehe nur daraus, taus en de von Kranichen (Senbazuru} ' zu fal ten , frage sich einmal , wie man einen Airbag möglich st platzsp arend zu sa mmenfal ten kann , wie In sekten ihre Flügel unte r ih ren P anzer legen od er wie m an dünnwandige Spiegelteleskope platzsp arend in s All transporti eren kann. Für a ll die s (und na türlich no ch vieles mehr) sind ernst hafte Anw endungen entstande n, die längst ihren Platz und ihre Berechtigung in de r "ri cht igen" Wi ssen sch aft gefunden haben . Ich hoffe, dieses Kapit el ist fü r den einen oder a nderen ein Einstieg in die faszinierende Welt de s Origami . Wei tere Referenzen und eine Reihe von Anwendungen de s Origami findet man z. B . a uf Robert Langs Webseite www.langorigami. corn unter dem St ichwo rt "Scienc e".
P eier Keller ist Dipl.-Math. und lebt in Berl in .
1 Senbaz ur u - t au send Krani che. Der japanischen My thologie nach wir d ein Wu nsch gewährt , wenn man t au send Kraniche faltet. Die oh ne Unterbrechung zu faltend en Orizurus (Papierkra niche) stellen eine Opfer gabe an die Kranich-Got t heit dar.
20 Das regelmäßige Siebzehneck
Übersicht 20.1 Das Problem und die Rechnung
265
20.2 Die Konstrukti on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 270
20.1
Das Problem und die Rechnung
Carl Friedrich hat seinen 17. Geburt st ag . Zur Feier hat er 16 Gäste eingeladen, und es soll einen runden Kuchen geben . Nun sind die Gäste eifer sü chtig darauf bedacht , alle ein Kuchenstück in ex ak t der gleichen Form wie das von Carl Friedrich zu bekommen, denn keiner möchte sich ungerecht behandelt fühlen . Und da die Gäste alle glühende Verehrer der Euklidischen Geometrie sind , sollen bei der Ku chenvertei lung nur Zirk el und Lineal zum Einsatz kommen . Carl Fri edrich hat diese Aufgabe gelöst . Wi e und mit welch en Baustein en er das wohl geschafft hat , das werden wir nun Schritt für Schritt vorst ellen . Die Übe rlegungen des jungen Carl Fri ed rich sollte n spät er in dessen erste m gro ßen Werk veröffentlicht wer den : den berühmten Disqu isitiones A rithmetica e.
266
20 Das regelmäßige Siebzehneck
Erste Vorbereitung : Gerade in der vorigen Woche war es Carl Fri edrich gelungen zu zeigen, dass die komplexen Lösungen der Gl eichung 2 X "+ 1 -
1
=
°
eine zykli sche multiplikative Gruppe der Ordnung 2 n + 1 bilden. Er wu sste überdies, dass man die El em ente einer solchen Gruppe nur dann mit Zirk el und Lineal würde kon struier en können , wenn 2 n + 1 eine Primzahl wäre, was mit der Struktur ihrer Automorphism engruppe zus am me nhing - der en Ordnung 'P(2n + 1) musst e eine Zweierpoten z sein. Und als er no ch ein Kind war , hatte er schon herausgefunden , dass 2 n + 1 nur dann prim sein konnte, wenn n selbs t eine Zweierpoten z war , die Zahl a lso zu den bekannten Fermatprimzahlen gehörte. Dagegen sind Zahlen der Form 2 n + 1 ni cht prim, fall s n einen ungeraden Faktor u ent hält, denn in diesem Fall zerfä llt das Polynom
xn
+ 1 = X 2 k ,u + 1 =
(X
2k
) u
+1
in die Faktoren X
2k
+ 1 und
und folglich muss auch 2 2k lichkeit p = 2 + 1. Zweite Vorbereit ung:
k
(x 2 ) U -
2k 'U
1
k
- (x 2 )U- 2
+ - .. . -
+ 1 zus am me ngesetzt
x2
k
+ 1,
sein. Es bleibt nur die Mög-
Für k = 2 ergibt sich gerade 2
22
+1 =
17 -
eine Prim-
zahl. Daher bilden die Lösu nge n (j der Gl eichung x 17 - 1 = 0, j E {O, ... , 16} , eine Gruppe C, die isomorph zu Z17 ist, und die Aut omorphisme n dieser Gruppe bilden ihrers eits eine Gruppe der Ordnung 16. Der Schlüssel zur Konstruktion des regelm äßi gen Siebzehnecks lieg t in der Aufklä ru ng der Struktur die ser G ruppe. Die Au tomorphism en {'PP : C -+ C , ( j
H
(J I p E {1 , .. . , 16}}
der Gruppe de r Lösungen von x 17 - 1 = 0, die durch das Bild ( p von ( 1 unter 'PP zu ch ara kterisieren sind (und von den en ein einziges zu kon struier en das ganze Konstruktionsproblem darstellt) , bilden eine gleichfall s kommut a ti ve Gruppe, gen annt g , die zu Z]'7 ~ Z 16 isomorph ist . Die se Isomorphie erkennt m an daran , dass jedes 'P E 9 durch it eriertes E rhebe n der E rzeuger zur dritten P ot enz darstellbar ist ; der durch 'P3 : (j H ( } = (f 'j definier te Automorphismus ist von der Ordnung 16 und erzeugt g . Durch die Abbildung eines fest en Erzeugers von C (0. B . d . A. ( 1) a uf irgendeine n der 16 Erzeu ger kann eine Perm ut at ion a uf der Menge der Nullst ellen von x 17 - 1 induziert werde n , die mit der multiplikativen Struktur von dessen Zerfällungskörper L verträglich wäre, die al so zu eine m Körperautomorphismus fortgeset zt werden kann .
267
20. 1 Das P roble m und die Rechnung
Dritte Vorbereitung: Von dem b erühmten , leid er tragisch jung ver storben en französisch en Mathe mati ker Evariste Galois hatte Carl Fri edrich geh ört, dass den normal en Un t er gruppen
{id}
=
Go
=9
die ser Automorphismengruppe gewi sse Zwischenkörper L
= tc;
~
Kn-
1 ~ .. . ~
K o = Ql
zwische n Ql = K« und L = K n , in dem a lle Nullst ellen eine r a lgebraische n Gl eichung liegen , entspräc he n, und di e Grade [Ki+1 : K i ] der Körper erweit erungen ents präche n gen au den Indizes IGn - i/ Gn - (i + 1) I der Unterg ru p pen . Da diese Indizes in g , wie Carl Friedrich wu sste , alle 2 sein müssen, kann L ais Körperturm über Ql beschrieb en werd en , dessen "St ockwerke" sä mt lich qu adrati sch e Erweiteru nge n des jeweils darunter liegenden "Stockwerks" darst ellen . "So vie l Glü ck kann man au ch nur an seinem Geburt stag haben ", denkt Carl Friedri ch, Das vertrac kte Ku chenproblem kann also angegang en we rden. Vierte Vorbereitung: Rein re chnerisch scheint die Sache ja einfa ch: Die komplexen siebzeh nten Einhe its wurzeln haben di e Form
(k
=
e i . 2~;~
=
cos (
2
.
:7'7r) +
i . sin (
2
.
:7'7r) ,
denn sie a lle genügen de r Gleichung x 17 - 1 = 0. In der Gaußschen Ebene bilden sie gerade di e gesu ch te Zerlegung de s Ei nhe itskr eises. Praktischerweise gel ten für die se Einheitswurzeln die Re chenregeln (0 = 1,
(m ' (n
(0
+ (1 + (2 + ... + (16 =
= (m +nmod 17 V m , n
E
°
und
{O, . .. , 16}.
Damit bilden di e siebzehnten Einheitswurzeln eine zy klische multiplikative Gruppe der Ordnung 17, und j ed e außer ( 0 = 1 ist ein Erzeuger di eser Gruppe. J ed em Erzeuge r (p di eser Gruppe wied erum ents pricht ein Körper automorphismus CPP' der durch (j M für a lle j E {I , ... , 16} induziert wird . Die Me nge der E rze uge r werde im Folgenden mit E16 b ezeichnet.
(J
Fünfte Vorbereitung:
Do ch es gib t einen kleinen Un terschied zwi schen den Elementen von g , der mit der Untergru ppenstrukt ur von 9 ~ ;L16 zu sammenhängt : Wenn m an di e von CP2 erz eugte Untergruppe (CP2) untersu ch t , d . h . die (j iteriert quadriert , so stellt sich heraus, dass (CP2) von de r Ordnung 8 ist , 9 a lso in eine Unter gruppe U und eine gleich m ächtige Ne benklasse N zerfällt. Folglich zerfä llt a uc h E 16 in zwei ver schi ed en e Bahnen : Die, di e durch Anwende n von Automorphismen a us U aus ( 1 hervorgeh en , und d ie, di e durch Anwende n von Aut om orph ismen aus der en Ne benklasse N a us ( 3 hervorgeh en.
268
20 Das regelmäßige Siebzehneck
Mit Hilfe der obigen Rech enregeln kann man leicht herausfinden, wie diese Bahnen zusam me ngesetz t sind. Carl Fri edrich erkennt, dass für das Folgende diese Unterscheidung bedeutsam werden wird . Die erste Bahn fasst er in Q1 zusammen , die zweite in Q2 : E16 = Q1 U Q2 . Es sind
und
Für die Aufgabe der Ku chenteilung nutzt Carl Fri edrich die Darstellung der Einheitswurzeln als Ausdrücke mit transzendenten Funktionen wie exp , sin und cos herzlich wenig. Er muss versuchen , sie in algebraische Ausdrücke zu transformieren , die auf ganzen Zahlen und den Grundrechenarten sowie dem Zieh en der Quadratwurzel beruhen. Nur dann b esteht Au ssicht, sie mit Zirk el und Lin eal konstruieren zu können . Sechste Vorbereitun g:
Dazu stellt er die Summen
und a uf, die sogenannten Gaußs ehen Perioden. Für diese gilt a ufgru nd der Rechenregeln PI
+ P2 =
- 1
und , was etwas aufwändiger zu prüfen ist, PI ' P2 = - 4.
Diese Üb erprüfung kann mittels folgender Tabelle 20.1 erfolgen. Tab. 20.1: Zu r Auswertun g des P rodu kts der Gaußsehen Per ioden
(3 (5 (6 (7 (10
(1 (4 (6 (7 (8 (11
(12 (12 (13 (14 (15 (11
(2 (5 (7 (8 (9 (12 (13 (14 (16
(4 (7 (9 (10
(8
(9 (13 (11 (12 (16 (13 (14 (1 (14 (15 (2 (11 (1 5 (16 (3 (14 (1 (2 (6 (1 5 (2 (3 (7 (16 (3 (4 (8 (1 (5 (6 (10
(1 5 (1 (3 (4 (5 (8 (9 (10 (12
(16
(2 (4 (5 (6 (9 (10 (11
(13
In der Tabelle tritt jed es (j , j E {I, ... , 16} genau viermal auf, folglich ist das Produkt beid er Gaußseher Perioden gleich - 4.
269
20.1 Das Problem und die Rechnung
Sowohl Summe al s auch Produkt von PI und P2 sind ganzzahlig. Das kann nur heiß en, da ss beide mit Hilfe der Quadratwurzel ausgedrückt werden können :
(x - PI) . (x - P2) womit {Pi ,P2}
=
{ -~
-
~
= x2 -
(PI
+ P2) . x + PI ' P2 = x 2 + X -
. V17 , - ~ + ~ . V17}
4,
ist .
Ein Größenvergleich ergibt schnell: 1 PI = - 2
+ -1 . vTI 2
1 1 P2 = - - - - . ' 2 2
vTI
Ql zerfällt gleichfalls in zwei Bahnen, nämlich die Zahlen Q11, die beim iterierten Erheben zur 4. Potenz aus (1 hervorgehen, und die Zahlen Q 12, die dabei aus (2 hervorgehen. Siebte Vorbe reit ung:
In Q2 passiert das Gleiche; hier ergeben sich verschiedene Bahnen , wenn man (3(-+ Q2I) bzw. (6(-+ Q 22) iteriert in die 4. Potenz erhebt. Über Q11 , Q 12 , Q21 und Q22 bildet Carl Friedrich nun die Summen
P4
+ (4 + (13 + (16, (2 + ( S + (9 + (IS ,
Ps
( 3 + (S
(1
P3
+ (12 + (14 (6 + (7 + (10 + (11.
P6
Er fährt weiter fort wie im ersten Durchgang und findet P3 + P4
PI =
P3 ' P4
- 1,
p» + P6
P2 =
PS' P6
- 1.
- -1 + -1 . vTI 2
2
- -1 - -1 . vTI 2
2
'
'
Damit und mit zwei weiteren Größenvergleichen kann er d ie Werte von P3, P4, Ps und P6 erm it teln , indem er PI und P2 als Koeffizi enten quadratischer Gl eichungen einset zt und diese mit der ihm aus der Schule bekannten p-q-Formel löst: P3
- -1 + -1 . vTI + )17 - - -1 . vTI
P4
- -1 + -1 . vTI -
Ps
- -41 - -41 . vTI + )17 - + -1 . vTI 8 8
P6
- -41 - -41 . vTI -
4 4
4 4
8
)17 -8
)17 -8
8
- -81 . vTI
+ -1 . vTI 8
270
20 Das regelmäßige Sieb zehneck
Achte Vorbereitung: Carl Fri edrich erkennt, dass er der Dar st ellung der 17. Einhe itswurzeln als algebraische Au sd rücke dicht au f den Fersen ist . Er braucht das er pro bte Verfahren nun nur noch mit den ver schi ed en en Bahne n in Q l1 wied erholen , die als it er ierte 16. Po t en zen von ( 1 bzw. ( 4 a uft reten: {(I , (16 } und {( 4 , ( 13}. P7 Ps
x
2
P3'
-
P7 + Ps
P3
P7 ' Ps
P5
X
+ P5
(x - P7) . (x - ps) P3
2 ±
=? P7,S
~ V'4 - P5
P7 = ( 1+ ( 16 liegt weiter rechts des Urspru ngs als
der Wurzelausdruck mi t P7 =
= - -1
8
ps = ( 4 + ( 13, daher ents pricht
,,+" dem numerischen Wert von
P7. Also ist
r;;r-P5
1-
P3
2 +V
+ -1 .
8
) -17 - _ 1.
vTI +
32
32
vTI
+
17 16
. TI - V~ ~. +~ 16 V 11 128 + 128
TI
V 11
.
Am Ziel: Damit ist er am Ziel, denn P7 ist ni chts a nderes als die Summe von ( 1 und "0 und damit de r do ppelte Re al teil von ( 1, der sich gut m it Hilfe der cos-Fu nkt ion darstellen lässt .
Er finde t nun no ch schnell die et was schönere Darstellung:
cos
C;77l")
11 -1+ vTI + V34 -
= 6.( +
20.2
~.
J
17 + 3 .
vTI -
2 . vTI)
V34 - 2 . vTI - 2 . V34
+ 2.
vTI
Di e Konstruktion
Der Rest ist nun - wie b ereit s einiges von der Vorarbeit - rein e Fl eißsach e: Die Vorgeh en sweise zur Kon struktion eine r Strecke, die so lang ist , wie die Wurzel einer b ereits zuvor kon struierten St recke, hatten Carl Fri edrich und seine Freunde im Geom etrieunterricht b eh andelt . Damit können sie nun endlich den Geburtst agskuchen in 17 völlig gleiche Stücke sch neide n, und es gib t kein en Anl ass zum Streit .
271
20 .2 Die Ko nstr uktion
Eine besonders kurze, platzsparende und sogar leicht zu merkende Vorgeh ens weise, wie man dieses auch auf sein er eigenen Geburtstagsparty erreiche n kann , möchte ich hier aufzeigen (sieh e Abbildung 20.1) .
c
E
A
B =Po
Abb. 20.1: Konstr ukt ion des regelmäß igen Siebzeh necks
Konst ru kt ion sa nleitu ng :
• • • • • • • •
Zeichnen eines au srei chend großen Kreises kl um O. Zeichnen eines Durchmesser s AB und Konstruktion der Mittelsenkrechten ml, die den Kreis k l in C und D schneidet . Konstruktion de s Mit telpunktes E von CO. Konstruktion des Mittelpunkt es F von E O. Zeichnen von F B . Konstruktion der Winkelhalbierenden W l des Winkels L OF B . Konstruktion der Winkelhalbierenden Wz des Winkels zwischen ml und W l , die mit AB den Schnittpunkt G hat . Konstruktion eine r Senkrechten SI zu un durch den Punkt F . Konstruktion der Winkelhalbierenden W 3 zwische n SI und Wz mit dem Schnit tpunkt H von W 3 und AB.
272
• •
•
20 Das regelmäßige Siebzehneck
Kon strukt ion des T haleskre ises k2 üb er der St rec ke H B mi t den Schnittpunkten J und K von k2 und C D = m 1 . Kon struktion eines Kr eises k3 um C , der durch J und K verl äuft und der AB in den Punkten L und N schneide t (Achtung: N liegt seh r nahe am Mittelpunkt M des Thaleskreises k2). Kon struktion eine r Tangente t 1 zu k3 durch N.
Die Schnittpunkte der Tangente mit k: sind die Punkte P3 und H 4 des regelm äßi gen Sieb zehnecks. Diese Nummerieru ng ergibt sich au s dem vollst ändig kon struierten Sieb zehneck . Au sgeh end von B = Po lassen sich durch fort geset zt es Abtragen des Ab standes POP3 auf der Kr eislini e k1 alle weiter en Punkte des Sieb zehnecks kon struier en . Ein a nde res Thema ist , nachzuweisen , dass die x-Koordinate des let zten E ndes kon struier t en Punktes H tat sächlich den ob engen annten Zahlen wert hat man möge sich auf lange, fehl erträchtige Rechnungen mit horrenden Wurzelausdrücken eins te llen ! No ch eine Legende: 1894 lieferte ein Doktorand der Ma thematik, Johann Gust av Her me s, an der Mathematischen Fakult ät der Universität Königsberg einen Koffer a b. Der Inhal t waren etwa 10.000 handgeschriebene Seiten , a uf denen er mit vergleichbar en Methoden die Kon struktion eines a nde re n regelm äßi gen nEcks beh andelt : des 65.537-Ecks. Es handelte sich um den Ertrag seine r zehnjährig en Bemühungen , den Doktorgrad zu erlange n . Die Professor en hatten b ereits geglaubt , er werde dies niemals zu eine m Ende bringen. Nun hatten sie, die ihm die Aufgabe a us mangelnder Sympathie gestellt hatten , ein ordentliches Problem am Hals: Sie mu ssten Hermes nachweisen, dass seine Konstruktion fals ch war , um zu verhindern, dass er den Dokto rhut bekam. Davor kapitulierten sie, und Hermes wurde Doktor.
Der Koffer übrigen s üb erstand b eid e Weltkriege und ist heute im Mu seum der Mathematischen Fakultät der Univer sit ät Göttingen zu best aunen . Norb ert Engb ers ist Dipl.-Math. und lebt in Osnabrück.
21 Ein Satz von Carnot
Übe rsicht 21.1 Satz von Carnot
273
21.2 Umkehrsatz von Carnot
275
Die erste Regel, an die man sich in der Mat hematik halten muss, ist, exakt zu sein. Die zweite Regel ist , klar und deutlich zu sein und (Lazare Nico las Marguer ite Carnot) na ch Möglichkeit einfa ch. In diesem Kapitel wollen wir dem Leser einen klein en, aber sehr interessanten und ich denke nicht all zu bekannten Satz am Dreieck vor st ellen . Die Grundfrage laut et : Welche Beziehungen müssen gelten , wenn drei a uf den Dreiecksseiten senkrecht st ehende Geraden ein ander in einem Punkt schneiden?
A
c
p
B
Abb. 21.1: Drei auf den Dreiecks seiten senkrech te Ge rade n sch neiden eina nder in eine m Pun kt.
Einen Sonderfall kennt jeder: Die Höhen , die einander in einem Punkt schneiden. Aber wie kann man dies ver allgemeinern?
21.1
Satz von Carnot
La zare Nicolas Marguerite Carnot (1753- 1823) war französisc her Offizier , Politiker un d bedeuten der Mathematiker. Sein mathematisches Hauptwerk Geometrie de position ersch ien 1803. Unter a nde re m hat er sich die Frage gest ellt, welche
274
21 Ein Satz vo n Carnot
Beziehung zwische n den Streckenabschnitten am Dreieck gelten müsse, damit drei a uf den Dreieck sseiten senkrecht stehe nde Ger aden einande r in eine m Punkt schneiden .
Satz 21.1 (Satz von Carnot) Wenn drei Gerad en, die lotrecht auf den Seiten ein es Dreiecks ABC st ehen, nämlich in den Punkten P auf B C, Q auf A C und R auf AB, ein an der in ein em Punkt schneiden , besteht zwischen den Stre ckenabschnitien BP, C Q, AR, C P , A Q und BR folg ender Zu sammenhang (si ehe auch Abbildung 21.2): (21.1)
B ewe is : Um den Satz zu b eweisen, benutzen wir Grundlagen a us der Schulgeometrie. Zunäch st einmal ergä nze n wir Abbildung 21.1 zu Abbildung 21.2 :
A
C
B
Abb. 21. 2: Skizze zum Beweis
Wir verwenden die Not at ion und Bezeichnungen a us Abbildung 21.2 . Mit Hilfe des Satzes von Pythagoras lass en sich folgende Beziehungen aufstellen :
Cp
2
+ PX 2 =
CX
2
+ PX 2 = BX 2 2 2 C Q2 + QX = CX Bp
2
A Q2 2
2
+ QX =
AX
2
2 2
+ RX = BX 2 2 2 A R + RX = AX
BR
(21.2) (21.3) (21.4 ) (21. 5) (21.6) (21. 7)
Nun führen wir folgende Subtraktionen durch:
2 2 Bp2 _ C p 2 = BX _ CX
((21.3)-(21.2))
(21.8)
2 2 C Q2 _ AQ2 = CX - AX
((21.4)-(21.5))
(21.9)
275
21.2 Umke hrsatz von Carnot
2 2 2 2 AR - BR = AX - BX
((21.7)-(21.6))
(21.10)
Die Summe der Gleichungen (21.8) , (21.9) und (21.10) ergibt:
Bp2 +CQ2 +AR2 _CP2 _AQ2 _BR2 =0 2 2 2 2 {::} Bp + C Q2 + AR = C p + AQ2 + BR Damit ist der Beweis er bracht.
21.2
D
Umkehrsatz von Carnot
Für den vorgestellten Satz von Carnot gilt au ch die Um kehrung. Man hat damit auch ein Kri terium, ob drei Geraden , die in a usgewählt en Punkten auf jeweils einer Dreiecksseite senkrecht st ehen, ein ander in einem Punkt schneiden. Interessant ist be sonders der Beweis.
S a tz 21.2 (Umkehrsatz v o n Carnot ) Gegeben seien ein Dreieck ABC, Punkte P auf BC, Q auf AC und Rauf AB .
Wenn die Gleichung (21.11)
gilt, so schneiden die drei in P , Q bzw. R senkrecht auf den Dreie ckseiten stehenden Geraden einander in ein em Punkt.
B ewe is : Die Idee zum Beweis ist die se : Man kann P und Q a uf BC bzw . CA beliebig wählen, und die Lote zu die sen beiden Punkten treffen einander in einem Punkt X . Das Lot zur Seite AB und dessen Schnit tpunkte mi t den anderen Loten bleiben zunäch st außen vor . Die Frage ist jetzt , ob das Lot von R - wenn dieser Punkt auf AB so gewählt wird , dass
gilt - diesen Punkt X au ch trifft . Dass es irgendwo auf AB den Punkt R' gibt, für den das Lot den Punkt X trifft , leuchtet ja jedem Leser ein : Man muss nur vom Schnittpunkt X aus das Lot auf AB fällen und findet R' . Der Witz ist , dass X auch dann getroffen wird, wenn man nach der Gleichung geht, um den Lotfußpunkt R zu find en - dass also das nach Gleichung gefunden e R mit dem nach Konstruktion gefunden en R' üb er ein stimmt.
276
21 Ein Satz von Carnot
Die Wahl von P und Q als Bestimmende für den Schnittpunkt X erfolgt hier o. B. d . A., denn von den dr ei gegeb en en Punkten P , Q und R wähle man , falls das Dreieck ABC stumpfwinklig ist, die zwei aus , die sich auf den Dreiecksseite n , die dem st um pfen Winkel anliegen , befinden . Ist das Dr eieck ab er nicht st um pfwinklig, d. h ., alle Winkel sind klein er od er gleich 90° , so kann man b eliebig e zwei der drei Punkte für die Argumentation im vorigen Abschnitt nehmen . Der Grund für diese Rücksicht auf stumpfe Winkel ist der, dass man sicher sein muss, dass das Lot von X auf die dritte Seite tatsächlich diese Seite trifft. Aus dem Satz von Carnot und der Voraussetzung 21.11 folgt :
Durch Einset zen von BR = AB - AR und BR' = AB - AR' folgt:
AR2 - (AB - AR)2 = AR,2 - (AB - AR,)2 {:} AR2 - AB 2 + 2 . AB . AR - AR2 = AR,2 - AB 2 + 2 . AB . AR' - AR,2 {:} AR = AR' Somit fallen Rund R' zusammen und wir haben bewiesen, dass bei Gü ltigkeit der Glei chung die Lote ein ander in einem Punkt schneiden. 0
Floruni Modler studiert Mathematik in Hannover.
22 Die Kardioide als Hüllkurve
Bei eine r früheren Gelegenheit [66] be schäftigte ich mit den Einhüllenden von Kurven sch aren . Hier folgt ein weiteres Beispiel, das wahrscheinlich schon län gst bekannt ist , mi r ab er bish er no ch nicht auffiel. Ich habe au ch ni cht danach gesu cht , weder in Büchern no ch im Internet . Wählt man auf einem Kreis, dessen Mittelpunkt auf de r x-Achse liegt und de r durch den Urs prung geh t (Abbildung 22. 1), beliebige Punkte
Abb. 22.1: Kreise durch den Ursprung mit Mittelpunkt auf dem gegebenen Kreis und schlägt um sie Kreise, die ebenfalls durch den Ursprung gehen (Abb . 22.2) ,
Abb. 22.2: Mehrere solcher Kreise so ist die Einhüllende der so ents tehe n de n Kreisschar eine Kardioide (Abb. 22.3) :
278
Die Kardioide als Hüllkurve
Abb. 22.3: Die Hüllkurve ist eine Kardioide
Beweis:
F ür den Kreis KI mit Radius R gilt (siehe Abbildung 22.4) ( XM
2
2
- R ) + YM = R 2 2 XM + YM - 2RxM = 0,
2
(22.1)
und für den Kr eis K 2 um den Punkt P (XM , YM ) gilt:
+ (Y (x - XM )2 + (y 2 2 x - 2XM X + y (X
- XM ) 2
= YM )2 =
YM )2
. a 2 m it a2
XIv/
=
XM 2
+ YM 2
+ YM 2
2YMY = 0
(22.2)
Y
(X,y)
---t":...---.....:..------J'--I------+--- x
Abb. 22.4: Skizze zum Beweis Aus (22.1) folgt YM = v'2 RxM - XM 2 , und das ergibt eingesetz t in (22.2) : (22.3)
279
Die Kardioide als Hüllkurve Dies ist eine a ndere Form der Gleichung für K 2, sie ent hält nicht mehr YM.
Wird darin XM frei gewählt , so ents te he n lauter ver sch ied en e Kr eise K 2, deren Mittelpunkte auf K; liegen und die durch den Ur sprung geh en . D . h ., (22 .3) beschreibt die in den obigen Abbildungen a ngedeute te Kr eissch ar ; dabei ist XM der Scharparameter . Wie in [66] erklärt wird , kü rzt man dies mi t
F(X ,y, XM) = 0 ab , und um die Ei nhüllende der Kreissch ar zu finden, mu ss die partielle Ableitung von F nach x M gleich 0 geset zt werden :
- 2x _ oder
2 · (2R - 2XM )y = 0 2· V2RxM - XM 2
x
+
(R - XM )y = 0 v2RxM - XM 2
(22.4)
Hiermit ist als näch stes XM a us (22.3) zu elim inieren. Dabei gelten die folgenden Re chnungen für Argumente , die den Nenner nicht 0 werden lassen . Mit (22.4) gilt
J2R XM - XM 2 -_ - (R - XM )y , x so dass sich durch Einsetzen in (22.3 ) 2
X
+ y2 -
2
XMX +
2(R - XM )y X
2 =
0
ergibt , woraus (22 .5) folgt . Durch Qu adrieren beider Seiten von (22.3 ) erhält man weiter ( X2
+ y2 ) 2 -
2 (x2
2 2 = + y 2) . 2XMX + 4XMX
2 ) Y2 . 4 ( 2RxM - XM
Die s ist eine quadrati sche Gleichung in XM (22 .6) mit den Lösungen:
Ein Vergl eich mit (22.5) erg ibt:
X(X2 + y2)
+ 2Ry2 = 2Rl + (x 2 + l) x ± J (2R y2 + (x 2 + y2) x )2 0 = J(2Ry2 + (x 2 + y2) x)2 - (x 2 + y2) 3
(x 2 + y2)3
280
Die Kardioide als Hüllkurve
Damit haben wir die paramet erfreie Darst ellung der Hüllkurve: ( 2R y2
+ (x 2 + y 2) x) 2 =
(x2
+ y 2) 3
(22.7)
Einfach er zu ver st eh en ist 22.7 mit Hilfe von P olarkoordinaten x = r . cos 'P, Y = r . sin 'P, mi t r E
JR, r
~
0, 'P E [0,271-).
Damit er hält man:
Daraus ergibt sich die Lösung:
t:
=
2R · (1
+ cos 'P)
(228)
I
Dies ist die Gleichung einer Kardioid e wie der Randkurve in Abbildun g 22.3. Hans-Jürg en Caspar, p ens. Lehrer für Physik und Mathematik.
Teil IV Elliptische Kurven und Kryptographie
23 Das Gruppengesetz elliptischer Kurven
Übersicht 23.1 Motivat ion
283
23.2 Definition ellipt ische r Kurven
284
23.3 Singu lä re Punkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 23.4 Das Gru ppengesetz
288
23.5 Die Assozia ti vität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294 23.6 An der e Ansätze
301
23.7 Abschluss
303
Elliptische Kurven sind seit einigen J ahren in aller Munde : Sie wa ren der wesentliche Schlüssel zu Andrew Wi les' Beweis von Fermats legendär em let zt en Satz, und in For m des EIGamal-Kryptosyst em s halt en sie E inzug in unseren Alltag a uf SmartCards , P ocke tPCs und a nder en Kleingeräten , die eine Re ssourcen schonendere Public-Key-Verschlüs selung benötigen als das sonst üb liche RSA- Verfahren sie bereit st ellen kann. Doch was sind eigentlich ellip ti sche Kur ven und was macht sie so be sonders? Die se Fr age ver su che ich in die sem Kapitel zu be antworte n .
23.1
Motivation
E ben weil elliptische Kur ven ein spannendes un d wichtiges Thema sowohl in reiner als au ch in a ngewandter Mathematik sind , findet man viel Literatur dazu und in keine r Quelle feh lt dabei das Gruppengesetz, um das sich a uch dieser Beitrag hier dreht .
284
23 Das Gruppengeset z elliptischer Kurven
Ich hab e im Laufe der Zeit im me r wied er einm al diese Literatur durchforst et , a ber kein Skript , kein P ap er , das ich fand , enthielt , was ich mir vorstellte. Entwed er war es sehr auf reine Mathe mat ik au sgericht et und die Problem atik des Gruppengeset zes wurde viel allgemeiner und m it schwe re n Gesch üt zen z. B . aus der alg ebrai sch en Geometrie an gegangen ode r es waren prax isorient iert e Texte über Kryptographie, die sich sehr unpr äzise mi t dem Gruppen geset z b esch äft igten, um den Fokus auf die An wendungen zu legen . Sehr oft war es dann so, dass die Defini ti on en nur für Sp ezialfäll e angegeb en wur de n und der Beweis der Assoziativität aufgrund seine r Län ge ganz ausgelassen wurde . Ich habe vor kurzem im Buch .Elliptic Curves - Nu mber Theory and Cr ypto gra phy" [67] das erste Mal einen vollst än digen Bewei s de s Assozi ativgesetzes ent deckt , doch auc h die ser stellt e m ich nicht zufrieden, da er ein en relativ gr oßen Umweg dafür m achte. Kurzum : Ich hab e mi r in diesem Kapitel vorgenommen, die Gruppen st ruktur a uf ellipti schen Kurven in ihrer allgemeinen Form zu definieren und ins besondere die Assozia t ivit ät nachzurechnen , ohne mit allzu großen Kanonen auf Sp atzen zu schieße n.
23.2
Definition elliptischer Kurven
Zue rs t zur Frage, was ellipt ische Kurven eigen tli ch sind: Mit dem Ausdruck ellipti sche Kurve wird eine spezielle Ar t algebraische r Kurven bezeichnet , nämlich die Lösungen von Glei chungen de r Form
Dies ist die sogenannte uerallqeme inerie Weierstmß-Gleichung. Die Bezeichnung de r Koe ffizien ten (insbesondere die Ab wesenheit von a5) ist traditionell so wie hie r a ngegeben. Es ist a lso so, dass wir einen Körp er K und ein Pol yn om
haben . E ine ellipt ische Kurve ist dann im Wesentlichen die Nullstellenmenge eines solche n P olynoms. Die kleinen Untersc hiede liegen in den sogenannten "singulären Punkt en" . Die Me nge S dieser singulären Punkte schli eßen wir nämlich aus dieser Null st ellenmen ge aus . (Was genau singuläre Punkt e sind und wieso wir sie weglassen , darauf werden wir im nächst en Ab schnit t zu sprech en kommen .) Ein weitere r Un t erschied ist der , dass wir eine n weit er en Punkt dazunehmen , den wir mit 00 b ezeichnen werden .
23.3 Singuläre Punkte
285
Als elliptische Kurve im enger en Sinne ist also eine Menge folgender Gestalt definiert: E(K) := { 00 } U { (x , y) E K2 1F(x , y) = 0 } \ s 00 wird der unendlich f erne Punkt genannt , der später noch eine wichtige Rolle spielen wird . Auch wenn zunächst ni cht offensichtlich ist , wieso man da noch einen Zusatzpunkt "küns tlich" dazunehmen sollte, ist er von entscheidender Bedeutung, denn er wird später das neutrale Element unser er Gruppenstruktur sein .
Welchen Körper man für K wählt , ist theoretisch egal. Interessant für die Praxis sind aber vor allem die Körper lFp für groß e Primzahlen p und die Körper lF2 m für groß e m. In der Theori e sind Kurven üb er Q und den p-adischen Zahlen Qp ganz interessant. Sie spielen u . a . eine große Rolle in dem angesprochenen Beweis von Wiles. Elliptische Kurven über Zn und anderen kommutativen Ringen werden in speziellen Problemen a uch betrachtet. Man kommt dann aber mi t der Gruppenstruktur , so wie wir sie hier definieren wollen , in Schwierigkeiten, da nicht durch jede Zahl dividiert werden kann. (Was durchaus gewollt sein kann, da man an einer solchen "Schwierigkeit" bei Kurven über Zn erkennt , dass n keine P rimzahl ist , sod ass man mit solchen Kurven Fak torisierungsalgorithmen , P seudoprimzahlt ests und sogar Primalitätsb eweise implementieren kann .) Ab jet zt wird K immer eine n Körper b ezeichnen , F(x , y) immer ein Polynom aus K [x , y] von oben angegeb en er Gestalt , dessen Koeffizienten wir auch immer wie ob en b ezeichnen werden . E(K) wird au ch immer die durch F defini erte ellipt ische Kurve b ezeichnen. Da wir nie mit mehr als eine r ellipt ische n Kurve zugleich hantier en werden, sollte das kein e Unklarhe ite n b ereiten , denke ich .
23.3
Singuläre Punkte
Die Menge S aus unser er Definition ist die Menge der sogenannten singulären Punkte. Ein P unkt (u ,v) auf der alg ebraischen Kurve F(x ,y) = 0 heißt dabei singulär, wenn VF(u, v) = (0 ,0) , d.h ., wenn ~~(u, v) = ~~(u ,v) = 0 ist. (Dies sind einfach formale Abl eitungen in K [x, y], kein e Abl eitungen im Sinne der reellen od er komplexen Analysis .) Singulär e Punkte haben die unangen ehme Eigenschaft , dass eine ellipt ische Kurve do rt , anschaulich gesprochen , kein e einde ut ig be stimmte Tangente b esit zt. Es gibt b ei alg ebraischen Kurven, die durch kubische Polynome wie unser F defini ert sind, nur zwei Möglichkeiten für singuläre Punkte: Der Neunonsehe Kn oten (ob en in Abbildung 23.1) mit der Gleich ung y2 = x 3 + x 2 hat z. B. in (0,0) eine n singulä ren Punkt (ein en Kreuzungspunkt , um
286
23 Das Gruppengesetz elliptischer Kurven
Abb. 23.1: Newtonscher Knoten (oben) und Neilsche Parabel (unten)
gena u zu sein) und wie man an der Zeichnung sieht, gä be es in diesem P unkt mindest en s zwei Möglichkeit en , eine Tange nt e a n den Graphen zu legen . Ähn lich verhäl t es sich m it der Ne ilsche Parab el (unt en in Abbildung 23.1) , die die Gleichu ng y 2 = x 3 hat. Sie hat ebenfalls in (0,0) einen sing ulä ren P unk t (hi er eine n Rückkehrpunkt ). Dort fällt es un s ebe nso schwer , eine sinnvolle Tangente a n den Graphen zu legen . Da wir Tangen t en jedoch unbedingt brauchen wer de n für die vollst ä ndi ge Defini tion der Gruppenv erknüp fun g, stören un s die singulären Punkt e so sehr, dass wir sie einfach en tfern en. Wi r werden jetz t ein Lemma b eweisen , das sicherstellt , dass wir un s nachher kein e Schwierigkeit en mi t de r Ab geschlossenheit einfangen , wen n wir die Sin gularität en elim inieren : Lemma 23.1 Sei (u , v) E K 2 ein Punkt auf der algebraisch en Kurve F (x , y ) = y 2 + al XY + a3Y - x 3 - a 2x 2 - a4X - a6 = 0 über' K . (u , v) ist gen au dann singulär, wenn alle Geraden durch diesen Punkt die K uro e m ehr als einm al in (u, v) schn eid en.
Was b ed eu t et das konkret ? Jede Gerade in K 2 , die durch (u, v) verl äuft , kann durch (x , y) = (u , v ) + t(r x , ry) parametrisier t werden , wob ei t üb er ganz K variiert und (r x,ry ) i- (0; 0) die "Richt ung" der Geraden a ngibt . Set zt man diese
287
23.3 Singuläre Punkte
zwei Ausdrüc ke für x und y in F ein, erhält man ein Polynom in t, dessen Nullstellen gen au die Schnittpunkte der Ger aden mit der Kurve darst ellen . Wenn (u ,v) a uf der Kurve liegt , heißt das , dass t = 0 eine Nullste lle dieses P olynoms ist . Dass die Gerade die Kurve nun ,,mehrfach in (u, v ) schne ide t", bed eutet dem zufolge nichts anderes, als dass t = 0 eine mehrfache Nullste lle des P olynoms ist . B ewe is : Wir set zen zunächst die beiden Au sdrücke au s der allgemeinen Geradengleichung in F , in ~~ und ~~ ein und erhalten drei Pol ynome F, i; und
Fy
E
K [t]: -
+ tr y) 2 + a l(U + trx)(v + tr y) + a3(v + try) - (U + tr x) 3 - a2(U + tr x)2 - a4(U + tr x) - a6 33 = - rx t + ( - 3r x2 u - a2rx2 + r 2y + alrxr y )2 t 2 + (r y(2v + a lU + a3) + rx(al v - 3u - 2a2U - a4))t + (v 2 + alU v + a3v - u 3 - a2u 2 - a4U - a6) 2 Fx (t ) = al(v + try) - 3(u + tr x) - 2a2(U + tr x) - a4 = -3r; t 2 + (al r y - 6ur x - 2a2r x)t + (alv - 3u 2 - 2a2U Fy(t) = 2(v + tr y) + al(U + tr x ) + a3 = (2r y + alrx)t + (2v + al U + a3) F(t) = (v
a4)
,, ----7 " .. ------'-
Ist (u, v) ein singulärer Punkt der Kurve, so gilt F(O) = Fx (O) Fy(O) = 0, d . h ., alle drei Ab solutglied er sind O. Der Koeffizient des linearen Glied s von F ist nun a b er eine Linearkombination der be iden Ab solutglieder von i; und Fy , also a uch O. Somit ist t = 0 eine (mindestens) doppelte Nullstelle von F für jede ents pre che nde Gerade, also unabhängig von r x und r y. ,,
ß-- " ..
~
Anders her um ist es gen auso einfach : 'Wenn 0 für jed e Gerade eine meh rfache Nullst elle von F ist, dann ist der Koeffizient vor dem linea ren Glied für jed e Wahl von r x und "u gleich 0, insbesonder e für (r x,ry) = (1,0) und für (r x ,ry) = (0 ,1) . Also sind au ch die beid en Absolutglied er von t; und F'y gleich 0, also ist (u , v) ein singulärer Punkt der Kurve. D Man erken nt an den Formeln auch, dass eine Gerade durch (u , v ), deren Richtungsvektor (r x ,ry) "senkre cht" auf (al v - 3u 2 - 2a2u - a4,2v + alU + a3) = \7 F( u , v) steht, auch im nichtsingulären Fall die Kurve mehrfach in (u , v) schneidet. Eine solche Gerade ist die Tangente an den Graphen durch (u,v) (es ist sogar die einz ige mit dieser Eig en schaft, wenn (u,v) nichtsingulär ist , aber das brauchen wir nicht) .
288
23 Das Gruppengesetz elliptischer Kurven
Es sei no ch einm al fest gehalten , dass eine elliptische Kurve E( K) per Defini ti on kein e sing ulä ren P unkte enthält. Die algeb rai sche Kurve F( x , y) = 0 kann dies jedoch durchaus.
23.4
D as Gruppengesetz
Dass elliptische Kurven a uf eine "nat ürliche" Art und Weise mit eine r Grupp en struktur ver seh en werden können, ist ihr entsche ide n de r Vort eil gege nübe r a nde re n algebraischen Kurven und macht sie für die vielfältigen Anwendungen so interessant . Wi r wollen uns nun en dli ch a nsehen, wie die se Verknüpfung definiert ist . Die Id ee ist folgende: Man nimmt sich zwei Punkte a uf eine r ellipt ische n Kurve und verbindet sie durch eine Gerade. Die Hoffnung b est eht dann , das s diese Gerade die Kurve no ch ein drittes Mal schne ide t und man ebe n jen en dri tten Punkt nutzen kann , um die Verknüpfung der ersten beiden Punkte zu erkläre n (sieh e au ch Abbildung23 .2) . In diesem Sinne ist die ents te he nde Verknüpfung "nat ürlich", weil sie sich a us der geometrischen An schauung herl eitet . Dass das, was wir gleich mach en wer de n, a be r wirklich eine Gruppen struktur liefert, ist alles a nde re als offen sichtlich. (Es sei denn , man hat viele, viele Rech enbeispi ele durchexer ziert und zufällig immer darauf geachtet .)
Q
p
Abb. 23.2: Geometrische Idee des Gruppengeset zes: Drei Kurvenpunkte auf einer gemeinsa men Gerade
Dabei st ellen sich folgende Fragen: •
Wi e formalisiert man das, sodass es für alle Körper funktioniert?
23.4 Das Gruppengesetz
• • •
289
Wi e geh en wir mit dem unendlichen fernen Punkt dabei um? Wi e garantier en wir , dass wirklich immer ein dritter Punkt herauskommt? Was macht man , wenn Punkte zusam me nfa llen?
Nun, die erste Frage ist noch die einfachste von a llen : Alle geometrischen Konst ru kt ionen, die wir a us der Anschaulichkei t die ser Idee herleiten werden , können so umformuliert werden , dass sie au sschließlich durch die vier Grundrechenarten bes chrieben werden können , sodass wir einfach die sich ergebenden Formeln als Definition benutzen und a uf sä mtliche Körper ausdehnen . Wir b etreiben im Prinzip al so affine Geomet rie in K 2 und benutzen fü r die Herleitungen und Beweise keine Spezifika der reellen oder komplexen Zahlen .
23.4.1
Der unendlich ferne Punkt
Wi e binden wir nun den unendlich fernen Punkt in unser e Übe rlegungen mit ein? Am b esten t un wir dies, indem wir die Zahlen eb en e, die uns a ls Ver anschaulichung di ent , um eine ob er e und eine unter e Kante erweitern . Der unendlich ferne Punkt wird al so an das ob ere und das unter e Ende geset zt (b eides!) . Konkret können wir uns das so vor stellen , das s jed e Gerade durch den unendlich fernen Punkt eine senkrechte Gerade ist und umgekehrt j ed e senkrechte Gerade durch den unendlich fernen Punkt geht . Ab er wir wollten uns ja nicht all zu sehr an der An schauung festhalten . Daher sei nun defini ert:
D efinit ion 23.2 Sind (u , v) , (u , v') E E (K ) Punkte einer ellipti schen Kurve mi t v =I- V i , so definieren wir (u , v) EB (u , v'): = (u , v' ) EB (u , v) := 00. Ist v = V i und ~~(u, v) = 0, so definieren wir ebe nfa lls (u,v) EB (u, Vi ) := 00. • Ich erwähnte ja scho n, dass 00 das neutrale El ement unserer Verknüpfung werden soll. Zwei Punkte, die di rekt übereinander liegen , de ren verb indende Gerade also senkrec ht ist , sind demzufolge zueinander invers. Ein Punkt , der die Ableit ungsb edingung erfüllt, be sitzt a nalog eine senkrecht e Tangente , die man sich als Verbindungsgerade de s Punktes mi t sich selbst vor stellen könnte , und ist m it dieser Definition selb stinv er s (sieh e au ch Abbildung 23.3) . Da wir uns no ch ni cht sicher sind , dass wir wirklich eine Gruppe vorliegen haben, zeigen wir j etz t aus nahms weise, dass die ses obige Inv er se immer exis tiert und eindeutig b estimmt ist :
Le m ma 23 .3 S ei E(K) ein e f est gewählte elliptische Kurve. Ist (u , v) E E(K) , so gibt es maximal ein en weit eren Punkt aus E(K), dessen x -Koordinate ebenfalls gleich u ist, näm lich den Punkt (u , - al U - a3 -v ) E E(K) . Gilt dabei v = - a l U - a3 - v, so gilt auch ~~(u ,v) = o.
290
23 Das Gruppengesetz elliptischer Kurven
Abb. 23.3: Eine senkrechte Gerade durch inverse Elemente
Beweis: Setzen wir x = U in die Gleichung F( x , y) = 0 ein , welche die elliptische Kurve E(K) festlegt, so erhalten wir eine Gleichung in y, die die Form y2 + (alu + a3)y + ... = 0 hat . Da wir hier mit Körpern hantier en , kann diese Gleichung maximal zwei Lösungen haben , al so kann es nur maximal zwei solcher v geb en . Ist ein Punkt (u , v ) auf der Kurve vorgegeb en , so ist also v eine Lösung der Glei chung. Wir wissen , dass die a ndere Lösung Vi (die dann notwendigerweise a uch in K liegt) die Identität alU + a3 = - (v + Vi ) erfüllt ===} Vi = - a lU - a3 - v.
(U ,Vi) liegt a lso in K 2 und erfüllt F( U,Vi) = O. Wir müssen noch sichergehen, dass (u , Vi ) nicht singulär ist . Dann haben wir gezeigt , dass es zur elliptischen Kurve gehört . Dies folgt a ber au s 23.1, denn wäre es singulär, so wäre (u , Vi) ein mehrfacher Schnittpunkt der alg ebraischen Kurve F(x , y) = 0 mit der Gerade x = u , Wir wissen ab er , dass es höchstens zwei solcher Schnittpunkte gibt. Beide Schnittpunkte müssten a lso identisch (u , Vi) = (u , Vi) sein . Also wäre (u ,v) singulä r , was im Widerspruch zur Voraussetzung (u ,v) E E(K) st eht. Fallen die beiden konstruierten Punkte (u, v) und (u , - al u - a3 - v) zus ammen , dann ist V = - a l u -a3 - V ===} 2v +alu +a3 = O. Dies ist a ber gen au ~~ (u , v) . D
Die obige Definition, wann sich zwei Elemente zum unendlich fernen Punkt addieren , liefert uns a lso wirklich ein eindeutig bestimmtes (und vor allem a uch immer existentes) Inverses , wie wir es uns wünschen.
291
23.4 Das Gruppengeset z
23.4.2
Die anderen Fälle
Nach die sem leider no twendigen Schwenk kön nen wir unsere Idee von oben konkretisieren und die Verknüpfung, a uf die wir es so sehr ab geseh en haben, zu Ende defini er en . Führen wir nämlich unser e Id ee von ob en a us und bast eln a us den Punkten (ui .vi ) und (U2 , V2) E E(K) eine n dritten Punkt (U3, V3) E E(K) , so defini er en wir (vi . vi ) E9 (U2, V2) := - (U3,V3 ) (wob ei hier natürlich das ob en kon struierte Inv er se geme int ist und etwa - (a, b) = (-a , - b)). Lasst uns denn zur Tat schreiten und besagte Konstruktion durchführen : Seien (Ul , VI) ,(U2, V2) E E (K ) und Ul i- U2, dann hat die verbindende Gerade durch diese b eid en Punkte die Gl eichung: y = m x + n mit m = UI V i -V2 und -U 2 n = vl -mUl .
In sb esonder e ist die Ger ade ni cht senkrecht , d . h ., unser e Konstruktion kollidiert nicht mit der Defini tion für inverse E leme nte, die nur den Fall sen kre chter Ger aden b etrifft. Wenn wir di es nun in F( x , y) = 0 einse tzen , erhalten wir die Gleichung (m x
+ n) 2 + al x(mx + n) + a 3(mx + n) = ===}
0
=
x x
3 3
+ a 2x 2 + a4X + a6 + (a 2 - m 2 - a l m )x 2
+ Terme klein er en
Grades.
Wir wissen ber eits, dass diese Gleichung zwei Lösungen hat , nämlich
Ul
und
U2. Daraus können wir nun den dritten Schnittpunkt ermit teln , denn es gilt - (Ul+ U2+ u3 )= a2- m2- a l m ===} u 3 = -a2 +m 2 +alm -ul -u2.
Damit wissen wir schon sehr viel: Wir können a us der Ge radenglei chung die zugehörige Koo rdinate V3 berechnen und erh al ten dann einen Punkt (U3, V3) E K 2 auf de r algebraischen Kurve F( x , y) = O. W ir wissen vor allem a uch , dass dieser P unkt einde ut ig b estimmt ist und immer exist iert . Das einz ige, was uns noch zu zeigen bleibt , ist die Tatsa che, dass der Punkt (U3,V 3) nichtsin gul är ist , al so wirklich in E(K) liegt . Au ch hier leistet das Lemma 23.1 hervorrag ende Dien ste, denn wir haben eine Gerade durch (U3 , V3) und kennen all e Schnittpunkte mit der Kurve. W är e (U3 , V3) sing ulär, so müsst en mindesten s zwei der dr ei Punkte zusamme nfa llen, d.h ., es würde (Ul , VI) = (U3, V3) od er (U2, V2) = (U3 ,V 3) gelt en . In j ed em Fall wäre (U3, V3) nach Vorausset zung schon nichtsin gul är. Wir erhalten al so eine n Wider spruch . Damit ist al so (U3 , V3) ex istent, einde ut ig best im mt und ein El em ent von E(K). Dasselb e trifft damit natürlich auch auf - (U3, V3) zu .
292
23 Das Gruppengesetz elliptischer Kurven
Definition 23.4 W ir defini er en also für (UI , v i ) , (U 2 , V 2 ) E E(K) mi t UI i- U 2 den Punkt (und damit au ch den Punkt (UI , VI) E9 (U2 ,V2) = - ( U3,V3 ) ) durch : m '-
UI -
n := V I -
V 3 :=
U2 mUI
+ m 2 + al m mU3 + n
U3 := - a2
(U 3 , V 3 )
UI -
U2
•
( U I, Vl )
Abb. 23.4: Der Fall zweier verschiedener, nicht übereinander liegender Punkte
Es bleibt un s nur noch der Fall zu untersu chen, dass wir zwei identi sche Punkte haben. Ist nämlich b ei zwei Punkten UI = U 2 , dann gilt ent wede r V I i- V2 und un sere Defini ti on für die Inver sen greift od er es gilt VI = V 2. J et zt setzen wir zusätz lich ~; (u , v) i- 0 voraus, denn den anderen Fall haben wir ebe nfalls in un serer Definition des Inver sen inb egriffen . Die Id ee ist nun dieselb e: Wir b etrachten die "Ge rade durch die Punkte (u , v) und (u , v )". An sch aulich ges proc he n ist das genau die Tangente, denn, wenn wir zwei Punkte aufeinander zu gehe n und sich in (u, v ) treffen lassen , dann geht ihre Verbindungsger ade in die Tangente durch (u , v ) üb er. (Natürlich nur, sofern (u , v) wirklich eine solche besit zt, also ni chtsingulär ist .) Wie finden wir nun die Tangentengleichung? Gew öhnliche s Differenzieren ist mei st nicht mögl ich , da wir ja keine Funktion y(x) haben . Wi r können aber statt de ssen implizit differenzieren:
293
23.4 Das Gruppengesetz
In Punkt en (Ul, vI), in den en ~~ ( U l,v I) -::p 0 ist, gilt dann
Dies liefer t un s wied er eine Tangentengleichung der Form y = m x obi gen mund n = Vl - mUl .
+n
mit dem
Das gleiche Spi el wie ob en liefert un s ein Polynom in x vom Grad dr ei , dessen Nullst ellen die Schnittpunkte der Geraden mit der Kurve angeb en . J etzt kennen wir ebenfalls schon zwei Nullste llen dieses Polynoms, denn im Zusammen hang mit Lemma 23.1 haben wir festgest ellt, dass die Tangente den Graphen in (U l , vi ) mehrfach schne ide t. (In diesem Sinne ist also die Vorst ellung der Tangenten als "Gerade durch (Ul , Vl) und (Ul,VI)" durchaus berechtigt .) Wir können also a uch jetzt U 3 durch - a2 + m 2 + al m - Ul - Ul und Einsetzen in die Geradengleichung erhalten .
V3
durch
Abb. 23.5: Der Fall zweier identischer Pun kte und nichtsen krechter Ta ngente
Die Formulierung "Gerade durch P und Q" werden wir im Folg enden weiterhin so b enutzen , dass eine Gerade durch zwei identische Punkt die Tangente meint. Wi e wir hi er geseh en haben, schadet das ja kein esfall s der Gültigkeit un serer Kon struktion.
23.4.3
Zusammenfassung der Definition
Endlich können wir die Verknüpfung vollständig defini er en :
294
23 Das Gruppengesetz elliptischer Kurven
Definition 23.5 Seien (UI , vi ) , (U2, V2) E E(K) b eliebige endliche Punkte eine r ellipt ische n Kurve. Dann definieren wir: 00 EB 00 := 00. i. ii. (UI ,VI) EB 00: = 00 EB (UI ,VI):= (UI ,VI). iii. (Ul ,VI) EB (U2, V2) := (U2,V2) EB (Ul ,Vl) := 00 wenn Ul = U2 und VI =I- V2 oder wenn (UI , vi ) = (U2, V2) und ~~ (u , v) = O. iv, In allen anderen Fällen : (UI,VI) EB (U2,V2) := (U3, - a 1U3 - a3 - V3), wob ei VI - V2 UI - U2
m '-
~ ( U I, vI)
~~(UI ,VI) U3 := - a 2 + m
2
+ alm
sonst - UI - U2
•
Direkt aus der Definition kann man ablesen, was wir b ereits festgestellt haben: Es gibt ein neutrales El ement und aus Lemma 23.3 folgt, dass jed es Element auch ein beidseitiges Inver ses hat. Eine winzige Rechnung zeigt auch, dass iv. kommutativ ist , sodass die Verknüpfung insgesamt kommutativ ist. (Was ja a uch einleuchtend ist, denn die Gerade durch die beiden Punkte ist ja das Entscheidende für die Definition und dabei ist es natürlich egal, ob die Gerade vom ersten zum zweiten Punkt oder a nders herum geht.) Bis hierhin haben wir also eine sogenannte Quasigruppe vorli egen. Was uns jetzt üb er alle Maßen glücklich machen würde, wär e das Assoziativgesetz, und genau das ist es , was uns wirklich vor Schwierigkeiten stellt.
23.5
Die Assoziativität
23.5.1
Vorbereitung
Wir wollen nun b eweisen, dass für alle P, Q , R E E(K) gilt: (A)
Dies wird leider etliche Fallunterscheidungen und viel Geduld erfordern. Zunächst werden wir ein Lemma beweisen, das wir für die Umformungen sp äter benötigen werden:
295
23.5 Die Assoziativität Lemma 23.6 Es gilt für alle Punkte P, Q aus E (K)
(-(P fBQ)) fBP = - Q und
(-P) fB (P fB Q) = Q. Beweis: Ist P fB Q = 00, so gilt (-(P fB Q)) fB P = ( - 00) fB P = P = - Q. Nat ürlich gilt die Gleichung au ch, wenn P = 00 ode r Q = 00 ist . Wir können also o. B . d. A . nur endliche Punkte betrachten .
Wi r wissen au s der Defini tion, dass - (P fB Q) de r dri t te Punkt auf der nichtsenkrec hten Geraden durch P und Q ist . Umgekehrt kann man a be r auch sagen , dass Q der dritt e Punkt auf der Geraden durch P und - ( P fB Q) ist . Somit gilt nach Definition (-(P fB Q)) fB P = - Q. Vollkommen a nalog bew eist man die zweite Gleichung.
o
Mit Hilfe von Lemma 23.6 können wir den Fall a bhande ln, das s Q fB R = 00 ist , denn dann haben wir R = - Q und die rechte Seite von (A) geht üb er in (P fB Q) fB (-Q) , was nach dem Lemma (man benutze die zweite Gleichung und die Kommutativität) gleich P ist . Und P ist ja a uch das Erge bnis der linken Seite. An alog läs st sich der Fall P fB Q = 00 erledigen. Ebenfalls können wir den Fall behandeln, dass P fB (Q fB R) = 00 ist, denn dann gilt P = - (Q fB R) ===} P fB Q = - R nach 23.6 (er ste Gleichung a uf Q und R angewandt) und somit (P fB Q) fB R = 00 = P fB (Q fB R) . Wir können also eine weitere Einschränkung treffen und sagen , dass nicht nur P , Q, R, sonde rn au ch Q fB R , P fB Q, P fB (Q fB R) und (P fB Q) fB R vom unendlich fernen Punkt vers chieden sind .
23.5.2
Ausschluss der einfachen Fälle
Wi r be trachten je tzt die sechs Ge raden , die bei unserer Verknüpfung a uftauchen (siehe Abbildung 23.6), als da wären: Die Geraden durch
• • •
• • •
Q und R (= : m j ) , P und Q (=: [I) , P fB Q und sein Inverses (= : mz ), Q fB R und sein Inverses (= : [z), P und Q fB R (=: m3) und durch P fB Q und R (=: [3 ) '
296
23 Das Gruppengesetz elliptischer Kurven
Abb. 23.6: Die drei Punkte und sechs Geraden (Auch hier meint eine Gerade durch zwei identische Punkte die Tangente.) St ellen wir die Ge raden und ihre gegens eitigen Schnittpunkte in eine r Tabelle zu sammen , ergibt sich Tab elle 23.1. Da wir davon ausgeh en , dass die vier Summen Q EfJ R , P EfJ Q, P EfJ (Q EfJ R) und (P EfJ Q) EfJ R alle ungleich 00 sind, sind insbesondere die Geraden [1 , [3 , m i und m 3 nicht senkrecht. Anders herum sind a ber [2 und m2 senkrechte Geraden, da sie zwei inverse Punkte verbinden (oder eben einen selbstinversen Punkt mi t sich selb st) . Das erklärt a uch, warum hier 00 als Schnittpunkt dieser beiden Geraden a uftaucht , denn den unendlich fernen P unk t hatten wir ja a nschaulich als oberes und unteres Ende von senkrechten Geraden festgelegt. Wie wir sehen, liegen acht von den neun Punkten in der Tabelle auf der elliptischen Kurve. Der Tr ick wird nun sein , dass der let zte Punkt X , der Schnittpunkt von [3 und m 3 , erstens wirklich existiert und zweitens a uch auf der Kurve liegt . Dann ergibt sich näm lich durch unsere Definition der Gruppenverknüpfung, dass X = - (P EfJ (Q EfJ R)) = - (( P EfJ Q) EfJ R) ist, denn X ist dann jeweils de r dritte P unkt von [3 und m 3 a uf der ellipt ische n Kurve.
297
23.5 Die Assoziativität
Tab. 23.1: Sechs Geraden und (hoffentlich) neun Punkte Q - (P EB Q)
- (Q EB R )
R
00
p
Q EB R
P EBQ X?
Durch Bilden des Inv ers en erhalte n wir daraus direkt die Gültigkeit des Assoziat ivgeset zes. Wir werden also ver suchen zu zeigen, dass es so einen Schnit tpunkt X wirklich gibt, dass also [3 und m3 nicht parallel sind, und dass F(X) = 0 ist . Damit wir den Beweis, den wir also vorhaben, wirklich führen können , müssen wir zunächst sicherstellen, dass [i und mj jeweils voneinander verschieden sind. Sch auen wir also zunächst, was passiert, wenn das nicht so ist . Es stellt sich heraus, dass wir alle sich ergebenden F älle bereits ausgeschlossen haben oder mit 23.6 erschlagen können . Wenn nämlich li = mj gilt, dann sind div erse Punkte ,,zuviel" gleich zeitig auf eine r gem einsamen Gerade und auf der ellipt ische n Kurve. Die Ide e ist also jedes Mal , dass einige der Punkte gleich sein müssen:
Fall 1 : [1 = mi Dann läg en P , Q, R auf einer gemeinsamen, nichtsenkrechten Geraden . Sind P, Q, R paarweise verschieden , so muss dann nach Definition - R sein . ===} (P EB Q) EB R = 00 . Das hatten wir ausgeschlossen .
= P EB Q
Ist P = Q -::P R od er P -::P Q = R, so funktioniert das analoge Argument mit der Tangente durch Q. Ist P = R, so gilt aufgrund der Kommutativität: P EB (Q EB R) = P EB (Q EB P) = (P EB Q) EB P = (P EB Q) EB R. -I
Fall 2 : [1 = m2 Hatten wir ausgeschlossen , da
m2
eine senkrechte Gerade ist , 11 jedoch nicht. -I
Fall 3 : [1 = m3 P, Q EB Rund - (P EB Q) lägen dann auf einer gemeinsamen, nichtsenkrechten Geraden. Sind die drei Punkte paarweise verschieden od er P = QEBR -::P - (P EB Q ), so gilt nach Definition P EB (Q EB R) = - ( - (P EB Q)) = P EB Q ~ Q = Q EB R ~ R = 00 . Das hatten wir a usgeschlossen. Ist Q EB R = - (P EB Q), so folgt P EB (Q EB R) = P EB (-(P EB Q)) 2I!::6 - Q und (P EB Q) EB R = (-(Q EB R)) EB R 2I!::6 - Q Also gilt Assoziativität. -I
298
23 Das Gruppengesetz elliptischer Kurven
Fall 4 :
(2 = rni
Analog zu m Fall 2. -/
Fall 5 :
(2
= m2
Dann liegen QffiR , P ffiQ und - (Pffi Q) auf eine r senkrechten Geraden . Auf eine r sen krecht en Gera den gibt es (mit Vielfachheiten) genau zwei endliche Punkte der elliptischen Kurve . ===}
Q ffi R = ± (P ffi Q)
Ist Q ffi R
=P
ffi Q, so gilt mit 23 .6 P
=R
===}
(1
=
m j . Das ist Falll.
Ist Q ffi R = - (P ffi Q), so gilt n ach 23.6 P ffi (Q ffi R) = - Q und (P ffi Q) ffi R = - (Q ffi R) ffi R = - Q ebenfa lls nach 23.6. Also gilt a uc h hier die Assoziativität. -/
Fall 6 :
(2
= m3
Analog zu Fall 2. -/
Fall 7: (3 = rni R,Q ffiP und - (R ffiQ) lägen dann auf einer gemeinsamen , nichtsenkrechten Ge ra den. Das lässt sich - unter Aus nutzung der Kornm u t at ivit ät - durch denselb en Beweis wie in Fall 3 erl ed igen, m an muss nur P u nd R vertauschen . -/
Fall 8 :
(3
= m2
Analog zu Fall 2. -/
Fall 9 :
(3
=
m3
Dann sind R , P und Q ffi R a uf einer gemeinsamen , nichtsenkrechten Geraden. An a log zu Fall 7 ergibt sich dann die Assoziativität. -/
23.5.3
Der letzte Fall
Nach a ll den F ä llen , in denen wir die Assoziativität schon zeigen konnten , drängt sich einem ja doch d as Gefühl auf, es müsse a uch a llgem ein ge lten. Um d as zu zeigen , bleibt uns in der Tat nur no ch ein ein ziger Fall zu untersuchen , der sich a ber als der kom pli zier t est e herausstellt. J ed e unserer Geraden ka n n a ls Nullstellenmenge eines P olynom s der Form ax
+
by + c E K [x , y] d argest ell t werden , die wir entsprechend den Gera den mit Li und mj b ezeich nen .
E benso ka nn aber auch j ede Ge rad e parametrisiert werden , wie wir es für 23.1 b er eit s getan haben :
(x ,y) = (u ,v)
+ t( rx;r y)
299
23.5 Die Assoziativität
Wir werden jetzt beid es brauchen . Zunächst setzen wir nämlich eine Parametrisierung von 11 in F ein. Wir er halt en dann ein Polynom P E K [t] (wie es genau aussieht , haben wir schon einm al b eim Beweis von 23.1 geseh en) , dess en Nullst ellen genau diejenigen t sind , die den Punkten P, Q und - (P E9 Q) ent sprech en . Wenn Punkte zusam me nfallen, dann hatten wir defini ert , dass 11 als "Ge rade durch mehrer e identische P unkte" die Tangente an E(K) meint. Dann ents pricht ein solcher ,,meh rfache r P unkt" auch eine r mehrfachen Nullstelle von F. Wir setzen diese Parametrisierung von 11 a uch in die Polynomdarstellungen von ffi1 , ffi2 und ffi 3 ein und erhalten Polynome m1,m2 ,m3 E K [t]. Diese sind vom Nullpolynom verschied en, da 11 -::P rn, vorausgesetzt ist , und die Nullstellen ents prechen genau den Schnittpunkten von h mit rn. , also Q, - (Q E9 P) und P . Daraus folgt : m1 . m2 . m 3 und P sind Polynome vom gleiche n Grad, deren Nullstellen mit Vielfachheit üb er ein stimmen. Es gibt desh alb ein a E K X mit
P=
a·
m1 .
m2' m3.
Wir nehmen uns dieses a und defini eren ein weiteres Polynom, nämlich:
Wenn wir di e P arametrisierung von h in dieses Polynom einsetzen, erhalte n wir das Nullpolynom , da ja P - a . m 1 . rh2 . rh3 = 0 herauskommt nach der eben erfolgten Überlegung. C ist natürlich ein Polynom in x und y . Wenn man ab er b -::P 0 (es sind nichtsenkrechte Geraden!) und
yn =
b~ ((ax + by + c) -
(ax
+ c)t
ausnutzt, kann man C als Polynom aus K [x][ax + by + c] darstellen, d . h ., man kann Pol ynome bis E K [x] find en mit :
,0 ,3
C (x, y) =
,3 ( x
)(ax + by + c)
3
+ ,2 ( X ) ( ax + by + c) 2 + , I( X ) ( ax + by + c) + , 0 ( x )
LI , d . h ., d as Pol ynom, des sen Nullstellenmenge gen au 11 ist, hat genau die se Form ax + by + c, und da 11 keine senkrechte Gerade ist , ist b -::P O. Wir können die ses Verfahren also hier a nwenden.
Jetz t setzen wir no ch einmal die Parametrisierung von [1 in C ein. Wir wissen schon, dass das Nu llpolynom herauskommen mu ss. Wir wissen aber a uch weit er , dass LI identisch null wird , wenn man die P arametrisierung einsetz t (LI ist ja ger ade das P olynom, dessen Nullste llenme nge h ist) . Also bleibt nur , o(x ) üb er , denn in den Summanden, wo L1(X,y) vorkommt, kommt das Nullpolynom her aus.
300 ===}
23 Das Gruppengeset z elliptischer Kurven
I'o(x ) = 0
===}
C wird von li get eilt.
Wenn man die Roll en der [ und m vert ausc ht, er hält man analog ein sodass F - ß . lIl 2b von mi geteilt wird .
ßE K
X
,
W ir setzen jetzt D = F - a mI m 2m3 - ßl Il2b. Ziel wir d es sein, zu zeigen , dass die ses Polyn om ident isch dem Nullp olynom ist. Offen sichtlich wird D von I I und von m 1 geteil t. [1 und m 1 sind verschiedene Geraden , al so sind II und m 1 t eilerfremde Pol yn ome. Also wird D sogar vom Produkt I I . m1 geteil t. D ist höchst en s ein kubisches Pol ynom , a lso gibt es ein d ri t tes, (hö ch stens) lineare s Polynom L E K [x , y], sodass
(K [x , y] hat eine einde ut ige Primfakt or zerl egung, woraus sich zus am me n mit den Graden ergi bt , dass L exist iert und höchst en s lin ear sein kann , da L höchst en s Grad drei hat .)
Wir wollen zeigen , dass L schon das Nullpo lynom sein mu ss. Zunächst bemerken wir , dass P EB Q =: (ua,v a) und Q EB R =: (U b, Vb) Nullstellen von L sind, da F (u a,va ) = l3(Ua , Va) = m 2(U a , Va) = 0 und ebens o F (Ub, Vb) = b(Ub ,Vb) = m 2(Ub , Vb) = O. Au s der Faktor zerl egung von D folgt als o, dass li (Ua , va) = 0 od er m i ( Ua , va) = L (u a, v a ) = 0 sein mu ss. W äre lI(Ua,Va ) = 0, läge P EBQ al so auf [1, so wären P, Q, P EB Q kollinear. Das hatten wir b ereits au sgeschlo ssen in Fa ll 2 weiter ob en. W äre mi (u a , va ) = 0, so sind R , P EB Q und Q kollinear. Di es ist der Fall 7 von ob en , fällt a lso ebe nfa lls weg.
o od er
Bleibt a lso L(ua , v a) = 0 übrig. Ganz a nalog können wir L(Ub, Vb) = 0 folgern. Also hat L zwei ver schi ed en e Nullst ellen (son st P EB Q = Q EB R ~ P = R , das ist wiede r Fall 1) . Daraus folgt , dass L ein lineares Polyn om oder das Nullpol ynom ist , eine von Null versch iedene Konst ante kann es nicht mehr sein . W ir wissen weiterhin , dass [2 und mz senkrechte Ge raden sind. l2 und m 2 haben daher die Form ax + c. Also kommt im Produkt lIl 2l3 nirgendwo ein y3 vor . Eb enso kommt y hö chs tens in zweit er Potenz in m im2m3 und in F vor, sodass a uch D nur y bis hö chstens zur zwei ten Potenz ent hält. Da II und mi ab er garantiert y ent halt en (denn dies sind ja nichtsenkrechte Geraden), darf L kein y meh r ent halt en , um das zu gewährleist en. Also ist a uch L von der Form ax + c.
301
23.6 Andere Ansätze
Wäre nun L linea ren Grades , so wär e die durch L definiert e Gerade ~ <:;;; «? also eine senkrechte Gerade durch P EB Q un d Q EB R, d . h . P EB Q = - (Q EB R) . Das ist Fa ll 7. So! Das wa r's! Doch , wirk lich . .Jet zt hat das Asso ziativgesetz keine Chance me hr , sich vor uns zu ver bergen, ab hier ist es geliefert: L muss das Nullpo lynom sein, weil wir inzwischen alle anderen Fälle ausgeschlossen ha ben . Also ist 0
=D=
F - amlmZm3 - ß ll lzl3
W ären
und
pa rall el, dann gäbe es (, .; E
[3
amlmZm3
m3
+ ß ( l l lzm 3 + ß';ll lz .
===}
F
[{ x
= amlmZm3 + ß h lzl3. mit b
=
(m3
+ .;
===}
F
=
J et zt setzen wir z. B . den P unk t X l = - (P EB (Q EB R)) ein . Dieser liegt a uf der ellipt ische n Kur ve und a uf ma , ist also ein e Nu llst elle von F . Ebenso ist er ein e Nu llst elle von m 3. Dem zufolge mu ss a uch l1(X I) = 0 oder lz(XI) = 0 sein . Ist X l Nullstelle von Li; so ist [1 = m 3 , ist X l Nullste lle von la, so wäre [z = rns . Beide Fälle hat t en wir ausgeschlossen ===} [3 und m 3 können ni cht par allel sein ===} ein gemeinsamer Sch nit t pun kt X mu ss exist ieren. Da m 3 und b im P unkt X Null werde n , wird also a uch F an der Stelle X nu ll. Also liegt X auf der ellipt ische n Kurve und endlich ha ben wir auch den allerletzten Fa ll erschlag en. Das Assoz iativgesetz gilt tatsächlich !
23.6
Andere Ansätze
Nac hdem wir es wir klich geschafft haben , die Assoziativität der Verknüpfung zu beweisen , will ich noch einen klein en Aus blick auf a ndere Ansätze geben , die es für diesen Nachweis gibt.
23.6.1
Projektive Geometrie
Der Ansatz , de r in Washingt on [67] verfolgt wird , ist im Grunde ein ähn licher , wie de r , den ich gegangen bin . Der wesentliche Un t er schied ist a ber , dass dort eine an de re Geo metrie betracht et wurde. An st att nämlich elliptische Kurven als P unkt me nge in « ? zu bet racht en , ist es auc h oft sinnvoll, sie als Nullst ellenme nge eines homogen en Polynom s in der pr ojekti ven E bene K p Z zu betrachten .
K p Z ist dabe i die Men ge ( [{3 \ { 0 })/ "', wobe i VI '" Vz : -{::::::::} VI = AVZ für ein A E «<. Die Äquivalenz klasse des Vekt ors (u,v ,w) wird dann als (u : v : w) geschrieben . Was ist de r Vorteil der proj ek tiven Bet rachtungsweise?
302
23 Das Gruppengeset z elliptischer Kurven
Zum eine n kann man die "norma le" Eben e al s Teilmenge der projektiven betracht en , indem man den Punkt (u , v) in J( p 2 als (u : v : 1) einbe ttet. Zum ander en kann man gleichzeitig unendlich ferne Punkte mi t einfü hre n, indem man die Punkte, die nicht von dieser Einbet tung getroffen werden , al s die unendlichen Punkte defini er t . Da kon stante Vi elfa che b ei den Äquival en zkl assen keine Rolle spielen , sind das al so gen au diejen igen Klassen mi t projektiven Koordinaten (u : v :O) . An st elle unseres Pol yn oms P wird ein homogenes P olynom dritten Grades p i b enutz t , das durch p i (x, y , z ) = y2z +a l xy z + a3yz2 _x 3 -a2x 2z -a4xz 2 -a6z 3 gegeb en ist . Es muss ein homogenes P olynom sein , um sicherzustellen , dass die Nullstellenmenge des P olynoms in der projektiven E bene wohldefiniert ist , denn wählt man a us der Nebenklasse (u : v : w) einen Vertreter , al so eine n Vektor (AU, AV, AW) und setzt ihn in p i ein, so erhält man
p '( AU, AV, AW) = A3 pl (U ,V,W). Das rechtfer tigt es al so , auch in der projektiven Eben e von der Nullstellenme nge des P olynoms pi zu sp rec hen. Man erkennt schne ll, dass P( u , v) = pi (u , v , 1) ist und somit die Id entifikati on der endliche n Punkte unser er (affin en) elliptische n Kurve mi t den en der projektiven Variante supe r funktioniert . De r Vorteil liegt a uf der Hand, sobald man etw as mehr über die projektive Geometrie weiß : J et zt kann man das a lles wesentlich verkürzen , da man den unendlich fernen Punkt nicht mehr in jed em Beweis und jed er Definition ext ra unt ersuchen muss. Er entspric ht ganz einfac h dem Punkt (0 : 1 : 0), den man b ehandeln kann wie jeden a ndere n . (Im Geg en sa tz zu unserer Definit ion von E (J( ) gib t es in de r projek tiven Eben e nicht mehr "den" unendlichen Punkt , sondern i. A . mehrere. E s gibt aber nur einen, der Nullst elle von p i ist , daher a uch jetzt no ch die Bez eichnung.) Ebens o wird eine Unters cheidung von senkre chten und nichtsenkrechten Ger aden überflüssig, genau wie man au ch ni cht mehr auf parallele Ger aden b esonders a chten muss. Alle Ger aden schne ide n einande r in eine r projektiven Eben e (notfall s in eine m unendlichen Punkt) . Man kann dann gene re ll sagen: "Liege n dr ei Punkte eine r ellipt ische n Kurve auf eine r geme ins a me n Gerade, so verschwindet ihre Summe." Das konnten wir in de r affinen Variante nur für nicht senkrech te Ge raden sagen. Tr ot z a ll dem schi en mir der Bewei s aus diesem Buch nicht geeign et . E r war a n einigen St ellen sehr schwam mig und t rot zdem für mi ch nicht einfach genug, viel e Schrit te konnten weggel as sen od er wesentlich verkürzt werden . Projektive Koordinaten ext ra für diesen Beweis einz ufü hre n, ersch ien mir a uch zu umständlich. Und die Handhabung des Beweises war schon deshalb schwieriger , da man überall mindesten s eine inhalb Mal so viele Koordinaten und Variablen zu überblicken hatte.
303
23.7 Abschluss
Für eine n Fort ges chrit tene n ist dies siche rlich ein inter essan t er Weg , der von mir gesuc hte eleme nt are Beweis für E insteiger ist es j ed och siche r ni cht.
23.6 .2
Divisoren
Es gibt eine n weitere n Beweisansat z, der ä ußerst elega nt und kurz daherkommt . E r benut zt die sogenannten Divisor en . Technisch geseh en ist die Menge der Di visor en Di v(E) eine r ellipt ische n Kurve E (K) die freie ab elsche Gruppe über den El em en t en von E (K ), d . h ., j ed em Punkt P E E (K ) wird ein Erzeuger [P] zuge ord net, und ein Di visor ist eine formale (a be r en dliche!) Summe a oo [00] + ap [P] + aQ[Q ] + ... mi t a oo , p ,aQ , ' " E Z. ü
Die Divi soren sind eine Gruppe (das lässt sich ja b ei der Bezeichnung "freie abelsche Gruppe" be reits vermuten, ist a ber auc h seh r leicht nachz urechnen) . Der Trick ist nun , dass man eine Untergruppe Divo( E) der Divi sor en betrachtet und davon wied erum eine Faktorgruppe. Dann kann man einen Isomorphismus von dieser Faktorgruppe nach E(K) find en . Da in der Faktorgruppe selb stverst ändlich das Assoziativgeset z gilt , überträgt sich diese Eig en schaft dann auf E(K) . Der Vorteil dieser Herangeh ensweise ist auch klar: Es ist ein ä ußerst schöne r, effizienter und kurzer Beweis. Leider ist er a uch sehr schwierig vorzubereiten. Wenn man es direkt versucht , hat man große P robleme, die Faktorgruppe und den Isomorphismus er stens zu finden und zweitens nachzurechnen , das s der Isomorphismus wirklich eine r ist. Um das zu vermeiden , braucht man wied er neu es Handwerkszeug, und gen au da stecken die Kanonen auf Spatzen , die ich eigent lich vermeiden wollte. Kurzum : Für den Profi ist die s sicherl ich der Bewei s schlecht hin, er hat a lles , was man sich wünscht , a ber wieder ist man weit davon en tfernt , ein en für total e E insteiger lesenswert en Bewei s gefunden zu haben.
23.7
Abschluss
So , das wa r me in Bei t rag über das Gruppengesetz elliptischer Kurven . Ich hoffe , dass er vielleicht dem Einen oder Anderen nu tzen wird , der nach die sem Thema sucht , wie ich es getan habe. Möglicherweise gib t es ihn j a doch , den einfachen , kurzen und elementaren Beweis de s Assoziativgesetzes, nach dem ich lange vergeblich sucht e.
F(miJg , Gockelj) = 0 Johann es Hahn (Gockel) ist Dipl.-Math. und promoviert in J ena.
24 ECC - Elliptic Curves Cryptography
Übersicht 24.1 Einführung
305
24.2 Das Problem des diskreten Logarithmus
306
24.3 Schlüsseltausch nach Diffie-Hellman
308
24.4 Public-Key-Verschlüsselung nach E lGamal
309
24.5 Sign ierung nach E lGamal und mit ECDSA . . . . . . . . . . . . . . . . . . . . . . 310 24.6 Index Calculus
313
24.7 Abschluss
315
Wi e versprochen, möcht e ich nach dem Gruppengesetz ellipt ischer Kurven nun die hervorstechendste Anwendung elliptischer Kurven in der Praxis vorstellen: Die Verwendung in der Kryptographie. Insb esondere gehe ich dabei auf Schlüsselaustausch, asymmetrische Ver- und Entsch lüss elung sowie Signierung mit Hilfe von ellipt ische n Kurven ein .
24.1
Einführung
Ich werde in diesem Kapitel sehr "universelle" Verfa hren für drei der wesentlichen Grundaufgaben der Kr yptographie vorstellen, die in der Praxis a ber oft a uf die elliptischen Kurven sp ezialisiert werden. Es soll dab ei um ganz wesentlich e Bestandteile des ver schlü sselt en Informationsaustausches gehen: Die Beschaffung eine s geh eim en Schlüssels für symmetrische Verfahren, Versch lüss elu ng mit öffentlichem Schlüssel und Signierung von Dat en .
306
24 ECC -
Elliptic Curves Cryptography
Viele kr yptogr aphische Verfahren basieren auf "asymmet rischen" P roblems tellungen , sogenannten Einweg- und Tr apdoor-Einwegfunktionen . E ine Funkt ion f heißt dabei Einw egfunktion , wenn 1. 2.
y = J(x ) effizient a us x be rec hne t werde n kann und zu eine m gege be ne n y nicht mit vertretbar em Aufwand ein pass endes Urbild gefunde n werde n kann .
"Effizient" meint dab ei in 1., dass es eine n de t ermi nisti schen Algorithmus gibt , der y in Polynomi alzeit aus x ber echnet . Im Gegen satz dazu darf sich die Op eration auch mit eine m probabilisti schen Algorithmus nicht in Pol yn omialzeit umkehren lassen . (Am b est en a uch dann nicht , wenn man st at t des Worst-Case den Average-Case betrachtet , denn auf den kommt es in der P raxis ja an .) Es gibt viele Funktionen , von den en man vermutet , sie seien E inwegfunktionen. Solche verwendet m an z. B . b ei Hashalgorithmen . Die t atsächliche Exis te nz einer solche n Funktion hat allerdings bish er niemand nachweisen können . (E in solcher Beweis hätte übrigen s die Ungleichhe it von P und NP unmittelbar zur Folge.) Zum Beispi el wird vermut et , dass die Mu ltiplikation von Primzahlen eine solche Einwegfunktion ist , denn die Mul tip likation als solche ist seh r schnell durchführbar , während für die Zerlegung in P rimfak toren bishe r kein Algorithmus mi t vert retbarer La ufzeit bekannt ist . Int eressant wird es für Vers chlüsselungen bei den sogena nnt en Trapdoor-Einwegfunktion en . Dies sind Funktionen , die b ei Kenntnis eine r Zusat zinformation ebe n doch die effiziente Umkehru ng ermögliche n . Eine solche t rit t bei vielen PublicKey-Verfahren auf. Beliebter Vertret er dieser Sp ezies ist das RSA-Verfahren , das darauf basier t , dass die Exponentiation modulo n sehr effizient machbar ist , während das Berechnen eine r Wurzel praktisch undurchführbar ist , es sei denn man kennt den privaten zweiten Exponenten , mit dem die E ntschlüss elung erfolgt.
24.2
Das Prob lem des diskreten l ogarit hmus
Die vier Algori thmen , die ich nun vorst ellen werde, machen von einem ähnlichen P roblem Gebrauch . Es geht dabei um das Diskreter-Logarithmus-Problem (a bgekürzt DLP) . In seiner allgemei nen Formulierung ist das DLP folgende Problem stellung: Man hat die zykl ische Gruppe r = (,) (inklusive de s Erzeuger s , ) sowie ein Elem en t 'ljJ E r gegeben . Das Problem be steht nun darin , einen Exponenten k E Z zu find en, sodass 'ljJ = gilt . (Da man meisten s endliche Gruppen betrachtet, geht es genau genom me n nur um die Bestimmung von k mod [T[]
,k
24.2 Das Problem des diskrete n Logarithmus
307
Für bestimmte Gruppen ist dies sehr einfach zu erle digen: Wenn man z. B . die Untergru ppe (2) von ()l x , .) b etrachtet , dann liefert eine Anwendung des binären Logarithmus effizient di e gesuchte Lösung. Auch in den "P rot oty pe n" der zyklische n Gruppen (Z jnZ , + ) ist das Problem sehr einfach, da man nur eine Division mod n durchführen muss. Diese Gruppen eignen sich a lso nicht für kr yptographische Zwecke . Doch schon , wenn man die multiplikativen Gruppen der en dliche n Körper JF~ betrachtet , wird das Problem ungleich schwi eriger. In der Tat lässt sich das DLP in diesen Gruppen nur mit eine m ähnlich hohen Aufwand lösen, wie man ihn zur Faktorisierung natürlicher Zahlen b enötigt. Für uns von besonderer Bedeutung sind aber natürlich die Punktgruppen elliptischer Kurven über endlichen Körpern. Sie sind zwar i. A. nicht selbst zyk lisch, aber man kann einfach ein Element a uswä hlen und die von ihm erzeugte Untergruppe betrachten. Wenn man die Kurve und diese Untergruppe geschickt wählt , dann ist das DLP für diese Konstellation mit keinem bekannten Algo rithmus vernünftig lösbar. Aus diesem Grund sind elliptische Kurven und die Verfahren, die a uf dem DLP beruhen, vom kryptographischen Standpunkt so interessant: Ein diskreter Logarithmus lässt sich bei geeigneter Wahl der Punktgruppe nämlich sogar noch schwerer berechnen a ls die Faktorisierung einer Zahl. Das führt zu dem , was ich einleitend schon erwähnte: Für die gleiche Sicherheitsstufe benötigt ein Algorithmus , der auf Faktorisierung beruht , ungleich größere Zahlen als ein Algorithmus , der auf dem DLP in elliptischen Kurven beruht. Ein weiterer wichtiger Grund, elliptische Kurven zu verwenden , ist , dass die Gruppenoperation rel ativ schnell ausgeführt werden kann . Eine Gruppe ist klarerweise nur dann von praktischem Nutzen, wenn nur das Knacken einer Verschlüsselung oder eines anderen Verfahrens praktisch nicht machbar ist, während das Anwenden des Verfahrens effizient sein muss. Woran aber liegen diese Unt erschiede zwischen den einzelnen Gruppen? Ein elementarer Satz der Gruppentheorie sagt uns doch eigentlich, dass alle zyklischen Gruppen derselben Mächtigkeit zueinander isomorph sind . Wieso sind trotzdem verschiedene Vertreter derselben Isomorphieklasse mal mehr und mal weniger geeignet für kryptographische Anwendungen? Die Antwort liegt in der Art dieses Isomorphismus: Es ist nämlich genau der diskrete Logarithmus , der diesen Isomorphismus zu den "Prototypen" Z bzw. ZjnZ darstellt. Wie schwer das DLP in einer Gruppe I' zu lösen ist , hängt also davon ab , ob man dies en Isomorphismus in eine effizient ber ech enbare Form bringen kann. Und gen au das ist in viel en Gruppen noch niemandem gelungen . Es ist also der vielzitierte Unterschied zwisch en Theorie und Praxis, der das DLP wirklich interessant macht.
24 ECC -
308
24.3
Ellipt ic Curves Cryptography
Schlüsseltausch nach Diffie-Hellman
Zunächst soll es nun um den Sch lü sselaustausch nach Diffie-Hellmann gehen. Die s ist ein simples Protokoll, welches es zwei Gesprächspartnern, die traditionellerweise mit A(lice) und B (ob) bezeichnen werden , ermöglicht , über einen öffentlichen Kanal (der a lso u . U. abgehört werden könnte) derart Informationen a ust auschen, dass sie danach beide ein und denselben "Wert" haben , a us dem sie einen gemeinsamen Schlüssel für eine geschützte Kommunikation ermitteln können . Das Vorg eh en ist dab ei das Folgende: 1.
2. 3. 4.
A und B verständigen sich öffentlich über eine Gruppe (r) . Sowohl A a ls a uch B wählen geheime Zufall szahlen a bzw. b und berechnen K;A = "(a bzw. K; B = "( b. Diese Werte K;A bzw. K;B schicken sie sich gegens eitig. A b erechnet a us den ihr b ekannt en Werten K;ß und B b erechnet analog K;~.
Wegen K;ß = (rb ) a = "(a' b = ("(a)b = K;~ erhalten sie beide dasselbe Gruppenelement, während ein eventueller Lauscher nur "(, "( a und "( b kennt . Dieses Gruppenelement kann nun auf eine vorher festgelegte V/eise dazu benutzt werden, um einen gemeinsamen Schlüssel für eine symmetrische Verschlüsselungsmethode zu finden. Kann a lso in der zyk lischen Gruppe das DLP effizient gelöst werden , dann kann man auch effizient den geheimen Schlüssel von A und B ermitteln. Wenn man hingegen eine "gute" Gruppe findet , d ann sind die Aussichten für den eventuellen Lauscher, den geheimen Schlüssel zu finden , sehr entmutigend. Diese Fragestellung, ob es möglich ist , aus den drei öffentlichen Werten den Schlüssel zu ermitteln, heißt a uch Dijfie-Hellmann-Pro blem . Die einzige bekannte Möglichkeit , es zu lösen , ist eben genau die Anwendung des diskreten Logarithmus . Solange man a lso eine Gruppe findet, in der das DLP prakt isch ni cht zu lösen ist , ist man mit Diffie-H ellmann auf der sicher en Seite. Selbst das schwächer e Dijfie-Hellm ann-Entscheidungsproblem, b ei dem es nur darum geht, zu überprüfen , ob eine geraten e Lösung die richtige ist, ist in vielen Grupp en (z. B . in endliche n Körpern) bisher nicht ohne diskret en Logarithmus vern ünft ig lösbar. (Wobei hier die endliche n Körper im Vorteil sind. Zumindest dieses Entscheidungsproblem ist nämlich b ei einigen Klass en von ellipt ische n Kurven seh r effizient lösbar.)
24.4 Public-Key-Verschlüsselung nach EIGamal
24.4
309
Public-Key-Verschlüsselung nach EIGamal
Während das Diffie-Hellmann-Protokoll dazu dient , zwei Kommunikationspartnern einen gemeinsamen Sch lüssel für eine symmetrische Verschlü sselung zu beschaffen, wird das nun folgende Protokoll eine asymmetrische Verschlüsselung bereit stellen , d. h . ein P ublic-Key-Verfahren , welches genau wie Diffie-He llm ann auf dem DLP beruht. Benannt ist dieses Protokoll nach dem US-amerikanischen Kryptologen Taher EIG amal (der oft auch Tahir al-Dscham al geschrieben wird) Prinzipiell gibt es drei Stufen des Protokolls (wie üblich sind unsere beiden gesprächigen Kryptographen mit A(lice) und B(ob) b ezeichnet ): i.
Erzeugung des Schlüssels für A a) b) c)
ii.
A wählt eine endlich e, zyklische Gru ppe r = (r). Sie wählt zufällig ein e ganze Zahl x E { 2, . . . , [T] - 2 } un d b erechnet 'ljJ:= , x. A hat nun (r" , 'ljJ ) als öffentlichen un d x als privaten Schlüssel.
Verschlüsselung eine r Botschaft für A von B: a) b) c)
B besorgt sich den öffentlichen Sch lüssel von A und stellt seine Nachricht als ein E lement 11, E r dar . Er wählt eine zufällige ganze Zahl k E { 2, . . . , Irl - 2 } und berechnet a := , k sowie ß := Jl,'ljJk. B üb erträgt an A die Werte a und ß.
iii . E ntschlüsselung de r Botschaft a)
A berechnet mit Hilfe ihres privaten Sch lüssels x einfach Jl,
= ß(a X)- l .
Dies funktioniert deshalb, weil
ß(a X)- l = Jl, .» 'f/ . (k) , - x = 11, (, x)k . (, k) - x = Jl" xk " ( xk )- l = Jl, ist. Der EIGamal-Algorithmus hat wesentlich e Vort eile gegenüber anderen asymmet rischen Verfahren: Dadurch, dass man eine zufällige Zahl k zur Verschlüsselung verwen det, hängt der chiffriert e Text im Idealfall nicht mehr vorh ersehbar vom Klart ext a b : Der gleiche Klartext kann mit dem selben Schl üss el viele verschiedene Chiffretexte ergeben. Dadurch könn en Angriffe, die mit gewähltem Kla rt ext ar beiten, unwirksam gemacht wer de n . Ebenso werde n statistische Angriffe unbrauchbar , da die Verteilung des Chiffretextes einer Gleichverteilung a ngenähert wir d. Nur wenn das Problem des diskreten Logarithmus in r praktisch lösbar ist , ist es bisher möglich, die Verschlüss elung zu br ech en. Das heißt ab er wie im let zten Abschnitt, dass lediglich kein ander es Ver fahren bekannt ist, die Verschlüsselung zu knacken, ohne das DLP zu lösen. In der Praxis ist das aber natürlich völlig ausreich en d.
24 ECC -
310
24.5
Ellipt ic Curves Cryptography
Signierung nach EIGamal und mit ECDSA
Neben der reinen Verschlüsselung von Daten ist eine der Hauptanwendungen der Kryptographie natürlich auch das Sicherstellen der Authentizität von gesendeten Daten. Man braucht also ein Verfahren, mit dem Alice überprüfen kann, ob ihre empfangene Nachricht tatsächlich von Bob stammt. Manchmal ist es möglich , die asymmetrische Verschlüsselung und die Signierung in einem Algorithmus zu kombinieren (z. B. beim RSA -Public-Key-Verfahren ist dies de nkbar) . Ich werde aber zwei eigenständige und allgemeine Signierungsprotokolle vorstellen , die mit jeder Versch lüsselungsmetho de genutzt werden können : Die Signierung nach EIGamal und de n Elliptic Curues Digital Signature Algorithmus (abgekürzt ECDSA) .
24.5.1
EIGamal-Signatur-Algorithmus
Dieser Algorithmus läuft ebenfalls in drei Schritten ab: i.
Erzeugung des Sch lüssels für B. a)
b)
e) d)
ii.
B wäh lt wieder eine endliche, zyklische Gruppe F = (r) mit N Elementen. N wird üb licherweise so gewählt, dass es einige sehr große Primfaktoren hat oder am b est en selbst prim ist. Außerdem wählt er eine Funktion f : I' --+ Z, die die Eigenschaft hat , dass die einzelnen Urbilder nur sehr wenige Gruppenelemente enthalten. Ebenfalls wäh lt er wieder eine Zahl x E {2 , ... , N - 2} und berechnet 1/; =
,x.
B veröffentlicht den Sch lüssel (f" , 1/;, 1). Sein privater Sch lüssel ist wie gehabt x.
Signieren einer Nac hricht von B für A. a) b) e)
B stellt die Nachricht als ganze Zahl m dar (Hashfunkt ionen sind in diesem Zusammenhang üb lich, da sie die Größe von m beschränken) . B wäh lt eine zufällige Zah l k mit ggT(k, N) = 1 und ermittelt p = Sch ließlich wird s = k -I(m - z - f (p)) mod N berechnet . Die Signatur ist dann (m , p, s).
,k.
iii. Verifizieren der Signatur durch A a) b) e)
A hat Kenntnis von (m, p, s) und dem öffentlichen Schlüssel (f", 1/;, 1) von B. Sie berechnet V I = 1/;f( p) . p" sowie V 2 = Ist V I = V2 so akzeptiert A die Signatur als korrekt.
,m.
Zunächst untersuchen wir, warum dies funktion iert , d . h ., wieso b ei einer korrekt signierten Nachricht tatsächlich VI = V2 ist:
311
24.5 Signierung nach EIGamal und mit ECDSA
Ist (m , p, s ) eine korrekt e Sign atur , so gilt k , s = m - x . f (p) + h N für ein h E Z. Daraus folgt : Vi
= 'ljJf(p) . pS
= ('"yx ) f(p)
.
c'l )S
= ,x·f( p ) . - : :
= ,x· f (p )+m -
x·f(p )+hN
= ,m. ('"yN)h
=
V2 ·
1
Die zweite Frage, die sich a ufdrängt , ist nat ürlich , was für eine Funkt ion f denn da verwendet werden soll. ElGamal hat seine Verfahren zunäch st für die multiplikativen Gruppen der endlichen Körper entwickelt. Wenn man dann z. B . als Ausgangspunkt hat , dann bietet sich für f die kanonische die Gruppe Abbildung nach { 1, ... , p - 1 } a n, die a us jeder Re stklasse den passenden Repräsentan ten aus wählt.
JF;
Wenn stattdessen I' eine Unt ergru ppe einer ellipti schen Kurve E (JF p ) ist, dann ist (u, 11) >--+ U eine übli che Wahl für f. Welche Funktion man let zt en Endes benutzt , ist zunächst egal. Aus Sich erheitsgründen sollte jed och die ob en genannte Bedingung sich erg est ellt werden , dass nicht all zu viele Gruppen elem en t e dasselb e Bild unter f haben . Im Beispi el wär e f z. B . inj ekti v, im Beispi el der ellipti sche n Kurven hätten höchst en s zwei Punkt e dasselb e Bild un t er f .
JF;
Au ßerdem mu ss sich f nat ürlich au ch effizient au swert en las sen , sonst würde das Verfahren seinen pr ak ti schen Nu tzen verlieren. Die nächst e Fragest ellung ist die nach der Sicherheit des Verfahrens : Ist es dem Auß en st eh enden C(harles) möglich, fremde Nachrichten mit Bobs Signatur zu ver sehen?
,m
Um dies zu tun , mü sst e C ein Tripel (m , p, s) erzeugen , das 'ljJf( p ) . p" = erfüllt. Bekannt sind ihm dazu nur Bobs öffentlicher Schlüssel (r, I , 'ljJ , f) sowie die Nachricht m. C könnte also ein p fest set zen und versuchen , ein dazu passendes s zu find en . Dazu müsste er die Gleichung pS = . 'ljJ - f ( p ) nach s a uflösen können , er müsste
,m
also eine n di skr et en Logarithmus bestimmen . Nach un serer Gen eralannahme, dass dies prakti sch nicht machbar ist , fällt dieser Weg weg. E in a nderer Weg wär e es , s festzul egen und ein passendes Gruppen elem ent p zu nach p a ufgelöst werden. Es find en . Dazu mü sst e die Gleichung 'ljJ f ( p) . ps = wird allg em ein a ngenom me n, dass dieses Problem mindest en s genauso schwer ist , wie das P roblem des diskr et en Logarithmus, wenn nicht noch schwerer.
,m
24 ECC -
312
Elliptic Curves Cryptography
Sicher ist das allerdings nicht, da dies e Frage noch nicht vollständig untersucht wurde. Jetzt kommt auch die Bedingung ins Spiel, dass das Bild von f nicht wesentlich kleiner als T selbst ist. Wäre im(J) nämlich sehr klein, so könnte C alle möglichen 'lj;- ! (Pi) nach p auflösen Bilder f(p;) durchprobieren, die Gleichung p" = und prüfen , ob f(p;) = f(p) ist. Je kleiner im(J) ist , desto wahrscheinlicher ist es dann , schnell einen Treffer zu landen und so eine gültige Signatur (m, p , s) zu produzieren.
,- ,r .
Da man sich ja o. B. d. A . alle Exponenten modulo N = [I"] reduziert denken kann, muss die Wahl von f eigentlich noch weiter eingeschränkt werden. Auch die Gruppenordnung N darf nicht allzu beliebig sein, da sonst noch weitere Angriffe mög lich wären, wenn N eine ungünstige Primfaktorzerlegung hat. Daher wäh lt man meist solche Untergruppen, deren Ordnung große Primfaktoren hat oder die selbst prim ist. Es ist auch noch offen, ob es vielleicht ein Verfahren gibt, p und s zugleich zu bestimmen. Bisher ist es aber niemandem gelungen und deshalb wird das Signatur-Verfahren nach ElGamal auch als sicher angesehen.
24.5.2
ECDSA
Ein zweiter, dem ElGamal-Verfahren sehr ähnlicher Signaturalgorithmus ist der Elliptic Curves Digital Signature Algorithmus - abgekürzt ECDSA -, der eine Abwandlung des klassischen Digital Signature Algorithmus (DSA) für die Benutzung mit elliptischen Kurven darstellt. Wie auch die ElGamal-Protokolle wurde der DSA nämlich zunächst für endliche Körper definiert. i.
Erzeugung des Schlüssels für B . a)
b) c) H.
B wählt eine (ausnahmsweise multiplikativ geschriebene) elliptische Kurve E(lF p ) , deren Ordnung gleich l'q ist , wobei q eine große Primzahl ist und l eine kleine Zahl. B wählt einen Punkt, E E(lFp ) der Ordnung q und wie gewohnt eine zufällige Zahl x und berechnet daraus 'lj; = Die Information (E , p, q, " 'lj;) werden öffentlich gemacht, x wird geheim gehalten.
,x.
Signierung einer Nachricht für A von B. a) b)
B stellt seine Nachricht wie gehabt als natürliche Zah l m dar. Er wählt zufällig eine Zah l k E { 2, .. . , q - 2 } und berechnet das Gruppenelement p = = (u, v) E lF~.
,k
313
24.6 Index Calculus
c) d)
Daraus berechnet er 8 = k - 1 (m + xu) mod q. Falls einfach ein neues k und versucht es noch einma l. Die Signatur ist wieder (m, p , 8).
8
= 0, so wählt B
iii. Verifizierung der Nachricht durch A . 1
m mod q und b2 =
1
a)
A b er echnet bt =
b) c)
Sie berechnet weiterhin p' = '""/' . 'ljJ b2 • Die Signatur wird akzeptiert, wenn p' = p ist .
8-
.
8-
.
u mod q.
Wir können uns auch hier durch eine winzige Rechnung davon überzeugen, dass der Algorithmus bei einer gültigen Signatur perfekt funktioniert . Dann gilt nämlich:
p'
= /, . 'ljJ b2 = 'Ts
-1
·m .
bX)S
- 1 ·U
= 'Ts - ' .(m+x u ) = 'T
k
= p
Die Sicherheit von ECDSA ist vergleichbar mit der des ElGamal-SignaturAlgorithmus, da ein Angreifer vor denselben Problemen stehen würde. Der wesentlichste Unterschied liegt in der Effizienz: Für die Verifizierung einer Nachricht benötigt Alice beim ElGamal- Verfahren drei Exponentiationen , beim ECDSA-Verfahren nur zwei , die sich auch noch etwas effizienter als normal gestalten lassen. Da dies der rechenaufwändigste Schritt ist , ist jede Verbesserung willkommen in der Praxis.
24.6
Index Calculus
J etzt möchte ich kurz noch den tieferen Grund besprechen , wieso elliptische Kurven gegenüber der zweiten großen Klasse von kryptographisch verwendbaren Gruppen - den multiplikativen Gruppen der endlichen Körper - so sehr im Vorteil sind . Das liegt am sogenannten Irulex-Calculus-Alqoritlimue , der es in endliche n Körpern erlaubt, das Problem des diskret en Logarithmus et was effizienter zu lösen als in ander en Gruppen. Ich deute kurz an , wie der Algorithmus über lF p funktioniert .
24 ECC -
314
Elliptic Curves Cryptography
JF;
,k.
Gegeben ist wie gewohnt ein erze ugendes E leme nt, von und ein weiter es Elemen t 'lj; E Gesu cht ist eine ganze Zahl k mi t 'lj; = Wesentlicher Grundst ein ist , dass die Abbild ung des diskret en Logarithmus auc h in endliche n Gruppen aus Produkten Summe n macht :
JF; .
Dies wir d im Algorithmus a usgenutzt, um log,,(b) fü r gan z be st immte b E T zu b est immen und da raus schließ lich log" ('lj; ) zu ermit t eln. 1.
2.
3. 4.
Man wählt eine soge nannte Faktorbasis B , die die P rimzahlen bi s zu eine r gew isse n Gren ze enthält. Man be rec hne t ver schi ed en e Potenzen und ver su cht, je eine n Repräsent anten in ein Produkt a us Eleme nten von B zu faktori sier en . Anhand eine r solche n " B-Zerlegung" erhält m an eine lin eare Gleichung für die diskreten Logarit hme n der E leme nte a us B. Wenn man genüge nd solche r Gleichungen zusamme n hat, kann m an mittels lin earer Algebra die diskreten Logarithmen der E leme nte von B ausrechnen. Danach ver su cht m an , 'lj; ode r ein Vielfaches von 'lj; ebenfalls in P rimfakt ore n aus B zu zerlegen. Gelingt dies, so erhält man eine lin eare Gl eichung für log" ('lj;), in der nur die in zwischen bekannten Werte log,,(b) für b EB vorkommen.
,k
Zunächst ein Beispi el, um das Wirkungsprinzip zu verdeutlichen : Sei p = 401 " = 6 mod p und 'lj; = 214 mod p. 1. 2.
W ir wählen B = { 2,3 }. Inde m wir für k = 1,2,3, ... ber echnen und jeweils ver su chen , die E rgebnisse zu fak to risieren , erh al ten wir folgende Glei chungen:
,k
, I , 15
3.
== 2 1 . 3 1 mod 401 == 20 . 3 5 mod 401
Umformulier t sind das die Gleichungen: 1 == 1 . L 2 + 1 . L3 mod 400 15
== 0 . L 2 + 5 . L 3 mod 400
Wobei L b die Abkürzung fü r log,, (b) sei. Die s ist ein ganz no rmale s lineares Gle ichungssystem , das wir rela t iv einfach lösen können. Dab ei erhal ten wir nach einer Probe der versch iedenen Möglichkeit en (da 5 und 15 Nullteiler in Z/400Z sind , gib t es mehr als eine Lösung) :
L2 == 238 mod 400 L3
== 163 mod 400
315
24.7 Abschluss
4.
Wir können nun mit Hilfe der Relati on 2 . 'Ij; == 428 == 3 3 mod 401 den diskr eten Loga rithmus finde n: log, (2) + log, ('Ij;) == 3 . log, (3) mod 400 ===} log, ('Ij;) == 251 mod 400.
In sgesamt hat der Algorithmus eine Laufzeit von et wa O(ex p (y!2 . In p . In In p)) . Damit ist er allgem ein verw endbar en Algorithmen deutlich üb erl egen, denn diese haben bish er eine Laufzeit von O( yp) = O(ex p( ~ . In p). Der wichtigst e Effizien zfaktor a m Index-Calculus-Algorithmus ist dabei die Wahl von B . W ählt man B klein er , sinkt die Wahrscheinlichkeit , B-faktorisierbare Körperelem ente und nü t zlich e Relationen zwische n ihnen zu find en . Wählt man B größer, steigt die Laufzeit des Algorithmus jedoch dramatisch an . Man kann den Algorithmus auf offensichtliche Weise auf b eliebi ge endliche Körper üb ertragen , denn diese können ja als Quotienten der Pol ynomringe lFp [x] reali siert werden. Da man au ch in Polynomringen eine einde ut ige Primfaktorzerlegung hat , funktioniert das Verfahren a uch dort. Man mu ss in B dann a uch die Primelem ente des Polynomrings zulassen (d. h . die irreduzibl en P olynome) . Der Punkt ist a be r, dass der Index-Calculus-Algorithmus unbedingt die Möglichkeit zur Faktorisierung benötigt . So et was wie eine Primfaktorzerl egung ist in allg em ein en Gruppen a ber nicht gegeb en . Der Algorit h mus lässt sich also nicht weit er au sdehnen. Vor allem lässt er sich nicht a uf elliptische Kurven um sch reiben , und dort bleiben einem Angreifer im Idealfall nur die wesentlich langsameren , allgem einen Verfahren .
24.7
Abschluss Die vielfältigen Mögli chkeiten, das diskrete-LogarithmusProblem zu kr yptographischen Zwecken zu benutzen, werden in der Praxis vor allem über endlichen Körpern und elliptischen Kurven eingesetz t . Wie wir gesehen haben , sind ellipti sche Kurven a ber heutzutage deutli ch im Vorteil gegenüber den endlichen Körpern . Ich hoffe ich konnte euch die se Anwendungen und Vorteile elliptischer Ku rven etwas näher bringen. log mf 9 (Go ckel)
25 Primzahlen und elliptische Kurven
Übersicht 25.1 Mathematisches üb er ellipt ische Kurven
317
25.2 ECM -
319
Fak torisierung mit elliptischen Kurven
25.3 Zertifizierung von Primzahlen
322
25.4 Abs ch luss. .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . .. . . . . . . .. . .. . . . . 325
Nach den zwei vor angegangenen Kapiteln über das Gruppengesetz elliptischer Kurven und die Elliptic Curves Cryptography soll es nun im dri t t en Kapitel um zahlentheoretische Anwendungen ellipt ische r Kurven gehen . Ich wer de dabei den Faktorisierungsalgorithmus nach Hendrik Lenstra und das Go ldwasser-KilianPrimalitätszertifikat vorstellen .
25.1
Mathematisches über elliptische Kurven
Bevor es richt ig losgeht , möchte ich kurz et was zur Mathematik der ellipt ische n Kurven sag en . Wir benötigen dieses Mal nämlich ein wenig mehr mathematisches Handwerkszeug als das rein e Gruppengeset z.
25 .1.1
Hasses Satz
Ein grundlegender , aber äußerst nützlich er Satz ist nach Helmut Hasse b enannt . Er liefert eine Abschätzung für die An zahl der Punkte ein er ellipt ische n Kurve üb er endliche n Körpern:
Sa t z 25.1 (Satz von H a sse ) Ist E( lF q) eine elliptisc he Kurve, so gilt q + 1 - 2yq 50 IE (lFq)150 q + 1 +
2yq.
318
25 Primzahlen und elliptische Kurven
Ich werde den Satz in diesem Beitrag ohne Beweis benut zen , da der Beweis et was lä nge r ist , wenn man ihn von Anfa ng a n a ufba ue n mu ss, und außerde m keine für diesen Darst ellung int er essanten Er kennt n isse liefer t. Es sind neb en diesem Satz noch viele weitere Au ssa gen zur Gru ppe no rd nung möglich und mit Schoofs Algorithmus ist es a uch mö glich, sie effizient zu b erechnen . (Scho ofs Algorithmus ber echnet die An zahl P unkte eine r elliptische n Kurve über eine m endliche n Kör per in po lynomieller Zeit.)
25.1.2
Elliptische Kurven mod n
Wir werden uns mit Algorithmen beschäftigen, die der Beantwortung wesentliche r Fr agen der algorithmischen Zahlentheorie dien en , nämlich der Fr agen , ob eine natürliche Zahl n prim ist und wenn sie es nicht ist , wie ihre P rimfa kt orzerlegung aussieht . Dab ei werden wir mi t elliptischen Kurven über Z / nZ hantieren . Au ch wenn wir bisher nur ellipt ische Kurven über Körpern unt er su cht hab en , ist das fü r die Praxi s er st einmal kein Problem für uns. Die Algorithmen , die ich gleich vorstellen werde, funkt ionieren bestens, wenn m an das Gruppengesetz der ellipti schen Kurven völlig naiv eins zu eins übernimmt . Es ist trotzd em erwähne nsw ert , dass man mit der bekannten Ber echnungsvorsch rift i. A . kein e Gruppe bekommt , da in der Definition der Verknüpfung Divisionen auftreten. Wi e wir wisse n , gibt es bei zus am me ngesetzten n ab er Nullte iler in Z / nZ, die ein e solche Div ision unmögli ch machen . Die Verknüpfung ist also a uf die se Weise ni cht für a lle Elemente de r Menge defin ierbar. Wie gesag t , fü r die P raxis ist das kein P roblem , denn sobald m an bei de n Bere chnungen der nachfolgen den Algori thmen auf so einen Nullt eiler st ößt, hat man j a einen nicht trivialen Teiler von n zur Hand , indem man de n ggT de s Divisors mi t n berechnet , und damit a uch eine Antwort auf die jeweilige Fragest ellung gefunden . Für die t heoret ische n Üb erlegungen ist die s aber zunächst do ch ein Problem. Indem man jedoch eine verallgemeinerte Defini tion der Gruppenverknüpfung mittels proj ektiver Koordinaten benutzt , kann dies gelöst werden . Dann kann man ellipt ische Kurven über all en kommutativen Ringen mit 1 defini er en (vergleiche hier zu Kapitel 23 Abschnitt 23.6.1 "P rojektive Geometrie") : Die proj ektive Eben e über dem Ring R defini ert man dann wie folgt: Zunäch st führt man auf R 3 diese Relation ein:
25.2 ECM -
319
Faktorisierung mit elliptischen Kurven
Die Äquivalen zklasse von (u ,v ,w) wird dann mit (u : v : w) b ezeichnet, genau wie wir das schon von der pr oj ektiven Geometrie üb er Körpern kennen . Die proj ektive Eb en e ist ab er nur eine Teilmen ge dieser Fa kt orme nge : Rp
2
:=
{ (u : v : w) I :3 r-i , r v , r w E R : r u u
+ r v v + r ww =
1}
Ist R ein Körp er , so ergibt das die übliche Definition , da die Bedingung für jedes Tripel (u ,v,w) =I- (0,0,0) erfüllbar ist . Im Fall R = Z wär e die Bedingung äquivalen t zu ggT(u ,v, w) = 1 un d im Fa ll R = Z/ n Z zu ggT( u ,v,w ,n) = l. E ine ellipt ische Kurve E (R) wird dann genauso defini er t wie b ei den Körpern , nämlich als Nullstellenme nge eines hom ogen en Polynom s der Form
Es gib t i. A . mehrere unendliche Punk t e b ei elliptische n Kurven über Ri ngen , trotzdem ist (0 : 1 : 0) weit erh in das ne utrale E leme nt. E in nü t zlicher Asp ekt a n dieser Definition ist , dass die Redukti on der Punktkoordinat en eine r Kurve E (Z/ nZ ) modulo eine r Primzahl p i n eine n Gruppenhomomorphismus E(Z/nZ ) ---+ E (Z/pZ) liefer t. Das ist vor allem dann inter essan t , wenn man zwei P rimteiler p und q von n sowie eine n P unkt P E E (Z / nZ ) hat , der mod p den un endlich fernen Punkt erg ibt, mod q a be r nicht . Dieser P unkt liegt dann "teilweise im Un endlichen" und die dritte Koordinate ist dann durch p , ab er nicht durch q t eilb ar. Die dritte Koordinate solche r "halbune ndliche n" Punkt e hat also eine n gem ein same n Primteiler mi t n . Man kann zeigen , dass das Auftret en eines solchen P unktes äquivalen t dazu ist , dass bei seiner Berechnung durch das Gruppengesetz, wie wir es kennen , eine unerlaubte Divi sion durch ein en Nullteiler au ftrat.
25.2
ECM Ku rven
Faktorisierung mit elliptischen
Es existiere n dutzende Verfahren zur Faktorisierung von spez iellen natürlichen Zah len . J ohn M. Pollard b eschrieb 1974 ein solches Verfahren , das man auch Pollords (p - 1)-A lgoriihm us nennt . Schauen wir un s doch einm al kurz an , was seine Id ee war : An gen ommen, die Zahl n = pqr sei gegeben, wobei hier p und q verschiedene Primzahlen sind und r einfach ein e natürliche Zahl ist. Nehme n wir a uch no ch an , dass p - l selbs t kein e allzu großen Primfaktoren hat. Wählt man dann eine genüge nd gro ße Schr anke B und ber echnet das P ro dukt e aller P rimp otenze n klein er od er gleich B , dann ist p - 1 ein Teiler dieses P ro dukts.
25 Primzahlen und elliptische Kurven
320
Es gilt dann nach Fermats klein em Satz für jed e natürliche Zahl a, die nicht von p geteilt wird:
a
e
==
1 mod p
Es ist hingegen nicht sehr wahrscheinlich , dass dies a uch für alle Primfaktoren von n zutrifft , sofern man die Schranke B geschickt wählt . Es exist iert also höchstw ah rscheinlich ein zweiter Primteiler q, sodass
ist . Das heißt , dass a e - 1 von p, ab er nicht von q geteilt wird . Bildet man also gg'I' (o" - I, n ) = ggT (a e - 1 mod n ,n), so ist man effizient in der Lage, eine n nichttrivialen Faktor von n zu find en , nämlich p od er zumindes t ein Vielfaches von p . Nun hat man ab er das Probl em , das s man p vorher nicht kennt und daher die Schranke B nur schlecht b estimmen kann. Wählen wir un s irgendein B, so b est eh t zwar eine gewisse Chance, dass p - 1 "B-po te nzglat t" ist - wie man die obige E igen sch aft a uch nennt - a be r wenn p - 1 das nicht ist, haben wir ein Problem . Man könnte größere Werte von B au sprobieren , a be r da die Wahl dieser Schranke den größten Anteil an der Laufzeit des Algorithmus hat , würde dies den Effizienzvorteil zunichte machen. Das Verfahren ist so also nicht für allg em ein e Zwecke zu gebrauche n. Es taugt nur für einige spez ielle Zahlen . Glü cklicherw eise entwickelte Hendrik Lenstra 1980 a be r ein e a bge wa nde lte Ver sion dieses Verfahren s für ellipt ische Kurven , welch e auch Len stras Met hode ode r ECM - Elliptic Curoes M ethod - genannt wird . Sie ist wesentlich vielseitiger einse tz bar und ist auf eine sehr viel größere Menge von natürlichen Zahlen anwendbar. Der Algorithmus ist erst a unlich einfach und rü ckblickend wied er einm al völlig naheliegend. Wir haben wieder eine Zahl n und eine Sch ranke B wie oben. Au s die ser Schranke berechnen wir un s ebenfalls den Exponenten e. Dann geh t es los mi t der ECM: 1.
2. 3.
4.
Wähle zufällig eine ellipti sche Kurve E(Z /nZ) und einen Punkt P E E( Z /nZ) . Ber echne das El em ent e . P. Wird b ei der Ber echnung durch ein Elem ent geteilt, was in Z/nZ ni cht inver ti erbar ist (also geme insame Teiler mit n hat) , so wird abgebrochen. Wenn nicht , dann st a rten wir no ch eine n Ver such.
Warum funktioniert das ? Nehmen wir wied er die Faktorisierung n = pqr an . W ählen wir dann eine ellipt ische Kurve E (Z/ nZ ) und reduzier en sie mod p, so erhalten wir E( Z /pZ) und von dieser Kurve wissen wir, dass sie zwische n p + 1 - 2JP und p + 1 + 2JP E leme nte hat .
25.2 ECM -
Faktorisierung mit elliptischen Kurven
321
J ed e natürliche Zahl im Intervall (p + 1 - 2yp, p + 1 + 2yp) kommt dabei vor und die Ordnungen der elliptische n Kurven mod p sind au ch einigermaßen gleichförm ig verteilt in diesem Intervall , wenn p nicht sehr klein ist (aber klein e Primfak toren schließt man in der P raxis sowieso durch eine Probed ivision von vornher ein au s). Nun gib t es hö chstw ah rscheinlich au ch einige B-potenzgla tte Ordnungen in diesem Int ervall, solange B eine vernünftige Größe hat. Tr effen wir eine Kurve mit so eine r Ordnung, dann ist e· P = 00 in E( Z jpZ) , da e ja ein Vielfa ches der Ordnung IE (Zj pZ)1 ist . Wie schon bei der (p - l)-Methode ist es a ber weniger wahrscheinlich , dass e . P auch modulo anderen Primteilern von ti zu 00 wird . Wir haben also einen "halbune ndliche n" Punkt gefunden , bei dessen Ber echnung Nullte iler von ZjnZ aufgetret en sein mü ssen. In Schritt 2 find en wir somit eine n der gesu chten Teiler von n , Be t rachte t man die Unterschiede zwischen Pollards und Len stras Vorgehen, so fäll t ein wesen tlicher Vorteil der ECM in s Auge: Beim (p - 1)-Algorithmus hatte man wenig Möglichkeiten, wenn p - 1 nun ni cht B-potenzglatt war , und musste den Algorithmus dann ohne Ergebnis abbrechen. Die Faktorisierung mit ellipti schen Kurven lässt sich davon jedoch ni cht a bschrecken, denn wir können einfach eine neue Kurve wählen. Hier kommt es nämlich darauf an, dass die Ordnung der zufällig gewählten Kurve die Glattheit seigenschaft erfüll t und nicht die feste Zahl p - 1. E in weiterer nicht zu ver ach tender Vorteil ist die Tatsache , dass sich der Algorithmus parallel ver arbeiten lässt . Hat man mehrere Prozessoren zur Verfü gung, so kann m an gleichzeit ig mehrere ellipti sche Kurven abarbeiten lassen und den Algorithmus so kräftig beschleunigen. Auch hie r ist aller dings die Größe von B bzw . e der en t scheidende Fak tor in der Laufzeit . W ählt man B kleiner , so sinkt die Dichte von B-potenzglatten Zahlen im Inte rvall , das durch den Satz von Hasse vorgegeben wird . Vergrößert man B, explodiert wieder die Laufzeit . In der Praxis sieht es desh alb heutzutage so aus: Einige High-End-Algorithmen wie das Quadratische Sieb und das allg em ein e Zahlkörper sieb sind erhe blich im Vorteil gegenüber der ECM, was die asymptotische Laufzeit betrifft . Allerdings haben sie groß e Kon st anten , sodass man die Faktorisierung meist aufteilt : Kleine P rimfaktoren findet man durch Probedivision . Für die mi t telgroßen Primfaktoren benutzt man die Methode der ellipt ischen Kurven mit eine m B in der Gr ößen ordnung 108 . Damit find et man Faktoren mit ca . 40 Ziffern (~ 130 Bits) , und nur für die größ eren Faktoren nimmt man dann wied er die richtig schwer en Geschütze.
322
25 Primz ahlen und ell ipt ische Kurven
25.3
Zertifizierung von Primzahlen
25.3. 1
Was ist eigentlich ein Zertifikat?
Dieser Frage geh en wir zue rs t nach. Für viele Anw endungen , z. B . in der Kryptographie, werden Primzahlen b enötigt und nicht immer hat der Anwender diese dabei selbst erzeugt. Oft gen ug b ekommt er öffentliche Schlüssel zugeschickt und m uss sie anwen den . In seh r vielen Algorithmen sind dabei eine od er mehrere Primzahlen im Spi el und die Sicherheit hängt nicht selten genau von dieser Primalität ab. Besonders in sich erheitskritischen Be reichen benötigt man deshalb Bewe ise , dass die jeweilige Zahl wirklich prim ist. Hier kommen dann die Zertifikate ins Spiel. Allgemein formu liert ist ein Zertifikat ein Satz von Daten, die es effizient erlauben, eine be stimmte Eigenschaft zu überprüfen und zweife lsfrei zu beweisen . ("Zweife lsfrei" ist natürlich ab strahiert zu ver stehen. Völlige Sicherheit vor z. B . Hardwarefehlern kann es naturbedingt nicht geben.) Ein sim ples Beispiel: Angenommen, man möchte die Eigen schaft " n ist eine zu sammengesetzt e Zahl" zert ifiziere n . Dazu ist es völlig au sr eichend , eine n Teiler von n anzugeb en. Wer immer das Zertifikat prüfen möchte, kann dies dann durch eine simple Probedivision tun . Ge ht sie ohne Rest auf, so hat der Prüfer damit einen todsicheren Beweis, dass n keine Primzahl ist. Bleibt ein Rest , so wird das Zertifikat abgelehnt und der Kommunikationspartner a ls Betrüger entlarvt. An die sem Beispiel fällt schon ein wesentliches Kriterium für Zertifikate auf: Nur das Überprüfen muss effizient möglich sein . Das konkrete Finden eines Tei lers ist z. B. ziem lich aufwändig, während die Division sehr effizient implementiert werden kann . Noch etwas fällt auf: Zertifikate sind i. A. so angelegt , dass nur die p osit ive Antwort et was bringt . Wenn die Prob edivision aus dem Beispiel feh lsch lägt , da nn wissen wir weiterhin nicht , ob n zusa mme ngesetzt oder prim ist. Wir wollen nun ein Zertifikat kennenlernen , das einer gegebenen Zahl p beschei nigt , wirklich eine Primzahl zu sein.
25.3.2
Das Goldwasser-Kilian-Zertifikat
Das Zertifikat nach Goldwasser-Kilian (b enannt nach der amerikanischen Info rmatikerin Shafi Go ldwasser und ihrem Ko llegen Joe Ki lian) , das die Primalität der natürlichen Zahl n beweist , besteht a us folgenden Daten: 1.
Einer ellipt ische n Kurve E( Z /nZ) zusa mme n mit eine m Punkt P E E( Z /nZ) ,
323
25.3 Zertifizierung von Primzahlen
2. 3.
eine r Primzahl q > (ifi5 + 1)2, sodass es eine Zahl m = k . q gibt mit m· P = 00 und k· P = (u : v : w) mit w E (Z /nZ) X , eine m weiteren Zertifikat, welch es b eweist, dass q prim ist.
Das Goldwasser-Kilian-Zertifikat ist also ein rekursives Zertifikat, das eine Folge von immer kleiner werdenden (q kann immer kleiner als n gewählt werden) Primzahlen und den entsprechenden Daten enthält . Die Folge endet selbstverständlich, sobald die Zahlen klein genug sind, um sie sofort als Primzahlen zu erkennen . Die natürliche Frage ist nun, warum das Zertifikat funktioniert. Das ist ab er schnell zu beantworten:
Satz 25.2 Liegt ein gültiges Goldwasser-Kilian-Zertifikat für n vor, so ist n eine Primzahl. Beweis: Aus dem Zertifikat wissen wir, dass es eine n Punkt der Ordnung q in E( Z /n Z) gibt , nämlich den Punkt k· P (Es ist ja kP -::J 00 = (0 : 1 : 0) und q(kP) = mP = 00).
vn,
Gäbe es nun einen Primteiler p :::; so können wir E(Z /n Z) modulo p reduzieren. Da die dritte Koordinate von k · P teilerfremd zu n ist , ist sie a uch teilerfremd zu p und insbesondere modulo p von Null verschieden. Auch in E( Z /pZ) ist also kP -::J 00. Daher mus s kP mod p a uch die Ordnung q haben . Nun wissen wir a ber aus Hasses Theorem, dass E(Z /pZ) maximal die Ordnung
hat. Das ist ein Widerspruch, denn wenn kP die Ordnung q hat, dann müsste q ein Teiler von IE (Z / pZ )1 sein . Also kann n keine zus ammengesetzte Zahl sein.
D
Goldwasser und Kilian haben neben der Idee für die ses Zertifikat auch gleich no ch einen Algorithmus angegeben, der in einer erwarteten Laufzeit von 0(1og12 n) ein solches Zertifikat für eine Primzahl n generiert (Diese Laufzeit gilt - sofern einige Vermutungen wahr sind, die man a ber heutzutage für richtig hält - für fast alle Eingaben) : Gegeb en sei eine natürliche Zahl n , die höchstwahrscheinlich prim ist (also z. B . eine n Mill er-Rabin-Test mit 10 bis 20 Basen b estanden hat). 1.
2.
W ähle zufällig eine elliptische Kurve E(Z /nZ ) und berechne mit Schoofs Algorithmus die Ordnung m, die E( Z /n Z) haben mü sste , wenn n prim ist . Tritt in Schoofs Algorithmus ein Fehl er a uf, so ist n nicht prim. Spalte klein e Primfaktoren von m durch Probedivision ab und prüfe, ob der Rest eine wahrscheinliche Primzahl (~ + 1)2 < q :::; ~ ist. Ist er das nicht , b eginne mit eine r neu en Kurve von vorn.
324 3.
4.
25 Primzahlen und elliptische Kurven
Wähle eine n zufä lligen Punkt P E E( Z /n Z) und t este, ob !!J . P -::p 00 und m · P = 00 ist . Wenn erstere s nicht gilt, dann wähle eine n ander en Punkt, wenn zweiteres nicht gilt , dann kann m nicht die Ordnung IE (Z/nZ )1 sein, also kann n nicht prim sein. Wi ed erhole den Test mit q. Ist q nicht prim, so b eginne von vorn , ist q prim , so haben wir ein gültiges Zertifikat für n erstellt.
Dieser Algorithmus hat im Gegensatz zu anderen Primzahltests entscheidende Vorteile. Zum einen ist seine Laufzeit für fast alle Eingaben effizient. Zum a nderen ist das Überprüfen des entstehenden Zertifikats no ch einmal deutlich schneller möglich , nämlich in O(log4 n). Die s ist deutlich schneller, a ls es selbst der AKS-Primzahltest sein könnte. Da AKS im Moment sowieso noch unpraktikabel ist, ist der Goldwasser-KilianTest noch immer verbreitet, meistens a llerdings in der verbesserten Version von Atkin und Morain , die das Zertifikat noch einmal ein paar Größenordnungen schneller erzeugen kann , nämlich in erwarteten O(log6 n) . Ihr Vorgehen wandelt den ersten Schritt ab , indem nicht mehr a us der Kurve die Ordnung berechnet wird , sondern stattdessen ein m vorgegeben wird, zu dem eine passende Kurve konstruiert wird . Der Beweis der Primeigenschaft ist mit der Methode nach Goldwasser-Kilian sogar so effizient , dass damit schon für über 20000-stellige Primzahlen Zertifikate erstellt werden konnten . Das Programm PRIMO , welches diesen Test implementiert, ist eines der meistgenutzten Tools für das Testen auf Primalität allgemeiner Zahlen .
25.3.3
Am Beispiel der vierten Fermat-Zahl
Ich möchte das Goldwasser -Kilian-Verfahren nun direkt am Beispiel der vierten 24 Fermat-Zahl 2 + 1 demonstrier en . Wer ein bi sschen programmieren kann od er geduldig mit dem Taschenrechner durch 54 Primzahlen dividier en will, der kann sich natürlich einfach davon über zeugen , dass diese Zahl prim ist . Ab er das ist ja viel weniger spannend als der Weg über die ellipt ische n Kurven . Sei also p = 2 + 1 = 65537. Wenn man ein wenig Glück (oder wahlweise mehr Hintergrundwissen) hat, dann find et man schnell die Kurve EI, die durch die Gleichung y2 = x 3 + 2 über JF p gegeben ist und m = p + 1 Punkte hat (sofern p wirklich prim ist). Durch Probedivision mit den Primzahlen unterhalb von 20 findet man: m = 2.3 2 . 11 ·331 24
331 kommt a lso für das gesuchte q in Frage, denn 331 > (~ + 1)2 ~ 289. Fehlt uns also noch ein Punkt P , der m . P = 00 und !!J P -::P 00 erfüllt. Man sieht sofort , dass P = (-1 : 1 : 1) ein Punkt auf der Kurve ist . Man kann jetzt
325
25.4 Abschluss
überprüfen, ob (2 .3 2 . l1)P i- 00 ist. Nach eine r langwierigen Rechnung, für die man sich am besten Computerunterstützung besorgt , er hält man 198P = (11137 : - 19443 : 1) . Jetzt nehmen wir dies en Punkt und multiplizier en ihn mit 331. Das ergibt in der Tat (0 : 1 : 0) = 00 . P ist also für unser Zertifikat geeignet . Was jetzt noch zu tun bleibt, ist ein Zertifikat find et man schnell die Kurve E2 , die durch y2 = m = q + 1 = 332 Elemente hat , wenn q wirklich
für q = 331 auszustellen. Hier x 3 +x über lF q gegeb en ist und prim ist .
Durch Probedivision erhalten wir m = 22.83 und mit ein wenig Probieren findet man heraus , dass P = (3: 19 : 1) ein Punkt der Kurve ist , der 4P = (14: 21 : 1) und 332P = (0 : 1 : 0) = 00 erfüllt. Da wir 83 ohne Probleme direkt als Primzahl erkennen können und 83 > (~331 + 1)2 ~ 27 ,7 gilt, ist damit bewiesen, dass 331 prim ist, und damit wissen wir wied erum, dass 65537 prim ist.
25.4
Abschluss So , das war dann das letzte K apitel über elliptische Kurven und ihre Anwendungen . Ich hoffe, er hat euch gefallen. Es gäbe noch unendlich viel mehr über ellipt ische Kurven zu erzählen und wer weiterhin Interesse an diesem spannenden Thema zeigt , dem sei ein weiteres Mal das Buch Washington [67] em pfohlen. E(lFmjg) --+ E(lFcockez) Johannes Hahn (Gockel) ist Dipl.-Math. und promoviert in J ena.
26 Primzahlen mit Abstand
Übersicht 26.1 Der Ab st and zwischen 2 Primzahlen wird beliebig groß
327
26.2 In jed er unbegren zt en arithmetischen Progr ession gibt es unend lich viele Prim zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328 26.3 Es gib t ar it hmetischen Progression en beliebiger Länge, die nur a us P rim zahlen b est eh en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
26.1
Der Abstand zwischen 2 Primzahlen wird beliebig groß
Die Anzahl der Primzahlen ist unendlich , das hat schon Euklid , de r vor 2300 J ahren lebt e, bewiesen . Dennoch bilden die P rimzahlen kein Mu ster . Das B ertrandsehe Po stulat sagt zwar , dass es zwischen einer nat ürlichen Zahl n und 2n eine Primzahl geben mu ss (siehe Aigner [68]) . Do ch wenn man die natürlichen Zah len durchgeh t und P rimzahlen sucht, dann weiß man nicht , wie viele Zahlen man prüfen mu ss, bis man die nächste P rimzahl findet . Zu Anfang findet man recht häufi g Primzahlen, die 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37 usw . Abe r in höh eren (und sehr hohen) Ber eichen der Zahlen wird der Ab stand von der einen zur nächst en Primzahl beliebig gro ß.
Was heißt das? Denk dir eine Zahl , z. B . 1.000 .000 (ein e Million), und man kann irgendwo in den nat ürlichen Zahlen zwei Primza hlen Pl und P2 find en , zwische n den en keine anderen P rimz ahlen liegen und der en Abstand größer ist als 1.000 .000. Und für je de n ander en gewünschten Abst and, z. B. 1.000 .000.000.000.000, gilt das Gleiche.
Warum stimmt das? Warum kann m an das so sagen , obwohl es kein e Formel für die P rimzahlberechnung gibt? Man b eweist es so:
328
26 Primzahlen mit Abstand
Beweis: Sei m eine beliebi ge natürliche Zahl. F ür das, was wir zeigen wollen , ist es kein e E insc hränkung, wenn wir m > 3 vor aussetzen . Betrachte die Zahlen :
m! +2 m!+ 3 m! + 4 m! + m- 1
m!+ m Alle die se Zahlen sind keine Primzahlen , denn m ! ist durch 2 teilbar und also auch m ! + 2. m! ist au ch durch 3 t eilb ar und darum ist a uch m! + 3 durch 3 t eilbar. Und sch ließlich ist m! + m durch m t eilb ar. J ed e dieser aufeinander 0 folgenden m Zahlen hat eine n echten Teiler.
Was hat man da mit gezeigt ? Es gibt in den na türlichen Zahlen für jed e be liebige Zahl m (den Ab st and) einen Berei ch mit (mindest en s) m - 1 aufeinander folgenden Zahlen , die alle kein e Primzahlen sind. Das b edeutet : Der Ab st and zwische n 2 Primzahlen wird b eliebig groß.
26.2
In jeder unbegrenzt en arithmet ischen Progression gibt es unendlich viele Pri mzahlen
Sie liegen also beliebi g weit au sein ander , machen sich rar unter den groß en Zahlen , dennoch kann man es fast nicht vermeid en, üb er sie zu stolpe rn, wenn man mit eine r fest en Schrittweite durch die Zeilen schreite t . Eine arithmetische Progression ist eine Folge a + n . d, n E N, a und d sind natürliche Zahlen . Es ist t rivial , dass es arithmetischen Progr ession en , wie 2+n · 2, gibt , in den en nicht un endlich viele Primzahlen vorkomme n. Es ist ab er nicht trivial , was Dirichlet b ewies, nämlich dass in jed er a rit hme t ische n Progr ession , bei der a und d rela t iv prim sind, immer unendlich viele Primzahlen vorkommen . Demzufolge gib t es unendlich viele Primzahlen der Form 2+n ·3, unendlich viele der Gest al t 4 + n . 1, auch 4 + n . 3 usw. Die ses Ergebnis sag t ni cht , dass alle Zahlen in ein er solchen a rit hmetischen Progression P rimzahlen sein mü ssen, es sag t , dass - schr eitet man weiter und weiter - man immer wieder a uf eine P rimzahl st oßen wird .
329
Arithmetische Progressionen beliebiger Länge
Dieses Erge bnis int erpretier e ich so: Die P rimzahlen sind zwar im Einzeln en unvorher sagbar , a be r um das zu sein , darf es auf der anderen Seite auc h keine Bereich e in den natürlichen Zahlen gebe n, die au s nicht trivialen Gründen primzahlfrei sind . So geseh en ist das E rgebnis von Dirichlet notwendig.
26.3
Es gibt arithmetischen Progressionen beliebiger l änge, die nur aus Primzahl en best ehen
Die Primzahlforschung geht zurück bis in s Alte rt um, a be r sie ist a uch heute noch ein lebendiges und sehr produktives Arbeit sgebiet in de r Mathematik. Der Leser denkt da siche r sogleich an die populär en Bemühungen groß e und immer größer e Primzahlen zu find en , wenn gleich dies schon nicht mehr mathematisch , sonde rn vielm ehr algorithmisch, t echnisch und logistisch die größere n Herausforderungen bed eutet. E in neu eres E rgebnis a nde re r Art mö chte ich zum Schluss noch nennen ; es wurde von Green und Tao [70] 2008 bewiesen :
Satz 26.1 (Green-Tao-Theorem) Es gibt arithmetis che Progression en beliebiger Läng e, die nur aus Primzahlen best ehen. Das ist eine Existenzaussage . Mittlerweise hat man au ch schon einige Bei spiele für solche Progressionen gefunden .
Beispiel 26.2 Die arithmetisch e Progression 468395662504 823 liefert für n = 0 bis 23 Primzahlen .
+ n · 205 619 ·223092 870
•
Man kann also eine b eliebige natürliche Zahl vorg eb en , z. B . 83843 , und siche r sein, dass es irgendwo in den natürlichen Zahlen eine a rit hmetische Progression der geforderten Länge (z. B. 83843) gibt, in der nur Primzahlen vorkommen . Das find e ich üb errasch end.
Mortin Wohlgemuth aka Mairoid.
27 Faktorisierungsverfahren
Übe rsicht 27.1 Einführung
331
27.2 Probedivision
332
27.3 Fermat-Faktorisierung
333
27.4 Lehman-Algorithmus
335
27.5 Po llard-R ho-Verfahren
337
27.6 (p - 1)-Verfahren
341
27.7 Elli ptische-Kurven-Met hode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 27.8 Qu adra tisches Sieb
2
27
+1 =
352
596495891 2 7497 217 . 5 7046 8920 0 6 8 5 129054 7 2 1
(Morrison & Brillhart, 1970) Bekannterweise ist das klas sische Problem , die Primzahlen von den zus ammen gesetzten Zahlen zu unterscheiden , nach heutigem Kenntnisstand sehr effizient lösbar . Als viel schwieriger erweist es sich aber , die komplet t e Faktorzerlegung einer natürlichen Zahl anzugeben . Obwohl dieses Problem seh r alt und grundlegen d ist , muss man tief in die ma thematische Tri ckkiste greifen , um selbst Primfaktoren moderater Länge bestimmen zu können. Das Kapitel be leuchte t klassische und akt uelle Verfahren zur Faktorisierung. Neben de n Verfahren selb st st ehen Laufzeitanal yse und Hinweise zur effizienten Realisierung au f dem Comput er im Mittelpunkt.
27.1
Einführung
Dass eine natürliche Zah l eine (bis auf die Reih enfolge der Faktoren) einde ut ige Primfaktorzerl egung besitzt, hat t e schon E uk lid et wa 300 v. Chr. gezeigt. La nge Zeit haben sich die meisten Mat hem at iker auch mit diesem Wis sen b egnügt ; die
332
27 Faktorisierungsverfah ren
konkreten Faktoren zu best immen war meist die damit verbunden e Arbeit nicht wer t . Da s ä nde rte sich schlagart ig Mitte der 60er-J ahre des vori gen Jahrhunderts, als leistungsfähige Computer verfügbar wurden und - et was späte r das RSA -K ryptosyst em erfunde n wurde. Daraufhin wurde viel E ne rgie in die Erforschung der Problematik und die E nt wicklung "gut er" Faktorisierungsalgorithmen gesteckt - mit mäßig em Erfolg. Bis heute ist es niemandem gelungen , das Faktorisierungsproblem als effizient lösbar nachzuweisen . Dennoch sollen einige der Ergebnisse bzw. Verfahren in den nachfolgenden Abschnitten besprochen werden .
27.2
Probedivision
Die Probedivision ist die naiv e Methode, Primfaktoren zu erhalte n. Man fängt an, durch 2, 3, usw. zu dividieren , und schaut , ob die Division aufgeht . Wenn ja , hat man eine n Primfaktor gefunden . Das Verfahren hat seine Berechtigung, da das Vorhandens ein klein er Faktoren sehr viel wahrscheinlicher ist als das gro ßer ; eine Divi sion ist auch sehr schnell ausgeführt . Ist N die zu faktorisierende Zahl und gibt es eine n Teiler a > VN von N , so ist der Komplem entärteiler b = N'[o. klein er als VN . Es reicht also, die Probedivisionen bis VN a uszuführen.
A lgorit hm us (Pro b e d ivisi o n) 1:
2: 3:
4: 5: 6:
7:
Eingabe: N for a ll 2 :::; p < if p I N t he n Abbruch end if e nd for Au sgabe: p
VN
do
An dieser St elle soll au sdrücklich darauf hingewiesen werden , dass man sich erst vergewissern sollte, ob N a uch wirklich zusam me ngesetz t ist . Das ist leicht möglich (z. B. mit dem Miller-Ra bin-Test ) und soll hier nicht weiter erläute rt werden .
Ve rb esse ru nge n Eigentlich genügt es, nur Primzahlen p zu te sten. Ist a = p . q zusammengeset zt, so te stet man ja p bzw . q viel früher als a. Dazu mü sste m an vorher eine P rimzahltabelle erst ellen, was sich a ber nicht immer lohnt .
333
27.3 Fermat-Faktorisierung
Man kann sich aber mit folgender Überle gung beh elfen : Hat man b er eits durch 2 getestet, so kann man sich a lle ander en durch 2 teilbare n Zahlen spare n, indem man nur di e ungeraden Zahlen t est et. Will man a uch den Vielfachen von 3 a us dem Weg gehe n, so t estet man nur a lle zu 2 · 3 = 6 t eilerfremden Zahlen (welche von der Form 6k ± 1 sind ). Um zus ätzlich die 5 zu b erücksichtigen , t estet man nur all e zu 30 t eilerfremden Zahlen (di ese sind von der For m 30k ± 1, ± 7, ± ll , ± 13). Das kann man zwar b eliebig weiter treib en, wird a be r schnell ziem lich mühsam. Mit de r P robedivision kann man sehr schnell alle "Trivia lt eiler" erkennen . Bei einer Laufzeit von O(p) für einen Primfaktor p ist sie a ber a b einer gewissen Größe der Fak toren ni cht mehr prak tikabel.
27.3
Fermat- Faktorisierung
Eines der klassisch en Verfahren hat Fermat 1643 in eine m Bri ef er wä hnt . Darin st ellt er die zu zerlegende Zahl al s Differ en z zweier Quadrate dar. Dann gilt N
=
2 x - y2
=
(x
+ y)( x
- y)
und man bekommt eine Faktorzerlegung von N . Au sgehend von der umgestellten Glei chung x 2 - N = y2 kam Ferm at a uf die Idee , zu prüfen , ob die Differenz x 2 _ N (für verschied en gewählte x) ein Quadrat darstellt. Die Wahrsch einlichkeit dafür ist am größt en, wenn x 2 in der Nähe von N lieg t. Das Verfahren definiert also eine Folge X k mi t X o :=
und t estet , ob
Zk :=
x% -
r.JNl
und
X k :=
Xo
+k
N ein Quadrat ist.
Algor ithmus (Fe rmat-Ver fahren) 1:
2:
Eingabe: N (ungerade) for x := to (N + 9)/6 do
r.JNl
2
z := x - N if Z = y 2, y E N t hen 5: Abbruch 6: end if 7: end for 8: Au sgabe: x - y 3:
4:
E ine ob ere Gren ze für x ist der Wer t x = (N + 9) /6. Dann ist y = (N - 9) /6 und wir b ekommen den Faktor p = x - y = 3, fall s dieser existiert. Es macht ab er keinen Sinn, so weit zu geh en , da wir dann b ereits mehr Aufwand als die Probedivision b etrieb en hät t en .
334
27 Faktorisierungsverfahren
Beispiel Am Beispiel von N = 314731 soll das einmal demonstriert werden . Wir beginnen bei Xo := ffi = 562 und bekommen die folgenden Werte:
I 1
k
Xk
o
562
1113
1
563
2238
2
564
3365
3
565
4494
4
566
5625
Zk
= x~ - N = 3·7 ·53 = 2·3·373 = 5·673 = 2·3 ·7 · 107 = 752
Bereits nach vier It erationen haben wir ein Quadrat und bekommen die Zerl egung N = 5662 - 75 2 = (566 - 75)(566 + 75) = 491·641. Man prüft leicht nach, dass es sich um Primfaktoren handelt.
Verbesserungen Überlegen wir uns, wie wir die ses Verfahren effizient umsetzen können. St att jedes Mal eine Quadrierung durchzuführen , nutzen wir die Beziehung
es folgt was sich schneller berechnen lässt. Auch Wurzelziehen ist t euer; wir versuchen daher schon im Vorfeld zu entscheid en , ob Zk üb erhaupt ein Quadrat sein kann . Dazu bestimmen wir den Rest r == Z k modulo einer geeigneten kleinen Zahl m. Ist r kein quadratischer Rest mod m (d . h. , die Gleichung x 2 == r besitzt modulo m kein e Lösung) , so kann Zk auch keine Quadratzahl sein . Für m = 10 gibt es beispielsweise nur die qu adratischen Reste [D, 1,4,5,6, 9}, die beiden ersten berechneten Werte für Z k scheiden also schon aus (diese enden auf 3 und 8) . Noch besser sieht es bei m = 16 aus , dort haben wir nur [O, 1, 4, 9} als mögliche Reste . Man kann also anhand der letzten vier Bit sofort 75 % der Nichtquadrate identifizieren.
La ufzeit J et zt kann man sich fragen, ob der Fermat-Algorithmus eigent lich alle Faktoren findet - und wenn ja, wie lange er dafür braucht. Sei zunächst N ungerade und N = v -q (wob ei p ~ q). Dann sind p , q ungerade und X ·-
.-
p +q 2-
-
und
p -q Y ·.- - 2 -
335
27.4 Lehman-Algorithmus
sind ganze Zahlen und es gilt die geforderte Eigenschaft N = x 2 - y2 . Da alle x get estet werden , werden p und q in jed em Fall gefunden. Weiterhin sieht man leicht, dass der Algorithmus versagt, falls N gerade und nicht durch 4 teilbar ist . Potenzen von 2 sollten also vorher herausdividiert werden .
Satz 2 7. 1 Ist N = P: q ungerade und Ip q in O(c 2 ) Schritten gefunden .
ql S; c · m
mit c
> 0, dann werden p und
Sei o. B. d. A . p :::0: q und N = (x +y)(x -y) die gefundene Lösung (also y = 9 ), welche in Schritt k gefunden wird . Wir benutzen die Ungleichungen x o S; vN + 1 (also x 6 S; N + 2vN + 1) und Zk = y2 S; %-vN und die explizite Darstellung Zk = Zo + 2k xo + k 2 • Für k gilt dann: B ewe is :
Jx6 + Zk - Zo - xo JN + 2vN + 1 + ~ vN - 1 - vN = JN + (2 + %-)vN - vN = VN ( J1+ :~ - 1)
k=
S;
< --
VN (1 + 8+c 8VN 1 + .c 8 2
-
1)
D
m
'Nenn sich die Faktoren p und q also nur um unterscheiden , werden sie quasi sofort gefunden . Je weiter sie a ber auseinanderliegen , desto schlechter wird das Verfahren. Im schlimmsten Fall werden (N + 9) /6 Operationen gebraucht , weil erst dann ein Trivialfaktor wie 3 gefunden wird.
27.4
Lehman-Algorithmus
Eine interessante Kombination von Probedivision und Fermat-Verfahren mit verbesserter Laufzeit wurde von R. S. Lehman [72] vorgestellt. Er b enut zt den folgenden Satz:
336
27 Faktorisierungsverfahren
Satz 27.2 (von Lehman) Ist N = p . q ungerade m it Primzahlen p, q und ist 1 S; r
J
bei r~l S; p S; Eig enschaften:
VN, so
==
1 (mod 2), falls k gerade und x
3. V 4k N S; x S; V 4k N
VN,
wo-
gibt es natürliche Zahl en x , y und k mit den
1. x 2 - y2 = 4k N
2. x
<
+ 4(r~ 1 )
j!i
== k + N
(mod 4), falls k ung erade
Ist N prim, so gibt es solche Zahlen nicht .
Dar auf aufbauend hat Lehman ein Verfahren zur Faktorzerl egung an gegeb en . Damit die Laufzeit möglichst klein wird und die Voraussetzungen des Satzes siche r erfüllt sind, mu ss r =
A lgorith mus (Lehman-Verfahren) 1:
2: 3:
4: 5:
6:
7: 8:
9:
10: 11: 12: 13: 14 : 15:
Eingabe: N for aB 2 S; p S;
337
27.5 Pollard-Rho-Verfahren
Laufzeit Schaue n wir un s die Lau fzeit a n : Die P ro be division kost et O( (IN) Op erationen . Die b eid en geschachtelte n Schleifen seh en zunächst sehr aufwändig au s, der Aufwand ist a be r mit
w m) o I: ( k =l 4Vk
= 0
(
J 4Vk m W
dk ) = O( \IN)
k =l
erforderlichen Opera tionen vergleichb ar mi t der Probedivision . Damit haben wir ein Verfahren kennengelernt , das asym ptotisch be sser als die "reine" Probedivision ist. Dass das über ha upt möglich ist, liegt ja ni cht auf de r Hand!
27. 5
Pollard-Rho- Verfahren
Mit dem folgenden , von J ohn M. Pollard 1975 vorgest ellten Verfahren können wir die Laufzeit , eine n Primfaktor p zu find en , auf O( y'p) herunter schrauben . Das gelingt un s aber nur un te r Aufgabe de r E rfolg sgarantie, die wir ja bei den bisherigen Verfahren hatten . Es handelt sich um eine Monte-C arlo-Methode, bei der der Zufall mit von der Partie ist .
Eine G e b u r t sta gsfo lge Das Verfahren beruht auf der Au snutzung des Geburtstagsparadoxons. Bei diesem Problem geht es eigent lich um die Fr ag e, wie groß eine Gruppe P ersonen sein mus s, um mit mindest ens 50-%iger 'Wa hrscheinlich keit ein Paar mit dem seIbern Geburtsdatum darunter zu haben (Lösung: 23) . Allgem ein er haben wir eine Urne mit p Kugeln und fra gen nach der mittler en An zahl Ziehungen mit Zurücklegen, bis die erste Wi ed erholung a uftaucht. Es stellt sich heraus, dass wir dafür nur ungefähr y'p Versuche b en ötigen . Wi e kann man sich das üb erl egen ? Die Chance auf eine Wi ed erholung bei eine m Ver such st eigt linear mit der Zahl der b ereits durchgeführten Ver su che, die Chance auf eine Wi ed erholung in allen Ver su chen damit quadratisch. Das Faktori sierungsverfahren defini ert nun eine Zufallszahlenfolge ai; modulo N. Ist p ein Teiler von N , so können wir also davon au sgeh en, dass et wa unter den ersten y'p Folgengliedern eine Wiederholung de r Folge modulo p auftrit t. In die sem Fall hä tten wir ein Paa r (a i , aj) mi t der Ei gens chaft a, == a j (mod p). Wenn wir die ses Paar fänden , könnten wir ggT (a, - aj , N ) berechnen und erhielten damit en tweder p oder ein Vielfache s von p . Um nicht N zu erhalten (womi t wir nichts erreicht hä tten), darf der Trivialfall a, == a j (mod N ) natürlich nicht ein treten.
338
27 Faktorisierungsverfahren
Floyd's Zyklenalgorithmus Das P ro blem liegt im Finden , denn wir können schlecht alle P aare testen (das sind immerhin ~ p Stück) . Man kann dieses Problem ab er dennoch lösen : Dazu wählen wir keine "echte" Zufall sfolge ak, sonde rn eine P seudozufall sfolge mit eine r de t erministi schen Bere chnungsvorschrift ak +l = f( a k) . Dad urch ist gewährleiste t , dass a km od P in eine P eriode ein t ri t t , fall s sich ein E lement wiederholt . Die Funkt ion f sollt e einfach geh al ten sein, ab er dennoch hinreichend ,,zufällige" Zahlen erzeugen. Bewährt hat sich ak +l
=
f( ak)
= a~ + c (mod N ), c tt- {- 2, O} .
Nach Durchl auf einer Vorperiode der Länge m kommt die Folge a km od P in eine Periode der Länge l ~ "jP; man kann sich leich t davon üb erzeu gen , dass das bei eine r linear en Funkti on f nicht der Fall ist . An schaulich erg ibt sich eine Schl eife, die a n den griechi schen Bu chstaben p er inne rt, der a uch der Name nsgebe r der Methode ist (Abbildung: 27.1) :
Abb. 27.1 : Verlauf der Pseudowfallsfolge mod p
Die Exi stenz einer Periode bewirkt , dass wir mi t einem sp eziellen Algorithmus das fragli che P aar (ai , aj) finden können, ohne alle P aare zu testen . Wi r können un s nämlich ohne Mühe davon üb erzeugen, dass de r folgende Satz gilt :
Satz 27.3 (von F loyd) Für ein e periodische Folge (a k) mod p mit Vorperiod e m und P eriod e l gilt a i == a j (mod p) =? i == j (mod l ).
Die Differ en z j - i ist dabei ent weder genau l od er ein klein es Vielfaches von l, da man a nnehmen kann , dass die Vorp eriode nicht viel länger ist als die P eri od e.
339
27.5 Pollard-Rho-Verfahren
Der Zykl enalgorithmus von Floyd macht sich diese Eigenschaft zu Nutze, indem er nur die Paare (ak , a2k) für a ufsteigende k t estet . Denn irg endwann ist 2k k = k das ent sprec he nde Vielfache von l. Wir können natürlich nicht die Paare (aa, a k) t esten , da a a mit hoher Wahrscheinlichkeit in der Vorperiode liegt. Wegen l ;:::;:; y'p benötigen wir für das Finden also nur O( y'p) Schritte.
A lgorithmus ( Pollard- Rho- Ve r fa hren) 1:
2: 3: 4:
5: 6: 7:
8:
E inga be: N Wähle 0 < x = Y < N und c t/:- {-2 , O} , p := 1 while p = 1 do x := x 2 + c (mod N ) y := (y 2 + C)2 + c (mod N) p := ggT (x - y , N ) e nd while Au sgabe: p
(Im Algorithmus ist ak = x und a 2k = y.) Rechnen wir dazu ein Beispi el. Gegeb en sei N = 222473; unser e Folge b eginnt mit aa := 1, al s Rekursion b enutzen wir ak+l = a~ + 1 (also ist c = 1). Die einzelnen R ech enschritte lassen sich au s folgender Tabelle ablesen : (mod N )
ggT(a k - a 2k , N )
5
222470
1
5
677
221801
1
3
26
40692
181807
1
4
677
98211
124939
1
5
13384
28790
207067
1
6
40692
97934
165231
1
7
194799
98737
96062
1
8
98211
32201
66010
1
9
83607
23650
59957
1
10
28790
34307
2169 56
1
11
152176
7945
144231
1
12
97934
125980
194427
379
k
ak
a2 k
1
2
2
ai; - a 2k
Wie wir sehen , erh al ten wir nach 12 Iterationen den Fakt or 379 und damit die Zerlegung N = 379 . 587 .
340
27 Faktorisierungsverfahren
Verbesserungen Natürlich bräuchte man die Werte für ak nicht nochmals neu zu b erechnen , da man diese ja schon einmal vorher (für a2k) erze ugt hat . Man kann das Verfahren also et was schneller machen , wenn man die ak sp eich ert . Dann geht aber eine r der Vorteile des Verfahrens - geringer Platzbedarf - verloren . Nachb essern kann man aber no ch an einem anderen Punkt : St att nach jeder Iteration den ggT zu berechnen, können wir das P rodukt k o+ n
P(ko) :=
TI (ak -
a2k) (mod N)
k =k o
der Werte aus n Iterationen bilden (z. B . n = 50) und erst danach den ggT(P(ko) , N ) bestimmen. Für die ggT-Berechnung muss ext ra der Euklidische Algorithmus angeworfen werden , der hier mit Abstand den größten Reche na ufwand verursacht. Ein event ue ller Faktor p geht dadurch nicht verloren. Allerdings ste igt die Gefahr, dass sich a uch ein zweit er Faktor q im Produkt P(ko) wied erfindet . Eine weitere Verbesserung wurde von Richard P. Brent vorgeschlagen. Diese besteht darin , den Algorithmus von Floyd durch einen etwas schnelleren zu ersetzen - der Unterschied ist aber marginal. La u fze it Wie bereits oben erklärt, haben wir eine heuristische Laufzeit von O(.jP). Eine alt ern ative Begründung liefer t folgende Rechnung:
a2k - ak = (a~k - l
+ c) - (aLl + c)
= (a~k -l - aLd
+ ak -d . (a2k - l - ak -t) (a2k - l + a k- t)· ((a~k-2 + c) - (aL2 + c)) (a2k- l + ak -t) . (a~k -2 - aL2) (a2k - l + ak -t) . (a2k -2 + ak -2) . (a2k -2 - ak -2)
= (a2k-l = = =
= (a2k-l
+ ak -t) . (a2k - 2 + ak -2) ... . . (ak + ao) . (ak
- ao)
k -l
= (ak - ao)·
TI (ak+i + ai)
i=O
Die Iterierte aa« - ak ist also ein Produkt aus k Faktoren modulo N (bzw. p). Taucht in nur einem dieser Faktoren unser p a uf, so finden wir p durch Berechnung von ggT(a2k - ak, N) (resp ektive ggT(ak - a2k, N)) . Der Trick besteht also darin , pro It er ation nicht nur eine n potentiellen Faktor auf Teilbarkeit zu t esten (wie b ei der Probedivision) , sondern gleich mehrer e parallel. Nach k It erationen haben wir ungefähr k 2 Faktoren getest et.
27.6 (p - 1)-Verfahren
341
Die gen aue An zahl der erforde rliche n It erationen kann man natürlich nicht vorhersehen . J e nach Wahl von ao und c kommt man mal schneller, mal langsamer zum Ziel. Es kann auch vorkommen , dass von zwei Primfaktoren der größ er e zuerst gefunden wird. Ein weiter er (unwahrsch einlicher) Fall, der eint reten kann , ist der, dass ggT (a 2k - ak , N) = N zurückgegebe n wird . Das ist dann der Fall, falls sich modulo aller Primteiler gleich zeitig eine P eriode bildet .
27.6
(p - l)-Verfahren
Das (p - 1)-Verfahren von Pollard nutzt die Struktur der Gruppe lF; (der Menge {1, 2, ... , p - 1} mit der Multiplikation modulo p) aus. Es basiert auf den bekannten Sätzen von Fermat und Lagrange.
Satz 27.4 (von Fermat) Ist p Primzahl und a E N nicht durch p teilbar, so gilt a P -
1
==
1 (mod p) .
Hier und in den b eid en folgenden Kapiteln wird noch der Primzahlsatz benötigt , weswegen wir ihn hier noch schnell ein schi eb en .
Satz 27.5 (Primzahlsatz) Gegeben ist die Primzahljunktion ;r(x) := I{p Primzahl, p ::; x} l. Dann gilt die Asymptotik lim ;r(x) = 1. x-+oo x /ln(x)
Das heißt, die An zahl der Primzahlen klein er od er gleich x kann durch x/ ln(x ) abgeschätzt werden. Für die nachfolgenden Au sführungen benötigen wir noch den Begriff de r Gla ttheit :
Definition 27.6 (glatt, potenzglatt ) Sind N , B natürliche Zahlen, so heiß t N B -glatt, falls alle Primteiler von N nicht größer sind als B . N heißt B-potenzglatt , wenn das auch für alle • P rimzahlpotenzen gilt. 175 (= 52 . 7) wär e also 7-glatt, 25-potenzglatt, ab er nicht 7-potenzglatt.
27 Faktorisierungsverfahren
342
Ist j et zt P eine P ri mzahl und P - 1 = Pl . P2 . . ... Pk die Primfaktorzerl egung von P - 1 in a bsteigen de r Ordnung (al so Pl ~ P2 ~ .. . ~ Pk) und B eine natürliche Zahl , für die P - 1 B-poten zglatt ist (daraus folgt dann schon B ~ Pl), dann gilt für jed es m E 1'1, das durch all e Zahlen s, B teilbar ist : P - 1 I mund
a
m
==
1 (mod p)
für j ed es nicht durch P t eilbare a . Fall s die Kongruen z o/" == 1 (mod p) für eine n Primteiler P von N gilt (und für kein en ander en!) , so b ekommen wir P durch Berechnung von P = gg'I' (u'" - 1, N ). Abgeseh en von dem Problem , dass wir B ~ Pl wählen mü ssen , müssen wir siche rstellen , dass P - 1 ein Teiler von mist . Eine einfa che Wahl von m wäre m = B! . Bei "normalen" Zahlen P - 1 reicht es a ber , wenn m alle Primzahlen x Pl al s Faktoren enthält ; die großen nur einmal , sehr klein e (z. B . < 50) au ch mehrfach. J et zt wird sich mancher frage n, ob o/" - 1 (m od N ) überhaupt effizient b er eche nbar ist. Da zu betrachten wir die Aufgabe, b == o /" (mod N ) zu bestimmen . m besit zt eine einde ut ige Binärdarst ellung m = L: i EI 2 i (mit eine r Indexmenge 1). Dann gilt i 2i b == a m == aL. iEI 2 == a (m od N ).
TI
iEI
Die Werte . r erh äl t man einfach durch fortgesetztes Quadrieren modulo N. Die Zahl der benötigten Quadrierungen entspr icht der An zahl der Bits von m und wäch st dem zufolge logarithmisch mit m. E s geht al so sehr effizient (di ese Poten zierungsm ethode wird auch "Square & Multiply" genannt) . Der Algor it hmus b er echnet nun nicht a'" - 1 (mod N ) an eine m Stück , sondern sch rit t weise ao := a, ak +l := a%k (mod N ) mit all en in m ent haltenen Primt eilern qk . Zwisch endurch wird sp oradisch getestet , ob ggT(ak - 1, N ) > 1 ist. Wurde B hinreichend groß gewählt , dann bekommen wir den Primfaktor p. Alg orithmus ( (p-1 )- Verfah re n, Ve r s io n 1) 1:
2: 3: 4: 5: 6: 7:
8: 9: 10:
Eingabe: N Wähle 1 < a < N - 1, B E N for a B q ::; B , q P rimzahl , klein e q mehrfach d o a := a'! (mod N ) P := ggT(a - 1, N ) if P I N then Abbru ch e nd if e nd for Au sgabe: P
(m wäre hier a lso das Produkt der q au s Schritt 3) .
27.6 (p - 1)-Verfahren
343
Beispiel Diesmal ist N = 90044497 zu zerlegen. Wir machen einen einfachen Test mi t B = 50; begonnen wird mi t ao = 2. Potenziert wird mit allen P rimzahlen j; 50, mit den Primzahlen 2, 3 dreifach , mi t 5 und 7 zweifach . Es ergeben sich folgen de Werte: -
qk
(mod N)
1, N )
k
qk
1
3
256
1
3
2
2
ak = a k _ 1
ggT (ak -
27611727
1
382914 56
1
4
3 52 72
6393722
1
5
11
441978 45
1
6
13
53185607
1
7
17
72650205
1
8
19
69088449
1
9
23
1465908
1
10
29
32373292
5743
3
Daraus erhalt en wir N = 5743· 15679. Schaut man sich die Zerlegung von P - 1 an , so ergibt sich P - 1 = 5742 = 2 · 3 · 3·11 · 29. In sbesondere sehen wir , dass das mehrfache Vorkommen kleinerer Primzahlen zu be rü cksichtigen ist . Für den Komplement ärteiler gilt 15678 = 2· 3 . 3 . 13 · 67, die ser ist also weniger glat t und wird erst mi t B ::::: 67 ein paar Iterationen später gefunden .
E in e sc hne llere Ve r s io n Nach dem Satz von Lagrange ist die Ordnung jed er Untergruppe von lF; ein Teiler von p - 1. Poten zieren wir eine der It eri erten a k mit eine m Teiler von p - 1, so gelangen wir in eine klein ere Untergru ppe von lF; (wodurch sich die Chance erhö ht, späte r ai; == 1 (mod p) zu erhalte n ). Bleibt nur ein Primteiler übrig, d. h ., hat man b := a P 2 · .. · · P k ber echnet, so braucht man nicht mehr mit allen weiter en Primzahlen zu poten zieren . Es genügt , wenn wir bP 1 find en. Das können wir viel einfache r erreiche n, indem wir aufst eigend bqi mit P rimzahlen qi b erech nen , bis qi = PI ist. Wegen bqi + 1 = bqi +d i = bqi . bd i brauchen wir dafür nur mit den zu den ents preche nden Primzahldifferen zen d, zugehö rigen Werten bd i zu multiplizieren . Die Werte für kann man vorberechnen und abspeich ern. Der resultierende Sp eich er aufwand ist gering, da die Ab stände d i nach dem Primzahlsatz von der Größenordnung In Pi sind. Die Berechnungen sind dann insgesamt deutlich schneller.
v-
Der modifizierte Algorithmus sieht also so aus : Wir defini eren zwei Sch ranken B I und B 2 (wob ei BI « B2) und wenden Ver sion 1 des Verfahrens mi t BI als
344
27 Faktorisierungsverfahren
Schranke a n. Danach haben wir ein E leme nt b E lF; bekommen und ber echnen weit er alle P otenze n bqi für Primzahlen BI < qi ::; B 2. Da diese Ber echnungen deutlich sch neller von statten gehe n, kann B 2 sehr viel größer als BI gewählt werden .
A lgorithmus ((p-l)-Verfahren, Version 2) 1:
2: 3: 4:
5: 6: 7: 8: 9:
10: 11 :
12: 13 : 14 : 15 : 16 : 17: 18 :
Eingabe: N W ähle 1 < a < N -1 , Bl ,B2 E N, BI < B 2 for a B q ::; B I, q Primzahl , klein e q mehrfach do a := a q (mod N ) P := ggT (a - 1, N) if P I N then Abbru ch end if end for qo := kleinste Primzahl > B I , b := a qo (mod N ) fo r a ll qo < qk ::; B 2 , qk Primzahl , k = 1,2, . .. do b := b · a q k - q k - l (mod N ) ggT (b - 1, N ) if P I N then Abbruch end if e nd for Au sgabe: P P :=
(Die Werte a 2 , a 4 , . . . , die re chnet und gespeichert .)
a
qk
-q k - l
an nehmen kann , werden vor Zeile 11 b e-
Der Wermutstropfen : Ne be n der Bedingung a us Ver sion 1 (PI ::; B2) mu ss zusätz lich P2 ::; BI gelte n, da sonst der Algori t hmus ver sagt. Unter su chungen haben a be r erge be n, dass im Normalfall P2 « PI gilt, so dass es i. A. kein e Problem e geb en sollte. Weitere Verb esserungen An alog zum Rho-Verfahren sind wir bestrebt , die Zahl der ggT -Bere chnunge n ger ing zu hal ten. Daher werden zu nächst n Stück (z. B. n = 100) de r erzeugten Werte (b - 1) modulo N a ufmult ipliziert und er st dann de r ggT gebildet. Pollard hat in seine r Originalarbeit ein e Methode a ngegeben, Phase 2 (Zeile 11 bis 17) spürbar zu beschl eunigen . Die Id ee ist folgende: Die gesu chte P rimund zahl PI lässt sich einde ut ig darst ellen als PI = V W - u , wenn w := P 1 U < w , v ::; w sind. Ist jet zt P ein Teiler von b 1, so a uch von bV W - b" : Pollard defini er t nun ein Polynom h(x) = ITu<w(x - bU ) (mod N ) und ber echnet
IVB2l
27.7 Elliptische-Kurven-Methode
345
p = ggT ([1v::;w h(b V W ) , N ). Benutzt wird dabei ein schneller Multi plikationsalgorit hmus für P olynome, der das Produkt zweier Po lynome vom Grad n in O( n ln( n)) b erechnet. Auf Kost en von Spei che rplatz kann dadurch die Laufzeit deutlich reduziert werden . Weit ere Verb esserungen hat Peter L. Montgomery a usge ar be itet [731 .
Laufzeit Wi e man sieht, werden O(pI) Op erati on en benötigt. Die Größe des größte n Primfaktors von p - 1 entschei de t also üb er die Laufzeit . Da man diesen ab er nicht kennt, ist das Verfahren wiederum ein Glücksspi el. Um wenigst en s herauszufinde n , was wir so im Mittel zu erwarte n haben , benutzen wir den folgenden Satz:
Satz 27. 7 (vo n H a r d y / R a m a n uj a n ) Ist D( N) die Anzahl aller Primteiler von N, dann gilt im Mittel die Abschätzung D( N) ~ Inln( N) .
Für p - 1 = Pl . .. .. Pk können wir k
k- 1
~ lnln
(:J
~
In ln(p) anne hme n und den Ansatz
= In(1n(p) - ln (p I) ) = In (ln(p). ( 1 -
l~((;/))
= ln ln(p)+ ln (1- 1~(~/ ) ~k +ln(1 -1~~;/) mach en . Als Ab schätzung für Pl b ekommen wir daraus In(pI) ~
(1 -
~ ) ln(p) ~ 0,632 · ln(p).
Die Laufzeit hat dann also einen "Erwart ungswert" von O(pO,632). Die Varianz ist a ber sehr ho ch , so dass man mit diesem Verfahren a uch recht große Fak toren finden kann (auch wenn m an in 90 % der F älle Pech hat). Darüber hin aus gib t es no ch ein Verfah ren (von H . C . Williams) , das sich die Glattheit von p + 1 zu Nu tze macht , was die E rfolgsaussichten erhöht .
27.7
Elliptische-Kurven- Methode
Wie ger ade geseh en , hat das (p - 1)-Verfahren den unschönen Nachteil , dass die Laufzeit von der Glat theit de r Gruppenordnung - a uf die man keinerlei E influss hat - abhängt. Das nachfolgend vorgest ellte (1985 von H. W . Lenstra jr. er funde ne ) Verfahren funktioniert nach dem selb en Prinzip, biet et a be r die Möglichkeit der E influssna hme . Die Chance, einen Primfaktor p zu find en, kann dadurch erhö ht werden .
346
27 Faktorisierungsverfahren
Wir benötigen dazu den Begriff der ellipt ische n Kurve, den wir für unser e Zwecke et was einschränken .
D efin it io n 27.8 (Elliptische Kurve) Seien a , b E lK für eine n Körper lK und sei x 3 + ax + b ein Polynom ohne mehrfache Nullstelle. Die Menge JE der Punkte (x, y) , die die Gleichung y2 = x 3 + ax + b erfüllt, zuz üglich eine s El em ents 0 heißt ellipt ische Kurve • üb er lK.
Eine typische Kurve üb er lK = lR zeigt die unten st ehende Abbildung 27.2. :
i:
2.
i
3
y = x -
13 16 X
ir-
3 16
'JJ.
:
:
1
1x
1
1···················1··················· :-2
:2
i
1..".
I
-1
1•• ••••• •• • •• • • ••• . 2 . .. . . . . . . . ... . . . . .. :
1
1
Abb. 27.2: Beispiel für eine ellipt ische Kurve über lR Wir interessieren uns hier a ber für den Restklassenkörper JFp für eine Primzahl p . Elliptische Kurven üb er JF p spi elen auch eine wichtige Roll e in der Krypto-
graphie. Die für uns wesentliche Eigenschaft ist die Tatsache, dass eine solche Kurve eine a belsche Gruppe darstellt. Punkte P , Q auf einer elliptischen Kurve las sen sich beliebig addieren bzw. invertieren, wobei der in der Definition erwähnte Punkt o die Rolle des neutralen Elementes übernimmt . Im Einzelnen gelten für zwei Punkte P = ( Xl , yl), Q = (X2, Y2) und deren Summe P + Q = (X3, Y3) folgende Rechenregeln: 1. Invertierung: - P
=
( Xl ,
- y l) und - 0 = O. Aus Q - X l - X2 bzw . Y3 = - Yl
2. Addition: Es gilt X3 = m 2
Y2 - Yl X2 - Xl m =
1
3XI
+a
2Yl
= - P folgt P + Q = O.
+ m(xl
, wenn P =I- Q,
, wenn P = Q.
- X3), wobei
27.7 Elliptische-Kurven-Methode
347
Wi e in jed er Gruppe ist die Ordnung ord(P) eine s Punktes P E JE das kleinste n E N, für das n · P = 0 ist ; wir haben ja hier eine additiv geschrieb en e Gruppe vor uns . ord(JE) ents pricht dab ei der An zahl aller Punkte auf JE. Es gilt der folgende wichtige Satz:
Satz 27.9 (v o n Hasse) Sei JE eine elliptische Kurve über 1F p - Dann gilt für die Ordnung die Schranke 10rd (JE) - p - 11 < 2,fP.
Das bedeutet , dass bei zufälli ger Wahl de r Kurvenparameter a und b die Gruppenordnung innerhalb eines Intervalls um p vari iert . Man kann ungefähr von eine r Gleichverteilung ausgeh en ; an den Rändern des Hasse-Intervalls scheint die Dichte etwas geringer zu sein . Wa s hat das alles nun mit dem Faktori sierungsproblem zu tun? Gegeb en sei wied er eine natürliche Zahl N und ein zu find ender Primfaktor p von N. Wir würden nun gern Punktadditionen auf einer ellipt ische n Kurve JE üb er 1F p an st ellen . Da wir p leid er nicht kennen , werden wir die ob en genannten Op eration en (Addition , Mu ltiplikation , Invertierung der x /y-Werte) modulo N a usführe n. Da N ein Vielfaches von p ist , sind diese konform zu den jeweiligen Berechnungen modulo p - wir rechnen damit nur mit deutlich größ eren Vertretern der "echte n" Wert e modulo p . Unser Ziel ist es, eine Addition P +Q = 0 herbeizuführen. Ist P Q = (xz ,Yz) , so folgt P = - Q und damit : 1. Xl 2 . Yl
= (Xl ,Yl) und
== Xz (mod p) == - yz (mod p)
Wollten wir nun die Punkte P und Q addieren, so mü ssten wir nach den obigen Re chenregeln das Inverse (xz - xI)- 1 (mod N) und (im Falle P = Q) (2Yl) -1 = (Yl + YZ)- l (mod N ) bilden . Aufgrund de r Kongruenzen (1.) und (2.) exist iere n diese nicht und wir bekommen durch Ber echnung von ggT (Xz - z i , N ) und ggT(2Y l , N ) mit hoher Wahrsch einlichkeit un seren Primfaktor p . Das funktioniert natürlich nicht , wenn die Kongruen zen (1.) und (2.) a uch modulo an der er Primfaktoren q von N gelten . Um die gewünschte Addition zu bekommen, bedienen wir un s derselben Methodik wie das (p - l)-Verfahren . Dort sind wir von einem E leme nt a E 1F; und einem geeigneten m E N a usgega ngen. War ord(a) 1m , so gal t a'" == 1 (mod p), und wir hatten un ser Ziel erreicht. Analog ber echnen wir nun das Vielfache m · P . Ist ord(P) 1m , so gilt m- P = O . Da s Vielfa che m - P ber echnen wir mit dem b ereits vor gest ellten "Square & Multiply"-Verfahren , nur auf eine additive Gruppe angewandt (es mü sst e demzufolge "Double & Add" heißen).
348
27 Faktorisierungsverfahren
Bis hierhin haben wir gege nüber dem (p- 1)-Verfahren ni chts gewonne n. Ist ab er nun m · P i- 0 , so mü ssen wir nicht das Handtuch werfen , sonde rn können durch Variation der Kurvenparamet er a und b im me r wied er neu e Ku rven erze uge n. Da deren Ordnung eine n Zufallswert im Hasse-Int erv all a nnim mt , können wir irgendwann doch no ch Glü ck haben und es gilt ord(P) Im. Mit dem Unterschied , dass wir au f eine r a nde ren Gruppe arbeit en , ent spricht das Vorg eh en also gen au dem des (p - 1)-Verfahre ns. Daher wird im Folgenden gleich die erwei terte Fassung a ngegeben.
A lgorit hmus (ECM ) 1: 2:
3: 4: 5:
6: 7:
8: 9: 10:
11: 12: 13: 14: 15:
16: 17: 18: 19:
Eingabe: N W ähle eine elliptische Kurve JE und einen Punkt P E JE; eb enfall s Sch ranken B I , B 2 E N , BI < B 2 for a B q :::; B I , q Primzahl , kleine q mehrfach do P: = q. P if eine Addition (bzw. Verdopplung) ni cht möglich then p: =ggT( X2 - XI , N ) (bzw.p :=ggT(2Y I , N» Abbru ch end if end for qo := klein st e Primzahl > BI, Q := qo . P fo r a ll qo < a» :::; B2 , a» Primzahl , k = 1,2, ... do Q := Q + (qk - qk-I) . P if Addition (bzw. Verdopplung) nicht möglich t hen p := ggT(X 2 - z i , N) (b zw. p := ggT(2YI , N » Abbruch end if end for Bei Misserfolg: Geh e zu 2. Ausgabe: p
(Vor Zeile 11 werden die möglichen Werte von (qk - qk-I) ' P vorbere chnet und gespeiche rt .) An alog zum (p - 1)-Verfahren gilt a uch hie r : Ist ord(P) = PI Primfaktorzerlegung der Ordnung des Startpunktes (wobei PI ?: P2 ?: so haben wir nur dann Erfolg, falls PI :::; B 2 und P2 :::; BI ist .
Pk die ?: Pk) ,
Ein (klein er) Vorteil ergibt sich hier no ch aus der Tatsache, dass wir a uf versch iede ne n ellipt ische n Kurven parallel rechnen ; mit jed em weiteren Primfaktor q von N korresp ondier t ja eine ents p rec he nde Kurve. Die Erfolgsa ussichten wer-
349
27.7 Elliptische-Kurven-Methode
den ab er im Wesentlichen durch den klein st en Primfaktor b estimmt , so dass dieser Vorteil ehe r vern ac hläs sigbar ist.
B eispiel Versu chen wir das an einem Beispiel nachzuv ollz iehen. Die Ei ngab eza hl ist N = 373935877 613. Als elliptische Kurve wählen wir JE : y 2 = x 3 + 11x - 11 und als St artpunkt P = (1, 1) E JE. Au s G ründen der Ei nfac hhe it ver zichten wir a uf die 2. Phase und wählen nur die Schranke BI = 15. E ine gee igne te Zahl, die all e Prim zahlen j; BI a ls Teiler ent hält, ist z. B. rn = 360360 = 2 3 . 3 2 . 5 . 7 . 11 . 13. Für das "Double & Add"Verfahren müssen wir rn als Summe von Zweierpoten zen da rst ellen , d . h .:
Um uns un nötige Additionen zu erspare n, nehmen wir die kürze re Da rstellung
Durch sukzessi ve Punktverdopplung erhalt en wir nun: 2 1 P = (47,373935877290) 2 P
= (227972965300, 183442291117) = (61805727327, 11053Ei328079)
2 17 P
= (280318713435, 342677737184)
22 P 3
2
18
P = (268323296538, 16670570674)
Nun sind wir in der Lage, rn· P durch Additi on der en t sprechenden Zweierpot enzen zu be stimmen : 23 P 3
2 P 3
2 P 3
2 P
+2
5
+2
P _
+2
5
+ 25 P
= (70097302030, 311003332604)
P - 2 P = (346 690843 31, 321123021245 ) 7
+ 2 15 P = 27 P + 2 15 P + 2 16 P = 5
7
P- 2 P
(317161257334 ,1 888429 75469) (120.533742333, 164980145 780)
Nun müssen wir no ch 2 18 P addiere n und stellen fest , dass wir die P unktaddi tion (120 533742 333,164980145780) + (268323296 538,1 6670 570674) ni cht au sführen können , da 26832329 6.538 - 120.533742333 = 147789 55420 5 modulo N nicht inve r tierb a r ist . Wi r bekommen m it p = ggT( 1477895.5420.5, N ) = 157.559 also einen Primfaktor von N. F ür die Kurve JE über lF 1 5 7 5 59 gilt or d ( P ) = 182 = 2 · 7 · 13 und für die Gruppenordnung or d(JE) = 157976 = 23. 72.13 .31. Diese lässt sich übrigen s effizient mit Schoof's Algorithmus bestimmen. Das Beispie l zeigt auch gut, dass für den E rfolg die Ordnung des Startpunktes (und nicht der Gruppe) ent sche ide nd ist.
350
27 Faktorisierungsverfahren
Erweiterungen/Verbesserungen Ein gro ßer Vorteil dieser Met hode ist ihre un ein geschränkte Parallelisierbarkeit . Sämtliche Kurven sind von einander unabhängig, so dass man die Ber echnungen ent sprec he nd verteilen kann. Es hat sich he rausgestellt , dass man B l/ B z so wählen sollt e, dass sich ein Verhältnis von etwa 2:1 zwischen den Laufzeiten von Phase 1 bzw . 2 ergibt . De s Weiteren gibt es noch einige Tricks, mit denen man die Effizienz no ch et was weiter steigern kann . Im Folgenden eine Au swahl: 1) Einsparung von Punkt additionen In Phase 2 be rechnen wir a ufst eigend Punkte q . P für alle Primzahlen q im Int ervall (BI , Bz]. Da s kost et et wa Bz / In(Bz) Punktadditionen. Punktadditionen sind sehr teuer, da sie eine Inv er tierung beinhalten (dazu muss man den Erweiterten Euklidischen Algorithmus aufrufen) . Man kann die Zahl de r Additionen a ber mi t folgendem Trick a uf etw a Vlh verringern: Gegeben sei ein w E N. Mit natürlichen Zahlen u (eindeutige) Darstellung
< w und v ergibt sich die
q = vw -u q 'P = vw 'P -u 'P Fixiert man je tzt w in der G rößenordnung Vlh, so gilt ebenfall s u , v ~ Vlh, Wir können jetzt die Werte v w · P und u - P berechnen und sp eichern , was 2Vlh Punktadditionen kostet . Statt nun die Differenzen vw· P - u · P auszurechnen, be stimmen wir nur den ggT (xz - X l, N) de r x-Koor dinaten von vw· P bzw . u . P und schauen, ob wir den gesu chten Faktor p bekommen. Weiter kann man Re chenzeit sparen , wenn man mehrere Werte (x z - X l ) vor der ggT -Bildung a ufmult ipliziert . 2) Einsparung von Inve rtierungen Unter Verwendung einer anderen Kurvenparametrisierung kann man soga r ganz a uf die Inve rtierungen verzi chten . Die von uns eingeführten Kurven haben die Form JE : yZ = x 3 + ax + b, welch e a uch als Weierstrais-Parametrisierung bekannt ist . Eine Kurve der Form
mit Kurvenpunkten (x , y , z) liegt in der sog. Montgomery-Parametrisierung vor. Eine Addition von Punkten dieser Form kommt ohne Inv ertierung au s; sie wird gern für P hase 1 verw endet . Details zu dieser Parametrisierung kann man in Montgomer y [741 nachlesen .
351
27.7 Elli ptische-Kurven-Methode
3) Erhö hung der Glattheit der Gruppenordnung Man kann d afür sor gen , dass b ei geeigne te r Wahl der Kurvenparamet er gewährleist et ist , dass die Ordnung or d( JE) immer durch bestimmte (klein e) Zahlen t eilb ar ist . Man kann damit also ,,kün stlich" die Gl attheit der Ordnung erhö he n. Besorgen t ut dies ein sogenannter K urvengenerato r. E in solcher liefert zu einem Zufall szahlenwert a E Z Kurvenparameter a, b für eine ellipti sche Kurve JE mit be sag te r E igensch aft . Daneben wird no ch ein gül tiger Star tpunkt P E JE generie rt . Als Beispiel wird kurz ein Generato r für eine Ku rve JE in der oben genannt en Montgomeryform a ngegeben . Sei a E Z zufällig gewählt . Dann bekommen wir mi t 6a u· = - 2 (mod N ) . a +6
a 'P: =
- 3u 4
-
6u 2
4u3
(~~ , - ,1)
+1
(mod N )
(mod N )
den Parameter a und ein en Kurvenpunkt P a uf JE, wobei ord(JE) immer durch 12 teilbar ist . Der P arameter b wird (analog zur Weierstraßform) für Punktaddition en in Montgomeryform nicht benötigt, a uch wird die y-Koordinate des St art punkts P für die Berechnung nicht benötigt (darum der Strich). E inige ander e Erweiterungen werden in [741 b esch rieb en . La ufze it Die Laufzeit hängt en ts cheidend davon ab , wie viele Kurven wir durchprobieren mü ssen , bis ord(P) die erforde rliche Glattheit seigen schaft erfüllt. Wenn wir einerseit s die Schranken BI / B 2 klein er wählen, so sind wir mit der Berechnung einer Kurve schneller fertig und können somit mehr Kurven t esten . Anderer seits könnten wir sie größ er wäh len , um die Wahrsch einlichkeit für die Glattheit zu erhöhen . Für eine An two rt brauchen wir ein e Aussage über die Häufigkeit glat ter Zahlen .
S atz 2 7 .10 ( Can fie ld, E r dös, P omerance) Fü r die " Glattheitsfunktion "
'ljJ (x, y) := I{n E N : n ::; x , n be sitzt keinen Primteilert gilt 'ljJ (x , y) = x · u -u (l +o(I», wobei u := ln(x) / ln(y) .
> y} 1
352
27 Fakt orisierungsverfahren
In Kurzform: F ür eine zufällig gewählte Zahl n ::; x b eträgt die Wahrschein lichkeit , y-glatt zu sein , et wa «» . Für un s bed eutet das, dass wir ungefähr U U Kurven zu t est en haben , um eine n Primteiler p zu find en, wob ei hier u := In(p) jln(B2) ist (man kann u als das Längenverhältnis der Zahlen p und B 2 auffassen) . Da die "Double & Add"-Methode pro Kurve et wa B2 Op erationen b enöti gt , können wir eine Gesamtlaufzeit von L(p) = U U • B2 = U U • v' !" an set zen . Um die Laufzeit zu minimieren, machen wir den An satz dL j du = 0, also:
_ pl / Uu U-2 (ln(p) - u 2I n(u) - u 2) = =}
°
ln (p) = u 2(1
+ ln (u ))
Umste llen liefert uns eine asymptotische obere Sch ranke für die Lösung U opt
U opt :
~ yl 2 ln (p)j ln (ln (p )),
woraus wir mi t
B 2 ~ exp ( ~ yl2 ln(p) ln(ln(p)) ) die ents pre che n de Wahl für B2 er halten. Darüber hinaus ist au ch die Bestimmung der asymptotischen Laufzeit mögli ch . Zur Übe rsicht lichkeit setzen wir q := ln(p) und bekommen nach Einsetzen:
L() p
q = e U ln (u )+ l.. " = e V2 q/ In (q ).~(ln ( 2q ) -ln(ln (q ) ) )+Vln (q ) /2q.q
= e~ v2q / l n (q ) .l n (q ) ( 1 +o (1 ) )+ ~v2q In (q ) =
e h~·(l + o( 1))+~ v2 q l n( q)
= e V q 1n (q ) (2+o ( 1) ) = e V 1n(p) ln(l n(p) ) (2+o( 1) )
Die Laufzeit ist som it su bexponent ieller Natur. Leider gib t es zu wenige glat te Zahlen , um daraus eine n effizienten Algorithmus zu erhalte n. J et zt kommt mögli cherw eise der Einwand , dass man die optimalen Werte für B 2 und die Kurvenanzahl nicht kennt, da ja auch p nicht bekannt ist . In der Praxis geht man von eine r b est im mt en Gr öße von p au s und macht die ents p rec he nden Test s. Sch lag en diese fehl , so wech selt man zur näch st en Größenordnung. Gegenüber dieser ist der Aufwand der ersten Tests vernachl ässigbar klein.
27.8
Quadratisches Sieb
Wir rufen un s no ch mal die Fermatmethode ins Ged ächtnis: Die gegeb en e Zahl N als Differen z zweier (ni chttrivialer) Quadrate dargest ellt liefert uns wegen
353
27.8 Quadratisches Sieb N = X2 - y2 = (x - y)(x
+ y) zwei eb enso nichttriviale Faktoren von N . Wir verallgem ein ern jetzt diese Id ee: Gegeb en sei eine Kongruen z 2
x ==
dann gilt
l
(mod N) ,
(x - y)(x + y) == 0 (mod N) .
Wenn die se Kongruenz nichttrivial ist , d. h ., es gilt weder x - y == 0 (mod N ) noch x + y == 0 (mod N ), so bekommen wir ebenfalls mi t ggT (x - y , N ) und ggT (x + y , N ) zwei Faktoren von N geliefert . Die Idee des Qu adratischen Siebes besteht darin, nicht direkt solche kongruenten Quadrate zu bestimmen, sondern sie aus betragskleinen quadratischen Resten zu kombinieren . Das läss t sich am bes ten durch ein Beispiel demonstrieren: Sei N = 517631, VN = 719 ,4... . Das Fermatverfahren würde jetzt bei Xo = 720 aufsteigend te sten, ob die Differenz N ein Qu adrat ist . Wi r bekommen dabei u . a .: 724 2 == 5 ·7 ·11 . 17 (mod N )
x; -
2 739 == 2 ·5 ·7 ·11 ·37 (mod N) 2 2 741 ==2·5 .17 ·37(mod N ) Bei Ferm at würden wir noch bis 816 2 geh en , b evor wir ein echt es Quadrat erhalte n. Man sieht aber sehr leicht, dass b ereits die drei obigen Zahlen zusammenmultipliziert au ch auf der rechten Seite ein Quadrat ergebe n, nämlich (724 .739 .741) 2 == (2 . 52 .7 .11 .1 7 .37)2 (mod N) 2 2 =} 473961 == 351126 (mod N) und damit ggT (473961 - 351126, N ) = 431 sowie ggT (473961 + 351126, N ) = 1201. Wenn man es also geschi ckt anstellt, kann man sich viel Arbeit er sparen. Die Idee der Kombination quadratische r Reste gab es schon vor 80 Jahren. Eines der ersten darauf basierenden Verfahren war die Kettenbruchmethode, die in den 60er-Jahren recht populär war. Abgelöst wurde sie aber durch das seit 1981 entwickelte Quadratische-Sieb-Verfahren (Pomerance [75]). Dieses a rbe it et in zwei Stufen: Im Siebschritt werden einerseits hinreichend viele qu adratische Kongruenzen (Relationen) erzeugt , im Auswahlsch rit t wird andererseits versucht , diese zu einem Quadrat x 2 == y2 (mod N) zu kombinieren. Haben wir eine solche Kongruen z gefund en, so ist sie mit Wahrsch einlichkeit 1 - (~)k nichttrivial, wenn k die An zahl der Primteiler von N ist - da jed er Primfaktor p von N theor etisch mit gleich er Wahrscheinlichkeit in x - y wie in x + y ent halt en sein kann .
354
27 Faktorisierungsverfahren
Si ebschritt Aus dem Beispiel ist vielleicht schon die Methode ersicht lich , mittels derer wir an die b egehrten Relationen gela nge n können . Wir erze ugen betragsklein e qu adratische Rest e ri , die nur klein e Primteiler ent halt en. Diese kann man mit hoher 'Wa hrsche inlich keit mit a nde ren Rest en kombinier en, die dieselb en P rimt eiler aufweisen . Kombinieren b ed eutet hier multiplizier en , so dass die jeweiligen Primteiler in gerade r Poten z ent halt en sind. Klar ist dabei : J e größer ein Primteiler, de sto weniger Relationen werden wir finden , die die sen en thalten . Wi r sind also a n "glat t en" quadratischen Re sten inte re ssiert . Die P rimteiler, die wir zul assen , fassen wir in einer Faktorb asis zu sammen.
D e fin itio n 27. 11 (Fa k t o r b a sis ) Sei B E N. E ine Faktorbasis zu B ist eine Menge F = { -1 ,P2 , ... Primzahlen P2, ... .t» ::; B.
,pd
mit •
Negative Reste sind eb enso gewollt , weswegen wir PI := -1 mit aufnehmen . Daneben brauchen wir no ch ein Siebpolynom , das die qu adratis chen Re ste erzeugt . Die ses ist von der Form
Q(i) =
(i+ lv'NJf -N.
Wir können ber eits jet zt die Faktorbasis auf b estimmte Primzahlen Pi einschränken , da in von eine m Siebpolynom Q( i) erzeugt en Rest en r i nicht b eliebi ge Primt eiler vorkommen können . Welche das sind, bekommen wir üb er die Ber echnung de s Legendresymbols heraus.
D efinit ion 27. 1 2 (Legen d resymbol) Sei a E Z und P eine Primzahl. Unter dem Legendresymbol versteht man die Sch reibweise
(~)
, wenn P I a , , wenn a qu adratischer Rest modulo P ist , , wenn a quadratischer Nichtrest modulo P ist.
•
27.8 Quadratisches Sieb
355
Eine Primzahl P kann nur dann ein Teiler von Q (i) sein, fall s (i
l
+ VNJ)2 ==
N (mod p) gilt, was sofort (~) = 1 impliziert . Bei Erst ellung der Faktorbasis wird daher zu j ed er Primzahl das Legendresymbol a usgewertet . Das geht a uch für große Primzahlen seh r schnell, da es einige einfache Rech enregeln für das Legendresymbol gibt .
Sieht man von der 0 ab, so gibt es modulo eine r ungeraden Primzahl genauso viele qu adratische Reste wie Nichtreste; im Endeffekt fall en dadurch ca. die Hälfte a ller Primzahlen durchs Raster. Als näch st es b enötigen wir das Siebintervall. Dieses defini ert diejenigen i E Z, für die wir die Werte Q(i) verw enden . Es ist von der Form
wob ei 0 ~ E: ~ ~ gilt . Das b ewirkt , dass die damit gewonnen en quadratischen Reste von der Größenordnung Q(i) E O(N~ +E:) sind. Wir erze uge n uns also fortlaufend Werte Q(i) und sch auen , ob diese über der Faktorbasis F zerfallen , d . h. , Q(i) besitzt nur Primfaktoren aus der Faktorbasis . Die naive Method e, dazu eine Probedivision durch all e Faktoren paus F durch zuführen, ist uns dabei viel zu langsam. Stattdessen bedi en en wir uns eines deutlich schne ller en Siebverfahrens , das a uf der Äquivalenz
mit l E Z , sEN b eruht . Dabei lösen wir zunäch st die Kongruen z Q(i)
== 0
(mod
pj)
für a lle Primzahlen Pj E F und in Fr age kommenden Exponenten s , Man beachte, dass Q ein qu adrati sches Pol ynom ist . Modulo einer Primzahl haben solche Polynome höchstens zwei Nullstellen (wir mü ssen demzufolge au ch alle Lösungen betrachten) . Die Nullst ellen lassen sich au ch für große Primzahlen schnell be stimmen ; das gilt ebenfalls für die Nullstellen modulo einer Primzahlpotenz. Haben wir nun zwei Lösungen il und i2 erhalten , so bekommen wir alle weiteren einfach durch Addition ganzzahliger Vielfache r l . pj zu i l bzw. i2 . Die Ergebnisse wer den in eine r Siebtabelle festgehalten. Die Zeilen markier en den Index i und die Spalten die Primzahlen Pj der Faktorbasis . Die Einträge sind die Vi elfachheiten s des Vorkommens der Pj in der Faktorzerl egung von Q(i) . Untensteh end zu seh en ist die Siebtabelle (Tabelle 27.1) für unser Eingangsb eispi el N = 517631 und das Siebintervall I = [- 24, 24].
356
27 Fa kt orisier ungsverfa hren
Tab. 27.1: Siebtabelle für N = 517631 - 1
2
5
7
11
13
17
1
-
-
3
1
- 22015
1 1
-
1
1
-
-
- 14950
1
1
2
-
-
1
717 721
- 3542
1
1
1
-
1 1
-
2210
1
-
-
724 734
6545 21125
-
-
1
1
1
-
-
3
-
-
i
Xi
Q (i )
- 24 - 15
695 704
- 34606
- 10 - 2
709
2 5 15
23
37
-
-
-
1
-
1
-
1
-
-
-
1
-
1
1
-
-
-
1
-
-
2
-
-
-
20
739
28490
-
1
1
1
1
-
-
-
1
22
741
31450
-
1
2
-
-
-
1
-
1
In die ,,finale" Siebtabelle kommen natürlich nur die Q(i) , die über der Faktorbasi s F zerfall en . Um festzustellen , ob das der Fall ist, müssen wir während des Siebvorgangs Q (i ) durch gefundene Faktoren pj dividieren . Wird dadurch am Ende Q(i) zu 1 reduziert, so ist Q (i ) über F vollständig zerlegbar. Auswahls chr itt Nachdem wir im ersten Teil des Ver fah rens hi nr eichend viele - was "hinreichen d" b ed eutet , werd en wir gleich seh en - Relationen der Form xl == Q(i ) (mod N) gefunden haben, werden diese nun im zweiten Tei l zur gesuchten Lösung kombiniert . W ir haben also insgesamt l qu adratische Reste Q( i I), . . . , Q ( id gegeben und su chen jetzt eine Auswahl {i m u . . . , im,, } <:;; {i r , . . . , iL} , so dass im Produkt
a uch auf der linken Seite ein echtes Quadrat st eht. Dazu müssen die Elemente Pj der Faktorbasis in der Faktorzerlegung der lin ken Seite in einer ger aden Potenz vorkommen . Sind Si j die zugehörigen Exponenten , so muss also die Gleichung
ZrSrj
+ Z Z S Zj + ... + Z l S l j == 0
(m od 2)
mit Koeffizient en Zr, . .. ,Zl E {O, I } gelten. Diese Eigenschaft muss natürlich für alle k Elemente von F gelten , so dass wir ein Gleichungssystem Az == 0 (m od 2) der Form
(::: • C:)
= 0 (mod
2)
b ekommen . Im Lös ungsvektor Z sind genau die n Bit geset zt , die diejenigen Relation en a uswählen, welche sich zur gesucht en Lös ung kombinieren lass en.
27.8 Quadratisches Sieb
357
Zu lösen ist also ein lin eares Gleichungssystem über IF2, wob ei im Fall l > k sogar eine Lösung garantiert ist . Falls sich als Lösung eine triviale Kongruen z ergibt, muss wenigstens ein e weiter e Kongruen z gefunden werden.
B e is p ie l Bleiben wir bei unserem Beispiel N = .517631. Die Siebtabelle haben wir schon gesehen, im zugehörigen Gleichungssystem A z == 0 (mod 2) ist dann
A=
1
1
1
1
0
0
0
0
0
0
1
0
1
1
1
0
0
1
1
0
0
1
0
0
1
1
1
1
0
0
0
1
0
1
0
1
0
1
0
0
1
0
0
1
0
1
0
1
0
1
0
1
0
1
0
0
0
0
1
0
1
0
0
1
1
0
0
1
0
0
0
1
1
0
0
0
0
0
1
0
1
0
0
0
0
0
1
1
1
und z =
0
Um zwei kongruente Quadrate zu erzeugen , müssen also die Relationen 6, 8 und 9 kombiniert werden (entspricht den Werten i = 5, 20 und 22) .
Erweiterungen j Ve r b e ss e r u n ge n Der Siebschritt ist natürlich parallelisi erbar, da man unabhängig von einander verschied ene Werte Q( i) berechnen und über verschied enen p E F sieben kann . Man kann aber noch weiter e interessante Erweiterungen einba uen. 1) Verwendung von partiellen Re lationen Man kann die Forderung, dass ein quadratischer Rest über F zerlegbar sein muss , etwas abschwächen. Man lässt in der Faktorzerlegung einen Primfaktor q außerhalb von F zu, der aber eine bestimmte (nicht zu hohe) Schranke nicht überschreiten darf. Findet man zwei solche sogenannten partiellen Relationen mi t demselben Faktor q, so lässt sich q durch Kombination beider Relationen eliminieren. Damit man eine Chance auf solche P aare hat, darf q aber nicht zu groß geraten. 2) Verwendung von Heuristiken Weiterhin hat man herausgefunden , dass sich das Sieben nach großen Primpot enzen v' nur für kleine p lohnt und schränkt sich hier ent sprechend ein - auch wenn dadurch möglicherw eise Relationen übersehen werden.
358
27 Faktorisierungsverfahren
Eine weit ere brauchbare Modifikation ist das logarithmische Sieb en . St at t die Wer t e Q(i ) durch gefunde ne Faktor en pS zu dividieren , hält man sich eine Tabelle mit den Logarithmen der v' bzw. der Q(i ). Eine Di vision erse tzt man dann durch eine Subt rak ti on des ent sprechen de n Logarithmus. Dahint er steckt die Tats ache, dass eine Subt rakt ion schneller a usge führt wird als eine Div ision . Die Logarithmen werden mit einer hinreich end groß en Gen auigkeit gespeichert. Ein Rest zerfällt übe r F , fall s die Subtrakt ione n einen Wert sehr dicht b ei 0 ergeb en. Nachteil: die Rundungsfehl er st ellen eine (theor et ische) Fehl erquelle dar. 3) Verw endung von Mehrfachpolyn om en Wi r be nu tz ten bis je t zt ein ein ziges Siebpolynom der Ge st al t Q (x) = x 2 - N . Nur für weni ge x sind die so erzeugte n Re ste wirkli ch klein ; und m an ist nat ürlich a n mögli chst klein en Re sten inte re ssier t , da diese mi t höherer Wahrscheinli chkei t üb er der Faktorbasis zerfallen. Daher gibt es eine erweit ert e Variante, die vari able P olynome der Form
Q( x ) = (ax
+ b)2 -
N
verw endet . W ählt m an hier a und b so, dass a ein Teiler von b2
Q( x) = (ax
+ b)2 -
N = a 2x 2 + 2abx
+ b2 -
-
N ist , so gilt
N = a - (ax 2 + 2bx
+ c)
für eine ganze Zahl c. Das bedeu te t : Q (x) ist immer durch a teilbar , so dass man nur die Wert e Q (x) / a bet rach t en mu ss. Man kann sich also ein a wählen un d erhäl t dadurch meh rere Siebpolynome. Ei n zu groß es a füh rt ab er leider dazu , dass die Wert e Q( x) schneller anwachsen. Um ein zugeh öriges b zu bekommen , löst man die Kon gruen z b2 == N (mod a). Au ch hier kann man tricksen, da die Zahl de r Lösungen dieser Kon gruenz umso größ er ist , je mehr P rimfaktoren a besi t zt . Man wählt daher gern solch e a m it vielen verschiedenen kleinen P rimfak toren und erh äl t entsprechend viele Siebpolynome. 4) Eine Weiter entwicklung: Das Zahlkörper sieb Ende der 80er-Jahre gelang eine deutliche Verbesserung durch E rfindung des Zahlkörper sieb es. Das Verfahren benutzt algebraische Zahlkörper und erzeugt viel glattere Relationen als das ori ginale QS . Wer sich für die ses Verfahren inte ressiert , lese z. B. in Lens t ra [76] weit er. Laufzeit
W ählen wir die Faktorbasis sehr groß , so find en wir a uch schnell geeigne t e Relati onen , benötigen ab er a uch viele davon und mü ssen an schli eßend no ch ein Riesen gleichungssyst em lösen . Ist die Faktorbasis dagegen klein, suchen wir mitunter sehr lange. Gesu cht ist also wied er einm al der gold en e Mittelweg.
359
27.8 Quadratisches Sieb
Fangen wir mit dem Siebverfahren an . F ent hält alle Primzahlen p ::; B . Hat man mit dem Siebpolynom n quadratische Rest e gewonnen , so werden zu jed er Primzahl p E F in sgesamt n lp Eintragungen in der Siebtabelle vorgenommen . F ür den Gesamtaufwand ergibt sich daraus
L ~ ~ n · Jkl~(k) B
pE F p
2
dk
~ n · ln (ln (B )).
Die Integr alabschätzung bekommt man aus dem Primzahlsatz, aus dem man die Größenordnung k ln(k) für die k-te Primzahl folgern kann. Pro berechnetem quadrati schen Re st b enötigen wir also gerade einmal ln(1n(B)) Operationen für das Sieben. Jetzt müssen wir un s natürlich überlegen , wie viele quadratische Reste wir durchprobieren müssen , bis uns eine der gewünschten Relationen üb er den Weg läuft . Für diese muss der Rest üb er F zerlegbar, also B -glatt sein . Dazu b enötigen wir wied er die in Kapitel 6 vorgest ellte Glattheitsfunktion 'ljJ und den Satz von Canfield , Erdös und Pomerance. Nehmen wir an , alle vom Siebpolynom erzeugten Re ste sind im Betrag durch x bes chränkt . Es ist dann x . 'ljJ (x, B )-l die zu erwartende Anz ahl a n benötigten Versuchen, um einen B -glatten Res t zu bekommen. Um im Au swahlsch ritt das Gleichungssystem lösen zu können , benötigen wir etwa Jr(B) Rel ationen . Wir können also eine Gesamtlaufzeit von
L( x) = In(1n(B)) . Jr(B) . x · 'ljJ (x, B) -l an setzen. Der P rimzahlsatz sagt uns Jr (B) ~ B I ln(B) , wir können In (ln( B )) . Jr (B) also mit B großzügig nach oben ab schätzen. Um den Satz von Canfield , E rdös und Pomerance a nzuwenden, set zen wir B := x l / u , also L(x) = x l / u . x· 'ljJ (x,X l /U )- l. Anwenden des Satzes ergibt
Um die Laufzeit zu m inimier en, machen wir wied er den An satz dL I du = 0, was uns a uf 2(1n(u) ln(x) = u + 1) füh rt . Man be ach te die Ähnlichkei t zur Laufzeitanaly se in Kapite l 6. An alog zu dieser bekommen wir U opt ~ J2In( x )1 In(1n(x)) . Fehl t nur noch das Einsetzen und Vereinfachen: L(x) = et In (x )+u In (u ) = e 1n( x) · V ln (l n( x» /2 1n( x)+! In (21 n (x ) / ln(ln (x » )·v21n (x ) / ln t ln fz ) = e V ! In (x ) In(l n (x »+ ! ln(ln (x »·v21n (x ) / ln (l n (x » = e V 2 1n (x )ln(ln (x »
360
27 Faktorisierungsverfahren
W ie scho n erwähnt , sind die qu adrati sch en Reste im Bet rag durch N ~ +E: b esch ränkt , wob ei man mit e --t 0 (für N --t (0 ) a us kommt, al so:
L( N) =
e
\/2 ln (N ! + O(l )
In (ln ( N !+O(l ) )
= e V (l+o( l» ln (N ) ln (ln (N »
Man kann jetzt no ch nachrechnen , dass die optimale Wahl von B in der Größenordnung B
~
~e
(~ +o(l» · vln( N) ln (l n ( N »
liegt. Soweit der Sieb schritt . Das Ganze würde natürlich gar kein en Sinn machen , wenn die eigentliche Komplexität im Auswahlschrit t läge . Dort haben wir ein Gleichungssystem mit einer (I x I)-Mat rix (wobei 1 :":::i B) zu lösen . Die GaußElimina tion hat zwar allgemein eine Laufzeit von O(z3), doch handelt es sich hier um ext re m dünn b esetzt e Matrizen . Man kann j a leicht nachrechnen , dass die An zahl der auf 1 geset zten St ellen in eine r Spalte durch et wa In( N) b esch ränkt ist . In der Praxi s er gibt sich daher eine Laufzeit von B 2 +o ( 1 ) für den Au swahlsch ritt, wob ei man ehe r speziell a uf solche Mat rize n zuges chnit tene Algorithmen verwende t , z. B . das "Block Lanczos"-Verfahren. Der Au swahlschritt ist gegenübe r dem Sieb schritt fast vernachlässigba r. Das ist a uch gut , da sich ersterer - im Gegensatz zu letz terem - schlecht parallelisieren lässt . Die Laufzeit hat starke Ähnlichkeit mi t der Lau fzeit de r Elliptische-Kurven-Methode. Das ist ab er kein Zufall, da die Komplexität beider Verfahren durch glat te Zahlen be stimmt wird . Das QS unterscheidet sich von ECM dadurch , dass de r Aufwand a usschließlich von der Länge der Eingabe N a bhängt und unabhängig von der Größe der Primteiler von N ist. In der Praxis läuft es meist auf eine Arbeitsteilung hinaus. Faktoren bis et wa ifN werden mit ECM schne ller gefunden . Bleiben dagegen genau zwei Faktoren größer al s ifN übrig, so gibt man dem QS den Vor zug, welches in diesem Fall seine St ärken ausspi elen kann .
N a ch t r a g Ein klein es Konsolenprogramm , das auf dem Mathep lanet en verfügbar ist [77], hat einige der vorgestellten Verfahren implementiert , so das s man das Ganze auch einm al ausprobi er en kann. Die Verfahren und die ihne n zugrunde liegenden Id een sollten dem Leser ein Gefühl für die Problematik und die damit verbunden en Schwieri gkeiten gebe n . Wi e schwer Faktorisier en wirklich ist , ist eine noch ungekl ärte Frage. Möglicherweise wird ja doch noch ein "sch ne ller" Algorithmus gefunden . Kay Schönberger ist Dipl.-Informatiker und lebt in Berlin.
Teil V Ausblick auf Weiteres
28 Fouriertransformation
Übersicht 28.1 Motivation
363
28.2 Zeit und Frequenzbereich
364
28.3 Der Weg zur Fouri ertransformation
365
28.4 Beispiele mit dem Oszilloskop
368
28.5 Die Faltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372 28.6 Systeme ........ . .... ......... ...... ... ..... ....... . ........ 375 28.7 Was es sonst noch gibt
28.1
377
Motivation
Gegen das mathematische Ende des E lektrotechnik-Studiums wird man zu den Funktionaltransformationen (oder Int egraltransform at ion en) gelangen. Es ist ein wichtiges Ziel der Ausbildung, diese Transformationen anwenden zu können . Sie sind sozusagen das Schwei zer Sackmesser des Elektroingenie urs. Dieser Beitrag zielt in erster Linie auf die praktische Anwendung ab. Dazu mag es manchem schon genügen, etwas über komplexe Zahlen zu wissen und alge braische Gleichungen lösen zu können . Das ist natürlich komfortabel , denn es ist gut möglich , solchermaßen ausgerüstet Prüfungen zu best ehen und a uch praktische Probleme zu lösen . Wer es ab er genauer wisse n will , kommt nic ht darum herum, sich mit Fu nktionentheorie zu beschäftigen. Auch von linearen Differentialgleichungen sollte man etwas verstehen. Hier geht es vor allem um die Motivation: Wieso und wozu ist das gut? Und die Antwort kann ich zusammengefasst gleich vorw egnehmen : Für nahezu jede Form der Signalvera rbeit ung, seien es optische, akustische od er a nde re Signale.
364
28.2
28 Fouriertransformat ion
Zeit und Frequenzbereich
Die meisten Menschen sind es gewohnt , in zeitlichen Abl äufen zu denken , das ist unsere a llt ägliche Erfahrung. Nahezu jeder wissenschaftlich interessierte Mensch kennt die Signaldarstellungen auf dem Oszilloskop. Was wir a ls Ton hören , wird zu einer Linie der Intensität über die Zeit . Aber wie hören wir diesen Ton? Unser Ohr zerlegt das Signal keineswegs in kleinste Zeiteinheiten , wie es dies das Oszilloskop t ut , sondern es filtert die einzelnen Frequenzen hera us, wie in der Abbildung 28.1 veranschaulicht ist . E
Abb. 28.1: Signalweg im Ohr Im Schallverlauf E(t) , also im Zeitbereich , sieht man die einze lnen Frequenzen nur sch lecht . Im Ohr muss also eine Transformation in den Fr equenzbe reich stattfinden . Umgekehrt, wie in Abbildung 28.2 gezeigt , geht es a uch . Spielt man Töne a uf einer Orgel, so ad dieren sich die Schwingungen und können mit dem Os zillographen b et racht et werden. Aus Signalen verschiedener Frequen z setzt sich also wieder ein Zeit signa l zusammen. E
t Abb. 28.2: Von der Klaviatur zum Zeit signal Man sieht sofort: Die zeitliche Darstellung lässt kaum erkennen , welche Tas ten gedrückt wurden. Das Frequenzgemisch sieht ziemlich chaotisch aus . Wie kann der Mensch aus diesem Tongemisch wieder etwas Sinnvolles hera ushören? Einerseits zerlegt unser Gehör das Signal wieder in seine Frequenzen. Aber das Gehör und seine Nervenzellen tun noch viel mehr. Störgeräusche (z. B. das Blut rauschen ) müssen hera usgefiltert wer den. Tonfolgen müssen er kannt werden usw. Früher hat man versucht , diesen Geh eimnissen durch Ti erversuche a uf die Spur zu kommen. Wichtige Durchbrüche hat man j edoch erst erzielt , als man neue mathematische Methoden auch mit schnellen, logischen , programmier baren Baustein en aus probier en konnte (FPGA, DSP).
365
28.3 Der Weg zur Fouriert ransformat ion
Di e Folgerung: Mathematik rettet Katzenleben! Heute sind di e Funktionaltransformationen und a bge leitete Berechnungen daraus zu einem wichtigen Wirtschaftfaktor geworden . Das Handy ist nur das naheli egendste Beispiel für moderne Signalverarbeitung. Der Röntgentomograph m acht di e Bildgebung auch ni cht m ehr mit Fotoplatten.
28.3
Der Weg zur Fouriertransformation
Nach de r Einleitung jetzt ein wenig Mathematik: Ich habe von Transforma tionen vom Zeit - in den Frequenzbereich gesp ro chen . Man kann nun versu chen , eine solche Transformation m athematisch zu beschreiben . Eine Sinusfunktion mit der Zeit als Parameter lä sst sich a uch folg endermaßen sch re ib en: sin ( t ) =
e i .t
-
e - i-t
---,::-...,--2·i
Anschaulich ist dies die Differenz zweier gegenläufig ro tierender Zeiger auf dem Einheitskreis. Da die Differenz im aginär wird , muss sie mi t der Di vi sion durch 2i no ch um - 90 0 auf die re elle Achse gedreht werden . M an kön nte diese Schwingung a uch a llein durch die beiden Frequenzen +w und -w und die Amplitude
A definieren . Somit ist b er eits so et was wie eine Transformation definiert. Di ese einfa che "Tra ns form at ion" hat all erdings zwei Na chteile: 1. Ist das Signal im Zeitbereich aus Schwingungen verschied en er Fr equen zen zusam menge setzt , so lä sst sich di ese Zusammensetzung nicht erm it teln. 2. Wirkliche Sign a le sind nicht unendlich lang. Außer der Amplitude muss a uch no ch ih re Zeitdauer berücksichtigt werden. Diese Na chteile lassen sich durch eine b essere Methode beseitigen . Zu 1. Durch M ult iplikation mit eine r Testfunktion können di e einzelne n Fr equ en zen er m it telt werden . Di e Testfunktion lautet b ei der Fouriertransformation e- iw t . M an nennt di ese Funktion den Kern d er Transformation . Um zu seh en, wie gut ein Signal auf den Kern passt , wird das Produkt über di e Zeit integriert. Zu 2. Im einfachen Beispiel nahm ich eine unendliche Sinusfunktion a n. Um die sem Umstand gerecht zu werden , könnte m an eine weitere Zahl einführen für die Zeitdauer oder (u nd so wird es gemacht) m an verschmilzt Amplitude und Dauer mittels Integration , wa s j a bereits in der Besprechung zu Punkt 1 nahegelegt wird . Nach diesen prakti schen Überlegungen mag die Fouriertransformation ni cht mehr so fremd erscheinen:
Y(w) =
~ ./ 271"
-0000 y(t) . e-
iw t
.
dt
(28.1)
366
28 Fouriertransformation
Dazu no ch einige E rklä ru ng en: Hier wird die Kreisfrequen z w = 2·7r·f ver wendet . Man kann ebe nso gut f verwenden , mu ss abe r die Vorfak toren anpassen : fällt dann weg. Dies handhabt jedes Bu ch ode r Skript et was ander s.
2\.
28 .3.1
Vo n den Fourierreihen zur Transformation
Eine n weit er en Eins t ieg bilden die Fourierreih en . Damit kann m an das ers te Problem lösen und ein Signal in seine Fr equen zb estandteile zerlegen. Die Ei nsch ränkung aus P unkt 2 (Fourierreih en b eschreib en unendliche p eriodische Signale) muss a be r noch beseiti gt werden . Ein Zr-pe riodisches Signal sei auf [- T, T ] ab solut int egri erbar (J : :IR --+ C). Die Fourierkoeffizient en lauten :
Ck(J ) =:
2~"JT
-T
Die Fourierreihe ist dann:
L CXJ
f(t ) . e- i.\'.' .t dt
Ck(J) . e i . k~rr -t:
k = -CXJ
Der Gren zwert dieser Reihe (fall s sie konv er gier t) ist wied er die ursp rüngliche Funkt ion f . (Dazu muss die Funkt ion a n Un st eti gkeitsstellen das Mittel der links- und re chtsseit ige n Gren zwer t e sein . An Stet igkeitspunkten ist das automatisch erfüllt. ) Dann gibt es eine Bij ekti on zwisc he n f und der Folge Ck (J) der Fourier koeffizienten . Um a uch nichtperiodische Funkt ione n zu b ehandeln , kann man die P eri od e in eine m Gren züber gang unendlich wach sen lassen . Wir haben al so eine a uf :IR ab solut integri erbare Funktion f : :IR --+
Wenn
f
stet ig differ en zierbar ist, gilt (für t E ]- T ,T[):
367
28.3 Der Weg zur Fouriertransformation
Wenn man jet zt T un endlich groß werden lässt , konv ergi ert ft gegen f . Bei diesem Gren züber gang wird au s der Summe ein Integral. Der Au sdruck k · if werde durch den Gren zübergang zur Kr eisfrequen z w und if wird zu dw. Wir gela ngen hiermit zur folgenden Integraldarst ellung:
f(t ) =
2~
i : (i:
f(T) . e-
iW T •
dT) .e
iw t
.
(28.2)
dw
Diese Herl eitung ent hielt nicht nur die Transformation in den Frequen zb ereich , sonde rn a uch gleich wied er die Rücktransformation in den Zeitbereich , es sollte ja die ur sprünglich e Zeitfunktion wied erher gest ellt werden. Darum werden hier no ch einm al Transformation und Rücktransformation separat in eine r Tabelle gezeigt . Dabei habe ich mi ch auf zeit liche Signale besch ränkt . Man kann auch Helligkeit swerte in einem zweidimensionalen Bild t ransformieren usw. Dies wird hier a ber nicht be sprochen.
28.3.2
Tabelle zur Fouriertransformation von Zeitsignal en
In der Tabelle 28.1 sind einige Begriffe zusammengestellt . In de r let zt en Zeile sind die Tr ansform ationsformeln vom Frequenz- in den Zeitbereich (links) und vom Zeit- in den Frequenzbereich (re cht s) da rge stellt. Tab. 28.1: Tabelle zur Fouriertransformation von Zeitsignalen Zeit be reich
Frequen zbereich
Begriffe
Zeitsignal
Spektrum
Paramete r
Zeit : t oder Ort: x
Freq uenz: w oder
Funkti onwert
reell: y(t)
komplex: Y(w)
Transformation in den
2~
00
J -
Y(w) · e i w t dw
00
00
J
f
y(t)· e - i w t dt
-00
Nun sind wir in der Lage, Beispi ele zu rechnen . An dieser St elle wird einfach davon ausgegangen , dass das Integral konv ergi ert und et was Sinnvolles herauskommt , was natürlich nicht selbs t verständlich ist .
Welche Signale lassen sich t ransformieren? Das Oszillo skop kann für jedes technisch erzeugb are Sign al ein e Tr ansformation in den Frequen zb er eich an zeigen . Wo liegen ab er mathem atisch die Gren zen ? Die klein st e Menge der transformierbaren und rück-transformierbar en Funktionen wird Schwarz-Raum od er die M enge der schnell abfall end en Funktion en gen annt (im Wesentlichen sind das Kombinationen au s Gauß-Verteilungsfunktionen).
368
28 Fouriertransformation
Diese Funktionen kann man folgendermaßen spezifizieren: Für jed es k E No und n E N ist lim IxIn f(k )(x) = o. X--+±=
Der Schwarz-Raum ist jedoch eine zu st arke Eingrenzung und für den Elektrotechniker kaum a nwendbar. Erweitern wir ihn deshalb zunächst zu der Menge der Energiesignale.
i:
i:
Ein beschränktes , stückweise stetiges Sign al y(t) nennt man Energiesignal, wenn gilt : y(t) . y *(t) dt
=
2
ly (t )1 dt <
(28.3)
00
Divergiert obiges Integral , aber existiert der Grenzwert lim
T --+ =
~l'fT - T
21
y(t)'y*(t)dt = lim
T --+=
l'l'fTly (t )1
2.1
2
- T
dt <
00,
(28.4)
so spricht man von einem Leistungssignal, da man den Grenzwert als mittlere Leistung interpretieren kann. Diese Signale lassen sich transformier en . Die Transformation kann aber nicht nur zu klassischen Funktionen, sondern auch zu Distributionen führen.
28.4
Beispiele mit dem Oszilloskop
Da dieser Beitrag angewandte Mathematik behandelt, habe ich die Signale mit einem Oszilloskop transformiert . Dieses berechnet die Signale im Frequenzbereich mit der FFT-Methode (fast [ourier transformation) .
28.4. 1
Die Sinusfunktion
Zunächst einmal das einfachst e Signal in diesem Zusammenhang: die Sinusfunktion . Genau genommen kann man dieses Signal nicht transformieren (t echnisch), da es unendlich lang a ndauert . Da es sich aber um ein Leistungssignal handelt (wie oben definiert) , ist die Transformation zumindest t heoretisch definiert . Nun a ber zur Messung. Bis auf die Mess- und Auflösungsfehl er kommt heraus , was wir erwarte n würden .
In
Abbildung 28.3 et wa das
Bei der Frequenz von 1 kHz sieht man den (durch die Messung leicht zerdrückten) Diracstoß. In den Bildern fällt a uch auf, dass nur die positiven Frequenzen vorkommen . Die Fouriertransformation erst re ckt sich aber auch auf die negativen Frequenzen und das sollte man nie vergessen. In der Technik sch einen diese a uf den erst en Blick kein e Rolle zu spielen. Beim Beispi el mit de r Amplitudenmodulation werden wir ab er seh en , dass negative Frequenzen auch in den
369
28.4 Beispiele mit dem Oszilloskop
Fr equenzbereich
Zeit b ereich
1
60 -
~
c:; .: ;j .: .: es
40
0
r-
20 -
[:l.
tI)
o_
.1
L
I.
I
o
o
4
2 Z eit (m s )
2
4
F r e qu e n z ( kH z)
Abb. 28.3: Sinus transformi eren
positiven Bereich gespiegelt wer den und deshalb ni cht verna chl ässigt wer den dürfen . Etwas Weit eres wird bei d ieser Darst ell u ng vernachlässigt : die P hase . Nach der Fouriertransformation haben wir für jede Frequenz einen kom pl exen Wert . Der Oszillograph stellt nur den Bet rag d a r. Man kön nte mit einem zweiten Diagr amm die Pha se über die Frequen z einzeichnen. Diese beiden Darstellungen nennt man auch Bod e-D iagra m m e (Beispiel folgt). Noch ein pa ar Wort e zur d B-Skal a : Di ese bezeichnet das Verhältnis von Ausgangs- zu Eingangssignal bei einer b est im mt en Fr equenz . Die Defin ition la utet : L = 20 10g lO ·(Uou t /Uin) . 0 d B bed eu t et somit Us,« = U i n, 20 d B eine lO-Fache Verstärku ng , 40 d B eine hu ndertfache Verstärku ng und -6 d B ei ne Abschwächu ng auf etwa 1/ 2. Nun soll ei n geeigneteres Signal verwen de t werden . Um die Energie endlich zu hal t en , wird d a s Signal einfach nur in einem gewissen Zeit fenst er eingescha ltet. Vor her u nd n achher sei es Nu ll. In Abbildung 28.4 wird gefensterlt. Freq ue nz bereic h
Zeit b ereich
1 ~
c:; .: ;j .: .: es
0
[:l.
tI)
- 1 -
-1
o
1
30 -
20 -
10 -
o 2
Z e it( ms )
Abb. 28.4: Sinus im Fenster
3
5 F re qu e nz( kH z )
370
28 Fouriertransformation
Wi e sieht das denn au s? Au s dem reinen Dirac-Impuls ist ein ziem lich übel ver schmierter Frequen zgang geword en und das nur, weil wir etwas a bgeschnit t en haben . Zug egeb en , wir haben j a au ch unendlich viel Signal a bges chnit ten. Der "Gipfel" des Signals ist immer no ch et wa b ei 1 kH z (Achtung: die Skala in Abbildung 28.4 ist gegenübe r dem ersten Beispi el et was ander s gewählt) . Das Frequen zsp ektrum hat ab er noch viele kleiner e lokal e Maxi m a, welche b ei dieser Messung nach und nach im Rauschen untergeh en .
28.4 .2
Die Rechteckfunktion
Die Rechteckfunktion hat eine wich tige praktische Bed eutung; sie dient dazu, Funkti onen durch ein Zeit- oder Frequenzfenster zu betrachten . Ein einzelner Rechte ckpuls soll nun zuerst mathematisch transformiert werden : TT
()_{I t -
o
Itl::;
t
sonst
Nun setzen wir die se Funktion in das Fourier-Integra l ein und erhalten eine Funktion der Frequen z: Y (f)
/2 7'
=
e-
i ·2 7rft
dt
T
=
[ 1
i'7rfT
t]
-i .2Jr-j · e _ I
-2
e
2 T
- j·27r f
2
- j'7rf T
- e i · 2 Jrj
j1')
. (
= l' . S ill'L'ttJr ]
- 1'. ' -
"
SIllC
(j1') Jr
Die Bezeichnung sinc (x ) ist eine Abkürzung für sin (x )/x. Die Me ssung zeigt Abbildung 28.5. Fr equen zb ereich
Zeitber eich I
:::.
1
-
0; >: >: >:
;j
05
-
I
lI
[:l.
tI)
0
-
-
I
- 20
I
o
l.
40 ~
'"(j
-
I
(j
v
I
""'"s,
"co
.;1
20 -
:
Cl
-
I
20
tIl
o-
I
0
200
400
F r e qu e n z ( k H z)
Abb. 28.5 : Rechteckpul s t ransformieren Die Funktion im Bild rechts ist von der Form Isinc (a· f) 1Nun machen wir das Gegenteil von vorhin. Die Fouriertransformation und die Rü cktransformation
28.4 Beispiele mit dem Oszilloskop
371
sehe n sehr ähnlich au s. Was passiert also, wen n man die sinc (t ) Funkti on in den Fre que nz bereich t ransform iert? Die Antwort soll die Messung in Abbildung 28.6 gebe n . Bis auf die erwarteten Feh ler ergibt sich b ei dieser Messu ng wied er ein Recht eck. Frequ en zb er eich
Zeitbereich 1
-
Il:l
::.
c:; >: >: >:
;j
3
"'.8"
.:,e
05 -
'"
Cl
[:l,
t.r)
<J
'"ij
o-
>:
tIl""
- 500
0
o
500
Z e i t(fl s )
50
100
F r e qu e n z ( kH z )
Ab b. 28.6: Sinc tra nsformieren
28.4.3
Die Dreieckfun ktion
In Abbi ldu ng 28.7 erkennt man die Koeffizient en der Fourier re ihe. Dank der Tatsache, dass nur ein endliches Signal t ransform iert wurde, sind diese Spi t zen auc h nicht unendlich hoch . Die Fre que nze n liegen b ei der Grundfrequenz, dem 3, 5, 7-fachen usw. Frequ en zb ereich
Zeitbereich Il:l
::.
60 -
3
>: >:
"'.8"
[:l,
'"ij
<J
tIl""
"">:
;j
Cl
.:,e
40
'"
20
>:
t.r)
- 1
0
1
Z e i t (m s )
0 0
10
20
F r e qu e n z ( kH z )
Abb. 28.7: Dreiecksignal t ransformieren
Bei dem gefensterten Dreieck (Abbildung 28.8 ) tauc ht wieder dieser ,,\Terschmiereffekt" auf. Dieser trägt die nic ht ga nz offensichtliche Bezeichnu ng Leck effekt.
372
28 Fouriertransformation
Fr equen zb ereich
Zeitbereich
1
:::.
§""
0
>:: >::
es
[:l.
t1)
.Jv_.
30 -
20 10 -
o-
- 1
o
- 1
1
Z eit (m s )
F r e qu e n z ( kH z )
Abb. 28 .8: Dreieck im Fenster
28.4.4
Gauß
Zum Schluss noch eine Funktion , die ihre Form beh ält (weni gst en s t he oretisch ). Es ist die Nor m alverteilung, oft einfa ch mi t Gauß bezeichnet. Die Mess ung ist in der Abbildung 28.9 dargest ellt . Fr equen zb ereich
Zeitber eich Cl:l
"(j
's,"
.!<
'"
20
.;1
'" ::
tIl"" - 200
o
200
10 0 0
5
10
F r e qu e n z ( kH z )
Abb. 28 .9: Gauß transform ieren
28.5
Die Faltung
In der P raxi s stellt sich oft die Aufgabe, gewisse Frequen zen au szufiltern. Nehmen wir an , a uf der Tonbandaufnahme st ört ho chfrequent es Rausch en und Pfeifen. Es sollen nun die T ön e über 6 kH z gefiltert werden , um das Stück einigermaß en wiede r her zu st ellen. Mat he mat isch biet et sich an , das Sign al im Frequen zb er eich mi t einer Fen sterfunktion zu multiplizier en , wie in Abbildung 28.10 gezeigt. Frequen zen ab eine r gewisse n Höh e werden einfa ch a bgeschnit ten . Das Sp ekt ru m im Bild ist übrigen s nur ein Beispi el. Man kann selbs t vers t ä ndlich j ed es
373
28 .5 Die Fa ltung
u
- I
!
!
!
l '1' I
! -!- -
I
!
I
I
-!
!
I
! ""1 I
r- !
I
I
I -1- !
!
j
j
-I I
-r -
-II
I
-
_
I
! I - ._ - - I1 --I
r- -
I 1
u "'T -
-1- -
!
r - -, -
-!- -
T -
-! -- -
r- -
1
I
I
I ! ! I ! I I .I- _ -i __ !__ -l. _ -1 __ !- _ -J
I I I I
I I I I
i I I !
! I
! I I ! I I I!
f
!
I
!
! - -! - - - -!
!!!
!!! --j--t--4
6 k Hz
!
I
!
f
r - I - -1- - T -
-I - - r - 1 I I I I _ .\. __I __ l- _ -l
I I I ! I _ -l. __ 1__ .I- _ -l _ ..
!
-1- -
"1 -
...j. _ _ 1_ _
---t--1--t--4--1-I I I ! I
I
6k Hz
-
- -
! I i ! _ -l- _ -I __ 1--_ -l
I!
__ -l. _ _ 1__ .I- _ -I _ _
I! --- -II
u
1
I! I
I
I
I
I
I I I I ----1--1--'
I I 4--1-I
I I I --1--r---1
I
I
I
I
f
6kH z
Abb. 28.10: Tiefpass
Sp ektrum dem Filter unterw erfen . Im Fr equen zb ereich ist das Signal nun einfach zu beschreib en : Die Anteile, die eine Frequen z unter 6 kH z haben , werden nicht be einflusst , alle s darüber wird null. Was passi ert a be r mit dem Zeitsignal, wenn man Im Sp ektrum zwei Signale multipliziert? Die mathem atis che Herl eitung ist nicht allzu schwierig und wird als Faltung od er Faltungsprodukt b ezeichnet. Der Au sdruck Produkt rührt daher , dass die Faltung im Fre que nz be re ich der Multiplikation im Zeitbereich ent spricht. Dies gilt auch umgekehrt . Nun a be r zur Herl eitung der Faltung:
i:
Zwei Signale (J und g) werden im Zeitbereich gefalte t :
(J
* g)( x)
=
f(x - t ) . g(t) dt
i:i:
Dieses Signal wird nun in den Frequen zb er eich transformiert:
f(x - t) . g(t) . e-
=
'OO ]-00 00 f( x - t) · g(t) · j-00
iw x
d t dx
e -iw. ( x -t ) · e -
iw t
dt dx
Nun können wir das Falt ungsintegral in ein Transformationsintegral wandeln durch die Substi tution z = x - t , d z = dx :
]-0000 f( z) . e
-iw z
dz·
]-0000 g(t) . e
-iwt
dt
Die s ist aber das P rodukt der Sign ale im Frequenzbereich . Damit sind wir fer tig.
374
28 Fouriertransformation
Fre quen zb ereich
Zeitbere ich 1 CQ
60
."
's,"
"'"
40 -
"il
20 -
'co"
.;1
'" tIl'"
- 1 -
o
10
o-
20
~I""
0
,,,
iml~I" II,
500
Z eit (m s )
1,000
F r equ en z (H z )
Abb . 28.11: Amplitudenmodulation Mu lt ipliziert man zwei Signale in eine m Mischer , so en tstehen neue Frequenzen (Abbildung 28. 11). Dies wird b eispi elsweise genutzt, um ho chfrequente Sign ale in eine n t ieferen Frequen zb er eich zu transformier en , wo sie elekt ronisch besser verarbeit et werden können . Im Bild 28.12 links wurde ein Sinuss ignal von 1 kHz mit eine m Sinus von 100 Hz mod uliert . Neben den urs prüngliche n Frequenzen zeigt die Tr ansformatio n noch Sign ale b ei 900 Hz und bei 1100 Hz. W ie diese ents tehe n , sieht man am b est en , wenn man die Fa lt ung graphisch au fzeichnet:
,
,- -
I1 1
-
,r r- I
"1
u -,-, - r - -,,- -,-, - , - --,-, - , - , - -,- , - , - --',- - ,, - , ,, - -',, - - - - r - -; - - ,- - r - -, - - ,- - I - , , , , - -,, - ,.. - .., - -rr- - .,., - ...,- -,.. - - - - -
T
r-
.I-
-1- - I 1
"1
I
-1-
-1-
i.,
1
1
1
1 1
1
1
1
I
I
1
-t
- h
I
1
- -, -
-
----0
1
-g
-,- -
T
-
.I-
1 -11 1
,
- -,- -,- -
,1
,
1 -1- - I 1 1 1
, - -,- -
"1
, - -'-, 1
- -rr- - - ...,- -,.. - -r 1
9
1
1 't-
1
1
1
I
1
I
I
1 -11 1
-
,- 1 I1
,
, - -,- - ,
"1
h:j- r
1
-gt h -
, ,
-11
- r- - - - ~ I
h
f
Abb. 28.12: Faltung Die Grundfrequen z in dieser Grafik im Frequen zb er eich heißt h (b ei der Messung ob en 1 kH z) . Diese wird modulier t von g . Bei jed er Frequen z bildet man nun ein Fa lt ungs integral. Bei den meist en Integralen erg ibt sich null , da sich die Diracpulse von 9 und h gen au treffen mü ssen , damit et was he rauskommt . Ein Zusamment reffen findet unte r a nder em für die Freque nzen h + 9 (u nte re Pfeile) un d h - 9 (obere Pfeile) st att. (Die gleiche Überlegung gilt au ch für die nega tive Seit e.) Ein Sign al mit aufmodulierter Information benötigt deshalb immer eine gewisse Ba ndbreit e. Ist g die hö chst e a ufmo dulierte Frequen z, so wird das amplituden moduliert e Sign al Frequen zen im Bereich h ±g ent halt en . Diese Frequen zbänder
375
28 .6 Systeme
sind inzwischen knapp und deshalb dem entsprechend t eu er. Dank Digitaltechnik sind die Bänder beispielsweise für s Fernseh en et wa 8-mal schmaler geword en, bei gleichbleib ender od er b esser er (gefühlter) Qualität .
28.6
Systeme
Bish er wurden nur Funktionen transformiert . Ein Signal wurde zum Beispiel aus dem Zeitbereich in den Frequen zb ereich transformiert, b earbeitet und wied er zurückgeschickt. Eine groß e St ärke der Fouriertransformation liegt ab er darin, dass man line are Differentialgleichungen t ransformieren kann . Technisch a usgedrüc kt kann man dies et wa so ver st eh en (sieh e Abbildung 28.13) : Unse r Signal sei weiterhin als E ing ang ssignal eine r Schaltung vorhanden . Das Signal werde nun mit Spulen , Konden sator en und a nde ren linear en Bauteilen beh andelt. Wir wollen wissen , welch es Signal am Au sgang der Schaltung anliegt . Was wir wollen , ist also eine Funktion (genauer ein Op er ator) , die a us eine m E ingangssignal das Au sgangssignal b erechnet.
e(t )
--1
.' ~ a(t)
- - -----'----
Abb . 28.13 : Der Systemgedanke
Um das Ausgangssignal zu erhalten, können wir die ganze Gleichung in den Frequenzbereich transformieren, dort lösen und wieder zurück in den Zeitbereich t ransformieren. Zuerst mü ssen wir unter a nderem wissen , was a us einer n- ten Ableitung im Zeitbereich im Frequenzbereich wird. Ohne Beweis seien in Tabelle 28.2 einige nützliche Korrespondenzen zur Behandlung von Differentialg leichungen aufgeführt . Im Zeitbereich lau ten die Funktionen f(t) und g(t) und im Frequenzbereich P( w) und G(w) . Ta b. 28.2 : Regeln zu r Fouriert ransfo rmation von Zeitsignalen Name
Zeitbe reich
1. Lineari tät
Q'
2 . Ähnl ichkeitssatz
f(t) f( a ·t)
+ ß· g(t)
3. Fa lt ung 4 . Verschiebung 5 . Multipl ikation mit t 6 . Ab leit ung
f( t - T ) t k . f(t)
Freque nzbe reich
Q, P (w)+ß· G(w) (1/ a) . P(w /a ) P( w) . G(w) e- iw T ·P (w)
28 Fouriertransformation
376
Mit diesen Korrespond en zen sind wir nun in der Lage, Syst em e zu t ransformi eren . Als einfaches Beispiel dien e der Ti efp ass mi t W ider st and und Spule in Abbi ldung 28.14.
Abb. 28.14: Tiefpass
Die se Sch altung lässt sich durch eine line a re Differen ti algl eichung 1. Ordnung b eschreiben: (28.5) L · :t i (t) + R· i(t) = Uin(t ) Wir geben ein Sign al u(t) in die Schal tung und wollen den Strom i(t ) wissen . Die Differen ti algleichung wird un ter Benutzung der Kor respondenzen in de n Frequenzbereich t ransfor miert:
L· i . w · I( w) + R · I (w) = U (w)
(28.6)
Das Schöne daran ist : Das ist kein e Differenti algleichung mehr , sondern nur ein e algebraische. Stellt man die se um , so erhäl t man die Übert ragungsfunkti on G :
J(w) = .
I ' W
1
L
+ R' . U (w) =
G(w) . U (w)
(28.7)
Die Üb ertragungsfunktion könnte man in den Zeitbereich zur ück transformieren . Dies ist abe r nicht das, was wir wirklich wollen . Die Schaltung stellt eine n Filter dar. Das heißt , wir wollen wissen , wie die Schaltung auf Signale versch iede ne r Fr equen z rea giert . Das wissen wir a be r ber eit s. Trotzdem ist es no ch nü t zlich , G(w) in Bod edi agramme aufzu tragen. Zuerst wird der Bet rag von G in Abhängigkeit der Fr equen z in Abbildung 28.15 dar gest ellt. Wird die Frequen z und die Ver stärkung (b zw. Ab schwächung) linear in eine m Diagramm a ufgetragen (Abbildung 28.1 5, links) , so sieht die Übe rt ragungskurve kompliziert a us und ist schlecht zu handhaben. Daher verw endet man ein doppelt logarithmisches Diagramm, wie rechts in der Abbildung. Dank die ser Art der Dar stellung kann man nun vereinfachend mit geraden Strecken a rbeit en. Bei Spannungs- oder Stromverh äl tnissen ents prechen 20 dB dem Faktor 10. Bei de r 10fachen Eckfrequenz ist das Au sgangssign al bei diesem Tiefpass noch 10 % vom Eingang. Berauschend ist das nicht gerade, daher werden oft elektronische Fil ter mit größerer Steilheit (höherer Ordnung) verw endet .
377
28 .7 Was es sonst noc h gibt
10° s,
.2
..sc
<j
r..
10-
10-
1
2
''' 'I
E"'"
,"1 ,,;
", li,
i i li i,i
11 1\ 1\ "
20 4 ,-
~ .-~O~lj
, ,
I
tu
I ' ! "
-
: -
" '!'-
Fr e q uen z
F r e qu e n z( H z )
Abb. 28 .15: Bodediagramm für den Betrag, links mit linearen und rechts mit logarithmischen Achsen
Was ich bisher in diesem Beitrag vernachlässigt habe, soll nun noch in der Abbildung 28.16 zu Ehren kommen : Der Phasengang. Bei der Fouriertransformation erhält man ja schließlich eine n komplexen Funktionswert, und der hat eine Phase. Bei einem Tiefpass erster Ordnung dreht sich die Phase um - 90 0 zu den hohen Frequenzen hin .
0
-\
,,; ,1
,' ,il'
II ; l i l
"
"
1", '
v
..sc
§'"
"''e""
- 45
..c: Cl,
- 90
'i 'i"
\
I, i ill
'-
"" ,.
"
F r e qu e n z
Abb. 28 .16: Boded iagramm für die Pha se
28.7
Was es sonst no ch gibt
Bish er wurde von der Fouriertransformation ges proche n. Es gibt ab er eine Vielza hl von Funktionaltransformationen für ver schi ed en e Anw endungen . Eine Au swahl au s dem Gebi et der Sign alv erarbeitung ist in Tabelle 28.3 gegebe n. Ein gu ter Teil der Transformationen baut a uf der Fouriertransformation a uf. Es mach t also Sin n , dass man diese gründlich studiert . F ür die Bildverarbeitung und a uch die Kompression von Bildern wird oft eine zweidime nsionale Fouriertransformation verw endet . Wavelets wird manchmal au ch als Üb erbegriff verwendet und dann fallen auch Fourier- und Laplacetransformation darunter . Die Laplac etransformation wird in der Regeltechnik und Filtertheori e verw endet.
378
28 Fouriertransformation
Tab. 28.3: Verschiedene Funktionaltransformationen Name
Beschreibung
Anwendung
Fouriertra nsformation
Signale werden in ihr Spektrum "zerlegt "
Signalve rarbeitung, Filter, Bildbearbeitung
OFT (diskrete Fouriertransformation )
Fourier für digitale Systeme
FFT : fast Fourier tran sformation: verbreitete und schnelle Methode zur OFT
Wavelets
Weiterentwicklung der Fouriert ransformation , optimierte Fensterung
Signalanalyse
Laplacetra nsformation
Einseitige Transformation mit Dämpfung im Kern
Lösen von Diff-gl., Regeltechnik
Ähnlich wie OFT, Spektrum "aufgewickelt "
Digit ale Signalverarbeitung
Signale positiver Frequenz werden um _90' gedreht, bei neg. Frequenzen um +90'
Hüllkurven , EinseitenbandDemodulation
z- Transformation Hilbert Transformation
Dank eines Dä mpfun gsgliedes im Ke rn können m it de r La placet ransformati on a uch Funk t ionen transformiert werden , die mit der Zeit ansteigen , a lso zum Beisp iel die linea re Ra mpenfunk t ion . Ueli Hafn er ist Dipl.Ing. F R und leb t in W interthur.
29 Das Brachistochronenproblem
Übersicht 29.1 Einleitung
379
29.2 Formali sierung de s P roblems
381
29.3 Ein m äch tiges Werkzeug: Variationskalkül. . . . . . . . . . . . . . . . . . . . . .. 382 29.4 Bestimmen der opt imalen Lösung
384
29.5 Abs chluss
387
29.1
Einleitung
Im Jahr 1696 stellte Johann Bernoulli, ein Mit glied der b erühmtesten Schweizer Gelehrtenfamilie , de r mathemati schen Welt ein einfach for muliertes, doch bei näherer Betrachtung schwieri ges und recht au fschlussreiches P roblem:
"Wenn in einer verticalen Ebene zwei Punkte A und B gegeben sind, soll man dem beweglichen Punkt e M eine Bahn zuweisen, auf welcher er von A ausgehend verm öge sein er Schwere in kür zester Zeit nach B gelangt." In modernerer Sprache au sgedrückt , würde seine Aufgabe folgendermaßen lauten : Wi e mu ss eine Bahn b eschaffen sein, a uf der ein sich reibungsfrei b ewegender Körper von einem höher gelegen en Punkt A zu einem ni edriger , jedoch nicht senkrecht darunter liegenden Punkt B allein von der Schwerkraft angetrieben die kürzeste mögli che Zeit benötigt ? Zu die sem P roblem hat Bernoulli mögli cherweise das Werk Galileis inspiriert, de r den K rei sbogen fälschli che rweise für den op timalen Bahnverlauf geh al ten hat te . Au ch lag Johann fast ständig im Streit mi t seinem zwölf J ahre ält eren Bruder J akob Bernoulli, de r ebenfalls ein sehr produktiver Physiker und Mathematiker wa r (was man damals nicht so st reng unter schi ed wie heute) . Johann wettete, dass er das Problem schne ller und elegante r lösen könne als alle ander en, darum veröffen tli chte er seine Problem st ellung in der Zeitschrift "A cta Erudiiorum".
380
29 Das Brachistochronenproblem
A
Abb. 29.1: Welche Bahn ist die schnellste von A nach B?
Es ist ein Trugschluss anzunehmen, dass die Bahn mit der kürzesten Länge, nämlich die Strecke AB, au ch die sei, auf der der Körper !VII die kürzeste Zeit benötigt. Das zeigt schon der Vergleich mit der Bahn, auf der der Körper !VI2 zunächst von
(::)
A
senkrecht herunterfällt , um dann mit konstant der Geschwindigkeit , die er am Ende des Freifallabschnitts hat, waagerecht
zu erre iche n (siehe Abbildung 29.1). Bei der direkten Bahn von A nach B wirkt, wie aus der eleme nt a ren Dynamik bekannt ist , die Hangabtriebskraft PH in Richtung AB mit
IpHI
= m·g ·sin(a) .
Dabei ist (mit .6.x a
= arctan
(~~ )
der Neigungswinkel der Bahn gegen die Horizontale und 9 = 9,81m /s 2 die Erdb eschl eunigung. So gilt mit dem fundamentalen Geset z der Newtonsehen Mechanik "Kraft ist gleich Mas se mal Beschleunigung" (P = m · Ci) :
g .
a
(.6.x)2 s
+ (.6.y)2
.
.6.y J(.6. X)2 + (.6.y)2
381
29.2 Formalisierung des Problems x
vI + x
(Dabei wurde die Id entit ät sin (a rctan (x ))
2
verw endet .)
Um damit die l = J (.0.x)2 + (.0.y )2 lange Bahn her abzukommen , b enötigt der Körper also gemäß dem Geset z der beschl eunigten Bewegung l = ~ . a . t 2 :
J
2 · [2
td ire k t
g . .0.y ,---------
r:
v2 ·
(.0. x )2 + (.0.y) 2 s : .0.y
Ausnutzen der Reibungsfreih eit in dem Sinne, dass stets Ekin
+
E p ot
= m· 9 . h
+ 21 . m
.v
2
= const.
gilt , führt ebe nfalls zu diesem Ergebnis. Dies wird später no ch verw endet werden . Bei der .Knickbahn'' b en ötigt er hingegen für den sen kre chten Teil nach .0.y = ~ . 9 . die Zeit
ti
für den waagerechten Teil
V2· 9 · li y' so dass die Ge samtzeit
/2.
tK n ic k
.0.y +
.6.x 2
Vg ·.0.y
beträgt. Der Vergl eich ergibt, dass die Knickb ahn schneller ist, fall s
(.0. X)2 also wenn .0.x
+
(.0.y) 2
> (.0.y +
~x) 2 ,
> ~ . .0.y. Son st ist die schiefe Ebene "sch neller".
Beid e Ver su che schein en also nicht optimal zu sein.
29.2
Formalisierung des Problems
Um die optimale Bahnkurve zu finden , nehme man vernünftigerweise an , dass die se exi stiere und als zweim al st et ig differenzierbare Funktion y(x) darstellbar ist . Ferner möge A mit dem Nullpunkt identisch sein und FG in negativer yRichtung wirken (vgl. Abbildung 29.2) . Zunächst muss ein Au sd ru ck für die Zeit für das Durchl aufen der ganzen Bahn gefunden werden . Auf dem Bahnstück dl , das nach P ythagoras die Länge dl = J(d x )2 + (dy) 2 = Jl
+ (Y'( X))2 . dx
382
29 Das Brachistochronenproblem
\ \
Abb . 29.2: Zum Ansatz für die Lösung
hat , läuft der Körper mit der Geschwindigkeit
v =
'!!!:.9 ' h =
~
V -2 ·g ·y(x )
2
(man beachte, dass y( x ) stets negativ ist). Durch infinitesimales Aufsummieren, also Integrieren des Quotienten ~ , ergibt sich die Gesamtlaufzeit . Dies liefert den Ausdruck
l
T(y)
bl
o
l( x ) -v (x ) dx
_ 1_ ~
y 2 ·g
'l
0
bl
VI +r-:::r:::\ (y' (x))2 y -y(x)
dx ,
der minimal wer den soll.
29.3
Ein mächtiges Werkzeug: Variationskalkül
T = T( x , y , v') ist eine ree llwertige "Funktion", deren Argument nicht nur eine reelle Zah l ist , sondern die zusätz lich von eine r differen zier baren Fu nktion üb er dem Intervall I = [X l, X2 ], Y : I ---+ lR , X H y(x) und deren erster Ableitung y' abhängt . Solch eine "Fu nktion a uf eine r Klass e von Funktionen" nenn t ma n ein Funk tio nal . Im vorli egend en Fa ll kann m an sich a uf die Problemklasse b eschränken , bei der T nicht explizit von x abhängt un d T durch ein Integral mit festen Int egrat ionsva riablen un d st etiger Funktion F : lR 3 H lR definiert ist :
T(y) =
l
X2
Xl
F(x ,y(x) ,y'(x))dx
29.3 Ein mächtiges Werkzeug: Variationskalkül
383
Mit diesen Objekten beschäftigt sich heute die Funktionalanalysis, die Anfang des 20. Jahrhunderts ent wickelt wurde. Tat sächlich aber wurden Problem e dieser Ar t schon weit früher mit den Mitteln der Analysis gelöst. Den wichtigsten allg em ein en An satz zum Auffinden von Funktionen , die gewisse Funktionale minimieren , bildet die Variationsrechnung, die von Joseph Loui s Lagrange ent wickelt und von Euler p erfektioniert wurde. Gegeb en sei also ein ste t ig differen zierbares Funktional T = I X l2 F(x, y , y') dx . Lagranges An satz zur Lösung lässt sich als Analogie zur Vorgeh en sweise b ei der Ex tremwertsuche für differenzierbare Funktionen auffas sen : F ür das Funktional wird eine vereinfachende Darstellung au s kons tantem Wer t T an einer Stelle, line arer Form D T und Termen höherer Ordnung gesucht. Was man hier sieht, ist der Beginn eine r "verallgeme ine rte n Taylor-Entwicklung' für eine Funktion T : IR 3 H IR: X
T( x ,y,y') = T( xo ,Yo ,Yb)
+ DT( xo ,Yo ,Yb) · (x -
Xo, Y - Yo ,y' - yb)T
+ 0(2)
Die Linear form D T (hier dargestellt als Zeilenvektor) stellt dabei das Analogon zur ersten Abl eitung eine r differ en zierbaren Funktion da r, die zwecks Extrem wertsuche gleich null gesetz t wird. Praktischerw eise gilt nach dem Satz von der Abl eitung unter dem Integral zeich en , dass die Differentiation des Funktionals T gleichbed eutend ist mit der Integration der Abl eitung von F . Aber halt - kann man denn nach Funktionen differenzieren? Man kann , und die ser Ans atz ist das eigentlich Geniale a n Lagranges Gedankengang. Der Raum de r für die Lösung in Frage kommenden Funktionen Y ist ein Vektorr aum , nämlich der Vektorraum der au f einem Intervall zweimal st et ig differenzierbaren Funktionen . Man bezeichnet diesen üblicherweise mi t C 2( [XI , X2 ]); im vorliegenden Fall also mit C 2 ([0, bI]) . Die Entsprechu ng zu Geraden durch eine n Punkt Y sind in diesem Raum Mengen von Funktionen der Form z = Y
+ E' TI ,
E
E IR,
wobei TI eine ebenfalls zweimal stetig differenzierb are Funktion a uf [Xl, X2] mit der Einschränkung TI( XI ) = TI( X2 ) = O. ist . Die s deshalb , damit die R andbedingungen des Problems nicht verletzt werden. Die vermeintli che Schwierigkeit, es gebe überabzählbar viele mögli che derartige Funktionen TI , erweist sich als Vorteil, denn die Stetigkeit von F ga rantiert für alle TI: F( x , Y, y' ) = lim F( x , Y + E • TI , Y' + E • TI' ), <--+0
und beim Extremalpunkt YE hat für jed es beliebige TI zu gelten:
dF(x , YE + E • TI , y~
dE
+ E • TI')
= 0
384
29 Das Brachistochronenproblem
Damit ist geme int, dass - egal, in welch er "Richt ung" 7) man die Lösung YE im Funktionenraum durchläuft - man dort stets ein Extremum vor find et , und dieses lässt sich per Differentiation nach E b equem lokali sier en . Diese Richtungsa bleit unge n nennt man Gateaux-Ableitungen . Zunäch st ste llt man unter Zuhilfenahme der Kettenregel ~~ dar als dF
dE
dy 8F dy' -8F . + - .8y d e 8 y' de
Fy(x, y, y' )· 7)
+
Fy' (x , y , y') . 7)
+ (d~
Fy'(x ,y,y')· 7)' (Fy' (x , y , y' ) . 7)) -
(d~ Fy' (x , y , y')) . 7)) .
Hier wurden verw endet , • •
dass das Funktional F ni cht explizit von der freien Variablen x a bhängt, die Produktregel zur Ableitung von F y' (x , y , y' ) . 7).
Falls das Funktional - wie in diesem Fall , a be r a uch in vielen anderen Anw en dungsfällen - durch ein Integral zwische n zwei fest en Gren zen b eschrieb en ist , ver schwindet wegen der Randbedingungen für 7) der mittlere Term , und man erhält:
Zusammengenommen ergibt sich die fundamentale
E uler -Lag range- G le ichung :
Fy -
d~ Fy,
0
Sie muss stets erfüllt sein , wen n ohne weitere Einschränkungen ein Funktional a uf C 2([Xl , X2]) einen ext remalen Wer t a nnehmen soll. Hängt ein Funkt ional von mehreren Variablen und de ren Ableitungen a b, so gibt es für jedes dieser P aare eine Gle ichung, die auf ein System von Differenti algleichungen führ t . Die s ist eine grundlegende Technik de r an al yti schen Mechanik.
29.4
Bestimmen der optimalen Lösung
Mit die sen Erkenntnissen wird nun die hie r gesu chte Lösungskurve, die wegen dieser Eigenschaft Brachisiochrone genannt wird (von gr. ß(2axu:;To~ = kürzest er , X (201/0~ = Zeit) , bestimmt . Direkt a us der E uler-Lag range-Gleichung erg ibt sich als Folgerung
o
y'.
(F - ~F ,) y
dx
y
385
29.4 Bestimmen der optimalen Lösung
y' . Fy ( Fy . y '
+
Fy ' . y" - Fy ' . y" - y' . dd Fy ' X
+
d
Fy ' . y") - ( Fy " y"+d dx Fy ' . Y')
d (
dx F - dx F y ' . y
:X(F
')
- F y ' . y') ,
also ist
F( x , y , y' ) - y' . Fy ' (x , y, y') kon stant, und zwar gleich C. Das zu lösende Problem, formal ver einfacht um den Faktor ~, wird damit zu :
C
y H (y ' ( X» 2
( y'(x»2
v -y (x )
~' V H ( Y ' (x » )2
C· ) -y(x)· )1
+ (y'( x))2
1
+
(Y'( X))2 _ (Y'(X))2
1
Dem zufolge ist C echt po sitiv und a uch
) - y(x) . )1
+ (y'(x ))2
iJ .
auf (0 , bI] kon stant , nämlich Wegen y(O) = 0 erkennt man an die ser Stelle schon, dass y' (x) in x = 0 eine Singularit ät hat , wegen Y x : y( x) ::::; 0 also limx --+o y'( x) = -00 gelten mu ss. M wird sich auf de r op timalen Bahn von A aus also zunächst senkrecht abwärts bewegen . Nach Quadrieren mu ss auc h
(1
+
(y'( X))2) . (-y(x))
im gen annten Bereich kon stant sein. Damit ist di e Differentialgleichung
(1
+
(Y'( X))2) . y(x) = K =
aufgestellt . Mit der Substi tution y'
= cot (ep ) sowie der b ekannten Identität
ergibt sich a us der Differen tialgleichung
Dies leite man nun ab und setze es gleich cot( ep ). Man erhält:
y'
2 · K · sin (ep) . cos(ep) . ep'
386
29 Das Brachistochronenproblem
Division durch y' (= co t(
=
. 2 d
und nun wird noch die trigono metrische Identität sin 2 (x ) berücksichtigt : 2· K .
dx
(~
-
~ . cos (2 .
~ -
~ . cos (2 . x )
. d
K· (1 - cos (2 ·
x (wegen x (O)
+ Cl
o muss
Cl
y
K· (
o gelten)
~ . sin (2 .
und
K · sin 2 (
(~
2 ' (1
-
~ . cos (2 .
- cos( 2 ·
Damit ist eine P arameterdarstellung der Lösungskurve gefunden. Leider ist es nicht mö glich, sp zu elim iniere n und den Term als y( x) hinzu schreiben , aber man kann dessen Um kehrfunkt ion als x (y) darstellen , indem m an den Term für y nach
x (y)
- -K . arccos 2
(2'Ky) 1 - --
-
VK
. y - y2
d2
K = ist d abei der Skalieru ngsfaktor und ist in dieser Formel a ls negative Länge a ufzufa ssen ; ferner ist d ie Kon st a nte C so zu wä hlen , dass sich fü r y = oz gerade x = bl ergibt . Die Kurve kann m an sich z. B . durch einen Funktionenplott er auf dem pe anzeigen lassen . Falls y ni cht automa t isch a ls Bezei chnung für die Ordinate ve rs tanden wird , erg ibt sich die korrekt e Da rstellung de r Lösungskurve durch Spiegelung an de r 1. Winkelhalbierenden y = x im Koordinatensyst em, siehe Abbildung 29 .3.
Nun sei no ch angemerkt , dass es sich bei die ser Kurve um den Anfang eines Zykloidenbogens handelt. Die Zykloid e erhält man graphisch , indem man eine n Punkt auf einem Kreis markiert , der ent la ng einer Geraden ohne Gleiten abrollt. Langzeitbelichtet e Aufnahmen eines roll enden Fahrrades mi t Sp eichen strahlern z. B. zeigen näherungsweise Zykl oiden als Leu cht spuren .
387
29.5 Abschluss y
4
x
~
\
i\.
<,
<,
i't ~
B
Abb. 29.3 : Die Lösungskurve ist Teil einer Zykloide.
Die se Lösung bleibt au ch dann die be ste , wenn das Verh äl tnis ~ un günsti ger ist , et wa der horizontale Abs t and von A und B meh r als 7f / 2-fach größer ist als ihr vertikaler. Der Zykloidenbogen wird fortgesetzt durchlaufen , bis im Falle 6.y = 0 ein vollst ändiger Durchlauf die optim ale Bahn darst ellt . Dabei liegt der ti efst e Punkt der Bahn unterhalb von B , siehe Abbildung 29.4. Durch den int ui tiv nicht nachzuvollziehenden "Gang durch den Keller" erg ibt sich der nötige Ge schwindigkeitszuwachs, um B schneller zu erreichen.
Y
A
x
~
\ I\.
"- -,
-,
./
i""'-.. i'-..
-... """-
~
,-
:...-..;
./
V
B
/'
Abb. 29 .4: Für lange hor izo ntale Strecken muss "durch de n Keller gegangen" werde n.
29.5
Abschluss
Wie ging der St reit zwischen den Gebrüdern Bernoulli weiter? Johann hatte das Problem in der be sag ten Fachzeitschrift veröffentlicht und be kam daraufhin eine Anz ahl Zuschriften , von denen die mei st en die korrekte Lösung en thielten . Die Lösungswege waren a ber hö chst unterschiedlich . Eine Zuschrift war anonym , do ch erkannte Johann sogleich "ex ungu e leonem " (an de r P ranke den Löwen) : Sie war von Sir Isaac Ne wt on hö chstpersönli ch verfasst , de r für seine mi serable Handschrift berüchti gt war. Später gab dieser zu , dass ihn Johann Bernoullis Problem "eine n ganzen Tag a ngest rengt en Nac hdenkens" geko stet habe .
388
29 Das Brachistochronenproblem
Jakob Bernoulli bracht e auch eine Lösung zust a nde und war sicher , den St reit damit zu seinen G unsten ents chiede n zu haben . Abe r J oh ann Bernoulli hat t e seinen wichtigsten Trumpf noch im Ärmel: E r fand eine bei weit em elega ntere Lösung, die a uf dem Fermatschen Prinzip a us der Op t ik beruht . Nach diesem durchlä uft ein Lichtbündel in eine m Medium mi t sich st etig ände rn der Br ech za hl n , die zur Lichtgeschwindig keit im Med ium um gekeh rt propor t ion al ist , den Weg m it der kürzesten aller möglichen Lau fzeit en . Dam it kann ma n nach dem Bre chungsgesetz des Holl änd ers W . Snellius (sieh e Ab bildung 29.5)
Abb. 29.5: Das Brechungsgesetz von Snellius: Beim Übergang zwischen Medien ändern sich mit dem Brechungsindex auch die Lichtgeschwindigkeit und der Winkel des Strahls zum Lot. Fermat erkannte, dass dieser Lichtweg immer die Laufzeit minimiert (Fermatsches Prinzip). Dieses Prinzip behält seine Gült igkeit auch im Falle sich stetig ändernder Brechzahlen n , weshalb es für die Lösung des Brachistochronenproblems herangezogen werden kann. und dem Zusammenhang n Z • y = const. ,
der in einem Medium die Brechz ahl stetig so regelt , dass sich de r Licht st rahl wie ein Körper unter Schwerk raft einfluss darin fort pflanzt , die Differenti algleichun g für die Lösung de s Brachistochronenproblems sofort angeben. Die Forderung y :s: 0 kann fallen gelassen werden , da sie in diese r Analogie nicht benöt igt wird: sin(a I) . nl = sin(az) . n z gilt üb erall, also ist sin (a rccot (y' (x ))) · n ~
VI + (y'(x))Z . Vy(x) ~ y' (x)
c c C z - y(x ) y(x)
Von dieser Gleichung war Johann Bernoulli bekannt , dass der Zykloiden bogen sie löst e. Dami t hatt e er den Bru de rzw ist im Hause Bernoulli für sich entschieden , den n kürzer geht es wirklich kaum!
Norberi En gbers ist Dipl.- Math. und ar beitet in Osnabrück.
30 Repunits, geometrische Summen und Quadratzahlen
Übersicht 30.1 Einige Sp ezialfälle
390
30.2 Hilfsmi t tel . . . . . . . . . . . . . . . .. . .. . . . . . . .. . . . . . ... . . . . ... . .. . . .. 392 30.3 Der Fall q
=3
395
30.4 Au sblick . . . . . . . . . . . . . . . . ... . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . . . . 404
Zah len , die nur a us Einsen best eh en , heißen repunits . Der Begriff ist zusamme ngesetzt a us repeated (wied erholt) und unit (Einheit) . Betrachtet man die Zahlen 11111 . . . in eine m Zahlensystem mit der Basis q, so scheine n diese kaum Quadratzahlen zu repräsentieren . Zumindest dann nicht , wenn sie mehr als zweistellig sind . Vor längerer Zeit wurde im Forum von Matroids Matheplanet üb er dieses Problem a usgiebig diskutiert, spez iell üb er die Basis 3. Da dieser Fall damals ohne aus reiche nde Lösung blieb , ste lle ich hier eine n An satz vor, der die no ch offenen Fr agen b eantwortet . Der Beweis ist nicht schwi eri g, erforde rt ab er et was Aus dauer und Geduld beim Nachvoll zieh en . Um das Ganze au ch für Anfänger leicht verständlich zu halten , betrachte ich zue rst ein p aar sim ple Spezialfälle, stelle zwei bekannte Standardmethoden zur Lösung solche r Au fgaben vor und betrachte da nn das Ker nproblern , "Basis = 3". Die m- st ellige Zahl 111 ... 111 im q-adischen System ist nicht s anderes als die geomet rische Summe m -I m 1 S(q ,m - 1) := "
L.J
k= ü
qk =
~. q -l
Also ist eine solche Zahl genau dann Quadratzahl, wenn es a uch S (q, m - 1) ist.
390
30 Repunits, geomet rische Summen und Quadr atzahlen
Dies führt zu folgender Problemstellung : Seien q , m E N mit q > 1 und m (q, m ) gibt es ein N E N mit qm - 1 2 -- = N
> 2. F ür
welche Paare
q -1
Vorbemerkungen:
(1) 0 ist bei mir keine natürliche Za hl , No := NU { O} (2) a == b(m) b edeut et a == b mo d m (3) Es sei stet s d E N , d > 2, d · (d - 1) quadratfrei (4) pT 11 n :<=? pT 1 n und pT+! f n
30.1
Einige Spezialfälle
Alle folgen den Aussagen bzgl. q, m und Lösbarkeit beziehen sich auf die vorgena nnt e Problemstellung.
Hilfss atz 30 .1 m = 3 ist nicht lösbar.
•
B eweis e N ===='?
q3 - 1 =- = q2 + q + 1 > q 2
===='? N ::::: q + 1 q -1 + q + 1 ::::: q2 + 2q + q ===='? Widerspruch
2
l
2
(
)2
o
Die Aus sage b ed eu t et , dass die repunit 111 zu kein er Basis q eine Q uad ratza hl ist .
Hilfss atz 30 .2 Seien r E {I , 2} und t ungerade. Da nn gilt : q = 2T
B eweis:
N 2 = S (q,m - 1) T
===='? 2
•
•
t ist nicht lösbar.
= 1 + q . S(q,m - 2)
t - S( 2T • t , m - 2) = N 2 - 1 = (N - 1) · (N
+ 1)
N 2 = S (2 T • t , m - 1) und S (2 T • t , m - 2) sin d ungerade. D ie rechte Seite ist da ru m durch 8 tei lb ar , die link e höch st ens durch 4. =} Widerspruch 0
391
30.1 Einige Spezialfälle
Hilfssatz 30.3 q = S ist nicht lösbar.
B ewers: .
Sei' -Sm-7 - 1
=
N2
.
Ist m = 2k , so ist di e linke Seite gleich Sk; 1 . (Sk
+ 1) .
Weil Sk - 1 und Sk + 1 teilerfremd sind und Sk + 1 nicht durch 7 teilbar ist, gibt es ein M E N mi t Sk + 1 = M 2 .
::::} Sk = (M
+ 1) . (M -
1) ::::} M = 3 ::::} k = 1 ::::} m = 2 ::::} Widerspruch
Sei nun m ungerade. Dann ist :
Sei d ein gemeinsamer Teiler von 2 m - 1 und (2 m)2
::::} d 122m
+ 2 m +1
Wegen d I 2 m
::::}
d I 2 m . (2 m
+ 2)
::::} d I (2 m
+ 2m + 1
+ 2).
1 ::::} d I 3 ::::} d = 3 V d = 1.
-
Weil m ungerade, ist 2 m
-
1 nicht durch 3 teilbar ve- d
Damit sind (2 m - 1) und (2 m)2
+ 2m
=
1.
+ 1 teilerfremd.
Nun gibt es 2 F älle zu betrachten: 1. Fall:
m 7 I (2 m - 1): Dann sind 2 7- 1 und (2 m)2
::::} Es gibt ein M E N mit (2 m )2 + 2 m
+ 2 m + 1 t eil erfremd.
+ 1 = M 2•
+ a + 1 = M 2 ::::} M 2 > a 2 a 2 + 2a + 1 ::::} Widerspruch .
Mit a := 2m ist dann a 2
::::} a 2. Fall:
2
+a+1 ~
7 f (2 m ::::} 2
m
::::} m
1): Dann gibt es ein ungerades M E N mit 2m
-
=
=
::::} .M
M
2
~ (a
+ 1)
1= M
-
2
•
m
+ 1 ::::} 2 == 1 + 1 == 2( 4)
1 und dies ist ein Widerspruch zu m
> 2. D
Hilfssatz 30.4 (3 ,5) und (7,4) sind Lösungen.
Erfolgt durch Einsetzen der Werte:
5
3 ; 1
= 121 = 11 2 ,
7
4
61
= 400 =
D
392
30 Repunits, geometrische Summen und Quadratzahlen
30.2
Hilfsmittel
30.2.1
Die Pellsehe Gleichung
Zur Lösung un seres Problems greifen wir auf ein bewährt es Hilfsmittel zur ück, die Pel lsehe Gleich ung.
D efi nit ion 30.5 Die Gleichung x 2
-
D .
y2
1 mit (x , y) E ;z,
X
;z, und D
E
;z, heißt Pellsehe
•
Gleichung .
In den folgen den b eiden Hilfssätzen werd en zwei Eigenschaft en der P ellsehen Gleichung angegeben . Diese Aussagen sind allgemein bekannt, wesh alb fü r die Bewei se auf Bundschuh [85] verwiesen wird .
Hilfssatz 30 .6 I st D qu adm tf rei, so hat die P ellsehe Gle ichung unendlich viele Lösu ngen (u , v ) E N x No.
D efi n it ion 30 .7 Die klein ste positive Lösu ng (u , v) der P ellsehen Gleichung (d . h. (u , v) E N x N und u minimal) , heißt Fun dam entallösung un d wird im Folgend en m it (uo ,vo) b ezeich net . •
Hilfssatz 30 .8 Sei D qua dratfr ei. Da nn ist fü r n E No j eder Lösungswert (u(n),v(n)) E N x No für (x ,y) von der Form: u(n) =
~.
( (u o + vo · VD)n + (u o - vo·
v(n) = _ 1_ . ( (u o + vo.
2· VD
Speziell ist (u (O) , v (O))
= (1,0)
VD)n -
und (u (l) , v (l))
VD) n)
(30 .1 )
(uo - vo · VDt )
=
(uo , vo) .
Um die P ellsehe Gleichu ng auf unser P roblem a nwenden zu kön nen , müssen wir sie allerdings noc h etwas verallgemeinern.
393
30.2 Hilfsmittel
Hilfssatz 30.9 S ei D := d· (d - 1) und
(I)
(30.2)
S ei (uo , vo) die Fundam entallösung der P ellsehen Gleichung
(II)
(1)
Dann sind alle positiven Lösungen für x von (I) gegeben durch
u(n) = mit A := Uo
(2)
1+
d- l
2
+ Vo . VD
Es gilt
V
d
.A n
+
V
1-
d -l
2
und B := Uo - Vo .
d
.B n
(30.3)
VD.
A·B = 1.
(30.4)
Beweis: (1) Setze in (I) für x, y : x = Xo + (d - 1) . yo und y = Xo + d . yo. Dann geht (I) über in: dxo 2
+ 2dxo' (d -
- (d -1) xo 2
{:} Xo
-
yo
2
2
.
-
l)yo
+ d(d -
1) 2 . Y0 2
2(d - l )xo' d·yo - (d -1)d 2
' Y 02
=1
d . (d - 1) . (d - (d - 1)) = 1
Damit lässt sich eine umkehrbar einde ut ige Beziehung zwische n (x , y) und (xo , yo) he rstellen, durch die jede Lösung von (I) gen au einer Lösung von (Ir) entspricht . Seien A und B wie ob en und u o(n) und vo(n ) die Lösungen von (Ir) . Dann gilt: Uo() n
1 = -1 . A n + - . B n 2
vo(n ) = =?
2
1 . An _ 1 . Bn 2·Jd .(d -1) 2 . J d. (d - 1)
u(n) = u o(n) =
.
sowIe
(! +
= d
2
+J
+ (d -
1) . vo(n )
d- 1 ) . An 2 .Jd .(d -1) d . (d - 1) . An 2d
+d-
Beweis von (2) wird zur Übung empfohlen!
+
(! _ 2
d- 1 ) . Sn 2 .Jd .(d -1)
J d . (d - 1) . B n 2d D
394
30.2.2
30 Repunits, geometrische Summen und Quadratzahlen
Rekursive Folgen
Hilfssatz 3 0. 10 (1) Seien s ,t E Z mit t
2
i= -
s4 .
+ 1) = s- r(n) + t - r(n -
Für eine Folge (r (n ))nEN sei r(n
1).
Dann gibt es a , b E IE., so dass gilt r(n) =a·An + b·B n mitA =
(2)
s +~ 2
undB =
(30.5)
s -~ . 2
+ Sund B = R - S. r(n) = a- An + b· B":
Seien a , b, R, S E IE. sowie A = R Für eine Folge (r(n))n EN sei Dann gilt
r( n mit s = A
+ 1) =
s . r( n ) + t . r (n - 1)
(30.6)
+ Bund t = - A . B.
B eweis : Folgt sofort durch Nachrechnen .
D
Hilfssatz 30 .11 Für D := d · (d - 1) sei (uo, vo) die Fundamentallösung der P ellsche n Gleichung x 2 - D . y2 = 1.
u (n ) mit n E No seie n die nichtnegativen Lösungen x der P ellsehen Gleichung d . x 2 - (d - 1) . y2 = 1. Mi t A := Uo + Vo . V75 und a =
1+
J
d -l
2
gilt:
d
(1) u(n) =
a· A 2 n
+1-
An
a
(30.7)
(2) u (n
+ 1) = 2 . Uo . u( n)
- u( n - 1)
(30.8)
395
30.3 Der Fall q = 3
B eweis:
(1) Mit R = Uo und S = Vo . v75 sind A = R
Aus (30 .3) folgt
u(n)
=
1+
j
d- 1 d .
2
An
+
j
1_
2
+ Sund
d- 1 d.
B
= R - S.
tr:
Da mi t sind die Vorau ssetzungen von (30.6) er füllt und (2) folgt m it u(n) wegen t = - A . B = 1 und s = A + B = 2 . Uo. u (O)
=
1
=}
b = 1 - asowie B
= 11-
wegen A · B
=
= r (n )
1.
o
E inse t zen in (30 .3) ergibt (1).
30.3
Der Fall q = 3
30. 3.1
m geradzahlig
Satz 30 .12 Sei m = 2k. Dann gilt: m
3 - 1 2 -
Beweis:
=
N
2
I r'os bar. . ist ni.cht
(30 .9)
Die linke Sei te läs st sich zerlegen und man erhält
"21 . (3k
- 1) . (3
k
+ 1) =
2
N .
Man erkennt: Beide Klammern sin d stets durch 2 t eilbar , hö ch stens eine aber ist durch 4 t eilbar. In sbesondere ist au ch N gerade . 1. Fa ll:
2 11(3k
-
1)
Dann sind 3'; 1 und (3k + 1) t eilerfremd. k 2 =} :3 M E N : 3 + 1 = M k =} 3 = }} f 2 - 1 = (M - 1) . (M + 1) =} M =} k = 1 =} m = 2 =} Widerspruch 2. Fall:
=
2
2 11(3k + 1) Dann sind 3'f1 und (3k - 1) teilerfremd . k 2 =} :3 M E N : 3 - 1 = M k 2 =} 3 = M + 1 == 1(4),, weil a us N gerade und ~ ungerade folgt , das s hi eraus folgt 4 1M2.
]1;[
gerade ist, und
396
30 Repunits, geometrische Summen und Quadratzahlen
== 1(4) ::::} k gerade, al so k = )2 _ 1 = M 2 ::::} W idersp ru ch
Also 3 k ::::} (3
t
2t D
30 .3.2
m ungeradzahlig
So leicht das Problem fü r gerades m zu lösen war , so schwierig erweist sich der a nder e Fall , m ungerade. Den Zug ang liefert die Pellsehe Gle ichung. Wir formen die Au sgangsgleichung um und erhalten eine Pellsehe Gleichung wie in (30 .2) : 3· (3 k ) 2 - 2 . N 2 = 1 -{:::::::} 3x 2 = 1
2l
Dies führt zu eine r Folge r (n ), die die x-L ösungen dieser Gleichung durchl äuft. Damit reduziert sich das Au sgangsproblem darauf, all e Folgen glied er r(n ) zu finden , die 3er-P ot enzen sind.
Hilfssatz 30 .13 Di e Folg e (r(n)) n EN sei gegeben mit: r(O) und r( n + 1) = 10 · r (n ) - r (n - 1).
= 1,
=9
r (l)
I st (k, N) eine Lö sung des Ausgangsproblems, also
32 k +1
-
1
-2-- = N
2
(30 .10)
dann gibt es ein n mit r( n) = 3 k •
.
B e w e is e Au s
32 k + 1 2
-
1
=
N
2
k 2
folgt 3 . (3 ) - 2 . N
2
=
1.
Damit ist 3 k eine Lösung der P ellsehen Gleichung 3x 2
-
(3 - 1) . y 2 = 1.
Nach (30 .2) ist damit die Fundame nt allös ung von
x2
_ 6y 2
zu suchen . Die se ist (5,2). Dami t sind A
1+
VI
a = _-:-'2
=1
= 5 + 2· V6 und
und
VI
B
= 5 - 2· V6 sowie
1b = --,-'2
und es gilt fü r Lösungen r( n) von x: r(n) =a·A n +b ·B n
(nach (30 .3) und (30 .4))
Wegen A . B = 1 folgt aus (30 .6) die Beh auptung.
D
397
30.3 Der Fall q = 3
Folgerung: Für die gesuchten Lösungen gilt also : (1) (2)
Sie sind in der Folge der r(n) ent halten . Es gibt passende n, so dass die Lösungen von der Form
a . A 2nAn + 1 - a sm . d , m it . a , Awie ' 0 b en m . (30 .7) . Die in der Folgerung bei (2) angegeb en e Darstellung der Folge r(n) lässt sich in unser em sp eziellen Fall mit A = 5 + 2 . j6 ver einfachen .
Hilfssatz 30.14 Mit A ;= 5 + 2 . j6 gilt: r(n)
Beweis:
Es ist : a=
1
= A +1
1 + /2 V"3 2
=
5 +2 ·j6 6 + 2· j6
A A +l
Mit (30 .7) und (30.8) folgt r(n) =
.
A 2 n +1 +1 An
(30.11)
~ . (3 + j6) 6
6 +2·j6
-----,--,,-----'-- = a
12
---..e'L . A 2 n + 1 _ ---..e'L A +l An A +l.
o
J etzt werden wir die Folge r(n) genauer betrachten. Man erkennt schnell eine Besonderheit: Es sind r(l) durch 9, r(1 + 3) durch 27, r(1 + 3 + 9) durch 34 teilbar usw. Um dies allgemein nachzuweisen , wird im folgenden Satz 30.15 gezeigt werden, dass von diesen speziellen Folgengliedern jedes das jeweils nachfolgende teilt . Und als wesentlicher Teil wird dabei noch gezeigt , dass der Quotient der beiden Folgenglied er st ets durch 3, nie aber durch 9 teilbar ist . Daraus ergibt sich sofort 3 t +2 I r(1 + 3 + ... + 3 t ) .
Satz 30.15 Zu jedem t E N gibt es ein c(t) E N mit 3 f c(t), so dass gilt :
t+ _1) 3 ( 1
r
2
= 3· c(t) . r
(3t -l) - 2-
(30.12)
30 Repunits, geometrische Summen und Quadratzahlen
398 Beweis:
Aus Satz 30 .14 ergibt sich:
r
(3t+
1
- 1 ) = _ 1_ .
A +1
2 t
undr(3 -1) = _ 1_ i 2 A +1
A2'( ~ )+1+ 1 =
3t
A 3'+; -1
'A
1
_ 1_ . A +
+1
A 3'+; -1
A +1
3t
+1 A 3'; 1
r( 3t +~ - 1)
1
=} ----'' - ; - --c-'-
r
(321) t
Setze X = X(t) := A 3 ' . Dann ist
r(~)
+1
3
X
1
.
1
= - · - - = X- 1+ X X +1 X · r( 3'2 1)
Es ist offensichtlich X = v
1 X
+ ui - yI6 mit
v = v (t ) E N und w = w(t) E N.
v- w · y16
=} - = --.,,---~
=}
X -I
v2
6 · w2
-
+~ = v -I + 2 X v -
Wegen
r(~) r
(3'2
1
v
6 . w2
E Q =} v
2
-
+ v'6 . w . (1 _
6w
2
= 1, da w
i-
v2
-
1 ) 6 . w2
0
)
folgt
X -I Damit haben wir
= 2v - 1 E N .
(3+ 2 1) = (2v - 1) · (3- 2-1) . t
r
1
+X
t
1
t:
Es bleibt zu zeigen: 3 11 (2v - 1). Hierzu zeigen wir: v
== - 1(9).
Für t = 1 ist X = (5 + 2 · yI6)3 =} V = 125 + 3 · 5·4·6
t -+ t + 1 : Sei A
3t
= v
+ ui - v'6 und v == 3t
- 1(9).
v(t + 1) + w( t + 1) . v'6 = A + = (A 3' )3 = (v =}
v(t + 1) = v
3
1
+ 18vw == 2
== 125 == - 1(9).
( _1)3
+ ur- v'6) 3 == - 1(9)
(n ach lnd.vor.)
399
30.3 Der Fall q = 3 ::::} 2v - 1
==
- 2 - 1 == - 3(9) ::::} 3 1 (2v - 1)
::::} 2v- 1= 3· c(t ) mit 3 fc(t) D
Satz 30.16 Für t E N gilt :
3+ I (3 3+ f r (3 t 1
(1)
t
(2)
Beweis:
2
t
t:
t
~ 1)
(30.13)
~ 1)
(30.14)
Wegen r(l) = 9 ist dies klar für t = l.
t -+ t + 1: Dies folgt sofort au s Satz 30.15 .
D
Für eine n klein en Teil der Folge r(n) wissen wir nun , wie die 3er-Poten zen verteilt sind. J etzt werden wir den groß en Rest betrachten und zeigen, dass dieser für die Teilbarkeit durch 3 "vernachlässigbar" ist . Vernachlässigbar heiß t in diesem Fall , das s eine be stimmte 3er-P otenz als Teiler jeweils das er ste Mal in der oben be trachteten Teilfolge a uft ri tt und in keinem Fall früher («). Daraus läss t sich dann ein Zusammenhang zwische n der Teilbarkeit durch eine 3er-Poten z und der Größe der Folgen glied er her st ellen , welch er let ztendlich den gewünschten Wider spruch liefern wird. Die Unter suchung dieses Re sts der Folge wird mi ttels eines geeigneten Siebverfahrens durchgeführt . Man zeigt schnell, das s gen au jedes drit te Folgenglied de r r( n) durch 3 teilbar ist . Also kon struieren wir eine Teilfolge, die nur au s diesen Gliedern besteht , und teilen diese durch 3, je tzt beim erst en Mal sogar durch 9. Die Eigensch aft , das s genau jedes dri t te Folgenglied durch 3 teilbar ist, vererb t sich, wir wählen wieder nur die se a us, teilen wieder durch 3 usw. Dieses Siebverfahren liefert uns die gewünschte Eigenschaft (*) . D efi nition 3 0. 1 7 Für k E No seien folgende Folgen definiert: ro(n) := r(n) r l (n ) :=
1
9" . ro(3n + 1)
rk +l(n) :=
~ . rk(3n + 1) für k ~
1
•
400
30 Repunits , geometrische Summen und Quadratzahlen
Hilfssatz 30 .18 Für k ?: 1, n ?: 0 gilt: rk (n)
B eweis :
1 ( 3 +
k
1)
3 -= -k -1 . ro 3 k . n + -
2
(30.15)
Für k = 1 folgt die Aussage direkt a us de r Definit ion .
Sei k ?: 1 und es gelt e rk (n) ::::} rk+ d n)
1 (
=- . ro 3k + 1
3k . n
1)
k
3 -+2
= :31 ' rk(3n + 1) = :31 ' 3k1+ 1
1+ (
= -k . ro 2
3
3 k +l . n
( k ' ro 3 . (3n + 1) k
+ 3 k + -3 2--
1)
+ -3
k
- 1) 2-
.
o
Hieraus folgt sofor t die Beh aup t ung. Zuer st brauchen wir einige t ech nisc he Eigensc haften dieser Teilfolgen.
Hilfssatz 30 .19 Es gilt: 1)
(1)
rk(n)
= ak' A . + bk ' A
(2)
Fü r' k
>
3k
B eweis:
a (k)
(
+ 1) =
·n
mit ak ,bk E IE.+
a(k ) . rk( n) - rk(n - 1)
== - 2(9) für k ?: 1
Zu (1) : Für k
(30.16)
A
(30.17) (30.18)
= 0 ist dies klar, de nn nach Satz 30.14 ist
ro( n ) = - - . An A + 1
k.-» k + l :
k 3
1,n?: 0 existiert ein a(k) E N\ {1} mit
rk( n
(3)
n
(1) n A
+ -1- . A + 1
401
30.3 Der Fall q = 3
i- der Bruch i zu setzen.
F ür k = 0 ist st at t
Zu (2): Die Exist enz eines solche n a(k) folgt au s (30.16) und (30.6).
Damit bleibt die Gan zzahligkeit a(k) > 1 zu zeigen. Für k = 0 ist a(k) = 10. Sei nun a(k) E N\{ I }. Na ch (30.6) ist
a(k) = A c> a(k + 1)
3k
+ (~) 3
k
~ A,H' + (W'" ~ V)' + (m")'
~ (A" + (~) " ) . ( (A" + (~) ") ' - 3) 2
=a(k) . (a (k )- 3) :::: 2· (4- 3). Z u (3): a(l) = 970
== - 2(9). Der Rest ist durch Induktion klar.
D
Nun gehen wir daran zu zeigen , dass gen au jedes dritte Folgenglied der rk(n ) durch 3 t eilbar ist , ro(n ) sogar durch 9.
Hilfssat z 30.20 Sind rk(O) und rk(l) E N und ist r k(O) nicht, wohl aber rk(l) durch 3 teilbar, dann gilt:
(1)
rk(n) E N für alle n E N
(30.19)
(2)
3 I rk(n) ~ n == 1(3)
(30.20)
(3)
9 I ro(n ) ~ n
== 1(3)
(30.21)
B eweis : Seien rk(O) und rk(1) wie vorg egeb en . Au s der Kon struktion der rk(n) folgt rk(n) > O. Da rk(O), rk(l) und a(k) E N, folgt rk(n) E Z nach (30.17) . Daraus folgt (1). Es ist rk(O)
== ± 1(3) und rk(l) == 0(3) .
Na ch (30.18) ist a(k) == 1(3) .
:::} rk(2) = a(k) . rd l ) - rk(O) == 1·0 - (±1) == =F 1(3)
402
30 Repunits, geometrische Summen und Quadratzah len =?
rk(3) = a(k) . rk(2) - rk(l) == 1· (=t=1) - 0 == =t= 1(3)
=?
rk(4) = a(k) . rk(3) - rk (2) == (=t=1) - (=t=1) == 0(3)
Der Rest folgt durch Induktion. Aus
r(n + 1) == r(n) - r(n - 1)(9) , r(O) = 1 sowie r(l) == 0(9)
== - 1(9) =? r(3) == - 1(9) und r( 5) == 1(9) =? r(6) == 1(9) .
folgt r(2)
=?
r( 4) == 0(9)
o
Der Rest folgt induktiv.
Der einschränkenden Vor aussetzungen für die rk (n) bei Hilfss atz (30 .20) werden wir uns jetzt ent ledigen: Satz 30. 21
ro (n) E N \I n ist klar.
Beweis: =?
r l(O)
Tl (4) =
=
1, Tl(l)
=
969 und rt(n) E N \I n .
i· rl (3) ist gen au durch 9 teilbar nach Satz 30 .16. Damit ist rz (0) nicht,
wohl a ber r2(1) durch 3 teilbar.
k --+ k + 1: Seien nun rk(O) nicht , wohl aber rk(l) durch 3 t eilbar. Damit sind nach (30 .19) all e rk(n) E N. Nach (30.15) ist rk(l)
=
1 (3+ _1) k
3k+ 1
.
ro
I
2
.
Damit ist nach Satz 30 .16 rk(1) genau durch 3 t eilbar .
~ . rk(l)
Also ist rk+I(O) =
Ent sprechend ist rk (4)
=
nicht durch 3 t eilbar.
1 (3+ 1)
3 k + 1 . ro
k
2
2-
und damit durch 9 teilbar.
Al so ist rk+I(1) durch 3 teilbar . Damit sind nach (30 .19) a lle rk+l(n) E N.
o
Hilfssatz 30.22
3
k
11
r( n) =?:3 t
E
No mit r k- l (t ) = 31k . r(n)
(30 .22)
403
30.3 Der Fall q = 3
Für k
B eweis : Sei 3k+
1
11
= 2 ist die s offensichtlich richtig. Sei k > 2.
r(n) =} 3 k 1 r (n )
=}:3 t E No mit rk - l (t ) =}3
11
= 31k . r (n ) (nach l nd .vor .)
rk -dt) =} :3 to E No mit t = 3 · to
+ 1 nach
(30.20) . D
Hilfss a tz 3 0. 23
3
B ewei s :
k 1
r(n) =} n ~
3k -
1
_l
2
= 31k . r(n) .
Aus (30.22) folgt: :3 t E No mit rk -l (t)
1
(30.23)
1 (3 _1) k
=} 3 k . r(n) = rk -l( t) ~ rk - l(O) = 3 k . r Wegen der Monotonie von r k, t
~
-
1
2
.
0 und (30.15) folgt
(3 1) k
r(n) ~ r
-
1
2
.
Aus der Monotonie folgt die Behauptung.
D
S atz 30 .24 Für n > 1 ist r(n) keine 3er-Potenz.
B eweis:
Aus r (l)
= 9 und der Monotonie folgt r(n ) =I- 1; 3; 9 für n >
1.
Sei nun k > 2 un d r(n) = 3 k . (30.23) =} n ~
3k -
1 -
2
1
(30. 11) =} 3 k = _ 1_ . A
A+ I
2n 1 + + 1 > _ 1_ . An+1 An A +1
A = 5 +2 ·Vß =}9
k 1_ k 1 > -1 . 9-3 - 2- l = -1 . 33 - _l > 3
11
=}k > 3 k -
Dies ist offensicht lich falsch .
1
-
11 4 =} k + 4 > 3 k -
3k- I -
4
1
D
404
30 Repunits, geometrische Summen und Quadratzahlen
Satz 30.25 Sei m = 2k + 1. Dann gilt : 3m - 1
- -- = N 2
2
ist ni cht lösbar.
(30 .24)
Beweis: Nach Hilfssatz 30 .13 muss es zu eine r Lösung (q, m) ein n mi t r( n) = 3 q geben. In Sa tz 30. 24 wurde gezeigt , dass es so eines für ungerade m ni cht gib t . D In sgesamt haben wir geze igt, dass mit Au sn ahme von l l Ll Is kein e repunit zur Basis 3 mi t mehr al s 2 Stellen (m > 2) eine Quadratzahl ist. Die repunits 13 = 1 und 113 = 4 sind nämlich Quadratzahlen, wir hatten ab er in unser er Problemstellung und für all e weiter en Unter su chungen St ellen zahl m > 2 vorausgeset zt .
30.4
Ausblick
Das Problem, wann die geometrischen Summen Quadrate ergeben , war für mich ein Zeitvertreib , eine Art Kreu zworträtsel für Mat he matiker. Wer mag, kann a uch a ndere Basiszahlen q b etrachten . E ine einfache Lösung für die Verallgemeinerung auf beliebige Basiszahlen gebe ich in [83]. W . Ljunggren ver all gem ein erte das Problem von Quadratzahlen auf beliebige natürliche P oten zen sowie b elieb ige Basiszahlen und gibt eine Lösung in [82].
R einhard Briinner ist Dipl. Math . und lebt in Bayern .
31 Irrationalität von e und
tt
Übersicht 31.1 Einleitung
405
31.2 Die Irra tionalit ät von e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406 31.3 Die Ir rationalit ät von
31.1
7r . • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • ••
408
Einleitung
Jeder von uns kann es wohl im Schl af aus wendig sagen: Die Zahlen e und 7r sind nicht nur irrational , sondern soga r tran szendent , also nicht algebraisch über Ql. Ich möchte in diesem Kapitel für die b eid en "Klassiker" e und 7r die Eig enschaft der Irrationalität zeigen . Im a nschließen de n Kapitel werde ich dann eine n Beweis für di e Transzenden z von e angeb en , der noch mit eleme nt a ren Mit te ln (Arithmetik und Integralrechnung) au skommt. Für den Beweis der Transzenden z von 7r werden ent weder der Sat z von Lindem ann-Weier straf od er ab er einige Kenntnisse üb er symmetrische Polynome vor auszu set zen sein . "E lementar" ist hier ni cht als "t rivial" oder "einfach nachzuvollziehen" zu verstehe n, sondern bezieht sich au f die verwendeten Hilfsmittel au s Ari thmetik, Algebra und In tegral re chnung, die - wenigstens im Prinzip - dem Schüler der Oberstufe bekannt sein sollt en.
Definition 31.1 (Rationalität, Irrationalität) Eine reelle Zahl x heiß t rational , wenn sie als rat ionales Verhältnis zweier ganzer Zahlen dar stellbar ist, d . h .: :3 p , q E Z, q
i= 0 : E =x q
Die Men ge der ration alen Zahlen wird mit Ql b ezeichnet. Reelle Zahlen, die nicht rational sind, heißen irrational. Die Menge JR\Ql der irrationalen • Zahlen b ezeichnet man mit TI.
406
31 Irrationalität von e und rr
31.2
Die Irrationalität von e
Die E ulersche Zahl e sei wie üblich de finie rt als der Grenzwert der Zahlenfolge
(1 + ~)
n
n,
EN.
Satz 31.2 e ist eine irra tion ale Zahl .
Wegen (
1+
~) n n
=
~
L...-
k =O
(n)k ....!..-n
~
=
L...-
k
k=O
n.(n - 1) k!. . .. ..n (n - k + 1) k
gilt im Gren zwert n -t 00 (di e maßgeblichen klein en k werden im Ver gleich zu so klein , dass die 1, . .. , k + 1 im Gren zwer t wie beh andelt werden können und sich geg en n k her auskürzen) die Darstellung
n
n-
n-
n
n
e
1
= n--+(X) lim I: k 1. ' k =O
a uf die der folgende Beweis gest üt zt ist . W ir verw enden a uch, dass e keine ga nze Zahl sein kann , weil man a bs chätzen kann , dass 2 < e < 3.
B eweis:
Es sei an genommen , dass
es gäbe also p , q E N mit e
=
~.
=
1
I: k! E Q, 00
e
k =O
E s ist dab ei q ?: 2, de nn e ist keine ga nze Zahl.
Dann kann man die Summe zerlegen in q
e
1
= s + t mit s = '" und t L...- k! k =O
00
I:
k =q + 1
und schätzt t a b mi t t els: 1 (q + I )!
<
1
(q + I)!
00 (q + 1)! I: (q ,=0 + 1 + i )!
I: (q + 2)k k =O
1
(q + I )!
1
00
1 1-
_1_
q+ 2
1
k!
407
31.2 Die Irrationalität von e 1
q +2 q +2 -1 1 q +2 (q + 1)2 q! 1 q +2 q2 + 2 . q + 1 q!
(q + I )!
<
F ür b
q+2 q2 + 2 . q 1 1 q q!
<
(e - s ) . q . q! gilt al so 0
b
1 q!
b
1
q
e
1 und som it
~
= E """" k! + q = 'L
q .q!'
k=O
Man multipliziert a uf beiden Seiten mit q! :
v
(q - I) !
1 k'
L q
=
q!.
k=O
b
+-
q
'
Nun st eht links eine ganze Zahl. Da all e Nenner in der Summe Teiler von q! sind, ist das q!-fache der Summe ebenfalls ganz . Demnach muss au ch % ganz sein , b a lso ein Vielfaches von q. Wegen 0 < b ~ 1 und q ~ 2 ergibt sich ein Wider spruch . 0 In diesem noch sehr einfache n Beweis zeigt sich b ereits das Beweisprinzip , das au ch im Folgenden verw endet wird: Au s alg ebraisch en Gründen ergibt sich, dass ein Au sdruck gr ößer sein mu ss, a ls er aus a nalyt ischen Gründen sein darf. Historische Anmerkung
Die Irrationalit ät von e wurde von Johann Heinrich Lambert 1767 erst m als geze igt. E r verwendet e für seine n Beweis die Kettenbruchentwicklung von e. Diese ist im Übrigen bemerken swer t ; es gilt : e -1
1+ - 1+
-
1 -----,---
2+ 1 +
\
-
1+ 4 +
1
-
-
1I
l+ ~ 1+ ~
[1; 1,2,1,1,4,1,1,6, .. .]
(Euler)
Eine weiter e bemerken swerte Kettenbruch-Darstellung mit e: e-l- I
e- 1
2+
1
6 + 10+
1
11 14 + 18 + .. .
[2; 6,10,14,18, . . .]
(eb enfalls Euler)
408
31 Irrationalität von e und 11"
31.3
Die Irrationalität von
7r
Nun möchte ich die Irrationalit ät von 71" nachweisen. Dazu wird die charakterisie rende Eigenschaft verwendet , dass die Vie lfachen von 71" die Nullstellen der Sinusfunktion und die Extremstellen des Cosinus sind.
D efinition 31.3 (11" n a ch E . Landau, 1934) Die Funktion 00
.
sm : JR --+ JR , x H
""" ~
k =O
(-1 (k 2
)k
+ 1)1. . x
2k +l
ist periodisch und b esitzt un endlich viele Nullstellen . Die kleinste positive • Nullst elle von sin heißt 71" .
S atz 31.4 71"
ist eine irrationale Zahl.
B eweis: Es wird 71"2 rf- Q bewiesen, woraus die Behauptung sofort folgt. Dazu definiert man ein Polynom 2n -ten Grades
o und
für r
1 sind n-fache Nullstellen von
<
n ; für r
>
i, daher gilt
2n gilt dies sowieso .
Für die übr igen Ab leitungen von
f
gilt
(n) .(n(k +_ r)!k )! . ( _l )k . x k -r .
.~ f (n+r )( X ) = ~ n! Z:: k k =r
Dieser Ausdruck ist für x = 0 stets ganzzahlig, was a ufgru nd der Achsensymmetrie von f bzgl. x = 1/ 2 a uch für x = 1 gilt . Also gilt
Man nehme nun an ,
71"2
sei rational, also
71"2
=
~ mit p , q E N.
Man bildet a us den Ab leitungen, die für x = 0 und x = 1 ganzzahlig werden, den für x = 0 un d x = 1 ebenfalls ganzzahligen Ausdruck
409
31.3 Die Irrationalität von Jr
n
2:) - 1)i . Jr 2(n-j) . /2 j )(x) ,
qn .
n E PT b eliebig.
j=ü
Nun leitet man F~(x)
. sin(Jrx) -
tt
>
Fn(x) . cos(JrX)
nach x ab . Die Absicht dabei ist, es später als Ableitung von etwas anderem identifizieren zu können . Man erhält
+
F;: (x) sin ( JrX)
JrF~ (x) cos( Jrx) - JrF~ (x) cos( JrX)
+ Jr2 . Fn(x))
(F;:(x)
+ Jr2Fn (x) sin( JrX)
. sin(Jrx) .
Bei der Au swer tung dieses Ausdrucks heben sich alle Terme mit Ableitungen von f gegenseitig weg:
qn .,in(.x).
~ qn . sin]
(~( - 1)' . 'n-', P H')(x) +.' ~(_1),.,n-" !"''(.r»)
tt:z )
(~( _ 1), . ' n-' , !"'H) (x) + ~(-1)' .'n-'H' P' )(r)) n
= qn . sin(Jrx) . 2:) _ 1)j Jr2n- 2j / 2H2\x) j =ü n
- qn. sin (Jrx) . 2) _ 1)i- 1Jr 2n- 2(j-1) /2 j -
2+ 2)(x)
j =ü
~ qn 'in(n) (~( - 1)'
.'(n-j)
p H''(.r) -
;~,< - 1)' .'i
n
- , )
!,'H')(r))
= qn. sin(Jr x). (Jr2n +2. f( x)) = pn . Jr2 . f( x). sin(Jr x) Von der drittletzten zur vorl et zten Zeile verschwindet der Term für j = n, da alle höheren als die 2n-te Abl eitung von f verschwinden. Die Terme für 1 :s: j :s: n -1 elim iniere n sich gegens eitig, und es bleibt nur no ch derj enige für j = - 1 übrig. Da
f
auf [0, 1] nur Werte zwische n 0 und ~! annimmt, folgt, dass
o< Also gilt wegen 0
:s:
sin (Jrx)
o<
1 1
o
f(x) dx
<
~ . n.
:s: 1 auf [0,1] auch
1 1
f(x) . sin(Jrx) dx
<
1
n!
410
31 Irrationalität von e und
und also
o<
1 1
pn . it : f (x ) . sin (1rX) dx
7r
<
W ählt man n gro ß genug, so kann also
1 1
pn . 1r' f (x ) . sin (1rx ) dx
< 1
erreicht werden .
Jo1 pn . 1r . f( x) . sin (1rx) dx ist a ber nach dem Vorausgegangenen das Integral de r Ableitung von F~( x)
. sin (1rX) - 1r' Fn(x) . COS(1rX) 1r
üb er dem Intervall [0,1], also gleich der Differen z der Randwerte
[ F~ (X) .1rsin (1rx)
-
F n () X
F~ ( I ) · 0 _ Fn(l) . (-1) t:
Fn(l)
+
( )]
• COS 1r X
1
0
F~(O) . 0 + Fn(O) . 1 1r
Fn(O).
Dies ist ganzzahlig, kann also nicht zwischen 0 und 1 liegen : Widersp ru ch!
0
Hier b ekommt man eine Vorstellung davon, wie schwierig es sein kann, die Irrationalität nicht-alg ebraischer Au sdrücke nachzuweisen : Zunächs t völlig undurchschaubare , eigens zum Zweck kon struierte pol ynomiale Au sd rü cke werden definiert , die se werden dann an al ytisch nach oben a bgeschätzt , während die algebraische Behandlung eine kon träre Ab schätzung nach unten liefer t . Die se Met hode ist dabei t rotz de r absch reckenden Terme no ch als elementar zu bezeichnen , da man die Hilfsmi t tel Ableiten , In tegrieren , geometrische Reihe et c. noch in der Schule bzw. in den ersten Sem estern eine s Studiums lernt.
Historische Anmerkung Erstmals wurde die Irrationalität von 1r 1761 bewiesen, und zwar ebenfalls von Johann Heinrich Lambert . E r kam damit Euler um 14 J ahre zuvor , der die s er st 1775 vermutet hatte . Au ch vermutete Lambert damals bereit s, dass 1r ni cht Nullstelle eines Polynoms mi t ganzzahligen Koeffizienten sein könne. Die Theorie der algebraischen Zahlen und de ren Gegensatz , de r tran szend ent en Zahlen, war zu der damaligen Zeit a ber er st im En tstehen . Wenn man heute die Irr ationalität von e und 1r vorausset zt und verw endet, wär e es angebracht, kurz a n die Leistung des Herrn Lambert zu denken .
Norb eri Engbers ist Dipl.-Math . und lebt in Osnabrück.
32 Transzendenz von e und tt
Übersicht 411
32.1 Einleitung
32.2 Die Tr anszenden z von e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 412 32.3 Die Tr anszenden z von
32.1
Ir
416
Einleitung
Transzendenz ist ein Beg riff, den die Ma thematik au s de r Philosophie en tlehnt hat , wo er "das die Vernunft Übersteigende" bedeutet . Transzendent ist das, was de m definierenden, b eweisenden und erklärenden Gei st unzugän glich bleibt , z. B . das Göttliche . In der Algebra und der Zahlentheorie versteigt man sich lieber nicht zu solchen Höhen und spricht von trans zendenten Elementen über Kö rpern od er allgeme in üb er Ringen, wenn diese ni cht als Nullst ellen von Polynomen üb er diesen Strukturen beschrieb en werden können . An der Herausbildung des mathem atischen Transzenden zb egriffs waren Johann Heinrich Lambert und Leonhard Euler b et eiligt. Der erste , der eine konkret e Zahl als transzendent identifizieren konnte, war Joseph Liou ville, der dazu sein E rgebnis über die rationale Approx imierbarkeit alg ebraischer Zahlen verwende t e, das ver einfacht lautet: E ine algebraische Zahl lässt sich nur mit b egr en zt er Gen auigkeit durch rationale Näheru ngs brüche mi t beschränktem Nen ner ap proximieren . Ist die Zahl b esser durch Brüche approximierbar, so ist sie also transzendent. Das trifft für die Liouvillesche Zahl
L
00
l :=
1O-
k1
= 0 ,110001000000000000000001000...
k =!
zu. Geor g Cantor b ewies dann auf nichtkonstruktivisti sch e Art die Exi st en z von üb er abzählbar vielen transzendenten Zahlen in IR , indem er die Ab zählbarkeit der Menge der algebraischen Zahlen üb er (Ql nachwies.
412
32 Transzendenz von e und
1["
D efinition 32.1 (Algebraizität, Transzendenz) Eine Zahl z E C heißt algebraisch über dem Körper K C C, wenn ein Pol yn om p E K [X ]'p -=1= 0, p
=
ak .
X
k
+ a k- l
.
X
k
-
1
+ ... + a a ,
exi stiert , das z a nnulliert, d . h . p(z) = O. Dabei spricht man von einer algebraischen Zahl k -t en Grades über K, wenn es ein z annullieren des Pol ynom p E K [X ] gibt , das den Grad k hat , und es kein P olynom ger ingeren Grades gib t , das z a nnulliert . E in solches p minimalen Grades heißt das Minimalpolynom von z, wen n der Leitkoeffizient von p a uf 1 no rmiert ist . Die Menge der alg ebraischen Zahlen üb er dem Körper K wird mit K b ezeichnet und bildet ihre rseits einen Körper. Besit zt das Minimalpolynom eine r algebraische n Zahl z nur Koeffizienten , die in K ga nze Zahlen sind (b eispielsweise au s Z im Fall K =
Die Algebraizi t ät reeller und komplexer Zahlen ist eine naheliegende Verallgemein erung der Rationalität, denn rationale Zahlen annullieren lin eare Polynome der Form q . X - p . Rationale Zahlen sind also algebraische Zahlen vom Grad 1. Im Prinzip nimmt man bei den Tr anszenden zb eweisen daher die gleiche Vorgehensweise wie in den vorangegangen en Beweisen der Irrationalität : Annahme des Gegenteils, d . h . der Existenz eines Minimalpolynoms, Bast eln eines Funktionals aus dem Minimalpolynom, dessen an aly tis che und alg ebraische Abschätzungen eina nde r widersprec he n - und fertig ist der Beweis.
32 .2
Die Transzendenz von e
Los geh t es wieder mi t dem leichteren der beiden F älle , der Transzendenz der Eulerschen Zahl e.
413
32.2 Die Transzendenz von e
Satz 32.2
Die Zahl e ist transzendent.
Als Vorbereitung für den Beweis definieren wir für eine reelle Zahl t und ein beliebiges Polynom f E C[x] mit n
I: a
f (x)
x
j .
j
,
an
#0
j =O
das Funktional
{t t- u e ·f(u) du.
J
It(t) :=
o
Anmerkung: Diese Definition gilt a uf natürliche Weise auch für komplexes t , da der Integrationsweg in der komplexen Zahlenebene wegen der Holomorphie des Integranden keine Rolle spielt. Im zweiten Teil dieses Kapitels, in dem die Transzendenz von 7r bewiesen wird , wird davon Gebrauch gemacht .
It(t) wird mittels partieller Integration ausgerechnet ; man erhält [_ et - u .! (u )]: _ e o ·f (t )
- f (t )
et
.
+
-l
t
-et- U f (u ) du [_e t - u f(u) ]:
+ e t · f (O) + et · f (O)
+
(-J'(t)
+e t
f(O))
l l
t
t
- et- u f ' (u ) du _ et -
u
f'(u) du
I: f(j)(O) I: f(j )(t) , n
n
j =O
j =O
wob ei höhere Ableitungsgrade als n = grad j' nicht auftauchen. Die analytische Abschätzung für It(t) soll allgemein durchgeführt werden, d. h . so, dass sie auch für den Transzendenzbeweis für 7r, wo komplexwertige Argumente auftreten, verwendbar bleibt. Es handelt sich um die Standardabschätzung "B etrag des Integrals ist kleiner oder gleich der Länge des Integrationsweges mal das Maximum des Betrages auf diesem Weg", die man auf den geradlinigen Weg in C von 0 nach t anwendet. s E [0,1] ist ein reellwertiger Paramet er.
1 t
II t (t )1
t u e - ·f(u)
1 et 1
<
s
.
t
dul
· f (s· t) · tds l
1 · Itl · max
0:0;8:0;1
le . ( 1- S) ·f(s· t) 1 t
32 Tra nszendenz von e und tt
414
< Itl ' max le t . ( 1 - s ll· max If (s· t )1 O~ s ~ 1
< Itl '
O ~ s ~1
max e lt . ( 1- 8 l l . max j(s'
O ~ s ~1
O ~ s ~1
Itl)
Ill ·elt l .]( Ill), wobei das Polynom j(X) E ~[X] ist mit n
j(x) =
L
lajl ' xj .
j =o
Da in j (X) alle Koeffizienten positiv sind, ist es a uf ~ 2: o streng monoton wachsend, wird sein Betrag für reell-positive Argumente kalkulierbar maximal und liegt das Maximum von j (u) am rechten Rand des Integrationsintervalls. J et zt kann man die Transzenden z von e beweisen : Beweis:
grad
f =
Es wird a ngenom men, e sei Nullstelle eines Pol ynoms g E Ql [x], r > 0, also
g(x) = bo
+
b1X + ... + br . z " , g(e) = O.
Dieses Polynom mit rationalen Koeffizienten kann durch Mu ltiplikation mi t deren Hauptnenner in eine s mit ganzzahligen Koeffizienten üb erführt werden , so dass wed er die annullierende Eigenschaft verloren geht noch sich der Grad ändert - die Normiertheit bleibt aber im Allg emeinen nicht erhalt en. O . B . d . A. werden also im Folgenden die Koeffizienten von g als ganzzahlig angenommen : g E Z [X ]. Man wählt eine Primzahl p > ma x (r, Ibol ) (man wird später die Exist en z un endlich vieler Primzahlen derart ausnutzen , dass p beliebig groß gewählt werden kann) und definiert ein Pol ynom f mittels
Es gilt: grad
f
=
(r
+ 1) . p
-
1 =: n
Des Weiteren sei ein Funktional defini ert:
Es ist
1;, (bk' » ,~ J' b, .~ J'j)(k) ) (1;, bk e').(~ /''(O)) L L bk' (0) -
r
n
k =O j =O
r
n
- L Lbk' f k =O j =O
j)(k) .
f Ul (k)
41 5
32 .2 Die Tra nsze ndenz von e
o ist
(p - 1)-fach e Nullstelle von f ; 1, ... , r sind p- fach e Nullst ellen von f . Es bleib en von der Doppelsumme übrig: n
L
i, = -
,..
n
k= l
j =p
L L bk ' jCj )(k)
bo · l j )(O)
j =p-l
Da in dieser Doppelsumme die p-te und höher e Abl eitungen eines Polynoms nt en Grades, n > p , mit ganzzahligen Koeffizienten st eh en , sind alle Summanden durch p! t eilbar (ein Vielfaches jed es Faktors aus p! find et sich in der Folge der Exponenten von x , die vor den Koeffizienten au s Z mu ltipliziert werden) . Der erst e Summand der Einzelsumme ist immerhin noch mit der gleichen Begründung durch (p - I )! t eilbar. Beim Bestimmen der (p - l )-t en Abl eitung des Terms für f an der St elle x = 0 fehlt nur in eine m der vielen Summanden der Fa kt or x , und nur dieser liefert daher eine n nichtver schwindenden Te rm : Es ist derj eni ge, in dem x p-l( p - l j-mal abgeleitet wird und die (x - k)P gar nicht. Also ist
J j ist eine ganze Zahl und wegen oo < P und r (p - I)! , aber kein Vielfaches von p . Daraus folgt 1
IJjl =
Cl '
1
(p - I)! ,
Cl
E Z,
<
p auc h ein Vielfaches von
Cl
~ 1.
Dies ist die algebraische Ab sch ätzung. Für die an alytische geht man zu j üb er , d . h . zu dem Polynom, dessen Koeffizienten den gleichen Betrag wie die von f haben , a be r alle po sit iv sind, also
Dass in diesem Polynom alle Koeffizienten bis a ufs Vorzeichen mit den en in f üb er ein stimmen , kann man sich klarmach en , indem man in f(x) x durch - x substi t uiert und sich üb erl egt , dass das so ent st ehende Polynom bis a uf den Fa kt or (_1) n mit j üb erein st immt, j edoch sich gegenüber f nur die Vorzeichen der Koeffiz ien ten zu den un geraden Potenzen von x um gedreht haben . Es ist
e-l
. (k + l )P . (k + 2)p · . .. . (k + r )P (2 . r )po "'+(P-l )
j(k)
<
(2 · - )" , fall s 0
<
Daraus folgt für Jj : r
IJjl
<
L
j =O
Ibjl 'I I j (j)1
k
< r.
416
32 Transzendenz von e und
1r
r-
<
L
lbj l · j · ej .j(j)
j= O
<
L r
Ibjl ' (2 · r)· e j ·(2 · r) (r +l ) 'P -l
j=O C2 . C2 :=
(2 . r) (r+l) .p
~ j=o Ibj I· e j ist eine von p unabhängige Kon st ante.
Au s den unter schi edli chen Wachstumsordnungen der Ab schätzungen ergibt sich nun der Wider spruch , denn ungeach t et der auftret enden Proportionalitätsfaktoren Cl, C2 wird für genügend groß es p die algebraische Abs chätzung nach unten D zwingen d größer als die a nalyt ische Ab schätzung nach ob en . Historische A nme rkung: Die Transzendenz von e wurde er stmals 1873 von Charle s Hermite bewiesen . Sein An satz en tsprach im Wesentlichen dem , der a uch hier - wesentlich vere infacht - verwendet wurde.
32 .3
Die Transzendenz von
1f
Als Ferdinand Lindemann im Jahre 1882 die Transzenden z von 7f b ewies , hatt e er damit ein zwei Jahrtausende altes Problem erle digt: Die Quadratur des Kreises, od er in heutiger Sprache: Die Kon struktion zweier Strecken mit dem Längenverhältnis ft nur mit Zirkel und Lin eal. Man kann bekanntlich St recken mit Längenverhältnis z zur Einheit sstrecke dann und nu r dann mi t Zirkel und Lineal kon struieren , wenn z Element eines algebraischen Zahlkörper s K ist, der üb er eine Kette
quadratischer Körper erw eiterungen, also so, dass
gilt , zu dem Körper Q der rationalen Zahlen a bsteigt. In sbesondere mu ss z dafür Nullstelle eines Pol ynoms 2. , 4. , 8., . .. , 2n a us Z[X] sein .
1
.
Grades
Obgleich also seit 120 Jahren fest steht, dass 7f dieses Kriterium nicht erfüllt , be schäftigen sich nach wie vor viele Hobbymathematiker mit de r Aufgabe , mit den genannten Hilfsmi t teln einen Krei s in ein flächengleiche s Quadrat zu überführen . Vielleicht verm ag die ses Kapitel dagegen ja etwas Abhilfe zu schaffen .
32 .3 Die Transzendenz von
417
7f
Satz 32 .3
Di e Zahl
7f
ist tran szend ent .
Ich erw ähne zunächst einen Satz , au s dem die Transzendenz von e und 7f quasi sofort folgt : den Satz von Lindemann-Weierstraß , m it dem eine groß e Klasse von Zahlen als transzendent identifiziert werden kann .
Satz 32.4 (Satz vo n Lindemann-Weierstraß) Für alle paarweise verschiedenen 001 , ••• , a n E ([Jl C C, dem Kö rper der algebmischen Zahlen über Z, und für alle ß1, ... ,ßn E ij gilt n
L
ßk . e
a h
cF 0,
k =O
oder kurz gefasst : Alle e a k mit paarweise versc hiedenen Expon ent en ak E ([Jl sind lin ear unabh ängig über ([Jl.
Sehr leicht kann man damit nun die Transzenden z von e und
7f
zeigen:
K orolla r 32.5 Die Zahl eist transze ndent.
Beweis:
Ann ahme, e sei in ([Jl. Set ze 001
= 0,
ß1
e,
Dann ist e· e O -1 . e 1 Weier straß.
Korollar 32.6 Die Zahl
1,
- 1,
e-e
ßk
=
°
(V k ?: 3) .
0, im 'W ide rspruch zum Satz von LindemannD
7f
ist trans zend ent .
B eweis: Ann ahme, 7f sei in ([Jl. 'Wegen i2 = -1 und der Tatsache, dass die alg ebraischen Zahlen eine n Körp er bilden , sind au ch i . 7f un d 2 . i . 7f au s ij.
418
32 Transzendenz von e und rr
Set ze dann i . tt , O:z
2·i .n,
1,
1,
ßz
o
(\I k
~
3) .
Dann ist 1 · ei
' 7[
+ 1 · eZ. i
' 7[
= - 1 + 1 = 0,
wiederum im Widersp ru ch zum Satz von Lindemann-Weierstraß .
o
Do ch statt den Satz von Lindem ann-\Veierstraß zu beweisen , will ich hier in et wa die gleiche Vorg eh en sweise wählen wie im Tr anszenden zb eweis für e.
32. 3.1
Vorbereitungen
Als wichtige Voraussetzungen für den Beweis von Satz 32 .3 benötigt man eine Au ssage über ganz-algebraische Zahlen sowie den Haupt sa tz über elementarsy mmetris che Funktionen .
Lemma 32. 7 Sei ~ eine algebraisch e Zahl über Q, die über Q das Minimalpolynom r -ten Grades
I: ak ' x" T
f E Q[X ]'
f
=
k=O
habe. B ei Multiplikation des Minimalpolynoms mit dem Hauptn enn er A sämtlicher Ko effizienten von f wird daraus ein Polynom aus Z[X] mit dem führenden Ko effizient en A statt 1. Dan n ist A . ~ eine gan z-algebraische Zahl, also Nullst elle eines norm ier t en Polynoms mit gan zzahlig en Ko effizient en (was kein e Selbstverst ändlichkeit ist) .
Beweis:
Es ist
T
0 = I: aj · e · j=O Wi r multiplizieren die Glei chung mi t A T:
o
T- l
T
AT . I:a j . e j =O
A T . ~T
+ I: AT . aj j=O
.
e
T- l
(A . ~ r
+ I: AT-j . aj
. (A . ~ ) j
j=O
o
32 .3 Die Transzendenz von
419
7f
Den elem entarsymmetrischen Funktion en begegnet man , wenn man Produkt e von Lin earfaktoren au smultiplizier t und mit P olynomen vergl eich t . Bei den elementarsymmetrischen Funktionen handelt es sich nun um P olynome in mehrer en Ver änderli chen . Wenn vom Grad von Polynom en in mehrer en Ver änderli chen die Red e ist , so ist der Totalgrad geme int, d . h . die höchst e vorkommend e Summe aller Ex p one nte n in eine m Monom . Permutationen der Nullstellen u ; haben selb st ver ständlich kein en Ei nflus s au f das Ergebn is, wenn man die Koeffizien ten als Pol ynome in den Null st ellen a uffasst : (x - ur) . (x - U 2 ) . . . .. (x - u n ) = x n - S I ,n . X n- l + S2, n . X n-2 - + ... + ( - L)" . Sn, n, wob ei die
Sj ,n
die folgen de n Au sdrücke in den
Ui
sind:
n S I, n
L
Ui
i= 1
L
S2 ,n
Ui ' Uj
l :So i < j :So n
L
S3, n
U i . U j . Uk
l:Soi< j< k:Son
n
Sn,n
II
Ui
i =1
E in symm etris ches Polynom P in n Veränderli chen UI , U 2 , ... , U n ist ein Polynom, das invariant gegenüber sä mtlichen P ermutationen de r Variablen ist . Bei spie l: W ährend das Pol yn om PI := UI + U2 - 2· U l . U2 gleich bleibt, wenn man Ul und U2 vertauscht , ändert sich das Polynom P2 := U l - U2 + ui . U 2 dadurch in ein anderes P olynom . Darum ist PI ein symme t rische s Polynom, P2 ist es nicht . J e höher die Zahl der Ver änderlichen ist , gegen desto mehr P ermutation en mu ss P invariant sein .
L emma 3 2. 8 (Sa t z üb er e lementarsymmetrische Funkt ionen) Jed es sym me trische Polynom P in den n Variablen U l , U2 , ... , U n mit rational en Ko effizient en besit zt eine eindeutige Darst ellung als Po lynom mit rationalen Ko effizient en in den eleme ntars ymme trischen Funktion en Sl, n, S 2 ,n, . . . , s n, n .
Sind die Koeffizient en von P ganzzahlig , so ergeben sich fü r die Dars tellung als Polynom in Ul , U 2 , . .. , U n gleichfalls ganzzahlige Ko effizi enten.
420
32 Transzendenz von e und
7['
Beweis: Die einzelne n Monome des symmetrischen Polynoms p können nach dem Totalgrad geordnet werden; man erhält eine Darstellung des symmetrische n Polynoms als Summe homogen er symmetrischer Polynome der Totalgrade 0, 1, ... , m. Es reicht , den Satz für ein beliebiges homogen es sym met rische s Polynom 9 = g(Xl , . . . , x n ) vom Totalgrad m zu beweisen . Dazu ordnet man jed em von dessen Monomen auf einde ut ige Weise eine Höh e zu: Das Monom
n
L qj = m, j =1
erhält die Höhe n
1 . ql
+
2· q2
+ ...+
n· qn
~
m.
Da die Zahl der Monome in 9 endlich ist , exis tiert ein Monom , dessen Höhe maximal ist. Sei dies
r ist dadurch einde ut ig bestimmt, dass ql ::; q2 ::; . . . ::; qn : J egliche P ermutation der qi würde zu einer geringer en Höhe führen . Aufgrund der Symmetrie des Polynoms 9 gehören auch alle Monome
mit a E Sn (di e Bahn von r unter S n) zu g, und für
existiert die Darstellung in elementarsymmetrischen Funktionen
a q 1 , ... .a.::
( Sn,n )
q,
.
(
Sn - l ,n
) q2- q,
.
(
S n- 2, n
) q3-q2
.....
( ) q n -qn - l Sl ,n ,
welche so konstruiert wurde, dass sie exakt die gleiche Höhe und den gleichen Koeffizienten hat wie dasjenige Monom in 9 mit der höchsten Höhe. Folglich ist das höchste Monom in d := 9 - h, welches weiterhin homogen ist , von echt kleinerer Höhe. Die Rationalität bzw . Ganzzahligkeit der Koeffizienten von 9 bleibt in d erhalten. Die se Prozedur des sukzessiven Subtrahierens der Bahn des Monoms mit maximaler Höhe führt al so im mer nach endlich vielen Schritten zum Monom der Höhe 0, dem kon stanten Polynom . Da dieses der einzige Vertreter in seiner Bahn ist, ha t man die eindeutig bestimmte Darstellung von 9 in den elementarsymmetrischen Funktionen mit rationalen bzw. ganzzahligen Koeffizienten erhalt en . D
32 .3 Die Transzendenz von
32.3.2
421
7r
Konjugierte von
1 . Jr
Derart gewappnet wid men wir un s nun der Hauptaufgabe die ses Abs chnit t s, dem Beweis von Satz 32.3.
Beweis: An genommen, 7r sei algebraisch üb er Q . Weil a uch i algebraisch üb er Q ist und ij (c q , die Menge der algebraische n Zahlen üb er Q, eine n Körper bildet , ist auch i . 7r algebraisch mit dem Minimalpolynom
I>k' x k, grad 9 ~ 2. T
g E
Q[X ]' g(x) =
k =ü
De r Hauptnen ner aller Koeffizien ten von 9 sei B. Na ch Satz 32.7 ist damit B · i- 7r eine ga nz-algebraische Zahl. Nach dem Fundamen t alsatz der Algebra zerfällt 9 üb er Q in r versch iede ne Lin earfaktoren :
g(z) = (z - 6)' (z - 6 )· ... · (z -
~T )
Dabei sind 6 ,... , ~ T die Konjugierten von i . 7r , also sämt liche Nullst ellen des Minimalpolyn om s von i . tt . Unt er diesen Konjugierten b efindet sich , da die Koeffizienten von 9 alle reell sind , a uch das konjugiert-komplexe - i . tt . Gen au wie B · i . 7r sind a uch die üb rigen B . ~j ga nz-algebraisch , also Nullst ellen des normierten Polynoms d au s Z[ X], welches man gemäß dem Verfah ren au s Lemma 32.7 au s 9 gewinnt . Demnach ist d das Minimalpolynom sämt liche r Konjugierter von B· i· tt . Mit der Ganzzahligkeit der Koeffizienten im Minimalpolynom d von B . i . 7r können wir b ei der algebraische n Abs chätzung von Funktionalausd rü cken deren Ganzzahligkeit nachweisen . Man bildet dazu den Au sd ru ck
Da i . null .
7r
un te r den Konjugierten ist und e i
' 7[
= - 1, ist dieses Produkt gleich
Man multipliziert das Produkt au s und erhält : T
1 + L e~j + j =l
L
e~j Hk
+ ... + e~l+ ...H , .
l ~j < k ~T
Sei c k = (c1k , ... , c Tk ) E {O,IY, k ein Index, der die 2 T El em ente von {O,IY durchläuft , dann ist das Produkt 2' >
(1 + e~ l ) . (1 + e6 ) . . .. . (1 + e~' ) =
L
k= l
eE: l k >~ l + » >+E:, k ' ~r
32 Tra nsze ndenz von e und tt
422
eine Summe aus 2 r Exponen tialtermen , unt er der en Exponen t en all e Summen a us den ~j vorkommen , die möglich sind, wenn jed es ~j ent wede r hineingenommen wird ode r nicht. Diese 2 r Summen werden zur Ver einfachung nun 'Pk geschrieb en : r
'Pk = L:>Sj k . j =l
~j ,
1 ::;
< 2r .
k
Wichtige Konsequen z: P ermutiert man die Indizes der ~j irge nd wie, so steht der zu dieser Oper ation gehöre nde Term wied er unter den Summanden . Zu j ed em 'Pk = c1k .
6 + ... + Crk
. ~r
ist a lso auch die ga nze Bahn bzgl. der symmetrischen Gruppe S r unter den 2 r Faktoren, al so ex ist iert zu j ed em (J' E S r ein l E {I , ... , 2 r } mit 'PI = c 1k . ~O'(l)
+ ... + Crk . ~a( r ) '
Mi ndes tens zwei von diesen Summen sind null - nämlich die zu 'Pnl = 0 und 1r + (-i· 1r) gehöre nde n. Sei q die An zahl der er , die null ergebe n; diese tragen zum Produkt
'Pn2 = i·
(1 + eel ) . (1 + e6 ) ..... (1 + e!;n ), wenn man es zur Summe a usm ult ipliziert, jeweils den Summanden 1 bei. Dieses Produkt kann d ann als Summe folgendermaßen geschrieben werden : q
+
n
I: e'Pk
=
mi t n
r
2 - q
k =l
Ein en ts cheidender Tri ck bei der a lgebraischen Ab schätzung wird sein , die Summe über 1, ... , n mi t - q ident ifizieren zu können , um daraus eine Teilba rkeitsa uss age zu gewinnen. Wir wählen eine Primzahl p - die groß genug sein muss , denn über deren Größe wird sp äter der Widerspruch geführt - und de finieren das Polynom f vom Grad n - p + p - 1:
f (x) = B n·P . x p - 1 .
n
TI (x -
'Pk )P
k= l
Das Polynom f ist in den Ausdrücken 'Pk sym me t risch, d. h. gegenüber jed er P ermutation der 6 ,... , ~r invariant , und sein e Koeffizienten sind , wie man durch Au smultiplizier en des Produktes er kennt , ganzzahlig. Der Hauptsatz über' elementarsymmetrische Funktion en (32.8) garantiert nun , dass das au smultiplizierte P olynom eine pol ynomiale Darstellung in Sl ,n('Pl , .. " 'Pn ), S2,n('Pl , ... , 'Pn ),
32 .3 Die Tra nszendenz von
423
7r
. .. , Sn ,n('Pl , . . . , 'Pn)
besitz t , die a ufgru nd der Ganzzahligkeit de r Koeffizient en von f (x) wiederum ga nzza hlige Koeffizien ten hat . Au ßerdem gilt , dass das P roduk t 21'
TI (x -
'Pk ) = x
2r
n
-n.
k= l
TI (x -
'Pk)
k=l
m den Konjugier t en 6 ,... , ~r von i . 7r wied er symmetrisch ist . Let zt er es ist darin b egründet , dass zu j ed em (J" E S r ein l E {I , .. . ,2 r} exist iert m it 'PI = c l . ~CT ( l )
+ .. .+ Cr
. ~CT ( r ) ,
also die P rodukte auch de ssen Line arfak to r en thal t en. Also läs st sich - wied erum nach dem Satz über eleme nt arsymme t rische Funktionen - d ieses Produkt als P olynom mi t ganzzahligen Koeffizienten in den elementarsy mmetrischen Funkti on en s l , r(6 , · · · ,~r) ,
s2,r( 6 , · ·· , ~r ),
... ,
schre ib en. Di e eleme ntarsy m metrische n Funkt ione n in aufs Vorzei chen) die rati on alen Koeffizi enten
6, .. . , ~r sind ab er (bis
l ,br -l , .. . , bo
des normier t en Minimalp olyno ms g . Das ergibt sich au s der Id entit ät r
I)k' x
k
= (x -
6)' (x
-
6 ) · · · · · (x
- ~r )
k =O
nach Au smultiplizier en der rech t en Seit e. Es gib t also ein Pol ynom F E Z [X, X r r
x2 - n o
l , . . . ,
X o], so dass
n
TI (x -
'Pk) =F(x ,br- l , . . . , bo) .
k= l
Die Koeffizient en von n ~~~q (x - 'Pk ) sind die gleichen wie die des Produkt s über a lle 2 r Linearfak t oren , a lso rationale Zahlen , ebenso diejenigen von de ssen p-ter P ot enz . Der Vorfakt or B st eht in f (x) n 'p-mal vor der p-ten Potenz dieses Produkts und damit a us reiche n d oft , um die Koeffizient en von f a lle zu ganzen Zah len zu ma chen. Die D arstellung von f mi t Koeffizi enten sei n·p+p- l
f (x) =
2..:
j =O
«s x
j
mi t Y j : aj E Z .
32 Tra nszende nz von e und
424
32.3.3
tt
Zwei konträre Abschätzungen
Nun bedienen wir uns wieder des bereits aus dem Beweis der Transzendenz von e b ekannt en Funktionals
Man beachte, dass Integrale dieser Art auch für t E C woh ldefini ert sind, sofern der Integrand eine auf ganz C holomor phe Funktion ist, also eine Stammfunktion besitzt . Also gilt die Standardabschätzung für Int egrale, "Betrag eines Integrals ist kleiner oder gleich der Länge des Integrationsweges mal dem Maximum des Betrages auf diesem Weg" insbesondere für den kürzestmöglichen Weg in C , den geradlinigen Weg von u = 0 nach u = t .
Algebraische Abschätzung eines Funktionals Von Ij leit en wir das Funktional
ab, welches - wie im Beweis der Transzendenz von e gration ausgewertet wird zu
J!
mittels partieller Inte-
(~ e") . (~ /j)(O)) -~~/j)(~,)
C%-'/j) (0)) - ~ n%-, !u, (~k)
(~' e").
Wegen der Herleitung aus der partiellen Int egrat ion kann apriori keine andere Obergrenze für die Summe über j angegeben werden; deshalb geht die Summe bis unendlich. Höhere als (n . p + p - l)-te Ab leitungen sind aber allesamt 0, können also ignoriert werden . Wir setzen
m := n - p
+p
-
1.
Damit ist
Wegen q + L-~'=~q e 'P h.
= 0 ist die erste Summe
L m
i, = - q.
j =O
n
LL m
j(j )(O) -
- q:
j =Ok=l
j(j )(
32 .3 Die Tra nszendenz von
425
7r
Aufgru nd der ga nzzahligen Koeffizienten von j und seine r erst en m Ableit unge n und des hoh en Exp on enten für B ergibt sich, dass die Summen
sym me t rische Pol yn om e in den n ganz-algebraische n Zahlen B ' 'PI , . . . , B ''Pn mi t ganzzahligen Koeffizienten sind und also au ch Jj ein symmetrisches P olynom ist mi t ganzzahligen Koeffizienten in den 2 r Au sdrücken r
B·
I>j ' ~j .
j = 1
Also lässt sich J j als ganzzahliges P olynom in den elementa rsym me t rische n Funkt ione n
sl ,r(B · 6 , ... , B · ~r) , s2,r (B · 6, ... , B· ~r ),
,
. ..
sr,r (B · 6 , ... ,
B'~r)
schre ibe n . Diese sind gleich den Koeffizienten im Minimalpolynom d von B · i . 7r, also ganzzahlig, so dass wir folgern können , dass Jj eine ga nze Zahl ist. Ist der Ableitungsgrad j echt klein er als p, so ist j (j ) ('Pk) = 0 für alle k E {I, ... , n} , da die 'Pk als p-fache Nullste llen kon struier t sind. Zu der Doppelsumme tragen also nur die p-t e und höher e Abl eitungen bei, deshalb ist die Doppelsumme ein Vielfach es von p! . Ist j < p -l, so ist au ch j (j ) (0) = O. Ferner ist a uch j (j ) (0) ein Vielfach es von p!, falls j :::0: p. Die interess antest e Ableitung ist also j (p-I ) (O):
'PI . 'P2 . . .. .'Pn ist symmet risch in den Konjugierten ~j von i- 7r: Zu jedem Fak tor 'Pk = C l . ~ I + ... + Cr . ~r ist auch die ga nze Bahn bzgl. der symmetrische n Gruppe S r un te r den n = 2 r - p Fak to ren . Also ex istiert zu jedem (J" E Sr ein l E{1 , . .. , 2 r - p} m it
'PI
= Cl
.
~CT( I)
+ ... + C l
.
~CT (r)'
Demzufolge ist , wieder nach dem Haupt satz über elementar symmet rische Funkt ionen , tr: . 'PI . 'P2 .. . .. 'Pn ein ganzzahliges Pol ynom in den element a rsymmetrischen Funktionen der B · ~j . Diese sind als die Koeffizienten des Min imalpolynoms d von ganz-alg ebraischen Zah len ganzzahlig, also ist B ": 'PI' 'P2 · .. . · 'Pn ganzzahlig. j( p- I) (O) ist folglich ein Vielfaches von (p - I)! .
426
32 Trans zenden z von e und rr
Die Primfaktoren in Bund 'f/I . 'f/2 ..... 'f/n sind fest und unabhängig von der Wahl der Primzahl p . p kann also so groß gewählt werden , dass es wed er in B noch in 'f/I . 'f/2 .... . 'f/n vorkommt . So ist gewährleist et, dass j (p - I ) (0) nicht Vielfaches von p! ist. Wir gewinnen die Darstellung:
- q . a- (p - I)! - b· p! mit a , b E Z, p kein Teiler von a
JI {=}
I (P ~l)!1 = Iq ·a+ b , pl
Ist zude m noch p t eilerfremd zu q, so t eilt p wed er q noch a , und der Betrag ist eine natürliche Zahl echt größer null. Damit folgt IJ I I
=
C3 •
(p - I)! ,
E
C3
Z,
C3
:::0:
1.
Soweit die algebraische Ab sch ätzung des Funktionals.
Die analytische Abschä tzung Die analytische Abschätzung gewinnt man nun durch die Standardabsch ätzung. Dabei ist wieder j(z) dasjenige Polynom vom Grad m = n.- p + p - 1, dessen Koeffizienten betragsmäßi g gleich den en von j( z), jedoch alle nichtnegativ sind: m
f( z )
= L a j ' z j,
j =
j =O
m
L
lajl· z j.
j =o
IJ(u)1 auf der Kr eissch eib e
So ist gewährleist et , dass das Maximum von
o mit dem Radius l'Pkl bei
J(
um
l'Pkl angenom men wird , da dort alle z j und a uch alle laj I . zj bei reell-positivem z das gleich e Ar gument annehmen . Berücksichtigt man die Wirkung der gewichtenden Exponentialterme, ände rt sich am Prinzip nichts, außer dass aus Polynomen un endliche Poten zreih en werden . Aus dem selb en Grund ist das reelle Integral von el'Pkl- u .j (u) von 0 bis I'f/kl eine Majorante für den Betrag des komplexen Integr als von e'Pk- U ·f (u ) von 0 bis 'f/ k.
Damit wird der Betrag des Funktionals JI - ganz grob , da es im Wesentlichen a uf die Wachstumsordnung bezüglich pankommt - nach ob en abgeschätzt . Die Integration kann dabei aufgrund der Holomorphie des Integranden wied er üb er den geradlinigen Weg von 0 nach 'f/ k vollzogen werden:
I~l
1111 <
U
t lJo
'P k e'Pk- ·f(u)
dul
( 'P k e'Pk- ·f (u ) -
k =I
U
32.3 Die Transzendenz von 7f n
<
L
427
l'P kl· el'Pkl ·j (l'Pkl)
k= l
< n· max l'P kl· emaX l<S k<Snl'P kl .j ( max l'P kl) l~ k~ n
l~ k~n
Der Betrag der Integr ale a us der 2. Zeile wurde mit der im Beweis der Tr anszende nz von e verw endeten Methode a bgeschätz t. Im let zt en Schrit t werden no ch alle n Summ ande n gegen deren betragsm äß ig größten a bgeschätzt, wozu man verwendet , dass die Exp one nti alfunkt ion und j st re ng monoton wach send auf der reell-positiven Halbachse sind. Mit := max1 9 ~ n
l'Pkl
gilt also
Pl i ::; n:> . e Für x ~ 1 gilt für das Pol yn om Monom ,
j
A
of (
eine Abschätz ung gege n dessen höchst es
Wegen [i . 7f 1~ 3 ist definitiv größer als 3, so dass diese Ab schä tzung a nwendbar wird . Setzt man nun und so gilt Somit kann IJ I I nicht stärker als exp one nt iell mit der Größe von p zune hme n. Dies st eht im Wider spruch zum zuvor er haltene n Ergebnis der alg ebraischen Abschätz u ng IJII ~ (p - I)! , denn (p - I)! nimmt st ä rker als exp one ntiell mit der Größe von p zu: Man find et nämlich , dass mit Anwachsen von p das Verhältnis ( C4 · M P) / (C 3 ' (p -1)!) b eliebig klein wird , un gea chtet der a uft retende n Proportionalitätsfaktoren C3, C4. Damit gibt es ob erhalb eine r gewissen Gren ze ein p , für das die algebraische Ab schätzung für IJI I nach unten größer wird als die analytische Ab sch ätzung nach ob en . Hiermit erhalte n wir sch ließlich den Widerspruch, der den Beweis vollendet. D
Norberi Engb ers ist Dipl.-Math. und lebt in Osn abrück .
Literaturverzeichnis Z u d en K apite ln 1 bis 6 " G rup pen z wang I - V I" :
[1] H. Kurzwei l, B . Stellm acher: "T heor ie der endlichen Gruppen", Springer Verlag, 1998 [2] M . Artin: "Algebra", Birkhäuser, 1. Auflage 2009 [3] M . As chbacher: "Finite group theory", Cambridge University Press, 2000 [4] Johannes Hahn: "G ru p p enzwa ng IX: Unfall im Genlabor: (Per-)mutationen in der Bevö lkerung ', 2006 , www. rna t hepl an e t. com/def aul t 3. htrnl ? ca ll=a r ti cl e . php ?s id=965 [5] Johannes Hahn : "Gruppenzwang V II : Gruppen sind immer noch Top!", 2006 , www. rnatheplanet .com/default3 .htrnl?call =articl e .php?sid=923 Zu K ap itel 7 ,,E in Spielze u g mit Gruppe n strukt ur" : [6] David Joyner : .Adventures in Group T heory", T he J ohns Hop kins University P ress, Baltimore, 2008 [7] Hans Julius Zassenhaus: .Rubik's Cube: A toy, a galois tool, group theory for every bo dy", Physica A, Volume 114 , Issue 1-3 , p . 629 -637, 1982 Z u K ap itel 8 ,,E nd liche K örper" : [8] S. Bosch, "Alge bra", Springer Verl ag, 7. Auflage 2009 [9] M . Artin: "A lgebra", Birkhäuser , 1. Auflage 2009 [10] S. Wewers: " Die multiplikativ e Gruppe eine s K örpers ist zyklisch" in Vorlesungsskript "Algebra I", Hannover , 2008 /2009, www .ia zd. un i - hannover . de/-wewe r s/lehr e/ws 08/a l gebr al/ zykl i s ch . pdf [11] C hr . K a rpfinger , K. Mey berg: "Algebra: Gruppen - Ringe - Körper", Sp ektrum Akademischer Verlag, 1. Auflage. 2009 Zu K ap it el 9 "Ü b e r die Anzahl von S itzo r dnung en a m runden T isch" : [12] McGowan , John : "T he nu m ber of di sti nct necklaces", sunma rk i nc . corni conte s t / pu zzle s2 .ht rnl [13] Ask D r . Math: "P erm ut at ions in a Necklace", rnathforurn. or g/dr .rnat h/pr obl erns/ r orner07 . 04 . 99. htrnl , April 1999 [14] Ask Dr. Math: .Pclya-Burnside Lemma", rnat hforurn . or g/dr.rnat h/pr oblerns/ l i ng e r .7.02 .99 .htrnl , Februa r 1999 [15] Andreas Drees, C hristian Sie be neicher: "E in Lemma über Perlenketten", www. rnathernatik .uni-bielefeld .de/ -s ieben/lothar/perlenketten.pdf [16] A . Betten , H . Fripertinger, A . K orb er : .Algebraic Co mbinatorics Via Fi nite Group Actions", bedvgm. kfunigraz. a c. at: 8001/frib/htrn12/book/hy l OO.ht rnl , September 7, 1998 [17] Martin Schoenert : "A lem m a t hat is *not* Burnside's", De c. 7, 1994 , www .ma t h . rwt h- aa chen . de/-Ma r t i n . Schoene r t/ Cube - Lover s/Mar t i n_Schoene r t __A_ lemma_that _is _*not *_Burnside's .html [18] Hein z Lünebur g: "A Lemma t hat is not Bumside's", www .mathematik. uni- kl.de/ -luene/miszell en/Burnside. html
430
Lit erat urverzeichnis
[19] Ask Dr. Math: "Com binat or ics", mat hfo rum . org/dr . mat h/ pr obl ems / l e r che 5 . 16 . 97. html , Mai 1997 [20] T he On-Line Encyclo ped ia se que nce s/
of Int eger Sequ en ces, www . r esearch .att .comrnjas/
[21] On -Line E ncycl opedi a of Integer Sequences - Sequence A047996, www. res e arch. att . com/cgi - bin/ ac cess . cgi/as/nj as/s equ ences/eis A.c gi?Anum=A047996 [22] G. Polya : .How To Solve It - A New Asp ect of Mat he rnatica l Met hod", Second Edit ion, Princet on Univers ity Press, P rin ceto n , New J er sey, 1988 Ziti ert na ch hydra. na t . uni - magdeb ur g .de/geom/ PZ. html . [23] Peter Paule: ,'yorl esu ngsan kü ndigu ng Algori t hrnische Kom bi na t ori k", G raz, zum SS 2001 [24] "B urnside's lem m a", en . wikipe dia . org/wiki/ Burnside' s _lemma [25] M . Wo hlgemut h : "Ha lsba nd -Ge ne rator in default 3 . html ? ca ll=matro i d/necklace s .php
P lIP",
2002 ,
www .mathepl anet .com/
[26] T he (Co mb inatorial) O bject Server, Index of Generation Pages, theor y . cs. uv i c . ca/ co s . html , 2003 Zu K a pitel 1 0 " Su rn rne nzerlegu ngen" : [27] H. S. W ilf: "generatingfun ct ion ology", Philadelphia , 2nd Ed iti on, 1994, www.mat h . upenn .edu/ - wilf /DownldGF.html [28] Murray R . Spiegel: "Scha um's outline of t he ory and problems of calculus of finit e differe nces and difference equ at ions ", New York , NY [u , a .], McGraw-Hill, 1971 [29] Leonh ar d Euler : .J ntroductio in Analysin Infinit orum'', Lausan ne 1748 (Nachdruck Spr inge r 1983) , Kap . 16 [30] George A. An d rews: "The T heory of Partit ions", Ad dison-Wesley, Re ad in g (MA) 1976 , insbes. Kap . 5 be treffend die Form el von Hardy- Rarnanuj a n-Radernache r. [31] G. Ir. II a rdy a nd S. Ramanuj an : ,,Asympto ti c Formulae in Com binatory An alysis", Proc. London Mat h . Soc . 17, 75-115, 1918 [32] T he On -Line Encycloped ia of Int eger Sequences, Sequence A0000 41: a(n) = number of pa rt itions of n (the pa rt ition nurnbers) , www. r e s e ar ch. a t t . c omr n j a s / s equence s / A000041 [33] M . Wo hlgemu t h : ,,Anz a hl Mög lichk eit en, Beträge bis zu 100 Cen t in Mü nzen zu zah len", P HP -Anwendung, 2002 , www .ma t he plane t .com/def ault 3 . ht ml ?call=mat roi d/mue nzz. php Zu K a pit el 11 ,'pentagon, K art enhaus u n d Surnrnenze rle gung" : [34] Abdul Ha ssen, Thomas J . Osler: .Playing wit.h pa rt.itions on t he cornp uter", M athematics Depar tment , Rowan Un ivers ity, NJ , 2001, www.r owan . edu/ open / dept s / mat h/ HASSEN/Pape rs /Playingwithpart ition .pdf [35] Pascal HitzIer: .Eulcrsche Partitionsprodukte", www . wv . inf . tu-dresden . de rpascal / prose94 . ps . gz , Proseminararbeit , Uni versit ät T ü bing en, 1994 [36] Bar bar a Gä rtner : "Zah lent heo rie", Vorl esun g, P lI Ka rlsruh e, 1999 /2000 , S. 6 ff, www . ph- l udwigsburg . de/fi l e admin/subsi t es/2e-imix- t-0 1/us er _fi l es/per so nal/ s chmidt-thieme/ verans taltungen/zahlentheorie .pdf [37] Folge A001318 in Th e On-Line Encyclopedia com/- nj as/sequenc es/A001318
0/ In teger Sequences, www. r ese arch. at t .
Literat urverzeichnis
431
Z u K a p it el 12 " Das H e ir ats p r o blem" : [38] R . Diestel: "Grap hent heorie", Springer Verlag, Berlin , 3. Aufl. 2006. [39] M . Aign er : "Diskrete Mat he matik", Vieweg l Teubner Verlag , 2006 [40] Alexand er Schri j ver : "T heory of Lin ea r a nd In t eger P rogr a m m ing", Jo h n Wiley & Sons; 1. Auflage, 1998 [41] Philipp Ha ll: "O n Representations of Su bsets", J . Lond on Mat h . Soc., 10 (1935) 26-30 . [42] C hri sti na Büsing : "G raphen- und Netzwerkoptim ierung" , Spektrum Akademische r Verlag , 1. Auflag e, 2010 [43] Bernhard Karte , Jens Vyg en : "Kom b inat ori sche O pt im ieru ng : T heori e u nd Algorit hmen", Springer Verlag, 2010 Zu K a pitel 13 " Über die Anzahl s u rjek tiver A bb il dung en" : [44] E lke Wi lkeit: "Gesa mt he ite n", Art ikel im In t ernet (exi sti er t heu t e n icht mehr), 200 1 [45] Erich Priesn er : "Anzah len", Anzahlen .html
2000 ,
www.mat h . t u- cot t bus. de / I NSTITUT/ l sgd i / DM/
Z u K apitel 14 " Pote n zs u m men" : [46] Milt on Ab ram owitz, lrene A . St egun: "Hand book of Mat hem at ical Funct ions", Dover P ubli cations , New York, USA, 1970 [47] Helmut Ric hter, Be rnhard Sch iekel: .Potcnzsumrncn , Bernoulli-Z ah len u nd E uler'sche Summenformel", München , 2004 , www . lrz - muenc hen . derhr/numb/pot enz s ummen. pdf [48] P avel Guerzhoy: "P ower Sums, Bernoulli Nu m bers, and Riem ann 's Zeta- Function", www . mat h . hawa i i . edu/- pavel/be r noul l i . pdf [49] Konrad Kön igsberger: "A nalysis 1", Heide lberg, Springer Verl ag , 2003 Zu K a p it el 15 " B e rech n u ng g roßer Binomialko effizient en" : [50] Paulo Riben boim : "Die Welt der Prim zahlen: Geheimn isse und Rekorde", Sp ri ng er Verlag , 2006 [51] M . Wo hlgemut h: "Binomialkoeffizien t und Primfaktorzerl egung von n!", P HPBeispi elprogram m , 2001 , www.mat hepl an et.c om/defaul t 3. ht ml?call=ma t r oid/ fakt or 2 . php Zu K a pitel 1 6 " Ü ber P ermanenten, P ermutationen und Fixpunkte" : [52] H. J . Ryse r: "Com binat oria l Mat hem atics", Mat hem atical Associ ati on of Am er ica, 1963 [53] Habbo Ha it Hein ze: "Die Pe rmanente im thermodyn am ischen Viel -Bosonen -Pfadintegral ...", Dip lom -Arbeit , Oldenburg, 1996 [54] H. W . Gould : "Combinatorial Identities", Morgant own Printing an d Binding Com pany, Morgantown , Wes t Virginia, 1972 Zu K apitel 17 " Zäh le n mit P ermanenten" : [55] The O n-Line Encyclopedia of In t eger sequences /
Seq uences,
www . r es earch . at t . com/r n j as /
Zu K a pitel 18 " B inom ialm a t r izen und d a s L emma von G e ssel Viennot" : [56] M. Aigner: .Latticc Paths an d Determ inants", Springer Verlag, 2001
432
Literatu rverzeichnis
[57] G . Helms : .Accessing Bernoulli -Numbers by Ma trix-Operations", go .helms-net .de / math/pascal /bernoulli_en . pdf, Version 2.3.2 , 200 9 [58] Alan Edelman , Gilbert Strang: "Pascal Ma t rices", MIT, web. mi t . edu/ 18 . 06/www/ Essays/pascal- work . pdf, 2006 [59] Ma ur ice F. Aburdene and J ohn E. Dorband : "Unification of Legendre, Laguerre, II er-
mi te, and binomial di screte t ra nsforrns usin g P ascal' s m at rix" aus Mult idim ens ional S yste m s and Si gnal Processinq , Volume 5, Num ber 3 / J uli 1994 , Springer Net herlands, siehe a uch www. spr i nger l i nk. com/ c ont ent / 124nm1748t 39mu83/ Zu Kapitel 19 "W in ke ld reiteil u n g und der Satz von Haga" : [60] T. Chen: .Proof of t he im possibility of t ris ecti ng an angle wit h euclidean to ols", Mat hematics Magazin 39, 1966 , S. 239-241 [61] T hom as Hull (Herausgeber ): "OrigamP: T hird Int ernational Meeting of Origam i Scienc e, Ma th, an d Ed ucation", A K Peters, Abschni t t 2 ab Seit e 314, 2001 [62] Rober t Lang: .Origami an d Geo metric Constructions", www. l angor i gami . com/ s c i ence / hha/hha .php4, Seit e 22-23 , 1996
Zu Kapitel 20 ,,Das r egelmäßige Siebzehneck" : [63] B.L . van der Waerd en : "Algebra I/lI", Sp ringer Verl ag, erst m als erschienen 1930 / 31 , let zte Auflage 1993
Zu Kapitel 21 ,,Ein Satz von Carnot" : [64] H. S. Coxeter, S. L. Greitz er: "Zeit lose Geo met rie", Ernst Klet t , 1997
Zu Kapitel 22 ,,Die Kardioide als Hüllkurve" : [65] Kuno F lad t : "Ana lyt ische Geo m et rie spez ieller ebener Kurven", S. 284 ff., Akad emi sche Verl agsgesellschaft Fr ankfur t a . M ., 1962 [66] Hans-Jü rgen Cas pa r: "Über Hüllkurven (Einhüllend e, En velopen) ", 2007, matheplanet .com/default3 .html ?call=article .php?sid=1121
www.
Zu d en Kapiteln 23 bis 25 "Elliptische Kurven 1-3" : [67] Lawrence C. Wash ington: .Elliptic Curv es - Number Theory and Crypt ogr aphy" , Cha pman , 2. Auflage, 2008
Zu K apitel 26 ,'primzahlen mit Abstand" : [68] Ma rt in Aigner , G ünter M . Ziegler : "Das BUCH der Beweise", Springer Verl ag, 2003 [69] P aul o Rib enboim: "Die Welt der P rimzahlen : Geheim nisse und Rekord e", Springer Verlag, 2006 [70] Ben G ree n, Ter ence Tao; "T he primes contain ar bit ra rily long arit hmetic pr ogression s", Armals of Ma t hematics 167: 481-547 , 2008
[71] G reen-Tao theorem, bei en . wi k i ped i a . org/wiki/Green- Tao_ theorem Zu Kapitel 27 ,,Faktorisierungsverfahren" :
[72] R . S. Lehman : "Factoring Lar ge In tegers", Mathematics of Com putation 28, 1974, S. 637-6 46 [73] P. L. Mon t gom ery: "Speeding t he P ollar d and Elli pti c Cur ve Method s of Fact ori zati on", Mat hematics of Com putat ion 48, 1987, S. 243- 264
Literaturverzeichnis
433
[74] P. L. Montgomery: "An FFT Extension of t he Elliptic Curve Method of Fact orizat ion", Dissertati on , Universi ty of California , 1992 [75] C . Porner an ce: "T he Q ua d rat ic Sieve Fact oring Algori thm", Lecture Notes in Co mputer Science 209, 1985, S. 169-182 [76] A . K . Lens tra, H. W . Len stra, Jr. : "T he Development of t he Num ber F ield Sieve", Lecture Not es in Mat hem at ics 1554 , 1993 [77] K . Schö nberg er ,,Ein Fak t ori sier un gs-Progr amm in C", 2008, ....... rnathep1anet . corni defau1t3 .htrn1 ? ca11=artic1e.php?sid=1163#s12466
Zu K apitel 28 " Fo u r ie r t r a n sfo r mat io n" : [78] Uwe Ki en cke, I-Iolger J äkel : "Sig nal e un d System e", Ol den bourg, 2008 [79] K. Burg , H. Haf , R. W ille . A . Meis t er: "Höhere Mat hem ati k fü r Ing eni eur e, Band 3: Gewöhnl iche Different ialgleichu ngen , Dis t ri b ut ionen , Integralt ransformat ionen ", Vieweg+ Teubne r, 5. Auflag e, 2009 [80] K . Meyber g, P. Vachen au er : "Höhe re Mathemat ik 2: Di ffer en ti al gleichungen , Funkt ione nt heori e, Fourier- An al yse, Vari a ti on sr echnung" , Sp ringer Verl ag , 2001
Zu Kapitel 29 "Das B r achisto chronenproblem" : [81] Al fred Wagn er : "Die Va ri ati on sr echn un g und ihre Baseler Urspr ünge" , ersc h iene n in : Uni Nova Nr . 87, Wi ssen scha ft smagazin d er Un iversität Basel, J uni 2000, S.36-40
Zu K apitel 30 "Repunits, g eo m e t r isc h e Summen und Quadratzahlen" : [82] VV. Ljunggr en : "No en setninge r om u bestemte likninger av forme n (x n - 1)j (x- l ) = yq" , Nors k. Mat. T idsskr. 25, 1943 [83] Reinhard Brünner : "Geomet rische Sum me n und Qu adra t zahlen", 2009, ....... rna t hep1ane t. com/ de f au1t 3 . htrn1?a r t ic1e=1234 [84] H. \ V. Lenstra Jr.: .Solvi ng t he Pe ll Equat ion" in .Not.lces of the AMS", Vol. 49, Nu m ber 2, S. 182 ff, 2002; auch : ...... . ams . org/notices /200202 /fea-1enst ra . pdf [85] P et er Bundschuh : "E infüh rung in d ie Zahlen theori e", Sp ring er Verl ag, 1996
Zu d en Kapitel n 31 und 32 ,,Irrationalität /Transzendenz von e und 11"' : [86] Ivan Ni ven : "A Sim ple Proof Tha t P i Is Irra ti on al", 194 7, ....... pi314 .at/rnath/rniscl irrationa1_niven .pdf [87] Michael F ilaset a : "Transcen den tal Num ber T heory : Tra nscend ence of E an d Pi", ...... . rnath .sc .edu/-fi1aseta/gradcourses /Math785/Math785 Notes6 .pdf . [88] P et er Bundschuh : "Ei nführung in d ie Zahlen theori e", Sp ri ng er Verlag, 1996 [89] Kaleidoskop, Ein m a them a ti scher Almanach, her a usgegeb en von Eberhard Oet tinger, Klet t Verl ag , 1988 [90] Micha el Artin: "Algeb ra", Birkh äuser Verlag , 1998 [91] Rudolf Fri t sch : .Hilberts Beweis d er Tran szenden z d er Ludolph schen Zahl 11''', LM U M iinchen , ....... rna t hernat ik . uni - rnuenchen . de fri t s chi pi . pdf, 2003
r
Index ABBA-Lemma , 60 abels ch , 5 abels ch e Gruppe, 6 Abg eschlossenheit Inver senbildung, 26 Multiplika tion, 26 abgeschwä ch t e G ru p penaxiome, 18 Addit ion m odulo n , 12 Adjunktion , 129 affine Abbildungen, 7 algeb raisch, 412 Ar chimedes , 256 arith metische Progression , 328 ass oziat iv , 4 Assoz iat ivitä t , 4 a uflös bare G r u p pe, 93 Aufl ösb arkeit sstufe, 101 a ufsteigende Zentralreihe , 104 Au tomorphismengruppe , 50 Au tomorphismus , 47 Bahn , 76 Bahnenformel , 79 Bahnenzerl egung, 79 Bahnlänge, 76 Bernoulli, J akob , 212 Bernoulli, J oh ann , 379 Bernoulli- Za hlen , 212, 247 Bertrand sches P ostulat , 327 Bezout , 126 Bi ld,46 Bi nom ia lkoe ffizie nt , 215 Binomialma trix, 239 , 248 bipartiter Graph , 186 Brachi stoch rone, 384 C antor, Ge org, 411 C arnot , 273 C auchy,87 Charak teristik, 121 charakteristisc he Untergruppe, 54 Cubegroup, 111 Dedekind-Identit ät, 68 Der angement, 231 Der angement-Zahlen, 226 , 231 Diffie-Hellmann-Problem , 308 direkte Summe, 57 direktes Produkt , 57 Di skret er- Lo garithmus-Problem, 306 DLP, 306 E C D SA , 310 eckendisjunkt , 243 E CM , 319 , 348
Einbettung, 47 Eindeu t igkeit in ver ses El emen t , 17 neutral es El ement , 16 einfache Gruppe, 39 Einheit , 125 Einheitengruppe, 125 Einwegfunktion , 306 eleme ntarsy m metrische Funktionen , 41 9 E lGamal-Ver schlüsselung, 309 E lliptic Cu rves D igital Signature, 310 elliptische Kurve , 284, 346 E lliptische -K urven-Met hode, 345 endliche Körper, 117, 137 endliche K örpererweiterung. 120 E ndo m or p his mus ,47 E pim or p hism us, 47 erzeugende Funktion , 171 , 212 E rz eugend ensystem, 30 erzeugte Unt ergr u p pe, 30 E uler, Leonhard , 149 , 163 , 179 , 383 , 407, 411 E uler-La grange-Gleich u ng, 384 Faktorba sis , 354 Faktoren d er R eihe, 93 Faktorgruppe, 40 Fermat , 125 Fermat-Verfahren , 333 F ixpunkt , 226 , 232 for male Ableitu ng, 136 Fou ri er t ransformation , 363 Frobenius-Abbildung, 123 Fundamen t all ösung, 392 Funktional , 382 G a lois , E va riste. 267 ganz-algebra isch , 4 12 G auß, C arl Friedrich, 265 G außklammer, 218 G außsche Perioden, 268 Gessel- Viennot , 243 gla tt , 341 G oldwa sser-Kilian-Zertifika t , 322 Grad einer K örpererweiterung. 120 Green-Tao-T heorem , 329 gr ößter gemein samer Teiler, 126 Gruppe , 6 Gruppen mi t Primzahlordnung, 38 Gruppen axiome, 4 Gruppenhomomorphismus , 43 Gruppenoperation , 75 Gruppoid ,6 Hag a , 258
436 Halbgruppe, 6 Hall, Philip, 185 Hasse, Helmut , 317 Hasse-Diagramm , 67 Heira t sproblem , 185 Heira t stheo rem , 185 Hermit e, C harle s, 416 höh ere Kommut a torgruppen , 10 1 Homomorphiesat z, 50 Homomorphismus, 43 id en t ische A b bild ung, 8 Identität , 8, 10 Index , 35 Index-Calculus-Al gorithmus, 313 Inklusion und Ex klusi on , 205, 222 innerer Autom or phismus, 54 in variant , 54 in ver ses E lement, 5 E indeutigkeit, 17 irrational , 40 5 irreduzib el , 125 isomorph, 48 , 94 Isomorphie , 48 Isomorphiesatz, 62 , 68 Isomorphismus, 47 k-Partition , 204 kanonisch er Homomorphismus, 46 K ardioide, 277 K artenhaus-Zahlen , 178 kart esisch es Produkt , 57 Kern , 46 K lein er Satz von Fermat , 125 Knot en-Kanten-Inzid enzmatrix, 195, 196 kommutativ, 5 kommutative Gruppe, 6 Kommutativit ät , 5 Kommutator, 99 , 114 Kommutatorgruppe, 100 Komplexprodukt, 60 komponentenweise , 57 Kompositionsreihe, 96 Konjugation , 54 , 114 Konjugation skl asse, 77 Körper, 118 Körper mit Primzahlordnung, 123 Körpererweiterung, 119 Korrespondenzsatz, 63 Lagrange, 36 Lagrange, .loseph Louis, 383 Lambert , Johann Heinrich, 407 , 411 Landau, E ., 408 Länge der Subnormalreihe, 92 Legendre, 218 Legendresymbol , 354 Lehman-Verfahren, 336
Index Lemma von Bezout , 126 Lemma von Gess el-Viennot , 243 Lenstra, Hendrik, 320 Lindemann, Ferdinand , 416 Lindemann-\ Veierst ra ß, 417 linksinv er s , 16 Linksneb enklasse, 33 linksn eutral, 15 Liou ville , Joseph , 411 Magma , 6 Matchin g, 185 Minimalpolyn om , 412 modulo, 12 , 119 Monoid ,6 Monomorphismus, 47 Multimen ge, 160 Neb enklasse, 33 Neilsche Parabel , 286 neutrale s E lement , 5 Eindeutigkeit, 16 Newton, Isaac, 387 Newtonsehe Knoten , 285 nilpotent , 104 Nilpotenz-Klas se, 104 normal ,38 Normalisator, 77 Normalreih e, 92 Normalt eiler , 38 numerische Partition, 161 O rb it , 76 O rdnung, 53 O rigami, 255
(p - l)-Verfahren , 342 p-Gruppe, 80 p-Sylowgruppe, 82 p-Sylowunt ergruppe, 82 Partition , 204 Pascal-M atrix, 239 P ellsc he Gleichung, 392 P en t agonalzahlen , 178 P ermanente, 223 P ermutation gerade, 232 ungerade, 232 Pfad , 241 Pfadgewi cht , 242 Pfadmatrix, 243 Pfadsy stem , 241 Gewicht , 242 phi-Funktion, 149 Pollard , J ohn M ., 319 Pollard-Rho-Verfahren , 339 Polya-Burnside-Lemma , 147
437
Index Polya-Theorie, 157 Polynomdivision, 125 potenzglatt , 341 Primkörper, 121 Primzahlen, 327 Primzahlordnung, 123 Prinzip der Inklusion und Exklusion, 205, 222 Probedivision, 332 Projektion, 46 Public-Key-Verschlüsselung, 309 Quadratisches Sieb, 352 Quotient , 40 rational, 405 rechtsinvers , 16 Rechtsnebenklasse, 33 rechtsneutral, 15 Reduktion modulo p, 119 relativ teilerfremd , 149 Rencontre-Zahlen, 226 , 231 repunits, 389 Rubik 's Cube, 107 Satz über Primkörper, 122 Satz von Carnot , 274 Satz von Cauchy, 87 Satz von Fermat, 125 Satz von Haga, 258 Satz von Hasse, 317 Satz von Heller und Tompkins, 200 Satz von Hoffman und Kruskal, 199 Satz von Jordan-Hölder, 98 Satz von Lagrange, 36 Satz von Legendre, 218 Satz von Lindemann-\'Veierstraß, 417 Satz von Schreier, 97 Sätze von Sylow, 81 Signierung mit ECDSA , 310 nach ElGamal , 310 Signum eines Pfadsystems, 242 Silberner Schnitt , 261 Silbernes Rechteck, 261 singulärer Punkt , 284 , 285 Speedcubing, 108 Stabilisator, 76 Stirling-Zahlen zweiter Art , 204 Strich-Konvention, 46 Subnormalreihe, 92 Summenzerlegung, 161 surjektiv, 203 Sylow,81 symmetrisches Polynom, 419 tailswap, 244
Tausch-Lemma, 60 Teilkörper, 136 total unimodular, 199 Träger, 191 transzendent, 412 Trapdoor-Einwegfunktionen, 306 un endlich ferner Punkt , 285 unimodular, 197 Untergruppe, 25 Untergruppenkriterium, 27 verallgemeinerte \'Veierstraß-Gleichung, 284 Verfeinerung, 95 Verknüpfung, 4 voll charakteristisch , 54 Wenzel , Pierre Laurent , 256 Winkeldreiteilung, 255 \'Vohldefiniertheit, 4 Zauberwürfel, 107 Zentralisator, 77 Zentrum , 55, 113 Zerfällungskörper, 129 Eindeutigkeit, 132 Existenz, 132 Zerlegungen in irreduzible Elemente, 126 Zertifikat , 322 zyklisch, 31 zyklische Gruppe, 31