Springer-Lehrbuch
This page intentionally left blank
Rupert Lasser Frank Hofmaier
Analysis 1 C 2 Ein Wegweiser z...
114 downloads
1630 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Springer-Lehrbuch
This page intentionally left blank
Rupert Lasser Frank Hofmaier
Analysis 1 C 2 Ein Wegweiser zum Studienbeginn
Rupert Lasser Technische Universität München, Deutschland
Frank Hofmaier Technische Universität München, Deutschland
ISBN 978-3-642-28643-8 DOI 10.1007/978-3-642-28644-5
ISBN 978-3-642-28644-5 (eBook)
Mathematics Subject Classification (2010): 97I10, 97I30, 97I40 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer Spektrum © Springer-Verlag Berlin Heidelberg 2012 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften.
Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Springer Spektrum ist eine Marke von Springer DE. Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media www.springer-spektrum.de
Vorwort
Das vorliegende Buch beruht auf den Vorlesungen Analysis 1 und Analysis 2 im Bachelor-Studium der Mathematik an der Technischen Universit¨at M¨unchen. Die Analysis ist sicherlich eine der a¨ ltesten und anwendungsreichsten Theorien und somit ein klassisches Fach der Mathematik. Insofern kann dieses Buch nur Ergebnisse enthalten, die wohlbekannt und auch in zahlreichen weiteren B¨uchern zur Analysis zu finden sind. Unsere Referenzliste enth¨alt nur einen kleinen Teil der Gesamtheit von Lehrb¨uchern zu diesem Thema. ¨ Uber das gesamte Lehrbuch hinweg legen wir Wert auf die mathematische Pr¨azision. Durch zahlreiche motivierende Beispiele werden die mathematischen Sachverhalte beleuchtet, der Idee folgend Abstraktes mit Konkretem zu verkn¨upfen. Das Buch ist in 16 Kapitel unterteilt. Die ersten beiden Abschnitte geben die notwendigen Grundlagen zu reellen und komplexen Zahlen. Der zentrale Begriff der Konvergenz steht im Mittelpunkt der drei folgenden Kapitel. Konvergenz wird nicht nur im Bereich der reellen oder komplexen Zahlen sondern allgemein in metrischen R¨aumen studiert. Es folgen Abschnitte u¨ ber Stetigkeit, Differentiation und Integration. Die Kapitel 9 bis 11 befassen sich mit Konvergenz von Funktionsfolgen, insbesondere Taylorreihen und Fourierreihen. Die wichtige Eigenschaft der Kompaktheit bildet den Inhalt von Kapitel 12. Als vorbereitender Teil werden dann Grundlagen zu normierten Vektorr¨aumen pr¨asentiert. Differenzierbarkeit im Mehrdimensionalen, Umkehrsatz und implizite Funktionen bilden die Basis der mehrdimensionalen Analysis und sind Inhalt der Kapitel 14 und 15. Im letzten Kapitel werden elementare L¨osungsmethoden von gew¨ohnlichen Differentialgleichungen vorgestellt. Das vorliegende Buch umfasst somit die Analysis der ersten beiden Semester des Bachelor-Studiums Mathematik und gibt an vielen Stellen Einblick in dar¨uber¨ hinaus gehende mathematische Sachverhalte. Eine Reihe von Ubungsaufgaben am Ende jedes Kapitels runden das Werk ab. Garching b. M¨unchen, Februar 2012
Rupert Lasser Frank Hofmaier
v
This page intentionally left blank
Inhaltsverzeichnis
Einleitende Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1
Die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.1 Archimedisch angeordnete K¨orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2 Intervallschachtelung und Vollst¨andigkeit . . . . . . . . . . . . . . . . . . . . . . 9 1.3 Supremumseigenschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2
Die komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.1 Konstruktion der komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.2 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3
Folgen reller und komplexer Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Folgen und Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Rechnen mit Grenzwerten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Asymptotische Gleichheit und rekursiv definierte Folgen . . . . . . . . . 3.4 Eine Intervallschachtelung f¨ur den Logarithmus . . . . . . . . . . . . . . . . . 3.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23 23 26 30 32 35
4
Metrische R¨aume und Cauchyfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Metrische und normierte R¨aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Cauchyfolgen und Vollst¨andigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Skalarprodukt und Orthogonalit¨at . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Teilfolgen und H¨aufungswerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37 37 42 45 48 53
5
Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Konvergenz und absolute Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Konvergenzkriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Umordnungssatz und Cauchy-Produkt . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Exponentialreihe und Eulersche Formel . . . . . . . . . . . . . . . . . . . . . . . .
55 55 59 65 68 71 vii
viii
Inhaltsverzeichnis
5.6 Die R¨aume 1 , 2 und . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.7 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 6
Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Stetige Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Eigenschaften stetiger reellwertiger Funktionen . . . . . . . . . . . . . . . . . 6.3 Exponentialfunktion und Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Stetige Funktionen auf [a, b] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
79 79 84 89 92 93
7
Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 7.1 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 7.2 Mittelwertsatz und lokale Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 7.3 Ableitung der Umkehrfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 7.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
8
Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 8.1 Regelfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 8.2 Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . 119 8.3 Methoden zur Berechnung von Integralen . . . . . . . . . . . . . . . . . . . . . . 121 8.4 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 8.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
9
Funktionenfolgen und gleichm¨aßige Konvergenz . . . . . . . . . . . . . . . . . . . 129 9.1 Gleichm¨aßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 9.2 Differentiation und Integration von Potenzreihen . . . . . . . . . . . . . . . . 133 9.3 Der Approximationssatz von Weierstraß . . . . . . . . . . . . . . . . . . . . . . . 136 9.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
10 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 10.1 Der Satz von Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 10.2 Potenzreihen mit allgemeinem Entwicklungspunkt . . . . . . . . . . . . . . . 145 10.3 Der Abelsche Grenzwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 10.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 11 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 11.1 Trigonometrische Polynome und Fourierkoeffizienten . . . . . . . . . . . . 151 11.2 Konvergenz nach Dirichlet und Fej´er . . . . . . . . . . . . . . . . . . . . . . . . . . 154 11.3 Konvergenz im quadratischen Mittel . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 11.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 12 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 12.1 Kompakte metrische R¨aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 12.2 Charakterisierung kompakter Mengen . . . . . . . . . . . . . . . . . . . . . . . . . 171 12.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
Inhaltsverzeichnis
ix
13 Normierte Vektorr¨aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 13.1 Stetige lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 13.2 Kurven in Vektorr¨aumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 13.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 14 Totale Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 14.1 Totale und partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 14.2 Richtungsableitungen und Niveaumengen . . . . . . . . . . . . . . . . . . . . . . 196 14.3 Mittelwertsatz und stetig differenzierbare Abbildungen . . . . . . . . . . . 199 14.4 Ableitungen h¨oherer Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 14.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 15 Umkehrsatz und implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 15.1 Invertierbare lineare Abbildungen und Diffeomorphismen . . . . . . . . . 213 15.2 Lokale Invertierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 15.3 Implizit definierte Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 15.4 Extrema unter Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 15.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 16 Elementar l¨osbare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . 231 16.1 Der Satz von Picard-Lindel¨of . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 16.2 Differentialgleichungen mit getrennten Variablen . . . . . . . . . . . . . . . . 239 16.3 Lineare Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . 241 16.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 Bezeichnungen und Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
This page intentionally left blank
Einleitende Anmerkungen
Wesen Der Gegenstand der Mathematik ist schwer zu umgrenzen, jedenfalls schwieriger als der von Physik, Chemie oder Brauwissenschaft etc. F¨ur Mathematik ist nicht ihr Gegenstand charakterisierend als vielmehr die Art des Schließens. Von Alexander Markowitsch Ostrowski (1893-1986, Basel) [16] stammt folgendes Zitat: Jedesmal, wenn man aus einem endlichen, u¨ bersichtlich dargestellten System von scharf ” formulierten Pr¨amissen logisch einwandfreie Schl¨usse zieht, treibt man Mathematik.“
Insofern ließe sich als Gegenstand der Mathematik alles beschreiben, was sich auf endlich viele scharf formulierte Grundtatsachen (Axiome) ” zur¨uckf¨uhren l¨asst.“
Auf diesem Hintergrund erkl¨aren sich zumindest die Wesensz¨uge, die die Mathematik auszeichnen, • • • •
die Sch¨arfe der Begriffsbildung, die pedantische Sorgfalt im Umgang mit Definitionen, die Strenge der Beweise, die abstrakte Natur der mathematischen Objekte.
Mathematische Symbole Um der l¨uckenlosen Exaktheit und Klarheit zu gen¨ugen, hat sich eine Darstellung ¨ mathematischer Uberlegungen entwickelt (math. Symbolik), die f¨ur Nichtspezialisten (bzw. nicht pr¨azise und klar formulierende Personenkreise) schwer zug¨anglich ist. Hermann Weyl (1885-1955, Princeton) sagt: Ein auff¨alliger Zug aller Mathematik, der den Zugang zu ihr dem Laien so sehr erschwert, ” ist der reichliche Gebrauch von Symbolen.“
1
2
Einleitende Anmerkungen
Der mathematische Formalismus ist kein u¨ berfl¨ussiges Glasperlenspiel“. Die kom” plexen Zusammenh¨ange, die h¨ochsten Grad pr¨aziser Beschreibung bed¨urfen, lassen sich verbal und romanhaft nicht mehr darstellen. (Ein sch¨ones Beispiel findet man in der Einleitung im Buch von H.Heuser: Lehrbuch der Analysis [9]). Wir werden uns weitgehend an u¨ bliche Notation und Konventionen halten. Symbole wie z.B. ∀ ( f¨ur alle“) oder ∃ ( es existiert...“) und Begriffe wie etwa Menge ” ” oder Abbildung, die nicht nur in der Analysis sondern in allen Zweigen der Mathematik von grundlegender Bedeutung sind, wollen wir als bekannt voraussetzen. Wir verweisen hierzu auch auf die B¨ucher von O. Deiser [3] und H. Koch [12]. Historische Entwicklung Betrachtet man die Erfolge der großen Mathematiker der Vergangenheit und die heutigen Anforderungen an die Mathematik, so lassen sich orientiert um die eigentliche mathematische Methodik folgende weitere Aufgaben erkennen: • pr¨azise Abstraktion naturwissenschaftlicher, ingenieurwissenschaftlicher, lebenswissenschaftlicher oder o¨ konomischer Abl¨aufe in klar definierte mathematische Begriffe (mathematische Modellbildung), • begleitende h¨ochst-rechnerintensive Untersuchungen (numerische Simulation). Letzteres ist eine Entwicklung der letzten Jahre, erm¨oglicht durch die Verf¨ugbarkeit leistungsf¨ahiger Computer. In diesem Zusammenhang sollten die numerischen K¨unste der großen Mathematiker (insbesondere Carl Friedrich Gauß, 1777-1855) der Vergangenheit besonders erw¨ahnt werden. Da wir uns hier mit Analysis, d.h. im wesentlichen mit Infinitesimalrechnung befassen, wollen wir noch einen sehr kurzen Blick in deren Historie wagen. Die zentralen ersten Entwicklungspunkte werden Newton (Isaac Newton, 1643-1727, London) und Leibniz (Gottfried Wilhelm Leibniz, 1646-1716, Hannover, Berlin) zugeschrieben. Nat¨urlich findet man bereits bei Archimedes, Kepler, Cavalieri, Fermat, Pascal, Wallis, Huygens, Toricelli, Descartes Vorl¨aufer analytischer Methodik. Folgendes scheint klar zu sein: Die beiden Symbole d“ und “ wurden am 29. Oktober 1675 von Leibniz zum erstenmal ver” ” wendet. Der Blick von Leibniz galt grob gesprochen dem Tangentenproblem und der Quadratur (Berechnung von Fl¨acheninhalten), symbolisch dv = v dx . Newton hingegen entwickelte die Differential- und Integralrechnung innerhalb der so genannten Fluxionsrechnung. Dabei sind alle Gr¨oßen zeitabh¨angig, x = x(t) . ˙ die Ableitung nach t. Die Fluxion“ bezeichnet dann x, ” Im Jahr 1699 entstand der Priorit¨atsstreit zwischen Newton und Leibniz. Dabei wurde Leibniz vorgeworfen, die Differentialrechnung nicht selbst¨andig erfunden, sondern von Newton entlehnt zu haben. Bis 1710 wurden Argumente ausgetauscht,
Einleitende Anmerkungen
3
schließlich sprach sich eine eigens eingesetzte Kommission dahingehend aus, dass Newton der erste Erfinder der Infinitesimalrechnung ist. Leibniz und Newton blieben auch aus politischen Gr¨unden zerstritten. Erst im 19. Jahrhundert setzte sich durch, dass Leibniz und Newton unabh¨angig voneinander den Grundstock zur Analysis gelegt haben. Seither haben sich Generationen von Mathematikern mit der Analysis besch¨aftigt, die wir unm¨oglich alle hier erw¨ahnen k¨onnen. Zu den bekanntesten Lehrb¨uchern z¨ahlen etwa die Werke von J. Dieudonn´e [4] oder W. Rudin [19]. Als deutschsprachige B¨ucher auf diesem Gebiet seien unter anderen K. K¨onigsberger [13], [14] und H. Heuser [9] sowie O. Forster [7], [8] genannt.
This page intentionally left blank
Kapitel 1
Die reellen Zahlen
Die Menge IN := {1, 2, . . .} der nat¨urlichen Zahlen wollen wir hier als bekannt voraussetzen, ebenso wie die Menge ZZ := {0, ±1, ±2, . . .} der ganzen Zahlen. Weiter schreiben wir IN0 := IN ∪ {0} = {0, 1, 2, . . .}. Diese Mengen sind allesamt diskret, d.h. zwischen zwei aufeinander folgenden nat¨urlichen (oder ganzen) Zahlen liegt keine weitere nat¨urliche (oder ganze) Zahl. Eine wichtige Beweismethode, die auf den Grundeigenschaften von IN beruht, ist das Induktionsprinzip: Ist M eine Menge mit den Eigenschaften (i) 1 ∈ M (Die Zahl 1 ist ein Element von M), (ii) n ∈ M ⇒ n + 1 ∈ M (Ist n ∈ M, dann folgt n + 1 ∈ M), so gilt IN ⊆ M. Aus dem Induktionsprinzip leitet sich die Beweismethode der vollst¨andigen Induktion ab: Jeder nat¨urlichen Zahl n ∈ IN sei eine Aussage A(n) zugeordnet (die richtig oder falsch sein kann). Gelten (i) A(1) ist richtig“ (Induktionsanfang), ” (ii) A(n) ist richtig“ ⇒ A(n + 1) ist richtig“ (Induktionsschritt), ” ” so gilt A(n) ist richtig“ f¨ur alle n ∈ IN. ” Wir wollen dies hier nicht weiter vertiefen, sondern verweisen auf Lehrb¨ucher zur diskreten Mathematik, wie etwa Matouˇsek/Neˇsetˇril [15] oder Taraz [20].
1.1 Archimedisch angeordnete K¨orper Die Rechenoperationen (Addition, Multiplikation) f¨uhren uns von den nat¨urlichen und ganzen Zahlen zun¨achst zur Menge Q der rationalen Zahlen, m : m ∈ ZZ, n ∈ IN . Q := n R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_1, © Springer-Verlag Berlin Heidelberg 2012
5
6
1 Die reellen Zahlen
Die Menge Q gen¨ugt der folgenden Definition. Definition 1.1. Sei K eine Menge (mit mindestens 2 Elementen), auf der zwei Verkn¨upfungen + ( Addition“) und • ( Multiplikation“) gegeben sind, sodass gilt: ” ” (K1) Assoziativit¨at der Addition: a + (b + c) = (a + b) + c ∀a, b, c ∈ K. (K2) Neutrales Element der Addition: Es gibt 0 ∈ K mit der Eigenschaft 0 + a = a + 0 = a ∀a ∈ K. (K3) Inverses bezuglich ¨ Addition: Zu jedem a ∈ K gibt es −a ∈ K, sodass a + (−a) = 0. (K4) Kommutativit¨at der Addition: a + b = b + a ∀a, b ∈ K. (K5) Assoziativit¨at der Multiplikation: a • (b • c) = (a • b) • c ∀a, b, c ∈ K. (K6) Neutrales Element der Multiplikation: Es gibt 1 ∈ K mit der Eigenschaft 1 • a = a • 1 = a ∀a ∈ K. (K7) Inverses bezuglich ¨ Multiplikation: Zu jedem a ∈ K, a = 0, gibt es a−1 ∈ K, sodass a • a−1 = 1. (K8) Kommutativit¨at der Multiplikation: a • b = b • a ∀a, b ∈ K. (K9) Distributivit¨at: a • (b + c) = a • b + a • c ∀a, b, c ∈ K. Dann heißt K ein kommutativer K¨orper. An Stelle von a • b schreibt man auch kurz ab, statt a−1 gelegentlich auch 1a . Weiter schreibt man a − b f¨ur a + (−b) und an := a • a •. . .• a. n−mal
Folgerungen: Sei K ein kommutativer K¨orper. F¨ur a, b ∈ K gilt dann (i) (ii) (iii) (iv) (v)
−(−a) = a , (a−1 )−1 = a, a • 0 = 0, ab = 0 =⇒ a = 0 oder b = 0, a(−b) = −(ab) , insbesondere a(−1) = −a, (−a)(−b) = ab.
Diese Eigenschaften kann man leicht aus den Axiomen (K1)-(K9) folgern. Man fordert sie also nicht in der Definition, dennoch gelten sie in jedem kommutativen K¨orper. Wenn in obiger Definition alles außer (K8) erf¨ullt ist, spricht man von einem (nicht-kommutativen) K¨orper; in der Algebra werden K¨orper genauer untersucht. Wir wollen hier nur festhalten, dass Q mit der gew¨ohnlichen Addition und Multiplikation ein kommutativer K¨orper ist, IN und ZZ hingegen nicht. Wir werden bald noch weitere Beispiele f¨ur kommutative K¨orper kennen lernen: die Menge IR der reellen Zahlen sowie die Menge C der komplexen Zahlen. Eine weitere Eigenschaft, die Q (und auch IR aber nicht C, wie wir noch sehen werden) zu eigen ist, ist die M¨oglichkeit einer Anordnung.
1.1 Archimedisch angeordnete K¨orper
7
Definition 1.2. Ein kommutativer K¨orper K heißt angeordneter K¨orper, falls in K eine Teilmenge der positiven Elemente (Schreibweise: a > 0 steht f¨ur a ist ” positiv“) ausgezeichnet ist, die die folgenden Eigenschaften besitzt: (A1) (A2)
F¨ur jedes a ∈ K gilt genau eine der drei Bedingungen a > 0 oder a = 0 oder −a > 0. Aus a > 0 und b > 0 folgen a + b > 0 sowie ab > 0.
Ein angeordneter K¨orper heißt archimedisch angeordneter K¨orper, wenn er zus¨atzlich die folgende Eigenschaft hat: (A3)
Zu a > 0, b > 0 existiert ein n ∈ IN, sodass na := a + a + . . .+ a > b gilt. (Archimedisches Axiom) n−mal
Schreibweisen: Ist −a > 0, so heißt a negativ und man schreibt a < 0. Ist a − b > 0, so heißt a gr¨oßer als b und man schreibt a > b. a ≥ b bezeichnet a > b oder a = b. a < b bezeichnet b > a. a ≤ b bezeichnet a < b oder a = b. Einfache Folgerungen aus (A1) und (A2): (i) (ii) (iii) (iv) (v) (vi)
a < b, b < c =⇒ a < c (Transitivit¨at) a < b ⇐⇒ a + c < b + c f¨ur alle c ∈ K a < b, c > 0 =⇒ ca < cb a > b > 0 =⇒ 1a < 1b
0 ≤ a < b =⇒ a2 < b2 F¨ur a = 0 gilt a2 > 0.
(insbesondere 1 = 12 > 0)
In jedem angeordneten K¨orper gilt die folgende Ungleichung, die nach Jakob Bernoulli I (1654-1705, Basel) benannt ist. (Es gab noch einige weitere bekannte Mathematiker namens Bernoulli.) Satz 1.3 (Bernoulli-Ungleichung). Sei K ein angeordneter K¨orper. F¨ur jedes x ∈ K mit x ≥ −1 und alle n ∈ IN gilt (1 + x)n ≥ 1 + nx .
(1.1)
Beweis. Wir beweisen die Ungleichung mittels vollst¨andiger Induktion. F¨ur n = 1 hat man sogar Gleichheit. Gelte nun (1.1) f¨ur ein n ∈ IN. Dann folgt (iii)
(vi)
(1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx)(1 + x) = 1 + (n + 1)x + nx2 ≥ 1 + (n + 1)x und die Ungleichung ist auch f¨ur n + 1 erf¨ullt.
8
1 Die reellen Zahlen
Mit dem archimedischen Axiom folgt: Satz 1.4. Sei K ein archimedisch angeordneter K¨orper. Dann gelten: (a) (b)
Ist b > 1, so gibt es zu jedem M > 0 ein n ∈ IN derart, dass bn > M. Ist 0 < q < 1, so gibt es zu jedem > 0 ein n ∈ IN derart, dass qn < .
Beweis. (a) Setze x := b − 1 > 0. Mit Satz 1.3 gilt bn = (x + 1)n ≥ 1 + nx. Mit (A3) gibt es zu M > 0 ein n ∈ IN, sodass nx > M. Zusammengefasst gilt bn ≥ 1 + nx > 1 + M > M . Die Aussage (b) folgt aus (a), indem man b := q−1 und M := −1 setzt.
In jedem angeordneten K¨orper K kann man einen Absolutbetrag einf¨uhren. F¨ur a ∈ K definiert man a falls a ≥ 0 , |a| := −a falls a < 0 . Es gelten folgende Regeln: (1) (2)
|ab| = |a| |b|
|a + b| ≤ |a| + |b| und |a| − |b| ≤ |a − b| (Dreiecksungleichung)
Beweis. Regel (1) erh¨alt man mit den Folgerungen (iv) und (v) von Definition 1.1. Wir kommen zum Nachweis von (2). Es gelten ±a ≤ |a|, ±b ≤ |b|, und damit a + b ≤ |a| + |b| sowie −(a + b) ≤ |a| + |b|. Daraus folgt |a + b| ≤ |a| + |b|. Die zweite Ungleichung erh¨alt man aus |a| = |a − b + b| ≤ |a − b| + |b| und aus |b| = |b − a + a| ≤ |b − a| + |a| = |a − b| + |a|; damit gilt ±(|a| − |b|) ≤ |a − b|. Schreibweisen: (1)
Sind K ein kommutativer K¨orper und a1 , a2 , . . . , an ∈ K, so schreiben wir abk¨urzend n
ak := a1 + a2 + . . . + an .
k=1
(2) (3)
Wir setzen 0! := 1 sowie (n + 1)! := (n + 1) (n!) f¨ur n ∈ IN0 , also 1! = 1, 2! = 2 , 3! = 6 , 4! = 24 usw. (n! spricht man als n Fakult¨at “). ” F¨ur n, k ∈ IN0 , n ≥ k, erkl¨aren wir die Binomialkoeffizienten n n! . := k! (n − k)! k Seien K ein kommutativer K¨orper, a, b ∈ K und n ∈ IN. Wenn wir (a + b)n ausrechnen und dann zusammenfassen (vgl. Kapitel 1.4, Aufgabe 5), erhalten wir die so genannte Binomialformel, n n k n−k n a b (a + b) = . k=0 k
1.2 Intervallschachtelung und Vollst¨andigkeit
9
1.2 Intervallschachtelung und Vollst¨andigkeit Die Menge Q der rationalen Zahlen ist uns noch nicht umfassend genug; beispielsweise gibt es keine rationale Zahl x derart, dass x2 = 2 gilt. Angenommen, es w¨are x ∈ Q, x2 = 2, so schreibe x = qp als gek¨urzten Bruch mit p, q ∈ ZZ. Dann gilt 2q2 = p2 . Dann enth¨alt auch p die Zahl 2 als Faktor, d.h. p = 2r mit r ∈ ZZ. Folglich ist 2q2 = p2 = 4r2 und dann q2 = 2r2 . Somit enth¨alt q auch 2 als Faktor – im Widerspruch dazu, dass qp gek¨urzt ist. Mehr dazu findet man u.a. in [3, Kap. 1.1]. Wir wollen nun diese L¨ucken ” auff¨ullen“. n n+1
Beispiel 1.5. F¨ur n ∈ IN seien an := n+1 und bn := n+1 . n n F¨ur alle n ∈ IN gilt
n+1 n
> 1, also auch 0 < an < bn . Weiter gilt
2 n+1 (n + 2)n+1nn n + 1 (n2 + 2n)n+1 n + 1 an+1 n + 2n = = = an (n + 1)2n+1 n (n + 1)2n+2 n n2 + 2n + 1 n+1 1 1 n+1 n+1 1− 1− =1, = ≥ n (n + 1)2 n n+1 wobei wir im vorletzten Schritt die Bernoulli-Ungleichung verwendet haben. Ebenso erhalten wir 2 n+2 n+2 bn n + 2n + 1 1 (n + 1)2n+3 n n 1+ 2 = = = bn+1 (n + 2)n+2nn+1 n+1 n2 + 2n n+1 n + 2n n+2 n n+1 n 1+ 2 = =1. ≥ n+1 n + 2n n+1 n Damit gilt 0 < an ≤ an+1 < bn+1 ≤ bn f¨ur alle n ∈ IN und es folgt schließlich an < bk f¨ur alle n, k ∈ IN.
6 656 Aus b5 = 65 = 46 15 625 < 3 erhalten wir an < 3 und damit 3 1 an − an = < f¨ur alle n ∈ IN . bn − an = an 1 + n n n Hier stellt sich nun die Frage, ob es eine Zahl c gibt, sodass an ≤ c ≤ bn f¨ur alle n ∈ IN gilt. In Kapitel 5.7, Aufgabe 8 werden wir zeigen, dass c ∈ / Q ist. Dies war bereits ein erstes Beispiel f¨ur eine Intervallschachtelung; wir werden diesen Begriff im Folgenden noch allgemein definieren. In einem angeordneten kommutativen K¨orper K bezeichnen wir (a, b ∈ K, a ≤ b) die Mengen [a, b] := {x ∈ K : a ≤ x ≤ b} ]a, b] := {x ∈ K : a < x ≤ b}
[a, b[ := {x ∈ K : a ≤ x < b} ]a, b[ := {x ∈ K : a < x < b}
10
1 Die reellen Zahlen
als Intervalle. Erstere heißen abgeschlossen, letztere offen, die anderen bezeichnen wir als halboffen. Ist I eines dieser Intervalle, so bezeichnet |I| := b − a die L¨ange von I. Definition 1.6. Sei K ein archimedisch angeordneter kommutativer K¨orper. Eine Intervallschachtelung ist eine Folge (In )n∈IN von abgeschlossenen Intervallen In = [an , bn ] mit In+1 ⊆ In f¨ur alle n ∈ IN (d.h. a1 ≤ . . . ≤ an ≤ an+1 ≤ . . . ≤ bn+1 ≤ bn ≤ . . . ≤ b1 ). (ii) Zu jedem > 0 existiert ein n ∈ IN mit |In | = bn − an < .
(i)
Der K¨orper K heißt vollst¨andig, falls zu jeder Intervallschachtelung (In )n∈IN genau ein x ∈ K existiert mit x ∈ In f¨ur alle n ∈ IN. Es gibt weitere a¨ quivalente Charakterisierungen der Vollst¨andigkeit, siehe Kapitel 4.2 und auch [3]. Obige geht auf Karl Weierstraß (1815-1897, Berlin) zur¨uck. Die Menge IR der reellen Zahlen ist ein vollst¨andiger archimedisch angeordneter K¨orper. Wir werden uns k¨unftig, wenn Aussagen u¨ ber IR hergeleitet werden, letztendlich nur auf die genannten Gesetze (Axiome) st¨utzen. Diese Eigenschaften, d.h. (K1),...,(K9), (A1), (A2), (A3) und die Vollst¨andigkeit legen IR fest. Der K¨orper Q ist nicht vollst¨andig. Wir werden gleich feststellen, daß in IR stets Wurzeln existieren, in Q nicht. Auch die im folgenden Beispiel konstruierte Zahl e ist nicht rational (siehe auch Kapitel 5.7, Aufgabe 8). n n+1
Beispiel 1.7 (Eulersche Zahl). Seien an := n+1 , bn := n+1 , In := [an , bn ], n n so ist (In )n∈IN eine Intervallschachtelung, siehe Beispiel 1.5. Man bezeichnet
In = {e} .
n∈IN
Eine N¨aherung (im Dezimalsystem) f¨ur e ist e ≈ 2.71828182845904523536... Satz 1.8 (Existenz von Wurzeln). Zu jedem x ∈ IR, √ x > 0, und k ∈ IN existiert genau eine reelle Zahl y > 0 mit yk = x. Man schreibt y = k x oder y = x1/k . Beweis. Sei zun¨achst x ≥ 1. Wir konstruieren eine Intervallschachtelung In = [an , bn ] mit
n−1 akn ≤ x ≤ bkn und |In | = 12 |I1 | f¨ur n ∈ IN . (1.2) Dazu starten wir mit a1 := 1, b1 := x + 1, also I1 = [a1 , b1 ] = [1, x + 1] . Wegen x ≥ 1 gilt bk1 = (x + 1)k ≥ xk ≥ x ≥ 1k = ak1 , also ist (1.2) f¨ur n = 1 erf¨ullt.
1.2 Intervallschachtelung und Vollst¨andigkeit
11
Ist In = [an , bn ] mit (1.2) gegeben, so sei m := 12 (an + bn ) = an + 12 (bn − an). Wir setzen [an , m] , falls mk ≥ x , In+1 = [an+1 , bn+1 ] := [m, bn ] , falls mk < x . x an
m
bn
akn
mk
bkn
an+1 bn+1
Mit dieser Konstruktion ist (1.2) auch f¨ur In+1 erf¨ullt. Es ist In+1 ⊆ In ; ferner gibt es
n−1 mit Satz 1.4 zu jedem > 0 ein n ∈ IN mit 12 < x , also |In | < . Da IR vollst¨andig ist, existiert y ∈ IR mit
n∈IN
In = {y}.
Wir zeigen nun yk = x. Dazu beachte man, dass Ink := [akn , bkn ] ebenfalls eine Interk vallschachtelung ist. Es gilt In+1 ⊆ Ink , da In+1 ⊆ In , und k−1 k−1 + bk−2 . |Ink | = bkn − akn = (bn − an)(bk−1 n n an + . . . + an ) ≤ |In | k b1
, also |Ink | < . kbk−1 1 F¨ur alle n ∈ IN folgt x ∈ Ink mit (1.2) und wegen y ∈ In gilt yk ∈ Ink . Es gibt genau k ein Element in In und damit ist yk = x. Ist nun > 0, so existiert ein n ∈ IN mit |In | <
n∈IN
Zum Beweis der Eindeutigkeit nehmen wir an, es sei x = yk = zk mit y, z > 0. Aus y < z folgt x = yk < zk = x, ein Widerspruch (ebenso bei y > z). Also gilt hier y = z. Schließlich bleibt der Fall 0 < x < 1. 1 x
gibt es wie eben gezeigt ein y > 0 mit yk = 1x , also x =
1 yk
=
k 1 y
.
√ In Q kann man nicht Wurzeln jeder Zahl ziehen. Wie schon erw¨ahnt ist 2 nicht rational. Zur Bestimmung von Quadratwurzeln mittels Intervallschachtelung siehe auch Kapitel 1.4, Aufgabe 8. Zum Schluss dieses Abschnitts zeigen wir ein einfaches Lemma, das uns sp¨ater noch von Nutzen sein wird. √ √ √ Lemma 1.9. F¨ur 0 ≤ b < c und k ∈ IN gilt 0 < k c − k b ≤ k c − b. √ √ Beweis. Aus k c ≤ k b folgt c ≤ b unmittelbar√aus den √ Anordnungsaxiomen, im Widerspruch zur Voraussetzung. Also muss 0 < k c − k b sein. √ √ √ Angenommen, es gilt k c − k b > k c − b, so folgt √ √ √ √ √ √ √ k k k c = ( k c)k > ( b + k c − b)k = ( b)k + k · ( b)k−1 · k c − b + · · · + ( k c − b)k F¨ur
≥ b + (c − b) = c (alle Summanden sind nicht-negativ). Dies ist ein Widerspruch; damit ist die rechte Ungleichung ebenfalls bewiesen.
12
1 Die reellen Zahlen
1.3 Supremumseigenschaft Ist A ⊆ IR eine beliebige Menge reeller Zahlen, so heißt b ∈ IR eine obere Schranke (bzw. untere Schranke) von A, falls a ≤ b (bzw. a ≥ b) f¨ur alle a ∈ A gilt. Besitzt A eine obere Schranke, so heißt A nach oben beschr¨ankt. Entsprechend definiert man nach unten beschr¨ankt. Gilt beides, so nennt man A beschr¨ankt. Liegt eine obere (bzw. untere) Schranke b von A sogar in A selbst, so heißt diese Maximum (bzw. Minimum) von A; wir schreiben dann b = max A (bzw. b = min A). Beachte, dass max A und min A wegen (A1) eindeutig bestimmt sind, wenn sie existieren. Definition 1.10. Eine Zahl s ∈ IR heißt Supremum einer Menge A ⊆ IR, falls gilt: (i) (ii)
s ist obere Schranke von A und f¨ur jede obere Schranke t von A ist t ≥ s.
Das heißt, s ist die kleinste obere Schranke von A. Man schreibt s = sup A. Entsprechend definiert man s als das Infimum von A ⊆ IR, falls gilt: (i) (ii)
s ist untere Schranke von A und f¨ur jede untere Schranke t von A ist t ≤ s.
Das heißt, s ist die gr¨oßte untere Schranke von A. Man schreibt s = inf A. Bemerkung: Sei etwa A = [a, b] mit a, b ∈ IR, a < b, so ist b = max A = sup A. Das ˜ aber kein Maximum. Intervall A˜ = [a, b[ hingegen besitzt ein Supremum b = sup A, Auch Supremum und Infimum brauchen nicht immer zu existieren. Beispielsweise besitzen die nach oben unbeschr¨ankten Intervalle [a, [= {x ∈ IR : x ≥ a} kein Supremum. Zur Frage der Existenz sei auf den nachfolgenden Satz verwiesen. Existiert sup A (oder infA), so ist es eindeutig bestimmt: Sind s und s˜ zwei Suprema von A, so muss s ≤ s˜ und s˜ ≤ s gelten, also s = s. ˜ Satz 1.11 (Supremumseigenschaft). Jede nach oben (bzw. nach unten) beschr¨ankte nicht-leere Menge A ⊆ IR besitzt ein Supremum (bzw. Infimum). Beweis. Wir studieren hier nur den Fall, dass A nach oben beschr¨ankt ist. Dazu konstruieren wir eine Intervallschachtelung (In )n∈IN , In = [an , bn ], mit den Eigenschaften
n−1 (i) bn+1 − an+1 = 12 (bn − an) (daraus folgt |In | = 12 |I1 | f¨ur alle n), (ii) bn ist obere Schranke von A, (iii) an ist keine obere Schranke von A. Wir beginnen mit I1 = [a1 , b1 ], wobei b1 eine beliebige obere Schranke von A und a1 ∈ IR keine obere Schranke ist. Sind I1 , . . . , In bereits gefunden, sodass (i), (ii) und (iii) gelten, dann sei mn := 12 (an + bn). Offensichtlich ist an ≤ mn ≤ bn . Nun setze In+1 = [an+1 , bn+1 ] :=
[an , mn ] , [mn , bn ] ,
falls mn obere Schranke von A ist, falls mn keine obere Schranke von A ist.
1.3 Supremumseigenschaft
13
Damit gilt In+1 ⊆ In und bn+1 − an+1 = 12 (bn − an ). Ferner ist bn+1 eine obere Schranke von A und an+1 ist keine obere Schranke von A.
n−1 Ist nun > 0, so existiert laut Satz 1.4 ein n ∈ IN mit 12 < b1 −a . Folglich gilt 1 |In | < ; damit ist (In )n∈IN eine Intervallschachtelung. Wegen der Vollst¨andigkeit gibt es eine Zahl s ∈ IR mit {s} =
In .
n∈IN
Wir zeigen s = sup A. Dazu ist nachzuweisen: (a) (b)
s ist eine obere Schranke von A und s ist kleinste obere Schranke von A.
Zu (a): Angenommen, es gibt x ∈ A mit s < x. Dann existiert zu := x − s ein n ∈ IN mit bn − an < = x − s. Wegen s ∈ [an , bn ] gilt bn − s ≤ bn − an < x − s und damit bn < x im Widerspruch dazu, dass bn obere Schranke von A ist. Zu (b): Angenommen, es gibt eine obere Schranke s˜ von A mit s˜ < s. Dann existiert zu := s − s˜ ein n ∈ IN mit bn − an < = s − s. ˜ Weiter folgt wegen s ∈ [an , bn ] nun s − an ≤ bn − an < s − s, ˜ also an > s. ˜ Damit gilt aber an > s˜ ≥ x f¨ur alle x ∈ A, d.h. an ist obere Schranke von A, ein Widerspruch. Damit ist s = sup A gezeigt.
Man kann zeigen, dass ein archimedisch angeordneter K¨orper, der die Supremumseigenschaft erf¨ullt, stets vollst¨andig ist. Daher kann man die Vollst¨andigkeit auch mittels Supremumseigenschaft definieren (das wird auch gelegentlich so gemacht). Eine weitere Charakterisierung der Vollst¨andigkeit erfolgt u¨ ber so genannte Cauchyfolgen, siehe Kapitel 4.2. Lemma 1.12. Seien A, B nicht-leere nach oben beschr¨ankte Teilmengen von IR. (a) (b)
Ist A ⊆ B, so gilt sup A ≤ sup B. Bezeichnen A + B := {a + b : a ∈ A, b ∈ B}, rA := {ra : a ∈ A} f¨ur r ∈ IR und A · B := {ab : a ∈ A, b ∈ B}, so hat man sup(A + B) = sup A + supB , sup(rA) = r sup A , falls r ≥ 0 , sup(A · B) = sup A sup B ,
falls A, B ⊆ [0, [ .
Entsprechende Aussagen gelten f¨ur das Infimum, falls A und B nach unten beschr¨ankt sind. Beweis. Seien := sup A, := sup B. (a) Es ist eine obere Schranke von A, denn aus ≥ x ∀x ∈ B folgt ≥ x ∀x ∈ A. Da die kleinste obere Schranke von A und eine obere Schranke von A ist, folgt ≤ .
14
1 Die reellen Zahlen
(b) Aus a ≤ ∀a ∈ A und b ≤ ∀b ∈ B folgt a + b ≤ + ∀a ∈ A, b ∈ B, also sup(A + B) ≤ + . Mit der Definition des Supremums als kleinste obere Schranke existieren zu jedem > 0 ein a0 ∈ A und ein b0 ∈ B mit a0 > − 2 und b0 > − 2 . Damit ist a0 + b0 > ( + ) − . Da > 0 beliebig klein gew¨ahlt werden darf, ist + die kleinste obere Schranke von A + B. Aus ≥ x ∀x ∈ A folgt r ≥ rx ∀x ∈ A und weiter r ≥ y ∀y ∈ rA. Also ist r eine obere Schranke von rA. Sei nun a < r . Dann ist ar < , d.h. ar ist keine obere Schranke von A; folglich gibt es ein x ∈ A mit ar < x. Damit ist rx ∈ rA und a < rx; also ist a keine obere Schranke von rA. Damit folgt: r ist kleinste obere Schranke von rA. Im Fall A, B ⊆ [0, [ gilt , ≥ 0. F¨ur = 0 oder = 0 gilt A · B = {0} und die Behauptung ist offensichtlich wahr. Wir k¨onnen also , > 0 annehmen. Aus x ≤ ∀x ∈ A und y ≤ ∀y ∈ B folgt dann xy ≤ ∀x ∈ A, y ∈ B. Also ist eine obere Schranke von A · B. Wir nehmen nun an, dass nicht die kleinste obere Schranke von A · B ist. Dann gibt es ein c ∈ IR mit c < und c ≥ x ∀x ∈ A · B. Wir −c setzen := + . Es gilt > 0 und nach Definition des Supremums gibt es a ∈ A mit a > − sowie b ∈ B mit b > − . Daraus folgt ab > ( − )( − ) = − ( + ) + 2 ≥ − ( + ) = c im Widerspruch dazu, dass c obere Schranke von A · B ist. Damit ist tats¨achlich die kleinste obere Schranke von A · B. Die entsprechenden Aussagen f¨ur das Infimum zeigt man ganz analog.
Wir schließen diesen Abschnitt mit einigen Resultaten zur Lage von IN, ZZ und Q innerhalb IR. Vorweg zeigen wir ein Resultat u¨ ber IN, das auf den ersten Blick selbstverst¨andlich erscheint. Man bedenke aber, dass wir IR abstrakt nur als einen vollst¨andigen archimedisch angeordneten K¨orper erkl¨art haben; Begriffe wie Supremum oder Maximum haben wir definiert v¨ollig unabh¨angig davon, ob oder wie wir IN in IR wiederfinden. Satz 1.13. Sei A ⊆ IN ⊆ IR eine nicht-leere Menge nat¨urlicher Zahlen. Es gilt: (a) (b)
A besitzt ein Minimum. Ist A beschr¨ankt, so hat A ein Maximum.
Beweis. (a) Sei U := {n ∈ IN : n ist untere Schranke von A}. Dann gilt offensichtlich 1 ∈ U. Außerdem ist U eine echte Teilmenge von IN, denn ist k ∈ A, so ist k+1 ∈ / U. Mit dem Induktionsprinzip finden wir ein n0 ∈ U mit n0 + 1 ∈ / U, sonst w¨are U = IN. Wir zeigen n0 = min A. Es gilt n0 ≤ n ∀n ∈ A. Zu zeigen bleibt n0 ∈ A. W¨are n0 ∈ / A, so w¨are n0 < m ∀m ∈ A und damit m − n0 ≥ 1. Das heißt m ≥ n0 + 1 ∀m ∈ A, woraus n0 + 1 ∈ U folgt – im Widerspruch zu oben. (b) Sei s := sup A. Nach (A3) existiert ein n1 ∈ IN mit s < n1 . Damit gilt k ≤ s < n1 f¨ur alle k ∈ A, also n1 − k ∈ IN ∀k ∈ A. Laut (a) existiert m := min{n1 − k : k ∈ A}. Dann ist n1 − m = max A.
1.4 Aufgaben
15
Satz 1.14. (a) Zu jedem x ∈ IR existiert genau ein k ∈ ZZ mit k ≤ x < k + 1. (b) Zu je zwei reellen Zahlen a, b mit a < b gibt es eine Zahl r ∈ Q mit a < r < b. Die Zahl k gem¨aß Aussage (a) wird mit [x] bezeichnet. Demnach ist [x] die gr¨oßte ganze Zahl, die kleiner oder gleich x ist. Man nennt [ ] auch Gaußklammer. Beweis. (a) Nach (A3) existiert ein n ∈ IN mit 1 − x < n, also 1 < n + x. Laut Satz 1.13 existiert eine gr¨oßte Zahl m ∈ IN mit m ≤ n + x. Damit ist k := m − n die gr¨oßte ganze Zahl, die kleiner oder gleich x ist. (b) W¨ahle n ∈ IN mit 1n < b − a und setze k := [na]. F¨ur r := 1 1+an 1+k r > na n = a und b > n + a = n ≥ n = r.
k+1 n
∈ Q gilt dann
1.4 Aufgaben 1. Beweisen Sie die im Anschluss an Definition 1.1 angegebenen Folgerungen. Geben Sie in jedem Schritt an, welches Axiom Sie dabei ben¨utzen. 2.
a b
< dc .
Folgern Sie aus den Axiomen: Es gilt stets
<
a. Seien a, b, c, d positive reelle Zahlen mit
a b
b. Gibt es positive reelle Zahlen a, b, c, d derart,
a+c b+d < dass ab +
c d. c a+c d = b+d
gilt?
3. Beweisen Sie die nach Definition 1.2 genannten Folgerungen. 4. Zeigen Sie, dass IF2 := {⊥, } mit den durch ⊥ + ⊥ := ⊥ ,
⊥ + := ,
+ ⊥ := ,
+ := ⊥ ,
⊥ • ⊥ := ⊥ ,
⊥ • := ⊥ ,
• ⊥ := ⊥ ,
• := ,
erkl¨arten Operationen ein kommutativer K¨orper ist. 5. Seien K ein kommutativer K¨orper, a, b ∈ K und n ∈ IN. Weisen Sie die Binomialformel n n k n−k n (a + b) = a b k=0 k mittels vollst¨andiger Induktion nach. 6. Zeigen Sie: Zu jedem > 0 gibt es ein N ∈ IN mit 1 √ < n
f¨ur alle n ≥ N .
16
1 Die reellen Zahlen
7. Besitzen die folgenden Mengen ein Minimum, Maximum, Infimum, Supremum ? M1 := {x ∈ IR : x2 > 7} 1 1 1 n : n ∈ IN M3 := + : m, n ∈ IN M2 := (−1) 1 − n n m Bestimmen Sie diese gegebenenfalls. 8. Arithmetrisches, Geometrisches und Harmonisches Mittel; eine Intervallschachtelung f¨ur die Quadratwurzel. Seien a, b positive reelle Zahlen. Wir setzen A(a, b) :=
a+b , 2
G(a, b) :=
√ ab ,
H(a, b) :=
1 A( 1a , 1b )
=
2ab . a+b
a. Zeigen Sie: Es gilt min{a, b} ≤ H(a, b) ≤ G(a, b) ≤ A(a, b) ≤ max{a, b}, wobei Gleichheit nur im Fall a = b auftritt. Nun sei 0 < a < b. Wir setzen a1 := a, b1 := b und an+1 := H(an , bn ) ,
bn+1 := A(an , bn )
f¨ur n ∈ IN .
b. Zeigen Sie: F¨ur alle n ∈ IN gilt an < bn . c. Zeigen√Sie: Die Intervalle In := [an , bn ] bilden eine Intervallschachtelung; es gilt ab ∈ In ∀n ∈ IN. 1 (bn − an)2 . d. Zeigen Sie: F¨ur alle n ∈ IN gilt bn+1 − an+1 ≤ 4a
√
√
1 . e. Berechnen Sie eine N¨aherung c f¨ur 2 mit c − 2 ≤ 10000
9. Seien x ∈ IR \ Q und r ∈ Q. Zeigen Sie: a. Es gilt x + r ∈ IR \ Q. b. Im Fall r = 0 gilt auch rx ∈ IR \ Q.
Kapitel 2
Die komplexen Zahlen
In IR k¨onnen wir zwar aus jeder positiven Zahl die Wurzel ziehen, aber es gibt z.B. keine reelle Zahl x mit x2 = −1. Wir wollen nun einen kommutativen K¨orper C, die Menge der komplexen Zahlen, konstruieren, in dem es eine Zahl i gibt mit i2 = −1 und der die reellen Zahlen enth¨alt. Dabei m¨ussen wir allerdings auf die archimedische Anordnung verzichten.
2.1 Konstruktion der komplexen Zahlen Wir definieren die Menge der komplexen Zahlen als Menge von Paaren reeller Zahlen, C := IR × IR = {(x, y) : x, y ∈ IR}. Eine komplexe Zahl z = (x, y) schreiben wir auch in der Form z = x + iy . Dabei entspricht i = 0 + 1 i = (0, 1). Ferner heißen Re z := x der Realteil von z und Im z := y der Imagin¨arteil von z. Wir fassen IR k¨unftig als Teilmenge von C auf: IR = {x + 0i : x ∈ IR} = {z ∈ C : Im z = 0} ⊂ C. Die Menge C ist mit und
(x + iy) + (u + iv) := (x + u) + i(y + v) als Addition (x + iy)(u + iv) := (xu − yv) + i(xv + yu) als Multiplikation
ein kommutativer K¨orper; man kann leicht nachpr¨ufen, dass (K1),. . . ,(K9) hier erf¨ullt sind. Die imagin¨are Einheit i ist dabei besonders ausgezeichnet. Es gilt i2 = −1. Insbesondere gibt es keine Anordnung auf C, die (A1) und (A2) erf¨ullt, denn dann m¨usste i2 > 0 gelten! F¨ur z ∈ C \ IR sind daher Aussagen wie z > 0 “ nicht sinnvoll. Man kann aber ” einen Absolutbetrag in C einf¨uhren. F¨ur z = x + iy ∈ C setzt man |z| := x2 + y2 . √ Dies ist im Fall x2 + y2 > 0 laut Satz 1.8 wohldefiniert; sonst setze 0 := 0. R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_2, © Springer-Verlag Berlin Heidelberg 2012
17
18
2 Die komplexen Zahlen
i IR
Grafisch stellt man C u¨ blicherweise als Ebene dar. Im kartesischen (x, y)Koordinatensystem ist |z| dann der Abstand des Punktes z vom Nullpunkt.
i iy
F¨ur z = x + iy nennt man z := x − iy die zu z konjugiert komplexe Zahl.
0
Es gelten die folgenden Rechenregeln, die man leicht herleiten kann.
−iy
z = (x, y) = x + iy |z| 1
x
IR
z
Satz 2.1. Seien z, w ∈ C. Dann gelten: (1) (2) (3) (4) (5) (6) (7) (8) (9)
z + w = z + w , zw = z w z=z Re z = 12 (z + z) , Im z = 2i1 (z − z) |Re z| ≤ |z| , |Im z| ≤ |z| |z| ≤ |Re z| + |Im z| √ |z| = z z |z| = |z| = | − z| |zw| = |z| |w| Stets ist |z| ≥ 0 ; |z| = 0 ist a¨ quivalent zu z = 0. Gesondert wollen wir die Dreiecksungleichung auff¨uhren.
Satz 2.2. Seien z, w ∈ C. Es gelten (a) (b)
|z + w| ≤ |z| + |w| , | |z| − |w| | ≤ |z − w| .
Beweis. Es ist |z + w|2 = (z + w) (z + w) = z z + z w + z, w + w w = |z|2 + 2Re (z w) + |w|2 ≤ |z|2 + 2 |Re (z w)| + |w|2 ≤ |z|2 + 2 |z w| + |w|2 = (|z| + |w|)2 . Daraus folgt (a). Die Aussage (b) zeigt man nun wie im Reellen.
Zur Veranschaulichung sei erw¨ahnt, dass f¨ur a ∈ C und r > 0 durch Ur (a) := {z ∈ C : |z − a| < r}
und
Kr (a) := {z ∈ C : |z − a| ≤ r} eine offene (bzw. abgeschlossene) Kreisscheibe um a mit Radius r bestimmt ist. (Die Begriffe offen und abgeschlossen werden wir in Kapitel 12 noch allgemein definieren.)
2.1 Konstruktion der komplexen Zahlen
19
Beispiel: F¨ur festes w ∈ C umfasst die Menge {z ∈ C : |z − w| = 2} genau diejenigen komplexen Zahlen, die von w den Abstand 2 haben. Es handelt sich also um einen Kreis mit Mittelpunkt w und Radius 2. Die Abbildung rechts zeigt diese f¨ ur w = 1 √ √ und w = 2(1 + i). Im Fall w = 2(1 + i) liegt der Nullpunkt auf diesem Kreis, denn f¨ur z = 0 gilt hier √ 2 √ 2 |z − w| = |w| = 2 + 2 =2.
√ 2(1 + i)
i 0
1
Wir nennen eine Teilmenge A ⊆ C beschr¨ankt, falls es ein M ≥ 0 gibt, sodass |z| ≤ M f¨ur alle z ∈ A gilt. Beachte aber, dass man Begriffe wie Supremum und Maximum f¨ur Teilmengen von C nicht einf¨uhren kann. Die folgende wichtige algebraische Eigenschaft des K¨orpers C sollte nicht unerw¨ahnt bleiben. Satz 2.3 (Fundamentalsatz der Algebra). Seien a0 , . . . , an−1 ∈ C. Die Gleichung zn + an−1zn−1 + . . . + a1z + a0 = 0 hat in C mindestens eine L¨osung. Bemerkung: Im Reellen stimmt diese Aussage nicht, z.B. gibt es keine reelle Zahl x, die die Gleichung x2 + 1 = 0 erf¨ullt. Der Fundamentalsatz der Algebra wurde erstmals von Carl Friedrich Gauß bewiesen, inzwischen ist eine Vielzahl ganz unterschiedlicher Beweise bekannt. Mit den uns bis hier zur Verf¨ugung stehenden Mitteln k¨onnen wir diesen Satz allerdings noch nicht beweisen; wir werden dieses Resultat f¨ur unsere Zwecke auch nicht weiter ben¨otigen. Mit Mitteln der Funktionentheorie kann man den Fundamentalsatz der Algebra recht leicht zeigen, bei Remmert/Schumacher [17] etwa findet man vier verschiedene Beweise. F¨ur weitere Beweise dieses Satzes, die nur auf Resultaten der Analysis basieren, sei u.a. auf K¨onigsberger [13] oder Beals [2] verwiesen. F¨ur einen rein algebraischen Beweis siehe z.B. Karpfinger/Meyberg [11]. Beispiel: Die dritten Einheitswurzeln. Wir wollen alle komplexen Zahlen bestimmen, die die Gleichung z3 = 1 erf¨ullen. Wie u¨ blich schreiben wir z = x + iy. Dann ist (x + iy)3 = x3 + 3x2 iy + 3x(iy)2 + (iy)3 = x3 − 3xy2 + i(3x2 y − y3) .
20
2 Die komplexen Zahlen
Es gilt also z3 = 1 + 0i genau dann, wenn x3 − 3xy2 = 1
und
3x2 y − y3 = 0
(2.1)
erf¨ullt ist. √ F¨ur y = 0 lautet die zweite Gleichung 3x2 = y2 ; es folgt y = ± 3 x. Setzen√wir dies in die erste Gleichung ein, ergibt sich −8x3 = 1, also x = − 12 und y = ± 12 3. F¨ur y = 0 ist die zweite Gleichung in (2.1) erf¨ullt und die erste Gleichung liefert x3 = 1, also x = 1. Die Gleichungen (2.1) sind daher genau dann erf¨ullt, wenn x und y einer der Bedingungen (1) (2) (3) gen¨ugen. Insgesamt haben wir also drei L¨osungen von z3 = 1 gefunden. Es gilt |z1 | = |z2 | = |z3 | = 1 und z1 + z2 + z3 = 0. Diese Punkte bilden die Ecken eines gleichseitigen Dreiecks, siehe auch Aufgabe 5.
1 x=− , 2 1 x=− , 2 x = 1,
1√ 3, 2 1√ y=− 3, 2 y=
y=0, √ z1 = − 12 + 12 3 i z3 = 1
√ z2 = − 12 − 12 3 i
2.2 Aufgaben 1. Stellen Sie die folgenden komplexen Zahlen in der Form x + iy dar: a. 2i + 2i1 b.
1+3i 1−2i
c. (1 + i)43 2. Skizzieren Sie die folgenden Punktmengen in C: a. {z ∈ C : |z| = c} f¨ur c = 12 , c = 1 und c = 2 b. {z ∈ C : Re z > 0} c. z ∈ C : z = 1z
2.2 Aufgaben
21
3. Geben Sie f¨ur a. z = i , b. z = 1 + i , c. z = 2 − 3i , d. z = − √12 − √12 i , jeweils z2 , i z und 1z in der Form x + iy an und skizzieren Sie alle diese Punkte in der komplexen Ebene. 4. Gegeben Sei eine komplexe Zahl w. Bestimmen Sie alle z ∈ C mit z2 = w. 5. Es seien z1 , z2 , z3 ∈ C mit z1 + z2 + z3 = 0 und |z1 | = |z2 | = |z3 | = c > 0. Zeigen Sie: z1 , z2 , z3 sind die Eckpunkte eines gleichseitigen Dreiecks. Tipp: Schreiben Sie die Ausdr¨ucke |z1 − z2 |2 + |z2 − z3 |2 , |z2 − z3 |2 + |z3 − z1 |2 und |z3 − z1 |2 + |z1 − z2 |2 mit Hilfe von |z|2 = z z als Summe und benutzen Sie die Voraussetzungen um zu folgern, dass |z1 − z2 | = |z2 − z3 | = |z3 − z1 | gilt. 6. Zeigen Sie: F¨ur alle z, w ∈ C gilt
|z + w|2 + |z − w|2 = 2 |z|2 + |w|2 . Interpretieren Sie diese Gleichung geometrisch. 7. F¨ur z, w ∈ C sei z ≺ w : ⇐⇒ Re z < Re w oder Re z = Re w und Im z < Im w . Zeigen Sie: ≺ erf¨ullt (A1). Insbesondere gilt f¨ur beliebige z, w ∈ C genau eine der drei Bedingungen z ≺ w, z = w oder w ≺ z. Zeigen Sie weiter, dass (A2) hier nicht gilt.
This page intentionally left blank
Kapitel 3
Folgen reller und komplexer Zahlen
Wir haben in Kapitel 1 gesehen, dass man mit Folgen von Intervallen reelle Zahlen n
definiert. Dort haben wir schon beobachten k¨onnen, dass an = 1 + 1n der EulerZahl e mit wachsendem n immer n¨aher kommt. Auf Fourier (Jean-Baptiste Joseph Fourier, 1768-1830, Paris) geht etwa die n¨aherungsweise Bestimmung von 4 durch Folgen sn , die sich als Summen schreiben, zur¨uck: 1 1 1 1 sn = 1 − + − + . . . ± (−1)n , 3 5 7 2n + 1 siehe auch Kapitel 11.2, Beispiel (1). Was passiert, wenn man Summen rn = 1 +
1 1 1 + + ... + 2 3 n
betrachtet, n¨ahern sie sich einer Zahl an (und was genau ist darunter u¨ berhaupt zu verstehen?); wenn ja, welcher? Dar¨uber hinaus stellen sich Fragen nach m¨oglichst schneller N¨aherung an bestimmte Zahlen, z.B. e oder . Obige Ann¨aherung an 4 ist sehr langsam. Beispielsweise wird heutzutage √ 8 n (4k)! 1103 + 26390k 1 sn = −→ 4 4k 9801 k=0 (k!) 396 zur Berechnung von etwa 2 Milliarden Stellen von benutzt. Letzteres stammt von Srinivasa Ramanujan (1887-1920, Madras, Cambridge).
3.1 Folgen und Grenzwerte Eine Folge (an )n∈IN reeller Zahlen an ∈ IR (oder komplexer Zahlen an ∈ C) ist eine Abbildung von der Menge der nat¨urlichen Zahlen in die Menge der reellen (oder komplexen) Zahlen, d.h. jedem n ∈ IN wird eine Zahl an zugeordnet. Zun¨achst sei R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_3, © Springer-Verlag Berlin Heidelberg 2012
23
24
3 Folgen reller und komplexer Zahlen
erw¨ahnt, dass eine Folge (an )n∈IN etwas anderes ist als die Menge {an : n ∈ IN}. Folge kommt es auf die Reihenfolge an. So sind etwa ((−1)n )n∈IN und
Bei der n+1 (−1) zwei verschiedene Folgen, w¨ahrend die Menge der Folgenglieder in n∈IN beiden F¨allen {−1, 1} ist. Analog kann man auch Folgen der Form (an )n∈IN0 oder gar (an )n∈ZZ erkl¨aren. Definition 3.1. Sei (an )n∈IN eine Folge reeller (oder komplexer) Zahlen. Man sagt, die Folge konvergiert gegen a ∈ IR (bzw. a ∈ C), falls gilt: Zu jedem > 0 existiert ein N ∈ IN mit |an − a| <
f¨ur alle n ≥ N .
Die Zahl a heißt dann Grenzwert (auch: Limes) der Folge.
C
IR a Alle an mit n ≥ N liegen in ]a − , a + [.
Alle an mit n ≥ N liegen in U (a).
Bemerkung: Grenzwerte sind eindeutig bestimmt. Beweis. Seien a, b Grenzwerte der Folge (an )n∈IN . Dann gibt es zu jedem > 0 nat¨urliche Zahlen N, M mit |an − a| <
f¨ur alle n ≥ N
und
|an − b| <
f¨ur alle n ≥ M .
Daraus folgt |b − a| = |(ak − a) − (ak − b)| ≤ |ak − a| + |ak − b| < 2 , wobei etwa k := max{N, M} sei. F¨ur jedes > 0 gilt also |b − a| < 2 ; es bleibt nur |b − a| = 0.
Schreibweise: Konvergiert die Folge (an )n∈IN gegen a, so schreibt man a = lim an n→
oder
an → a mit n → .
Gilt speziell lim an = 0, so bezeichnet man (an )n∈IN auch als Nullfolge. n→ Beispiele: (1) (2)
Sei an := a f¨ur alle n ∈ IN. Dann gilt lim an = a, denn |an − a| = 0 ∀n ∈ IN. n→
Sei an :=
1 n
f¨ur n ∈ IN. Hier gilt lim an = 0. n→
Begr¨ Zu > 0 existiert N ∈ IN mit
1 undung:
− 0 = 1 ≤ 1 < f¨ur alle n ≥ N. n n N (3)
Sei an :=
n+1 n
1
< N, vgl. (A3); folglich gilt
1
= . = 1 + 1n f¨ur n ∈ IN. Es gilt lim an = 1, denn 1 − n+1 n n n→
3.1 Folgen und Grenzwerte
(4) (5)
25
n
Sei an := 1 + 1n f¨ur n ∈ IN. Es gilt lim an = e (Beispiel 1.7, Korollar 3.4). n→
qn
Seien q ∈ C mit |q| < 1, an := f¨ur n ∈ IN. Es ist lim an = 0 wegen |qn − 0| = |q|n und Satz 1.4(b). n→
(6)
n
Seien q ∈ C mit |q| < 1, sn := qk f¨ur n ∈ IN. Es gilt lim sn = k=0
n→
1 1−q .
Begr¨undung: F¨ur q = 0 ist (1 − q)sn = 1 − qn+1 und folglich
n+1
1
qn+1
1 (5)
sn − 1 = 1 − q − = = |q|n+1 −→ 0 .
1 − q 1 − q 1 − q 1 − q |1 − q| n
Sei (an )n∈IN eine Folge und sn := ak wie im vorangehenden Beispiel. k=1
Falls (sn )n∈IN konvergiert, so schreibt man
lim sn . ak := n→
k=1
Man bezeichnet dies als Reihe und (sn )n∈IN als Folge ihrer Partialsummen. Man kann (und das wird tats¨achlich gemacht) den Ausdruck
ak
k=1
auch als einfache Abk¨urzung f¨ur die Folge der Partialsummen (sn )n∈IN verwenden. Dieses Symbol hat also, je nach Zusammenhang, zwei verschiedene Bedeutungen: Es bezeichnet entweder die Reihe an sich oder aber deren Grenzwert.
Beispielsweise nennt man qk die Geometrische Reihe. k=0
Wir werden in Kapitel 5 noch in einer allgemeineren Situation auf Reihen zu sprechen kommen. Satz 3.2. Ist (an )n∈IN eine konvergente Folge, so ist die Menge {an : n ∈ IN} beschr¨ankt. Beweis. Sei a := lim an . Dann existiert ein N ∈ IN mit |an − a| < 1 ∀n ≥ N, also n→
|an | ≤ |an − a| + |a| < 1 + |a| ∀n ≥ N . Mit M := max {|a1 |, |a2 |, . . . , |aN−1 |, 1 + |a|} gilt nun |an | ≤ M f¨ur alle n ∈ IN.
Wir haben mit Satz 3.2 eine notwendige Bedingung f¨ur die Konvergenz einer Folge, n¨amlich die Beschr¨anktheit von {an : n ∈ IN}, gefunden. Zum Beispiel kann (qn )n∈IN nicht konvergieren, falls |q| > 1 ist, da dann {qn : n ∈ IN} unbeschr¨ankt ist, siehe Satz 1.4(a).
26
3 Folgen reller und komplexer Zahlen
Der folgende Satz enth¨alt ein hinreichendes Kriterium f¨ur Konvergenz. Eine Folge (an )n∈IN reeller Zahlen heißt monoton wachsend (bzw. monoton fallend), falls an+1 ≥ an (bzw. an+1 ≤ an ) f¨ur alle n ∈ IN gilt. Satz 3.3. (a) Jede monoton wachsende und nach oben beschr¨ankte Folge (an )n∈IN reeller Zahlen konvergiert gegen das Supremum von {an : n ∈ IN}, d.h. lim an = sup{an : n ∈ IN} .
n→
(b) Jede monoton fallende und nach unten beschr¨ankte Folge (an )n∈IN reeller Zahlen konvergiert gegen das Infimum von {an : n ∈ IN}, d.h. lim an = inf{an : n ∈ IN}. n→
Beweis. Wir f¨uhren den Nachweis hier nur f¨ur den Fall einer monoton wachsenden und nach oben beschr¨ankten Folge. Laut Satz 1.11 existiert s := sup{an : n ∈ IN}. Sei nun > 0. Dann gibt es ein N ∈ IN mit aN > s − , denn sonst w¨are s nicht die kleinste obere Schranke. Mit aN ≤ an ≤ s folgt |an − s| ≤ s − aN < f¨ur alle n ≥ N.
Man schreibt auch sup an := sup{an : n ∈ IN}, inf an := inf{an : n ∈ IN}. n∈IN
n∈IN
Wir notieren noch eine einfache Folgerung. Korollar 3.4. Sei (In )n∈IN eine Intervallschachtelung, In = [an , bn ], so gilt lim an = sup an = a = inf bn = lim bn
n→
n∈IN
n∈IN
n→
mit
In = {a} .
n∈IN
3.2 Rechnen mit Grenzwerten Die folgenden Rechenregeln erleichtern die Bestimmung von Grenzwerten. Satz 3.5. Seien (an )n∈IN , (bn )n∈IN zwei Folgen mit a = lim an und b = lim bn . n→ n→ Es gelten: (1) (2) (3) (4) (5) (6)
lim |an | = |a|
n→
lim ( an ) = a
n→
( ∈ C)
lim (an + bn ) = a + b
n→
lim (an bn ) = ab
n→
Ist b = 0, so existiert ein n0 ∈ IN mit bn = 0 f¨ur alle n ≥ n0 , und die Folge (an /bn )n≥n0 konvergiert gegen ab . √ √ Ist an ≥ 0 f¨ur alle n, so gilt lim k an = k a (k ∈ IN). n→
3.2 Rechnen mit Grenzwerten
27
Beweis. (1) Seien > 0 und N ∈ IN mit |an − a| < ∀n ≥ N. Dann gilt auch | |an | − |a| | ≤ |an − a| < ∀n ≥ N. (2) Der Fall = 0 ist trivial. Andernfalls findet man zu > 0 nun ein N ∈ IN mit |an − a| < | | ∀n ≥ N. Damit gilt | an − a| < ∀n ≥ N. (3) Zu > 0 w¨ahle N ∈ IN mit |an − a| < /2 und |bn − b| < /2 f¨ur alle n ≥ N. Es folgt |(an + bn) − (a + b)| ≤ |an − a| + |bn − b| <
+ = 2 2
f¨ur alle n ≥ N .
(4) Nach Satz 3.3 existiert ein M > 0 mit |an | ≤ M f¨ur alle n ∈ IN. Setze K := max{|b|, M}. Zu > 0 existiert ein N ∈ IN mit |an − a| < /2K und |bn − b| < /2K f¨ur alle n ≥ N. Damit gilt |an bn −ab| = |an(bn −b)+(an −a)b| ≤ |an||bn −b|+|b||an −a| < K
+K = 2K 2K
f¨ur alle n ≥ N. (5) Mit dem vorangehenden Ergebnis gen¨ugt es, den Fall an = 1 zu betrachten. Es existiert ein n0 ∈ IN mit |b| − |bn| ≤ |b − bn | < |b| ur alle n ≥ n0 . Folglich gilt 2 f¨ |b| ≤ |b | f¨ u r alle n ≥ n . Insbesondere gilt b = 0 f¨ u r alle n ≥ n0 . n n 0 2 Es bleibt noch zu zeigen, dass n→ lim n≥n0
1 bn
=
1 b
gilt.
Zu > 0 existiert ein N ∈ IN, N ≥ n0 mit |bn − b| < 2 |b|2 ∀n ≥ N. Damit gilt
2
1 1 bn − b
= 1 |bn − b| ≤ 2 |bn − b| < 2 |b| =
− =
bn b bn b |bn | |b| |b|2 |b|2 2 f¨ur alle n ≥ N.
Zum Nachweis von (6) ben¨otigen wir noch folgendes Resultat. Satz 3.6. Seien (an )n∈IN eine konvergente Folge mit a = lim an und c ∈ IR. n→
(a) (b)
Ist an ∈ IR mit an ≤ c (bzw. an ≥ c) f¨ur alle n ∈ IN, so gilt a ≤ c (bzw. a ≥ c). Ist |an | ≤ c (bzw. |an | ≥ c) f¨ur alle n ∈ IN, so gilt |a| ≤ c (bzw. |a| ≥ c).
Beweis. (a) Seien zun¨achst an ≤ c f¨ur alle n ∈ IN. Ist a > c, so findet man zu := a − c ein m ∈ IN mit |am − a| < . Daraus folgt am = am − a + a ≥ a − |am − a| > a − = c, ein Widerspruch. Es gilt also a ≤ c. Im Fall an ≥ c gilt −an ≤ −c und wir erhalten analog −a ≤ −c, also a ≥ c. (b) Aus an → a folgt |an | → |a| laut Rechenregel (1) aus Satz 3.5. Mit dem eben Bewiesenen folgt die Behauptung.
Zu Satz 3.6 sei noch erw¨ahnt, dass aus an > c f¨ur alle n nicht notwendigerweise auch a > c folgt. Als Gegenbeispiel dient etwa an := 1n .
28
3 Folgen reller und komplexer Zahlen
Beweis (von Satz√ 3.5(6)). Wegen an ≥ 0 f¨ur alle n ist laut Satz 3.6 auch a ≥ 0. Daher existiert die Zahl k a. Sei nun > 0. Dann ist k > 0 und es gibt ein N ∈ IN derart, dass |an − a| < k gilt f¨ur alle n ≥ N. Mit Lemma 1.9 folgt
√ √
k an − k a ≤ k |an − a| ≤ √ √ f¨ur alle n ≥ N. Also ist lim k an = k a.
n→
Beispiel: lim
√
n→
n2 + n − n = 12 .
Beweis. Es ist √ √ ( n2 + n − n)( n2 + n + n) n 1 2 √ n +n −n = =√ = 2 2 n +n +n n +n +n 1 + 1n + 1 1 n→ n
und mit lim
= 0 sowie den Rechenregeln aus Satz 3.5 folgt
1 1 1 = n2 + n − n = lim =√ n→ n→ 1 + 0+ 1 2 1 + 1n + 1 lim
wie behauptet. Wir notieren noch eine weitere Folgerung.
Satz 3.7. Seien (an )n∈IN , (bn )n∈IN und (cn )n∈IN Folgen reller Zahlen mit an ≤ cn ≤ bn f¨ur alle n ∈ IN. Falls (an )n∈IN und (bn )n∈IN konvergent sind mit dem selben Grenzwert a, so gilt auch lim cn = a. n→
Beweis. Sei > 0. Dann gibt es N1 , N2 ∈ IN mit |an − a| < |bn − a| < 3 f¨ur alle n ≥ N2 . Aus an ≤ bn folgt mit der Dreiecksungleichung
3
f¨ur alle n ≥ N1 und
bn − an = |bn − an| = |bn − a − (an − a)| ≤ |bn − a| + |an − a| , folglich gilt bn − an < 23 f¨ur alle n ≥ N := max{N1 , N2 }. Außerdem gilt wegen an ≤ cn ≤ bn auch cn − an ≤ bn − an . Insgesamt erhalten wir damit |cn − a| = |cn − an + an − a| ≤ |cn − an| + |an − a| = cn − an + |an − a| ≤ bn − an + |an − a| < . f¨ur alle n ≥ N. Es ist also lim cn = a wie behauptet. n→
3.2 Rechnen mit Grenzwerten
29
Beispiel: Es gilt
⎧ ⎪ ⎨1
1 lim = 12 n→ 1 + xn ⎪ ⎩ 0
f¨ur 0 ≤ x < 1 , f¨ur x = 1 , f¨ur x ≥ 1 .
Beweis. Wir beginnen mit dem einfachsten Fall x = 1. Hier ist 1 1 n ∈ IN, also auch lim 1+x n = 2.
1 1+xn
=
1 2
f¨ur alle
n→
Im Fall 0 ≤ x < 1 gilt lim xn = 0; mit den Rechenregeln aus Satz 3.5 erhalten wir n→
lim
n→
F¨ur x > 1 gilt 0 <
1 1+xn
<
1 xn
1 1 =1. = n 1+x 1+0 1 n n→ x
und lim
1 n n→ 1+x
= 0; mit Satz 3.7 folgt lim
= 0.
1
n=8 n=4 n=2
1 2
Die Abbildung zeigt das 1 ur Verhalten von 1+x n f¨ 0 ≤ x ≤ 2 und n = 2, 4, 8.
x 1
2
Weitere wichtige Grenzwerte: √ (1) lim n a = 1 f¨ur jedes a > 0 , n→ √ (2) lim n n = 1 , n→
(3)
nk n n→ z
lim
= 0 f¨ur jedes k ∈ IN und z ∈ C mit |z| > 1 .
Beweis. (1) Wir betrachten zun¨achst den Fall a ≥ 1. √ F¨ur n ∈ IN setzen wir an := n a − 1. Mit der Bernoulli-Ungleichung (Satz 1.3) erhalten wir a = (1 + an)n ≥ 1 + nan, also an ≤ a−1 n . Wegen a ≥ 1 gilt weiter an ≥ 0 f¨ur alle n√und laut Satz 3.7 erhalten wir mit n lim a−1 a = 1. n = 0 schließlich lim an = 0, also lim
n→
n→
n→
Es bleibt noch zu zeigen, dass die Behauptung auch f¨ur 0 < a < 1 gilt. In diesem Fall ist 1a > 1 und wir k¨onnen das bereits Bewiesene mit 1a an Stelle von a ben¨utzen: Es gilt √ 1 1 =1. lim n a = lim = n→ n→ n 1 lim n 1a a n→
30
3 Folgen reller und komplexer Zahlen
(2) F¨ur n ∈ IN setzen wir an :=
√ n n − 1, dann gilt an ≥ 0 und weiter
n = (1 + an)n = 1 + n an +
n(n − 1) 2 n(n − 1) 2 an + · · · + ann ≥ 1 + an 2 2
f¨ur n ≥ 2, da alle Summanden auf der rechten Seite positiv sind. Nun folgt 2 n(n − 1) 2 n 2 an ⇒ 1 ≥ an ⇒ an ≤ n−1 ≥ 2 2 n f¨ur alle n ≥ 2. Mit lim 2n = 0 und Satz 3.7 erhalten wir lim an = 0, also n→
n→
lim
n→
√ n n=1.
(3) Sei x := |z| − 1 > 0. F¨ur jedes n ∈ IN mit n > 2k + 1, also
n+1 2
> k + 1, ist
n n(n − 1) · · ·(n − k) k+1 n k+1 xk+1 x ; |z| = (1 + x) > xk+1 = > (k + 1)! 2 (k + 1)! k+1 n
n
daraus folgt
k
k+1
n
< nk 1 (k + 1)! = 2 (k + 1)! n→ −→ 0
zn
n k+1 xk+1 xk+1 n 2
nk n n→ z
und mit Satz 3.7 erhalten wir lim
= 0.
3.3 Asymptotische Gleichheit und rekursiv definierte Folgen F¨ur p, q ∈ IN, 0 , . . . , a p ; 0 , . . . , q ∈ C, p = 0, q = 0, gilt ⎧ / , falls p = q , p p−1 p n + p−1 n + · · · + 0 ⎨ p q 0 , falls p < q , = lim n→ q nq + q−1 nq−1 + · · · + 0 ⎩ konvergiert nicht, falls p > q . Der Grenzwert h¨angt also nur vom jeweils ersten Term in Z¨ahler und Nenner ab. Dies gibt Anlass zu folgender Definition. Definition 3.8. Zwei Folgen (an )n∈IN , (bn )n∈IN heißen asymptotisch gleich, falls lim bann = 1 gilt. Man schreibt: an ∼ = bn f¨ur n → .
n→
Hierbei wird nicht verlangt, dass die Folgen (an )n∈IN oder (bn )n∈IN selbst konvergent sind. Insbesondere gilt
p n p + p−1 n p−1 + · · · + 0 ∼ = p np
(0 , . . . , p ∈ C) .
3.3 Asymptotische Gleichheit und rekursiv definierte Folgen
31
Beispiel 3.9 (Wallissches Produkt). F¨ur n ∈ IN sei pn :=
n 2k 2n 2 4 6 · · ··· = . 1 3 5 2n − 1 k=1 2k − 1
√ Es gilt pn ∼ = n, wobei ∈ IR ist mit Beweis. Einerseits ist
p √n+1 n+1 pn √ n
andererseits ist
pn √ n
2 =
√ pn n+1
p √n+1 n+2 √ pn n+1
√
2 ≤ ≤ 2.
monoton fallend, denn
n (2n + 2)2 4n(n + 1) 4n2 + 4n <1; = = n + 1 (2n + 1)2 (2n + 1)2 4n2 + 4n + 1
monoton wachsend, denn
2 =
n + 1 (2n + 2)2 4(n + 1)3 >1. = n + 2 (2n + 1)2 4n3 + 12n2 + 9n + 2
Daraus folgt √ pn p1 pn ≤ √ ≤ · · · ≤ p1 = 2 . 2 = √ ≤ ··· ≤ √ n n+1 2 Also ergibt sich mit Satz 3.3 nun √ pn pn lim √ = inf √ =: ≥ 2 n→ n n∈IN n pn pn lim √ = sup √ =: ≤ 2 . n + 1 n∈IN n + 1 √ Insbesondere ist mit (3.1) gezeigt, dass pn ∼ = n gilt. Weiter gilt auch = wegen und
n→
pn √ n √ pn n+1
=
pn pn In := √ ,√ n+1 n
Tats¨achlich gilt =
n∈IN
(3.2)
√ n+1 √ →1. n
Insbesondere erh¨alt man durch
eine Intervallschachtelung mit
(3.1)
!
In = { }.
√ ; zum Beweis siehe Kapitel 8.3.
Es ist oft sinnvoll oder sogar n¨otig, eine Folge rekursiv zu definieren, d.h. mittels einer Vorschrift, die angibt, wie man an+1 aus a1 , . . . , an berechnet.
32
3 Folgen reller und komplexer Zahlen
Beispiel 3.10 (Algorithmus zur Bestimmung der Quadratwurzel). Sei x > 0. Dann ist durch 1 x an + f¨ur n ∈ IN , a1 := x , an+1 := 2 an eine Folge (an )n∈IN erkl¨art. Wir wollen uns u¨ berlegen, ob diese Folge konvergent ist. Falls an > 0 ist, so folgt auch an+1 > 0. Zusammen mit a1 = x > 0 erhalten wir induktiv an > 0 f¨ur alle n ∈ IN, insbesondere ist der Bruch axn u¨ berhaupt erkl¨art. Wenn wir annehmen, dass lim an =: existiert, so gilt auch lim an+1 = und n→
n→
1 1 x x an + = , = lim an+1 = lim + n→ n→ 2 an 2 falls = 0. √ Wegen = 12 ( + x√) ⇒ 2 2 = 2 + x ⇒ = ± x kommen als Grenzwert nur die Werte 0 und ± x in Frage. Wir haben allerdings noch nicht gezeigt, dass die Folge konvergent ist! √ Behauptung: Es gilt lim an = x. n→
Beweis. F¨ur jedes n ∈ IN gilt √ (an − x)2 √ √ √ 1 2 1 x an − 2 x + = an − 2 x an + x = ≥0. an+1 − x = 2 an 2an 2an Weiter ist √ √ √ an − x 1 √ 1 an − x an − x ≤ 0 ≤ an+1 − x = 2 an 2 ≤1
≤ ··· ≤
1 2n−1
1 √ 2 n ( x − 1) n→ 2
Mit lim
√ a2 − x =
1 2n−1
√ 1 1 √ (x + 1) − x = n ( x − 1)2 . 2 2
√ = 0 erhalten wir nun lim an − x = 0 wie gew¨unscht. n→
3.4 Eine Intervallschachtelung fur ¨ den Logarithmus Folgendes Konzept stammt von Adolf Hurwitz (1859-1919, K¨onigsberg; Studium in M¨unchen). Wir werden in Kapitel 6.3 sehen, dass es sich bei dem hier konstruierten so genannten Logarithmus in der Tat um die Umkehrung der Exponentialfunktion handelt.
3.4 Eine Intervallschachtelung f¨ur den Logarithmus
33
Wir betrachten f¨ur beliebiges x > 0 eine rekursiv definierte Folge (xn )n∈IN0 . Es seien x0 := x ,
xn+1 :=
√ xn
(n ∈ IN0 ) .
(3.3)
Wir zeigen, dass unabh¨angig vom Startwert x immer lim xn = 1 gilt. n→
Beweis. Ist x0 = x ≥ 1, so ist auch xn ≥ 1 ∀n ∈ IN und daher xn+1 ≤ x2n+1 = xn , d.h. (xn )n∈IN0 ist monoton fallend und nach unten beschr¨ankt. Laut Satz 3.3 existiert := lim xn ≥ 1. Da aber auch = lim xn+1 ist, gilt n→
n→
2 = lim x2n+1 = lim xn = . n→
n→
Daraus folgt = 0 oder = 1. Schließlich ist = 0 aber nicht m¨oglich wegen xn ≥ 1 ∀n ∈ IN. Ist 0 < x < 1, so betrachte 1x als Startwert. Mit √1x = 1x folgt dann analog zu obiger Berechnung ebenfalls die Behauptung.
Lemma 3.11. Sei x > 0. Mit der in (3.3) erkl¨arten Folge (xn )n∈IN0 setze 1 n , bn := 2n (xn − 1) . an := 2 1 − xn
(3.4)
Dann ist (In )n∈IN0 mit In := [an , bn ] eine Intervallschachtelung. Beweis. Wir zeigen zun¨achst bn+1 ≤ bn und an ≤ an+1 sowie an ≤ bn f¨ur alle n ∈ IN. Dazu benutzen wir die Ungleichungen (i)
2(y − 1) ≤ y2 − 1
und
(ii)
y+
1 ≥2 y
f¨ur beliebiges y > 0, die man leicht aus y2 − 2y + 1 = (y − 1)2 ≥ 0 folgern kann. Mit (i) erhalten wir bn+1 = 2n+1(xn+1 − 1) ≤ 2n (x2n+1 − 1) = 2n (xn − 1) = bn sowie 1 1 1 n 1 − = an − 1 ≥ −2n − 1 = 2 an+1 = −2n+1 xn+1 xn x2n+1 und mit (ii) schließlich an = 2n 1 − x1n ≤ 2n (xn − 1) = bn . Also sind (an )n∈IN0 und (bn )n∈IN0 konvergente Folgen, siehe Satz 3.3, denn (an )n∈IN0 ist monoton steigend, beschr¨ankt nach oben durch b0 und (bn )n∈IN0 ist monoton fallend, beschr¨ankt nach unten durch a0 . Wegen an xn = 2n 1 − x1n xn = 2n (xn − 1) = bn und lim xn = 1 gilt lim an = lim bn . n→
Damit ist gezeigt, dass (In )n∈IN0 eine Intervallschachtelung ist.
n→
n→
34
3 Folgen reller und komplexer Zahlen
Ausgehend von x > 0 haben wir u¨ ber (3.3) und (3.4) eine Intervallschachtelung (In )n∈IN0 mit In = [an , bn ] definiert. Bezeichne ln(x) := lim an = lim bn , also n→
{ln(x)} =
n→
In .
n∈IN0
Wir nennen diese Zahl den (naturlichen) ¨ Logarithmus von x. Satz 3.12. F¨ur alle x, y > 0 gelten (a)
ln(1) = 0 ,
(b)
√ 1 − 1x ≤ ln(x) ≤ x − 1 und 2 1 − √1x ≤ ln(x) ≤ 2( x − 1) ,
(c)
ln(xy) = ln(x) + ln(y) .
(Funktionalgleichung des Logarithmus)
Beweis. (a) F¨ur x = 1 gilt xn = 1, also an = bn = 0 f¨ur alle n ∈ IN, und somit ln(1) = 0. (b) Wie in Lemma 3.11 gezeigt, gilt an ≤ ln(x) ≤ bn ∀n ∈ IN0 (wobei an , bn von x > 0 abh¨angen). F¨ur n = 0 erh¨alt man 1 ≤ ln(x) ≤ x − 1 . x √ √ F¨ur n = 1 gilt x1 = x, also hat man 2 1 − √1x ≤ ln(x) ≤ 2( x − 1). 1−
(c) Es sei z := xy > 0. Wir betrachten nun x0 = x, y0 = y, z0 = z und xn+1 = √ √ yn+1 = yn , zn+1 = zn gem¨aß (3.3). Unter Benutzung der bn zu x bzw. y bzw. z erh¨alt man
√ xn ,
ln(z) = lim 2n (zn − 1) = lim 2n (xn yn − 1) = lim (2n xn (yn − 1) + 2n(xn − 1)) n→
= lim xn n→
n→
n→
lim 2n (yn − 1) + lim 2n (xn − 1) = ln(y) + ln(x)
n→
n→
wie behauptet.
Korollar 3.13. Es gelten
(a) ln 1x = − ln(x) f¨ur alle x > 0, (b)
0 < x < y ⇒ ln(x) < ln(y).
Beweis. (a) Mit der Funktionalgleichung erhalten wir 1 1 + ln(x) = ln x = ln(1) = 0 . ln x x (b) Setze c := yx . Mit c > 1 folgt aus Satz 3.12(b) zun¨achst ln(c) ≥ 1 − 1c > 0; mit der Funktionalgleichung folgt nun ln(y) = ln(cx) = ln(c) + ln(x) > ln(x).
3.5 Aufgaben
35
ln(x) Der Logarithmus wird zwar beliebig groß, aber a¨ ußerst langsam. Um im Maßstab der Abbildung 30 cm auf der y-Achse an H¨ohe zu gewinnen (A4-Blatt), braucht man auf der x-Achse 100 Millionen Kilometer (≈ 23 × Abstand Erde – Sonne).
x
3.5 Aufgaben 1. Welche der Folgen 1 , an := √ n+1
bn :=
1 − 2n , 5 + 3n
cn := (−1)n
sind konvergent ? Bestimmen Sie gegebenenfalls den Grenzwert. Benutzen Sie dabei direkt die Definition 3.1 und keine weiteren Resultate aus Kapitel 3. 2. Berechnen Sie die Grenzwerte der durch an :=
n2 + 3n + 2 n3 + 1
und
bn :=
5n8 − 7n − 1 n8 + n4 + n2 + 1
erkl¨arten Folgen. 3. Ist die durch
1 n an := 1 − 2 n
erkl¨arte Folge (an )n∈IN konvergent ? Bestimmen Sie ggf. den Grenzwert. 4. Zeigen Sie mit Hilfe von Satz 3.3, dass die durch an :=
1 1 1 + + ···+ 1+n 2+n n+n
erkl¨arte Folge (an )n∈IN konvergiert. 5. Es sei (an )n∈IN eine Folge komplexer Zahlen. Zeigen Sie: Die Folge (an )n∈IN ist konvergent genau dann, wenn (Re an )n∈IN und (Im an )n∈IN beide konvergent sind.
36
3 Folgen reller und komplexer Zahlen
6. Untersuchen Sie die Folgen auf Konvergenz und bestimmen Sie gegebenenfalls den Grenzwert. √ √ a. an := n + t − n mit t > 0 √ mit t > 0 b. bn := n + nt − n √ c. c1 := 1 , cn+1 := 2 + cn f¨ur n ∈ IN √ mit 0 ≤ a ≤ b (Hinweis: bn ≤ an + bn ≤ 2bn ) d. dn := n an + bn 7. Es seien (an )n∈IN eine Folge komplexer Zahlen und a ∈ C. Zeigen Sie, dass die folgenden drei Aussagen a¨ quivalent sind. (i)
Zu jedem > 0 gibt es ein N ∈ IN mit |an − a| < f¨ur alle n ≥ N.
(ii)
Zu jedem > 0 gibt es ein N ∈ IN mit |an − a| ≤ f¨ur alle n ≥ N.
(iii)
Zu jedem > 0 gibt es ein N ∈ IN mit |an − a| <
2
f¨ur alle n ≥ N.
8. Das Arithmetisch-geometrische Mittel. Es seien a, b ∈ IR mit 0 < a < b. Wir setzen a0 := a, b0 := b und an+1 := G(an , bn ) ,
bn+1 := A(an , bn )
f¨ur n ∈ IN0 ,
wobei A und G wie in 1.4, Aufgabe 8, erkl¨art sind. Zeigen Sie: a. F¨ur alle n ∈ IN0 gilt an < bn . b. Die Intervalle In := [an , bn ] bilden eine Intervallschachtelung. 1 c. F¨ur alle n ∈ IN0 gilt bn+1 − an+1 ≤ 8a (bn − an)2 .
Kapitel 4
Metrische R¨aume und Cauchyfolgen
Wir haben den Begriff der Konvergenz sowohl f¨ur reelle als auch f¨ur komplexe Folgen erkl¨art. Dabei haben wir nur den Begriff des Abstandes“ zwischen x und y ” ben¨utzt, n¨amlich |x − y|. Hat man einen sinnvollen Abstandsbegriff in anderen R¨aumen als IR oder C, so kann man dort auch Konvergenz erkl¨aren.
4.1 Metrische und normierte R¨aume Wir f¨uhren nun einen allgemeinen Abstandsbegriff auf beliebigen Mengen ein. Definition 4.1. Sei M eine Menge. Eine Abbildung d : M × M → IR heißt Metrik, wenn (M1) (M2) (M3)
d(a, b) ≥ 0 und d(a, b) = 0 ⇐⇒ a = b, d(a, b) = d(b, a), d(a, c) ≤ d(a, b) + d(b, c), (Dreiecksungleichung)
f¨ur alle a, b, c ∈ M gilt. Man sagt dann, (M, d) ist ein metrischer Raum, und nennt d(a, b) den Abstand von a und b. Beispiele: (1)
Auf IR oder C haben wir eine nat¨urliche“ Metrik, d(x, y) := |x − y|. ” Wir schreiben k¨unftig IK f¨ur IR oder C.
(2)
Auf jeder Menge M = ∅ ist durch d(a, b) :=
0 , f¨ur a = b , 1 , f¨ur a = b ,
eine Metrik gegeben, die diskrete Metrik.
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_4, © Springer-Verlag Berlin Heidelberg 2012
37
38
4 Metrische R¨aume und Cauchyfolgen
Sei M := {0, 1}n := {x = (x1 , . . . , xn ) : x1 , . . . , xn ∈ {0, 1} }. Durch
(3)
d(x, y) := |x1 − y1 | + . . . + |xn − yn | (die Anzahl der Stellen, an denen x und y verschiedene Eintr¨age haben) ist eine Metrik definiert. Sie heißt Hamming-Abstand. (4)
Auf IK haben wir bereits zwei Metriken, die nat¨urliche und die diskrete Metrik. Eine weitere ist durch d(x, y) :=
|x − y| 1 + |x − y|
definiert. (M1), (M2) sind offensichtlich erf¨ullt. Um (M3) zu zeigen, verwenden wir folgende Hilfsaussage: F¨ur 0 ≤ s ≤ t gilt s t ≤ 1+t . s(1 + t) = s + st ≤ t + st = t(1 + s) und daraus folgt 1+s Mit s = |x − z| und t = |x − y| + |y − z| gilt d(x, z) =
(|x − y| + |y − z|) |x − z| ≤ 1 + |x − z| 1 + (|x − y| + |y − z|) =
|y − z| |x − y| + 1 + (|x − y| + |y − z|) 1 + (|x − y| + |y − z|)
≤
|y − z| |x − y| + = d(x, y) + d(y, z) , 1 + |x − y| 1 + |y − z|
also ist (M3) ebenfalls erf¨ullt. Man beachte, dass in einem metrischen Raum (M, d) jede Teilmenge L ⊆ M mit d|L, der Einschr¨ankung von d auf L, ein metrischer Raum ist. Ist die zu Grunde liegende Menge sogar ein IK-Vektorraum (IK = IR oder C), so erh¨alt man Metriken u.a. u¨ ber so genannte Normen. Definition 4.2. Sei X ein IK-Vektorraum. Eine Abbildung · : X → IR heißt Norm, wenn (N1) (N2) (N3)
x ≥ 0 und x = 0 ⇐⇒ x = 0, x = | |x, x + y ≤ x + y, (Dreiecksungleichung)
f¨ur alle x, y ∈ X und alle ∈ IK gilt. Weiter heißt (X , · ) dann normierter Raum. Man sieht sofort, daß bei gegebener Norm · durch d(x, y) := x − y
(4.1)
eine Metrik auf X definiert wird. Die Metriken auf einem IK-Vektorraum, die durch Normen gem¨aß (4.1) bestimmt sind, kann man einfach charakterisieren.
4.1 Metrische und normierte R¨aume
39
Satz 4.3. Sei X ein IK-Vektorraum. Eine Metrik d auf X wird gem¨aß (4.1) von einer Norm definiert genau dann, wenn (a) (b)
d(x + a, y + a) = d(x, y) d( x, y) = | | d(x, y),
und
f¨ur alle x, y ∈ X, ∈ IK gilt. Beweis. Bei gegebener Norm · setzen wir d(x, y) := x − y f¨ur x, y ∈ X . Dann gelten d(x + a, y + a) = (x + a) − (y + a) = d(x, y)
und
d( x, y) = ( x) − ( y) = | | d(x, y) . Sei umgekehrt d mit (a) und (b) gegeben. Wir setzen nun x := d(x, 0) f¨ur x ∈ X . Dann gilt x = 0 ⇐⇒ d(x, 0) = 0 ⇐⇒ x = 0. Ferner ist (b)
x = d( x, 0) = | | d(x, 0) = | |x . Schließlich gilt auch (a)
x + y = d(x + y, 0) = d(x, −y) ≤ d(x, 0) + d(0, −y) (b)
= d(x, 0) + d(−y, 0) = x + y . Es bleibt zu pr¨ufen, dass zwischen der so definierten Norm und d die Beziehung (4.1) gilt. In der Tat ist (a)
x − y = d(x − y, 0) = d(x, y)
wie behauptet. Beispiel: Normen auf IKd . F¨ur x = (x1 , . . . , xd ) seien x1 :=
d
|xk | ,
k=1
x2 :=
d
1/2
|xk |
2
,
k=1
x := max |xk | . k=1,...,d
Die Eigenschaften (N1) und (N2) gelten offensichtlich in allen drei F¨allen. Die Dreiecksungleichung (N3) ist f¨ur · 1 und · ebenfalls einfach zu sehen. Die Dreiecksungleichung f¨ur · 2 heißt auch Minkowski-Ungleichung (Hermann Minkowski, 1864-1909, Z¨urich, G¨ottingen). Zu deren Nachweis ben¨otigen wir die
40
4 Metrische R¨aume und Cauchyfolgen
Cauchy-Ungleichung; auch Cauchy-Schwarz-Ungleichung oder Cauchy-SchwarzBunjakowski-Ungleichung genannt (Augustin Louis Cauchy, 1789-1857, Paris; Viktor Jakowlewitsch Bunjakowski, 1804-1889, Petersburg; Hermann Amandus Schwarz, 1843-1921, Berlin). Satz 4.4 (Cauchy-Ungleichung). Seien (a1 , . . . , ad ) , (b1 , . . . , bd ) ∈ IRd . Dann gilt
1/2 1/2
d
d d
.
ak bk ≤ a2k b2k
k=1
k=1 k=1 Beweis. Es ist d
k=1
a2k
d
k=1
b2k
−
2
d
ak bk
=
k=1
d
d
d
d
a2k b2i − ak bk ai bi .
k=1 i=1
k=1 i=1
Auf der rechten Seite fallen die Summanden f¨ur k = i jeweils weg; wir erhalten d
d
d
d
d
d
a2k b2i − ak bk aibi =
k=1 i=1
k=1 i=1
a2k b2i − ak bk ai bi
k=1 i = 1
i = k
=
d
d
k=1 i=k+1
=
d
d
a2k b2i − 2ak bk ai bi + a2i b2k
(ak bi − ai bk )2 ≥ 0
k=1 i=k+1
und weiter
2
d
ak bk
k=1
≤
d
k=1
a2k
d
k=1
b2k
.
Da die Summen auf der rechten Seite nicht negativ sind, ist
1/2 1/2
d
d d
ak bk ≤ a2k b2k
k=1
k=1 k=1
wie gew¨unscht.
Satz 4.5 (Minkowski-Ungleichung). Seien x = (x1 , . . . , xd ) , y = (y1 , . . . , yd ) ∈ IKd . Dann gilt x + y2 ≤ x2 + y2. Beweis. Es ist x + y22 =
d
d
k=1
k=1
|xk + yk |2 ≤ |xk + yk | (|xk | + |yk |)
und mit Hilfe der Cauchy-Ungleichung erhalten wir
4.1 Metrische und normierte R¨aume d
41
d
|xk + yk | |xk | + |xk + yk | |yk |
k=1
≤
k=1
1/2
d
|xk + yk |
2
k=1
d
1/2
|xk |
2
+
k=1
d
1/2
|xk + yk |
2
k=1
d
1/2
|yk |
2
k=1
= x + y2 (x2 + y2) . Daraus folgt x + y2 ≤ x2 + y2.
Damit ist gezeigt, dass auch · 2 eine Norm auf IKd ist. Man nennt sie die Euklidische Norm. Der normierte Raum (IRd , · 2) heißt Euklidischer Raum. Die folgende Abbildung zeigt f¨ur jede der Normen · 1 , · 2 und · in IR2 die so genannte Einheitskugel K1 (0) := {x ∈ IR2 : x ≤ 1}. (0, 1)
(1, 1)
(0, 1)
(1, 0) (1, 0)
F¨ur x = (x1 , x2 ) mit x1 ≤ 1 gilt x1 ∈ [−1, 1] und x2 ∈ [−1 + |x1 |, 1 − |x1 |].
(1, 0)
Die Einheitskugel bez¨uglich · 2 ist genau die Kreisscheibe {(x1 , x2 ) ∈ IR2 : x21 + x22 ≤ 1}.
Die Einheitskugel bzgl. · ist das Quadrat [−1, 1]2 .
Beispiel: Der Raum . Wir bezeichnen den Raum aller beschr¨ankten Folgen reeller (oder komplexer) Zahlen mit . Mit den f¨ur x = (xn )n∈IN , y = (yn )n∈IN und ∈ IK definierten Operationen (x + y)n := xn + yn und ( x)n := xn ist dies ein IK-Vektorraum. Wir wollen sehen, dass durch x := sup |xn | eine Norm auf erkl¨art ist. n∈IN
Die Eigenschaften (N1) und (N2) sind leicht ersichtlich. Zum Nachweis der Dreiecksungleichung seien x, y ∈ . F¨ur jedes k ∈ IN gilt |xk + yk | ≤ |xk | + |yk | ≤ sup{|xn | : n ∈ IN} + sup{|yn | : n ∈ IN}, also auch x + y = sup{|xk + yk | : k ∈ IN} ≤ sup{|xn | : n ∈ IN} + sup{|yn | : n ∈ IN} = x + y . Bezeichnungen: Ist (M, d) ein metrischer Raum, so definieren wir Ur (a) := {b ∈ M : d(b, a) < r} und Kr (a) := {b ∈ M : d(b, a) ≤ r} sowie Sr (a) := {b ∈ M : d(b, a) = r} f¨ur feste a ∈ M, r > 0.
42
4 Metrische R¨aume und Cauchyfolgen
4.2 Cauchyfolgen und Vollst¨andigkeit F¨ur Folgen (an )n∈IN , an ∈ M, liegt es nun auf der Hand, einen Konvergenzbegriff einzuf¨uhren. Definition 4.6. Seien (M, d) ein metrischer Raum und (an )n∈IN eine Folge in M. (i)
Die Folge (an )n∈IN heißt konvergent gegen a ∈ M, falls zu jedem > 0 ein N ∈ IN existiert mit d(an , a) <
f¨ur alle n ≥ N .
d
Man schreibt lim an = a oder an −→ a. n→
(ii)
Die Folge (an )n∈IN heißt Cauchyfolge, falls zu jedem > 0 ein N ∈ IN existiert mit d(an , am ) < f¨ur alle n, m ≥ N .
(iii)
Der Raum (M, d) heißt vollst¨andig, falls jede Cauchyfolge in M konvergiert. Ein vollst¨andiger normierter Raum heißt Banachraum (Stefan Banach, 1892-1945, Lemberg).
Beispiel: F¨ur x ∈ IR setze (x) :=
x 1+|x| .
Dann ist durch
d(x, y) := | (x) − (y)| eine Metrik d auf IR erkl¨art, sodass (IR, d) nicht vollst¨andig ist. Beweis. Aus der Definition folgt unmittelbar, dass d(z, y) ≥ 0 ist f¨ur alle x, y ∈ IR; im Fall x = y gilt offensichtlich d(x, y) = 0. Sei nun d(x, y) = 0, so folgt y x = ⇒ x(1 + |y|) = y(1 + |x|) ⇒ x + x |y| = y + y |x| . 1 + |x| 1 + |y| In den F¨allen x, y ≥ 0 oder x, y ≤ 0 erhalten wir x |y| = y |x| und damit x = y. Andernfalls k¨onnen wir ohne Einschr¨ankung annehmen, dass x > 0 und y ≤ 0 gilt. Wir erhalten −x |y| = y |x| und weiter x + x |y| = y − x |y| ⇒ 2x |y| = y − x. Wegen x > 0 und y ≤ 0 ist dies ein Widerspruch. Es gilt also d(x, y) = 0 ⇐⇒ x = y. Damit ist (M1) gezeigt; (M2) ist offenbar auch erf¨ullt. Seien x, y, z ∈ IR, dann gilt
x z
x y y z
d(x, z) =
− = − + − 1 + |x| 1 + |z| 1 + |x| 1 + |y| 1 + |y| 1 + |z|
x y
y z
− + − = d(x, y) + d(y, z) , ≤
1 + |x| 1 + |y| 1 + |y| 1 + |z|
womit (M3) auch gezeigt ist. Folglich ist d eine Metrik.
4.2 Cauchyfolgen und Vollst¨andigkeit
43
Es sei an := n f¨ur a ∈ IN. F¨ur beliebiges N ∈ IN und N ≤ m ≤ n gilt dann
n m
n(1 + m) − m(1 + n)
n−m
d(an , am ) =
− = = 1 + n 1 + m (1 + n)(1 + m) (1 + n)(1 + m) ≤
1 1 n = ≤ . n(m + 1) m + 1 N
Wenn wir zu > 0 also N ∈ IN so w¨ahlen, dass d(an , am ) <
1 N
< ist, erhalten wir
f¨ur alle n, m ≥ N ,
d.h. (an )n∈IN ist eine Cauchyfolge in (IR, d). d
Angenommen, es gibt a ∈ IR mit an → a. Offensichtlich ist dann a > 0. F¨ur n ∈ IN, n > 2a, folgt
n
n a
|n − a| 1 2
d(an , a) =
− = > = . 1 + n 1 + |a| (1 + n)(1 + |a|) 2n(1 + |a|) 4(1 + |a|) Zu =
1 4(1+|a|)
gibt es demnach kein N ∈ IN derart, dass gilt d(an , a) <
f¨ur alle n ≥ N
d
im Widerspruch zu an → a. Die Folge konvergiert also nicht. Wir haben hiermit eine Cauchyfolge in (IR, d) gefunden, die nicht konvergiert. Folglich ist (IR, d) nicht vollst¨andig.
Bemerkungen: (1)
Eine Folge in (M, d) kann gegen h¨ochstens einen Grenzwert konvergieren. Man kann den Beweis aus Abschnitt 3.1 fast w¨ortlich kopieren.
(2)
Auch nach Definition √ 4.6 √ ist Q mit der nat¨urlichen Metrik nicht vollst¨andig: In jedem Intervall [ 2, 2 + 1n ] finden wir ein an ∈ Q. Damit ist (an )n∈IN eine Cauchyfolge in Q, konvergiert aber nicht (in Q).
(3)
Jede konvergente Folge (an )n∈IN in (M, d) ist eine Cauchyfolge, denn seien a = lim an und > 0, so gibt es ein N ∈ IN mit d(an , a) < 2 f¨ur alle n ≥ N, n→ und damit gilt d(an , am ) ≤ d(an , a) + d(a, am) <
+ = 2 2
falls n, m ≥ N .
Wenn wir im Folgenden von Konvergenz in IR oder C (ohne zus¨atzliche Angabe) sprechen, meinen wir stets Konvergenz in der nat¨urlichen (Betrags-)Metrik. Satz 4.7. Jede Cauchyfolge (an )n∈IN in IR ist konvergent.
44
4 Metrische R¨aume und Cauchyfolgen
1 Beweis. Zu k ∈ IN gibt es nk ∈ IN mit |an − am | 2k+1 f¨ur alle n, m ≥ nk . Wir k¨onnen diese so w¨ahlen, dass nk+1 ≥ nk gilt. Definiert man Intervalle mittels 1 Ik := x ∈ IR : |x − ank | ≤ k , 2
dann ist an ∈ Ik f¨ur alle n ≥ nk . Weiter gilt Ik+1 ⊆ Ik : Ist n¨amlich x ∈ Ik+1 , so gilt 1 1 |x − ank+1 | ≤ 2k+1 . Da mit nk+1 ≥ nk auch |ank+1 − ank | < 2k+1 ist, folgt |x − ank | ≤ |x − ank+1 | + |ank+1 − ank | < Die L¨ange der Ik ist
1 . 2k−1
1 , 2k
also x ∈ Ik .
Somit ist (Ik )k∈IN eine Intervallschachtelung.
Gem¨aß der Vollst¨andigkeit von IR nach Definition 1.6 sei nun Wir zeigen, dass lim an = a gilt. n→
Ist > 0, so w¨ahle k ∈ IN mit
1 2k
k=1
Ik = {a}.
< 2 . F¨ur n ≥ N := nk gilt dann
|an − a| ≤ |an − ank | + |ank − a| <
1 1 + < + = . 2k+1 2k 2 2
Folglich konvergiert die Folge (an )n∈IN gegen a.
Bemerkung: Im Beweis von Satz 4.7 haben wir die Vollst¨andigkeit von IR bez¨uglich Intervallschachtelungen benutzt um Vollst¨andigkeit bzgl. Cauchyfolgen zu zeigen. Fordert man in der Konstruktion der Menge IR als vollst¨andigen archimedisch angeordneten K¨orper die Vollst¨andigkeit mittels Cauchyfolgen, so kann man daraus wiederum die Vollst¨andigkeit bez¨uglich Intervallschachtelungen zeigen. Dar¨uberhinaus ist auch die Supremumseigenschaft (vgl. Satz 1.11) eine a¨ quivalente Charakterisierung der Vollst¨andigkeit von IR. Weitere Details zur Menge der reellen Zahlen findet man u.a. in [3]. Konvergenz im Euklidischen Raum: Es sei (xn )n∈IN eine Folge in IKd , xn = (xn,1 , ..., xn,d ). Wegen d
|xn,k − xk |2 → 0
⇐⇒ xn,k → xk f¨ur alle k ∈ {1, . . . , d}
k=1
konvergiert (xn )n∈IN gegen x ∈ IKd bzgl. · 2 genau dann, wenn alle Komponentenfolgen (xn,k )n∈IN gegen xk konvergieren. Ebenso sieht man, dass (xn )n∈IN Cauchyfolge in (IKd , · 2 ) ist, genau dann, wenn alle Komponentenfolgen (xn,k )n∈IN , k = 1, . . . , d, Cauchyfolgen in IK sind. Damit folgt: Korollar 4.8. Der Euklidische Raum (IRd , · 2 ) ist vollst¨andig. Insbesondere ist auch C (mit der nat¨urlichen Metrik) vollst¨andig.
4.3 Skalarprodukt und Orthogonalit¨at
45
Wir wollen noch ein Beispiel f¨ur einen weiteren Banachraum angeben. Sei M eine beliebige Menge, und bezeichne B(M) den Raum aller beschr¨ankten Funktionen f : M → IK, d.h. B(M) enth¨alt genau diejenigen Abbildungen f , f¨ur die { f (x) : x ∈ M} eine beschr¨ankte Teilmenge von IK ist. Mit f , g ∈ B(M) und ∈ IK gilt offensichtlich auch f + g ∈ B(M) und f ∈ B(M), daher ist B(M) ein IK-Vektorraum. Weiter sei f := sup | f (x)| . x∈M
Man kann direkt nachrechnen, dass · eine Norm auf B(M) ist. Gelegentlich schreibt man auch · M an Stelle von · . Satz 4.9. Der normierte Raum (B(M), · ) ist ein Banachraum. Beweis. Zu zeigen bleibt, dass jede Cauchyfolge in (B(M), · ) konvergiert. Sei ( fn )n∈IN eine Cauchyfolge in (B(M), · ). Zu jedem > 0 gibt es demnach ein N ∈ IN mit fn − fm < f¨ur alle m, n ≥ N. F¨ur beliebiges x ∈ M folgt daraus | fn (x) − fm (x)| < ∀ m, n ≥ N, wobei N unabh¨angig von x ist. Folglich ist ( fn (x))n∈IN eine Cauchyfolge in IK. Diese ist konvergent, da IK vollst¨andig ist. Also existiert der Grenzwert lim fn (x) =: f (x). n→ Sei n ≥ N zun¨achst fest gew¨ahlt. Es ist lim | fn (x) − fm (x)| = | fn (x) − f (x)| und damit | fn (x) − f (x)| ≤ ∀x ∈ M. m→ Da fn beschr¨ankt ist, ist somit auch f beschr¨ankt. Weiter gilt fn − f = sup | fn (x) − f (x)| ≤ x∈M
f¨ur alle n ≥ N ,
also konvergiert die Folge ( fn )n∈IN im Raum (B(M), · ) gegen f ∈ B(M).
4.3 Skalarprodukt und Orthogonalit¨at Definition 4.10. Sei X ein IK-Vektorraum. Eine Abbildung ·, · : X × X → IK heißt Skalarprodukt, wenn (S1)
x, x ≥ 0
und x, x = 0 ⇐⇒ x = 0,
(S2)
x, y = x, y,
(S3)
x, y = y, x,
(S4)
x + y, z = x, z + y, z,
f¨ur alle x, y, z ∈ X und alle ∈ IK gilt. Einen Vektorraum mit Skalarprodukt bezeichnet man auch als Pr¨ahilbertraum. Weiter sagt man, x und y sind orthogonal, falls x, y = 0 ist. Sei I eine beliebige Indexmenge. Eine Menge {xi : i ∈ I} ⊆ X heißt orthonormal, falls xi , x j = 0 f¨ur i = j und xi , xi = 1 f¨ur alle i ∈ I gilt.
46
4 Metrische R¨aume und Cauchyfolgen
Wit werden sehen, dass in einem Pr¨ahilbertraum X durch x := x, x eine Norm erkl¨art ist. Die Eigenschaften (N1) und (N2) sind offensichtlich. Zum Nachweis der ¨ Dreiecksungleichung (N3) sind noch einige Uberlegungen n¨otig. Satz 4.11 (Pythagoras). Sei {x1 , . . . , xn } eine endliche orthonormale Menge in einem Pr¨ahilbertraum X . " "2 Dann gilt " " n n " " 2 2 x = |x, xk | + "x − x, xk xk " . " " k=1 k=1 n
Beweis. Mit s := x, xk xk und der Orthonormalit¨at erhalten wir k=1
# s2 =
n
n
k=1
j=1
$
x, xk xk , x, x j x j
=
n
n
n
x, xk x, x j xk , x j = |x, xk |2
k=1 j=1
k=1
n
sowie s, x = |xk , x|2 = x, s. Insgesamt gilt also k=1
n
x − s2 = x − s, x − s = x, x − x, s − s, x + s, s = x2 − |x, xk |2 k=1
wie behauptet.
Eine unmittelbare Konsequenz ist die Besselsche Ungleichung (Friedrich Wilhelm Bessel, 1784-1846, K¨onigsberg): Ist {x1 , . . . , xn } eine endliche orthonormale Menge in einem Pr¨ahilbertraum X , so gilt x2 ≥
n
|x, xk |2
f¨ur alle x ∈ X .
(4.2)
k=1
Korollar 4.12 (Cauchy-Schwarz-Ungleichung). Sei X ein Pr¨ahilbertraum. F¨ur alle x, y ∈ X gilt |x, y| ≤ x y. Beweis. Im Fall y = 0 ist die Behauptung klar. Andernfalls betrachte die orthonor1 y und benutze (4.2).
male Menge {x1 } mit x1 = y Aus der Cauchy-Schwarz-Ungleichung erh¨alt man weiter x + y2 = x + y, x + y = x2 + 2Rex, y + y2 ≤ x2 + 2 |x, y| + y2 ≤ x2 + 2 x y + y2 = (x + y)2 und damit die Dreiecksunleichung f¨ur · . Damit ist nun auch bewiesen, dass es sich hierbei tats¨achlich um eine Norm handelt. Ist X mit dieser Norm vollst¨andig, so bezeichnet man X als einen Hilbertraum (David Hilbert, 1862-1943, G¨ottingen).
4.3 Skalarprodukt und Orthogonalit¨at
47
Beispiel: Das gew¨ohnliche Skalarprodukt in IKd : Durch x, y :=
d
xk yk
f¨ur x = (x1 , . . . , xd ) , y = (y1 , . . . , yd ) ∈ IKd
k=1
wird ein Skalarprodukt erkl¨art, wie man leicht nachrechnen kann. Als zugeh¨orige Norm ergibt sich 1/2 d x = x, x = |xk |2 k=1
die Euklidische Norm. Laut Korollar 4.8 ist IKd mit dieser Norm vollst¨andig, also ein Hilbertraum. Satz 4.13. Seien {x1 , . . . , xn } eine endliche orthonormale Menge in einem Pr¨ahilbertraum X und x ∈ X. Bezeichne s :=
n
x, xk xk
und
t :=
k=1
n
k xk
mit 1 , . . . , n ∈ IK .
k=1
Es gilt x −t ≥ x − s, wobei Gleichheit genau dann gilt, falls k = x, xk f¨ur alle k = 1, . . . , n ist. Damit ist s also dasjenige Element aus dem von {x1 , . . . , xn } aufgespannten Unterraum von X , welches den kleinsten Abstand von x hat. Beweis. Es gilt n
n
k=1 n
k=1
n
x − t2 = x, x − k xk , x − k x, xk − k k k=1
n
= x, x − x, xk x, xk + (k − x, xk ) (k − x, xk ) k=1 n
k=1
n
= x2 − |x, xk |2 + |k − x, xk |2 k=1 n
k=1
≥ x2 − |x, xk |2 = x − s2 , k=1
wobei die letzte Gleichung exakt der Satz von Pythagoras ist. Gleichheit gilt offensichtlich genau im Fall k = x, xk f¨ur alle k = 1, . . . , n.
Beispiel: Wir bestimmen im Euklidischen IR3 den Punkt s in der von x1 := (1, 0, 0) und x2 := (0, 1, 1) aufgespannten Ebene, welcher von x := (2, 3, 4) den geringsten Abstand hat. Es gilt s = x, x1 x1 + x, x2 x2 = 2x1 + 7x2 = (2, 7, 7).
48
4 Metrische R¨aume und Cauchyfolgen
4.4 Teilfolgen und H¨aufungswerte Eine notwendige Eigenschaft f¨ur die Konvergenz einer Folge (an )n∈IN in einem metrischen Raum ist deren Beschr¨anktheit. Dabei heißt eine Teilmenge A in einem metrischen Raum (M, d) beschr¨ankt, falls ein K ≥ 0 und ein Punkt b ∈ M existieren mit d(a, b) ≤ K f¨ur alle a ∈ A. Satz 4.14. Ist (an )n∈IN eine Cauchyfolge in einem metrischen Raum (M, d), so ist {an : n ∈ IN} beschr¨ankt. Den Nachweis f¨uhrt man wie den von Satz 3.2. Man beachte, dass jede konvergente Folge eine Cauchyfolge ist. Eine analoge Aussage zu Satz 3.3 existiert deshalb nicht, da Monotonie in metri¨ schen R¨aumen nicht sinnvoll erkl¨art werden kann. Folgende Uberlegungen umgehen dieses Problem, und gelten nat¨urlich auch f¨ur IR. Streicht man aus einer Folge (an )n∈IN einige Glieder, so erh¨alt man eine neue Folge. Formal kann man dies wie folgt beschreiben. Definition 4.15. Ist n1 < n2 < . . . < nk < . . . eine Folge nat¨urlicher Zahlen, so heißt (ank )k∈IN eine Teilfolge von (an )n∈IN. . Ist z.B. an = (−1)n , so sind sowohl (bk )k∈IN mit bk = 1 als auch (ck )k∈IN mit ck = −1 Teilfolgen von (an )n∈IN . Selbstverst¨andlich hat (an )n∈IN noch weitere Teilfolgen. Satz 4.16. Ist (an )n∈IN eine Folge in einem metrischen Raum (M, d), die gegen a ∈ M konvergiert, so konvergiert auch jede Teilfolge (ank )k∈IN gegen a. Beweis. Ist n1 < n2 < . . ., so gilt nk ≥ k f¨ur alle k ∈ IN. Zu > 0 existiert ein N ∈ IN mit d(ak , a) < f¨ur alle k ≥ N. d
Folglich gilt auch d(ank , a) < f¨ur alle k ≥ N, also ank −→ a mit k → .
Lemma 4.17. Es seien (an )n∈IN eine Folge in einem metrischen Raum (M, d) und a ∈ M. Folgende drei Aussagen sind a¨ quivalent: (i)
Zu jedem > 0 und jedem N ∈ IN gibt es ein n ≥ N mit d(an , a) < .
(ii)
F¨ur jedes > 0 ist die Menge {n ∈ IN : d(an , a) < } unendlich.
(iii)
Es gibt eine Teilfolge (ank )k∈IN von (an )n∈IN , die gegen a konvergiert.
Beweis. Wir zeigen (i)⇒(iii)⇒(ii)⇒(i). Gilt (i), so existiert zu = 1 und N = 1 ein n1 ≥ 1 mit d(an1 , a) < 1. Betrachte nun = 12 und N = n1 + 1. Dazu existiert n2 ≥ N > n1 mit d(an2 , a) < 12 . Rekursiv erh¨alt man n1 < n2 < . . . mit d(ank , a) < 1k f¨ur alle k ∈ IN, also lim ank = a. k→
Gilt (iii), so existiert zu beliebigem > 0 ein N ∈ IN mit d(ank , a) < f¨ur alle k ≥ N, d.h. {nk ∈ IN : k ≥ N} ⊆ {m ∈ IN : d(am , a) < }, womit letztere Menge unendlich ist.
4.4 Teilfolgen und H¨aufungswerte
49
Schließlich gelte (ii). Seien > 0 und N ∈ IN vorgegeben. Dann muss es einen Index n geben mit n ≥ N und d(an , a) < , denn sonst w¨are {n ∈ IN : d(an , a) < } endlich.
Definition 4.18. Sei (an )n∈IN eine Folge in einem metrischen Raum (M, d). Ein Element a ∈ M heißt H¨aufungswert von (an )n∈IN , falls f¨ur jedes > 0 die Menge {n ∈ IN : d(an , a) < } unendlich ist. Lemma 4.17 liefert demnach drei gleichwertige Charakterisierungen der Aussage a ist H¨aufungswert von (an )n∈IN “. ” Satz 4.19 (Bolzano-Weierstraß). Jede beschr¨ankte Folge (an )n∈IN reeller Zahlen besitzt einen H¨aufungswert. Beweis. Da {an : n ∈ IN} beschr¨ankt ist, existieren A1 , B1 ∈ IR mit {an : n ∈ IN} ⊆ [A1 , B1 ] =: I1 . Wir konstruieren rekursiv Ik = [Ak , Bk ] mit (i)
[Ak , Bk ] enth¨alt unendlich viele Glieder von (an )n∈IN ,
(ii)
[Ak+1 , Bk+1 ] ⊆ [Ak , Bk ] ,
(iii)
Bk − Ak =
1 (B1 − A1 ) 2k−1
.
Dazu gehen wir wie folgt vor: Ist [Ak , Bk ] gegeben, so setze M := 12 (Ak + Bk ). Da [Ak , Bk ] unendlich viele Glieder von (an )n∈IN enth¨alt, sind mindestens in einem der beiden Intervalle [Ak , M] und [M, Bk ] unendlich viele an . Wir setzen [Ak , M] , falls in [Ak , M] unendlich viele an liegen, [Ak+1 , Bk+1 ] := [M, Bk ] , sonst. Damit ist (Ik )k∈IN eine Intervallschachtelung. Sei
k=1
Ik = {a}.
Nun ist a H¨aufungswert von (an )n∈IN , denn zu > 0 existiert ein k ∈ IN mit [Ak , Bk ] ⊆ U (a) =]a − , a + [, also enth¨alt ]a − , a + [ unendlich viele an .
Korollar 4.20. Jede beschr¨ankte Folge (an )n∈IN in (IRd , · 2 ) besitzt einen H¨aufungswert. (Insbesondere hat jede beschr¨ankte Folge in C einen H¨aufungswert.) Beweis. Sei etwa an = (an,1 , . . . , an,d ) ∈ IRd . Wir betrachten die beschr¨ankte Folge (an,1 )n∈IN in IR. Laut Satz 4.19 und Lemma 4.17 existiert eine konvergente Teilfolge (ank ,1 )k∈IN von (an,1 )n∈IN . Betrachte nun (ank ,2 )k∈IN . Wir setzen bk,2 := ank ,2 . Wieder existiert eine konvergente Teilfolge (bk ,2 )∈IN . Geht man weiter so vor bis zur d-ten Komponente, erh¨alt man eine Teilfolge (anm )m∈IN von (an )n∈IN , die in (IRd , · 2 ) konvergiert, da jede der Komponentenfolgen (anm , j )m∈IN , j = 1, . . . , d, in IR konvergiert.
50
4 Metrische R¨aume und Cauchyfolgen
Definition 4.21. Man sagt, eine Folge (an )n∈IN reeller Zahlen divergiert gegen (oder konvergiert uneigentlich gegen ), wenn es zu jedem C > 0 ein N ∈ IN gibt, sodass an > C f¨ur alle n ≥ N gilt. Divergiert (−an )n∈IN gegen , so sagt man, dass (an )n∈IN gegen − divergiert. Beispiel: (qn )n∈IN divergiert gegen , falls q > 1 ist. Es sei (an )n∈IN eine nach oben beschr¨ankte Folge reeller Zahlen. F¨ur jedes n ∈ IN existiert bn := sup{ak : k ≥ n} und (bn )n∈IN ist eine monoton fallende Folge. Wir unterscheiden zwei F¨alle: • Ist {bn : n ∈ IN} nach unten beschr¨ankt, dann existiert nach Satz 3.3 lim sup an := lim bn = inf bn = inf n→
n→
n∈IN
n∈IN
sup ak k≥n
.
• Ist {bn : n ∈ IN} nicht nach unten beschr¨ankt, so divergiert (bn )n∈IN gegen −, und wir schreiben lim sup an := − . n→
Falls (an )n∈IN nicht nach oben beschr¨ankt ist, so setzen wir lim sup an := . n→
Man bezeichnet lim sup an als Limes superior der Folge (an )n∈IN . n→
Analog f¨uhren wir den Limes inferior von (an )n∈IN ein. Falls die Folge (an )n∈IN nach unten beschr¨ankt ist, betrachten wir cn := inf{ak : k ≥ n}. Dann ist (cn )n∈IN eine monoton wachsende Folge. • Ist {cn : n ∈ IN} nach oben beschr¨ankt, so setzen wir lim inf an := lim cn = sup cn = sup inf ak . n→
n→
n∈IN
n∈IN
k≥n
• Ist {cn : n ∈ IN} nicht nach oben beschr¨ankt, so schreiben wir lim inf an := . n→
Ist schließlich (an )n∈IN nicht nach unten beschr¨ankt, so setzen wir lim inf an := −. n→
Beispiele: (1)
Sei an := n. Hier gilt lim sup an = , da {an : n ∈ IN} nicht nach oben beschr¨ankt ist. n→
F¨ur den Limes inferior gilt cn = inf{ak : k ≥ n} = n. Da (cn )n∈IN nicht nach oben beschr¨ankt ist, folgt lim inf an = . n→
Achtung: Es ist lim inf an = inf an ! n→
n∈IN
4.4 Teilfolgen und H¨aufungswerte
(2)
51
Sei an := (−1)n n. Es gilt lim sup an =
und
n→
lim inf an = − , n→
da (an )n∈IN weder nach oben noch nach unten beschr¨ankt ist. (3)
Seien a < b und
an :=
a f¨ur n ungerade , b f¨ur n gerade .
Dann gilt lim sup an = b und lim inf an = a, denn bn = b, cn = a ∀n ∈ IN. n→
(4)
Sei an :=
n→
, d.h. (an )n∈IN = −2, 32 , − 43 , 54 , − 65 , . . . .Es gilt f¨ur n gerade , 1 + 1n bn = sup{ak : k ≥ n} = 1 1 + n+1 f¨ur n ungerade .
(−1)n
1+
1 n
Folglich ist lim sup an = lim bn = 1. Ferner haben wir n→
n→
cn = inf{ak : k ≥ n} =
− 1 + 1n
1 − 1 + n+1
f¨ur n ungerade , f¨ur n gerade ,
also lim inf an = lim cn = −1. n→
n→
Bemerkung: Da, falls (an )n∈IN nach oben und unten beschr¨ankt ist, offensichtlich cn = inf{ak : k ≥ n} ≤ sup{ak : k ≥ n} = bn gilt, folgt stets lim inf an ≤ lim sup an . n→
n→
Dies ist auch richtig f¨ur eine unbeschr¨ankte Folge (an )n∈IN , wenn wir − < a < f¨ur a ∈ IR vereinbaren. Satz 4.22. Eine Folge (an )n∈IN reeller Zahlen ist genau dann konvergent, wenn − < lim inf an = lim sup an < n→
n→
gilt. Wir haben dann Gleichheit der drei Grenzwerte, lim inf an = lim an = lim sup an . n→
n→
n→
Beweis. Sei (an )n∈IN konvergent gegen a. Zu > 0 existiert also ein N ∈ IN mit a − < an < a + f¨ur alle n ≥ N. Es folgt a − ≤ inf{ak : k ≥ n} ≤ sup{ak : k ≥ n} ≤ a + f¨ur n ≥ N und damit a − ≤ lim inf an ≤ lim sup an ≤ a + . n→
n→
Da > 0 beliebig war, folgt lim inf an = lim an = lim sup an . n→
n→
n→
52
4 Metrische R¨aume und Cauchyfolgen
Gelte nun a = lim inf an = lim sup an f¨ur ein a ∈ IR. n→
n→
Zu > 0 existiert also ein N ∈ IN mit a − < inf{ak : k ≥ n} ≤ sup{ak : k ≥ n} < a + f¨ur alle n ≥ N. Es ist dann a − < an < a + f¨ur n ≥ N, also lim an = a. n→
Bemerkung: Man kann sich leicht u¨ berlegen, dass f¨ur uneigentliche Konvergenz folgendes gilt: Eine Folge (an )n∈IN reeller Zahlen ist genau dann uneigentlich konvergent gegen (bzw. −), falls lim inf an = lim sup an = (bzw. −) . n→
n→
Wir wollen nun noch die Beziehung zu H¨aufungswerten aufzeigen. Satz 4.23. (a) Eine nach oben beschr¨ankte Folge (an )n∈IN reeller Zahlen hat genau dann mindestens einen H¨aufungswert, wenn a∗ := lim sup an endlich ist. n→
In diesem Fall ist a∗ der gr¨oßte H¨aufungswert von (an )n∈IN . (b) Eine nach unten beschr¨ankte Folge (an )n∈IN reeller Zahlen hat genau dann mindestens einen H¨aufungswert, wenn a∗ := lim inf an endlich ist. n→
In diesem Fall ist a∗ der kleinste H¨aufungswert von (an )n∈IN . Beweis. Wir zeigen nur (a); der Beweis von (b) geht ganz analog. Sei s ein H¨aufungswert von (an )n∈IN . Dann gilt bn := sup{ak : k ≥ n} ≥ s, also ist (bn )n∈IN konvergent mit a∗ = lim bn ≥ s. n→
Ist umgekehrt a∗ := lim sup an ∈ IR, so gibt es zu > 0 ein N ∈ IN mit bn − a∗ < n→
2
f¨ur alle n ≥ N, denn (bn )n∈IN konvergiert monoton fallend gegen a∗ . Weiter gibt es zu jedem n0 ∈ IN ein n ≥ n0 mit |an − a∗ | < ; laut Lemma 4.17 ist a∗ ein H¨aufungswert von (an )n∈IN .
Bemerkung: Unbeschr¨ankte Folgen k¨onnen durchaus H¨aufungswerte haben. Zum Beispiel hat (an )n∈IN mit 1 f¨ur n ungerade , an = n (−1)n/2 n f¨ur n gerade . einen H¨aufungswert 0, ist aber nach oben und unten unbeschr¨ankt. Korollar 4.24. Sei (an )n∈IN eine nach oben und unten beschr¨ankte reelle Folge. Dann ist lim inf an der kleinste und lim sup an der gr¨oßte H¨aufungswert von (an )n∈IN . n→
n→
Beweis. Die beidseitige Beschr¨anktheit liefert, dass lim bn und lim cn existieren. n→ n→ Nun wende Satz 4.23 an.
4.5 Aufgaben
53
N¨utzlich ist folgende Ungleichung. Seien (an )n∈IN und (dn )n∈IN zwei Folgen reeller Zahlen mit an ≤ dn f¨ur alle n ≥ N, wobei N eine feste nat¨urliche Zahl ist. Es gilt lim inf an ≤ lim inf dn ,
(4.3)
lim sup an ≤ lim sup dn .
(4.4)
n→
n→
n→
n→
Zum Schluss halten wir noch eine charakteristische Eigenschaft von Limes superior und Limes inferior fest. Satz 4.25. (a) Seien (an )n∈IN eine nach oben beschr¨ankte Folge reeller Zahlen und x ∈ IR mit x > lim sup an . Dann existiert N ∈ IN mit an < x f¨ur alle n ≥ N. n→
(b) Seien (an )n∈IN eine nach unten beschr¨ankte Folge reeller Zahlen und x ∈ IR mit x < lim inf an . Dann existiert N ∈ IN mit an > x f¨ur alle n ≥ N. n→
Beweis. Wir zeigen nur die Aussage (a). Angenommen, die Behauptung gilt nicht. Dann gibt es also zu jedem N ∈ IN ein n ≥ N mit an ≥ x. Damit existiert eine Teilfolge (ank )k∈IN mit ank ≥ x f¨ur alle k ∈ IN. Satz 4.19 liefert nun eine konvergente Teilfolge mit Limes gr¨oßer oder gleich x im Widerspruch zur Voraussetzung.
4.5 Aufgaben 1. Seien (an )n∈IN eine Folge in einem metrischen Raum (M, d) und a ∈ M. Zeigen Sie, dass die folgenden drei Aussagen a¨ quivalent sind. (i)
Zu jedem > 0 gibt es ein N ∈ IN mit d(an , a) < f¨ur alle n ≥ N.
(ii)
Zu jedem > 0 gibt es ein N ∈ IN mit d(an , a) ≤ f¨ur alle n ≥ N.
(iii)
Zu jedem > 0 gibt es ein N ∈ IN mit d(an , a) <
2
f¨ur alle n ≥ N.
2. Es sei d : C × C → IR gegeben durch |z − w| , falls ≥ 0 existiert mit z = w , d(z, w) := |z| + |w| , sonst. Zeigen Sie, dass d eine Metrik ist. 3. Sei d die Metrik aus dem Beispiel zu Definition 4.6. Gibt es eine Norm · in IR derart, dass d(x, y) = x − y f¨ur alle x, y ∈ IR gilt ? 4. Zeigen Sie: Jede Folge reeller Zahlen besitzt eine monotone Teilfolge.
54
4 Metrische R¨aume und Cauchyfolgen
5. Geben Sie jeweils Folgen (an )n∈IN , (bn )n∈IN mit lim an = und lim bn = n→ n→ an, sodass gilt: a. d.
lim (an − bn ) = 0
b.
lim an n→ bn
e.
n→
=1
lim (an − bn) =
c.
lim an n→ bn
f.
n→
=0
lim (an − bn) = −
n→
lim an n→ bn
=
6. Zwei Normen · a und · b auf X heißen a¨ quivalent, wenn c,C > 0 existieren derart, dass c · xa ≤ xb ≤ C · xa gilt f¨ur alle x ∈ X . Zeigen Sie, dass die Normen · 1, · 2 und · auf IRd a¨ quivalent sind. 7. Bestimmen Sie alle H¨aufungswerte der Folgen (an )n∈IN mit n
a. an := 1 + 1n , b.
an := 2n + 1,
c.
an := in ,
d.
an := 1n in .
8. Geben Sie jeweils eine Folge (an )n∈IN reeller Zahlen an derart, dass die Menge der H¨aufungswerte von (an )n∈IN a.
leer,
b.
die Menge {0, 1},
c.
die Menge ZZ,
ist. 9. Bestimmen Sie Limes Inferior und Limes Superior der Folgen (an )n∈IN mit 1−2n 5+3n , n i + (−i)n ,
a.
an := (−1)n
b.
an :=
c.
an :=
√ n n a + bn
(a, b ≥ 0).
Kapitel 5
Reihen
Wir haben in Kapitel 3.1 bereits definiert, was Konvergenz einer Reihe
ak
k=1
im Fall ak ∈ IK bedeutet. Wir wollen diesen Begriff auf beliebige normierte R¨aume ausdehnen. Seien die ak nun Elemente eines normierten Raumes (X , · ). Wie in IK betrachten wir die Partialsummen sn :=
n
ak ∈ X .
k=1
Wenn die Folge (sn )n∈IN der Partialsummen gegen ein s ∈ X konvergiert, so sagen wir, dass die Reihe in X gegen s konvergiert und schreiben s=
ak .
k=1
5.1 Konvergenz und absolute Konvergenz Zun¨achst f¨ullen wir unseren Vorrat an Beispielen auf. (1)
Die Geometrische Reihe: Sei q ∈ C. Es gilt 1 + q + q2 + ... =
1
qk = 1 − q
f¨ur |q| < 1 ,
k=0
siehe Beispiel (6) in Kapitel 3.1. Wir werden sehen (als Anwendung von Korollar 5.2), dass die Reihe f¨ur |q| ≥ 1 nicht konvergiert.
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_5, © Springer-Verlag Berlin Heidelberg 2012
55
56
(2)
5 Reihen
Die Harmonische Reihe
1
k konvergiert nicht.
k=1
n
Mehr noch, die Folge ihrer Partialsummen sn :=
k=1
1 k
divergiert gegen .
F¨ur k ∈ IN und n ≥ 2k gilt
Beweis.
1 1 1 + + ···+ 2 3 n 1 1 1 1 1 1 1 + + + ···+ + · · · + k−1 + ···+ k ≥ 1+ + 2 3 4 5 8 2 +1 2 1 1 1 1 1 ≥ 1 + + 2 + 4 + · · · + 2k−1 k = 1 + k . 2 4 8 2 2
sn = 1 +
Daher divergiert sn gegen . Es ist sogar lim inf sn = = lim sup sn . n→
(3)
n→
1 1 =: e = . Die Eulersche Zahl. Es gilt lim 1 + n→ n k! k=0 Wir haben die Zahl e in Beispiel 1.7 durch eine Intervallschachtelung erkl¨art. Zu zeigen bleibt das zweite Gleichheitszeichen. n n
Beweis. Bezeichne sn := k!1 und tn := 1 + 1n . Es gilt k=0
n 1 n 1 n 1 + tn = 1 + + ···+ 2 n2 1 n n nn = 1+1+
1 n(n − 1) 1 n(n − 1)(n − 2) + + ··· 2! n2 3! n3
1 n(n − 1) · · ·(n − (n − 1)) n! nn 1 1 1 2 1 1− + 1− 1− + ··· = 1+1+ 2! n 3! n n 1 2 n−1 1 1− 1− ··· 1 − . + n! n n n +
Folglich haben wir tn ≤ sn und mit (4.3) folgt e = lim tn ≤ lim inf sn . n→ n→ F¨ur n ≥ m gilt ferner 1 1 1 m−1 1 1− + ···+ 1− ··· 1 − . tn ≥ 1 + 1 + 2! n m! n n H¨alt man m fest, so folgt mit n → nun e = lim tn ≥ 1 + 1 + n→
1 1 + ···+ = sm 2! m!
5.1 Konvergenz und absolute Konvergenz
57
und mit m → erhalten wir schließlich lim sup sm ≤ e ≤ lim inf sn , n→
m→
also lim sn = e.
n→
(4)
Die Reihe
1
k(k + 1) .
k=1
1 1 Hier k¨onnen wir die Partialsummen direkt ausrechnen. Mit k(k+1) = 1k − k+1 erhalten wir n 1 1 1 1 1 1 1 = 1− + − + · · ·+ − = 1− . sn = 2 2 3 n n+1 n+1 k=1 k(k + 1)
Die Folge (sn )n∈IN ist konvergent; es gilt
1
lim sn = 1 . k(k + 1) = n→
k=1
Wir kommen zu einigen elementaren Eigenschaften konvergenter Reihen. Satz 5.1. Sei (ak )k∈IN eine Folge in einem normierten Raum (X , · ).
Falls die Reihe ak in (X, · ) konvergiert, so gilt: k=1
Zu jedem > 0 existiert ein N ∈ IN mit " " " " n " " f¨ur alle n > m ≥ N . " ak " < "k=m+1 "
(5.1)
Ist (X , · ) ein Banachraum (also vollst¨andig), so folgt aus (5.1) die Konvergenz der Reihe in (X, · ). Insbesondere ist in (IRd , · 2 ) die Bedingung (5.1) a¨ quivalent zur Konvergenz der Reihe. Beweis. Wegen sn − sm =
n
m
n
k=1
k=1
k=m+1
ak − ak =
ak
ist die Bedingung (5.1) a¨ quivalent dazu, dass die Folge der Partialsummen eine Cauchyfolge bildet. Die erste Aussage gilt, da jede konvergente Folge eine Cauchyfolge ist, vgl. Bemerkung (3) in Kapitel 4.2. In einem Banachraum gilt nach Definition 4.6 auch die Umkehrung; insbesondere ist (IRd , · 2) ein Banachraum, siehe Satz 4.8.
Korollar 5.2. Sei (ak )k∈IN eine Folge in einem normierten Raum (X , · ).
Konvergiert die Reihe ak , so gilt ak → 0 in (X , · ) mit k → . k=1
58
5 Reihen
Beweis. Man muss nur in Satz 5.1 speziell n = m + 1 w¨ahlen.
Die Umkehrung gilt jedoch nicht! Ein prominentes Gegenbeispiel ist die Harmonische Reihe. Hier gilt ak = 1k → 0; wie wir bereits festgestellt haben, ist die Reihe
k=1
1 k
divergent.
Anwendung: Die Geometrische Reihe
qn
n=0
ist im Fall |q| ≥ 1 divergent, denn f¨ur n → gilt hier qn → 0.
k=1
k=1
Zu jeder Reihe ak mit ak ∈ (X, · ) k¨onnen wir eine Reihe ak bilden, deren Summanden nicht-negative reelle Zahlen sind.
Korollar 5.3. Sei (ak )k∈IN eine Folge in einem Banachraum (X , · ).
k=1
k=1
Konvergiert die Reihe ak in IR, so konvergiert die Reihe ak in X . Beweis. Es ist
" " " n " n " " " ak " ≤ ak . "k=m+1 " k=m+1
k=1
k=1
Erf¨ullt ak die Bedingung (5.1) in IR, so gilt diese also auch f¨ur ak in X .
Definition 5.4. Sei (ak )k∈IN eine Folge in einem normierten Raum.
k=1
k=1
Die Reihe ak heißt absolut konvergent, falls ak konvergiert. Korollar 5.3 besagt also, dass jede absolut konvergente Reihe konvergent ist. Weiter ist folgende hinreichende Bedingung f¨ur Konvergenz von Reihen mit nichtnegativen Gliedern sehr n¨utzlich. Satz 5.5. Sei (ak )k∈IN eine Folge reeller Zahlen mit ak ≥ 0 f¨ur alle k ∈ IN. Die Reihe
ak konvergiert genau dann, wenn die Menge Ihrer Partialsummen beschr¨ankt ist.
k=1
Beweis. Die Folge (sn )n∈IN der Partialsummen ist hier offensichtlich monoton wachsend. Mit Satz 3.3 folgt aus der Beschr¨anktheit von {sn : n ∈ IN} die Konvergenz (der Folge der Partialsummen), also ist die Reihe in diesem Fall konvergent. Ist {sn : n ∈ IN} hingegen unbeschr¨ankt, so divergiert (sn )n∈IN gegen .
5.2 Konvergenzkriterien
59
5.2 Konvergenzkriterien Oft kann man Konvergenz durch Vergleich mit bekannten Reihen zeigen.
Satz 5.6 (Majorantenkriterium). Seien ck eine konvergente Reihe mit ck ≥ 0 k=1
f¨ur alle k, sowie (ak )k∈IN eine Folge in einem Banachraum (X , · ) und k0 ∈ IN mit
ak ≤ ck f¨ur alle k ≥ k0 . Dann konvergiert die Reihe ak absolut. k=1
Die Reihe ck bezeichnet man dann als (konvergente) Majorante f¨ur ak . k=1
k=1
Beweis. Sei > 0. Laut Satz 5.1 existiert N ≥ k0 mit Da
n
ak ≤
k=m+1
n
n
ck < f¨ur n > m ≥ N.
k=m+1
ck
k=m+1
gilt, folgt wiederum mit Satz 5.1 die absolute Konvergenz von ak . k=1
Anwendung: Die Reihe F¨ur k ≥ 2 gilt
1 k2
≤
1
k2 .
k=1 1 (k−1)k .
Da die Reihe
1
(k − 1)k ,
k=2
wie in Beispiel (4) gezeigt, konvergent ist, folgt mit dem Majorantenkriterium die
Konvergenz der Reihe
k=1
1 . k2
Den Grenzwert dieser Reihe k¨onnen wir hier allerdings nicht bestimmen. Wir werden dies in Kapitel 11.2, Beispiel (2) mit Hilfe von Fourierreihen tun; es gilt
k=1
1 k2
=
2 6 .
Bemerkung: Das Majorantenkriterium beinhaltet das so genannte Minoranten
kriterium. Sei ck divergent mit ck ≥ 0 f¨ur alle k. k=1
Ist (ak )k∈IN eine Folge in (X , · ) mit ak ≥ ck f¨ur alle k ≥ k0 , so kann die
Reihe ak jedenfalls nicht absolut konvergieren, denn sonst w¨are (ak )k∈IN eine k=1
konvergente Majorante f¨ur (ck )k∈IN . Die folgenden Konsequenzen aus dem Majorantenkriterium werden meistens f¨ur Reihen in IK formuliert. Die Verallgemeinerung f¨ur Reihen in einem Banachraum kann man sich einfach u¨ berlegen.
60
5 Reihen
Satz 5.7 (Quotientenkriterium). Sei (ak )k∈IN eine Folge in IK. Wenn ein Index k0 ∈ IN und eine reelle Zahl q mit 0 ≤ q < 1 existieren, sodass |ak+1 | ≤ q |ak |
f¨ur alle k ≥ k0
gilt, dann ist die Reihe ak absolut konvergent. k=1
Beweis. F¨ur k > k0 gilt |ak | ≤ qk−k0 |ak0 | = (|ak0 |q−k0 ) qk .
Da qk konvergiert (Geometrische Reihe), k¨onnen wir das Majorantenkriterium k=k0
anwenden und erhalten die absolute Konvergenz von ak . k=1
Bemerkung: Hat man nur |ak+1 | < |ak | f¨ur alle k ≥ k0 , so l¨asst sich daraus nicht die
Konvergenz der Reihe |ak | herleiten. k=1
Zum Beispiel erf¨ullen die Harmonische Reihe
k=1
1 k
und auch die Reihe
k=1
1 k2
die
Beziehung |ak+1 | < |ak |. W¨ahrend die Harmonische Reihe divergiert, konvergiert die zweite Reihe. Satz 5.8 (Quotientenkriterium). Sei (ak )k∈IN eine Folge in IK mit ak = 0 ∀ k ∈ IN.
a
Wenn lim sup k+1 ak < 1 gilt, dann konvergiert ak absolut. k=1 k→
ak+1
Wenn k0 ∈ IN existiert mit a ≥ 1 f¨ur alle k ≥ k0 , dann ist ak divergent. k
k=1
a
∗ Beweis. Sei a∗ := lim sup k+1 ak < 1. Dann existiert q mit a < q < 1 und aus k→
a
Satz 4.25 erhalten wir k0 ∈ IN mit k+1 ur alle k ≥ k0 . Laut Satz 5.7 folgt ak < q f¨ nun die erste Behauptung. Die zweite Aussage impliziert |an | ≥ |ak0 | > 0 f¨ur alle n ≥ k0 . Also ist die Bedingung an → 0 hier nicht erf¨ullt und mit Satz 5.1 folgt die Divergenz der Reihe.
Beispiel: Die Reihe Hier gilt
k 3 3k . k=1 k!
ak+1 (k + 1)3 3k+1 k! 1 3 3
= 1 + = ,
a
(k + 1)! k3 3k k+1 k k
a
also lim k+1 a = 0 < 1. Die Reihe ist daher laut Quotientenkriterium konvergent. k→
k
5.2 Konvergenzkriterien
61
Satz 5.9 (Wurzelkriterium). Sei (ak )k∈IN eine Folge in IK. Wenn es c, q ∈ IR mit 0 ≤ q < 1 und c ≥ 0 gibt derart, dass |ak | ≤ c qk
f¨ur alle k ∈ IN
gilt, so ist ak absolut konvergent. k=1
Beweis. Man kann direkt das Majorantenkriterium anwenden mit
c qk k=1
als konvergente Majorante. Das Wurzelkriterium wird oft in folgender Form geschrieben. Satz 5.10 (Wurzelkriterium). Sei (ak )k∈IN eine Folge in IK. Bezeichne a∗ := lim sup k |ak | . k→
Es gilt: (a) (b)
Ist a∗ < 1, dann konvergiert die Reihe ak absolut. Ist 1 <
a∗
k=1
≤ , dann divergiert ak . k=1
Beweis. (a) Sei q mit a∗ < q < 1. Laut Satz 4.25 existiert ein N ∈ IN mit f¨ur alle k ≥ N. Damit gilt |ak | < qk f¨ur alle k ≥ N und mit |a j | : j = 1, . . . , N c := max qj
k |ak | < q
erhalten wir schließlich |ak | ≤ c qk f¨ur alle k ∈ IN. Die absolute Konvergenz der Reihe folgt nun aus Satz 5.9. (b) Ist 1 < a∗ ≤ , so existiert eine Teilfolge mit nm |anm | → a∗ f¨ur m → . Damit ist |an | > 1 f¨ur unendlich viele n ∈ IN; insbesondere gilt also an → 0 und mit Korollar 5.2 folgt die Divergenz.
Bemerkung: Im Fall a∗ = 1 erlaubt Satz 5.10 keine Aussage zu Konvergenz oder
Divergenz. Betrachte z.B. wieder die Reihen Beispiel: Die Reihe
√ k k k−1 .
k=1
k=1
1 k
und
k=1
1 . k2
√ Mit k |ak | = k k − 1 und lim k |ak | = 0 haben wir hier insbesondere a∗ < 1; das k→
Wurzelkriterium liefert Konvergenz der Reihe.
62
5 Reihen
Das Wurzelkriterium (Satz 5.10) hat einen gr¨oßeren Anwendungsbereich als das Quotientenkriterium (Satz 5.8); es gilt folgendes. Lemma 5.11. Sei (cn )n∈IN eine Folge positiver Zahlen. √ c Dann gilt lim sup n cn ≤ lim sup n+1 cn . n→
n→
Beweis. Mit der Konvention r < f¨ur alle r ∈ IR gilt die Behauptung im Fall c lim sup n+1 cn = offensichtlich. n→
Im Fall a := lim sup n→
cn+1 cn
∈ IR gibt es zu beliebigem > 0 ein m ∈ IN mit
cn+1 ≤ a+ cn
f¨ur alle n ≥ m ;
es folgt cn+1 ≤ (a + ) cn f¨ur alle n ≥ m. Wir erhalten induktiv cm+p ≤ (a + ) p cm f¨ur alle p ∈ IN √ und weiter m+p cm+p ≤ (a + ) m+p (a+cm )m f¨ur alle p ∈ IN. Damit ergibt sich √ lim sup n cn = lim sup n→
p→
√ cm+p ≤ (a + ) lim sup
m+p
m+p
p→
= (a + ) lim sup n→
n
cm (a + )m
cm = (a + ) , (a + )m
wobei wir zwei Mal Satz 4.23(a) benutzt haben. Dies gilt f¨ur jedes > 0; es folgt √ c lim sup n cn ≤ a = lim sup n+1
cn wie behauptet. n→
n→
Man findet leicht Reihen, deren Konvergenz man mittels Wurzelkriterium, nicht aber mit dem Quotientenkriterium feststellen kann. Sei etwa a2 j = a2 j+1 = 0 f¨ur
ak+1
alle j ∈ IN, so gilt lim sup a ≥ 1; dennoch ist lim sup k |ak | < 1 m¨oglich. k→
k
k→
Der folgende Satz verallgemeinert die Beweisidee, die beim Nachweis der Divergenz der Harmonischen Reihe benutzt wurde. Satz 5.12 (Verdichtungskriterium). Sei (ak )k∈IN eine Folge reeller Zahlen mit a1 ≥ a2 ≥ a3 ≥ · · · ≥ 0.
Die Reihe ak konvergiert genau dann, wenn k=1
2n a2n = a1 + 2a2 + 4a4 + 8a8 + · · ·
n=0
konvergiert.
5.2 Konvergenzkriterien
63
Beweis. Wir verwenden Satz 5.5 und zeigen die Beschr¨anktheit der jeweiligen Partialsummen. Dazu seien sn := a1 + a2 + · · · + an und tm := a1 + 2a2 + · · · + 2m a2m . F¨ur n ≤ 2m gilt sn ≤ a1 + (a2 + a3) + · · · + (a2m + · · · + a2m+1−1 ) ≤ a1 + 2a2 + · · · + 2m a2m = tm .
F¨ur n ≥ 2m gilt andererseits sn ≥ a1 + a2 + (a3 + a4) + · · · + (a2m−1+1 + · · · + a2m ) ≥
1 1 1 1 1 a1 + 2a2 + 4a4 + · · · + 2m a2m = tm . 2 2 2 2 2
Daher sind die Folgen (sn )n∈IN und (tm )m∈IN entweder beide beschr¨ankt oder beide unbeschr¨ankt.
Beispiele: (1)
Die Reihe
1
ns mit s ∈ Q.
n=1
Sie konvergiert f¨ur s > 1 und divergiert f¨ur s ≤ 1. 1 ns
Beweis. Sei zun¨achst s ≤ 0. Dann gilt Divergenz.
→ 0 und mit Korollar 5.2 folgt
Im Fall s > 0 betrachten wir die verdichtete“ Reihe 2n a2n . Es ist ” n=0
1
2n 2ns = 2(1−s)n .
n=0
n=0
Weiter gilt 2(1−s) < 1 genau dann, wenn 1 − s < 0, also s > 1 ist und mit der Konvergenz bzw. Divergenz der Geometrischen Reihe folgt schließlich die Behauptung.
(2)
Die Reihe
1
n (ln n)s .
n=2
Diese konvergiert f¨ur s > 1 und divergiert f¨ur s ≤ 1. Beweis. F¨ur s ≤ 0 ist die Harmonische Reihe eine Minorante und es folgt die Divergenz. Sei nun s > 0. Da ln n monoton w¨achst, k¨onnen wir Satz 5.12 anwenden. Hier gilt
1
1
1
1
2n 2n (ln 2n )s = (n ln 2)s = (ln 2)s ns
n=1
und mit (1) folgt die Behauptung.
n=1
n=1
64
5 Reihen
Seien (ak )k∈IN0 und (bk )k∈IN0 zwei Folgen in IK. Weiter sei A−1 := 0 und bezeichne n
k=0
k=0
An := ak die n-te Partialsumme der Reihe ak . F¨ur alle m, n ∈ IN0 , m < n, gilt n
n
n
n−1
k=m
k=m
k=m
k=m−1
ak bk = (Ak − Ak−1) bk = Ak bk − =
Ak bk+1
n−1
Ak (bk − bk+1) + An bn − Am−1 bm .
(5.2)
k=m
Die Gleichung (5.2) ist auch unter dem Namen Abelsche partielle Summation bekannt (Niels Henrik Abel, 1802-1829, Norwegen). Mit ihrer Hilfe wenden wir uns Reihen zu, deren Glieder Produkte sind. Folgendes Kriterium ist benannt nach Johann Peter Gustav Lejeune Dirichlet (1805-1859, Berlin, G¨ottingen). Satz 5.13 (Dirichlet). Seien (ak )k∈IN0 und (bk )k∈IN0 zwei Folgen in IK mit folgenden Eigenschaften: n
(i)
Die Partialsummen An = ak bilden eine beschr¨ankte Folge.
(ii)
Es gilt b0 ≥ b1 ≥ b2 ≥ · · · ≥ 0 und
(iii)
k=0
lim bk = 0.
k→
Dann konvergiert die Reihe ak bk . k=0
Beweis. Nach (i) gilt M := sup |An | < . n∈IN0
. F¨ur n ≥ m ≥ N erhalten wir Sei > 0. Wegen (iii) existiert N ∈ IN mit bN < 2M mit (ii) und (5.2) nun
n
n−1
ak bk = Ak (bk − bk+1 ) + An bn − Am−1 bm
k=m
k=m
≤M
n−1
(bk − bk+1) + bn + bm
= 2M bm ≤ 2M bN < .
k=m
Mit Satz 5.1 folgt die Konvergenz. Korollar 5.14. Sei (ck )k∈IN eine Folge reeller Zahlen mit (i)
|c1 | ≥ |c2 | ≥ |c3 | ≥ · · · ,
(ii)
c2k−1 ≥ 0 und c2k ≤ 0 f¨ur alle k ∈ IN,
(iii)
lim ck = 0.
k→
Dann konvergiert die Reihe ck . k=1
5.3 Umordnungssatz und Cauchy-Produkt
65
Beweis. Man hat nur Satz 5.13 anzuwenden mit ak = (−1)k+1 und bk = |ck |.
In Korollar 5.14 handelt es sich um eine alternierende Reihe, d.h. ihre Glieder sind abwechselnd positiv und negativ. Dieses Resultat wird oft wie folgt formuliert. Korollar 5.15 (Leibniz-Kriterium). Ist (bk )k∈IN eine monoton fallende Nullfolge,
so konvergiert die Reihe (−1)k+1 bk . k=1
Das folgende Beispiel zeigt, dass auf die Monotonie im Leibniz-Kriterium nicht verzichtet werden kann. Seien etwa a2n−1 := Es gilt 0 < ak ≤
k=1
(−1)k+1 a
k
4 k
2 n
und a2n :=
1 n
f¨ur n ∈ IN .
f¨ur alle k ∈ IN und daher lim ak = 0. Allerdings ist die Reihe k→
nicht konvergent:
Betrachten wir dazu die Folge (sn )n∈IN der Partialsummen. F¨ur gerades n, also f¨ur n = 2m mit m ∈ IN, gilt m 1 sn = . k=1 k Die Folge der Partialsummen ist daher divergent.
5.3 Umordnungssatz und Cauchy-Produkt
Die Reihe (−1)k+1 1k ist laut Leibniz-Kriterium konvergent. Einerseits ist k=1
1 1 1 1 1 1 5 + − + 1+ − + + − + +··· < . 2 3 4 5 6 7 6 <0
<0
Wenn wir die gleichen Summanden aber in einer anderen Reihenfolge aufaddieren, etwa immer zwei positive und dann einen negativen, erhalten wir 1 1 1 1 5 1 1 1 1 1+ − + + − + − + +··· > . 3 2 5 7 4 9 11 6 6 >0
>0
Die Reihenfolge der einzelnen Summanden in einer Reihe spielt also eine wichtige Rolle. Wir wollen nun zeigen, dass man im Fall einer absolut konvergenten Reihe die Summanden beliebig umordnen kann, und der Grenzwert sich dabei nicht a¨ ndert. Die obige Reihe ist nicht absolut konvergent. Den Wert der Reihe k¨onnen
66
5 Reihen
wir an dieser Stelle noch nicht berechnen; dazu verweisen wir auf Kapitel 10.3, Gleichung (10.2).
k=1
k=1
Ist : IN → IN bijektiv, so bezeichnen wir a (k) als Umordnung der Reihe ak . Satz 5.16 (Umordnungssatz). Ist eine Reihe in einem normierten Raum absolut konvergent, dann konvergiert auch jede Umordnung dieser Reihe und alle Umordnungen haben den selben Grenzwert.
Beweis. Sei ak absolut konvergent. Weiter seien : IN → IN bijektiv und k=1
sn :=
n
ak ,
rn :=
k=1
n
a (k)
k=1
die Partialsummen der urspr¨unglichen bzw. der umgeordneten Reihe. Nach Voraussetzung ist (sn )n∈IN konvergent. Wir m¨ussen zeigen, dass lim (sn − rn ) = 0 gilt. n→
Dazu betrachten wir f¨ur n ∈ IN die Menge Mn := IN \ { (1), (2), . . . , (n)}; ihr kleinstes Element bezeichnen wir mit mn . Wir erhalten " " " " " " sn − rn = " a − a " k k " "k∈{1,...,n}∩M k∈{ (1),..., (n)}∩{n+1,n+2,...} n
≤
ak
+
k∈{1,...,n}∩Mn
≤
k=mn
ak +
k∈{ (1),..., (n)}∩{n+1,n+2,...}
ak
ak ,
k=n+1
wobei wir die absolute Konvergenz der Reihe benutzt haben, da letztere Ausdr¨ucke sonst gar nicht existieren. Wegen Mn ⊇ Mn+1 ist die Folge (mn )n∈IN monoton wachsend. Außerdem gibt es zu jedem j ∈ IN ein k j mit j = (k j ); dann ist j ∈ / Mk j und weiter j ∈ / Mn f¨ur alle n ≥ k j . Die Folge (mn )n∈IN ist deshalb nicht beschr¨ankt.
Sei nun > 0. Laut Satz 5.1 gibt es ein N ∈ IN mit ak < 2 . k=N
F¨ur alle n mit n ≥ N und mn ≥ N gilt folglich sn − rn < . Daher haben wir lim (sn − rn ) = 0, was a¨ quivalent zu
n→
k=1
k=1
ak = a (k)
ist. Die umgeordnete Reihe konvergiert also gegen den selben Grenzwert wie die urspr¨ungliche.
5.3 Umordnungssatz und Cauchy-Produkt
67
n=0
n=0
Satz 5.17 (Cauchy-Produkt). Seien an und bn konvergente Reihen in IK. n
F¨ur n ∈ IN0 setze cn := ak bn−k . k=0
Wenn an absolut konvergent ist, dann ist die Reihe cn konvergent mit n=0
n=0
cn = a n
n=0
bn
n=0
.
n=0
Beweis. Nach Voraussetzung existieren die Grenzwerte
k=0
k=0
ak =: , bk =:
und
|ak | =: x .
k=0
Wir bezeichnen die Partialsummen der Reihen mit
n :=
n
ak ,
n :=
k=0
n
bk ,
k=0
n :=
n
ck ,
k=0
und setzen n := n − f¨ur n ∈ IN0 . Damit gilt
n = a0 b0 + (a0 b1 + a1 b0 ) + · · · + (a0 bn + a1 bn−1 + · · · + an b0 ) = a0 n + a1 n−1 + · · · + an 0 = a0 ( + n ) + a1( + n−1) + · · · + an( + 0 ) = n + a0 n + a1 n−1 + · · · + an 0 . =:rn
Wir m¨ussen zeigen, dass lim n = gilt. n→
Wegen lim n = bleibt lediglich lim rn = 0 zu zeigen. n→
n→
Sei > 0. Wegen lim n = 0 gibt es N ∈ IN mit |n | < f¨ur alle n ≥ N. Es folgt n→
|rn | ≤ |an 0 + · · · + an−N N | + |an−N−1 N+1 + · · · + a0 n | ≤ |an 0 + · · · + an−N N | + (|an−N−1 | + · · · + |a0|) ≤ |an 0 + · · · + an−N N | + x f¨ur n ≥ N. Aus lim an = 0 erhalten wir lim |an 0 + · · · + an−N N | = 0. Daher gilt n→
n→
lim sup |rn | ≤ x. Da beliebig gew¨ahlt werden kann, bleibt nur lim |rn | = 0.
n→
n→
n=0
n=0
n=0
Die Reihe cn bezeichnet man als Cauchy-Produkt der Reihen an und bn . Wenn letztere beide nicht absolut konvergent sind, so ist deren Cauchy-Produkt m¨oglicherweise nicht konvergent, vgl. Aufgabe 7a.
68
5 Reihen
5.4 Potenzreihen Definition 5.18. Ist (ck )k∈IN0 eine Folge komplexer Zahlen, so heißt der Ausdruck
ck zk
k=0
eine Potenzreihe. Die ck nennt man die Koeffizienten der Reihe. Wir wollen untersuchen, f¨ur welche Werte von z ∈ C eine Potenzreihe konvergiert, und werden gleich sehen, dass jede Potenzreihe f¨ur alle z im Inneren eines ¨ gewissen Kreises konvergiert und f¨ur z aus dem Außeren divergiert.
Gelegentlich werden auch Reihen der Form ck (z − z0 )k betrachtet. Man bek=0
zeichnet z0 dann als Entwicklungspunkt.
Satz 5.19. Sei ck zk eine Potenzreihe. Setze k=0
:= lim sup k→
1 k |ck | und R :=
(dabei ist R = , falls = 0 und R = 0, falls = ). Damit gilt: Ist |z| < R, so ist die Reihe absolut konvergent. Ist |z| > R, so ist die Reihe divergent.
(a) (b)
Beweis. Setze ak := ck zk .
Laut dem Wurzelkriterium (Satz 5.10) konvergiert die Reihe ak absolut, falls k=0 lim sup k |ak | = |z| lim sup k |ck | < 1 ist, und divergiert im Fall |z| lim sup k |ck | > 1. k→
k→
k→
Das ist exakt die Behauptung. Die Zahl R heißt Konvergenzradius der Potenzreihe. Offensichtlich gilt % R = sup r ≥ 0 :
ck rk konvergiert absolut
,
k=0
wobei R = zu setzen ist, falls diese Menge nicht beschr¨ankt ist. Man kann den Konvergenzradius in vielen F¨allen auch mit Hilfe des Quotientenkriteriums bestimmen.
Satz 5.20. Sei ck zk eine Potenzreihe. k=0
c
Wenn := lim k+1 ck existiert, so ist R = k→
1
ihr Konvergenzradius.
(wiederum mit R = , falls = 0 und R = 0, falls = )
5.4 Potenzreihen
69
Beweis. Es gilt
ck+1 zk+1
ck+1
<1. lim
lim
< 1 ⇐⇒ |z| k→ k→ ck zk ck
=
Im Fall = 0 erhalten wir mit dem Quotientenkriterium (Satz 5.8): 1 Die Reihe konvergiert
f¨ur |z| < = R absolut. Ist hingegen |z| > R, so gibt es ein
ck+1
1 N ∈ IN derart, dass ck > |z| gilt f¨ur alle k ≥ N, und es folgt
ck+1 zk+1
c zk ≥ 1 k
f¨ur alle k ≥ N ;
die Reihe divergiert. Im Fall = 0 gilt |z| < 1 f¨ur alle z ∈ C. Die Reihe konvergiert dann absolut f¨ur alle z ∈ C, d.h. R = ; die Aussage gilt also auch in diesem Fall.
Beispiele: (1)
Die Exponentialreihe exp(z) :=
zk
k! .
k=0
Ihr Konvergenzradius ist R = , denn mit folgt absolute Konvergenz f¨ur alle z ∈ C. (2)
Die Sinusreihe sin(z) :=
|zk +1| k! (k+1)! |zk |
=
z2k+1
|z| k+1
z3
→ 0 und Satz 5.8 z5
z7
(−1)k (2k + 1)! = z − 3! + 5! − 7! ± · · · und
k=0
die Cosinusreihe cos(z) :=
z2k
z2
z4
z6
(−1)k (2k)! = 1 − 2! + 4! − 6! ± · · ·
k=0
(3) (4)
Sie konvergieren beide f¨ur jedes z ∈ C, denn die Exponentialreihe ist jeweils konvergente Majorante. Also haben diese Reihen ebenfalls den Konvergenzradius R = . k z Die Reihe hat den Konvergenzradius R = 1. k=1 k Die Reihe
kk zk hat den Konvergenzradius R = 0.
k=1
zk hat den Konvergenzradius R = 1.
(5)
Die Geometrische Reihe
(6)
F¨ur s ∈ C und k ∈ ZZ verallgemeinern wir die Binomialkoeffizienten, ⎧ s(s − 1) · · · (s − k + 1) ⎪ ⎪ f¨ur k ∈ IN , ⎨ s k! := 1 f¨ur k = 0 , ⎪ k ⎪ ⎩ 0 f¨ur k < 0 .
k=0
70
5 Reihen
Die Binomialreihe zum Exponenten s ∈ C ist definiert durch s k s(s − 1) 2 z + ··· Bs (z) := z = 1 + sz + 2! k k=0 s = 0 f¨ur k > s. Insbesondere f¨ur s = n ist damit Im Fall s ∈ IN0 gilt k n n n z = (1 + z)n . Bn (z) = k=0 k Ist s ∈ / IN0 , so hat die Potenzreihe Bs (z) den Konvergenzradius R = 1. Es gilt n¨amlich
s k+1
s z
k
|s − k| k+1
s = |z| = |z|
− → |z| mit k → ,
zk
k+1 k + 1 k + 1
k also haben wir absolute Konvergenz f¨ur |z| < 1 und Divergenz f¨ur |z| > 1. Wurzel- und auch Quotientenkriterium liefern keine Aussage u¨ ber das Konvergenzverhalten auf dem Rand des Konvergenzkreises, also f¨ur diejenigen z mit |z| = R. In der Tat gibt es Potenzreihen, die f¨ur manche z mit |z| = R konvergieren, f¨ur andere jedoch nicht. Die Geometrische Reihe hat den Konvergenzradius R = 1 und konvergiert f¨ur kein z mit |z| = 1.
Satz 5.21. Sei ck zk eine Potenzreihe mit Konvergenzradius R = 1 und es gelte k=0
c0 ≥ c1 ≥ c2 ≥ · · · ≥ 0 sowie lim ck = 0. k→
Dann konvergiert die Potenzreihe f¨ur alle z ∈ C mit |z| = 1, z = 1. n
Beweis. Wir setzen an := zn , bn := cn und An := zk . k=0
Es gilt (1 − z)An = 1 − zn+1. Ist nun |z| = 1, z = 1, so erhalten wir
n
1 − zn+1
≤ 2 |An | = zk =
k=0
1 − z |1 − z| f¨ur alle n ∈ IN0 und mit Satz 5.13 folgt nun die Behauptung.
k zk z und 2 . k k k=1 k=1 Sie erf¨ullen beide die Voraussetzungen von Satz 5.21 (die Tatsache, dass es hier keinen 0-ten“ Koeffizienten gibt, spielt keine Rolle, wie man sich leicht u¨ berlegen ” kann), sind also konvergent f¨ur alle z mit |z| = 1, z = 1. Allerdings konvergiert erstere nicht f¨ur z = 1 (Harmonische Reihe), w¨ahrend die zweite f¨ur z = 1 konvergent ist (siehe auch die Anwendung nach Satz 5.6).
Anwendung: Die Reihen
5.5 Exponentialreihe und Eulersche Formel
71
5.5 Exponentialreihe und Eulersche Formel Die Exponentialreihe ist uns im vorigen Abschnitt bereits begegnet. Sie hat den Konvergenzradius R = , ist also f¨ur alle z ∈ C konvergent. Daher ist durch exp(z) :=
zk
k!
k=0
eine Abbildung exp : C → C erkl¨art. Man bezeichnet sie als Exponentialfunktion. Sie spielt eine herausragende Rolle in der Analysis ( nat¨urliches“ Wachstum) und ” steht in engem Zusammenhang mit den trigonometrischen Funktionen Sinus und Cosinus (die wir bisher nur u¨ ber Potenzreihen definiert haben!). Aus der absoluten Konvergenz der Reihe erhalten wir f¨ur z, w ∈ C mit dem Cauchy-Produkt (Satz 5.17) n n k z wn z wn−k = n=0 n! n=0 n! n=0 k=0 k! (n − k)! =
n=0
n! 1 n k! (n − k)! zk wn−k n! k=0
=
(z + w)n . n! n=0
Es gilt also die Funktionalgleichung der Exponentialfunktion, exp(z + w) = exp(z) exp(w)
(5.3)
f¨ur alle z, w ∈ C. Weiter betrachten wir die Reihen cos(z) :=
(−1)k 2k z k=0 (2k)!
und
sin(z) :=
(−1)k
(2k + 1)! z2k+1 .
k=0
Beide werden durch die Exponentialreihe majorisiert und sind deshalb f¨ur alle z ∈ C absolut konvergent. F¨ur n ∈ IN erhalten wir 4n+1
j=0
1 1 1 4n (iz) j 1 = 1 − z2 + z4 − z6 ± · · · + z j! 2 4! 6! (4n)! 1 3 1 5 1 4n+1 z +i z − z + z ∓ · · · + 3! 5! (4n + 1)! =
2n
(−1)k 2k z k=0 (2k)!
2n
(−1)k 2k+1 z . k=0 (2k + 1)!
+i
Grenzwertbildung n → liefert nun die als Eulersche Formel bekannte Gleichung exp(iz) = cos(z) + i sin(z) . Mit cos(z) = cos(−z) und sin(z) = − sin(−z) folgt
(5.4)
exp(−iz) = cos(z) − i sin(z).
72
5 Reihen
Weitere Eigenschaften der Exponentialfunktion: 1 1 = e = lim 1 + , vgl. Kapitel 5.1, Beispiel(3). (1) Es gilt exp(1) = n→ n k=0 k! (2)
1 F¨ur alle z ∈ C gilt exp(−z) = exp(z) und insbesondere exp(z) = 0, denn die Funktionalgleichung (5.3) liefert exp(z) exp(−z) = exp(z − z) = exp(0) = 1.
(3)
Es ist exp(x) > 0 f¨ur alle x ∈ IR; genauer gilt sogar exp(x) > 1 f¨ur x > 0 und 0 < exp(x) < 1 f¨ur x < 0. Beweis. Die Aussage f¨ur x > 0 ist klar, da in der Reihe dann alle Glieder positiv sind; die Aussage f¨ur x < 0 folgt nun mit (2).
(4)
F¨ur x, y ∈ IR mit x < y gilt exp(x) < exp(y). Beweis.
Laut (3) gilt exp(y − x) > 1; Funktionalgleichung und (2) liefern exp(y − x) = exp(y) exp(−x) =
exp(y) exp(x)
und insgesamt folgt exp(x) < exp(y). (5)
F¨ur alle t ∈ IR gilt | exp(it)| = 1. Beweis. Aus der Eulerschen Formel (5.4) erhalten wir cos(t) = Re (exp(it)) sowie sin(t) = Im (exp(it)) und damit exp(−it) = exp(it) f¨ur t ∈ IR. Ande1 rerseits gilt auch exp(it) = exp(−it) ; es bleibt also nur | exp(it)| = 1.
i sin(t)
exp(it) 1 cos(t)
Fasst man C als Euklidischen Raum auf, so liegen die Punkte z = exp(it) auf dem Kreis um den Nullpunkt mit Radius 1. Es gilt cos(t) = Re (exp(it)), sin(t) = Im (exp(it)) sowie 1 = | exp(it)|2 = (cos(t))2 + (sin(t))2 .
Satz 5.22 (Additionstheoreme fur ¨ Sinus und Cosinus). F¨ur z, w ∈ C gilt cos(z + w) = cos z cos w − sin z sin w
und
sin(z + w) = sin z cos w + cosz sin w . Beweis. Mit Hilfe von Eulerscher Formel und Funktionalgleichung erhalten wir cos(z + w) + i sin(z + w) = exp(i(z + w)) = exp(iz) exp(iw) = (cos z + i sin z)(cos w + i sin w) = cos z cos w − sin z sin w + i(sin z cos w + cosz sin w)
5.6 Die R¨aume 1 , 2 und
73
und cos(z + w) − i sin(z + w) = exp(−i(z + w)) = exp(−iz) exp(−iw) = (cos z − i sin z)(cos w − i sin w) = cos z cos w − sin z sin w − i(sin z cosw + cosz sin w) .
Addieren bzw. subtrahieren wir die Gleichungen, so folgt die Behauptung.
5.6 Die R¨aume 1 , 2 und Den normierten Raum = {a = (an )n∈IN : an ∈ IK , {an : n ∈ IN} beschr¨ankt} mit der Norm a = sup |an | kennen wir bereits aus Kapitel 4.1. Wir definieren nun n∈IN
1 := {a = (an )n∈IN : an ∈ IK , 2
:= {a = (an )n∈IN : an ∈ IK ,
|an| < } ,
n=1
a1 :=
|an| ,
|an|
2
n=1
< } ,
a2 :=
und
n=1
1/2
|an|
2
n=1
.
Es ist nicht schwer einzusehen, dass 1 mit · 1 ein normierter Raum ist. Dies kann einfach auf direktem Wege gezeigt werden. ¨ F¨ur 2 sind hierzu einige weitere Uberlegungen n¨otig. Aus a = (an )n∈IN ∈ 2 und b = (bn )n∈IN ∈ 2 folgt a + b = (an + bn )n∈IN ∈ 2 , denn es ist |an + bn |2 ≤ |an |2 + 2|an| |bn | + |bn|2 ≤ 2(|an |2 + |bn |2 ). Auch in 2 gilt eine Cauchy-Ungleichung (vgl. Satz 4.4). Satz 5.23 (Cauchy-Ungleichung). Seien a = (an )n∈IN ∈ 2 und b = (bn )n∈IN ∈ 2 . Dann gilt ab = (an bn )n∈IN ∈ 1 und ab1 =
1/2
|an bn| ≤ |an |
n=1
n=1
n=1
Beweis. Aus Satz 4.4 erhalten wir 1/2 d
d
n=1
n=1
|anbn | ≤ |an | ≤
1/2
d
2
= a2 b2 .
1/2
|bn|
2
|an |2
n=1
|bn|
2
2
n=1
1/2
|bn|2
n=1
1/2 = a2 b2 <
f¨ur jedes d ∈ IN. Damit folgt (an bn )n∈IN ∈ 1 und die Ungleichung ist erf¨ullt.
74
5 Reihen
Analog zum Beweis von Satz 4.5 folgt nun die Minkowski-Ungleichung in 2 . F¨ur alle a, b ∈ 2 gilt a + b2 ≤ a2 b2 . Damit ist nun leicht ersichtlich, dass auch 2 mit · 2 ein normierter Raum ist. Zum Schluss zeigen wir noch, dass die hier betrachteten R¨aume vollst¨andig sind. Satz 5.24. Die normierten R¨aume ( p , · p), p ∈ {1, 2, }, sind Banachr¨aume. Beweis. Wir m¨ussen nur noch die Vollst¨andigkeit zeigen. Sei (an )n∈IN eine Cauchyfolge in p . Man beachte, dass hier an ∈ p ist, also etwa an = (an,1 , an,2 , an,3 , . . .). Zu > 0 gibt es dann N ∈ IN mit
1/p
|an,k − am,k |
an − am p =
p
<
(p = 1, 2)
k=1
bzw. an − am = sup |an,k − am,k | < k∈IN
(p = )
f¨ur m, n ≥ N. Damit ist f¨ur jedes k ∈ IN die Folge (an,k )n∈IN eine Cauchyfolge in IK. Also existiert der Grenzwert k := lim an,k . n→
· p
Zu zeigen bleibt = (k )k∈IN ∈ p und an −→ . Mit m → erhalten wir f¨ur alle n ≥ N und l ∈ IN nun
l
|an,k − k |
1/p p
≤
bzw.
≤
bzw.
sup |an,k − k | ≤ .
k=1,...,l
k=1
Damit gilt auch
|an,k − k |
1/p p
k=1
sup |an,k − k | ≤
k∈IN
f¨ur alle n ≥ N und es folgt die Behauptung. Satz 5.25. In 2 ist durch a, b :=
ak bk
k=1
ein Skalarprodukt erkl¨art. Mit diesem ist 2 ein Hilbertraum. Beweis. Mit Satz 5.23 sehen wir, dass die Reihe a, b in der Tat f¨ur alle a, b ∈ 2 konvergiert. Die geforderten Eigenschaften eines Skalarproduktes kann man nun mit Hilfe der Rechenregeln f¨ur Grenzwerte einfach nachpr¨ufen. Weiter gilt nach Konstruktion a, a = a2 und mit dieser Norm ist 2 laut Satz 5.24 vollst¨andig. Also ist 2 ein Hilbertraum.
5.7 Aufgaben
75
5.7 Aufgaben 1. Welche der folgenden Reihen sind konvergent ? a. d.
nn
n! + nn
n2 + 3n
n3 − 3n
b.
n=1
n=1
n!
nn
n=1 1 + a
2. Zeigen Sie:
n2
n=1
an
e.
n=1
n!
c. (a > 0)
n
|an | konvergent. Wenn die Reihe an absolut konvergent ist, dann ist n n=1 n=1
3. Zeigen Sie, dass die folgenden Reihen konvergieren und bestimmen Sie ihren Grenzwert.
a.
n−1 n=1 n!
b.
n(n + 2)
1
n=1
c.
an n+1 n=0 (a + 1)
d.
(−1)n a2n
n=0
(a ∈ C , a = −1) (a ∈ C)
4. Bestimmen Sie die Konvergenzradien der folgenden Potenzreihen. a.
n=0
d.
nn
(n + 1)! zn
n=0
2n n z n
b.
zn
(n + (−1)n)!
c.
n=0
e.
(an + bn)zn
n=1
2nzn
2
n=1
(a, b > 0)
5. Finden Sie ein Beispiel einer Reihe, deren Konvergenz man mit dem Wurzelkriterium (Satz 5.10), nicht aber mit dem Quotientenkriterium (Satz 5.8) folgern kann. 6. Sei (bk )k∈IN eine monoton fallende Nullfolge. Laut Leibniz-Kriterium existiert der Grenzwert s :=
(−1)k+1bk .
k=1
Zeigen Sie: F¨ur die Partialsummen sn dieser Reihe gilt |sn − s| ≤ bn+1 ∀n ∈ IN.
76
7.
5 Reihen
a. Die Reihe
n=0
(−1)n √ n+1
ist laut Leibniz-Kriterium konvergent.
Zeigen Sie, dass das Cauchy-Produkt dieser Reihe mit sich selbst divergent ist. Betrachten Sie also (−1)n an := bn := √ n+1
und cn :=
n
ak bn−k f¨ur n ∈ IN
k=0
und zeigen Sie, dass die Reihe cn nicht konvergiert. n=0
√1 n
b. Folgern Sie, dass die Reihe
n=1
8. Zeigen Sie, dass e = exp(1) =
n=0
Gehen Sie dabei wie folgt vor:
1 n!
N
Zeigen Sie Sie zun¨achst 0 < e −
n=0
nicht konvergiert.
irrational ist.
1 n!
≤
2 (N+1)!
f¨ur n ∈ IN.
Nehmen Sie nun an, es sei e ∈ Q, d.h. es gebe p ∈ ZZ, N ∈ IN mit e = folgern Sie daraus N 1 ∈ IN. N! e − n=0 n!
p N
und
Leiten Sie hieraus unter Benutzung obiger Absch¨atzung einen Widerspruch her. 9.
a. Zeigen Sie: F¨ur z ∈ C und n ∈ IN gilt (cos z + i sin z)n = cos(nz) + i sin(nz) . b. Geben Sie sin(3z) mit Hilfe von cosz und sin z an.
10. Die Folge der Fibonacci-Zahlen wird definiert durch a0 := 0 ,
a1 := 1 ,
an+1 := an + an−1
f¨ur n ∈ IN .
a. Zeigen Sie: F¨ur alle n ∈ IN gilt an+1 an−1 − a2n = (−1)n . an+1 . F¨ur n ∈ IN betrachten wir qn := an b. Zeigen Sie, dass die Folge (qn )n∈IN konvergent ist. n
Hinweis: Es gilt qn+1 − 1 = (qk+1 − qk ). k=1
c. Bestimmen Sie den Grenzwert lim qn . n→ 1 Tipp: Es gilt qn+1 = 1 + qn
5.7 Aufgaben
77
11. Seien an zn und bn zn Potenzreihen mit Konvergenzradien Ra bzw. Rb . n=0
n=0
n
Weiter sei cn := ak bn−k f¨ur n ∈ IN0 . k=0
Zeigen Sie: F¨ur z ∈ C mit |z| < min{Ra , Rb } gilt
anzn
n=0
bnzn
n=0
12. Eine Reihe der Form
=
cn zn .
n=0
ak
ks
k=1
(hier zun¨achst f¨ur s ∈ Q) heißt Dirichletsche Reihe. Zeigen Sie: a. Konvergiert
ak
k s0
f¨ur ein s0 , so konvergiert
k=1
ak
ks
f¨ur jedes s > s0 .
k=1
b. Es gibt ∈ IR, sodass die Reihe konvergiert f¨ur s > und divergiert f¨ur s < . 13. Zeigen Sie: Es gilt 1 2 .
This page intentionally left blank
Kapitel 6
Stetigkeit
Wir werden den Begriff der Stetigkeit hier f¨ur Abbildungen zwischen metrischen R¨aumen einf¨uhren. In Kapitel 12 werden wir diesen Begriff weiter ausbauen. Die Stetigkeit kann noch allgemeiner in beliebigen so genannten topologischen R¨aumen, die nicht notwendigerweise eine Metrik tragen m¨ussen, erkl¨art werden. Wir werden dies am Ende von Kapitel 12.2 kurz aufgreifen; mehr dazu findet man in Lehrb¨uchern zur Topologie, wie etwa [10] oder [18].
6.1 Stetige Abbildungen Definition 6.1. Seien (X , dX ) und (Y, dY ) metrische R¨aume. Eine Abbildung f : X → Y heißt stetig in p ∈ X , falls f¨ur jedes > 0 eine Zahl > 0 existiert, sodass gilt: dY ( f (x), f (p)) <
f¨ur alle x ∈ X mit dX (x, p) < .
Ist f stetig in allen Punkten p ∈ X, so heißt f stetig (oder stetig auf X ). Den Raum der stetigen Funktionen X → Y bezeichnen wir mit C(X ,Y ). Im Fall Y = IK mit der nat¨urlichen Metrik schreiben wir C(X ) an Stelle von C(X , IK).
f (p)
f (p)
p
p
Zu jedem > 0 gibt es ein > 0 derart, dass dY ( f (x), f (p)) < f¨ur alle x ∈ X mit dX (x, p) < gilt. Man beachte, dass von und auch von p abh¨angen kann. R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_6, © Springer-Verlag Berlin Heidelberg 2012
79
80
6 Stetigkeit
Mit der Bezeichnung UrdX (x) := {y ∈ X : dX (y, x) < r}, vgl. Kapitel 4.1, kann man die Stetigkeit wie folgt ausdr¨ucken: Die Abbildung f ist stetig in p genau dann, wenn es zu jedem > 0 ein > 0 gibt mit f UdX (p) ⊆ UdY ( f (p)) . Sind z.B. X = M ⊆ IR und Y = IR (jeweils mit der gew¨ohnlichen Metrik), so heißt Stetigkeit in p ∈ M, dass zu jedem > 0 ein > 0 existiert mit f ( ]p − , p + [ ) ⊆ ] f (p) − , f (p) + [ . Beispiele: (1)
Die konstante Funktion f : IR → IR, f (x) = c, ist stetig, denn es gilt stets | f (x) − f (p)| = 0 < .
(2)
Die Funktion f : IR → IR, f (x) = x2 ist stetig. Beweis. Zu p ∈ IR, > 0 w¨ahle = min 1, 2|p|+1 . Ist dann n¨amlich |x − p| < , so gilt | f (x) − f (p)| = |x2 − p2| = |x + p| |x − p| ≤ (|x| + |p|) |x − p| und mit |x| ≤ |x − p| + |p| erhalten wir weiter (|x| + |p|) |x − p| ≤ (|x − p| + 2|p|) |x − p| ≤ (1 + 2|p|) |x − p| < . Es gilt also | f (x) − f (p)| < f¨ur alle x ∈ IR mit |x − p| < .
(3)
Die Funktion f : IR → IR, ⎧ ⎨ 1 f¨ur x > 0 , 0 f¨ur x = 0 , f (x) = sgn (x) := ⎩ −1 f¨ur x < 0 , ist nicht stetig in p = 0, denn f¨ur ≤ 1 gibt es kein passendes“ > 0, sodass ” sgn ( ] − , [ ) ⊆ ] − , [ gilt, weil stets sgn ( ] − , [ ) = {−1, 0, 1} ist.
(4)
Sei (M, d) ein metrischer Raum. Die Identit¨at f : M → M, f (x) = x ist stetig, denn zu > 0 kann man = w¨ahlen. Aus |x − p| < folgt dann immer | f (x) − f (p)| < .
(5)
Seien (M, d) ein metrischer Raum, b ∈ M ein fester Punkt. Die Funktion f : M → IR, f (x) = d(x, b) ist stetig. Beweis. Zu > 0 w¨ahle = . Aus d(x, p) < folgt dann mit der Dreiecksungleichung | f (x) − f (p)| = |d(x, b) − d(p, b)| ≤ d(x, p) < = .
(5)
Sei (IRd , · 2 ) der d-dimensionale Euklidische Raum. F¨ur j ∈ {1, . . . , d} bezeichnen wir mit j : IRd → IR, j (x) = x j , die Projektion auf die j-te Ko-
6.1 Stetige Abbildungen
81
ordinate (Koordinatenfunktion). Die Funktionen j sind stetig, denn wegen | j (x) − j (p)| ≤ x − p2 k¨onnen wir = w¨ahlen. (6)
Sei j : 2 → IK, j (a) = a j , f¨ur a = (a1 , a2 , . . .) ∈ 2 , j ∈ IN. Analog zu vorigem Beispiel zeigt man, dass auch diese Koordinatenfunktionen stetig sind.
Der folgende Satz liefert eine Charakterisierung der Stetigkeit mittels Folgen. Satz 6.2 (Folgenkriterium). Seien (X , dX ), (Y, dY ) metrische R¨aume, f : X → Y eine Abbildung und p ∈ X. Die Abbildung f ist genau dann in p stetig, wenn gilt: F¨ur jede gegen p konvergente Folge (xn )n∈IN in X konvergiert die Bildfolge ( f (xn ))n∈IN in Y gegen f (p). Beweis. Seien f stetig in p ∈ X und (xn )n∈IN eine Folge in X mit p = lim xn . n→
Zu > 0 gibt es dann ein > 0, sodass dY ( f (x), f (p)) < f¨ur alle x ∈ X mit dX (x, p) < gilt. Weiter existiert zu ein N ∈ IN mit dX (xn , p) < f¨ur alle n ≥ N. Damit folgt dY (( f (xn ), f (p)) < f¨ur alle n ≥ N, d.h. lim f (xn ) = f (p). n→
F¨ur die umgekehrte Implikation sei nun vorausgesetzt, dass f nicht stetig in p ist. Das heißt: Es gibt ein > 0, sodass f¨ur jedes > 0 ein Punkt x ∈ X existiert mit sowohl dX (x, p) < als auch dY ( f (x), f (p)) ≥ . Insbesondere gibt es dann zu jedem n ∈ IN einen Punkt xn ∈ X mit dX (xn , p) < 1n und dY ( f (xn ), f (p)) ≥ . Damit ist (xn )n∈IN konvergent gegen p in X, aber ( f (xn ))n∈IN konvergiert nicht gegen f (p) in Y .
Schreibweise: Seien X,Y metrische R¨aume, D ⊆ X und f : D → Y eine Abbildung. Falls f (xn ) → c ∈ Y gilt f¨ur jede Folge (xn )n∈IN in D, die gegen p ∈ X konvergiert, so schreibt man lim f (x) = c. Falls f in p stetig ist, haben wir damit also c = f (p). x→p
Zu f : X → Y und g : Y → Z bezeichnen wir die durch g ◦ f (x) := g( f (x)) erkl¨arte Abbildung g ◦ f : X → Z als Komposition von f und g. Wir wollen zeigen, dass die Komposition zweier stetiger Funktionen auch wieder stetig ist. Satz 6.3. Seien (X, dX ), (Y, dY ) und (Z, dZ ) drei metrische R¨aume sowie p ∈ X. Wenn die Abbildungen f : X → Y stetig in p und g : Y → Z stetig in f (p) ∈ Y sind, dann ist g ◦ f : X → Z stetig in p. Beweis. Sei > 0. Da g stetig in f (p) ist, gibt es > 0 mit g UdY ( f (p)) ⊆ UdZ (g( f (p))). Zu > 0 gibt es nun > 0 mit f UdX (p) ⊆ UdY ( f (p)), weil f stetig in p ist. Zusammen haben wir g ◦ f UdX (p) ⊆ g UdY ( f (p)) ⊆ UdZ (g ◦ f (p)) , also ist g ◦ f stetig in p.
82
6 Stetigkeit
Sind X ein metrischer Raum, f : X → IK, g : X → IK Abbildungen und ∈ IK, so sind durch ( f )(x) := f (x) ,
( f + g)(x) := f (x) + g(x) ,
( f g)(x) := f (x) g(x)
weitere Abbildungen f + g, f , f g : X → IK erkl¨art. Ist f (x) = 0 f¨ur alle x ∈ X , so ist
1 f
: X → IK definiert durch
1 f
(x) :=
1 f (x) .
Satz 6.4. Seien (X, d) ein metrischer Raum, f : X → IK und g : X → IK stetig in p ∈ X sowie ∈ IK. Dann sind auch f + g, f und f g stetig in p. Ist f stets = 0, so ist auch 1f stetig in p. Beweis. Wir verwenden das Folgenkriterium (Satz 6.2). Ist (xn )n∈IN konvergent gegen p, so konvergieren auch f (xn ) gegen f (p) und g(xn ) gegen g(p). Laut den Rechenregeln f¨ur Grenzwerte (Satz 3.5) konvergieren ( f + g)(xn ) gegen ( f + g)(p) und f (xn ) gegen f (p) sowie f g(xn ) gegen f g(p) und, unter der gegebenen Voraussetzung, 1f (xn ) gegen 1f (p).
Beispiele: (1)
Mit Satz 6.4 sind Polynome P : IK → IK, P(x) = an xn + an−1xn−1 + · · · + a0 , mit n ∈ IN, a0 , . . . , an ∈ IK, stetige Funktionen.
(2)
Seien P und Q zwei Polynome. Setzt man M := {x ∈ IK : Q(x) = 0}, so ist P Q : M → IK stetig. Funktionen dieser Bauart heißen rationale Funktionen.
Es liegt nun auf der Hand zu fragen, ob auch durch (konvergente) Potenzreihen erkl¨arte Funktionen stetig sind. Sei M eine beliebige Menge und bezeichne B(M) den Raum aller beschr¨ankten Funktionen f : M → IK. Weiter sei f M := sup | f (x)| . x∈M
Man kann direkt nachrechnen, dass · M eine Norm auf B(M) ist. (Aus Satz 4.9 wissen wir bereits, dass B(M) mit dieser Norm sogar vollst¨andig, also ein Banachraum, ist.) Satz 6.5. Seien (X , d) ein metrischer Raum und p ∈ X. Ferner seien fn : X → IK (n ∈ IN) beschr¨ankte Funktionen, die in p stetig sind.
Wenn die Reihe fn X konvergent ist, dann ist durch n=1
f (x) :=
fn (x)
n=1
eine in p stetige Funktion f : X → IK definiert.
f¨ur x ∈ X
6.1 Stetige Abbildungen
83
n=1
n=1
Beweis. F¨ur jedes x ∈ X ist fn X eine konvergente Majorante von fn (x). Daher ist f : X → IK u¨ berhaupt erkl¨art (wohldefiniert). Zu zeigen bleibt noch die Stetigkeit in p. F¨ur jedes x ∈ X und (zun¨achst beliebiges) N ∈ IN gilt
N
N
| f (x) − f (p)| ≤ fn (x) − fn (p) + | fn (x)| + | fn (p)| .
n=1
n=N+1 n=1 n=N+1
Sei > 0. Da fn X konvergiert, gibt es ein N ∈ IN mit Damit ist
n=1
| fn (x)| <
n=N+1
3
fn X < 3 .
n=N+1
f¨ur alle x ∈ X . Somit haben wir
N
2 N
| f (x) − f (p)| ≤ fn (x) − fn (p) + .
n=1
3 n=1
N
N
W¨ahle nun > 0, sodass fn (x) − fn (p)
< n=1 n=1
3
f¨ur alle x mit d(x, p) < ist.
Dann gilt | f (x) − f (p)| < f¨ur alle x ∈ X mit d(x, p) < . Folglich ist f stetig in p.
Mit Hilfe von Satz 6.5 k¨onnen wir zeigen, dass jede Potenzreihe im Inneren ihres Konvergenzkreises eine stetige Funktion darstellt. Genauer gilt folgendes:
Korollar 6.6. Sei ck zk eine Potenzreihe mit Konvergenzradius R. Dann ist durch k=0
f (z) :=
ck zk
k=0
eine in UR (0) stetige (falls 0 < R < ) bzw. in ganz C stetige (falls R = ) Funktion f erkl¨art. Beweis. Sei z ∈ UR (0). Dann gibt es r mit |z| < r < R. Die durch fk (z) := ck zk , k ∈ IN, erkl¨arten Funktionen sind auf X := Ur (0) beschr¨ankt und stetig. Ferner gilt fk X ≤ |ck | rk , also ist
k=0
k=0
fk X ≤ |ck | rk < ,
da die Potenzreihe in UR (0) absolut konvergiert. Nun folgt mit Satz 6.5 die Stetigkeit im Punkt z. Da dies f¨ur jedes z ∈ UR (0) gilt, haben wir die Stetigkeit auf ganz UR (0). Die Aussage im Fall R = folgt ganz analog, wenn man C an Stelle von UR (0) betrachtet.
84
6 Stetigkeit
Laut Korollar 6.6 sind u.a. die folgenden Funktionen stetig. (1)
Die Exponentialfunktion ist stetig auf ganz C.
(2)
Sinus und Cosinus sind stetig auf ganz C.
(3)
Die Binomialreihe zum Exponenten s, s k Bs (z) = z , k=0 k
vgl. Kapitel 5.4, Beispiel (6), ist stetig auf U1 (0). (4)
Die Potenzfunktion z → az := exp(z ln a) ist stetig auf ganz C. Diese allgemeinen Potenzen f¨ur beliebiges z ∈ C werden wir in Kapitel 6.3 noch genauer untersuchen.
Bemerkung: Die im Beweis zu Korollar 6.6 benutzte Einschr¨ankung auf Ur (0) mit
r < R ist notwendig, da fk UR (0) m¨oglicherweise divergiert, wie z.B. bei der
Potenzreihe zk .
k=0
k=0
sin x x
=
1 x
(−1)k 2k+1 x (2k+1)!
(−1)k 2k x , insbesondere (2k+1)! k=0 k=0 (−1)k 2k z ist die Reihe auf der rechten Seite konvergent. Die Potenzreihe f (z) := (2k+1)! k=0
Anwendung: F¨ur x = 0 gilt
=
stellt daher eine auf ganz C stetige Funktion dar und mit dem Folgenkriterium erhalten wir sin x lim = lim f (x) = f (0) = 1 . x→0 x x→0
6.2 Eigenschaften stetiger reellwertiger Funktionen Wir wenden uns nun stetigen Funktionen zu, die auf Teilmengen von IR definiert und reellwertig sind. Satz 6.7 (Nullstellensatz). Sei f : [a, b] → IR stetig mit f (a) < 0 und f (b) > 0 oder f (a) > 0, f (b) < 0. Dann existiert mindestens ein x0 ∈ ]a, b[ mit f (x0 ) = 0. Beweis. Im Fall f (a) < 0, f (b) > 0 konstruieren wir rekursiv eine Intervallschachtelung (In )n∈IN0 mit In = [an , bn ], f (an ) < 0, f (bn ) ≥ 0 und |In | = 21n |I0 |. Dazu beginnen wir mit I0 := [a, b]. Sei In mit den angegebenen Eigenschaften bereits gefunden. Dann betrachten wir m := 12 (an + bn ) und definieren [an , m] , falls f (m) ≥ 0 , [an+1 , bn+1 ] := [m, bn ] , falls f (m) < 0 .
6.2 Eigenschaften stetiger reellwertiger Funktionen
85
Damit haben wir eine Intervallschachtelung und es gibt x0 mit {x0 } =
n∈IN0
In .
Nun gilt lim an = x0 = lim bn und, da f stetig ist, erhalten wir mit Satz 6.2 n→
n→
0 ≥ lim f (an ) = f (x0 ) = lim f (bn ) ≥ 0 , n→
n→
also f (x0 ) = 0. Der Beweis im Fall f (a) > 0 und f (b) < 0 geht ganz analog.
Korollar 6.8 (Zwischenwertsatz). Sei f : [a, b] → IR stetig. Zu jedem c ∈ ] f (a), f (b)[ (falls f (a) < f (b) gilt) bzw. c ∈ ] f (b), f (a)[ (falls f (b) < f (a) ist), existiert ein x0 ∈ ]a, b[ mit f (x0 ) = c. Beweis. Betrachte g : [a, b] → IR, g(x) := f (x) − c, und wende Satz 6.7 auf g an.
Anschaulich besagt der Zwischenwertsatz, dass f jeden Wert zwischen f (a) und f (b) annimmt: Im Fall f (a) < f (b) ist [ f (a), f (b)] ⊆ f ([a, b]). Gilt f (a) > f (b), so ist [ f (b), f (a)] ⊆ f ([a, b]). Anwendung: Es gibt eine kleinste positive Zahl x0 ∈ ]0, 2[ mit cos(x0 ) = 0. Beweis. Es gilt cos(0) = 1 und (−1)k 2k 4 42 4 42 2 = 1− + 1− + ∓ ··· cos(2) = 2! 4! 5·6 5·6·7·8 k=0 (2k)! n 2 4 2 1 3 < −1 + = −1 + =− , 4 3 n=0 30 3 1 − 30 13
also cos(0) > 0 und cos(2) < 0. Mit der Stetigkeit des Cosinus folgt zun¨achst, dass es mindestens eine Zahl c ∈]0, 2[ gibt mit cos(c) = 0. Wir betrachten M := {c > 0 : cos(c) = 0} und setzen x0 := inf M. Dann gibt es eine Folge (xn )n∈IN in M mit xn → x0 f¨ur n → . Mit dem Folgenkriterium erhalten wir cos(x0 ) = lim cos(xn ) = 0 und wegen cos(0) = 1 gilt x0 = 0, also x0 ∈ M. n→
Folglich ist x0 die kleinste positive Nullstelle des Cosinus. Wir sind jetzt in der Lage, weitere wichtige Eigenschaften von Sinus und Cosinus herzuleiten. Aus Kapitel 5.5 wissen wir bereits, dass sin2 x + cos2 x = 1 f¨ur alle x ∈ IR gilt. Dabei sind sin2 x und cos2 x abk¨urzende Schreibweisen f¨ur (sin x)2 bzw. (cos x)2 .
¨ Ublicherweise setzt man := 2x0 . Es gilt also cos 2 = 0 und daher sin 2 = 1
oder sin 2 = −1. Behauptung: F¨ur x ∈ ]0, 2[ gilt sin x > 0.
86
6 Stetigkeit
Beweis. F¨ur x ∈ ]0, 2[ ist sin(x) 1 (−1)k 2k+1 x2 x4 x6 = x = 1 − + − ± ··· x x k=0 (2k + 1)! 3! 5! 7! x2 x2 x4 > 1− 1+ + + ··· 3! 4·5 4·5·6·7 n 4 1 4 4 1 > 1− = 1− = > 0, 4 3! n=0 20 3! 1 − 20 6 also auch sin(x) > 0.
Folglich bleibt nur sin 2 = 1. Weiter erhalten wir f¨ur alle z ∈ C mit den Additionstheoremen (Satz 5.22)
• cos z + 2 = cos(z) cos 2 − sin(z) sin 2 = − sin(z),
• sin z + 2 = sin(z) cos 2 + cos(z) sin 2 = cos(z),
• cos( ) = cos 2 + 2 = − sin 2 = −1 und damit sin( ) = 0, • cos(z + ) = cos(z) cos( ) − sin(z) sin( ) = − cos(z), • sin(z + ) = sin(z) cos( ) + cos(z) sin( ) = − sin(z), • cos(z + 2 ) = cos(z + ) cos( ) − sin(z + ) sin( ) = cos(z), • sin(z + 2 ) = sin(z + ) cos( ) + cos(z + ) sin( ) = sin(z). Mit der Eulerschen Formel (5.4) folgt exp(i ) = cos( ) + i sin( ) = −1 und mit Hilfe der Funktionalgleichung (5.3) erhalten wir schließlich exp(z + 2 i) = exp(z) exp(2 i) = exp(z) (cos(2 ) + i sin(2 )) = exp(z) f¨ur alle z ∈ C. Als weitere Folgerung aus Satz 6.7 wollen wir noch einen Fixpunktsatz notieren. Fixpunkts¨atze sind wichtige mathematische Instrumente. So wird uns etwa der so genannte Fixpunktsatz von Banach (Satz 15.4) sp¨ater noch von großem Nutzen sein. Korollar 6.9 (Fixpunktsatz). Sei f : [a, b] → [a, b] stetig. Dann existiert ein x0 ∈ [a, b] mit f (x0 ) = x0 . Beweis. Nach Voraussetzung gilt a ≤ f (x) ≤ b f¨ur alle x ∈ [a, b]. Ist f (a) = a oder f (b) = b, so bleibt nichts zu zeigen. Seien also a < f (a) und f (b) < b. Die Funktion g : [a, b] → IR, g(x) := f (x) − x, ist stetig mit g(a) > 0 und g(b) < 0. Laut Satz 6.7 existiert x0 ∈ ]a, b[ mit g(x0 ) = 0. Damit gilt f (x0 ) = x0 .
6.2 Eigenschaften stetiger reellwertiger Funktionen
b
87
Die stetige Funktion f : [a, b] → [a, b] besitzt mindestens einen Fixpunkt x0 ∈ [a, b], d.h. es gilt x0 = f (x0 ). Anschaulich bedeutet dies, dass der Graph von f die Winkelhalbierende in mindestens einem Punkt schneidet.
a a
b
Analog wie bei Folgen heißt eine Funktion f : [a, b] → IR monoton wachsend, wenn aus y > x stets f (y) ≥ f (x) folgt. Falls aus y > x sogar immer f (y) > f (x) folgt, so heißt die Funktion streng monoton wachsend. Entsprechend definiert man die Eigenschaften (streng) monoton fallend. Satz 6.10. Seien I ⊆ IR ein Intervall, f : I → IR streng monoton wachsend oder streng monoton fallend und M := f (I). Dann ist f : I → M bijektiv und die Umkehrfunktion f −1 : M → I ist stetig. Beweis. Die Injektivit¨at folgt direkt aus der strengen Monotonie. Zu zeigen bleibt die Stetigkeit von f −1 . Sei f streng monoton wachsend. Zu festem p ∈ M betrachte a ∈ I mit f (a) = p. Wir m¨ussen zeigen: Zu jedem > 0 gibt es ein > 0 derart, dass |x − a| <
f¨ur alle x ∈ I mit | f (x) − p| <
gilt. Dies ist genau dann der Fall, wenn die folgenden Bedingungen beide erf¨ullt sind. Zu jedem > 0 gibt es ein 1 > 0, sodass gilt:
(i)
a−x < (ii)
f¨ur alle x ∈ I , x < a , mit p − f (x) < 1 .
Zu jedem > 0 gibt es ein 2 > 0, sodass gilt: x−a <
f¨ur alle x ∈ I , x > a , mit f (x) − p < 2 .
Wir wollen nun sehen, dass (i) erf¨ullt ist. Ist a ∈ I linker Randpunkt von I, so ist nichts zu zeigen. Sei also a ∈ I nicht linker Randpunkt von I. Dann gibt es b ∈ I, b < a, mit a − b < und wir setzen 1 := p − f (b). Ist nun x ∈ I, x < a mit p − f (x) < 1 , so folgt f (b) < f (x) und damit b < x wegen der Monotonie. Weiter folgt a − x < a − b < , also ist (i) nachgewiesen. Ganz analog zeigt man auch (ii). Ebenso analog f¨uhrt man auch den Beweis im Fall einer streng monoton fallenden Funktion.
88
6 Stetigkeit
Bemerkung: Es wird bei Satz 6.10 nicht gefordert, dass f selbst stetig ist. Auch braucht f (I) = M kein Intervall zu sein. Unter der zus¨atzlichen Voraussetzung, dass f stetig ist, folgt mit dem Zwischenwertsatz allerdings, dass M ein Intervall ist. Beispiel: Sei n ∈ IN. Die Funktion f : [0, [ → [0, [, f (x) := xn , ist streng monoton wachsend.√Die Umkehrfunktion ist die n−te Wurzelfunktion f −1 : [0, [ → [0, [, f −1 (x) = n x. Nach Satz 6.10 ist diese stetig. Wir f¨uhren noch einen weiteren Begriff ein. Seien D ⊆ IR, Y ein metrischer Raum und f : D → Y eine Abbildung. Wenn f¨ur jede Folge (xn )n∈IN in D, die gegen p ∈ IR konvergiert und xn > p ∀n erf¨ullt, f (xn ) → c gilt, so bezeichnet man c als rechtsseitigen Grenzwert und schreibt c = lim f (x). Gebr¨auchlich sind auch die Schreibweisen lim f (x) und f (p + 0). x→p+0
x↓p
Entsprechend erkl¨art man ggf. auch einen linksseitigen Grenzwert und schreibt dann lim f (x) oder lim f (x) bzw. f (p − 0). x→p−0
x↑p
Wenn D ein Intervall und p ∈ D kein Randpunkt von D ist, so ist f offensichtlich stetig in p genau dann, wenn rechts- und linksseitiger Grenzwert existieren und u¨ bereinstimmen. Satz 6.11. Sei f : [a, b] → IR monoton wachsend. F¨ur jedes p ∈ ]a, b[ existieren f (p + 0) sowie f (p − 0) und es gilt f (p − 0) ≤ f (p) ≤ f (p + 0) . Die Grenzwerte f (a + 0) und f (b − 0) existieren; es gelten f (a) ≤ f (a + 0) sowie f (b − 0) ≤ f (b). Entsprechende Aussagen gelten f¨ur monoton fallende Funktionen. Beweis. Sei p ∈ ]a, b[. Da f monoton wachsend ist, existiert das Supremum c := sup{ f (x) : x ∈ [a, p[ } und es gilt c ≤ f (p). Zu > 0 existiert x ∈ [a, p[ mit c − ≤ f (x ) ≤ c. Auf Grund der Monotonie gilt deshalb c − ≤ f (x) ≤ c f¨ur alle x ∈ [x , p[ . Ist nun (xn )n∈IN eine Folge in [a, p[ mit xn → p, so findet man ein N ∈ IN derart, dass xn ∈ [x , p[ f¨ur alle n ≥ N gilt. Damit ist c − f (xn ) < f¨ur alle n ≥ N. Folglich gilt lim f (xn ) = c und damit c = f (p − 0). n→
Die anderen Nachweise laufen analog.
Wir erw¨ahnen noch, dass sich die Rechenregeln f¨ur Grenzwerte mit Hilfe von Satz 6.4 auf lim f (x), lim f (x) und lim f (x) u¨ bertragen lassen. x→p
x→p±0
x→±
6.3 Exponentialfunktion und Logarithmus
89
Seien etwa lim f (x) = c und lim g(x) = b, so gelten x→p
x→p
lim ( f + g)(x) = c + b ,
x→p
und, falls b = 0 ist, haben wir
lim
x→p
lim ( f g)(x) = cb ,
x→p
f c (x) = . g b
6.3 Exponentialfunktion und Logarithmus Die Exponentialfunktion ist eine auf ganz C stetige Funktion. Schr¨anken wir uns auf die reellen Zahlen ein, so erhalten wir eine streng monoton wachsende Funktion exp : IR → ]0, [, wie wir aus Kapitel 5.5 bereits wissen. An Hand der Reihendarstellung sieht man weiter, dass exp(x) > x f¨ur alle x > 0 gilt. Daher ist die Bildmenge exp(IR) nach oben unbeschr¨ankt. Weiter gilt 1 exp(−x) = exp(x) < 1x f¨ur x > 0. Zu jedem y ∈ ]0, [ gibt es deshalb ein x ∈ IR mit exp(−x) < y < exp(x). Folglich existiert laut Zwischenwertsatz ein x0 ∈ IR mit exp(x0 ) = y; also ist exp(IR) = ]0, [. Nun k¨onnen wir mit Satz 6.10 folgern, dass die reelle Exponentialfunktion eine stetige Umkehrfunktion g : ]0, [→ IR besitzt; d.h. wir haben g ◦ exp : IR → IR , exp ◦ g : ]0, [ → ]0, [ ,
und
g ◦ exp(x) = x exp ◦ g(y) = y .
e
1
Die Exponentialfunktion bildet IR bijektiv auf das Intervall ]0, [ ab. 1
Wir werden sehen, dass g mit dem Logarithmus aus Kapitel 3.4 u¨ bereinstimmt. Dazu sind jedoch noch einige Vor¨uberlegungen n¨otig. Zun¨achst wollen wir eine weitere Charakterisierung der Exponentialfunktion herleiten. Diese wird motiviert durch das Problem der stetigen Verzinsung“. W¨achst ” etwa ein Kapital K durch Zinsen in einem Jahr auf K(1 + x), so hat man nach dem
90
6 Stetigkeit
n-ten
Teilneines Jahres, z.B. n = 12 bei monatlicher Verzinsung, einen Zuwachs auf K 1 + nx . Man fragt sich nun, ob ein Grenzwert f¨ur n → existiert. z n Satz 6.12. F¨ur alle z ∈ C gilt lim 1 + = exp(z). n→ n F¨ur z = 1 kennen wir dies schon, vgl. Beispiel (3) in Kapitel 5.1. Beweis. Wegen z n = exp(z) − 1 + n =
n k zk n z k! − k nk k=0 k=0
n
k=0
zk n(n − 1) · · ·(n − k + 1) zk + 1− k! k=n+1 k! nk =: cnk
n zk zk = 0 bleibt zu zeigen, dass cnk = 0 gilt. n→ k! k=n+1 k! k=0
und lim
Dazu halten wir fest, dass 0 < cnk < 1 f¨ur alle k, n ∈ IN und lim cnk = 0 ist. n→
Zu > 0 finden wir (vgl. Satz 5.1) ein N ∈ IN derart, dass n
|z|k < k=m k!
gilt. Damit erhalten wir
n zk
cnk ≤
k=0 k!
N
cnk
k=0
f¨ur alle m, n mit N < m < n
n |z|k |z|k + cnk < k! k=N+1 k!
N
cnk
k=0
|z|k + . k!
Ganz rechts k¨onnen wir nun den Grenzwert f¨ur n → bilden; die Anzahl der Summanden h¨angt hier nicht mehr von n ab. Damit folgt
n N zk
|z|k
+ = lim sup cnk ≤ lim cnk n→ k!
k! n→ k=0 k=0 und weiter, da dies f¨ur jedes > 0 gilt, die Behauptung.
Nun wenden wir uns dem Logarithmus zu. F¨ur x > 0 haben wir den Wert ln(x) mittels einer Intervallschachtelung definiert. Lemma 6.13. F¨ur 0 < a < b gilt 1 − ab ≤ ln(b) − ln(a) ≤ ba − 1.
Beweis. Aus Satz 3.12 folgt zun¨achst 1 − ab ≤ ln 1a + ln(b) ≤
ln 1a = − ln(a), siehe Korollar 3.13, erhalten wir die Behauptung.
b a
− 1 und mit
Satz 6.14. Die Funktion ln : ]0, [ → IR, definiert wie in Kapitel 3.4, ist stetig.
6.3 Exponentialfunktion und Logarithmus
91
Beweis. Seien p ∈ ]0, [ und (xn )n∈IN eine Folge in ]0, [, die gegen p konvergiert.
Zu > 0 gibt es dann ein N ∈ IN mit xpn − 1 < und xpn − 1 < f¨ur alle n ≥ N. Außerdem haben wir aus Lemma 6.13 xn −1 0 ≤ ln(xn ) − ln(p) ≤ p p −1 0 ≤ ln(p) − ln(xn ) ≤ xn
falls xn > p , falls xn < p .
Daher ist | ln(xn ) − ln(p)| < f¨ur alle n ≥ N. Also gilt lim ln(xn ) = ln(p). Mit Satz 6.2 folgt die Stetigkeit.
n→
Satz 6.15. F¨ur alle x ∈ IR gilt ln(exp(x)) = x. Beweis. Wegen exp(x) > 0 f¨ur alle x ∈ IR ist der Ausdruck ln(exp(x)) f¨ur alle reellen Zahlen x erkl¨art. Seien zun¨achst x > 0 und n ∈ IN. Setzt man a = n und b = x + n in die Ungleix chung aus Lemma 6.13 ein, so ergibt sich n+x ≤ ln(n + x) − ln(n) ≤ nx .
n
= ln n+x , vgl. Korollar 3.13, folgt Mit n(ln(n + x) − ln(n)) = n ln n+x n n nx x n ≤ ln 1 + ≤x n+x n n
und Satz 3.7 liefert lim ln 1 + nx = x. n→
Wegen der Stetigkeit des Logarithmus folgt mit Hilfe von Satz 6.12 nun x n x n = ln lim 1 + = ln(exp(x)) . x = lim ln 1 + n→ n→ n n 1 Sei nun x < 0. Dann ist −x = ln(exp(−x)) = ln exp(x) = − ln(exp(x)). Die Behauptung gilt also auch in diesem Fall; f¨ur x = 0 gilt sie offensichtlich. Umgekehrt gilt dann f¨ur jedes x ∈ ]0, [ auch exp(ln(x)) = x. Mit Hilfe von Exponentialfunktion und Logarithmus k¨onnen wir nun allgemeine Potenzfunktionen erkl¨aren. F¨ur x > 0 und z ∈ C setzt man xz := exp(z ln x) . Ist speziell x = e, so hat man ez = exp(z), da ln(e) = 1 ist. F¨ur x, y > 0 und z, w ∈ C ergibt sich damit unmittelbar x1 = x ,
x0 = 1 ,
xz xw = xz+w ,
x−z =
1 , xz
(xy)z = xz yz
92
6 Stetigkeit
und f¨ur x > 0, y ∈ IR, z ∈ C gilt (xy )z = (exp(y ln x))z = exp(z ln(exp(y ln x))) = exp(zy ln x) = xyz . Die Wurzelfunktion ist ein Spezialfall der Potenzfunktionen. Ist z = > 0, so ist x → x eine streng monoton wachsende, stetige, bijektive Abbildung ]0, [ → ]0, [. Die zugeh¨orige Umkehrfunktion ist x → x1/ , denn (x )1/ = x (1/ ) = x1 = x. Wir wollen noch verifizieren, daß f¨ur n ∈ IN die beiden Definitionen xn := x · · · x und xn := exp(n ln x) u¨ bereinstimmen. Dies ist der Fall, denn es gilt exp(n ln x) = exp (ln x + · · · + ln x) = exp(ln x) · · · exp(ln x) = x · · · x = xn . n Summanden
n Faktoren
Damit stimmt die Umkehrfunktion x → x1/n auch mit x →
√ n
x u¨ berein.
6.4 Stetige Funktionen auf [a, b] Wir leiten noch einige Eigenschaften f¨ur stetige Funktionen her, die auf Intervallen der Form [a, b] definiert sind. Wir werden diese in Kapitel 12 noch verallgemeinern, wenn wir stetige Funktionen auf so genannten kompakten Mengen untersuchen. Satz 6.16. Sei f : [a, b] → IR stetig. Dann ist f ([a, b]) eine beschr¨ankte Teilmenge von IR und f nimmt Maximum und Minimum an. Das heißt, es existieren ein p ∈ [a, b] mit f (p) = sup{ f (x) : x ∈ [a, b]} und ein q ∈ [a, b] mit f (q) = inf{ f (x) : x ∈ [a, b]}. Beweis. Wir f¨uhren den Nachweis nur f¨ur das Maximum. Sei sup{ f (x) : x ∈ [a, b]} , falls f ([a, b]) nach oben beschr¨ankt ist, M := , falls nicht. Dann existiert eine Folge (xn )n∈IN in [a, b] mit lim f (xn ) = M. n→
Da (xn )n∈IN beschr¨ankt ist, existiert nach Satz 4.19 eine Teilfolge
(xnk )k∈IN mit lim xnk = p ∈ [a, b]. Mit der Stetigkeit von f folgt f (p) = lim f xnk = M.
k→
k→
Definition 6.17. Seien (X, dX ) und (Y, dY ) zwei metrische R¨aume. Eine Funktion f : X → Y heißt gleichm¨aßig stetig auf X, falls zu jedem > 0 ein > 0 existiert, sodass gilt: dY ( f (x), f (x )) <
f¨ur alle x, x ∈ X mit dX (x, x ) < .
Ist f : X → Y gleichm¨aßig stetig, so ist f offensichtlich in jedem Punkt p ∈ X stetig.
6.5 Aufgaben
93
Satz 6.18. Seien (Y, dY ) ein metrischer Raum und f : [a, b] → Y stetig. Dann ist f auch gleichm¨aßig stetig. Beweis. Angenommen, f ist nicht gleichm¨aßig stetig. Dann gibt es ein > 0 derart, dass f¨ur jedes n ∈ IN zwei Punkte xn , xn ∈ [a, b] existieren mit |xn − xn | <
1 n
und dY ( f (xn ), f (xn )) ≥ .
Laut Satz 4.19 existiert nun eine konvergente Teilfolge (xnk )k∈IN von (xn )n∈IN mit lim xnk = p ∈ [a, b]. Mit |xnk − xnk | < n1k gilt auch lim xnk = p. Da f stetig ist, folgt
k→
k→
lim dY ( f (xnk ), f (xnk )) = dY ( f (p), f (p)) = 0
k→
im Widerspruch zu dY ( f (xnk ), f (xnk )) ≥ f¨ur alle k ∈ IN. Die Annahme ist demnach nicht erf¨ullbar.
Beispiel: Die Funktion f : ]0, [→ IR, f (x) := 1x , ist auf jedem Intervall [c, 1] mit 0 < c < 1 gleichm¨aßig stetig, aber sie ist nicht gleichm¨aßig stetig auf ]0, 1]. Beweis. F¨ur festes c mit 0 < c < 1 ist f nach Satz 6.18 gleichm¨aßig stetig auf [c, 1]. Um zu zeigen, dass f im Intervall ]0, 1] nicht gleichm¨aßig stetig ist, betrachte etwa = 1. Wir nehmen an, es gibt ein > 0 mit
f (x) − f (y) < 1 f¨ur alle x, y ∈ ]0, 1] mit |x − y| < . & ' Nun w¨ahlen wir a ∈ 0, 12 mit a < .
Mit x := a und y := 2a gilt dann x, y ∈ ]0, 1] sowie |y − x| < und weiter | f (x) − f (y)| =
1 1 1 − = >1= a 2a 2a
im Widerspruch zur Annahme; es gibt also kein solches . Folglich ist f nicht gleichm¨aßig stetig auf ]0, 1].
6.5 Aufgaben 1. Zeigen Sie, dass z → Re (z) ,
z → Im (z) ,
z → z und z → |z|
in ganz C stetig sind. Folgern Sie exp(z) = exp(z)
f¨ur alle z ∈ C .
94
6 Stetigkeit
2. Begr¨unden Sie, dass lim cos(x)−1 existiert, und berechnen Sie diesen Grenzwert. x x→0
3. Zeigen Sie, dass die Funktion f : IR → IR, 1 f¨ur x = 0 , sin x f (x) := 0 f¨ur x = 0 , im Punkt x = 0 nicht stetig ist: a. direkt an Hand der Definition; zeigen Sie, dass man beispielsweise zu = 12 kein passendes“ finden kann; ” b. mit dem Folgenkriterium (Satz 6.2). 4. Zeigen Sie, dass die Funktion f : IR → IR,
f¨ur x = 0 , x sin 1x f (x) := 0 f¨ur x = 0 , auf ganz IR stetig ist. Hinweis: Um die Stetigkeit im Nullpunkt zu zeigen, k¨onnen Sie z.B. das Folgenkriterium und die Absch¨atzung | f (x) − f (0)| ≤ |x − 0| verwenden. 5. Seien f , g : IR → IR stetige Funktionen mit f (x) = g(x) f¨ur alle x ∈ Q. Zeigen Sie, dass f (x) = g(x) f¨ur alle x ∈ IR gilt. 6. Seien (X, dX ) und (Y, dY ) metrische R¨aume. Eine Funktion f : X → Y heißt Lipschitz-stetig, wenn es ein L > 0 gibt mit dY ( f (x), f (y)) ≤ L dX (x, y)
f¨ur alle x, y ∈ X .
a. Zeigen Sie: Jede Lipschitz-stetige Funktion ist gleichm¨aßig stetig. b. Geben Sie eine Funktion f : IR → IR an, die in ganz IR stetig, aber nicht Lipschitz-stetig ist. 7. Seien p ∈ IR und f : IR → IR eine stetige Funktion derart, dass f (x + p) = f (x) f¨ur alle x ∈ IR gilt. Zeigen Sie, dass f gleichm¨aßig stetig ist. 8. Zeigen Sie, dass die Funktion f : IR → IR, f (x) := cos(x2 ), nicht gleichm¨aßig stetig ist. √ Hinweis: Betrachten Sie f ( k ) f¨ur k ∈ IN.
6.5 Aufgaben
95
9. Zeigen Sie, dass es genau eine reelle Zahl x gibt, die die Gleichung x = e−x l¨ost. 10. Seien M eine nicht-leere Menge und d : M × M → IR definiert durch 0 falls x = y , d(x, y) := 1 sonst . a. Zeigen Sie, dass (M, d) ein metrischer Raum ist. b. Bestimmen Sie alle stetigen Abbildungen f : (M, d) → (M, d). 11. Sei f : IR → C eine im Punkt x = 0 stetige Funktion derart, dass f (x + y) = f (x) + f (y)
f¨ur alle x, y ∈ IR
gilt. Zeigen Sie, dass eine Zahl c ∈ C existiert mit f (x) = cx
f¨ur alle x ∈ IR .
This page intentionally left blank
Kapitel 7
Differentiation
Die Differentiation, mit der wir uns in diesem Kapitel besch¨aftigen werden, stellt ein weiteres wichtiges Werkzeug der Analysis dar. Sie wird unter anderem durch folgende Problemstellungen motiviert: • Konstruktion einer Tangente an den Graphen einer Funktion in einem vorgegebenen Punkt • Lokale Approximation einer Funktion durch eine m¨oglichst einfache Funktion, n¨amlich ein Polynom ersten Grades • Bestimmung der Momentangeschwindigkeit eines Teilchens • als Gegenspieler der Integration“ (vgl. Kapitel 8) ” Trotz der vielen Gesichter finden wir einen einfachen Zugang mittels Grenzwerten.
7.1 Differenzierbarkeit Definition 7.1. Seien I ⊆ IR ein Intervall und x ∈ I. Eine Funktion f : I → IK nennt man differenzierbar in x, falls der Grenzwert lim
t →x t ∈ I , t = x
f (t) − f (x) t −x
df (x). dt Weiter heißt f (x) die Ableitung (oder Differentialquotient) von f in x.
existiert. Wir bezeichnen diesen Grenzwert dann mit f (x) oder
Ist die Funktion f in jedem x ∈ I differenzierbar, so heißt f differenzierbar. Falls x ein Randpunkt von I ist, wollen wir den Limes als rechts- bzw. linksseitigen Grenzwert verstehen. Die Angabe t ∈ I, t = x werden wir k¨unftig nicht mehr explizit ausschreiben. Man sollte aber im Kopf behalten, welche t f¨ur die Grenzwertbildung zugelassen sind. R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_7, © Springer-Verlag Berlin Heidelberg 2012
97
98
7 Differentiation
Bemerkung: Man kann Differenzierbarkeit analog auch f¨ur Funktionen f : I → X definieren, wobei X ein beliebiger normierter Raum ist, und zwar als Grenzwert in X. Wir verzichten darauf an dieser Stelle, merken aber an, dass wir komplexwertige Funktionen zulassen. Satz 7.2. Sei f : I → IK im Punkt x ∈ I differenzierbar. Dann ist f stetig in x. Beweis. F¨ur t ∈ I, t = x haben wir f (t) − f (x) =
f (t) − f (x) (t − x) → f (x) · 0 = 0 t −x
mit t → x .
Demnach ist f laut Folgenkriterium (Satz 6.2) stetig in x.
Die Umkehrung von Satz 7.2 gilt nicht; siehe etwa Beispiel (6). Schreibt man die Gleichung des Beweises etwas um, erh¨alt man folgendes. Mit P(t) := f (x) + f (x) (t − x) gilt lim
t→x
f (t) − P(t) =0, t −x
d.h. die lokale Approximation von f (t) durch P(t) ist schneller“ als die, mit der t ” gegen x strebt. Man bezeichnet P(t) auch als lineare Approximation von f in x.
P f (x)
f
Die Abbildung zeigt die Graphen einer differenzierbaren Funktion f sowie der durch P(t) := f (x)+ f (x)(t − x) erkl¨arten linearen Approximation. Die durch die Abbildung P beschriebene Gerade trifft den Graph von f an der Stelle (x, f (x)) tangential.
x
Bevor wir einige Ableitungen berechnen, zeigen wir grundlegende Rechenregeln. Satz 7.3. Seien f : I → IK und g : I → IK im Punkt x ∈ I differenzierbar und c ∈ IK. Dann sind c f , f + g und f g in x differenzierbar. Ist g(x) = 0, so ist auch gf in x differenzierbar. Dabei gelten: •
(c f ) (x) = c f (x)
•
( f + g) (x) = f (x) + g(x)
•
( f g) (x) = f (x) g(x) + f (x) g (x) f g(x) f (x) − g(x) f (x) (x) = g g(x)2
•
(Produktregel) (Quotientenregel)
7.1 Differenzierbarkeit
99
Beweis. Die ersten beiden Aussagen folgen direkt aus den Rechenregeln f¨ur Grenzwerte. Zur Produktregel betrachten wir g(t) − g(x) f (t) − f (x) f (t) g(t) − f (x) g(x) = f (t) + g(x) . t −x t −x t −x Grenzwertbildung t → x liefert nun ( f g) (x) = f (x) g(x) + f (x) g (x). Zu zeigen bleibt die Quotientenregel. Dazu sei h := gf . Wir haben dann 1 f (t) − f (x) g(t) − g(x) h(t) − h(x) = g(x) − f (x) . t −x g(t)g(x) t −x t −x Mit g(t) → g(x) f¨ur t → x erhalten wir im Grenzwert h (x) =
g(x) f (x) − f (x) g (x) . g(x)2
Die Behauptungen zur Differenzierbarkeit sind mit der Bestimmung der Formeln auch bewiesen.
Beispiele: ct − cx = c. t −x
(1)
Sei f : IR → IK, f (x) := cx mit c ∈ IK, so gilt f (x) = lim
(2)
Seien n ∈ IN0 und f : IR → IR, f (x) := xn . Es gilt f (x) = nxn−1 .
t→x
Beweis. F¨ur n = 0 gilt die Aussage offensichtlich. Gilt sie f¨ur ein n, so setze h : IR → IR, h(x) := xn+1 = x f (x). Mit Induktionsvoraussetzung und Produktregel folgt h (x) = 1 · f (x) + x f (x) = xn + xnxn−1 = (n + 1)xn.
Damit sind auch alle Polynome differenzierbar und alle rationalen Funktionen sind differenzierbar, außer an den Punkten, an welchen der Nenner = 0 ist. Die Ableitungen bestimmt man gem¨aß Satz 7.3. Insbesondere erhalten wir nun mit der Quotientenregel f¨ur f : IR \ {0} → IR, n−1 f (x) := x1n , dass die Ableitung f (x) = 0−nx = x−n n+1 ist. Also haben wir insgesamt x2n (xn ) = nxn−1
f¨ur alle n ∈ ZZ .
Es folgt eine weitere wichtige Regel, die wir oft nutzen werden. Sie betrifft die Komposition von differenzierbaren Funktionen. Satz 7.4 (Kettenregel). Seien I und J zwei Intervalle. Wenn die Funktionen f : I → J im Punkt x ∈ I sowie g : J → IK in y = f (x) ∈ J differenzierbar sind, so ist g ◦ f : I → IK in x differenzierbar und es gilt (g ◦ f ) (x) = g (y) f (x) .
100
7 Differentiation
Beweis. Da g in y differenzierbar ist, ist die Funktion G : J → IK, ⎧ ⎪ ⎨ g(s) − g(y) f¨ur s = y , s−y G(s) := ⎪ ⎩ f¨ur s = y , g (y) stetig im Punkt y und es gilt g(s) − g(y) = (s − y) G(s). Man erh¨alt weiter, da f stetig in x ist, lim
t→x
g( f (t)) − g( f (x)) ( f (t) − f (x)) G( f (t)) = lim = f (x) G( f (x)) = f (x) g (y) t→x t −x t −x
wie behauptet. Weitere Beispiele: (3)
Sei f : IR → IK, f (x) := exp(cx), mit c ∈ IK. Aus der Funktionalgleichung der Exponentialfunktion erhalten wir exp(ct) − exp(cx) exp(c(x + h)) − exp(cx) = lim h→0 t −x h exp(ch) − 1 exp(ch) − 1 = c exp(cx) lim = c exp(cx) . = exp(cx) lim h→0 h→0 h ch
f (x) = lim t→x
(4)
Ist f : I → C in x ∈ I differenzierbar, so sind Re f : I → IR und Im f : I → IR in x differenzierbar und es gilt (Re f ) (x) = Re f (x) ,
(Im f ) (x) = Im f (x) .
Dies folgt direkt aus f = Re f + i Im f und der Tatsache, dass eine Folge komplexer Zahlen genau dann konvergent ist, wenn die Folgen der Real- und der Imagin¨arteile beide konvergent sind. Betrachten wir nun f : IR → C, f (t) := exp(it) = cost + i sint, so erhalten wir aus (1) als Ableitung f (t) = i exp(it) = i(cost + i sint) = − sint + i cost. Somit haben wir cos (t) = − sint (5)
sin (t) = cost .
und
1 ln(t) − ln(x) 1 ≤ ≤ f¨ur 0 < x < t. t t −x x Vertauscht man die Rollen von t und x, so ergibt sich
Aus Lemma 6.13 erhalten wir
1 ln(t) − ln(x) 1 ≤ ≤ x t −x t
f¨ur 0 < t < x .
Insgesamt erhalten wir daraus mit t → x die Ableitung des Logarithmus, ln (x) =
1 . x
7.1 Differenzierbarkeit
(6)
101
Die Funktion f : IR → IR, f (x) :=
x sin
1 x
0
f¨ur x = 0 , f¨ur x = 0 ,
ist auf ganz IR stetig, vgl. Kapitel 6.5, Aufgabe 4. F¨ur x = 0 erhalten wir mit Produkt- und Kettenregel 1 1 1 f (x) = sin − cos . x x x Im Fall x = 0 sind beide S¨atze nicht anwendbar. Wir betrachten f (t) − f (0) 1 = sin . t −0 t Ein Grenzwert f¨ur t → 0 existiert nicht. Daher ist f in x = 0 nicht differenzierbar. Wir haben hier also ein Beispiel einer Funktion, die im Nullpunkt stetig aber nicht differenzierbar ist. (7)
Die Funktion f : [0, [ → [0, [, f (x) := x2 , ist bijektiv und differenzierbar. √ Ihre Umkehrabbildung f −1 : [0, [ → [0, [, f −1 (x) = x, ist im Nullpunkt nicht differenzierbar, denn sonst m¨usste laut Kettenregel
1 = f −1 ◦ f (0) = f −1 ( f (0)) f (0) gelten, was wegen f (0) = 0 nicht m¨oglich ist.
¨ Die Uberlegung in Beispiel (7) kann man f¨ur jede bijektive differenzierbare Funktion f durchf¨uhren. Sie belegt, dass f¨ur die Differenzierbarkeit von f −1 in y = f (x) die Ableitung f (x) notwendigerweise ungleich Null sein muss. In Kapitel 7.3 werden wir sehen, dass diese Bedingung auch hinreichend f¨ur die Differenzierbarkeit der Umkehrfunktion ist. Wenn die Ableitung f einer differenzierbaren Funktion selbst wieder differenzierbar ist, so bezeichnet man f := ( f ) als die zweite Ableitung von f . Entsprechend erkl¨art man gegebenenfalls auch eine dritte Ableitung usw. Statt f , f , . . . schreibt man auch f (2) , f (3) , . . . Definition 7.5. Eine differenzierbare Funktion f : I → IK heißt stetig differenzierbar, wenn f : I → IK stetig ist. Falls die Ableitungen f (1) , . . . , f (n) existieren und stetig sind, so sagt man, f ist n-mal stetig differenzierbar. Man beachte, dass jede differenzierbare Funktion stetig ist; daher folgt aus der Existenz von f (k) bereits die Stetigkeit von f (k−1) . Den Raum der n-mal stetig differenzierbaren Funktionen f : I → IK bezeichnen wir mit Cn (I). Weiter schreiben wir C (I) f¨ur den Raum der beliebig oft (stetig) differenzierbaren Funktionen.
102
7 Differentiation
Beispielsweise sind die Exponentialfunktion, Sinus und Cosinus sowie auch alle Polynomfunktionen beliebig oft stetig differenzierbar. Wir wollen ein Beispiel einer differenzierbaren, aber nicht stetig differenzierbaren, Funktion angeben. Die Funktion f : IR → IR,
x2 sin 1x f¨ur x = 0 , f (x) := 0 f¨ur x = 0 , ist in allen Punkten x = 0 differenzierbar. Die Ableitung erhalten wir mittels Produkt- und Kettenregel; dort gilt 1 1 1 1 1 2 f (x) = 2x sin + x − 2 cos = 2x sin − cos . x x x x x Wir zeigen nun, dass f auch in x = 0 differenzierbar ist. Dazu betrachten wir f (t) − f (0) 1 = t sin . t −0 t
Da die Abbildung t → t sin 1t an der Stelle t = 0 stetig ist, erhalten wir mit dem Folgenkriterium f (t) − f (0) 1 = lim t sin =0, lim t→0 t→0 t −0 t also ist f im Nullpunkt differenzierbar mit f (0) = 0. Allerdings kann man (etwa wiederum mit dem Folgenkriterium) leicht sehen, dass f am Punkt x = 0 nicht stetig ist. Daher ist f dort auch nicht differenzierbar, eine zweite Ableitung existiert hier also nicht.
7.2 Mittelwertsatz und lokale Extrema Definition 7.6. Sei f : X → IR eine Funktion auf einem metrischen Raum X . Man sagt, dass f ein lokales Maximum (bzw. lokales Minimum) im Punkt p ∈ X besitzt, wenn ein r > 0 existiert derart, dass f (x) ≤ f (p) f¨ur alle x ∈ Ur (p) gilt (bzw. f (x) ≥ f (p) f¨ur alle x ∈ Ur (p) gilt). Lokale Maxima oder Minima nennen wir lokale Extrema. Satz 7.7. Sei f : [a, b] → IR eine Funktion, die im Punkt x ∈ ]a, b[ ein lokales Extremum besitzt. Wenn f (x) existiert, dann gilt f (x) = 0. Beweis. Wir betrachten nur den Fall eines lokalen Maximums; die Aussage f¨ur das Minimum beweist man ganz analog.
7.2 Mittelwertsatz und lokale Extrema
103
Sei r > 0 gem¨aß Definition 7.6. Ohne Einschr¨ankung k¨onnen wir annehmen, dass Ur (x) = ]x − r, x + r[ ⊆ ]a, b[ gilt. f (t) − f (x) ≥ 0 und mit t → x folgt f (x) ≥ 0. t −x f (t) − f (x) F¨ur x < t < x + r gilt ≤ 0 und mit t → x gilt nun f (x) ≤ 0. t −x Es bleibt also nur f (x) = 0.
F¨ur x − r < t < x gilt
Die Umkehrung von Satz 7.7 gilt nicht. Beispielsweise hat die Funktion x → x3 an der Stelle x = 0 kein lokales Extremum, obwohl ihre Ableitung dort den Wert 0 hat. Man beachte auch, dass Satz 7.7 nur eine Aussage u¨ ber Extrema im Inneren des Intervalls, also in ]a, b[, erm¨oglicht und auch nur an Punkten, wo f differenzierbar ist. So hat etwa die Funktion f : [−1, 1] → IR, f (x) := |x|, ein Minimum im Punkt x = 0, ist dort aber nicht differenzierbar, und sie hat Maxima jeweils bei x = 1 und bei x = −1. Als eine erste Folgerung erhalten wir ein Resultat, welches nach Michel Rolle (1652-1719, Paris) benannt ist. Satz 7.8 (Rolle). Sei f : [a, b] → IR eine stetige Funktion mit f (a) = f (b), die auf ]a, b[ differenzierbar ist. Dann gibt es ein x ∈ ]a, b[ mit f (x) = 0. Beweis. Ist f konstant, so ist nichts zu zeigen. Sei also f eine nicht-konstante Funktion. Laut Satz 6.16 gibt es nun c, d ∈ [a, b] mit f (c) = max f ([a, b]) und f (d) = min f ([a, b]). Wegen f (a) = f (b) und da f nicht-konstant ist, muss mindestens einer der beiden Punkte c oder d in ]a, b[ liegen, d.h. es gibt x ∈ ]a, b[ derart, dass f in x ein lokales Extremum hat. Nach Satz 7.7 gilt f (x) = 0.
Man beachte, dass Differenzierbarkeit in den Randpunkten nicht erforderlich ist. Nun k¨onnen wir den so genannten Mittelwertsatz einfach herleiten. Wir formulieren gleich eine leicht verallgemeinerte Version. Satz 7.9. Seien f : [a, b] → IR und g : [a, b] → IR stetige Funktionen, die auf ]a, b[ differenzierbar sind. Dann gibt es ein x ∈ ]a, b[ mit ( f (b) − f (a)) g (x) = (g(b) − g(a)) f (x) . Beweis. Die Funktion h : [a, b] → IR, h(x) := ( f (b)− f (a))g(x)−(g(b)−g(a)) f (x), ist stetig, auf ]a, b[ differenzierbar, und es gilt h(a) = f (b) g(a) − f (a) g(b) = h(b) . Nach Satz 7.8 existiert ein x ∈ ]a, b[ mit h (x) = 0, woraus direkt die Behauptung folgt.
104
7 Differentiation
Der Sonderfall g(x) = x wird Mittelwertsatz (der Differentialrechnung) genannt: Satz 7.10 (Mittelwertsatz). Ist f : [a, b] → IR eine stetige Funktion, die auf ]a, b[ differenzierbar ist, so gibt es ein x ∈ ]a, b[ mit f (x) =
f (b) − f (a) . b−a
Eine physikalische Interpretation lautet wie folgt. L¨auft man etwa 100 Meter in 10 Sekunden, so betr¨agt die Durchschnittsgeschwindigkeit 36 km/h. Laut dem Mittelwertsatz gibt es dabei mindestens einen Zeitpunkt, an dem die Momentangeschwindigkeit (aufgefasst als Ableitung, also der Grenzwert der durchschnittli” chen Geschwindigkeit, wenn die zur¨uckgelegte Wegstrecke gegen 0 geht“) genau 36 km/h ist. Aus dem Mittelwertsatz erhalten wir eine Reihe interessanter Ergebnisse zum Verhalten von differenzierbaren Funktionen. Korollar 7.11. Sei f : [a, b] → IR stetig und auf ]a, b[ differenzierbar. Dann gelten: (i)
Ist f (x) ≥ 0 f¨ur alle x ∈ ]a, b[, so ist f monoton wachsend.
(ii)
Ist f (x) = 0 f¨ur alle x ∈ ]a, b[, so ist f konstant.
(iii)
Ist f (x) ≤ 0 f¨ur alle x ∈ ]a, b[, so ist f monoton fallend.
Beweis. F¨ur alle drei Aussagen ziehen wir die Gleichung f (x2 ) − f (x1 ) = f (x) (x2 − x1 ) heran, die laut dem Mittelwertsatz f¨ur beliebige x1 , x2 ∈ [a, b], x1 < x2 , mit einem geeigneten x ∈ ]x1 , x2 [ gilt. Ist nun f (x) ≥ 0 f¨ur alle x ∈ ]a, b[, so folgt f (x1 ) ≤ f (x2 ), d.h. f w¨achst monoton. Entsprechend geht man auch f¨ur die anderen beiden Aussagen vor.
Bemerkungen: (1)
In Korollar 7.11 gelten jeweils auch die Umgekehrten Implikationen. Ist etwa f (x) f monoton wachsend, so gilt f (t)− ≥ 0 f¨ur alle x,t ∈ ]a, b[ und damit auch t−x f (x) ≥ 0, falls f in x differenzierbar ist.
(2)
Gilt sogar f (x) > 0 f¨ur alle x ∈ ]a, b[ (oder f (x) < 0), so ist f streng monoton wachsend (bzw. streng monoton fallend), wie sofort aus dem Nachweis von Korollar 7.11 folgt. Hier gilt die Umkehrung allerdings nicht! Die durch f (x) := x3 erkl¨arte Funktion ist zwar auf ganz IR streng monoton wachsend, aber ihre Ableitung nicht u¨ berall positiv: Es gilt f (0) = 0.
(3)
Mit Korollar 7.11(ii) gilt auch folgendes. Seien f , g : [a, b] → IK stetig und auf ]a, b[ differenzierbar mit f (x) = g (x) f¨ur alle x ∈ ]a, b[. Dann existiert eine Konstante c ∈ IK mit f (x) = g(x) + c f¨ur alle x ∈ [a, b]. Zum Nachweis braucht man nur h := f − g zu betrachten.
7.2 Mittelwertsatz und lokale Extrema
105
Definition 7.12. Sei f : I → IK gegeben. Eine differenzierbare Funktion F : I → IK heißt Stammfunktion von f , falls F = f gilt. Laut Bemerkung (3) ist F bis auf eine additive Konstante durch f eindeutig bestimmt. Korollar 7.13. Seien ∈ IK sowie f : [a, b] → IK stetig und in ]a, b[ differenzierbar derart, dass f (x) = f (x) f¨ur alle x ∈ ]a, b[ ist. Dann gilt f (x) = c exp( x) f¨ur alle x ∈ [a, b] , wobei c ∈ IK eine Konstante ist. Beweis. Setze g(x) := f (x) exp(− x). F¨ur alle x ∈ ]a, b[ gilt damit g (x) = f (x) exp(− x) − f (x) exp(− x) = 0 . Folglich ist g eine Konstante, also gilt f (x) = c exp( x) mit einem c ∈ IK zun¨achst f¨ur alle x ∈ ]a, b[ und wegen der Stetigkeit dann auch f¨ur alle x ∈ [a, b].
Die Exponentialfunktion ist also die einzige differenzierbare Funktion f : IR → IR, die den Bedingungen •
f = f
•
f (0) = 1
gen¨ugt. Wir geben noch weitere Erg¨anzungen zum Mittelwertsatz an. Das n¨achste Resultat ist benannt nach Jean Gaston Darboux (1842-1917, Paris). Korollar 7.14 (Darboux). Seien f : [a, b] → IR differenzierbar und c ∈ ] f (a), f (b)[, falls f (a) < f (b) gilt (bzw. c ∈ ] f (b), f (a)[, falls f (b) < f (a) gilt). Dann existiert x0 ∈ ]a, b[ mit f (x0 ) = c. Beweis. Sei f (a) < c < f (b). Mit g(x) := f (x) − cx gilt g (a) < 0 und g (b) > 0. Wegen g(t) − g(a) 0 > g (a) = lim t→a+ t −a gibt es ein t1 ∈ ]a, b[ mit g(t1 ) < g(a). Ebenso folgt, dass ein t2 ∈ ]a, b[ existiert mit g(t2 ) < g(b). Laut Satz 6.16 nimmt g auf [a, b] sein Minimum an, und wegen der vorangehen¨ den Uberlegungen nimmt g dieses Minimum an einer Stelle in x0 ∈ ]a, b[ an. Mit Satz 7.7 folgt g (x0 ) = 0. Daher gilt f (x0 ) = c.
Unter Verwendung des verallgemeinerten Mittelwertsatzes k¨onnen einige Grenzwerte recht einfach bestimmt werden. Wir leiten die so genannte L’Hospitalsche Regel her (L’Hospital, Marquis de Sainte-Mesme, 1661-1704, Paris; die L’Hospitalsche Regel stammt von Johann Bernoulli I, 1667-1748, Basel).
106
7 Differentiation
Satz 7.15. Seien f , g : ]a, b[ → IR differenzierbare Funktionen. Weiter sei g (x) = 0 f¨ur alle x ∈ ]a, b[ und es gelte lim f (x) = 0 = lim g(x). x→b
x→b
f (x) =: existiert, so gilt x→b g (x)
Dann ist g(x) = 0 f¨ur alle x ∈ ]a, b[. Wenn lim
f (x) f (x) = = lim . x→b g (x) x→b g(x) lim
Eine entsprechende Aussage gilt f¨ur x → a. Dies gilt auch im Fall eines uneigentlichen Grenzwertes = ± und auch bei a = − oder b = . Beweis. Sei zun¨achst b ∈ IR. Nach Voraussetzung kann man f und g fortsetzen zu stetigen Funktionen auf ]a, b] und es gilt f (b) = 0 = g(b). Zu c ∈ ]a, b[ gibt es nach dem Mittelwertsatz ein x ∈ ]c, b[ mit g(c) = g(c) − g(b) = g (x) (c − b). Dann ist auch g(c) = 0 f¨ur alle c ∈ ]a, b[. Laut Satz 7.9 existiert zu jedem c ∈ ]a, b[ ein x = x(c) ∈ ]c, b[ mit f (c) − f (b) f (x) f (c) = = . g(c) g(c) − g(b) g (x) Mit c → b gilt auch x(c) → b und es folgt die Behauptung. Die Aussage f¨ur x → a beweist man ganz analog (zun¨achst f¨ur a ∈ IR). Nun betrachten wir den wir a > 0 anneh' b = . Ohne Einschr¨ ' & Fall
ankung & k¨onnen
men. Wir setzen : 0, 1a → IR, (t) := f 1t und : 0, 1a → IR, (t) := g 1t . Die Funktion ist differenzierbar mit
−g 1t (t) = = 0 t2 & ' f¨ur alle t ∈ 0, 1a und es gilt lim (t) = 0 = lim (t). Schließlich haben wir t→0
t→0
1
t2 f t f 1t (t) f (x) = lim = lim 2 1 = lim 1 = lim x→ g (x) t→0 (t) t→0 t g t→0 g t t und mit dem bereits Bewiesenen folgt
f 1t (t) f (x) = lim 1 = lim = lim x→ t→0 (t) t→0 g g(x) t
wie behauptet. Beispiele: (1)
Es gilt
sin x cos x = lim = 1. x→0 x x→0 1 lim
7.2 Mittelwertsatz und lokale Extrema
107
(2)
1 x − sinx 1 − = lim . x→0 sin x x x sin x Mit f (x) := x − sin x und g(x) := x sin x sind die Voraussetzungen von Satz 7.15 erf¨ullt; man beachte, dass g (x) = 0 in einem Intervall ]0, b[ mit einem geeigneten b gilt. Wir erhalten
Wir bestimmen
lim
x→0
lim
x→0
x − sin x 1 − cosx sin x = lim = lim =0, x→0 x cos x + sinx x→0 −x sin x + 2 cosx x sin x
wobei wir ein zweites Mal Satz 7.15 angewendet haben (nachdem wir uns u¨ berzeugt haben, dass die Voraussetzungen wiederum erf¨ullt sind). Eine zweite Regel von L’Hospital befasst sich mit dem Fall lim g(t) = ±. t→b
Satz 7.16. Seien f , g : ]a, b[ → IR differenzierbare Funktionen. Weiter sei g (x) = 0 f¨ur alle x ∈ ]a, b[ und es gelte lim g(x) = . x→b
f (x) =: existiert, so gilt Wenn lim x→b g (x) f (x) f (x) = = lim . x→b g (x) x→b g(x) lim
Eine entsprechende Aussage gilt f¨ur x → a. Dies gilt auch im Fall eines uneigentlichen Grenzwertes = ± und auch bei a = − oder b = . Beweis. Sei zun¨achst ∈ IR. Zu > 0 gibt es s ∈ ]a, b[ mit
f (x)
f¨ur alle x ∈ [s, b[ .
g (x) − < und g(x) > 0 Nun w¨ahle t ∈ ]s, b[, sodass |g(x)| >
| f (s)|
und |g(x)| >
|g(s)|
f¨ur alle x ∈ [t, b[ gilt.
F¨ur beliebiges x ∈ ]t, b[ gibt es laut Satz 7.9 ein ∈ ]s, x[ mit g ( ) ( f (x) − f (s)) = f ( ) (g(x) − g(s)) . Dies k¨onnen wir umformen zu f (x) f ( ) = g(x) g ( )
g(s) f (s) 1− + . g(x) g(x)
Man erh¨alt daraus
f (x)
f ( )
f ( ) g(s) f (s)
g(x) − ≤ g ( ) − + g ( ) g(x) + g(x) < + (| | + ) + . Damit gilt lim
x→b
f (x) = . g(x)
108
7 Differentiation
(x) Nun sei = . Zu M > 0 gibt es dann s ∈ ]a, b[ mit gf (x) ≥ M und g(x) > 0 f¨ur alle x ∈ [s, b[. W¨ahle t ∈ ]s, b[ mit g(x) > − f (s) und g(x) > 2g(s) f¨ur alle x ∈ [t, b[.
F¨ur beliebiges x ∈ ]t, b[ erh¨alt man wiederum mit Hilfe von Satz 7.9 ein ∈ ]s, x[, sodass f (x) f ( ) g(s) f (s) 1 = 1− + > M−1 g(x) g ( ) g(x) g(x) 2 gilt. Damit folgt lim
x→b
f (x) = . g(x)
Beispiele: lim x ln x = lim
ln x
= lim
1 x
= 0.
(1)
Es gilt
(2)
Dieses Beispiel soll zeigen, dass man bei den L’Hospitalschen Regeln auf die Voraussetzung g (x) = 0 nicht verzichten kann. Es stammt von O. Stolz (1842-1905, Innsbruck).
x→0 1 x
x→0
x→0
− x12
Seien f (x) := x + sin x cos x und g(x) := f (x) exp(sin x). Ein Grenzwert lim
x→
f (x) = lim exp(− sin x) g(x) x→
existiert nicht!
Hingegen ist f (x) 2 cos2 x = lim x→ g (x) x→ cos x exp(sin x) (2 cos x + f (x)) lim
= lim
x→
2 cos x exp(− sin x) =0, f (x) + 2 cosx
da der Z¨ahler beschr¨ankt bleibt und f (x) → mit x → gilt. Von den Voraussetzungen ist zwar lim g(x) = erf¨ullt, aber g (x) = 0 ist x→ nicht m¨oglich, auch nicht nach eventueller Einschr¨ankung des Definitionsbereichs, wegen g (x) = cos x exp(sin x) (2 cos x + f (x)) = 0
f¨ur alle x =
+ k , k ∈ ZZ . 2
7.3 Ableitung der Umkehrfunktion Satz 7.17. Sei f : I → IR streng monoton und differenzierbar in x ∈ I mit f (x) = 0. Setze J := f (I).
−1 1 Dann ist f −1 : J → I in y = f (x) differenzierbar und es gilt f (y) = . f (x)
7.3 Ableitung der Umkehrfunktion
109
Beweis. Sei (sn )n∈IN eine Folge in J mit sn → y = f (x) und sn = y ∀n. Bezeichnet tn := f −1 (sn ), so ist tn = x und es gilt tn → x, da f −1 laut Satz 6.10 stetig ist. Folglich haben wir f −1 (sn ) − f −1 (y) tn − x 1 lim = lim = n→ n→ f (tn ) − f (x) sn − y f (x)
wie behauptet. f
Grafisch erh¨alt man die Umkehrabbildung durch Spiegelung an der Winkelhalbierenden.
tn = f −1 (sn )
f −1
x = f −1 (y) y
sn
Die Steigung der Tangente an den Graph von f −1 im Punkt (y, f −1 (y)) ist gleich dem Kehrwert der Steigung der Tangente an den Graph von f im Punkt (x, f (x)) = ( f −1(y), y).
Beispiele: (1)
' & Die Funktion f : − 2 , 2 → [−1, 1], f (x) := sin x, ist differenzierbar mit f (x) = cos x. & ' Wir wissen bereits, dass cos im Intervall − 2 , 2 positiv ist, also ist sin laut Korollar 7.11 ' dort & streng monoton wachsend. Man sieht unmittelbar, & dass f' auch auf − 2 , 2 streng wachsend ist, denn f¨ur alle x ∈ − 2 , 2
monoton gilt schließlich −1 = f − 2 < f (x) < f 2 = 1. & ' Die Umkehrfunktion f −1 : [−1, 1] → − 2 , 2 heißt Arcus-Sinus und wird mit arcsin bezeichnet. Diese ist f¨ur alle y ∈ ] − 1, 1[ differenzierbar, und mit y = sin x gilt arcsin (y) =
1 1 1 1 = = . = cos x cos(arcsin y) 1 − y2 1 − sin2 (arcsin y)
2
−1 1
− 2
Die Abbildung zeigt den Graphen der ' & Funktion arcsin : [−1, 1] → − 2 , 2 .
110
(2)
7 Differentiation
Die Funktion tan : IR \ (2k + 1) 2 : k ∈ ZZ → IR, tan(x) := renzierbar mit
sin(x) , cos(x)
ist diffe-
1 cos2 (x) + sin2 (x) = = 1 + tan2 (x) . 2 cos (x) cos2 (x) ' & wachsend Insbesondere ist f : − 2 , 2 → IR, f (x) := tan(x), streng '
& monoton und mit lim tan(x) = , lim tan(x) = − folgt f − 2 , 2 = IR. tan (x) =
x→ 2
x→− 2
' & Nach Satz 7.17 existiert eine Umkehrfunktion f −1 : IR → − 2 , 2 ; wir bezeichnen diese mit arctan. F¨ur die Ableitung gilt arctan (tan(x)) =
1 . tan (x)
Mit y = tan(x) erhalten wir schließlich arctan (y) =
1 tan (arctan(y))
=
1 1 = . 2 1 + (tan(arctan(y)) 1 + y2
7.4 Aufgaben 1. Ist die Funktion f : IR → IR, f (x) :=
x2 cos ln(x2 )
f¨ur x = 0 ,
0
f¨ur x = 0 ,
differenzierbar ? Bestimmen Sie gegebenenfalls die Ableitung f und untersuchen Sie diese ebenfalls auf Stetigkeit. 2. Zeigen Sie, dass die Funktion f : IR → IR, f (x) := |x|3 , zwei Mal differenzierbar ist. Bestimmen Sie f und f . Zeigen Sie weiter, dass f an der Stelle x = 0 nicht differenzierbar ist. 3. Seien I ⊆ IR ein Intervall und f : I → IR differenzierbar derart, dass f beschr¨ankt ist. Zeigen Sie, dass f Lipschitz-stetig ist. 4. Seien I ein offenes Intervall und f : I → IR eine zwei Mal differenzierbare Funktion. Zeigen Sie: a. Ist x0 ∈ I mit f (x0 ) = 0 und f (x0 ) < 0, so hat f in x0 ein lokales Maximum. b. Ist x0 ∈ I mit f (x0 ) = 0 und f (x0 ) > 0, so hat f in x0 ein lokales Minimum. Hinweis: Wenden Sie Korollar 7.11 zun¨achst auf f an Stelle von f an.
7.4 Aufgaben
111
5. Seien I ein Intervall und f : I → IR eine monoton wachsende differenzierbare Funktion. Zeigen Sie, dass f genau dann streng monoton wachsend ist, wenn es kein Intervall J ⊆ I positiver L¨ange gibt mit f (x) = 0 ∀x ∈ J. 6. Bestimmen Sie alle lokalen Extrema von f : IR → IR, f (x) := x3 + ax2 + bx, in Abh¨angigkeit von a, b ∈ IR und entscheiden Sie jeweils, ob es sich um ein Maximum oder Minimum handelt. 7. Bestimmen Sie alle lokalen Extrema der Funktion f : IR → IR, |x| ln(|x|) f¨ur x = 0 , f (x) := 0 f¨ur x = 0 , und entscheiden Sie jeweils, ob es sich um ein Maximum oder Minimum handelt. 8. Bestimmen Sie die folgenden Grenzwerte. 1 1 a. lim − x→0 x ln(x + 1) b. c. d.
lim
x→1
ln(x) − x + 1 (x − 1)2
ln(cos(ax)) (a, b ∈ IR, b = 0) ln(cos(bx)) cos(x) − 1 lim exp x→0 x2 lim
x→0
9. Sei I ein Intervall. Eine Funktion f : I → IR heißt konvex, wenn f ( x1 + (1 − )x2) ≤ f (x1 ) + (1 − ) f (x2) f¨ur alle x1 , x2 ∈ I und f¨ur alle ∈ [0, 1] gilt. Eine konvexe Funktion f heißt streng konvex, wenn in obiger Ungleichung Gleichheit nur in den Trivialf¨allen x1 = x2 oder ∈ {0, 1} gilt. a. Sei f : I → IR differenzierbar. Zeigen Sie: Die Funktion f ist genau dann (streng) konvex, wenn f (streng) monoton wachsend ist. b. Sei nun f : I → IR zwei Mal differenzierbar. Zeigen Sie: Die Funktion f ist genau dann konvex, wenn f (x) ≥ 0 f¨ur alle x ∈ I ist. c. Zeigen Sie weiter, dass f¨ur eine zwei Mal differenzierbare, streng konvexe Funktion f nicht notwendigerweise f (x) > 0 f¨ur alle x ∈ I folgt.
112
7 Differentiation
10. Gegeben sei die Funktion f : IR → IR, f (x) := arcsin
2x 1+x2
.
a. Bestimmen Sie alle lokalen Extrema von f und entscheiden Sie jeweils, ob es sich um ein Maximum oder Minimum handelt. b. Zeigen Sie: F¨ur −1 < x < 1 gilt f (x) = 2 arctan(x). Gilt eine a¨ hnliche Identit¨at auch f¨ur |x| > 1 ? 11. Die Funktionen Sinus Hyperbolicus und Cosinus Hyperbolicus sind wie folgt definiert: 1 x sinh : IR → IR , sinh(x) := e − e−x , cosh 2 cosh : IR → IR ,
cosh(x) :=
1 x e + e−x . 2
Zeigen Sie: a. F¨ur alle x, y ∈ IR gilt sinh(x + y) = cosh(x) sinh(y) + sinh(x) cosh(y) ,
sinh
cosh(x + y) = cosh(x) cosh(y) + sinh(x) sinh(y) . b. F¨ur alle x ∈ IR gilt cosh2 (x) − sinh2 (x) = 1. c. Die Funktionen sinh und cosh sind differenzierbar mit sinh (x) = cosh(x)
und
cosh (x) = sinh(x) .
d. Die Funktion sinh besitzt eine differenzierbare Umkehrabbildung arsinh : IR → IR mit 1 arsinh (x) = √ . 2 x +1 e. Die Einschr¨ankung von cosh auf das Intervall [0, [ besitzt eine in ]0, [ differenzierbare Umkehrabbildung arcosh : [1, [ → [0, [ mit 1 arcosh (x) = √ . 2 x −1 f. Es gilt arsinh(x) = ln x + x2 + 1 arcosh(x) = ln x + x2 − 1
f¨ur alle x ∈ IR , f¨ur alle x ∈ [1, [ .
Kapitel 8
Integration
Die Grundidee der Integration ist es, den Inhalt der Fl¨ache, die zwischen Graph einer Funktion f : [a, b] → IR und x-Achse innerhalb der Intervallgrenzen liegt, zu berechnen. F¨ur so genannte Treppenfunktionen bereitet uns dies keine Probleme. Mittels eines Grenz¨ubergangs werden wir das Integral auf allgemeinere Funktionen erweitern. Die anschauliche Vorstellung als Fl¨acheninhalt gilt zwar f¨ur reellwertige Funktionen, wir werden dennoch auch C-wertige Funktionen zulassen. Neben dem Regel-Integral, welches wir in diesem Kapitel einf¨uhren, existieren einige weitere Arten von Integralen, wie etwa das Riemann-Integral oder das Lebesgue-Integral.
8.1 Regelfunktionen Definition 8.1. Eine Funktion f : [a, b] → IK heißt Treppenfunktion, wenn es a0 , . . . , an ∈ [a, b] mit a = a0 < a1 < . . . < an = b und c1 , . . . , cn ∈ IK gibt, sodass f (x) = ck
f¨ur alle x ∈ ]ak−1 , ak [
(k = 1, . . . , n)
gilt. F¨ur die Werte f (a0 ), . . . , f (an ) wird nichts weiter vorausgesetzt. Wir nennen a = a0 < a1 < . . . < an = b eine Teilung (oder Partition) von [a, b] und bezeichnen ( b
a
f (x) dx :=
n
ck (ak − ak−1)
∈ IK
k=1
als das Integral von f . Man beachte, dass an jeder Sprungstelle“ von f ein Teilungspunkt liegt, aber ” nicht jeder Teilungspunkt eine Sprungstelle zu sein braucht. Als Feinheit der Teilung bezeichnet man das Maximum max{ak −ak−1 : k = 1, . . . , n}. Ist a j−1 < a < a j f¨ur ein j = 1, . . . , n, so heißt die Teilung a = a0 < . . . < a j−1 < a < a j < . . . < an = b feiner als a = a0 < . . . < an = b.
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_8, © Springer-Verlag Berlin Heidelberg 2012
113
114
8 Integration
Anschaulich liefert das Integral einer nichtnegativen Treppenfunktion den Inhalt der Fl¨ache zwischen Graph und x-Achse.
a = a0
a1
Der Wert des Integrals a¨ ndert sich nicht bei verschiedenen Teilungen, die durch Hinzuf¨ugen oder Fortnehmen von passenden Punkten auseinander hervorgehen.
an = b
Mit T ([a, b]) bezeichnen wir die Menge aller Treppenfunktionen f : [a, b] → IK.. Mit zwei Treppenfunktionen f und g ist auch deren Summe eine Treppenfunktion; durch Verfeinerung einer Teilung zu f und einer Teilung zu g erh¨alt man eine gemeinsame Teilung zu f und g. Offensichtlich ist auch f ∈ T ([a, b]), falls f ∈ T ([a, b]) und ∈ IK. Daher ist T ([a, b]) ein IK-Vektorraum. Weiter ist der Raum der Treppenfunktionen ein Untervektorraum von B([a, b]), dem Raum der beschr¨ankten Funktionen [a, b] → IK. Dieser ist laut Satz 4.9 mit der so genannten Supremumsnorm · ein Banachraum. Wir halten einige Eigenschaften des Integrals von Treppenfunktionen fest: ( b
( b
( b
(1)
F¨ur f , g ∈ T ([a, b]) gilt
(2)
F¨ur f ∈ T ([a, b]) und ∈ IK gilt
(3)
Sind f , g ∈ T ([a, b]) reellwertig und ist f (x) ≤ g(x) f¨ur alle x ∈ [a, b], so gilt
a
( b a
(4)
( f (x) + g(x)) dx = ( b a
a
f (x) dx +
f (x) dx =
f (x) dx ≤
( b a
( b a
a
g(x) dx.
f (x) dx.
g(x) dx .
(b
( b
f (x) dx
≤ | f (x)| dx ≤ f (b − a). F¨ur f ∈ T ([a, b]) gilt
a a
Beweis. F¨ur (1) brauchen wir nur eine gemeinsame Teilung zu f und g zu w¨ahlen und (2) folgt direkt aus der Definition. Zum Nachweis von (3) sei zun¨achst f ∈ T ([a, b]) mit f (x) ≥ 0 ∀x ∈ [a, b]. Hier gilt ab f (x) dx ≥ 0 und der allgemeine Fall folgt mit Hilfe von (1), wenn wir f − g betrachten. Aus einer Teilung a = a0 < . . . < an = b zu f erhalten wir schließlich noch
n n
ck (xk − xk−1 ) ≤ |ck | (xk − xk−1 ) ≤ max |ck | (b − a) ≤ f (b − a) ,
k=1
k=1 k=1,...,n womit auch (4) gezeigt ist.
Wir merken noch an, dass der Wert des Integrals nicht von den Funktionswerten f (a j ) an den Sprungstellen abh¨angt, die Norm f hingegen schon. Bei der Erweiterung des Integrals auf gr¨oßere Funktionsklassen als die der Treppenfunktionen ist die Vorgehensweise nicht mehr ganz so offensichtlich. Der einfachste
8.1 Regelfunktionen
115
Weg ist der, den Cauchy (1823) gew¨ahlt hat. Er l¨asst sich kurz wie folgt beschreiben: Man dehne das Integral, das eine lineare (1), (2) und stetige (4) Abbildung T ([a, b]) → IK darstellt, aus auf den Abschluss (vgl. Kapitel 12) des Raumes der Treppenfunktionen im Banachraum (B([a, b]), · ). Definition 8.2. Eine Funktion f : [a, b] → IK heißt Regelfunktion (oder integrierbar im Cauchyschen Sinn), wenn eine Folge ( fn )n∈IN in T ([a, b]) existiert, die im Raum (B([a, b]), · ) gegen f konvergiert (d.h. lim fn − f = 0). n→
Man sagt dann, dass man f gleichm¨aßig durch Treppenfunktionen approximieren kann. Den Raum der Regelfunktionen bezeichnen wir mit R([a, b]). Wir haben R([a, b]) so gew¨ahlt, damit wir das Integral, das bisher f¨ur f ∈ T ([a, b]) erkl¨art ist, auch f¨ur f ∈ R([a, b]) einfach definieren k¨onnen. Seien f ∈ R([a, b]) eine Regelfunktion, und fn ∈ T ([a, b]) mit lim fn − f = 0. n→ Dann heißt ( ( b
a
f (x) dx := lim
b
n→ a
fn (x) dx
das Regel-Integral von f . Wir m¨ussen uns noch klar machen, dass dieser Grenzwert u¨ berhaupt existiert und unabh¨angig von der gew¨ahlten Folge ( fn )n∈IN ist. Laut den Eigenschaften (1) und (4) des Integrals f¨ur Treppenfunktionen gilt
( b
( b
fn (x) dx − fm (x) dx
≤ fn − fm (b − a)
a
a
≤ ( fn − f + f − fm ) (b − a) ( b fn (x) dx eine Cauchyfolge in IK ist. und mit fn − f → 0 folgt, dass a
n∈IN
Damit ist die Existenz des Grenzwertes gesichert. Ist (gn )n∈IN eine weitere Folge in T ([a, b]) mit lim gn − f = 0, so gilt n→
( b
( b
≤ fn − gn (b − a) f (x) dx − g (x) dx n
a n
a ≤ ( fn − f + f − gn ) (b − a) und es folgt lim
( b
n→ a
gn (x) dx = lim
( b
n→ a
fn (x) dx.
Nun haben wir belegt, dass die Definition widerspruchsfrei ist. Bemerkungen: (1)
Wir werden in K¨urze eine Charakterisierung der Regelfunktionen geben, aus der unmittelbar folgt, dass jede stetige Funktion f : [a, b] → IK eine Regelfunktion ist. Also existiert f¨ur jede stetige Funktion das Regel-Integral.
116
8 Integration
(2)
Wenn eine Folge ( fn )n∈IN von Regelfunktionen eine Cauchyfolge bez¨uglich · ist, dann konvergiert diese im Banachraum (B([a, b]), · ) gegen eine Funktion f , vgl. Satz 4.9. Man kann leicht einsehen, dass dann auch f wieder durch Treppenfunktionen approximiert werden kann, also eine Regelfunktion ist. Folglich ist (R([a, b]), · ) ein Banachraum.
(3)
Auf Konvergenz von Funktionsfolgen bez¨uglich · (gleichm¨aßige Konvergenz) werden wir in Kapitel 9 noch ausf¨uhrlicher zu sprechen kommen.
Beispiel: Sei f : [0, 1] → IR, f (x) := x. Wir zeigen, dass f ∈ R([0, 1]) gilt und berechnen
( 1 0
f (x) dx.
Zu n ∈ IN betrachten wir fn : [0, 1] → IR mit fn (0) = 0 und ! ! k−1 k k fn (x) := f¨ur x ∈ , (k = 1, . . . , n) . n n n & & k k k−1 1 1 F¨ur x ∈ k−1 n , n gilt damit | f n (x) − f (x)| < n − n = n , also f n − f ≤ n . Somit ist f ∈ R([0, 1]) und ( 1 0
f (x) dx = lim
n→
( 1 0
fn (x) dx = lim
n→
n
k 1
n
1
lim 2 k = lim n n = n→ n→ n
k=1
k=1
n(n + 1) 1 = . 2n2 2
Satz 8.3. Seien f , g ∈ R([a, b]) und ∈ IK. Dann gelten: (1) (2)
( b a
( b a
( f (x) + g(x)) dx =
f (x) dx =
( b a
( b a
f (x) dx +
( b a
g(x) dx.
f (x) dx. ( b
( b
(3)
Sind f , g reellwertig und f ≤ g, so gilt
(4)
Auch | f | ist eine Regelfunktion und
(b
( b
f (x) dx
≤ | f (x)| dx ≤ f (b − a) .
a
a
f (x) dx ≤
a
g(x) dx.
a
Beweis. Die Behauptungen (1) und (2) folgen mit den Rechenregeln f¨ur Grenzwerte direkt aus den entsprechenden Eigenschaften des Integrals f¨ur Treppenfunktionen. Zum Nachweis von (3) gen¨ugt es wiederum zu zeigen, dass aus f ≥ 0 stets b f (x) dx ≥ 0 folgt. a Sei also f ∈ R([a, b]) mit f (x) ≥ 0 f¨ur alle x ∈ [a, b]. Dann gibt es eine Folge ( fn )n∈IN von Treppenfunktionen mit f − fn → 0. Mit fn+ (x) := max{ fn (x), 0} ist auch fn+ ∈ T ([a, b]) und es gilt fn+ − f → 0. Nun ist
b + ur alle n ∈ IN und damit auch ab f (x) dx ≥ 0. a f n (x) dx ≥ 0 f¨
8.1 Regelfunktionen
117
Im Hinblick auf (4) halten wir fest, dass | | f (x)| − | fn (x)| | ≤ | f (x) − fn (x)| f¨ur alle x ∈ [a, b] ist. Also gilt | f | − | fn | ≤ f − fn . Da mit fn ∈ T ([a, b]) auch | fn | ∈ T ([a, b]) ist, folgt | f | ∈ R([a, b]). F¨ur die Treppenfunktionen fn wissen wir
( b
( b
≤ f (x) dx | fn (x)| dx ≤ fn (b − a) n
a
a
und lim f − fn = 0. Mit n→
(
lim
n→
b a
(
fn (x) dx
=
a
b
f (x) dx
,
lim
( b
n→ a
| fn (x)| dx =
( b a
| f (x)| dx
und lim fn = f folgen die Ungleichungen auch f¨ur f .
n→
Bemerkung: F¨ur f : [a, b] → C, f ∈ R([a, b]) gilt stets auch Re f , Im f ∈ R([a, b]). Außerdem ist ( b a
Re f (x) dx = Re
( b a
f (x) dx und
( b a
Im f (x) dx = Im
( b a
f (x) dx .
Schreibweise: Seien I, X zwei Mengen und f : I → X eine Abbildung. Ist weiter J ⊆ I, so bezeichnen wir mit f |J die Einschr¨ankung von f auf J, d.h. f |J ist diejenige Funktion J → X, die mit f auf J u¨ bereinstimmt. Satz 8.4. Seien a < b < c reelle Zahlen und f : [a, c] → IK eine Abbildung. Es gilt f ∈ R([a, c]) genau dann, wenn f |[a, b] ∈ R([a, b]) und f |[b, c] ∈ R([b, c]) ist. Gegebenenfalls ist dann ( c a
f (x) dx =
( b a
f (x) dx +
( c b
f (x) dx .
Beweis. Man braucht nur f |[a, b] und f |[b, c] mit Treppenfunktionen zu approximieren und nehme diese Treppenfunktionen zur Approximation von f . Umgekehrt liefert jede Approximation von f mit Treppenfunktionen, eventuell nach Hinzunahme von b als weiteren Teilungspunkt, Approximationen von f |[a, b] und f |[b, c].
Vereinbarungsgem¨aß setzt man ( b a
f (x) dx := −
( a b
f (x) dx f¨ur a > b
und
( a a
f (x) dx := 0 .
Satz 8.5. Sei f : [a, b] → IK eine Abbildung. Es gilt f ∈ R([a, b]) genau dann, wenn f¨ur jedes x ∈ ]a, b[ sowohl der linksseitige Grenzwert f (x−) als auch der rechtsseitige Grenzwert f (x+), f¨ur x = a der rechtsseitige Grenzwert f (a+) und f¨ur x = b der linksseitige Grenzwert f (b−) existieren.
118
8 Integration
Beweis. Sei f ∈ R([a, b]). Zu x0 ∈ [a, b[ und > 0 finden wir eine Treppenfunktion g ∈ T ([a, b]) mit f − g < 2 . Dann existiert ein Intervall ]x0 , a j [, sodass g| ]x0 , a j [ konstant ist, wobei a j aus einer Teilung von g ist. F¨ur beliebige x, y ∈ ]x0 , a j [ gilt damit | f (x) − f (y)| ≤ | f (x) − g(x)| + |g(y) − f (y)| < . Ist nun (xn )n∈IN eine gegen x0 konvergente Folge mit xn > x0 ∀n, so gibt es ein N ∈ IN mit xn ∈ ]x0 , a j [ f¨ur alle n ≥ N. Mit obiger Absch¨atzung folgt, dass ( f (xn ))n∈IN eine Cauchyfolge ist. Daher existiert der Grenzwert f (x0 +). Analog argumentiert man f¨ur x0 ∈ ]a, b], um Existenz von f (x0 −) zu begr¨unden. F¨ur die umgekehrte Beweisrichtung sei vorausgesetzt, dass f (x0 +) f¨ur x0 ∈ [a, b[ und f (x0 −) f¨ur x0 ∈ ]a, b] existieren. Wir nehmen an, dass f nicht durch Treppenfunktionen approximiert werden kann. Dann gibt es also ein > 0, sodass f − g ≥ f¨ur alle g ∈ T ([a, b]) gilt. Wir konstruieren daraus induktiv eine Intervallschachtelung ([an , bn ])n∈IN0 mit sup | f (x) − g(x)| ≥
x∈[an ,bn ]
f¨ur alle g ∈ T ([an , bn ]) .
Dazu beginnen wir mit [a0 , b0 ] := [a, b]. Sind [a0 , b0 ], [a1 , b1 ], . . . , [an , bn ] bereits erkl¨art, so setzen wir M := 12 (an + bn ). Dann m¨ussen auch auf mindestens einer der H¨alften [an , M] oder [M, bn ] alle Treppenfunktionen einen · -Abstand von f haben, der gr¨ oßer oder gleich ist. Wir k¨onnen nun [an+1 , bn+1 ] entsprechend w¨ahlen. Sei x0 = [an , bn ]. n∈IN0
Wir betrachten den Fall, dass x0 ∈ ]a, b[ ist (f¨ur die F¨alle x0 = a oder x0 = b kann man die Argumentation leicht anpassen). Da f (x0 +) und f (x0 −) existieren, gibt es zu beliebigem > 0 eine Zahl > 0 mit
und
| f (x) − f (x0 +)| <
f¨ur alle x ∈ ]x0 , x0 + [
| f (x) − f (x0 −)| <
f¨ur alle x ∈ ]x0 − , x0 [ .
Schließlich gibt es n ∈ IN mit [an , bn ] ⊆ ]x0 − , x0 + [. Definiert man die Treppenfunktion g : [an , bn ] → IK durch ⎧ ⎪ ⎨ f (x0 −) f¨ur x ∈ [an , x0 [ , f¨ur x = x0 , g(x) := f (x0 ) ⎪ ⎩ f (x0 +) f¨ur x ∈ ]x0 , bn ] , so gilt sup | f (x) − g(x)| <
im Widerspruch zu oben.
x∈[an ,bn ]
Damit ist gezeigt, dass f ∈ R([a, b]) ist.
8.2 Der Hauptsatz der Differential- und Integralrechnung
119
Korollar 8.6. Es gilt C([a, b]) ⊆ R([a, b]), d.h. jede stetige Funktion ist eine Regelfunktion. Auch jede monotone Funktion ist Regelfunktion. Beweis. Ist f ∈ C([a, b]), so gilt f (x+) = f (x) = f (x−) f¨ur jedes x ∈ ]a, b[ sowie f (a+) = f (a) und f (b−) = f (b). Mit Satz 8.5 folgt f ∈ R([a, b]). Ist f monoton, so benutze Satz 6.11.
8.2 Der Hauptsatz der Differential- und Integralrechnung Satz 8.7. Sei f ∈ R([a, b]). F¨ur x ∈ [a, b] setze
F(x) :=
( x a
f (t) dt.
Dann ist F : [a, b] → IK gleichm¨aßig stetig. Ist f stetig in x0 ∈ [a, b], so ist F im Punkt x0 differenzierbar, und es gilt F (x0 ) = f (x0 ) . Beweis. Falls f die Nullfunktion ist, ist nichts zu zeigen. Andernfalls ist f > 0 und f¨ur a ≤ x < y ≤ b folgt mit Satz 8.3(4) sowie Satz 8.4
( y
|F(y) − F(x)| =
f (t) dt
≤ f (y − x) . x
Zu > 0 w¨ahlt man =
f
und sieht, dass F gleichm¨aßig stetig ist.
Sei nun f stetig in x0 . Zu beliebigem > 0 gibt es > 0 mit | f (t) − f (x0 )| < f¨ur alle t ∈ ]x0 − , x0 + [ ∩ [a, b]. F¨ur solche t mit t = x0 gilt dann
( t
F(t) − F(x0 )
1 (t
1
− f (x0 ) =
f (s) ds − f (x0 ) ds
t − x0 t − x0 x0 t − x0 x0
( t
1
=
( f (s) − f (x0 )) ds
< . t − x0 x0 Daraus folgt F (x0 ) = f (x0 ).
Der folgende Satz zeigt uns, wie die meisten Integrale zu l¨osen sind, n¨amlich u¨ ber Stammfunktionen, vgl. Definition 7.12. Man nennt diesen zusammen mit Satz 8.7 auch Hauptsatz der Differential- und Integralrechnung, da Differenzieren und Integrieren in Beziehung gesetzt werden. Satz 8.8. Ist f ∈ R([a, b]) und existiert eine differenzierbare Funktion F : [a, b] → IK mit F (x) = f (x) f¨ur alle x ∈ [a, b], so gilt ( b a
f (x) dx = F(b) − F(a) .
120
8 Integration
1 Beweis. Sei m ∈ IN. Es gibt gm ∈ T ([a, b]) mit f − gm < m(b−a) und dazu eine Teilung a = a0 < a1 < . . . < anm = b, sodass gm | ]ak−1 , ak [= ck f¨ur k = 1, . . . , nm . Da F differenzierbar ist, gibt es laut dem Mittelwertsatz (Satz 7.10) nun Punkte k ∈ ]ak−1 , ak [ mit F(ak ) − F(ak−1 ) = f (k ) (ak − ak−1). Damit haben wir
nm
nm nm
f (k ) (ak − ak−1 ) − ck (ak − ak−1) ≤ | f (k ) − ck | (ak − ak−1)
k=1
k=1 k=1
<
und andererseits Daraus folgt
nm
nm
k=1
k=1
nm 1 1 (ak − ak−1) = m(b − a) k=1 m
f (k ) (ak − ak−1) = (F(ak ) − F(ak−1 )) = F(b) − F(a).
1 nm
(F(b) − F(a)) − ck (ak − ak−1) < .
m k=1
Mit m → erhalten wir schließlich die Behauptung, da lim
m→
nm
ck (ak − ak−1) = lim
m→
k=1
( b a
gm (x)dx =
( b a
f (x)dx
(laut Definition des Integrals) ist.
Bemerkung: Wenn eine solche Stammfunktion F existiert, so ist sie bis auf eine additive Konstante eindeutig, siehe auch Bemerkung (3) zu Korollar 7.11. Setzt man in Satz 8.8 sogar f ∈ C([a, b]) voraus, so folgt die Behauptung sofort aus Satz 8.7, denn mit G(x) := ax f (t) dt gilt dann G (x) = f (x). Damit haben wir F (x) = G (x) f¨ur alle x ∈ [a, b] und folglich ist G − F eine Konstante. Wegen G(a) = 0 hat diese Konstante nun den Wert −F(a). Somit gilt G(x) = F(x) − F(a) und ab f (t) dt = G(b) = F(b) − F(a).
Mit Satz 8.8 hat man nun eine sehr praktische Methode, das Integral ab f (x) dx zu berechnen, vorausgesetzt man kennt eine Stammfunktion von f . Satz 8.7 sagt uns weiter, dass zumindest jedes stetige f eine Stammfunktion besitzt. Wir wollen noch einige Beispiele von Funktionen f angeben, f¨ur die wir bereits eine Stammfunktion F kennen. f (x) := xn
(1)
f : IR → IR,
(2)
f : ]0, [ → IR,
f (x) := xa
(3)
f : ]0, [ → IR,
f (x) :=
(n ∈ IN) ,
1 , x
F(x) =
(a ∈ IR, a = −1) , F(x) = ln x.
xn+1 . n+1 F(x) =
xa+1 . a+1
8.3 Methoden zur Berechnung von Integralen
121
(4)
f : IR → IR,
f (x) := ex ,
F(x) = ex .
(5)
f : IR → IR,
f (x) := sin x ,
F(x) = − cosx.
(6)
f : IR → IR,
f (x) := cos x ,
F(x) = sin x.
1 , F(x) = arctan x. 1 + x2 Schreibweise: Oft schreibt man f¨ur die Stammfunktionen von f einfach das Symbol
(7)
f : IR → IR,
f (x) :=
(
f (x) dx .
Man nennt dies das unbestimmte Integral von f . Nat¨urlich ist dieses auch nur bis auf eine additive Konstante festgelegt. b Weiter schreibt man auch F(x)|x=b x=a oder F(x)|a an Stelle von F(b) − F(a).
8.3 Methoden zur Berechnung von Integralen Satz 8.9 (Partielle Integration). Seien f , g ∈ R([a, b]), zu denen differenzierbare Funktionen F und G existieren mit F (x) = f (x) und G (x) = g(x) f¨ur alle x ∈ [a, b]. Dann gilt ( b a
F(x)g(x) dx = F(b)G(b) − F(a)G(a) −
( b a
f (x)G(x) dx .
Beweis. Durch H(x) := F(x)G(x) ist eine differenzierbare Funktion erkl¨art und die Produktregel liefert H (x) = f (x)G(x) + F(x)g(x). Man beachte weiter, dass H eine Regelfunktion ist (dies folgt etwa mit Satz 8.5). Mit Satz 8.8 erhalten wir nun F(b)G(b) − F(a)G(a) = H(b) − H(a) = =
( b a
( b a
H (x) dx f (x)G(x) dx +
( b a
F(x)g(x) dx
wie behauptet. Beispiel: Seien 0 < a < b. Wir berechnen das Integral
( b a
ln x dx.
Dazu setzen wir F(x) = ln x und g(x) = 1. Dann gilt f (x) = 1x und als Stammfunktion zu g w¨ahlen wir G(x) = x. Mittels partieller Integration erhalten wir ( b a
ln x dx = b ln b − a ln a −
( b a
1 dx = b ln b − b − (a ln a − a) .
122
8 Integration
Damit haben wir auch gleich eine Stammfunktion des Logarithmus gefunden: Die Funktion L : ]0, [ → IR, L(x) := x ln x − x, ist differenzierbar mit L (x) = ln x, oder, als unbestimmtes Integral geschrieben, (
ln x dx = x ln x − x .
Als weitere Anwendung der partiellen Integration leiten wir eine Rekursionsformel zur Berechnung von (
(
cosn x dx
und
sinn x dx
her. (Hier steht wie u¨ blich cosn x als Abk¨urzung f¨ur (cos x)n , entsprechend bei sin.) Mit F(x) = cosn−1 x und G(x) = sin x in Satz 8.9 erhalten wir (
cosn x dx = cosn−1 x sin x + (n − 1) = cosn−1 x sin x + (n − 1) (
und daraus n
( (
cosn−2 x sin2 x dx cosn−2 x (1 − cos2 x) dx
cosn x dx = cosn−1 x sin x + (n − 1) (
Analog zeigt man auch n
(
cosn−2 x dx.
sinn x dx = − sinn−1 x cos x+ (n − 1)
(
Mit den Grenzen a = 0 und b = 2 ergibt sich nun f¨ur die durch cn := erkl¨arte Folge (cn )n∈IN die folgende Rekursionsformel: 2n c2n = 2n
( /2 0
cos2n x dx = (2n − 1)
( /2 0
sinn−2 x dx. /2 0
cosn dx
cos2n−2 x dx = (2n − 1)c2n−2 .
Also haben wir c2n =
2n − 1 2n − 1 2n − 3 1 c2n−2 = ··· 2n 2n 2n − 2 2
( /2 0
1 dx =
2n − 1 2n − 3 1 ··· . 2n 2n − 2 2 2
Ebenso gilt auch (2n + 1)c2n+1 = 2n c2n−1 und folglich c2n+1 =
2n 2n − 2 2 ··· 2n + 1 2n − 1 3
( /2 0
cos x dx =
2n 2n − 2 2 ··· . 2n + 1 2n − 1 3
Dies wollen wir nun noch benutzen, um das Wallissche Produkt zu berechnen. In Beispiel 3.9 haben wir die Folge (pn )n∈IN mit n
2k 2k −1 k=1
pn = pn √ n→ n
untersucht. Wir zeigen noch, dass lim
=
√
gilt.
8.3 Methoden zur Berechnung von Integralen
123
& ' Zun¨achst erhalten wir aus cos2n x ≥ cos2n+1 x ≥ cos2n+2 x f¨ur x ∈ 0, 2 , dass (cn )n∈IN monoton fallend ist, und weiter 1≥
c2n+1 c2n+2 2n + 1 →1 ≥ = c2n c2n 2n + 2
mit n → ,
c2n+1 = 1. c2n Andererseits folgt aus den Gleichungen (3.1) und (3.2), dass
also gilt lim
n→
lim
n→
mit einer Zahl
p2n 2 = 2n + 1 2
√ 2 ≤ ≤ 2 ist. Wegen 1 lim √ n→ n
c2n+1 p2n = ergibt sich 2 = , also 2n + 1 2 c2n n
2k
2k − 1 =
√ .
k=1
Der n¨achste Satz liefert uns noch ein weiteres n¨utzliches Hilfsmittel zu Berechnung von Integralen. Satz 8.10 (Substitutionsregel). Seien f : [A, B] → IK stetig und : [a, b] → [A, B] stetig differenzierbar. Dann gilt ( b a
f ( (y)) (y) dy =
( (b) (a)
f (x) dx .
Beweis. Die stetige Funktion f besitzt laut Satz 8.7 eine Stammfunktion F. Nun ist F ◦ differenzierbar; die Kettenregel (Satz 7.4) liefert (F ◦ ) (y) = f ( (y)) (y). Nach Voraussetzung ist stetig. Damit ist y → f ( (y)) (y) insbesondere eine Regelfunktion und mit Satz 8.8 ergibt sich ( b a
f ( (y)) (y) dy = F( (b)) − F( (a)) =
( (b) (a)
f (x) dx
wie behauptet. Beispiele: (1)
Die Funktion : IR → IR, ' (y)& := sin(y), ist stetig differenzierbar mit (y) = cos(y) und es gilt 0, 2 = [0, 1]. Damit ist ( 1 0
1 − x2 dx =
( ( /2) (0)
1 − x2 dx = =
( /2 0
( /2 0
1 − sin2 y cosy dy
cos2 y dy = c2 =
. 4
124
(2)
8 Integration
Das Integral
( 2 0
sin
√ x dx.
Wir setzen : IR → IR, (y) := y2 . Die Abbildung ist stetig differenzierbar und bildet das Intervall [0, ] auf [0, 2 ] ab. Weiter gilt (y) = 2y und damit ( 2 0
(
√ sin x dx =
( )
(0)
(
√ sin x dx =
=
sin
0
(
(y) (y) dy
2y sin y dy .
0
Mit Hilfe partieller Integration erhalten wir schließlich (
(
2y sin y dy = 2y(− cosy) − 2(− cosy) dy 0
0
0
= −2 cos + 0 cos 0 + 2 sin − 2 sin 0 = 2 .
8.4 Uneigentliche Integrale Definition 8.11. Eine Funktion f : ] , [ → IR, die auf jedem Intervall [a, b] ⊆ ] , [ integrierbar ist, heißt uneigentlich integrierbar, wenn f¨ur ein (und damit f¨ur jedes) c ∈ ] , [ die Grenzwerte lim a↓
( c a
f (x) dx
und
lim
( b
b↑
c
f (x) dx
existieren. Man nennt dann (
f (x) dx := lim a↓
( c a
f (x) dx + lim b↑
( b c
f (x) dx
das uneigentliche Integral von f u¨ ber ] , [. Diese Definition gilt sinngem¨aß auch in den F¨allen = − und = . Ist f auch auf dem abgeschlossenen Intervall [ , ] integrierbar, so stimmt das uneigentliche Integral nat¨urlich mit dem gew¨ohnlichen Integral u¨ berein. Dies folgt direkt mit Satz 8.7. Beispiele: (1)
(
1 dx. 2 − 1 + x Eine Stammfunktion zu x →
Das Integral
lim
( 0
a→− a
1 dx+ lim b→ 1 + x2
( b 0
1 1+x2
kennen wir bereits. Es gilt
1 dx = lim (− arctan a)+ lim arctan b = . a→− b→ 1 + x2
8.5 Aufgaben
(2)
125
Das Integral
( 0 −
ex dx.
Hier gen¨ugt es, den Grenzwert f¨ur a → − zu betrachten, denn die Exponentialfunktion ist auf jedem Intervall [a, 0] stetig und damit dort auch integrierbar. Wir erhalten ( 0 −
(3)
Das Integral
ex dx = lim
a→− a
( 1 1
ex dx = lim (e0 − ea ) = 1 . a→−
(s > 0).
dx
xs
0
( 0
F¨ur a ∈]0, 1[ gilt ( 1 1 a
xs
dx =
( 1 a
⎧
1 1 ⎨ −s+1 x−s+1 a , falls s = 1 , −s x dx =
1 ⎩ ln(x) a , falls s = 1 .
Im Fall s = 1 existiert das Integral nicht, denn es ist lim ln(a) = −. a↓0
Im Fall s > 1 ist lim a−s+1 = , also existiert das Integral hier ebenfalls nicht. a↓0
Gilt 0 < s < 1, so ist −s + 1 > 0 und wir haben lim a−s+1 = 0, also a↓0
( 1 1 0
xs
dx = lim a↓0
( 1 1 a
xs
1 −s+1 1 1 . − a−s+1 = −s + 1 1−s
dx = lim a↓0
8.5 Aufgaben 1. Berechnen Sie die folgenden Integrale. a. d. 2.
( /4 0
( 2 1
cos(3x − ) dx
ln x dx
b. e.
( 4 2 x − 3x + 4
√ x
1
( 1 0
x ex dx
dx
c. f.
( 3 0
( 1 0
x2 √ dx 1 + x2 x dx x+1
a. Sei g : [a, b] → IR differenzierbar mit g(x) = 0 ∀x ∈ [a, b]. Zeigen Sie: Es gilt
( b
g(b)
g (x)
. dx = ln
g(a)
a g(x) b. Berechnen Sie
( /2 cosx − sin x 0
cosx + sin x
dx.
c. Bestimmen Sie eine Stammfunktion von f : IR → IR, f (x) :=
2x . x2 +1
126
8 Integration
( 2
3. Seien m, n ∈ ZZ. Zeigen Sie: Es gilt
4. Zeigen Sie: F¨ur s > 1 gilt
( 1 1
0
dx =
xs
einx e−imx dx =
2
f¨ur m = n ,
0
f¨ur m = n .
1 . 1−s
5. Begr¨unden Sie, warum der Grenzwert lim
( a
a→
−a
sin x dx
existiert, nicht aber das uneigentliche Integral ( −
sin x dx .
6. Pr¨ufen Sie, ob die folgenden uneigentlichen Integrale existieren und berechnen Sie gegebenenfalls deren Wert. a. 7.
( 1
1 √ dx −1 1 − x2
( 1
b.
0
ln x dx
c.
( 0
ln x dx
a. Zeigen Sie, dass (R([a, b]), · ) ein Banachraum ist. b. Sei nun ( fn )n∈IN eine Folge, die in (R([a, b]), · ) gegen f konvergiert. Zeigen Sie: Es gilt lim
( b
n→
a
fn (x) dx =
( b a
f (x) dx .
c. Konstruieren Sie eine Folge ( fn )n∈IN in R([0, 1]), welche punktweise gegen f ∈ R([0, 1]) konvergiert, d.h. lim fn (x) = f (x) ∀x ∈ [0, 1], aber dass n→
lim
( 1
n→
0
fn (x) dx =
( 1 0
f (x) dx
gilt. 8. Zeigen Sie, dass f : [0, 1] → IR , keine Regelfunktion ist.
f (x) :=
1 f¨ur x ∈ Q , 0 f¨ur x ∈ / Q,
8.5 Aufgaben
127
9. Zeigen Sie: Ist f : [a, b] → C eine stetige Funktion mit ( b a
| f (x)| dx = 0 ,
so gilt f (x) = 0 f¨ur alle x ∈ [a, b]. 10. Die so genannte Gammafunktion wird wie folgt erkl¨art:
: ]0, [ → IR ,
(x) :=
( 0
t x−1 e−t dt .
a. Zeigen Sie, dass dieses uneigentliche Integral existiert. Hinweis: F¨ur 0 ≤ t < 1 gilt t x−1 e−t ≤ t x−1 . Weiter existiert eine positive Zahl c mit t x−1 ≤ c e−t/2 f¨ur t ≥ 1. b. Zeigen Sie c. Folgern Sie
(x + 1) = x (x) (n + 1) = n!
f¨ur alle x ∈ ]0, [ . f¨ur alle n ∈ IN .
This page intentionally left blank
Kapitel 9
Funktionenfolgen und gleichm¨aßige Konvergenz
Wir wollen eine Problemstellung bez¨uglich Folgen von Funktionen zun¨achst an Hand von einigen Beispielen er¨ortern. (1)
(2)
sin(nx) √ . n Offensichtlich existiert eine Grenzfunktion f (x) := lim fn (x) = 0. n→ √ Weiter ist auch jedes fn differenzierbar mit fn (x) = n cos(nx). Andererseits gilt f (x) = 0. Somit konvergiert fn keinesfalls gegen f . F¨ur n ∈ IN sei fn : IR → IR, fn (x) :=
Sei fn : [0, 1] → IR, fn (x) := n2 x(1 − x2 )n . Hier haben wir fn (0) = 0 = fn (1) f¨ur alle n ∈ IN und f¨ur x ∈ ]0, 1[ gilt lim fn (x) = 0. Hingegen gilt n→
( 1 0
und folglich
x(1 − x2)n dx =
( 1 0
fn (x) dx = n2
Somit konvergiert (3)
( 1
( 1 0
1 1 yn+1
1 = 2 n + 1 0 2n + 2
yn dy =
1 → . 2n + 2 (
fn (x) dx nicht gegen
1
lim fn (x) dx = 0.
0 n→
Setzt man gn (x) := nx(1 − x2)n , so gilt lim
n→
(4)
0
1 2
( 1 0
gn (x) dx =
1 = 2
( 1
lim gn (x) dx = 0 .
0 n→
F¨ur n ∈ IN sei fn (x) :=
1 , falls x = 0 , sonst.
k n!
f¨ur ein k ∈ ZZ ,
Damit ist fn | [0, 1] laut Definition 8.1 eine Treppenfunktion und folglich auch integrierbar.
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_9, © Springer-Verlag Berlin Heidelberg 2012
129
130
9 Funktionenfolgen und gleichm¨aßige Konvergenz
Als Grenzfunktion f (x) := lim fn (x) ergibt sich n→
f (x) =
1 , falls x ∈ Q , 0 , falls x ∈ IR \ Q ,
denn f¨ur x ∈ IR \ Q gilt fn (x) = 0 f¨ur alle n ∈ IN; ist x ∈ Q, etwa x = qp mit p ∈ ZZ, q ∈ IN, so haben wir f¨ur n ≥ q auch n! x ∈ ZZ, also fn (x) = 1 ∀n ≥ q. Damit ist f | [0, 1] ∈ / R([0, 1]). An diesen Beispielen sehen wir, dass bei (punktweiser) Konvergenz von Folgen ( fn (x))n∈IN die Differentiation oder Integration mit der Limesbildung nicht vertauscht werden d¨urfen. Das letzte Beispiel zeigt sogar, dass f¨ur die Grenzfunktion das Integral gar nicht gebildet werden kann. Mit anderen Worten: R([a, b]) ist nicht abgeschlossen unter punktweiser Konvergenz.
9.1 Gleichm¨aßige Konvergenz Wir kennen inzwischen einen Konvergenzbegriff f¨ur beschr¨ankte Funktionen. Ist M eine Menge, so ist der Raum (B(M), · ) der beschr¨ankten Funktionen mit der durch f = sup | f (x)| erkl¨arten Norm ein Banachraum und es gilt x∈M
·
fn −→ f ⇐⇒ sup | fn (x) − f (x)| → 0 , x∈M
vgl. auch Satz 4.9. St¨orend ist hierbei noch, dass wir prinzipiell nur beschr¨ankte Funktionen betrachten k¨onnen. Definition 9.1. Sei M eine Menge. Eine Folge ( fn )n∈IN von Funktionen fn : M → IK heißt gleichm¨aßig konvergent gegen f : M → IK, falls gilt: Zu jedem > 0 existiert ein N ∈ IN mit | fn (x) − f (x)| <
f¨ur alle n ≥ N und alle x ∈ M .
Letzteres ist a¨ quivalent zu sup | fn (x) − f (x)| → 0 mit n → . x∈M
Wir schreiben: fn → f gleichm¨aßig auf M. Sind f und alle fn beschr¨ankt, so gilt fn → f gleichm¨aßig auf M genau dann, wenn fn → f bez¨uglich · gilt. Der folgende Satz behandelt gleichm¨aßige Konvergenz und Stetigkeit. Satz 9.2. Seien (M, d) ein metrischer Raum und ( fn )n∈IN eine Folge von Funktionen fn : M → IK, die gleichm¨aßig auf M gegen f : M → IK konvergiert. Sind alle fn in einem Punkt a ∈ M stetig, so ist auch f stetig in a.
9.1 Gleichm¨aßige Konvergenz
131
Beweis. Sei > 0. Auf Grund der gleichm¨aßigen Konvergenz gibt es ein N ∈ IN mit | fn (x) − f (x)| < 3 f¨ur alle x ∈ M und alle n ≥ N. Wegen der Stetigkeit von fN in a gibt es > 0 derart, dass | fN (x) − fN (a)| < 3 f¨ur alle x ∈ M mit d(x, a) < gilt. Die Grenzfunktion f erf¨ullt dann | f (x) − f (a)| ≤ | f (x) − fN (x)| + | fN (x) − fN (a)| + | fN (a) − f (a)| < f¨ur alle x ∈ M mit d(x, a) < . Folglich ist f stetig in a.
Bemerkung: Es muss nicht notwendigerweise gleichm¨aßige Konvergenz vorliegen, damit eine punktweise Grenzfunktion stetiger Funktionen stetig ist. Die Folge von Beispiel (2) konvergiert gegen die stetige Nullfunktion. aber nicht Sie konvergiert
n 1 n 1 3/2 gleichm¨aßig, denn wegen 1 − n → exp(−1) gilt fn √n = n 1 − 1n → . Demnach haben wir hier sogar fn − 0 → . Der Raum C([a, b]) der stetigen Funktionen f : [a, b] → IK ist ein Untervektorraum des normierten Raumes (B([a, b]), · ), da jede auf [a, b] stetige IK-wertige Funktion beschr¨ankt ist, vgl. Satz 6.16. Korollar 9.3. Der Raum (C([a, b]), · ) ist ein Banachraum. Beweis. Zu zeigen bleibt nur die Vollst¨andigkeit. Sei ( fn )n∈IN eine Cauchyfolge bez¨uglich · in C([a, b]). Dann ist diese auch Cauchyfolge in B([a, b]) und konvergiert, da (B([a, b]), · ) ein Banachraum ist (siehe Satz 4.9), gegen eine Funktion f ∈ B([a, b]). Weiter folgt nun mit Satz 9.2, dass f ∈ C([a, b]) ist. Also ist (C([a, b]), · ) ein Banachraum wie behauptet.
Das n¨achste Resultat behandelt gleichm¨aßige Konvergenz und Integration. Satz 9.4. Sei ( fn )n∈IN eine Folge in R([a, b]), die gleichm¨aßig gegen eine Funktion f : [a, b] → IK konvergiert. Dann ist f ∈ R([a, b]) und es gilt ( b a
f (x) dx = lim
n→
( Insbesondere ist auch die Folge
( b
a
b
a
fn (x) dx .
fn (x) dx
konvergent. n∈IN
Beweis. Zu > 0 gibt es nach Definition der Regelfunktionen f¨ur jedes n ∈ IN eine Treppenfunktion gn : [a, b] → IK mit gn − fn < 2 . Nach Voraussetzung gibt es ein N ∈ IN mit fn − f < 2 f¨ur alle n ≥ N. Damit haben wir gn − f ≤ gn − fn + fn − f < f¨ur alle n ≥ N.
132
9 Funktionenfolgen und gleichm¨aßige Konvergenz
Folglich gilt gn → f bez¨uglich der · -Norm, also gleichm¨aßig auf [a, b]. Mit anderen Worten: Die Funktion f ist durch Treppenfunktionen approximierbar und somit eine Regelfunktion. F¨ur das Integral gilt mit Satz 8.3 (4) nun
( b
( b
( b
f (x) dx − fn (x) dx = ( f (x) − fn (x)) dx
≤ f − fn (b − a)
a
a
a
und mit n → folgt die Behauptung.
Die Aussage von Satz 9.4 beinhaltet auch, dass (R([a, b]), · ) ein Banachraum ist, vgl. auch Bemerkung (2) zu Definition 8.2. Wir notieren noch eine unmittelbare Folgerung. Korollar 9.5. Sei ( fn )n∈IN eine Folge in R([a, b]) derart, dass die Reihe f (x) =
fn (x)
n=1 N
N→
gleichm¨aßig auf [a, b] konvergiert, d.h. fn (x) −→ f (x) gleichm¨aßig auf [a, b]. Dann ist f ∈ R([a, b]) und es gilt
(
n=1 b
a
f (x) dx =
( b
n=1
a
fn (x) dx.
Nun wenden wir uns den Beziehungen zwischen gleichm¨aßiger Konvergenz und Differentiation zu. An Hand von Beispiel (1) sehen wir, dass gleichm¨aßige Konvergenz es nicht immer erm¨oglicht, Differentiation und Grenzwert zu vertauschen. Satz 9.6. Sei ( fn )n∈IN eine Folge stetig differenzierbarer Funktionen fn : [a, b] → IK, die punktweise gegen eine Funktion f : [a, b] → IK konvergiert. Weiter konvergiere die Folge ( fn )n∈IN der Ableitungen gleichm¨aßig auf [a, b]. Dann ist f differenzierbar und es gilt f (x) = lim fn (x) n→
f¨ur alle x ∈ [a, b] .
Beweis. Setze g(x) := lim fn (x). Nach Satz 9.2 ist g : [a, b] → IK stetig. n→
Laut dem Hauptsatz der Differential- und Integralrechnung gilt fn (x) = fn (a) + Satz 9.4 liefert
( x a
( x a
fn (t) dt
n→
fn (t) dt −→
( x a
f¨ur alle x ∈ [a, b] und alle n ∈ IN .
g(t) dt; damit ist f (x) = f (a) +
Durch Differentiation erhalten wir schließlich f (x) = g(x).
( x a
g(t) dt.
9.2 Differentiation und Integration von Potenzreihen
133
9.2 Differentiation und Integration von Potenzreihen In Kapitel 5.4 haben wir Potenzreihen eingef¨uhrt und untersucht; in Korollar 6.6 haben wir die Stetigkeit einer Potenzreihe im Inneren des Konvergenzkreises hergeleitet, und zwar mittels eines Satzes u¨ ber Majoranten (Satz 6.5). Zur Differentiation von Potenzreihen ben¨otigen wir ein Resultat zur gleichm¨aßigen Konvergenz, um Satz 9.6 anwenden zu k¨onnen. Satz 9.7. Seien M eine Menge und fk : M → IK beschr¨ankte Funktionen (k ∈ IN) mit
fk M := sup | fk (x)|. Weiter gelte fk M < . x∈M
Dann konvergiert die Reihe
k=1 fk k=1
absolut und gleichm¨aßig auf M gegen eine
beschr¨ankte Funktion f : M → IK mit f M ≤ fk M . k=1
Beweis. Wie im Beweis von Satz 6.5 gilt, dass f (x) := fk (x) wohldefiniert ist; k=1
die Reihe konvergiert absolut in jedem x ∈ M mit | f (x)| ≤
k=1
k=1
| fk (x)| ≤ fk M .
Also ist f M ≤ fk M . Zu zeigen bleibt die gleichm¨aßige Konvergenz. k=1
n
Dazu betrachten wir die Partialsummen sn (x) := fk (x). Zu > 0 existiert N ∈ IN, sodass
k=1
fk M < f¨ur alle n ≥ N gilt.
k=n+1
F¨ur alle x ∈ M und n ≥ N ist dann
|sn (x) − f (x)| = fk (x) ≤ | fk (x)| ≤ fk M < .
k=n+1
k=n+1 k=n+1 Daher konvergiert (sn )n∈IN gleichm¨aßig gegen f . Anwendung: Durch f (x) :=
1
n2 + x2 ist eine stetige Funktion f : IR → IR erkl¨art.
n=1
Beweis. F¨ur n ∈ IN betrachte fn : IR → IR, fn (x) :=
Da
n=1
1 n2
1 . n2 +x2
Es gilt sup | fn (x)| = x∈IR
1 . n2
konvergent ist, folgt mit Satz 9.7 gleichm¨aßige Konvergenz von fn (x).
Weiter ist jedes fn stetig; mit Satz 9.2 folgt jetzt die Stetigkeit von f .
n=1
Wir wollen nun den vorangehenden Satz in Zusammenhang mit Potenzreihen stellen. F¨ur z0 ∈ C und ≥ 0 bezeichne wie u¨ blich K (z0 ) = {z ∈ C : |z − z0 | ≤ } die abgeschlossene Kreisscheibe mit Mittelpunkt z0 und Radius .
134
9 Funktionenfolgen und gleichm¨aßige Konvergenz
Satz 9.8. Sei ck zk eine Potenzreihe mit Konvergenzradius R > 0. k=0
Weiter sei 0 < < R. Dann konvergiert die Potenzreihe absolut und gleichm¨aßig auf K (0).
Die Reihe k ck zk−1 konvergiert ebenfalls absolut und gleichm¨aßig auf K (0). k=1
Insbesondere ist die Funktion f : ] − R, R[ → IK, f (x) := ck xk , differenzierbar mit k=0
f (x) =
k ck xk−1 .
k=1
Mehr noch, f ist beliebig oft differenzierbar mit f (n) (x) =
k(k − 1) · · · (k − n + 1) ck xk−n .
k=n
Beweis. Betrachte fk (z) := ck zk . F¨ur |z| ≤ gilt | fk (z)| ≤ |ck k |. Damit erhalten wir fk K (0) ≤ |ck k |. Wegen < R ist die Reihe
ck k
k=0
absolut konvergent, siehe Satz 5.19.
Mit Satz 9.7 folgt die gleichm¨aßige Konvergenz von ck zk auf K (0). Aus
√ k
k=0
k → 1 folgt lim sup k k|ck | = lim sup k |ck | = R1 . Die Reihe k→
k→
k ck zk−1
k=1
hat also ebenfalls den Konvergenzradius R. Mit der gleichen Argumentation wie eben erh¨alt man, dass auch diese gleichm¨aßig auf K (0) konvergiert. F¨ur die Aussagen zu den Ableitungen w¨ahlen wir zu x ∈ ]− R, R[ eine Zahl > 0 mit |x| < < R. Fasst man die Partialsummen sn (x) :=
n
ck xk
k=0
als Funktionen sn : [− , ] → IK auf, so erh¨alt man die Behauptung zu f nun mit Satz 9.6. Durch Wiederholung dieser Beweisf¨uhrung folgt schließlich auch die allgemeine Behauptung.
9.2 Differentiation und Integration von Potenzreihen
135
Bemerkung: Eine Potenzreihe mit Konvergenzradius R konvergiert zwar gleichm¨aßig auf jeder abgeschlossenen Kreisscheibe K (0) mit 0 < < R, aber eventuell nicht gleichm¨aßig auf der offenen Kreisscheibe UR (0) = {z ∈ C : |z| < R}. Auch ist mit Satz 9.8 keine allgemeine Aussage u¨ ber Konvergenz oder Divergenz auf dem Rand des Konvergenzkreises, also f¨ur diejenigen z mit |z| = R, m¨oglich. Das Konvergenzverhalten f¨ur |z| = R der urspr¨unglichen und der differenzierten Reihe kann verschieden sein, wie etwa das Beispiel zu Beginn von Kapitel 10.3 zeigt. Satz 9.8 beinhaltet speziell f (n) (0) = n! cn
∀n ∈ IN0
(9.1)
(dabei sei f (0) := f ). Diese Formel ist bemerkenswert: Man erh¨alt die Koeffizienten der Potenzreihe von f durch Ableitungen f (n) an einer einzigen Stelle. Umgekehrt lassen sich die Ableitungen an dieser Stelle direkt aus den Koeffizienten bestimmen. Man beachte aber, dass es Funktionen f gibt, die beliebig oft differenzierbar
sind, bildet man jedoch die Potenzreihe cn zn mit cn = n=0
f (n) (0) n!
gem¨aß (9.1), so
konvergiert diese Reihe f¨ur kein z = 0 gegen f (z). Eine solche werden wir in Kapitel 10.1, Beispiel (2) finden.
Korollar 9.9. Sei ck zk eine Potenzreihe mit Konvergenzradius R > 0. k=0
Dann ist die Funktion F : ] − R, R[ → IK ,
F(x) :=
k=0
ck k+1 x , k+1
differenzierbar mit F (x) = ck xk . k=0
ck
= lim sup k |ck | = Beweis. Wegen lim sup k k+1 k→
k→
k=0
1 R
hat auch die Reihe
ck k+1 z k+1
den Konvergenzradius R. Die Behauptung folgt direkt mit Satz 9.8.
Beispiel: Die Potenzreihenentwicklung des Arcus-Tangens. Wir wissen bereits aus Kapitel 7.3, Beispiel (2), dass arctan differenzierbar ist mit 1 arctan (x) = 1+x 2. F¨ur |x| < 1 gilt weiter
1 1+x2
k=0
k=0
= (−x2 )k = (−1)k x2k (Geometrische Reihe).
Eine Stammfunktion dieser Reihe erhalten wir laut Korollar 9.9 durch F : ] − 1, 1[ → IR ,
F(x) :=
k=0
(−1)k 2k+1 x . 2k + 1
136
9 Funktionenfolgen und gleichm¨aßige Konvergenz
Folglich gilt F (x) = arctan (x) f¨ur |x| < 1 und damit arctanx = F(x) + c mit einem noch zu bestimmenden c. Einsetzen von etwa x = 0 liefert schließlich c = 0. Also haben wir arctan x = F(x), zun¨achst f¨ur x ∈ ] − 1, 1[. Die Reihe F(x) konvergiert laut Leibniz-Kriterium allerdings auch f¨ur x = ±1. Wir wollen noch zeigen, dass ihr Wert auch dort mit dem Arcus-Tangens u¨ bereinstimmt. F¨ur x ∈ ] − 1, 1[ gilt (vgl. auch Kapitel 5.7, Aufgabe 6) die Absch¨atzung
n (−1)k 2k+1
|x|2n+3
x .
arctan(x) −
≤
2n + 3 k=0 2k + 1 Wegen der Stetigkeit aller beteiligten Ausdr¨ucke gilt dies auch f¨ur x = ±1, also
n (−1)k
1
.
arctan(1) −
≤
2n + 3 k=0 2k + 1 Grenzwertbildung n → liefert die Behauptung. Insgesamt haben wir damit arctan(x) =
k=0
Insbesondere gilt
(−1)k 2k+1 x 2k + 1
f¨ur x ∈ [−1, 1] .
(−1)k 1 1 1 = arctan(1) = = 1 − + − ± ··· 4 2k + 1 3 5 7 k=0
9.3 Der Approximationssatz von Weierstraß Wie wir gezeigt haben, kann jede Potenzreihe mit Konvergenzradius R > 0 auf abgeschlossenen Intervallen [− , ] mit 0 < < R gleichm¨aßig durch eine Folge von Polynomen, n¨amlich den Partialsummen der Reihe, approximiert werden. Wir wollen nun den Weierstraßschen Approximationssatz herleiten, der besagt, dass sogar jede auf einem Intervall [a, b] stetige IK-wertige Funktion der Grenzwert einer gleichm¨aßig konvergenten Folge von Polynomen ist. Dazu betrachten wir das so genannte n-te Bernsteinpolynom zu einer Funktion f : [0, 1] → IK, welches wie folgt definiert ist: n n k k Bn (t; f ) := f t (1 − t)n−k . n k k=0 Unser Ziel ist, zu zeigen, dass f¨ur f ∈ C([0, 1]) stets Bn (·; f ) − f = sup |Bn (t; f ) − f (t)| → 0 t∈[0,1]
mit n → gilt.
9.3 Der Approximationssatz von Weierstraß
137
Zun¨achst bestimmen wir Bn (t; f j ) f¨ur f j (t) := t j , j = 0, 1, 2. Es gilt
n k t (1 − t)n−k = (t + (1 − t))n = 1 Bn (t; f0 ) = k k=0
und f¨ur n ≥ 1 erhalten wir mit nk nk = n−1 k−1 nun n
Bn (t; f1 ) =
n
k=0
=
k n
n n k n−1 k t (1 − t)n−k = t (1 − t)n−k k k − 1 k=1
n−1
k=0
(9.2)
n − 1 k+1 t (1 − t)n−(k+1) = t (t + (1 − t))n−1 = t . k
(9.3)
F¨ur n ≥ 2 haben wir schließlich n 2 n−1 k + 1 n − 1 k+1 k n k t (1 − t)n−(k+1) t (1 − t)n−k = Bn (t; f2 ) = n n k k k=0 k=0 1 = n = =
n−1 k n−1 k n − 1 k+1 n−1−k t (1 − t)n−1−k t (1 − t) + t n k k k=0
n−1
k=0
t t(n − 1) + n n
n−1
k=0
k n−1
n−1 k t (1 − t)n−1−k k
t(1 − t) 2 t t(n − 1) + t= +t . n n n
(9.4)
Weiter gilt Bn (t; f + g) = Bn (t; f ) + Bn (t; g) sowie Bn (t; f ) = Bn (t; f ) f¨ur ∈ IK und f , g : [0, 1] → IK. Falls f und g reellwertige Funktionen sind mit f ≤ g, so ist auch Bn (t; f ) ≤ Bn (t; g). Satz 9.10 (Weierstraßscher Approximationssatz). Sei f ∈ C([a, b]). Es existiert eine Folge von Polynomen (Pn )n∈IN derart, dass lim Pn − f = 0
n→
gilt. Ist f reellwertig, so k¨onnen die Pn reell gew¨ahlt werden. F¨ur a = 0 und b = 1 kann man Pn (t) = Bn (t; f ) w¨ahlen. Beweis. Wir k¨onnen [a, b] = [0, 1] annehmen. Die allgemeine Aussage folgt dann, t−a indem wir f b−a betrachten. Sei also f ∈ C([0, 1]). Da f nach Satz 6.18 gleichm¨aßig stetig ist, gibt es zu beliebigem √ > 0 ein > 0 derart, dass | f (s) − f (t)| < f¨ur alle s,t ∈ [0, 1] mit |s − t| < gilt.
138
9 Funktionenfolgen und gleichm¨aßige Konvergenz
Sei :=
2 f .
Als n¨achstes zeigen wir
| f (s) − f (t)| ≤ + (s − t)2
f¨ur alle s,t ∈ [0, 1] .
(9.5)
Im Fall |s − t| < gilt dies wegen der speziellen Wahl von ; andernfalls ist
+ (s − t)2 ≥ + = + 2 f > | f (s)| + | f (t)| ≥ | f (s) − f (t)| . Damit ist (9.5) bewiesen. Wir betrachten die Funktion gs : [0, 1] → IR, gs (t) := (s − t)2 . Aus (9.5) erhalten wir − − gs ≤ f (s) − f ≤ + gs f¨ur alle s ∈ [0, 1]. Es folgt −Bn (· ; + gs ) = Bn (· ; − − gs ) ≤ Bn (· ; f (s) − f ) ≤ Bn (· ; + gs ) und weiter (9.2)
| f (s) − Bn (t; f )| = |Bn (t; f (s) − f )| ≤ Bn (t; + gs ) = + Bn (t; gs )
(9.3),(9.4)
2
+ s − 2 st +
=
t(1 − t) 2 +t n
f¨ur alle s,t ∈ [0, 1]. Setzt man s = t, so folgt t(1 − t) ≤+ n n
| f (t) − Bn (t; f )| ≤ +
f¨ur alle t ∈ [0, 1]. Mit n → folgt schließlich die Behauptung, da > 0 beliebig w¨ahlbar ist.
9.4 Aufgaben 1. Zeigen Sie, dass die mittels fn (x) := gleichm¨aßig auf IR konvergiert.
sin(nx) √ n
erkl¨arte Funktionenfolge ( fn )n∈IN
2. F¨ur x ∈ IR seien fn (x) :=
nx4 , 1 + nx2
2
gn (x) := e−nx
und
hn (x) :=
nx . 1 + n 2 x2
Untersuchen Sie, ob die Funktionenfolgen ( fn )n∈IN , (gn )n∈IN bzw. (hn )n∈IN gleichm¨aßig konvergent auf IR sind. 3. Seien I, J Intervalle und ( fn )n∈IN eine Folge von Funktionen fn : I → J, die gleichm¨aßig gegen f : I → J konvergiert. Weiter sei g : J → IR gleichm¨aßig stetig. Zeigen Sie, dass die Folge (g ◦ fn )n∈IN ebenfalls gleichm¨aßig konvergent ist.
9.4 Aufgaben
139
4. Untersuchen Sie, ob die gegebenen Funktionenfolgen (i) (ii) a. b. c.
5.
gleichm¨aßig konvergent sind, einen stetigen Grenzwert haben. fn : [0, 1] → IR, fn (x) := xn , ' & gn : 0, 12 → IR, gn (x) := xn ,
1
hn : [0, 1] → IR, ⎧ 1 2nx , f¨ur 0 ≤ x ≤ 2n , ⎪ ⎪ ⎨ 1 1 hn (x) := 2 − 2nx , f¨ur 2n < x ≤ n , ⎪ ⎪ ⎩ 0, sonst .
1 n
1
Die Abbildung zeigt den Graph der Funktion hn .
a. Zeigen Sie, dass durch f (x) :=
1
(n + x)2
n=1
f¨ur x ≥ 0
eine stetige Funktion f : [0, [ → IR erkl¨art ist. b. Begr¨unden Sie, dass f differenzierbar ist. c. Berechnen Sie
( 1 0
f (x) dx.
6. Eine Folge ( fn )n∈IN von Funktionen fn ∈ R([a, b]) heißt konvergent im quadratischen Mittel gegen f ∈ R([a, b]), falls lim
n→
( b a
| fn (x) − f (x)|2 dx = 0 .
a. Zeigen Sie: Wenn eine Folge ( fn )n∈IN von Regelfunktionen gleichm¨aßig auf [a, b] gegen f konvergiert, dann konvergiert die Folge auch im quadratischen Mittel gegen f . b. Geben Sie ein Beispiel einer Folge an, die im quadratischen Mittel aber nicht gleichm¨aßig konvergent ist. c. Zeigen Sie, dass mittels
( b a
f (x) g(x) dx
ein Skalarprodukt auf C([a, b]) definiert ist. Warum ist dies kein Skalarprodukt auf R([a, b]) ? Zeigen Sie ferner, dass C([a, b]) mit der durch dieses Skalarprodukt erkl¨arten Norm nicht vollst¨andig ist.
140
9 Funktionenfolgen und gleichm¨aßige Konvergenz
7. Der Integralsinus (oder Sinus Integralis) ist definiert durch Si : IR → IR , Zeigen Sie: F¨ur x ∈ IR gilt Si(x) =
Si(x) :=
k=0
( x sint 0
t
dt .
(−1)k x2k+1 . (2k + 1)! (2k + 1)
Kapitel 10
Taylorreihen
Aus der Gleichung (9.1) wissen wir, dass eine Funktion, die durch eine Potenzreihe dargestellt wird, durch die Werte ihrer Ableitungen an einem einzigen Punkt eindeutig bestimmt ist. Wir wollen uns nun u¨ berlegen, inwiefern man allgemein eine beliebig oft differenzierbare Funktion rekonstruieren kann, wenn man die Ableitungen an einer bestimmten Stelle kennt. Ist eine Funktion nur n-mal differenzierbar, so kann man sich immerhin fragen, ob man mit Kenntnis der Ableitungen an einer Stelle wenigstens in der Lage ist, diese Funktion n¨aherungsweise zu bestimmen. Dies f¨uhrt uns zu den so genannten Taylorpolynomen und Taylorreihen (Brook Taylor, 1685-1731, Cambridge).
10.1 Der Satz von Taylor Satz 10.1 (Taylor). Sei f : [a, b] → IK eine Funktion derart, dass f (n−1) stetig auf [a, b] ist und f (n) (t) f¨ur alle t ∈ ]a, b[ existiert. Ferner seien c, x ∈ [a, b], c = x. Dann existiert eine Zahl zwischen x und c mit f (x) =
n−1
k=0
f (k) (c) f (n) ( ) (x − c)k + (x − c)n . k! n!
Beweis. F¨ur t ∈ [a, b] bezeichne Tn−1 (t; f ) :=
n−1
k=0
f (k) (c) (t − c)k . k!
f (x) − Tn−1 (x; f ) Mit M := haben wir f (x) = Tn−1 (x; f ) + M (x − c)n . (x − c)n Es bleibt zu zeigen, dass n! M = f (n) ( ) f¨ur ein ∈ ]c, x[ bzw. ∈ ]x, c[ gilt. Die Funktion g : [a, b] → IK, g(t) := f (t) − Tn−1 (t; f ) − M (t − c)n , ist in ]a, b[ n-mal differenzierbar mit g(n) (t) = f (n) (t) − n! M . R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_10, © Springer-Verlag Berlin Heidelberg 2012
141
142
10 Taylorreihen
Somit ist nur noch zu zeigen, dass es zwischen x und c gibt mit g(n) ( ) = 0. (k)
F¨ur k = 0, . . . , n − 1 gilt Tn−1 (c; f ) = f (k) (c) und damit g(k) (c) = 0. Nach Wahl von M ist g(x) = 0; laut dem Mittelwertsatz gibt es ein x1 zwischen x und c mit g (x1 ) = 0. Mit dem Paar c, x1 folgt analog, dass ein x2 zwischen x1 und c existiert mit g (x2 ) = 0. Nach n Schritten kommt man zu einem xn zwischen xn−1 und c mit g(n) (xn ) = 0. Mit := xn folgt nun die Behauptung.
Bemerkung: F¨ur n = 1 ist der Satz von Taylor genau der Mittelwertsatz. f (n) ( ) (x − c)n in Satz 10.1 n! als Lagrange-Restglied (Joseph Louis Lagrange, 1736-1813, Berlin, Paris). Der Satz zeigt, dass f durch ein Polynom vom Grad n − 1 n¨aherungsweise beschrieben werden kann; eine m¨ogliche Fehlerabsch¨atzung erh¨alt man etwa, wenn man eine Schranke f¨ur | f (n) | kennt. Die Polynome
Man bezeichnet den letzten Summanden Rn (x) :=
Tn−1 (t; f ) :=
n−1
k=0
f (k) (c) (t − c)k k!
nennt man Taylorpolynome mit Entwicklungspunkt c. Ist f beliebig oft differenzierbar, so heißt f (k) (c) (t − c)k T f (t) := k! k=0 die Taylorreihe von f mit Entwicklungspunkt c. Ob die Taylorreihe von f mit f u¨ bereinstimmt, kann nur u¨ ber Absch¨atzung der Restglieder erfolgen. Versch¨arft man die Voraussetzung an f , so erh¨alt man ein Restglied in Integralform. Satz 10.2. Sei f : [a, b] → IK eine n-mal stetig differenzierbare Funktion. Ferner seien c, x ∈ [a, b]. Dann gilt ( x n−1 (k) f (c) 1 f (x) = (x − c)k + (x − t)n−1 f (n) (t) dt . k! (n − 1)! c k=0 Beweis. Bezeichne Rn (t) := f (t) − Tn−1(t; f ). (n) Dann ist Rn : [a, b] → IK auch n-mal stetig differenzierbar und Rn (t) = f (n) (t). (k) (k) Wegen Tn−1 (c; f ) = f (k) (c) gilt weiter Rn (c) = 0 f¨ur k = 0, . . . , n − 1. Mit partieller Integration erhalten wir ( x c
(x − t)n−1 f (n) (t) dt =
( x c
(n)
(x − t)n−1Rn (t) dt (n−1)
= (x − t)n−1 Rn = (n − 1)
( x c
( x
t=x
(n−1) (t) +(n − 1) (x − t)n−2Rn (t) dt t=c
(n−1)
(x − t)n−2Rn
c
(t) dt .
10.1 Der Satz von Taylor
143
Wiederholung der partiellen Integration f¨uhrt schließlich zu (n − 1)(n − 2) · · · 1
( x c
(x − t)0 Rn (t) dt = (n − 1)! (Rn (x) − Rn (c)) = (n − 1)! Rn (x) ,
womit die Behauptung bewiesen ist. Beispiele: (1)
Sei f : IR → IR, f (x) := exp(x). Mit c = 0 erhalten wir f¨ur beliebiges x = 0, da f (k) (0) = 1 ∀k ∈ IN ist,
n−1 k
x
f (n) ( ) n
e|x| |x|n
x ≤
f (x) − =
n! n! k=0 k! mit einem zwischen 0 und x. Damit kann man zeigen, dass e nicht rational ist: Angenommen, es gelte e = qp mit p, q ∈ IN. Dann folgt q! e ∈ IN und auch := q! (e − 1 − 1!1 − 2!1 − · · · − q!1 ) ∈ IN. Mit obiger Restgliedabsch¨atzung erhalten wir aber 0 < = q! Rq+1 (1) ≤ besondere ∈ / IN, ein Widerspruch!
e q! (q+1)!
=
e q+1
< 1. Daraus folgt ins-
T2 T1 Die Abbildung zeigt die Graphen der Exponentialfunktion sowie der Taylorpolynome T1 , T2 und T3 zum Entwicklungspunkt c = 0. Man erkennt, dass das Restglied, also die Differenz zwischen Taylorpolynom und Funktionswert, in der N¨ahe des Entwicklungspunktes klein ist, aber rasch w¨achst, wenn man sich vom Entwicklungspunkt entfernt.
(2)
Sei f : IR → IR,
f (x) :=
T3
exp(−1/x2)
f¨ur x = 0 ,
0
f¨ur x = 0 .
Wir werden sehen, dass f beliebig oft differenzierbar ist und f (n) (0) = 0 gilt f¨ur alle n ∈ IN0 . Damit ist die Taylorreihe von f mit Entwicklungspunkt c = 0 identisch 0, obwohl f nicht die Nullfunktion ist.
144
10 Taylorreihen
Es gilt sogar
f
(n)
(x) =
pn (1/x) exp(−1/x2)
f¨ur x = 0 ,
0
f¨ur x = 0 ,
wobei pn ein Polynom ist. Beweis. Wir beweisen dies mit vollst¨andiger Induktion. F¨ur n = 0 ist die Aussage offensichtlich erf¨ullt. Gilt die Behauptung f¨ur ein n, so erhalten wir f¨ur x = 0 nun 1 1 d f (n+1) (x) = pn exp − 2 dx x x 1 1 1 1 1 −pn . = exp − 2 + 2p n x x x2 x x3 Setze pn+1 (t) := −t 2 pn (t) + 2t 3 pn (t). Da pn ein Polynom ist, ist auch pn+1 ein Polynom. Schließlich gilt f (n+1) (0) = lim t→0
f (n) (t) − f (n) (0) pn (1/t) exp(−1/t 2) = lim t→0 t t = lim s pn (s) exp(−s2 ) = 0 , s→
womit die Behauptung auch f¨ur n + 1 gezeigt ist. (3)
Wir wollen mit √ Hilfe des Satzes von Taylor und Restgliedabsch¨atzung eine N¨aherung f¨ur 2 bestimmen. √ Dazu betrachten wir die Funktion f : [0, [ → IR, f (x) := x. Diese ist im Intervall ]0, [ beliebig oft differenzierbar. Es gilt f (x) =
1 √ , 2 x
f (x) = −
√1 4 x3
und f (x) =
√3 . 8 x5
Das Taylorpolynom T3 zum Entwicklungspunkt c > 0 lautet demnach T3 (t; f ) =
√ t − c (t − c)2 (t − c)3 c+ √ − √ + √ . 2 c 8 c3 16 c5
1 = Im Fall c = 1 und t = 2 erhalten wir T3 (2; f ) = 1 + 12 − 18 + 16
23 16 . √ Um zu sehen, wie weit dieser Wert vom wahren“ Funktionswert 2 entfernt ” ist, m¨ussen wir die Differenz f (t) − T3 (t; f ) = R4 (t) absch¨atzen. Laut dem Satz von Taylor gibt es ein ∈ ]1, 2[ derart, dass
√ f (4) ( ) (2 − 1)4 2 = f (2) = T3 (2; f ) + 4! gilt, und mit f (4) (x) = −
15 √ 16 x7
erhalten wir
10.2 Potenzreihen mit allgemeinem Entwicklungspunkt
145
1
√ 5 5 23 15
2 − = | f (2) − T3(2; f )| =
=
≤ .
24 16 7 128 7 128 16 aherungswert unterscheidet sich vom Mit anderen Worten: Die Zahl 23 16 als N¨ √ 5 wahren Wert von 2 um nicht mehr als 128 .
10.2 Potenzreihen mit allgemeinem Entwicklungspunkt H¨aufig berechnet man Taylorreihen durch Umformung bekannter Reihen. Dazu ben¨otigen wir ein Ergebnis u¨ ber Umstellungen in der Reihenfolge der Summation. Lemma 10.3. Gegeben sei eine Doppelfolge (ai j )i∈IN , j∈IN von Zahlen ai j ∈ IK mit folgenden Eigenschaften:
|ai j | = bi
(i)
j=1
(ii)
(absolute Konvergenz bei festem i),
bi konvergiert.
i=1
Dann folgt
ai j =
i=1 j=1
ai j .
j=1 i=1
Beweis. F¨ur n ∈ IN sei xn := 1n . Weiter sei x0 := lim xn = 0. n→
Die Menge M := {x0 , x1 , x2 , . . .} ist mit der nat¨urlichen Metrik ein metrischer Raum. Zu jedem i ∈ IN definieren wir eine Funktion fi : M → IK mittels fi (x0 ) :=
ai j
j=1
und
fi (xn ) :=
n
ai j
j=1
f¨ur n ∈ IN .
Es gilt lim fi (xn ) = fi (x0 ); laut Folgenkriterium (Satz 6.2) ist jedes fi stetig in x0 . n→
Wegen | fi (xn )| ≤ bi f¨ur alle n ∈ IN0 folgt mit Satz 9.7, dass die Reihe fi i=1
gleichm¨aßig auf M gegen eine Grenzfunktion g : M → IK konvergiert und Satz 9.2 liefert dann die Stetigkeit von g im Punkt x0 .
Nach Konstruktion von g gilt weiter g(x1 ) = ai1 sowie i=1
g(x j ) − g(x j−1) =
i=1
f¨ur j ≥ 2. Damit haben wir
fi (x j ) − fi (x j−1 ) =
i=1
n
g(xn ) = g(x1 ) +
j=2
j
j−1
k=1
k=1
aik − aik
g(x j ) − g(x j−1) =
= ai j i=1
n
ai j
j=1
i=1
.
146
10 Taylorreihen
Schließlich erhalten wir, mit dem Folgenkriterium angewandt auf g,
n
j=1
i=1
lim ai j ai j = n→
j=1 i=1
= lim g(xn ) = g(x0 ) = fi (x0 ) = ai j n→
i=1
i=1 j=1
wie behauptet.
Bemerkung: Man beachte, dass die spezielle Wahl der Folge (xn )n∈IN im Beweis von Lemma 10.3 keine Rolle spielt. Es kommt lediglich darauf an, dass der Grenzwert x0 = lim xn existiert und dass xn = xm f¨ur n = m gilt. n→
Ein Beispiel f¨ur eine Doppelfolge, bei der die Reihenfolge der Summation nicht vertauscht werden darf (und die folglich die Voraussetzungen von Lemma 10.3 nicht erf¨ullt), bringen wir in Aufgabe 3 am Ende dieses Kapitels. Satz 10.4. Sei f : ] − R, R[ → IK durch eine Potenzreihe mit Konvergenzradius R > 0 definiert, etwa f (x) =
ck xk .
k=0
Weiter sei c ∈ ] − R, R[. F¨ur x ∈ UR−|c| (c) = ] c − (R − |c|) , c + (R − |c|) [ gilt dann f (x) =
k=0
f (k) (c) (x − c)k . k!
Beweis. F¨ur x ∈ UR−|c| (c) haben wir f (x) =
cn ((x − c) + c)n =
n=0
Wir setzen ank := cn
n=0
|ank |
k=0
n k
=
n (x − c)k cn−k . k k=0 n
cn
n=0
(x − c)k cn−k f¨ur k = 0, . . . , n und ank := 0 f¨ur k > n. Da
n n−k k
n
c c (x − c) n k
= |cn | ( |x − c| + |c| ) n=0 k=0 n=0
n
konvergiert, sind die Voraussetzungen von Lemma 10.3 erf¨ullt und wir erhalten n f (x) = ank = ank = cn cn−k (x − c)k . n=0 k=0 k=0 n=0 k=0 n=k k Laut Satz 9.8 gilt f (k) (c) 1 n = n(n − 1) · · ·(n − k + 1) cn cn−k = cn cn−k k! k! n=k k n=k
und die Behauptung ist bewiesen.
10.2 Potenzreihen mit allgemeinem Entwicklungspunkt
147
Bemerkung: Satz 10.4 gilt entsprechend auch im Fall R = . Betrachten wir Reihen der Form
ck (z − c)k
k=0
f¨ur ein c ∈ IK, so gibt es laut Satz 5.19 genau ein R ≥ 0 (oder R = ) derart, dass die Reihe absolut konvergiert f¨ur z ∈ UR (c) und divergiert f¨ur |z| > R. Man braucht nur u := z − c zu betrachten. Diesen Wert R nennen wir ebenfalls Konvergenzradius, der Punkt c heißt Entwicklungspunkt. Beispiel: Die Geometrische Reihe hat den Konvergenzradius 1; f¨ur |x| < 1 ist
f (x) :=
1
xk = 1 − x .
k=0
Sei c := − 12 . Aus
1 k!
k+1 f (k) − 12 = 23 und mit Satz 10.4 ergibt sich k+1 1 2 1 k = x+ 1 − x k=0 3 2
(10.1)
zun¨achst f¨ur x ∈ ] − 1, 0[. Letztere Reihe hat allerdings den Konvergenzradius R = 32 . Sie konvergiert daher sogar f¨ur x ∈ ] − 2, 1[. Wir wollen noch einige wichtige Eigenschaften festhalten. Sei f (z) =
ck (z − c)k
k=0
eine Potenzreihe mit Konvergenzradius R > 0 (oder R = ). Die Funktion f ist in UR (c) = {z ∈ IK : |z − c| < R} stetig (vgl. Korollar 6.6). Damit
folgt, dass (10.1) tats¨achlich f¨ur alle x ∈ ] − 2, 1[ und sogar f¨ur alle x ∈ C mit
x + 1 < 3 gilt. 2 2 Im Folgenden sei c ∈ IR. Laut Satz 9.8 ist f in ]c − R, c + R[ beliebig oft differenzierbar und es gilt f (n) (x) =
k(k − 1) · · · (k − n + 1) ck (x − c)k−n .
k=n
Die Taylor-Reihe von f mit Entwicklungspunkt c ist genau die Potenzreihe, denn es ist f (n) (c) = n! cn . Insbesondere gilt also folgender Identit¨atssatz:
k=0
k=0
Korollar 10.5. Falls ck (x − c)k = dk (x − c)k f¨ur alle x ∈ ]c − , c + [ mit einer Zahl > 0 ist, so gilt ck = dk f¨ur alle k ∈ IN0 .
148
10 Taylorreihen
Analog zu Korollar 9.9 ergibt sich, dass durch F : ]c − R, c + R[ → IK ,
F(x) =
ck
k + 1 (x − c)k+1
k=0
eine Stammfunktion von f gegeben ist.
10.3 Der Abelsche Grenzwertsatz Wir beginnen mit einem Beispiel. 1 . Die Funktion f : ]− 1, [ → IR, f (x) := ln(1 + x), ist differenzierbar mit f (x) = 1+x
F¨ur |x| < 1 k¨onnen wir f (x) als Potenzreihe schreiben: Es gilt f (x) = (−1)k xk . k=0
Eine Stammfunktion dieser Reihe k¨onnen wir leicht angeben. Damit erhalten wir
(−1)k
k=0
xk+1 k+1
= f (x) + c mit einer Konstante c ∈ IR.
Einsetzen von etwa x = 0 liefert c = 0. Somit haben wir ln(1 + x) =
xk+1
(−1)k k + 1
f¨ur |x| < 1 .
k=0
Laut dem Leibniz-Kriterium (Korollar 5.15) konvergiert die Reihe rechts auch noch f¨ur x = 1. Um zu zeigen, dass sie gegen ln(2) konvergiert, benutzen wir den folgenden Satz. Man beachte, dass die differenzierte Reihe f¨ur x = 1 nicht konvergiert. Satz 10.6 (Abelscher Grenzwertsatz).
Es sei f (x) = ck (x − c)k eine Potenzreihe mit Konvergenzradius R > 0, c ∈ IR. k=0
F¨ur den Randpunkt x = c + R sei die Reihe ck Rk auch konvergent. k=0
Dann gilt lim
x→(c+R)−
f (x) =
ck R k .
k=0
Insbesondere ist f : ]c − R, c + R] → IK, f (x) = ck (x − c)k , stetig. k=0
Beweis. Ersetzt man x durch Ry + c, so ergibt sich eine Potenzreihe um Null mit Konvergenzradius 1.
k=0
k=0
Es reicht also, f (x) = ck xk mit R = 1 und konvergenter Reihe ck anzunehmen. n
Mit Sn := ck f¨ur n ∈ IN0 und S−1 := 0 gilt k=0
10.4 Aufgaben
149 N
N
N−1
k=0
k=0
k=0
ck xk = (Sk − Sk−1) xk = (1 − x) Sk xk + SN xN
und mit N → folgt
f (x) = (1 − x) Sk xk
f¨ur |x| < 1 ;
k=0
k
diese Reihe ist konvergent, denn es gilt Sk x
≤ max |Sn | xk . n∈IN0 k=0
k=0
Betrachte S := lim Sn = ck . n→
k=0
Zu > 0 existiert N ∈ IN mit |S − Sn| < 2 ∀n ≥ N. Wir erhalten
k
| f (x) − S| = (1 − x) (Sk − S) x
k=0 N
≤ (1 − x) |Sk − S| |xk | + k=0
(1 − x) |x|k 2 k=0 =1
N
≤ (1 − x) |Sk − S| + . 2 k=0 N
Nun gibt es eine Zahl > 0 mit (1 − x) |Sk − S| < k=0
2
f¨ur alle x ∈ ]1 − , 1].
Damit haben wir schließlich | f (x) − S| < f¨ur alle x ∈ ]1 − , 1[. Folglich gilt lim f (x) = S wie gew¨unscht.
x→1−
Kehren wir zur¨uck zu unserem Beispiel. Mit Satz 10.6 erhalten wir nun ln(2) =
1
1
1
1
(−1)k k + 1 = 1 − 2 + 3 − 4 ± · · · ,
(10.2)
k=0
den Wert der Alternierenden Harmonischen Reihe.
10.4 Aufgaben 1. Es sei I ein Intervall derart, dass f¨ur jedes x ∈ I auch −x ∈ I gilt. Eine Funktion f : I → IK heißt gerade, wenn f (x) = f (−x) gilt f¨ur alle x ∈ I; sie heißt ungerade, wenn f (x) = − f (−x) gilt f¨ur alle x ∈ I. Zeigen Sie: Alle Taylorpolynome zum Entwicklungspunkt 0 (sofern sie existieren) einer geraden/ungeraden Funktion sind ebenfalls gerade/ungerade.
150
10 Taylorreihen
2. Es sei f : IR → IR eine differenzierbare Funktion mit f = f und f (0) = 1. Bestimmen Sie die Taylorreihe T f (x) von f zum Entwicklungspunkt 0. F¨ur welche x konvergiert diese gegen f (x) ? 3. Ein Gegenbeispiel zur Vertauschung bei Doppelsummen. F¨ur i, j ∈ IN sei −1 0 0 ⎧ f¨ur i < j , ⎪ 1 ⎨0 0 2 −1 ai j := −1 f¨ur i = j , 1 1 ⎪ ⎩ j−i 4 2 −1 2 f¨ur i > j . 1 1 1 Zeigen Sie, dass
8
.. .
ai j = ai j
i=1 j=1
4
.. .
2
.. .
0
···
0
···
0
···
−1 · · · .. . . . .
j=1 i=1
gilt und geben Sie an, welche der Voraussetzungen von Lemma 10.3 im vorliegenden Fall nicht erf¨ullt ist. 4. L¨osung der Schwingungsgleichung mittels Taylor-Entwicklung. Es sei f : IR → IR eine zwei Mal differenzierbare Funktion mit der Eigenschaft f (x) + f (x) = 0
f¨ur alle x ∈ IR .
Zeigen Sie mit Hilfe der Talyor-Entwicklung von f , dass gilt: f (x) = f (0) cos x + f (0) sin x
f¨ur alle x ∈ IR .
5. Es seien ∈ IR und f : IR → IR eine differenzierbare Funktion mit f (0) = 0 derart, dass f (x) = f ( x) gilt f¨ur alle x ∈ IR. a. Zeigen Sie, dass f beliebig oft differenzierbar ist und berechnen Sie f (k) f¨ur k ∈ IN. b. Bestimmen Sie die Taylorreihe von f um den Nullpunkt und deren Konvergenzradius. c. Zeigen Sie mit Hilfe einer Absch¨atzung des Lagrangeschen Restglieds, dass f¨ur | | ≤ 1 die Taylor-Reihe von f auf ganz IR gegen f konvergiert.
6. Sei z0 ∈ C. Die Potenzreihe ck (z − z0 )k habe den Konvergenzradius R > 0. k=0
Weiter sei z1 ∈ UR (z0 ). Zeigen Sie: F¨ur alle z ∈ UR−|z1 −z0 | (z1 ) gilt
k=0
j=0
ck (z − z0 )k = b j (z − z1) j
mit b j =
k= j
k j
ck (z1 − z0 )k− j .
Kapitel 11
Fourierreihen
Fourierreihen eignen sich zur Analyse von Funktionen, von denen man annimmt, ¨ dass sie eine Uberlagerung von Grundschwingungsfunktionen (mit bestimmten Frequenzen) sind, d.h. von sin(kx), cos(kx) oder eikx . Dabei k¨onnen diese Funktionen Sprungstellen haben (so genannte Pulsfunktionen). Zun¨achst ist eine Vorbemerkung zu periodischen Funktionen angebracht. Eine Funktion f : IR → IK heißt periodisch mit der Periode > 0, falls f (x + ) = f (x)
f¨ur alle x ∈ IR
gilt. Es gilt dann auch f (x + k ) = f (x) f¨ur alle x ∈ IR und alle k ∈ ZZ. Wir k¨onnen immer davon ausgehen, dass eine Funktion
mit Periode = 2 vorliegt, indem wir f durch eine Funktion g mit g(x) := f 2 x ersetzen.
11.1 Trigonometrische Polynome und Fourierkoeffizienten Ein trigonometrisches Polynom ist eine Summe der Form f (x) =
n a0 + (ak coskx + bk sin kx) 2 k=1
(x ∈ IR)
mit Koeffizienten a0 , . . . , an ; b1 , . . . , bn ∈ IK.
Wegen cos x = 12 eix + e−ix und sin x = 2i1 eix − e−ix kann man obige Darstellung auch schreiben als f (x) =
n
ck eikx .
k=−n a0 2
1 2 (ak − ibk )
Dabei ist c0 = und ck = sowie c−k = 12 (ak + ibk ) f¨ur k ∈ IN. Umgekehrt gilt dann nat¨urlich a0 = 2c0 , ak = ck + c−k und bk = 1i (c−k − ck ) f¨ur k ∈ IN.
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_11, © Springer-Verlag Berlin Heidelberg 2012
151
152
11 Fourierreihen
Wegen
( 2 0
einx dx =
1 inx
2 e =0 in 0
f¨ur n = 0
erf¨ullt die doppelseitige“ Folge (ek )k∈ZZ von Funktionen ek (x) := eikx die folgende ” Orthogonalit¨atsrelation: Es gilt ( ( 1 f¨ur k = m , 1 2 i(k−m)x 1 2 ek (x) em (x) dx = e dx = 2 0 2 0 0 f¨ur k = m . n
Ist nun f (x) = ck eikx ein trigonometrisches Polynom, so haben wir k=−n
( 2 0
f (x) e−imx dx =
( 2 0
n
n
ck eikx e−imx dx =
k=−n
k=−n
ck
( 2 0
ei(k−m)x dx = 2 cm
f¨ur m ∈ {−n, . . ., n}. Das Integral auf der linken Seite k¨onnen wir nicht nur f¨ur trigonometrische Polynome, sondern f¨ur beliebige integrierbare Funktionen bilden. Definition 11.1. Sei R p := { f ∈ R([0, 2 ]) : f (0) = f (2 )}. F¨ur f ∈ R p heißen die Zahlen 1 f)(k) := 2
( 2 0
f (x) e−ikx dx ,
k ∈ ZZ ,
die Fourierkoeffizienten von f . Die formale Reihe
f)(k) eikx
k=−
heißt Fourierreihe von f . Bemerkungen: (1)
Die Fourierreihe ist zun¨achst nur ein formales Gebilde. Es gibt zahlreiche F¨alle, bei denen sie f¨ur kein x ∈ IR konvergiert.
(2)
Wir werden die Konvergenz einer Fourierreihe (wenn nicht anders angegeben) wie folgt verstehen:
k=−
(3)
f)(k) e−ikx := lim
n→
n
f)(k) e−ikx .
k=−n
Bez¨uglich Fourierreihen k¨onnen wir 2 -periodische Funktionen g : IR → IK und Funktionen f : [0, 2 ] → IK mit f (0) = f (2 ) als gleichwertig sehen. Man kann f zu einer 2 -periodischen Funktion g : IR → IK fortsetzen mittels g(x + 2 n) := f (x) f¨ur x ∈ [0, 2 [ und n ∈ ZZ. Wir werden die 2 -periodische Fortsetzung stets auch wieder mit f bezeichnen.
11.1 Trigonometrische Polynome und Fourierkoeffizienten
153
Damit ist auch klar, dass die Fourierkoeffizienten f)(k) durch 1 f)(k) = 2
( 2 0
f (x) e−ikx dx =
1 2
( +2
f (x) e−ikx dx
f¨ur beliebiges ∈ IR gegeben sind. Als erstes Beispiel sei f eine so genannte Pulsfunktion, 1 f¨ur x ∈ [0, ] ∪ {2 } , f (x) := −1 f¨ur x ∈ ] , 2 [ . Es gilt f)(0) = 0 und f¨ur k = 0 erhalten wir ( ( 2 1 1 e−ikx
e−ikx
2 −ikx −ikx ) f (k) = e dx − e dx =
−
2 2 −ik 0 −ik 0 i −ik i −ik (e 2e − 1) − (1 − e−ik ) = −2 = 2 k 2 k 0 , falls k gerade , = − 2ik , falls k ungerade . Die Fourierreihe von f lautet also −
2i 1 1 4 i(2k+1)x e sin(2k + 1)x . = k=− 2k + 1 k=0 2k + 1
1 2
−1 Es ist aufschlussreich, die Partialsummen S2n+1 f (x) :=
4
n
k=0
1 sin((2k + 1)x) 2k + 1
f¨ur verschiedene n zu berechnen, um so die Approximation von f (x) zu veranschaulichen. Die Abbildung zeigt S1 f (x) und S3 f (x).
Jean-Baptiste Joseph Fourier (1768-1830, Paris) behauptete, dass f¨ur jedes f ∈ R p deren Fourierreihe gegen f strebt (er benutzte diese Reihen, um die W¨armeleitung
154
11 Fourierreihen
in einem K¨orper zu beschreiben). Dies ist falsch. Man erkennt an obigem Beispiel, dass etwa an der Stelle x = die Fourierreihe gegen 0 = f ( ) konvergiert. Viele Mathematiker (u.a. Cauchy) haben Fouriers Behauptung mit falschem Beweis nachgewiesen“. Erst Dirichlet brachte Ordnung in die Untersuchungen. Paul ” du Bois-Reymond (1831-1889, T¨ubingen, Berlin) konnte zeigen: Es gibt eine stetige 2 -periodische Funktion f , deren Fourierreihe an der Stelle x = 0 gegen divergiert. Ein wichtiges Resultat stammt von Lip´ot Fej´er (1880-1959, Budapest; damals 19-j¨ahrig). Er bewies, dass n |k| f)(k) eikt → f (t) 1 − f¨ur n → n + 1 k=−n gilt, falls die 2 -periodische Funktion f stetig ist (sogar mit gleichm¨aßiger Konvergenz). Wir werden in Satz 11.5 und Satz 11.6 darauf zur¨uckkommen.
11.2 Konvergenz nach Dirichlet und Fej´er Wir zeigen zun¨achst wichtige Gleichheiten f¨ur gewisse trigonometrische Polynome. F¨ur n ∈ IN betrachten wir Dn (x) :=
n
n
k=−n
eikx = 1 + 2 cos(kx) und k=1
n n |k| 1 n 1 ikx Fn (x) := Dk (x) = n + 1 ((n + 1) − |k|) e = 1 − n + 1 eikx . n + 1 k=0 k=−n k=−n Man bezeichnet (Dn )n∈IN als Dirichlet-Kern und (Fn )n∈IN heißt Fej´er-Kern. Lemma 11.2. F¨ur x ∈ / {2k : k ∈ ZZ} gilt
sin (2n + 1) 2x
Dn (x) = sin 2x
1 Fn (x) = n+1
und
2
sin (n + 1) 2x
. sin 2x
Weiter ist Dn (2k ) = 2n + 1 sowie Fn (2k ) = n + 1 f¨ur k ∈ ZZ. Beweis. Die Behauptungen f¨ur x = 2k sind offensichtlich. Andernfalls gilt 2n
Dn (x) = e−inx (eix )k = e−inx k=0
=e
−inx
2n+1 eix −1 eix − 1
ei(2n+1)x/2 ei(2n+1)x/2 − e−i(2n+1)x/2 sin (2n + 1) 2x
= eix/2 eix/2 − e−ix/2 sin 2x
11.2 Konvergenz nach Dirichlet und Fej´er
155
und mit Hilfe von cos(z − w) − cos(z + w) = 2 sin z sin w (siehe Satz 5.22) erhalten wir weiter x 2 x 2 n sin (n + 1) Fn (x) = sin Dk (x) 2 2 k=0 x n x sin (2k + 1) = sin 2 2 k=0 n
cos(kx) − cos((k + 1)x) 2 k=0 2 (n + 1)x 1 − cos((n + 1)x) = sin = , 2 2
=
womit die Behauptung gezeigt ist.
Zu f ∈ R p betrachten wir nun die folgenden trigonometrischen Polynome: n n |k| ikx ) f)(k) eikx . und n ( f )(x) := 1 − Sn ( f )(x) := f (k) e n+1 k=−n k=−n Das n¨achste Lemma gibt eine Integraldarstellung von Sn ( f ) und n ( f ) an. Lemma 11.3. Sei f ∈ R p . Es gilt Sn ( f )(x) =
1 2
n ( f )(x) =
1 2
( 2 0
( 2 0
f (y) Dn (x − y) dy =
1 2
f (y) Fn (x − y) dy =
1 2
f¨ur alle x ∈ IR und es ist Beweis. Mit
n ( f ) =
( 2 0
( 2 0
f (x − y) Dn (y) dy
sowie
f (x − y) Fn (y) dy
1 n Sk ( f ). n + 1 k=0
( 2 |k| 1 −iky 1 − f (y) e dy eikx n + 1 2 0 k=−n ( n |k| 1 2 eik(x−y) dy = f (y) 1 − 2 0 n + 1 k=−n
n ( f )(x) =
n
1 = 2
( 2 0
f (y) Fn (x − y) dy
ist die Gleichheit links in der zweiten Behauptung gezeigt. Die rechte Gleichung erh¨alt man durch Substitution mit t := x − y. Die entsprechenden Aussagen f¨ur Sn beweist man ganz analog. Daraus folgt die letzte Behauptung jetzt direkt mit der Definition von Fn .
156
11 Fourierreihen
Wir wollen sehen, unter welchen Bedingungen die Fourierreihe einer Funktion f ∈ R p gegen f konvergiert. Mit anderen Worten, uns interessiert das Verhalten von Sn ( f ) f¨ur n → . Dar¨uberhinaus wollen wir auch n ( f ) auf Konvergenz untersuchen. Es stellt sich heraus, dass n in gewissen F¨allen besser zur Approximation geeignet ist als Sn . Dies liegt u.a. an folgenden Eigenschaften. Lemma 11.4. Es gelten (i)
Fn (x) ≥ 0
(ii)
1 2
(iii)
( 2 0
f¨ur alle x ∈ IR,
Fn (x) dx = 1,
f¨ur jedes 0 < < konvergiert Fn (x) → 0 gleichm¨aßig auf [ , 2 − ] mit n → .
Beweis. Die erste Behauptung erkennt man sofort an Hand der Darstellung aus Lemma 11.2. Weiter ist ( 2 ( 1 2 |k| 1 n Fn (x) dx = 1 − n + 1 0 eikx dx , 2 0 2 k=−n wobei das Integral nur f¨ur k = 0 einen von Null verschiedenen Wert, n¨amlich 2 , hat. Somit ist auch die zweite Aussage gezeigt. Ist nun 0 < < , so erhalten wir, wieder mit Lemma 11.2, f¨ur alle x ∈ [ , 2 − ] die Absch¨atzung 1 Fn (x) ≤ n+1
1 sin(x/2)
2
1 ≤ n+1
1 sin( /2)
2
n→
−→ 0 .
Der Ausdruck rechts h¨angt nicht mehr von x ab; daher konvergiert Fn (x) gleichm¨aßig auf [ , 2 − ].
Satz 11.5. Sei f ∈ R p . Ist f im Punkt x stetig, so gilt lim n ( f )(x) = f (x). n→
Beweis. Sei > 0. Auf Grund der Stetigkeit gibt es eine Zahl > 0 derart, dass | f (y) − f (x)| ≤ 2 f¨ur alle y mit |y − x| < gilt. Ohne Einschr¨ankung k¨onnen wir M := f > 0 annehmen. Laut Aussage (iii) von Lemma 11.4 gibt es N ∈ IN mit |Fn (y)| ≤
4M
f¨ur alle y ∈ [ , 2 − ] und alle n ∈ IN .
Mit den Resultaten (i) und (ii) aus Lemma 11.4 gilt ferner ( 0
|Fn (y)| dy +
( 2 2 −
und wir erhalten schließlich
|Fn (y)| dy ≤
( 2 0
|Fn (y)| dy =
( 2 0
Fn (y) dy = 2
11.2 Konvergenz nach Dirichlet und Fej´er
157
( 2
(
1
1 2
|n ( f )(x) − f (x)| =
f (x − y) Fn (y) dy − f (x) Fn (y) dy
2 0 2 0
(
1
2 = ( f (x − y) − f (x) ) Fn (y) dy
2 0 ≤
1 2
( 0
| f (x − y) − f (x)| Fn (y) dy 1 + 2 +
≤
2M + 2 2
1 2
( 2 −
( 0 −
| f (x − y) − f (x)| Fn (y) dy
( 2 −
| f (x − y) − f (x)| Fn (y) dy
Fn (y) dy ≤
M + 2
f¨ur alle n ≥ N.
( 2 −
4M
dy ≤
Satz 11.6 (Fej´er). Sei f ∈ R p stetig. Dann gilt n ( f ) → f gleichm¨aßig auf [0, 2 ] mit n → . Beweis. Da f laut Satz 6.18 gleichm¨aßig stetig ist, gibt es zu > 0 ein > 0 derart, dass | f (y) − f (x)| < 2 f¨ur alle x, y mit |y − x| < gilt, d.h. h¨angt nicht von x ab. Nun kann man exakt wie im Nachweis von Satz 11.5 vorgehen.
Wir notieren noch einige wichtige Folgerungen. Korollar 11.7 (Weierstraßscher Approximationssatz). Sei f ∈ R p stetig. Dann existiert eine Folge trigonometrischer Polynome (Pn )n∈IN , die gleichm¨aßig auf IR gegen f konvergiert, also lim Pn − f = 0. n→
Beweis. W¨ahle Pn = n ( f ).
Korollar 11.8 (Eindeutigkeitssatz). Seien f , g ∈ R p stetig mit f)(k) = g)(k) ∀k ∈ ZZ. Dann ist f = g. Beweis. Aus der Voraussetzung folgt n ( f ) = n (g) f¨ur alle n ∈ IN0 . Mit Satz 11.6 erhalten wir f = g.
In den Beweisen zu Satz 11.5 und Satz 11.6 werden von Fn nur die Eigenschaften aus Lemma 11.4 benutzt. Man erh¨alt die selben Resultate daher auch, wenn man an Stelle von Fn andere Systeme von trigonometrischen Polynomen verwendet, sofern diese ebenfalls die Aussagen von Lemma 11.4 erf¨ullen. F¨ur den Dirichlet-Kern, also die Dn , ist dies allerdings nicht der Fall. Dennoch gilt in vielen F¨allen auch Sn ( f ) → f mit n → .
158
11 Fourierreihen
Satz 11.9 (Riemann-Lebesgue-Lemma). Sei f ∈ R([a, b]). Dann gilt lim
( b
n→ a
f (x) sin(nx) dx = 0 = lim
( b
n→ a
f (x) cos(nx) dx.
Insbesondere gilt f¨ur f ∈ R p damit lim f)(n) = 0. |n|→
Beweis. Seien zun¨achst g eine Treppenfunktion und a = a0 < a1 < · · · < am = b, sodass g(x) = ck f¨ur x ∈ ]ak−1 , ak [ gilt. F¨ur n ∈ IN ergibt sich
m
( b
m
1
g(x) sin(nx) dx = ck (cos(nak−1 ) − cos(nak ))
≤ 2 |ck | n→ −→ 0 .
a
n k=1 k=1 n Sei nun f ∈ R([a, b]). Zu jedem > 0 gibt es dann eine Treppenfunktion g mit f − g < b−a und weiter
( b
( b ( b
a f (x) sin(nx) dx − a g(x) sin(nx) dx ≤ a | f (x) − g(x)| dx < . Da beliebig klein gew¨ahlt werden kann, bleibt nur lim
( b
n→ a
f (x) sin(nx) dx = 0.
F¨ur cos zeigt man dies ganz analog. Die abschließende Behauptung ergibt sich dann unmittelbar mit e−inx = cos(nx) − i sin(nx).
Nun k¨onnen wir ein wichtiges Resultat u¨ ber punktweise Konvergenz von Fourierreihen beweisen. Wir erinnern uns (Satz 8.5), dass f¨ur eine Regelfunktion f ∈ R([a, b]) an einer Stelle x ∈ [a, b] stets die einseitigen Grenzwerte f (x+) und f (x−) existieren. Satz 11.10. Sei f ∈ R p . Wenn an einer Stelle x ∈ IR die einseitigen Ableitungen f (x+) := lim
t→0+
existieren, so gilt
f (x + t) − f (x+) t
f (x−) := lim
und
t→0−
f (x + t) − f (x−) t
lim Sn ( f )(x) = 12 ( f (x+) + f (x−)).
n→
Wenn f u¨ berdies an der Stelle x stetig ist, konvergiert die Fourierreihe an diesem Punkt also gegen den Funktionswert. Beweis. Wegen Dn (−x) = Dn (x) ergibt sich mittels Substitution ( 0 −
und auch
f (x − y) Dn (y) dy = ( 0
Dn (y) dy =
1 2
(
( −
0
f (x + s) Dn (s) ds
Dn (y) dy = .
Wir setzen dies in die Darstellung aus Lemma 11.3 ein und schreiben schließlich Dn wie in Lemma 11.2. Damit erhalten wir
11.2 Konvergenz nach Dirichlet und Fej´er
159
1 Sn ( f )(x) − ( f (x+) + f (x−)) 2 = =
1 2
( −
( 1
2
1 =
0
(
1 f (x − y) Dn (y) dy − ( f (x+) + f (x−)) 2
( f (x + y) + f (x − y) − f (x+) − f (x−) ) Dn (y) dy
0
f (x + y) − f (x+) f (x − y) − f (x−)
+ 2 sin 2y 2 sin 2y
y dy . sin (2n + 1) 2
Mit der Regel von L’Hospital (Satz 7.15) gilt weiter lim
y→0+
f (x + y) − f (x+)
= f (x+) 2 sin 2y
und
lim
y→0+
f (x − y) − f (x−)
= f (x−) . 2 sin 2y
Daher ist g : [0, ] → IK mit g(0) := f (x+) − f (x−) und g(y) :=
f (x + y) − f (x+) f (x − y) − f (x−)
+ 2 sin 2y 2 sin 2y
f¨ur y = 0
im Nullpunkt stetig. Insbesondere ist g eine Regelfunktion und mit Satz 11.9 folgt ( 1 1 y dy = 0 lim Sn ( f )(x) − ( f (x+) + f (x−)) = lim g(y) sin (2n + 1) n→ n→ 0 2 2
und damit die Behauptung. Beispiele: (1)
Fourierkoeffizienten und Fourierreihe der Pulsfunktion f ∈ R p , 1 f¨ur x ∈ [0, ] ∪ {2 } , f (x) := −1 f¨ur x ∈ ] , 2 [ . haben wir bereits berechnet. Mit Satz 11.10 folgt nun ⎧ ⎪ ⎨ 1 f¨ur x ∈ ]0, [ , 4 1 2k + 1 sin(2k + 1)x = ⎪ −1 f¨ur x ∈ ] , 2 [ , k=0 ⎩ 0 f¨ur x ∈ {0, , 2 } . Speziell f¨ur x =
2
erhalten wir mit sin (2k + 1) 2 = (−1)k den Wert
4 (−1)k 2k + 1 = 1 , k=0
also
1 1 1 = 1 − + − ± ··· 4 3 5 7
160
11 Fourierreihen
(2)
Sei f ∈ R p definiert durch f (x) := x2 f¨ur x ∈ [− , ]. Laut Satz 11.10 konvergiert deren Fourierreihe u¨ berall gegen den Funktionswert. ( 2 Wir berechnen die Fourierkoeffizienten. Es gilt f)(0) = x2 dx = ; mit 3 − ( ( 1 2 −ikx
1 x e x2 e−ikx dx = 2x e−ikx dx
− −ik − −ik − − (
4 1 1 1
2x e−ikx − = 2e−ikx dx = (−1)k 2 ik −ik − −ik − k ergibt sich f)(k) = (−1)k k22 f¨ur k = 0 und wir erhalten Sn f (x) =
n
k=−n
=
2 3
n f)(k) eikx = f)(0) + f)(k) eikx + f)(−k) e−ikx k=1
n
+ (−1)k k=1
n 2 ikx 2 (−1)k −ikx + 4 (e + e ) = cos(kx) . 2 k2 3 k=1 k
Setzen wir etwa x = 0 oder x = ein, so haben wir 0 = f (0) =
2 (−1)k +4 2 3 k=1 k
⇒
(−1)k 2 = 2 12 k=1 k
2 1 +4 2 3 k=1 k
⇒
k2 =
2 = f ( ) =
1
k=1
und
2 . 6
11.3 Konvergenz im quadratischen Mittel Man kann leicht nachpr¨ufen, daß C p := { f ∈ R p : f stetig} mit 1 f , g := 2
( 2 0
f (x) g(x) dx
ein Pr¨ahilbertraum ist. Mit der durch f 2 := f , f erkl¨arten Norm ist C p ein normierter Raum. Wir wissen auch bereits, dass {en : n ∈ ZZ} mit en (x) := einx eine orthonormale Familie in C p bildet. F¨ur die Fourierkoeffizienten von f ∈ C p gilt nach Definition f)(k) = f , ek . Die Besselsche Ungleichung (4.2) f¨ur C p liefert 1 2
( 2 0
| f (x)|2 dx = f 22 ≥
k=−
| f , ek |2 =
k=−
| f)(k)|2 ;
11.3 Konvergenz im quadratischen Mittel
161
insbesondere ist die Reihe rechts konvergent. Wir werden in K¨urze sehen, dass hier sogar Gleichheit gilt. Satz 11.11. Seien f , g ∈ C p . Es gelten (a)
f − Sn( f )2 → 0 mit n → ,
(b)
1 2
(c)
1 2
( 2 0
| f)(k)|2 ,
(Parsevalsche Gleichung)
k=−
( 2 0
| f (x)|2 dx =
f (x) g(x) dx =
f)(k) g)(k).
k=−
Beweis. (a) Sei > 0. Nach dem Satz von Fej´er (Satz 11.6) gibt es N ∈ IN mit | f (x) − n ( f )(x)| < f¨ur alle x ∈ [0, 2 ] und alle n ≥ N. Damit gilt auch f − n ( f )2 =
1 2
( 2 0
| f (x) − n ( f )(x)|2 dx
1/2
<
f¨ur alle n ≥ N .
Betrachte nun f¨ur jedes n ∈ IN die orthonormale Familie {ek : k = −n, . . . , n}. Satz 4.13 liefert f − Sn ( f )2 ≤ f − n ( f )2 . Damit gilt auch f − Sn ( f )2 < f¨ur alle n ≥ N. (b) Laut dem Satz von Pythagoras (Satz 4.11) gilt f − Sn( f )22 = f 22 −
n
| f)(k)|2 ≥ 0 .
k=−n
n
Mit (a) folgt lim | f)(k)|2 = f 22 . Dies ist genau die Parsevalsche Gleichung. n→ k=−n
(c) Mit der Cauchy-Schwarz-Ungleichung (Korollar 4.12) erhalten wir
# $
n n
f , g − f)(k) g)(k) = f , g − f)(k) ek , g = | f , g − Sn ( f ), g|
k=−n k=−n = | f − Sn( f ), g| ≤ f − Sn ( f )2 g2 .
Daraus folgt mit (a) die Behauptung.
Beispiel: Die Fourierkoeffizienten der durch f (x) := x2 f¨ur x ∈ [− , ] definierten 2 Funktion f ∈ C p kennen wir schon. Es gilt f)(0) = 3 und f)(k) = (−1)k k22 f¨ur k = 0. Andererseits gilt f 22 =
1 2
( −
x4 dx =
Die Parsevalsche Gleichung liefert
4 5
=
4 1 1 5 ( − (− )5 ) = . 2 5 5
2 3
2
+2
k=1
2 2 k2
.
162
11 Fourierreihen
Damit haben wir
1 1 k4 = 8 k=1
4 4 − 5 9
=
4 . 90
Bemerkung: Die Folgerungen in Satz 11.11 gelten nicht nur f¨ur stetige Funktionen. Dar¨uberhinaus kann man Fourierkoeffizienten und Fourierreihen f¨ur eine weitaus gr¨oßere Klasse von Funktionen definieren, wenn man z.B. auch uneigentliche Integrale zul¨asst oder indem man einen umfassenderen Integralbegriff benutzt, wie etwa das Lebesgue-Integral. Man kann zeigen, dass die Eigenschaften (a), (b) und (c) aus dem Satz a¨ quivalent und sogar f¨ur alle Regelfunktionen erf¨ullt sind.
11.4 Aufgaben 1. Bestimmen Sie die Fourierkoeffizienten der 2 -periodischen Fortsetzung der Funktion 0, x<0, f : ] − , ] → IR , f (x) := x, x≥0. F¨ur welche x konvergiert hier die Fourierreihe gegen den Funktionswert ? 2. Bestimmen Sie die Fourierreihe der durch f (x) := |x| f¨ur x ∈ [− , ] definierten Funktion f ∈ R p und berechnen Sie damit den Wert der Reihe
1
(2k + 1)2 .
k=0
3. Bestimmen Sie die Fourierreihe der durch f (x) := 2 − |x| f¨ur x ∈ [− , ] definierten Funktion f ∈ R p und berechnen Sie mit Hilfe der Parsevalschen Gleichung den Wert der Reihe 1 (2k + 1)4 . k=0 4. Seien f ∈ R p , y ∈ IR. Weiter sei Ty f : IR → IR, Ty f (x) := f (x − y). Bestimmen Sie die Fourierkoeffizienten von Ty f . 5. Sei f ∈ R p eine reellwertige Funktion. Zeigen Sie: Es gilt Sn ( f )(x) =
n a0 + (ak cos(kx) + bk sin(kx) ) , 2 k=1
wobei a0 , a1 , a2 , . . . und b1 , b2 , . . . reelle Zahlen sind.
11.4 Aufgaben
163
6. Sei f ∈ R p . Zeigen Sie: In der Darstellung Sn ( f )(x) =
n a0 + (ak cos(kx) + bk sin(kx) ) 2 k=1
gilt: f gerade
=⇒
bk = 0
f¨ur alle k ∈ IN ,
f ungerade
=⇒
ak = 0
f¨ur alle k ∈ IN0 .
7. Es sei f : IR → C eine stetig differenzierbare 2 -periodische Funktion. a. Zeigen Sie: Es gilt ) f (k) = ik f)(k) f¨ur alle k ∈ ZZ. b. Zeigen Sie: Es gilt
d dx n ( f )(x)
= n ( f )(x) f¨ur alle n ∈ IN0 .
c. Folgern Sie, dass eine Folge (Pn )n∈IN trigonometrischer Polynome existiert derart, dass (Pn ) gleichm¨aßig auf [0, 2 ] gegen f konvergiert und auch (Pn ) gleichm¨aßig auf [0, 2 ] gegen f konvergiert. 8. Seien f , g ∈ C p mit f)(k) = g)(k) f¨ur alle k ∈ ZZ. Zeigen Sie, dass f = g gilt.
This page intentionally left blank
Kapitel 12
Kompaktheit
Erinnern wir uns an Satz 6.18, wo wir gezeigt haben, dass jede auf einem Intervall der Form [a, b] stetige Funktion dort auch gleichm¨aßig stetig ist. Zu gegebenem > 0 k¨onnen wir ein > 0 finden, das f¨ur alle Punkte p ∈ [a, b] gut genug“ ist. ” Wir betrachten nun Funktionen, deren Definitionsbereiche diese und verwandte Eigenschaften von [a, b] erf¨ullen. Zur Motivation wollen wir noch kurz einiges u¨ ber [a, b] festhalten. (1)
Da [a, b] beschr¨ankt ist, besitzt jede Folge (xn )n∈IN in diesem Intervall eine konvergente Teilfolge, deren Grenzwert ebenfalls in [a, b] liegt. Das liegt u.a. daran, dass die Randpunkte zur Menge [a, b] geh¨oren; f¨ur ]a, b[ gilt dies nicht, obwohl ]a, b[ beschr¨ankt ist.
(2)
Ist > 0 gegeben, so reichen endlich viele Punkte x1 , . . . , xn ∈ [a, b], sodass [a, b] ⊆
(3)
n *
k=1
]xk − , xk + [ gilt.
Ist (Ik )k∈J mit einer beliebigen Index-Menge J eine Familie offener Intervalle * derart, dass [a, b] ⊆ Ik gilt, so reichen bereits endlich viele k1 , . . . , kn ∈ J k∈J
aus, um [a, b] zu u¨ berdecken. (Dies haben wir noch nicht bewiesen!)
12.1 Kompakte metrische R¨aume Die oben genannten drei Eigenschaften wollen wir auf beliebige metrische R¨aume verallgemeinern. Definition 12.1. Sei (X , dX ) ein metrischer Raum. (1)
Man nennt (X, dX ) folgenkompakt, falls jede Folge (xn )n∈IN in X eine in (X, dX ) konvergente Teilfolge besitzt.
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_12, © Springer-Verlag Berlin Heidelberg 2012
165
166
12 Kompaktheit
(2)
Man sagt, (X, dX ) ist total beschr¨ankt, falls f¨ur jedes > 0 eine endliche Menge von Punkten {x1 , . . . , xn } ⊆ X existiert, sodass X ⊆ Die endliche Menge {x1 , . . . , xn } heißt dann -Netz.
n *
k=1
U (xk ) gilt.
Bevor wir die Eigenschaft (3) formulieren k¨onnen, ben¨otigen wir eine exakte Formulierung der Begriffe offen“ und abgeschlossen“ in metrischen R¨aumen. ” ” Definition 12.2. Sei (X , dX ) ein metrischer Raum. Eine Teilmenge U ⊆ X heißt offen in X , wenn es zu jedem a ∈ U ein > 0 gibt mit U (a) ⊆ U. (Die leere Menge ist auch offen!) Eine Teilmenge A ⊆ X heißt abgeschlossen in X , wenn X \ A offen in X ist. Eine Menge U ⊆ X heißt Umgebung von a ∈ X , falls ein > 0 existiert mit U (a) ⊆ U. Insbesondere ist U (a) f¨ur jedes > 0 eine Umgebung von a in X . Diese Umgebungen heißen -Umgebungen. Beispiele: (1)
In IR sind die Intervalle ]a, b[ offen und [a, b] abgeschlossen.
(2)
In jedem metrischen Raum (X , dX ) ist X offen.
(3)
In jedem metrischen Raum (X , dX ) ist U (a) offen und K (a) abgeschlossen.
Man beachte, dass es stets Mengen gibt, die sowohl abgeschlossen als auch offen in X sind (z.B. X selbst). Es kann auch Teilmengen geben, die weder offen noch abgeschlossen sind (z.B. Q in IR). Weitere Beispiele: (4) (5) (6)
Die Intervalle [a, [ und ] − , b] sind abgeschlossen in IR. Die Intervalle ]a, [ und ] − , b[ sind offen in IR. Die Mengen ZZ und 1n : n ∈ ZZ \ {0} ∪ {0} sind abgeschlossen in IR. Sei X eine Menge versehen mit der diskreten Metrik, vgl. Beispiel (2) in Kapitel 4.1. Dann ist jede Teilmenge von X offen und auch abgeschlossen.
Satz 12.3. Sei (X, dX ) ein metrischer Raum; U,V und Ui (i ∈ I, I eine beliebige Indexmenge) seien offene Mengen in X. Dann gelten: (a)
∅ und X sind offen in X .
(b)
U ∩V ist offen in X.
(c)
W :=
*
i∈I
Ui ist offen in X.
Beweis. (a) wissen wir bereits. Zum Nachweis von (b) sei x ∈ U ∩V . Dann gibt es > 0 mit U (x) ⊆ U und > 0 mit U (x) ⊆ V . F¨ur := min( , ) gilt dann U (x) ⊆ U ∩V . Also ist U ∩V offen. Wir zeigen noch (c). Ist x ∈ W so gilt x ∈ Ui0 * f¨ur (mindestens) ein i0 ∈ I und damit existiert > 0 mit U (x) ⊆ Ui0 , also U (x) ⊆ Ui .
i∈I
12.1 Kompakte metrische R¨aume
167
Satz 12.4. Seien (X , dX ) und (Y, dY ) metrische R¨aume, f : X → Y eine Abbildung. Folgende Eigenschaften sind a¨ quivalent: (i)
f ist stetig.
(ii)
F¨ur jede offene Teilmenge V ⊆ Y ist das Urbild f −1 (V ) offen in X.
(iii)
F¨ur jede abgeschlossene Teilmenge B ⊆ Y ist f −1 (B) abgeschlossen in X.
Beweis. (i)⇒(ii): Sei V offen in Y . Zu a ∈ f −1 (V ) und b = f (a) ∈ V existiert ein > 0 mit U (b) ⊆ V . Wegen der Stetigkeit von f gibt es > 0 mit f (U (a)) ⊆ U (b), also gilt U (a) ⊆ f −1 (V ). Damit ist gezeigt, daß f −1 (V ) offen ist. (ii)⇒(i): Seien a ∈ X , > 0. Da U ( f (a)) offen in Y ist, ist auch U := f −1 (U ( f (a))) offen in X . Daher gibt es ein > 0 mit U (a) ⊆ U. Dies bedeutet f (U (a)) ⊆ U ( f (a)), d.h. f ist in a stetig. (ii)⇒(iii): Sei B ⊆ Y abgeschlossen. Dann ist Y \ B offen in Y und damit auch f −1 (Y \ B) = X \ f −1 (B) offen in X . Somit ist f −1 (B) abgeschlossen. Ganz analog zeigt man auch (iii)⇒(ii).
¨ Sei nun K ⊆ (X , dX ). Eine offene Uberdeckung von K ist eine Familie {Ui : i ∈ I} (I eine beliebige Indexmenge) von offenen Teilmengen von X , sodass K ⊆
+
Ui .
i∈I
Definition 12.5. Eine Teilmenge K des metrischen Raumes (X , dX ) heißt kompakt, ¨ falls jede offene Uberdeckung von K eine endliche Teil¨uberdeckung von K enth¨alt. ¨ Mit anderen Worten: Zu jeder offenen Uberdeckung {Ui : i ∈ I} von K existieren endlich viele Indizes i1 . . . , in ∈ I, sodass K ⊆
n +
Ui j
j=1
gilt. (Selbstverst¨andlich kann auch K = X sein.) Zun¨achst wollen wir zwei Beispiele f¨ur nicht kompakte Mengen angeben. (1)
(2)
Sei X = IR (mit der nat¨urlichen Metrik). Dann ist {Un : n ∈ IN} mit Un := ¨ ] − n, n[ eine offene Uberdeckung von IR. Mit endlich vielen dieser Un kann man offensichtlich nicht ganz IR u¨ berdecken. Also ist IR nicht kompakt. & 1 1' ¨ Sei wieder X = IR und K = ]0, 1[. Es ist 3n , n : n ∈ IN eine offene Uberdeckung von ]0, 1[. Es gibt daraus keine endliche Teil¨uberdeckung, denn zu jeder solchen Teil¨uberdeckung geh¨oren endlich viele Indizes n1 , . . . , nk . Aus diesen w¨ahle den gr¨oßten Index n. k , * 1 1 1 Dann ist 4n ∈ / , 3n j n j . Also ist ]0, 1[ nicht kompakt. j=1
168
12 Kompaktheit
Wir werden in K¨urze sehen, dass [0, 1] kompakt ist. Wir werden sogar zeigen, dass eine Teilmenge K ⊆ IR genau dann kompakt ist, wenn sie beschr¨ankt und abgeschlossen ist. Ein erster Schritt ist der folgende Sachverhalt, der f¨ur jeden metrischen Raum gilt. Satz 12.6. Sei K eine kompakte Teilmenge des metrischen Raumes (X , dX ). Dann ist K abgeschlossen und beschr¨ankt. Beweis. Zur Beschr¨anktheit w¨ahle a ∈ K. (Im Fall K = ∅ ist die Behauptung klar.) ¨ Dann ist {Un (a) : n ∈ IN} eine offene Uberdeckung von K und es gibt endlich viele n1 , . . . , nk , sodass k +
K ⊆
j=1
Unk (a)
gilt. Mit m := max(n1 , . . . , nk ) folgt dann K ⊆ Um (a), also ist K beschr¨ankt. Wir m¨ussen noch zeigen, dass X \ K offen ist. Sei dazu a ∈ X \ K. (F¨ur X \ K = ∅ gilt die Behauptung offensichtlich.) Zu zeigen ist, dass es > 0 gibt mit U (a) ⊆ X \ K. F¨ur x ∈ K setzen wir (x) := 12 d(x, a) > 0. Nun ist {U (x) (x) : x ∈ K} eine offene ¨ Uberdeckung von K und, da K kompakt ist, gibt es endlich viele x1 , . . . , xn ∈ K mit K ⊆
n + j=1
U (x j ) (x j ) .
Weiter sei := min{ (x1 ), . . . , (xn )}. Es gilt > 0. Wir wollen noch einsehen, dass U (a) ⊆ X \ K ist. Zu jedem x ∈ K gibt es ein j ∈ {1, . . . , n} mit x ∈ U (x j ) (x j ), also d(x, x j ) < (x j ). Folglich gilt mit der Dreiecksungleichung d(x, a) ≥ d(x j , a) − d(x, x j ) > 2 (x j ) − d(x, x j ) > (x j ) ≥ , also x ∈ / U (a). Damit gilt U (a) ⊆ X \ K.
Das n¨achste Resultat erleichtert den Nachweis der Kompaktheit einer Teilmenge erheblich, falls man die Kompaktheit einer Obermenge weiß. Satz 12.7. Sei K eine kompakte Teilmenge des metrischen Raumes (X , dX ). Ist A ⊆ K abgeschlossen, so ist A kompakt. ¨ Beweis. Sei {Ui : i ∈ I} eine offene Uberdeckung von A. ¨ Damit ist {Ui : i ∈ I} ∪ {X \ A} eine offene Uberdeckung von K. Also existieren endlich viele i1 , . . . , in ∈ I mit K⊆
n +
Ui j ∪ (X \ A)
j=1
(wobei man X \ A eventuell gar nicht braucht). Nun gilt A ⊆
n * j=1
Ui j .
12.1 Kompakte metrische R¨aume
169
Von großer Bedeutung ist der Begriff Kompaktheit in Verbindung mit der Stetigkeit. Satz 12.8. Seien (X , dX ) und (Y, dY ) metrische R¨aume und f : X → Y eine stetige Abbildung. Weiter sei K ⊆ X kompakt. Dann ist auch f (K) kompakt. ¨ Beweis. Sei {Ui : i ∈ I} eine offene Uberdeckung von f (K) in Y . −1 ¨ Mit Satz 12.4 ist dann { f (Ui ) : i ∈ I} eine offene Uberdeckung von K, denn jedes x ∈ K erf¨ullt f (x) ∈ Ui f¨ur ein geeignetes i ∈ I. Daher existieren i1 , . . . , in ∈ I mit K ⊆ Also ist f (K) kompakt.
n *
j=1
f −1 (Ui j ) und es folgt f (K) ⊆
n *
j=1
Ui j .
Korollar 12.9. Seien (X, dX ) ein kompakter metrischer Raum und f : X → IR eine stetige Abbildung. Dann nimmt f ihr Supremum und ihr Infimum an, d.h. es existieren a, b ∈ X mit f (a) = sup{ f (x) : x ∈ X} = max{ f (x) : x ∈ X } , f (b) = inf{ f (x) : x ∈ X } = min{ f (x) : x ∈ X } . Beweis. Laut Satz 12.8 ist f (X ) kompakt, also auch abgeschlossen und beschr¨ankt. Folglich existieren M := sup{ f (x) : x ∈ X } und m := inf{ f (x) : x ∈ X } in IR. Angenommen, es gilt M ∈ / f (X ). Dann g¨abe es, da IR \ f (X ) offen ist, ein > 0 mit ]M − , M + [ ⊆ IR \ f (X ) und M − w¨are eine kleinere obere Schranke von f (X) als M. Daher muss M ∈ f (X ) und analog auch m ∈ f (X ) sein.
Bemerkung: Korollar 12.9 verallgemeinert die Aussage von Satz 6.16, in welchem X = [a, b] vorausgesetzt wird. Korollar 12.10. Seien (X , dX ) und (Y, dY ) zwei metrische R¨aume. Weiter seien (X, dX ) kompakt und f : X → Y eine stetige bijektive Abbildung. Dann ist die Umkehrabbildung f −1 : Y → X auch stetig. Beweis. Wir verwenden die Stetigkeits-Charakterisierung (iii) aus Satz 12.4. Sei B ⊆ X abgeschlossen. Laut Satz 12.7 ist B kompakt, und mit Satz 12.8 folgt, dass f (B) kompakt in Y ist. Nach Satz 12.6 ist schließlich f (B) = ( f −1 )−1 (B) abgeschlossen in Y . Somit ist f −1 stetig.
Wir wollen uns kurz an einem Beispiel veranschaulichen, dass auf die Kompaktheit von X nicht verzichtet werden kann. Die Funktion f : [0, 2 [ → T := {z ∈ C : |z| = 1}, f (t) := eit = cost + i sint, ist eine bijektive Abbildung von [0, 2 [ auf T. Sie ist bekanntermaßen stetig. Ihre Umkehrabbildung ist jedoch nicht stetig im Punkt 1 ∈ T, denn jede Umgebung dieses Punktes wird durch f −1 abgebildet auf eine Menge, die auch Punkte in der N¨ahe von 2 enth¨alt.
170
12 Kompaktheit
Nach den gezeigten Ergebnissen ist es an der Zeit, kompakte Mengen n¨aher zu beschreiben. Notwendigerweise sind kompakte Mengen abgeschlossen und beschr¨ankt. F¨ur Teilmengen von IK (sogar IKn ) ist dies auch hinreichend f¨ur Kompaktheit, wie wir noch sehen werden. Der n¨achste Satz und das folgende Korollar verallgemeinern eine Eigenschaft der Intervallschachtelungen in IR. Satz 12.11. Sei K = {Ki : i ∈ I} eine Familie von kompakten Teilmengen eines metrischen Raumes (X , d) derart, dass der Schnitt von endlich vielen Mengen aus K stets nicht leer ist. Dann gilt Ki = ∅. i∈I
Beweis. Wir w¨ahlen ein festes K ∈ K und setzen Ui := X \ Ki . Angenommen, es gilt * ∅ = Ki = K ∩ ( Ki ). Dann ist K ⊆ X \ ( Ki ), also K ⊆ Ui . i∈I
i∈I
i∈I
i∈I
¨ Demnach ist {Ui : i ∈ I} ist eine offene Uberdeckung von K. Da K kompakt ist, reichen endlich viele Ui1 , . . . ,Uin aus, um K zu u¨ berdecken, etwa K ⊆
n *
j=1
Ui j . Nun folgt K ∩ (
n
j=1
Ki j ) = ∅, im Widerspruch zu Voraussetzung.
Wir notieren noch einen Spezialfall. Korollar 12.12. Ist {Kn : n ∈ IN} eine Folge kompakter (nicht leerer) Mengen eines metrischen Raumes mit Kn ⊇ Kn+1 f¨ur alle n, so gilt
n=1
Kn = ∅.
Wir erinnern an die Definition von folgenkompakt und total beschr¨ankt. Der n¨achste Satz sagt aus, dass ein kompakter metrischer Raum stets folgenkompakt ist. Satz 12.13. In einem kompakten metrischen Raum (X , d) besitzt jede Folge (xn )n∈IN eine konvergente Teilfolge. Beweis. Wenn die Menge {xn : n ∈ IN} endlich ist, gibt es sogar eine konstante Teilfolge und die Behauptung ist erf¨ullt. Sei also {xn : n ∈ IN} unendlich. Wir benutzen Lemma 4.17 und nehmen an, dass kein Punkt aus X H¨aufungswert von (xn )n∈IN ist. Dann gibt es zu jedem a ∈ X eine offene Umgebung Va , die h¨ochstens einen Punkt aus {xn : n ∈ IN} enth¨alt (n¨amlich xm , falls a = xm f¨ur ein m ∈ IN ist). ¨ Andererseits ist {Va : a ∈ X } eine offene Uberdeckung von X und, da X kompakt ist, gibt es eine endliche Teilfamilie, die bereits ganz X u¨ berdeckt. Dies steht im Widerspruch dazu, dass die Vereinigung endlich vieler der Va noch nicht einmal die Menge {xn : n ∈ IN} ganz enthalten kann. Daher ist die Annahme falsch. Die Folge besitzt demnach einen H¨aufungswert und damit auch eine (vgl. Lemma 4.17) gegen diesen konvergente Teilfolge.
Satz 12.14. Sei (X , d) ein metrischer Raum. Ist X folgenkompakt, so ist X auch total beschr¨ankt und vollst¨andig.
12.2 Charakterisierung kompakter Mengen
171
Beweis. Zum Nachweis der Vollst¨andigkeit sei (xn )n∈IN eine Cauchyfolge in X . Wir m¨ussen zeigen, dass diese einen Grenzwert in X besitzt. Da X folgenkompakt ist, existiert wenigstens eine konvergente Teilfolge (xnk )k∈IN mit lim xnk =: x ∈ X. k→
Sei > 0. Es gibt N1 ∈ IN mit d(xn , xm ) < 2 f¨ur alle n, m ≥ N1 . Ferner gibt es N2 ∈ IN mit d(xnk , x) < 2 f¨ur alle k ≥ N2 . Setze N := max{N1 , N2 }. Zu n ≥ N w¨ahlen wir ein k ≥ N2 mit nk ≥ N1 und erhalten d(xn , x) ≤ d(xn , xnk ) + d(xnk , x) < . Daher konvergiert auch (xn )n∈IN gegen x und die Vollst¨andigkeit ist bewiesen. Wir nehmen nun an, dass X nicht total beschr¨ankt ist. Dann existiert ein > 0, sodass es kein -Netz f¨ur X gibt. Nun k¨onnen wir rekursiv eine Folge (xn )n∈IN konstruieren mit d(xn , xm ) ≥ f¨ur alle n, m ∈ IN, n = m: Sind x1 , . . . , xn bereits gefunden, so erh¨alt man xn+1 durch Auswahl eines Elementes aus X \
n *
k=1
U (xk ) = ∅.
Offensichtlich gilt d(xk , xn+1 ) ≥ f¨ur alle k = 1, . . . , n. Diese Folge kann aber keine konvergente Teilfolge enthalten. Damit ist die Behauptung nachgewiesen.
12.2 Charakterisierung kompakter Mengen Betrachtet man Satz 12.13 und Satz 12.14 zusammen, so stellt sich die Frage, ob aus totaler Beschr¨anktheit plus Vollst¨andigkeit die Kompaktheit folgt. In der Tat gilt der folgende Satz. Satz 12.15. Sei (X , d) ein metrischer Raum. Folgende Bedingungen sind a¨ quivalent: (i)
X ist kompakt.
(ii)
X ist folgenkompakt.
(iii)
X ist total beschr¨ankt und vollst¨andig.
Beweis. Es bleibt nur noch die Implikation (iii)⇒(i) zu zeigen. Sei also X total beschr¨ankt und vollst¨andig. ¨ Wir nehmen an, dass X nicht kompakt ist, d.h. es existiere eine offene Uberdeckung {Ui : i ∈ I} von X , die keine endliche Teil¨uberdeckung von X enth¨alt. Gest¨utzt auf diese Annahme konstruieren wir eine Folge (xn )n∈IN in X mit (1) (2)
1 , 2n−1 U1/2n−1 (xn ) kann nicht durch eine endliche Teil¨uberdeckung von {Ui : i ∈ I} u¨ berdeckt werden. d(xn , xn+1 ) ≤
172
12 Kompaktheit
Wir starten mit n = 1. Sei {y1 , . . . , ym } ein 1-Netz. Dann ist X =
m * k=1
U1 (yk ).
Nach Annahme existiert mindestens ein U1 (yk ), das nicht von endlich vielen Ui u¨ berdeckt wird; wir setzen x1 := yk . Seien x1 , . . . , xn bereits gefunden, sodass (1) und (2) gelten. Da U1/2n−1 (xn ) offensichtlich total beschr¨ankt ist, finden wir ein U1/2n−1 (xn ), welches wir mit {y1 , . . . , ym } bezeichnen.
1 2n -Netz
f¨ur
Wegen (2) kann U1/2n−1 (xn ) nicht durch endlich viele Ui u¨ berdeckt werden, also existiert ein U1/2n (yk ) das auch nicht durch endlich viele Ui u¨ berdeckt wird. Setze xn+1 := yk und die Folge (xn )n∈IN mit den geforderten Eigenschaften ist rekursiv konstruiert. Nun ist diese eine Cauchyfolge, denn f¨ur m > n gilt d(xm , xn ) ≤ d(xm , xm−1 ) + d(xm−1 , xm−2 ) + . . . + d(xn+1, xn ) ≤
1 2m−2
+ ...+
1 2n−1
<
2 2n−1
=
1 2n−2
.
Da X vollst¨andig ist, existiert x := lim xn ∈ X . n→
Weiter gibt es j ∈ I mit x ∈ U j und > 0 mit U (x) ⊆ U j . Dazu finden wir N ∈ IN 1 mit d(xn , x) < 2 und 2n−1 < 2 f¨ur alle n ≥ N. F¨ur y ∈ U1/2N−1 (xN ) gilt nun d(y, x) ≤ d(y, xN ) + d(xN , x) <
1 + < , 2N−1 2
also U1/2N−1 (xN ) ⊆ U (x) ⊆ U j im Widerspruch zu (2). Damit war unsere Annahme falsch und X ist kompakt.
Dieser wichtige Satz liefert eine Charakterisierung kompakter Mengen. Speziell f¨ur Teilmengen A ⊆ (IKd , · 2 ) reicht es nun zu zeigen, dass A folgenkompakt ist. Ziehen wir den Satz von Bolzano-Weierstraß (genauer: Korollar 4.20) heran, so sieht man, dass noch zu untersuchen ist, f¨ur welche Mengen A ⊆ IKd folgendes gilt: Ist (an )n∈IN eine konvergente Folge in IKd mit an ∈ A f¨ur alle n ∈ IN, so ist auch a = lim an ∈ A. Dazu machen wir folgende Beobachtung. n→
Lemma 12.16. Seien A eine beliebige Teilmenge eines metrischen Raumes (X , d) und a ∈ X. Es gibt eine Folge (an )n∈IN mit an ∈ A f¨ur alle n und a = lim an genau dann, wenn f¨ur jedes > 0 der Schnitt A ∩U (a) nicht leer ist.
n→
Beweis. Existiert eine derartige Folge, so gilt bei beliebigem > 0 stets d(an , a) < f¨ur alle bis auf h¨ochstens endlich viele n, also an ∈ A ∩U (a) f¨ur alle diese n. Ist umgekehrt A ∩ U (a) = ∅ f¨ur alle > 0, so gibt es zu jedem n ∈ IN ein an ∈ A mit d(an , a) < 1n . Damit gilt a = lim an .
n→
12.2 Charakterisierung kompakter Mengen
173
Satz 12.17 (Charakterisierung abgeschlossener Teilmengen). Sei A eine Teilmenge eines metrischen Raumes (X , d). Die Menge A ist abgeschlossen in X genau dann, wenn f¨ur jede in X konvergente Folge (an )n∈IN mit an ∈ A ∀n auch a := lim an ∈ A gilt. n→
Beweis. Seien A abgeschlossen in X und (an )n∈IN eine Folge mit an ∈ A ∀n und a = lim an . n→
W¨are a ∈ X \ A, so g¨abe es ein > 0 mit U (a) ⊆ X \ A, da X \ A offen ist, und damit U (a) ∩ A = ∅. Dies steht im Widerspruch dazu, dass U (a) sogar unendlich viele an ∈ A enthalten muss. F¨ur die umgekehrte Implikation bezeichne A := {a ∈ X : ∃ (an )n∈IN , an ∈ A ∀n ∈ IN , a = lim an } . n→
Offensichtlich gilt immer A ⊆ A, denn zu a ∈ A kann man an = a ∀n w¨ahlen. Nach Voraussetzung gilt nun A = A. Wir m¨ussen zeigen, dass X \ A offen ist. Sei dazu a ∈ X \ A = X \ A. Dann gibt es keine Folge (an )n∈IN mit an ∈ A ∀n und a = lim an . Nach Lemma 12.16 existiert > 0 mit U (a) ⊆ X \ A. n→
Folglich ist X \ A offen, also A abgeschlossen in X .
Die Menge A aus dem Beweis von Satz 12.17 nennt man den Abschluss (oder die abgeschlossene Hulle) ¨ von A. Jeder Punkt a ∈ A heißt Beruhrpunkt ¨ von A. In IR gilt beispielsweise ]a, b[ = [a, b] = ]a, b]. Allgemein gilt Ur (x) = Kr (x). Nun k¨onnen wir alle kompakten Teilmengen in (IKd , · 2 ) charakterisieren. Korollar 12.18. Sei K eine Teilmenge des Euklidischen Raumes (IKd , · 2). Folgende Eigenschaften sind a¨ quivalent: (i)
K ist kompakt.
(ii)
K ist abgeschlossen und beschr¨ankt.
Beweis. Die Implikation (i)⇒(ii) gilt in jedem metrischen Raum (Satz 12.6). Sei nun K abgeschlossen und beschr¨ankt. Laut Korollar 4.20 besitzt jede Folge in K eine konvergente Teilfolge. Da K abgeschlossen ist, liegt auch deren Grenzwert in K, siehe Satz 12.17. Also ist K folgenkompakt; mit Satz 12.15 ist K dann auch kompakt.
Insbesondere sind alle Kr (a) ⊆ IKd oder [a1 , b1 ] × . . . × [ad , bd ] ⊆ IRd kompakt. Wir wollen noch ein Beispiel angeben f¨ur eine Teilmenge eines metrischen Raumes, die zwar abgeschlossen und beschr¨ankt, aber nicht kompakt ist.
174
12 Kompaktheit
In (2 , · 2), vgl. Kapitel 5.6, betrachten wir em := (0, . . . , 0, 1, 0, 0, . . .) ↑ m-te Stelle
f¨ur m ∈ IN und M := {em : m ∈ IN}. Die Menge M ist beschr¨ √ankt, denn es gilt x2 = 1 f¨ur alle x ∈ M. Weiter gilt f¨ur k = m stets em − ek 2 = 2; daher ist eine Folge in M nur dann konvergent, wenn sie ab einem gewissen Index konstant ist, und ihr Grenzwert geh¨ort dann offensichtlich wieder zu M. Folglich ist M auch abgeschlossen in (2 , · 2). ¨ Allerdings ist M nicht kompakt, denn wir k¨onnen leicht eine offene Uberdeckung von M angeben, die keine endliche Teil¨uberdeckung besitzt: Wir setzen ¨ Vm := U1 (em ). Dann ist {Vm : m ∈ IN} nach Konstruktion eine offene√Uberdeckung von M. Da zwei beliebige Elemente aus M aber stets den Abstand 2 haben, gilt Vm ∩ M = {em } f¨ur alle m. Damit ist auch klar, dass endlich viele der Vm niemals ausreichen k¨onnen, um M zu u¨ berdecken. Abschließend wenden wir uns wieder stetigen Funktionen zu und erinnern an den Begriff der gleichm¨aßigen Stetigkeit, siehe Definition 6.17. Man beachte die Unterschiede zwischen gleichm¨aßiger Stetigkeit und Stetigkeit. Aus gleichm¨aßiger Stetigkeit folgt Stetigkeit. Aber: Gleichm¨aßige Stetigkeit ist die Eigenschaft einer Funktion auf einer Menge, Stetigkeit wird f¨ur Punkte aus der Menge erkl¨art. In der - -Definition der Stetigkeit in einem Punkt p ∈ X kann das zu findende von p ∈ X abh¨angen. Bei gleichm¨aßiger Stetigkeit h¨angt nur von ab und die - -Bedingung gilt auf ganz X. Wir zeigen noch eine Verallgemeinerung von Satz 6.18. Satz 12.19. Seien (X , dX ) und (Y, dY ) zwei metrische R¨aume, f : X → Y eine stetige Abbildung. Ist (X , dX ) kompakt, so ist f gleichm¨aßig stetig auf X. Beweis. Wir nehmen an, dass f nicht gleichm¨aßig stetig auf X ist. Dann gibt es > 0, sodass zu beliebigem n ∈ IN Punkte xn , yn ∈ X mit dX (xn , yn ) < 1n aber dY ( f (xn ), f (yn )) ≥ existieren. Da (X , dX ) kompakt und damit auch folgenkompakt ist, existiert eine Teilfolge (xnk )k∈IN , die gegen ein x ∈ X konvergiert. Wegen dX (xn , yn ) < 1n konvergiert auch ynk → x und mit der Stetigkeit von f folgt f (xnk ) → f (x) sowie auch f (ynk ) → f (x) f¨ur k → . Andererseits gilt
≤ dY f (xnk ), f (ynk ) ≤ dY f (xnk ), f (x) + dY f (ynk ), f (x) f¨ur alle k und wir erhalten einen Widerspruch.
12.3 Aufgaben
175
Bemerkung: Man kann den Begriff der Kompaktheit auch noch verallgemeinern, ohne dabei auf einen metrischen Raum zur¨uckgreifen zu m¨ussen. Seien M eine beliebige Menge und T ein System von Teilmengen von M mit den folgenden Eigenschaften: (i)
∅, M ∈ T
(ii)
Der Schnitt zweier Mengen aus T geh¨ort stets wieder zu T.
(iii)
Die Vereinigung beliebig vieler Mengen aus T geh¨ort stets wieder zu T.
Dann bezeichnet man T als eine Topologie auf M. Satz 12.3 besagt also, dass die in einem metrischen Raum (X , d) offenen Mengen eine Topologie auf X bilden. In Anlehnung daran heißen die Elemente einer Topologie offen, auch wenn kein metrischer Raum zu Grunde liegt. Nun kann man ¨ auch abgeschlossene (als Komplemente von offenen) Mengen und mittels Uberdeckungen auch kompakte Mengen erkl¨aren. Sogar Stetigkeit kann sinnvoll definiert werden, wenn man hierzu die Charakterisierung analog zu Satz 12.4 verwendet. Eine Einf¨uhrung in die Topologie findet man z.B. in B¨uchern von K. J¨anich [10] oder B. von Querenburg [18].
12.3 Aufgaben 1. Untersuchen Sie direkt an Hand der Definition (also ohne Hilfe von Korollar 12.18), welche der folgenden Mengen kompakt in IR sind: A := ] − 1, 1[ B := 1n : n ∈ IN C := B ∪ {0} 2. Zeigen Sie: Jede endliche Teilmenge eines metrischen Raumes ist kompakt. 3. Seien K1 , . . . , Kn kompakte Mengen in einem metrischen Raum (X , d). Zeigen Sie, dass auch
n * j=1
K j kompakt ist.
4. Zeigen Sie, dass Q weder offen noch abgeschlossen in IR ist. 5. Zeigen Sie, dass ] − 1, 1[ weder offen noch abgeschlossen in C ist. 6. Seien X eine Menge, dX die diskrete Metrik auf X . a. Zeigen Sie, dass jede Teilmenge M ⊆ X sowohl offen als auch abgeschlossen in (X, dX ) ist. b. Sei (Y, dY ) ein weiterer metrischer Raum. Bestimmen Sie alle stetigen Abbildungen (X , dX ) → (Y, dY ).
176
12 Kompaktheit
7. Geben Sie jeweils ein Beispiel einer stetigen Funktion f : IR → IR an mit der Eigenschaft: a. Es gibt eine offene Menge U derart, dass f (U) nicht offen ist. b. Es gibt eine abgeschlossene Menge A derart, dass f (A) nicht abgeschlossen ist. 8. Gegeben seien die folgenden Mengen: a.
M ⊆ IRn endlich;
b.
M = [0, 1]× ]0, 1[ ;
c.
X = IR3 . M = {(x, y, z) ∈ IR3 : 0 < x2 + y2 + z2 < 1};
X = IR2 . M = x, sin 1x ∈ IR2 : x = 0 ;
d.
X = IRn . X = IR2 .
Ist M offen in X ? Ist M abgeschlossen in X ? Bestimmen Sie jeweils den Abschluss M von M in X. 9.
a. Seien (M, d) ein vollst¨andiger metrischer Raum und T ⊆ M. Zeigen Sie: T ist abgeschlossen in M genau dann, wenn (T, d) vollst¨andig ist. b. Folgern Sie: Ein abgeschlossener Unterraum eines Banachraumes ist selbst auch ein Banachraum. c. Bestimmen Sie den Abschluss des Raumes T ([a, b]) der Treppenfunktionen in (B([a, b]), · ).
10. Gegeben sei eine Funktion f : I → IR auf einem kompakten Intervall I. Zeigen Sie, dass f genau dann stetig ist, wenn der Graph G f := {(x, f (x) ) : x ∈ I} kompakt im IR2 ist.
Kapitel 13
Normierte Vektorr¨aume
Als Vektorraum wollen wir diesem Kapitel stets einen Vektorraum u¨ ber dem K¨orper IR verstehen. Bevor wir Abbildungen von Intervallen in normierte Vektorr¨aume untersuchen, werden wir die Stetigkeit von linearen Abbildungen zwischen normierten Vektorr¨aumen diskutieren. Seien V und W Vektorr¨aume. Eine Abbildung L : V → W heißt linear, wenn ¨ L( x + y) = L(x) + L(y) f¨ur alle x, y ∈ V und alle , ∈ IR gilt. Ublicherweise schreibt man oft kurz Lx an Stelle von L(x). Wenn wir von normierten Vektorr¨aumen V und W sprechen, so bezeichnen wir, wenn nicht anders angegeben, die zugeh¨origen Normen mit · V bzw. · W . Einige Grundlagen, wie etwa den Begriff Basis eines Vektorraumes oder die Darstellung einer linearen Abbildung zwischen endlichdimensionalen Vektorr¨aumen mittels einer Matrix, setzen wir hier als bekannt voraus. Dar¨uberhinaus sei auch auf Lehrb¨ucher zur linearen Algebra, wie etwa G. Fischer [5], verwiesen.
13.1 Stetige lineare Abbildungen Satz 13.1. Seien V und W normierte Vektorr¨aume sowie L : V → W linear. Die folgenden Eigenschaften sind a¨ quivalent: (i) (ii) (iii)
Die Abbildung L ist gleichm¨aßig stetig auf V . Die Abbildung L ist stetig im Nullpunkt 0V von V . Die Menge {LxW : x ∈ V, xV ≤ 1} ist beschr¨ankt.
Beweis. Der Schluss (i)⇒(ii) ist selbstverst¨andlich. Die Implikation (ii)⇒(iii) zeigen wir indirekt. Angenommen, die Menge in (iii) ist unbeschr¨ankt. Dann existiert zu jedem n ∈ IN ein xn ∈ V mit xn V ≤ 1 und Lxn W ≥ n. F¨ur yn := 1n xn gilt dann yn V ≤ 1n und Lyn W = 1n Lxn W ≥ 1. Da f¨ur eine lineare Abbildung L : V → W stets L 0V = 0W gilt, folgt wegen lim yn = 0V , dass L in 0V nicht stetig ist. n→
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_13, © Springer-Verlag Berlin Heidelberg 2012
177
178
13 Normierte Vektorr¨aume
Zu zeigen bleibt (iii)⇒(i). Nach Voraussetzung ist M := sup{LxW : x ∈ V, xV ≤ 1} < . Wir wollen sehen, dass Lx − LyW ≤ Mx − y f¨ur alle x, y ∈ V gilt. Daraus folgt direkt die gleichm¨aßige Stetigkeit von L auf V . Zum Nachweis braucht nur der Fall x = y betrachtet zu werden. Dann haben wir 1 x − yV > 0 und f¨ur z := x−y (x − y) gilt zV = 1. V Somit ist
1 x−yV
L(x − y)W = LzW ≤ M und wir sind am Ziel.
Definition 13.2. Zu jeder stetigen linearen Abbildung L : V → W normierter Vektorr¨aume wird die Operatornorm definiert durch L := sup{LxW : x ∈ V, xV ≤ 1} . Die Menge aller stetigen linearen Abbildungen V → W bezeichnen wir mit L (V,W ). Satz 13.3. Mit der Operatornorm ist L (V,W ) ein normierter Vektorraum. Beweis. Die Gesamtheit der linearen Abbildungen V → W bildet (unter punktweiser Addition und Skalarmultiplikation) einen Vektorraum. Da Summen und reelle Vielfache stetiger Abbildungen wiederum stetig sind, ist die Teilmenge L (V,W ) ein Untervektorraum. Es bleibt zu zeigen, dass die Operatornorm auch tats¨achlich eine Norm ist. Nach Konstruktion ist stets L ≥ 0. Im Fall L = 0 gilt Lx = 0V f¨ur alle x ∈ V mit xV ≤ 1. Daraus folgt Lx = 0V f¨ur alle x ∈ V , also L = 0. Dies beweist (N1). F¨ur nichtleere, beschr¨ankte Mengen B ⊆ IR und r ≥ 0 gilt bekanntlich sup(rB) = r sup B. Dies liefert f¨ur ∈ IR und L ∈ L (V,W ) stets L = | | L; somit ist auch (N2) erf¨ullt. F¨ur L, L ∈ L (V,W ) und x ∈ V haben wir (L + L )xW = Lx + L xW ≤ LxW + L xW . Zun¨achst folgt (L + L )xW ≤ L + L f¨ur x ∈ V mit xV ≤ 1 und daraus dann (L + L ) ≤ L + L, die Dreiecksungleichung (N3).
Bemerkungen: (1)
Mit der Operatornorm erh¨alt man die Absch¨atzung LxW ≤ L xV f¨ur alle L ∈ L (V,W ) und alle x ∈ V .
(2)
Im Fall V = W schreibt man L (V ) := L (V,V ) und nennt L ∈ L (V ) einen stetigen Endomorphismus von V . Mit L, L ∈ L (V ) gilt auch LL := L ◦ L ∈ L (V ). Aus der Absch¨atzung LL xV ≤ L L xV ≤ L L xV ergibt sich schließlich noch die so genannte Submultiplikativit¨at der Operatornorm: LL ≤ L L
f¨ur alle L, L ∈ L (V ) .
13.1 Stetige lineare Abbildungen
179
Beispiel: F¨ur x = (xn )n∈IN ∈ 2 sei Lx := Mit yn :=
1 n
x1 1
, x22 , x33 , . . . .
ist y = (yn )n∈IN ∈ 2 und laut Satz 5.23 gilt Lx = xy ∈ 1 .
Damit ist eine (wie man leicht nachpr¨ufen kann) lineare Abbildung L : 2 → 1 erkl¨art. Da nach Satz 5.23 auch Lx1 ≤ x2 y2 gilt, haben wir insbesondere Lx1 ≤ y2 f¨ur alle x ∈ 2 mit x2 ≤ 1. Daraus folgt die Stetigkeit von L und auch L ≤ y2 . Betrachtet man speziell x =
1 y2
y, so gilt x2 = 1 und Lx1 = y2 .
Insgesamt erhalten wir
L = y2 =
1 n2 n=1
1 2
=√ . 6
Definition 13.4. Zwei Normen · und · auf einem Vektorraum V heißen a¨ quivalent, wenn es Schranken M, M > 0 gibt mit x ≤ M x
und x ≤ M x
f¨ur alle x ∈ V .
Satz 13.5. (a) Zwei Normen eines Vektorraums V sind genau dann a¨ quivalent, wenn sie die selben Cauchyfolgen besitzen. ¨ (b) Aquivalente Normen haben die selben offenen Mengen. Beweis. (a) Seien · und · a¨ quivalente Normen und (xn )n∈IN eine Folge in V . Dann gilt xm − xn ≤ M xm − xn
und
xm − xn ≤ M xm − xn
f¨ur alle m, n ∈ IN. Daher ist eine Cauchyfolge in der einen Norm zugleich Cauchyfolge in der anderen Norm. Sind die Normen · und · nicht a¨ quivalent, dann existiert wenigstens eine der Schranken M, M nicht. Wenn etwa kein M im Sinne der Definition existiert, dann gibt es zu jedem n ∈ IN ein xn ∈ V mit xn ≤ 1 und xn ≥ n2 . Setzt man nun yn := 1n xn , so ist yn ≤ 1n , also lim yn = 0V bez¨uglich · . Wegen yn
≥ n ist aber (yn )n∈IN
n→ bez¨uglich · keine
Cauchyfolge.
(b) Zu den auf V a¨ quivalenten Normen · und · seien Schranken M, M > 0 gem¨aß der Definition gew¨ahlt. Die jeweiligen -Kugeln um Punkte a ∈ V erf¨ullen dann U /M (a) ⊆ U (a) und U /M (a) ⊆ U (a) . Hieraus folgt, dass jede Umgebung von a in der einen Norm auch eine Umgebung von a in der anderen Norm enth¨alt. Also hat V in jeder der beiden Normen die selben offenen Mengen.
180
13 Normierte Vektorr¨aume
Satz 13.6. Sei {a1 , a2 , . . . , ad } eine Basis des d-dimensionalen normierten Vektorraumes V . Weiter sei IRd versehen mit der Maximumsnorm x = max |xk |. 1≤k≤d
Dann ist die durch
d
Lx :=
xk a k
k=1
definierte bijektive lineare Abbildung L : IRd → V stetig und ihre Umkehrabbildung ist ebenfalls stetig. d
Beweis. Mit M := max ak V erhalten wir LxV ≤ |xk | ak V ≤ d M x . 1≤k≤d
k=1
Daher ist {LxV : x ∈ IRd , x ≤ 1} beschr¨ankt und L laut Satz 13.1 stetig. Da L−1 : V → IRd ebenfalls eine lineare Abbildung ist, gen¨ugt es, die Stetigkeit im Nullpunkt nachzuweisen. Dazu sei > 0. Die Menge C := {x ∈ IRd : x = } ist kompakt; nach Korollar 12.9 nimmt die stetige Funktion x → LxV auf C ein Minimum an. Da C den Nullpunkt nicht enth¨alt, gilt weiter 0 < min LxV =: . x∈C
Zu jedem y ∈ V mit yV < gibt es x ∈ C und ∈ IR mit y = L( x) = Lx, da L eine bijektive lineare Abbildung ist. Wegen | | LxV = yV < ≤ LxV gilt | | < 1. Aus yV < folgt also stets L−1 (y) = x = | | x = | | < . Folglich ist L−1 im Nullpunkt von V stetig.
¨ Satz 13.7 (Aquivalenz von Normen im endlichdimensionalem Raum). Sei V ein d-dimensionaler Vektorraum. Es gilt: (a)
Je zwei Normen auf V sind a¨ quivalent.
(b)
Unter jeder Norm ist V vollst¨andig und Grenzwerte in V sind unabh¨angig von der Wahl der Norm.
Beweis. (a) Sind · 1 und · 2 zwei Normen auf V , so schreiben wir Vk (k = 1, 2) f¨ur den mittels · k normierten Raum V . Nach Satz 13.6 ist bei gegebener Basis {a1 , a2 , . . . , ad } von V durch Lk x :=
d
x ja j
j=1
f¨ur x ∈ IRd
eine bijektive lineare und samt Umkehrabbildung stetige Abbildung L : IRd → Vk erkl¨art (bzgl. Maximumsnorm auf IRd ). Damit ist auch L := L2 L−1 1 : V1 → V2 eine bijektive lineare und stetige Abbildung, deren Umkehrung L−1 = L1 L−1 2 ebenfalls stetig ist. (Rein algebraisch betrachtet ist L die Identit¨at auf V .)
13.1 Stetige lineare Abbildungen
181
Mit den Schranken M1 := sup{L−1 z1 : z ∈ V2 , z2 ≤ 1}
und
M2 := sup{Ly2 : y ∈ V1 , y1 ≤ 1} erhalten wir f¨ur alle y ∈ V die Absch¨atzungen y2 = L(L−1 y)2 ≤ M2 L−1 y1 = M2 y1
sowie
y1 = L−1 (Ly)1 ≤ M1 Ly2 = M1 y2 . Die beiden Normen sind daher a¨ quivalent. (b) Mit Satz 13.5 und der eben bewiesenen Aussage gen¨ugt es, eine Norm anzugeben, mit welcher V vollst¨andig ist. Man erh¨alt sie z.B. aus der Euklidischen Norm des IRd mittels " " " d " " " " x j a j " := x2 . " j=1 " 0
d
Laut Korollar 4.8 ist (IR , ·2 ) vollst¨andig. Hat man eine Cauchyfolge in (V, ·0 ), so findet man deren Grenzwert nun u¨ ber die entsprechende Folge in IRd .
Insbesondere sind auf IRd die Normen x1 =
d
|x j | ,
1
d
x2j
x2 =
j=1
2
und
j=1
x = max |x j | j=1,...,d
a¨ quivalent. Korollar 13.8. Seien V und W normierte Vektorr¨aume, V endlich-dimensional. Dann ist jede lineare Abbildung L : V → W stetig. Beweis. Seien {a1 , . . . , ad } eine Basis von V und · 0 die durch " " " d " " " f¨ur x = (x1 , . . . , xd ) ∈ IRd " x j a j " := x " j=1 " 0
d
erkl¨arte Norm auf V . F¨ur x = x j a j ∈ V gilt dann j=1
" " " d " " " LxW = " x j L(a j )" ≤ " j=1 " W
d
|x j | L(a j )W ≤ d M x0 ,
j=1
wobei M := max L(a j )W sei. 1≤ j≤d
Mit Satz 13.1 folgt die Stetigkeit von L zun¨achst bez¨uglich · 0 und auf Grund ¨ der Aquivalenz der Normen auch bez¨uglich aller anderer Normen auf V .
182
13 Normierte Vektorr¨aume
13.2 Kurven in Vektorr¨aumen Seien X ein metrischer Raum und I = [a, b] ein kompaktes Intervall. Eine stetige Abbildung : I → X bezeichnet man als Weg. Gilt (a) = (b), so heißt ein geschlossener Weg. Beispiele (1)
In X = C mit der gew¨ohnlichen Metrik definiert (t) := eit mit I = [0, 2 k] f¨ur jedes k ∈ IN einen geschlossenen Weg.
(2)
Gegeben seien ein Radius r > 0 und eine Gangh¨ohe“ 2 c > 0. Dann definiert ”
(t) := (r cost, r sin t, ct) ,
t ∈ [0, 2 k] ,
einen Weg ( Schraubenlinie“) im IR3 . Ferner existiert der Grenzwert ” (t) − (t0) lim = (−r sin t0 , r cost0 , c) . t − t0 t → t0 t = t0
Letzteres motiviert die folgende Definition. Definition 13.9. Ein Weg : [a, b] → V im endlich-dimensionalen normierten Vektorraum V heißt im Punkt t0 ∈ [a, b] differenzierbar, wenn der Grenzwert
(t) − (t0 ) =: (t0 ) t − t0 t → t0 lim
t = t0
existiert. Den Vektor (t0 ) ∈ V bezeichnet man dann als Ableitung von in t0 . Ist in jedem Punkt t ∈ [a, b] differenzierbar, so nennt man eine differenzierbare Kurve. Wenn [a, b] eine Teilung t0 = a < t1 < . . . < tr = b besitzt derart, dass alle Restriktionen |[tk−1 ,tk ] differenzierbar sind mit auf [tk−1 ,tk ] stetiger Ableitung, dann heißt eine stuckweise ¨ stetig differenzierbare Kurve. Ist eine stetig differenzierbare Kurve, so bildet f¨ur jedes t0 ∈ I mit (t0 ) = 0 die Menge { (t0 ) + s (t0 ) : s ∈ IR} die Tangente an im Punkt (t0 ). Der Vektor (t0 ) heißt Tangentenvektor. Diejenigen Punkte t0 ∈ [a, b] mit Tangentenvektor (t0 ) = 0V werden singul¨ar genannt. Besitzt keine singul¨aren Punkte, so heißt eine regul¨are Kurve. Bemerkung: Weder die Definition der Differenzierbarkeit noch der Wert der Ableitung h¨angen von der Wahl der Norm in V ab (vgl. Satz13.7). Zum Beispiel ist f¨ur jede stetig differenzierbare Funktion f : [a, b] → IR der Graph f von f , definiert durch f : [a, b] → IR2 , f (t) := (t, f (t) ), eine regul¨are Kurve, da f (t) = (1, f (t) ) ist.
13.2 Kurven in Vektorr¨aumen
T (t0 )
183
S (t0 ,t) s=2
Sei t = t0 zun¨achst fest gew¨ahlt, so gilt r ( (t) − (t0 )) : r ∈ IR . S (t0 ,t) = (t0 ) + t − t0
s=1 s=0
Die Gerade durch die Punkte (t0 ) und (t) ist die Menge S (t0 ,t) := { (t0 )+s( (t)− (t0 )) : s ∈ IR}.
(t)
Ist im Punkt t0 differenzierbar, so erhalten wir die Tangente als Grenzwert“ von S(t0 ,t) f¨ur t → t0 , ”
(t0 )
s = −1
T (t0 ) := { (t0 ) + r (t0 ) : r ∈ IR} .
Beispiel: Durch : [−1, 1] → IR2 , (t) := (t 2 ,t 3 ), wird die so genannte Neilsche Parabel definiert. Sie ist eine stetig differenzierbare Kurve mit der Ableitung (t) = (2t, 3t 2 ) und hat genau einen singul¨aren Punkt, n¨amlich t0 = 0. 1
Die Abbildung zeigt die Neilsche Parabel. Man erkennt, dass es nicht m¨oglich ist, eine Tangente im Nullpunkt sinnvoll zu erkl¨aren.
1 −1
Seien V ein d-dimensionaler Vektorraum und {e1 , . . . , ed } eine Basis von V . Das System der Koordinaten bez¨uglich dieser Basis identifiziert V mit IRd . Jede Kurve : [a, b] → V wird so durch ihre Koordinatenfunktionen k : [a, b] → IR beschrieben:
(t) =
d
e j j (t) .
j=1
Satz 13.10. Seien V ein d-dimensionaler normierter Vektorraum und {e1 , . . . , ed } eine Basis von V . Eine Abbildung : [a, b] → V ist im Punkt t ∈ [a, b] genau dann differenzierbar, wenn jede Koordinatenfunktion k : [a, b] → IR (k = 1, . . . , d) dort differenzierbar ist. In diesem Fall gilt
(t) =
d
e j j (t) .
j=1
¨ Beweis. Wegen der Aquivalenz aller Normen auf V k¨onnen wir dort die Maximumsnorm zu Grunde legen. (s) − (t) Damit bedeutet lim = (t) das selbe wie s→t s−t
k (s) − k (t)
lim
− k (t)
f¨ur alle k ∈ {1, . . . , d} , s→t s−t
184
13 Normierte Vektorr¨aume
wobei k (t) die k-te Koordinate des Vektors (t) bzgl. der Basis {e1 , . . . , ed } von V bezeichne. Damit haben wir d
(t) =
ek k (t)
k=1
wie behauptet.
Definition 13.11. Sei : [a, b] → V eine st¨uckweise stetig differenzierbare Kurve im d-dimensionalen normierten Raum V . Als L¨ange von definieren wir l( ) :=
( b a
(t) dt .
Bemerkung: Die Kurvenl¨ange h¨angt von der Wahl der Norm ab. So hat beispielsweise die Strecke s(t) = (1 + i)t , t ∈ [0, 1] , √ in der Euklidischen Norm (die in C mit dem Betrag u¨ bereinstimmt) die L¨ange 2, w¨ahrend ihre L¨ange in der Maximumsnorm des IR2 gleich 1 ist. Im Vektorraum V = IRd wird die L¨ange von Kurven immer auf die Euklidische Norm bezogen, falls nicht ausdr¨ucklich etwas anderes gesagt wird. Die Abbildung gibt eine Motivation f¨ur die Definition der L¨ange. Die L¨ange einer Kurve ist stets gr¨oßer oder gleich der L¨ange eines Streckenzuges, der gewisse Punkte der Kurve verbindet. Je feiner man die Kurve unterteilt, desto besser wird die L¨ange approximiert. ¨ In Satz 13.12 wird diese Uberlegung pr¨azisiert.
Satz 13.12. Seien V ein d-dimensionaler normierter Vektorraum und : [a, b] → V eine st¨uckweise stetig differenzierbare Kurve. Dann gilt f¨ur jede Teilung a = t0 < t1 < . . . < tr = b die Ungleichung r
(t j ) − (t j−1) ≤ l( ) .
j=1
Ferner gibt es zu jedem > 0 eine Schranke > 0 derart, dass r
0 ≤ l( ) − (t j ) − (t j−1) ≤ j=1
f¨ur alle Teilungen der Feinheit max (t j − t j−1 ) ≤ gilt. 1≤ j≤r
Zum Beweis verwenden wir folgendes auch sonst n¨utzliches Resultat.
13.2 Kurven in Vektorr¨aumen
185
Lemma 13.13. Seien V ein d-dimensionaler normierter Vektorraum, : [a, b] → V eine stetig differenzierbare Kurve. Zu jedem > 0 gibt es eine Schranke > 0 derart, dass " " " (s) − (t) " " "≤ − (t) " s−t " f¨ur alle s,t ∈ [a, b] mit 0 ≤ |s − t| ≤ gilt. Beweis. Die Wahl von h¨angt nat¨urlich von der Norm auf V ab. Da aber je zwei Normen a¨ quivalent sind, gen¨ugt es, den Beweis f¨ur eine spezielle Norm zu f¨uhren. d
Mit einer Basis {e1 , . . . , ed } von V beschreiben wir die Kurve (t) = ek k (t) k=1
durch ihre stetig differenzierbaren Koordinaten-Funktionen k . Laut Mittelwertsatz gibt es ein k zwischen s und t derart, dass
k (s) − k (t)
= | (k ) − (t)| − (t) k k k
s−t gilt. Die Ableitung k ist auf dem kompakten Intervall [a, b] gleichm¨aßig stetig (Satz 12.19). Daher gibt es ein k > 0, sodass |k ( ) − k (t)| ≤ f¨ur alle ,t ∈ [a, b] mit | − t| ≤ k ist. Wir w¨ahlen nun := min k und erhalten 1≤k≤d
k (s) − k (t)
− k (t)
≤ max 1≤k≤d
s−t
f¨ur s,t ∈ [a, b] mit 0 < |s − t| ≤
wie behauptet.
Beweis (von Satz 13.12). Wir beginnen mit einer Teilung a = a0 < a1 < . . . < aq = b, auf deren Teilintervallen [ak−1 , ak ] die Restriktion von stetig differenzierbar ist (1 ≤ k ≤ q). Sei > 0. Wir verschaffen uns ein > 0, das den folgenden vier Bedingungen gen¨ugt. (1)
Zun¨achst wird so klein gew¨ahlt, dass f¨ur Teilungen a = t0 < . . . < tr = b der Feinheit max(t j − t j−1) ≤ stets j
r
l( ) − (t j )(t j − t j−1) ≤ .
4 j=1 gilt. Um Eindeutigkeit von (t j ) zu erzielen, nehmen wir die linksseitige Ableitung von , falls t j einer der Teilungspunkte ak sein sollte. (Wir approximieren also mit einer speziellen Treppenfunktion.) (2)
Weiter wird bzgl. der auf [a, b] gleichm¨aßig stetigen Abbildung so klein gew¨ahlt, dass (s) − (t) ≤ 4q f¨ur alle s,t ∈ [a, b] mit |s − t| ≤ gilt.
186
13 Normierte Vektorr¨aume
Wir verlangen qM ≤
(3)
4
f¨ur M := sup (t). t∈[a,b]
Schließlich wird auch noch so klein gew¨ahlt, dass die Absch¨atzung in Lem ma 13.13 f¨ur jedes Teilintervall [ak−1 , ak ] mit := 4(b−a) g¨ultig ist.
(4)
Zu dem nun fixierten > 0 sei a = t0 < . . . < tr = b eine Teilung der Feinheit ≤ . Mit A bezeichnen wir die Menge der Indizes j, f¨ur die es ein k gibt mit ak ∈ ]t j−1 ,t j [. Dann enth¨alt die Menge A h¨ochstens q Elemente. Damit gelten die Absch¨atzungen
r
l( ) − (t j ) − (t j−1)
j=1
r r
= l( ) − (t j )(t j − t j−1 ) + ( (t j ) (t j − t j−1) − (t j ) − (t j−1 ) )
j=1 j=1 ≤
r + (t j ) − (t j−1) − (t j ) (t j − t j−1) 4 j=1
≤
r + (t j ) − (t j−1 ) − (t j ) (t j − t j−1 ) + q + qM 4 j=1 4q j∈A /
≤
r 3 + (t j − t j−1) ≤ . 4 j=1 4(b − a) j∈A /
r
Es bleibt zu zeigen, dass stets (t j ) − (t j−1 ) ≤ l( ) gilt. j=1
Angenommen, dies ist nicht der Fall. Dann gibt es eine Teilung mit r
(t j ) − (t j−1) − l( ) ≥ 0
j=1
¨ f¨ur eine gewisse Zahl 0 > 0. Da die Summe auf der linken Seite beim Ubergang zu einer feineren Teilung nicht kleiner wird, bleibt die Ungleichung f¨ur alle feineren Teilungen g¨ultig. Mit einem < 0 erhalten wir nun einen Widerspruch zu der bereits bewiesenen Teilaussage.
Korollar 13.14 (Schrankensatz). Seien V ein d-dimensionaler normierter Vektorraum und : [a, b] → V eine stetig differenzierbare Kurve mit beschr¨ankter Ableitung (t) ≤ M f¨ur alle t ∈ [a, b]. Dann gilt (b) − (a) ≤ M(b − a). Beweis. Dies ergibt sich aus dem ersten Teil von Satz 13.12 mit der gr¨obsten Teilung t0 = a, t1 = b und der Standardabsch¨atzung l( ) ≤ M(b − a), vgl. Satz 8.3(4).
13.2 Kurven in Vektorr¨aumen
187
Beispiele (1)
Die k-fach durchlaufene Kreislinie vom Radius r > 0,
r (t) = r eit ,
t ∈ [0, 2 k] ,
hat die Ableitung r (t) = ir eit . Sie hat daher in der durch den Betrag auf IR definierten Norm die L¨ange l(r ) = (2)
0
r dt = 2 kr .
Die durch den Graph einer stetig differenzierbaren Funktion f : [a, b] → IR erkl¨arte Kurve f (t) = (t, f (t) ) hat die Ableitung f (t) = (1, f (t) ). Damit ist Ihre Euklidische L¨ange l( f ) =
(3)
( 2 k
( b a
1 + f 2 (t) dt .
Durch Abrollen eines Kreises vom Radius 1 auf der x-Achse des IR2 entsteht als Bahnkurve eines Umfangspunktes die Zykloide (t) = (1 (t), 2 (t) ) mit 1 (t) = t − sint und 2 (t) = 1 − cost.
2 (t)
1 (t)
t
2
Ihre Euklidische L¨ange u¨ ber einen Umlauf des Kreises ist l( ) =
( 2 √ 0
2 − 2 cost dt = 2
( 2 0
2 sin2 (t/2) dt = −4 cos(t/2) 0 = 8 .
Definition 13.15 (Parametertransformation). Sei : [a, b] → V ein Weg im ddimensionalen normierten Raum V . Ist : [c, d] → [a, b] eine bijektive stetige Abbildung, dann heißt := ◦ der aus durch Umparametrisierung mittels der Parametertransformation entstandene Weg. Da als injektive stetige Abbildung streng monoton ist, tritt genau einer der folgenden F¨alle ein: ( (c), (d) ) = (a, b) ,
heißt dann orientierungstreu .
( (c), (d) ) = (b, a) ,
heißt in diesem Fall orientierungsumkehrend .
188
13 Normierte Vektorr¨aume
Sind und die Umkehrabbildung −1 stetig differenzierbar, so bezeichnet man als eine C1 -Parametertransformation. Insbesondere ist dann nullstellenfrei, also als stetige Funktion auf [c, d] von festem Vorzeichen, sign = ±1, je nachdem, ob orientierungstreu oder orientierungsumkehrend ist. Bemerkungen: Wenn auch auf [a, b] stetig differenzierbar ist, so ist := ◦ stetig differenzierbar mit Ableitung
(t) = ( (t)) · (t) . ∈V
∈IR
Dies ergibt sich mit Satz 13.10 aus der Kettenregel. Unter C1 -Parametertransformationen bleiben Kurvenl¨angen invariant, denn eine einfache Substitution ergibt l( ) =
( d c
(t) dt = sign
= sign
( (d) (c)
( d c
(s) ds =
( (t) ) (t) dt
( b a
(s) ds .
Betrachtet man speziell = −1 , wobei
(s) :=
( s s0
( ) d
f¨ur ein festes s0 ∈ [a, b] sei, so ist eine orientierungstreue C1 -Parametertransformation. Mittels Satz 7.17 erhalten wir
(t) =
1
( (t))
=
1 ( (t))
und damit (t) = 1 f¨ur alle t ∈ [c, d]. Weiter gilt l( ) = d − c. Man sagt in diesem Fall, ist nach der L¨ange parametrisiert.
13.3 Aufgaben 1. F¨ur x = (xn )n∈IN ∈ sei Ax :=
x1 1
, x22 , x33 , . . . .
a. Zeigen Sie, dass A : → eine stetige lineare Abbildung ist und bestimmen Sie A. b. Zeigen Sie, dass A injektiv ist. c. Ist A surjektiv ? d. Weiter sei X := A( ) das Bild von A. Zeigen Sie, dass die Umkehrabbildung A−1 : X → nicht stetig ist.
13.3 Aufgaben
189
2. Zeigen Sie, dass in C([0, 1]) die durch f = max | f (x)|
f 2 =
und
x∈[0,1]
(
1
0
2
1
| f (x)| dx
2
erkl¨arten Normen nicht a¨ quivalent sind. 3. Berechnen Sie die L¨ange der Neilschen Parabel, gegeben durch
: [−1, 1] → IR2 ,
(t) := (t 2 ,t 3 ) ,
bez¨uglich jeder der drei Normen · 1, · 2 und · . 4. Die Astroide ist die durch
: [0, 2 ] → IR2 ,
(t) := (cos3 t , sin3 t) ,
gegebene Kurve. a. Begr¨unden Sie, dass stetig differenzierbar ist, und berechnen Sie . b. Berechnen Sie die L¨ange l( ). c. Berechnen Sie alle Maximal- und Minimalstellen von (t) . d. Bestimmen Sie alle singul¨aren Punkte von . 1 1
1
Die Astroide aus Aufgabe 4
1
Die Kardioide aus Aufgabe 5
5. Die Kardioide ist die durch
: [0, 2 ] → IR2 ,
(t) := ( (1 + cost) cost , (1 + cost) sint)
gegebene Kurve. a. Bestimmen Sie alle singul¨aren Punkte von . b. Bestimmen Sie alle Punkte von mit horizontaler oder vertikaler Tangente. c. Berechnen Sie die L¨ange l( ).
190
13 Normierte Vektorr¨aume
6. Sei c > 0. Die Abbildung
: IR → C ,
(t) := exp(ct + it) ,
beschreibt eine logarithmische Spirale. F¨ur a < b bezeichne La,b die L¨ange der Einschr¨ankung von auf das Intervall [a, b]. Berechnen Sie La,b und zeigen Sie, dass lim La,0 existiert. a→−
Im
Re
Obwohl die logarithmische Spirale den Nullpunkt unendlich oft umrundet“, hat ihre ” L¨ange bei festgehaltenem Endpunkt einen endlichen Grenzwert.
Kapitel 14
Totale Differenzierbarkeit
Wir wollen nun den Begriff der Differenzierbarkeit, den wir in Kapitel 7 f¨ur reellwertige Funktionen auf Intervallen und in Kapitel 13 f¨ur Funktionen von Intervallen in beliebige normierte R¨aume erkl¨art haben, ausdehnen auf Funktionen f : U → W , U ⊆ V , wobei V und W endlich-dimensionale normierte Vektorr¨aume sind.
14.1 Totale und partielle Ableitungen Definition 14.1. Seien V und W endlich-dimensionale normierte IR-Vektorr¨aume, U ⊆ V eine offene Menge in V . Eine Abbildung f : U → W heißt im Punkt a ∈ U differenzierbar, wenn eine lineare Abbildung A ∈ L (V,W ) existiert derart, dass die durch f (a + h) = f (a) + Ah + R(h) in einer Umgebung U0 ⊆ V von 0 ∈ V definierte Restfunktion R : U0 → W folgendes erf¨ullt: R(h) lim =0∈W . (14.1) h→0 hV h =0 Zun¨achst m¨ussen wir uns davon u¨ berzeugen, dass eine derartige lineare Abbildung A ∈ L (V,W ), falls sie existiert, auch eindeutig festgelegt ist. Dies ist tats¨achlich der Fall: Sei f (a + h) = f (a) + A1 h + R1(h) = f (a) + A2h + R2(h) mit A1 , A2 ∈ L (V,W ) derart, dass R1 und R2 die Bedingung (14.1) erf¨ullen. F¨ur B := A1 − A2 ∈ L (V,W ) erhalten wir mit beliebigem h ∈ V , hV = 1, t > 0 dann B(h)W = ≤
B(th)W t B(h)W R2 (th) − R1(th)W = = t thV thV R1 (th)W R2 (th)W t→0 + −→ 0 . thV thV
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_14, © Springer-Verlag Berlin Heidelberg 2012
191
192
14 Totale Differenzierbarkeit
Das heißt B(h) = 0 f¨ur alle h ∈ V mit hV = 1. Da B linear ist, folgt B(h) = 0 f¨ur alle h ∈ V , also A1 = A2 . Wenn die lineare Abbildung A gem¨aß Definition 14.1 existiert, so schreibt man auch A = D f (a) oder A = f (a) und bezeichnet sie als die totale Ableitung oder das totale Differential von f in a. Im eindimensionalen Fall V = W = IR ist die lineare Abbildung A nichts anderes als die Multiplikation mit einer reellen Zahl, n¨amlich dem Wert f (a). Satz 14.2. Seien V und W endlich-dimensionale normierte R¨aume, U ⊆ V offen und f : U → W eine Abbildung. Ist f im Punkt a ∈ U differenzierbar, so ist f in a auch stetig. Beweis. Wegen (14.1) existiert ein > 0, sodass R(h)W ≤ hV f¨ur alle h ∈ V mit hV ≤ gilt. Weiter k¨onnen wir U (a) ⊆ U annehmen (sonst w¨ahle man ein entsprechend kleineres ). Es gilt dann f (a + h) − f (a)W ≤ AhW + R(h)W ≤ (A + 1) hV f¨ur hV < . Mit dem Folgenkriterium (Satz 6.2) folgt nun die Stetigkeit von f in a.
¨ Bemerkung: Wegen der Aquivalenz der Normen (Satz 13.7), spielt es hier keine Rolle, welche Normen auf V und W gew¨ahlt wurden. Beispiel: Sei f : IR2 → IR, f (x1 , x2 ) := (x1 − 1)(x2 − 1).
F¨ur a = aa12 , h = hh12 ∈ IR2 gilt f (a + h) − f (a) = (a1 + h1 − 1)(a2 + h2 − 1) − (a1 − 1)(a2 − 1) = (a1 − 1)h2 + (a2 − 1)h1 + h1 h2 / . h1 a2 − 1 , + R(h) , = a1 − 1 h2 wobei R(h) = h1 h2 ist. Mit der Euklidischen Norm · 2 im IR2 gilt 1 2 (h + h22) |R(h)| |h1 h2 | 1 = 2 ≤ 2 2 1 2 1/2 = h2 → 0 2 1/2 h2 2 (h1 + h2) (h1 + h2 )
f¨ur h → 0 .
Die Ableitung A = D f (a) = f (a) ∈ L (IR2 , IR) ist also gegeben durch / . h1 h1 a2 − 1 , = (a2 − 1, a1 − 1) . h → a1 − 1 h2 h2 1×2−Matrix
14.1 Totale und partielle Ableitungen
193
Das vorangehende Beispiel geh¨ort zu dem Fall, dass der Bildraum eindimensional ist, d.h. f : U → IR mit U ⊆ IRn offen. Die Ableitung A von f in a ∈ U ist dann von der Form D f (a) h = Ah = c, h =
n
ck h k
k=1 n
mit c ∈ IR . Man hat also n
f (a + h) = f (a) + ck hk + R(h) , k=1
lim h→0 h =0
R(h) =0. h
Um die ck ∈ IR zu bestimmen, w¨ahlen wir h = tek , wobei ek den kanonischen k-ten Einheitsvektor in IRn bezeichne (k = 1, . . . , n). Damit ist 1 1 ( f (a + tek ) − f (a) ) = ck + R(ek t) t t und mit t → 0 folgt ck = lim t→0
f (ak + ekt) − f (a) f =: (a) . t xk
Man nennt dies die partielle Ableitung von f nach der k-ten Koordinate im Punkt a. Die Ableitung von f an der Stelle a ∈ U hat also die Gestalt D f (a) h = grad f (a) , h , f f wobei grad f (a) := (a), . . . , (a) der Gradient von f im Punkt a heißt. x1 xn Statt grad f (a) schreibt man gelegentlich auch f (a). (Das Symbol heißt Nabla). Wir wenden uns nun dem Fall V = IR, W = IRm (mit kanonischer Basis) zu. Sei f : U → IRm mit U ⊆ IR offen. Wir suchen A ∈ L (IR, IRm ) mit entsprechenden Eigenschaften. Schreibt man ⎛ ⎞ f1 (x) ⎜ ⎟ f (x) = ⎝ ... ⎠ , fm (x) so hat man das Problem der Differenzierbarkeit von f auf das Problem der Differenzierbarkeit der fk : U → IR (k = 1, . . . , m) zur¨uckgef¨uhrt. Es gilt dann (beachte: hier ist h ∈ IR) ⎛ ⎞ f1 (a) ⎜ ⎟ D f (a) h = ⎝ ... ⎠ h , fm (a)
vgl. auch Kapitel 13.2.
194
14 Totale Differenzierbarkeit
Wir kehren zur¨uck zum allgemeinen Fall. Bevor wir uns u¨ berlegen, wie man die lineare Abbildung D f (a) ∈ L (V,W ) als Matrix darstellen kann, werden wir noch einige wichtige Eigenschaften differenzierbarer Abbildungen zusammenstellen. Die folgenden sind unmittelbar ersichtlich. (1)
Ist f : V → W konstant, so ist D f (a) = 0.
(2)
Ist f : V → W selbst linear, d.h. f ∈ L (V,W ), dann ist D f (a) = f . Mit der Linearit¨at von f gilt n¨amlich f (a + h) − f (a) = f (h), also ist in diesem Fall R(h) = 0.
(3)
Sind f , g : U → W in a ∈ U ⊆ V differenzierbar und ∈ IR, so sind auch f + g : U → W und f : U → W in a differenzierbar mit D( f + g)(a) = D f (a) + Dg(a)
sowie
D( f )(a) = D f (a) .
Man kann auch die Kettenregel auf die vorliegende Situation verallgemeinern. Satz 14.3 (Kettenregel). Seien V1 ,V2 ,V3 endlich-dimensionale normierte IR-Vektorr¨aume, U1 ⊆ V1 , U2 ⊆ V2 offen und f : U1 → U2 , g : U2 → V3 Abbildungen. Wenn f in a ∈ U1 differenzierbar und g in f (a) ∈ U2 differenzierbar ist, dann ist die Abbildung g ◦ f : U1 → V3 in a differenzierbar und es gilt D(g ◦ f )(a) = Dg( f (a)) D f (a) . Beweis. Wir setzen R(h) := g ◦ f (a + h) − g ◦ f (a) − Dg( f (a)) D f (a) h. Es gen¨ugt zu zeigen, dass zu jedem 0 < < 1 ein > 0 existiert mit R(h)V3 ≤ hV1
f¨ur alle h ∈ V1 mit hV1 < .
Denn daraus folgt, dass dieses R der Bedingung (14.1) gen¨ugt. Sei also 0 < < 1. Da D f (a) und Dg( f (a)) stetige lineare Abbildungen sind, gibt es eine Schranke M ≥ 1 mit D f (a) xV2 ≤ M xV1 Dg( f (a)) yV3 ≤ M yV2
f¨ur alle x ∈ V1
und
f¨ur alle y ∈ V2 .
Wegen der Differenzierbarkeit von g im Punkt f (a) existiert ferner ein > 0 mit g( f (a) + k) − g( f (a)) − Dg( f (a)) kV3 ≤
kV2 2M + 2
f¨ur alle k ∈ V2 mit kV2 < . Setzen wir speziell k := f (a + h) − f (a) ∈ V2 , so finden wir, da f in a differenzierbar ist, eine Zahl > 0 mit k − D f (a) hV2 ≤
hV1 2M
f¨ur alle h ∈ V1 mit hV1 < .
14.1 Totale und partielle Ableitungen
195
F¨ur hV1 < gilt folglich kV2 ≤ D f (a) hV2 +
hV1 ≤ M hV1 + hV1 ≤ (M + 1) hV1 . 2M 2M
. Wir setzen alles zusammen und erhalten f¨ur hV1 < Sei nun := min , M+1 schließlich g ◦ f (a + h) − g ◦ f (a) − Dg( f (a)) D f (a) hV3 ≤ g( f (a) + k) − g( f (a)) − Dg( f (a)) kV3 + Dg( f (a)) (k − D f (a) h)V3 ≤
kV2 + M k − D f (a) hV2 ≤ hV1 + hV1 . 2M + 2 2 2
(beachte: Hier gilt kV2 < .)
Seien U ⊆ IRn offen, f : U → IRm eine Abbildung und {e1 , . . . , en } bzw. {w1 , . . . , wm } die kanonischen Basen des IRn und IRm . Die Komponenten von f sind die Funktionen f1 , . . . , fm : U → IR mit m
f (x) = fi (x) wi . i=1
F¨ur a ∈ U, i ∈ {1, . . . , m} und k ∈ {1, . . . , n} definieren wir
fi fi (a + tek ) − fi (a) , (a) := lim t→0 xk t vorausgesetzt dieser Grenzwert existiert. fi (a) die partiellen Ableitungen von f in a. Man nennt xk fi (a). Gelegentlich schreibt man auch Dk fi (a) statt xk Satz 14.4. Seien U ⊆ IRn offen und f : U → IRm im Punkt a ∈ U differenzierbar. Dann existieren die partiellen Ableitungen i ∈ {1, . . . , m}. Ferner gilt m
fi (a) wi i=1 xk
D f (a) ek =
fi ur alle xk (a) f¨
k ∈ {1, . . . , n} und alle
(k = 1, . . . , n)
oder, geschrieben als Matrix bez¨uglich der kanonischen Basen, ⎛ f ⎞ f1 1 x1 (a) · · · xn (a) ⎜ . .. ⎟ ⎟ D f (a) = ⎜ . ⎠. ⎝ .. fm fm x (a) · · · xn (a) 1
196
14 Totale Differenzierbarkeit
Beweis. F¨ur festes k ∈ {1, . . ., n} gilt, da f in a differenzierbar ist, f (a + tek ) − f (a) = D f (a)(tek ) + R(tek ) ,
wobei lim
t→0
R(tek ) =0. t
Damit erhalten wir D f (a) ek = lim t→0
f (a + tek ) − f (a) = lim t→0 t
m
i=1
fi (a + tek ) − fi (a) wi . t
Aus der Konvergenz in IRm folgt komponentenweise Konvergenz, also hat jeder Quotient in der Summe einen Grenzwert f¨ur t → 0. Folglich existieren die partiellen Ableitungen xfi (a) f¨ur i = 1, . . . , m.
k
Die (m × n)-Matrix
D f (a) =
fi (a) xk i,k
heißt Jacobimatrix oder Funktionalmatrix von f in a. Um sie zu bestimmen, braucht man nur die partiellen Ableitungen von f in a zu berechnen.
14.2 Richtungsableitungen und Niveaumengen Seien U ⊆ IRn offen, : ] , [ → U eine differenzierbare Kurve und f : U → IR differenzierbar. Wir betrachten g : ] , [ → IR, g(t) := f ( (t)). Laut Kettenregel (Satz 14.3) ist g differenzierbar und es gilt Dg(t) = D f ( (t)) D (t) , wobei Dg(t) ∈ L (IR, IR), D f ( (t)) ∈ L (IRn , IR) und D (t) ∈ L (IR, IRn ) sind. Nach Wahl der kanonischen Basis im IRn bekommt man f f ( (t)), . . . , ( (t)) sowie D f ( (t)) = grad f ( (t)) = x1 xn
D (t) = 1 (t), . . . , n (t) = (t) 6 7 f ( (t)) i (t) = grad f ( (t)) , (t) . i=1 xi n
und damit dann g (t) = Dg(t) =
Als spezielle Kurve betrachten wir noch den Fall : IR → IRn , (t) = a + tu, mit a, u ∈ IRn , u2 = 1; d.h. beschreibt eine Gerade durch a in Richtung u. Offensichtlich ist (t) = u f¨ur alle t ∈ IR und insbesondere 6 7 Dg(0) = grad f (a) , u . (14.2)
14.2 Richtungsableitungen und Niveaumengen
197
Berechnet man g (0) = Dg(0) direkt als Differentialquotient, so gilt andererseits Dg(0) = lim
t→0
g(t) − g(0) f (a + tu) − f (a) = lim . t→0 t t
Letzteren Grenzwert nennt man die Richtungsableitung von f in Richtung u im Punkt a. Man schreibt Du f (a) := lim
t→0
f (a + tu) − f (a) . t
Die Richtungsableitungen in Richtung der kanonischen Basisvektoren sind dann nichts anderes als die partiellen Ableitungen Dek f (a) = xf (a). k
Die folgenden Beispiele zeigen, dass alleine aus der Existenz der partiellen Ableitungen jedoch nicht notwendigerweise die Differenzierbarkeit folgt. (1)
Sei f : IR2 → IR,
f (x, y) :=
0
f¨ur (x, y) = (0, 0) ,
xy x2 +y2
f¨ur (x, y) = (0, 0) .
Da f l¨angs der beiden Koordinatenachsen konstant ist, existieren im Nullpunkt die partiellen Ableitungen xf (0, 0) = 0 und yf (0, 0) = 0. Wir betrachten nun die Einschr¨ankung von f auf eine andere Gerade, gegeben etwa durch u = (cos , sin ) mit = k2 , k ∈ ZZ. Es gilt f (tu) =
t 2 cos sin t 2 cos2 +t 2 sin2
= cos sin = 0 f¨ur t = 0 , 0
f¨ur t = 0 .
Die Abbildung t → f (tu) ist nicht stetig an der Stelle t = 0 und daher auch nicht differenzierbar, also existieren die Richtungsableitungen von f in Richtung u nicht. Weiter ist f im Nullpunkt nicht einmal stetig und daher auch nicht (total) differenzierbar. (2)
Sei g : IR2 → IR,
g(x, y) :=
0
f¨ur (x, y) = (0, 0) ,
xy2 x2 +y2
f¨ur (x, y) = (0, 0) .
Mit u = (cos , sin ) gilt g(0 + tu) − g(0) 1 t 3 cos sin2 = = cos sin2 t t t 2 cos2 + t 2 sin2
f¨ur alle t = 0 ,
also existieren die Richtungsableitungen Du g(0, 0) = cos sin2 . Dies beinhaltet insbesondere die partiellen Ableitungen.
198
14 Totale Differenzierbarkeit
Angenommen, g ist im Nullpunkt differenzierbar. Dann w¨are g g (0, 0) , (0, 0) = (0, 0) gradg(0, 0) = x y 8 9 und nach (14.2) weiter Du g(0, 0) = grad g(0, 0) , u = 0 f¨ur alle u ∈ IR2 mit u2 = 1 im Widerspruch zur vorangegangenen Rechnung. Bemerkung: In (14.2) wird Dg(0) maximal genau dann, wenn u ein positives Vielfaches von grad f (a) ist (außer im Fall grad f (a) = 0). Mit anderen Worten, die Richtungsableitung wird maximal, wenn man in Richtung des Gradienten schaut“. ” Eine weitere geometrische Deutung des Gradienten erh¨alt man durch Betrachtung der Niveaumenge N(a) von f in a ∈ U, N(a) := {x ∈ U : f (x) = f (a)} . Sei : ] , [ → N(a) eine differenzierbare Kurve. Da die Komposition g(t) := f ( (t)) = f (a) konstant ist, gilt 6 7 0 = g (t) = grad f ( (t)) , (t) . Ist nun (t0 ) = a f¨ur ein t0 ∈ ] , [, so gilt grad f (a) , (t0 ) = 0. Anschaulich kann man sagen, dass der Gradient von f im Punkt a senkrecht auf allen in der Niveaumenge N(a) verlaufenden Kurven ( H¨ohenlinien“) steht. ” Oft schreibt man die Niveaumengen auch in der Form Nc = {x ∈ U : f (x) = c}, wobei sinngem¨aß Nc = ∅ gilt, falls c nicht im Bild der Funktion f liegt. Beispiele: (1)
1 1 Wir betrachten f : IR2 \ {(0, 0)} → IR, f (x, y) := = . 2 2 (x, y)2 x +y Da f nur positive Werte annimmt, gibt es keine Niveaumengen Nc zu c ≤ 0. Die Niveaumengen von f sind genau die Kreise um den Nullpunkt in IR2 , denn es gilt f (x, y) = c ⇐⇒ (x, y)2 = 1c f¨ur c > 0. Wir berechnen 3 f 1 x (x, y) = − (x2 + y2 )− 2 (2x) = − x 2 (x, y)32
und
3 f 1 y (x, y) = − (x2 + y2 )− 2 (2y) = − y 2 (x, y)32
und erhalten grad f (x, y) =
1 (−x, −y). (x, y)32
Der Gradient zeigt also zum Nullpunkt hin“; je n¨aher wir uns beim Null” punkt befinden, um so gr¨oßer ist er.
14.3 Mittelwertsatz und stetig differenzierbare Abbildungen
(2)
199
Sei f : IR2 → IR, f (x, y) := xy. Wir setzen f (x, y) = xy = c. F¨ur c = 0 erhalten wir x = 0 oder y = 0, d.h. die beiden Koordinatenachsen bilden die Niveaumenge N0 von f . F¨ur c = 0 ist insbesondere x = 0 und weiter gilt xy = c ⇐⇒ y = cx ; die Niveaumenge Nc besteht aus zwei Hyperbel¨asten. Hier ist grad f (x, y) = (y, x) und damit insbesondere grad f (0, 0) = (0, 0).
(3)
Nun sei f : IR2 → IR, f (x, y) := x2 + 4y2. Es gibt hier keine Niveaumengen Nc f¨ur negatives c und die Niveaumenge N0 = {(0, 0)} besteht nur aus einem einzigen Punkt. F¨ur c > 0 setzen wir f (x, y) = x2 + 4y2 = c2 . Damit ist y=±
1 2 c − x2 2
und wir erhalten als Niveaumenge eine Ellipse mit Radien c (in x-Richtung) und 12 c (in y-Richtung). Es ist grad f (x, y) = (2x, 8y); auch in diesem Beispiel verschwindet grad f im Nullpunkt. y y
x
x
Die Abbildungen zeigen Niveaumengen und Gradienten der Funktionen aus den Beispielen (2) und (3). In beiden F¨allen verschwindet der Gradient im Nullpunkt. W¨ahrend sich im linken Bild dort zwei H¨ohenlinien schneiden“, besteht die ” Niveaumenge N0 im rechten Bild nur aus einem einzigen Punkt.
14.3 Mittelwertsatz und stetig differenzierbare Abbildungen Wir wollen uns u¨ berlegen, unter welchen Bedingungen an die partiellen Ableitungen die Differenzierbarkeit folgt. Zun¨achst zeigen wir eine Folgerung des Mittelwertsatzes (Satz 7.10) f¨ur Funktionen mit Werten in IRn .
200
14 Totale Differenzierbarkeit
Lemma 14.5. Sei g : [a, b] → IRm stetig und in ]a, b[ differenzierbar. Dann existiert ein x ∈ ]a, b[ mit g(b) − g(a)2 ≤ g (x)2 (b − a). Beweis. Wir setzen z := g(b) − g(a) und betrachten : [a, b] → IR, (t) := z, g(t). Die Funktion ist stetig auf [a, b] und differenzierbar auf ]a, b[. Laut dem Mittelwertsatz existiert ein x ∈ ]a, b[ mit
(b) − (a) = (x) (b − a) = z, g (x) (b − a) . Andererseits gilt (b)− (a) = z, g(b)−z, g(a) = z, z = z22 . Mit der CauchySchwarz-Ungleichung im IRm erhalten wir z22 = z, g (x) (b − a) ≤ z2 g (x)2 (b − a) , also g(b) − g(a)2 = z2 ≤ g (x)2 (b − a).
Ein weiteres Lemma liefert nun eine analoge Aussage zum Schrankensatz (Korollar 13.14). Dazu ben¨otigen wir den folgenden Begriff. Eine Menge U ⊆ IRn heißt konvex, falls f¨ur beliebige a, b ∈ U stets auch ta + (1 − t)b ∈ U ∀t ∈ [0, 1] gilt. Anschaulich bedeutet dies, dass zu je zwei Punkten in U auch deren Verbindungsstrecke ganz in U enthalten ist. Lemma 14.6. Seien U ⊆ IRn offen und konvex sowie f : U → IRm differenzierbar. Falls M ≥ 0 existiert mit D f (x) ≤ M f¨ur alle x ∈ U, so gilt f (b) − f (a)2 ≤ M b − a2
f¨ur alle a, b ∈ U .
Beweis. Zu a, b ∈ U bezeichne I := {t ∈ IR : ta + (1 − t)b ∈ U}. Wir betrachten : I → U, (t) := ta + (1 − t)b, und schließlich g : I → IRm , g(t) := f ( (t)). Mit der Kettenregel folgt g (t) = Dg(t) = D f ( (t)) (t) = D f ( (t)) (a − b) und damit insbesondere g (t)2 ≤ D f ( (t)) b − a2 ≤ M b − a2
f¨ur alle t ∈ [0, 1] .
Laut Lemma 14.5 existiert nun ein x ∈ ]0, 1[ derart, dass f (b) − f (a)2 = g(0) − g(1)2 ≤ g (x)2 ≤ M b − a2 gilt.
Bemerkung: Lemma 14.6 kann ohne große Schwierigkeiten auch f¨ur beliebige endlich-dimensionale normierte IR-Vektorr¨aume formuliert werden. Wir notieren noch eine unmittelbare Folgerung. Korollar 14.7. Seien U ⊆ IRn offen und konvex sowie f : U → IRm differenzierbar. Wenn D f (a) = 0 f¨ur alle a ∈ U gilt, dann ist f konstant.
14.3 Mittelwertsatz und stetig differenzierbare Abbildungen
201
Im Fall reellwertiger Funktionen, also m = 1, k¨onnen wir ein analoges Resultat zu Satz 7.7 bez¨uglich lokaler Extrema herleiten. Satz 14.8. Seien U ⊆ IRn offen und f : U → IR differenzierbar. Falls f an der Stelle a ∈ U ein lokales Extremum besitzt, so gilt Du f (a) = 0 f¨ur alle Richtungsableitungen (u ∈ IRn , u = 1). Insbesondere ist grad f (a) = 0. Beweis. Sei u ∈ IRn , u = 1. Wir w¨ahlen ein Intervall I derart, dass a + tu ∈ U gilt f¨ur t ∈ I. Da f (a + tu) − f (a) = Du f (a) lim t→0 t existiert, ist die Funktion g : I → IR, g(t) := f (a + tu), an der Stelle t = 0 differenzierbar mit g (0) = Du f (a). Nach Voraussetzung besitzt g im Nullpunkt ein lokales Extremum und die Behauptung folgt mit Satz 7.7.
Die Umkehrung von Satz 14.8 gilt nicht, wie folgendes Beispiel zeigt. Beispiel: Wir betrachten f : IR2 → IR, f (x, y) := sin(xy). Die Funktion t → sin(t) besitzt Maxima genau an den Stellen t = (4k + 1) 2 und Minima genau bei t = (4k + 3) 2 , k ∈ ZZ. Damit k¨onnen wir auch die Maxima und Minima von f angeben. Die Funktion f ist konstant auf den Mengen At := {(x, y) ∈ IR2 : xy = t} . Maxima sind A(4k+1) ; Minima sind A(4k+3) , k ∈ ZZ. 2 2 Wir berechnen grad f . Es gilt
grad f (x, y) = y cos(xy), x cos(xy) . Man sieht, dass grad f (x, y) = 0 gilt f¨ur (x, y) ∈ A(2k+1) , k ∈ ZZ, also an den Extre2 malstellen. Doch es gibt noch einen weiteren Punkt, an welchem der Gradient verschwindet: Es ist grad f (0, 0) = 0. Am Nullpunkt besitzt f jedoch kein lokales Extremum; in jeder Umgebung gibt es Punkte mit positivem und auch welche mit negativem Funktionswert. Definition 14.9. Sei U ⊆ IRn offen. Eine differenzierbare Funktion f : U → IRm heißt stetig differenzierbar, wenn a → D f (a) eine stetige Abbildung U → L (IRn , IRm ) ist, also wenn folgendes gilt: Zu beliebigen a ∈ U und > 0 gibt es > 0 derart, dass D f (b) − D f (a) <
f¨ur alle b ∈ U mit b − a <
ist (wobei links die Operator-Norm in L (IRn , IRm ) zu betrachten ist). Den Raum aller stetig differenzierbaren Funktionen f : U → IRm bezeichnen wir mit C1 (U, IRm ). Im Fall m = 1 schreiben wir kurz C1 (U), vgl. Definition 7.5.
202
14 Totale Differenzierbarkeit
Satz 14.10. Sei U ⊆ IRn offen. Eine Funktion f : U → IRm ist stetig differenzierbar genau dann, wenn s¨amtliche partielle Ableitungen
fi : U → IR , xk
i = 1, . . . , m ,
k = 1, . . . , n ,
existieren und stetig sind. Beweis. Sei f ∈ C1 (U, IRm ). Wir wissen aus Satz 14.4, dass alle partiellen Ableitungen existieren und dass
fi (a) = D f (a) ek , wi xk mit den kanonischen Basen {w1 , . . . , wn } von IRn sowie {e1 , . . . , em } von IRm gilt (i = 1, . . . , n; k = 1, . . . , m). Mit der Cauchy-Schwarz-Ungleichung erhalten wir
fi
fi
= |D f (a) ek , wi − D f (b) ek , wi | (a) − (b)
x xk
k ≤ (D f (a) − D f (b)) ek 2 ≤ D f (a) − D f (b) , wobei wir ek 2 = 1 = wi 2 benutzt haben. Somit sind die Funktionen
fi xk
: U → IR stetig.
F¨ur die Umkehrung k¨onnen wir uns auf den Fall m = 1 beschr¨anken, denn wir haben zu zeigen, dass f (a + h) − f (a) − J f (a) h lim =0 h→0 h gilt, wobei J f (a) die Jacobi-Matrix ist. Daher reicht es, jede Komponenten-Funktion fi : U → IR zu untersuchen. Zu a ∈ U und > 0 w¨ahlen wir r > 0 mit
f
f
und Ur (a) ⊆ U
x (x) − x (a) < n k k f¨ur alle x ∈ Ur (a) und k ∈ {1, . . . , n}. Sei nun h = (h1 , . . . , hn ) ∈ IRn mit h2 < r. Setzt man v0 := 0 und vk := (h1 , . . . , hk , 0, . . . , 0) f¨ur k = 1, . . . , n, so gilt f (a + h) − f (a) =
n
( f (a + vk ) − f (a + vk−1) ) .
k=1
Wegen vk 2 < r gilt a + vk ∈ Ur (a) f¨ur alle k. Da Ur (a) konvex ist, sind die Verbindungsstrecken zwischen a + vk−1 und a + vk ganz in Ur (a) enthalten. Ferner ist a + vk = a + vk−1 + hk ek . Laut dem Mittelwertsatz, angewendet auf die stetig differenzierbare Funktion k : [0, 1] → IR, k (t) := f (a + vk−1 + t hk ek ), existiert k ∈ ]0, 1[ mit
14.4 Ableitungen h¨oherer Ordnung
f (a + vk ) − f (a + vk−1) = hk Weiter gilt
203
f (a + vk−1 + k hk ek ) . xk
f
f
h k
x (a + vk−1 + k hk ek ) − hk x (a) ≤ |hk | n k k
und wir erhalten
n f
(a) hk
f (a + h) − f (a) −
x k k=1
n
n f
= ( f (a + vk ) − f (a + vk−1) ) − (a) hk
k=1
x k k=1
n f f
= (a + vk−1 − k hk ek ) − (a) hk ≤
k=1 xk
n xk
n
|hk | ≤ h2
k=1
f¨ur alle h ∈ IRn mit h2 < r. Daher ist f in a differenzierbar und D f (a) = grad f (a). Da nach Voraussetzung jede Komponente von grad f stetig in a ist, folgt schließlich die Stetigkeit von a → D f (a) = grad f (a).
Bemerkung: Zusammenfassend wollen wir folgende Implikationen festhalten. (1)
(2)
fi existieren. xk Die Umkehrung gilt jedoch nicht, wie wir schon an Hand von Beispielen in Kapitel 14.2 gesehen haben. fi U ⊆ IRn , f : U → IRm stetig differenzierbar⇐⇒ existieren und sind stetig. xk U ⊆ IRn , f : U → IRm differenzierbar =⇒
14.4 Ableitungen h¨oherer Ordnung Seien V und W endlich-dimensionale normierte IR-Vektorr¨aume, U ⊆ V offen sowie f : U → W eine differenzierbare Funktion. Ist die Ableitung D f : U → L (V,W ) wieder differenzierbar, so bezeichnet man D(D f ) : U → L (V, L (V,W ) ) als zweite Ableitung. Falls existent k¨onnen wir sukzessive h¨ohere Ableitungen bilden. Dabei w¨achst die Dimension des Wertebereiches jeweils an. Beispielsweise ist dim(L (V,W ) ) = dim(V ) dim(W ). Wenn wir stetige Differenzierbarkeit ins Auge fassen, k¨onnen wir wieder auf skalarwertige Funktionen, n¨amlich die partiellen Ableitungen, zur¨uckgreifen. Wir
204
14 Totale Differenzierbarkeit
betrachten deshalb eine Funktion f : U → IR mit U ⊆ IRn offen. Allerdings treffen wir auf 2 f f D j (Di f ) = = x j xi x j xi einerseits und
2 f Di (D j f ) = = xi x j xi
f xj
andererseits (falls diese Ableitungen existieren). Beispiel: Sei f : IR2 → IR, ⎧ 2 2 ⎪ ⎨ xy x − y x2 + y2 f (x, y) := ⎪ ⎩ 0
f¨ur (x, y) = (0, 0) , f¨ur (x, y) = (0, 0) .
Die partiellen Ableitungen an einer Stelle (x, y) = (0, 0) k¨onnen wir mit Produktund Quotientenregel direkt bestimmen. Wir erhalten D1 f (x, y) = y
x2 − y 2 2x(x2 + y2 ) − 2x(x2 − y2) y(x2 − y2) 4x2 y3 + xy = + x2 + y2 (x2 + y2 )2 x2 + y2 (x2 + y2 )2
x(x2 − y2 ) 4x3 y2 − 2 . 2 2 x +y (x + y2 )2 Auch im Nullpunkt ist f partiell differenzierbar, denn die Grenzwerte und D2 f (x, y) =
lim
t→0
f (t, 0) − f (0, 0) =0 t
und
lim
t→0
f (0,t) − f (0, 0) =0, t
existieren; also gilt D1 f (0, 0) = 0 sowie D2 f (0, 0) = 0. Wir wollen nun noch sehen, dass auch die zweiten Ableitungen D1 (D2 f )(0, 0) und D2 (D1 f )(0, 0) existieren, aber nicht den selben Wert haben. Wegen D2 f (t, 0) − D2 f (0, 0) t −0 lim = lim =1 t→0 t→0 t t und haben wir hier
D1 f (0,t) − D1 f (0, 0) −t − 0 = lim = −1 t→0 t→0 t t lim
D1 (D2 f )(0, 0) = 1 = −1 = D2 (D1 f )(0, 0).
Das folgende Resultat zeigt, unter welchen Umst¨anden die Reihenfolge der Differentiation vertauscht werden darf. Satz 14.11 (Schwarz). Seien U ⊆ IRn offen und f : U → IR eine Funktion, deren zweite Ableitungen D j (Di f ) existieren und in x ∈ U stetig sind (i, j = 1, . . . , n). Dann gilt D j (Di f )(x) = Di (D j f )(x).
14.4 Ableitungen h¨oherer Ordnung
205
Beweis. Man kann sich auf n = 2 einschr¨anken. Seien x = (x1 , x2 ) und a = (a1 , a2 ) mit a1 = 0, a2 = 0. Wir betrachten g(t) := f (t, x2 + a2) − f (t, x2 )
und
h(t) := f (x1 + a1 ,t) − f (x1 ,t)
(f¨ur diejenigen t ∈ IR, sodass g und h definiert sind). Aus dem Mittelwertsatz (Satz 7.10) erhalten wir 1 ∈ ]0, 1[ mit f (x1 + a1 , x2 + a2 ) − f (x1 , x2 + a2 ) − f (x1 + a1, x2 ) + f (x1 , x2 ) = g(x1 + a1) − g(x1 ) = a1 g (x1 + 1 a1 ) = a1 (D1 f (x1 + 1 a1 , x2 + a2) − D1 f (x1 + 1 a1 , x2 ) )
(14.3)
und analog 2 ∈ ]0, 1[ mit f (x1 + a1 , x2 + a2 ) − f (x1 , x2 + a2 ) − f (x1 + a1, x2 ) + f (x1 , x2 ) = a2 (D2 f (x1 + a1, x2 + 2 a2 ) − D2 f (x1 , x2 + 2 a2 ) ) .
(14.4)
Nochmalige Anwendung des Mittelwertsatzes auf (14.3) bzgl. der zweiten Ver¨anderlichen liefert 3 ∈ ]0, 1[ mit 1 ( f (x1 + a1, x2 + a2) − f (x1 , x2 + a2 ) − f (x1 + a1 , x2 ) + f (x1 , x2 ) ) a1 a2 = D2 D1 f (x1 + 1 a1 , x2 + 3 a2 ) . Ebenso erhalten wir aus (14.4), wenn wir den Mittelwertsatz auf die erste Variable anwenden, 4 ∈ ]0, 1[ mit 1 ( f (x1 + a1, x2 + a2) − f (x1 , x2 + a2 ) − f (x1 + a1, x2 ) + f (x1 x2 ) ) a1 a2 = D1 D2 f (x1 + 4 a1 , x2 + 2 a2 ) . Mit a1 → 0, a2 → 0 sowie der Stetigkeit von D1 D2 f und D2 D1 f folgt schließlich die Behauptung.
Seien V,W endlich-dimensionale normierte IR-Vektorr¨aume und U ⊆ V offen. Wir nennen eine Funktion f : U → W zwei Mal stetig differenzierbar, wenn s¨amtliche zweite partielle Ableitungen aller Komponentenfunktionen von f existieren und stetig sind. Den Raum der zwei Mal stetig differenzierbaren Funktionen f : U → W bezeichnen wir mit C2 (U,W ). Wieder schreiben wir kurz C2 (U), falls W = IR ist. Entsprechend definiert man ggf. auch Ck (U,W ) f¨ur k > 2. Wir sind nun in der Lage, Taylorpolynome (vgl. Kapitel 10.1) f¨ur f ∈ Ck (U) zu erkl¨aren. Wir wollen uns hier auf den Fall k = 2 beschr¨anken.
206
14 Totale Differenzierbarkeit
Satz 14.12 (Taylorentwicklung in IRn ). Seien U eine offene, konvexe Menge im IRn und f : U → IR zwei Mal stetig differenzierbar. Dann gilt f (x) = f (a) + grad f (a) , x − a +
1 n Di D j f (a) (xi − ai )(x j − a j ) + R2 (x − a) , 2 i, j=1
2 (x−a) ugt. f¨ur a, x ∈ U, wobei das Restglied R2 der Bedingung lim Rx−a 2 = 0 gen¨
x→a
Beweis. Wegen der Stetigkeit der zweiten partiellen Ableitungen im Punkt a gibt es zu jedem > 0 und 1 ≤ i, j ≤ n ein > 0 derart, dass |Di D j f (a + h) − DiD j f (a)| ≤
n2
f¨ur h ≤
(14.5)
gilt. Nun betrachten wir bei festem x ∈ U die Hilfsfunktion F : [0, 1] → IR, F(t) := f (a + (x − a)t) . Sie ist zweimal stetig differenzierbar. Deshalb gibt es laut dem Satz von Taylor (Satz 10.1) ein ∈ ]0, 1[ mit 1 1 F(1) = F(0) + F (0) + F (0) + (F ( ) − F (0) ) . 2 2 Dabei ist F(1) = f (x), F(0) = f (a) und F (t) = grad f (a + (x − a)t) , x − a =
n
D j f (a + (x − a)t) (x j − a j ) ,
j=1
siehe Formel (14.2), sowie F (t) = Folglich gilt f (x) = f (a) + grad f (a) , x − a +
mit R2 (x − a) =
n
i, j=1
Di D j f (a + (x − a)t) (xi − ai )(x j − a j ).
1 n Di D j f (a) (xi − ai )(x j − a j ) + R2 (x − a) 2 i, j=1
1 n (Di D j f (a + (x − a) ) − DiD j f (a) ) (xi − ai )(x j − a j ). 2 i, j=1
F¨ur x − a ≤ liefert (14.5) die Absch¨atzung |R2 (x − a)| ≤
1 2 n x − a2 < x − a2 , 2 n2
woraus die behauptete Bedingung folgt.
14.4 Ableitungen h¨oherer Ordnung
207
Hat man eine Abbildung f : U → IR, f¨ur die alle zweiten partiellen Ableitungen in x ∈ U existieren (U ⊆ IRn ), so kann man diese in Matrixform angeben. Die Matrix ⎛ ⎞ D1 D1 f (x) · · · D1 Dn f (x) ⎜ ⎟ .. .. H f (x) = ⎝ ⎠ . . Dn D1 f (x) · · · Dn Dn f (x) heißt Hessematrix von f im Punkt x. Der Satz von Schwarz (Satz 14.11) besagt also, dass H f (x) symmetrisch ist, falls die zweiten partiellen Ableitungen von f im Punkt x stetig sind. Definition 14.13. Eine reelle symmetrische (n × n)-Matrix A heißt positiv definit, falls Ah, h > 0 f¨ur alle h ∈ IRn \ {0} gilt. Sie heißt positiv semidefinit, falls Ah, h ≥ 0 f¨ur alle h ∈ IRn \ {0} gilt. Die Matrix A heißt negativ (semi-)definit, falls Ah, h < 0 (bzw. Ah, h ≤ 0) f¨ur alle h ∈ IRn \ {0} gilt. Falls Vektoren h+ , h− ∈ IRn existieren mit Ah+ , h+ > 0 und Ah− , h− < 0, so heißt A indefinit. Aus der Linearen Algebra wissen wir, dass zu jeder reellen symmetrischen (n × n)-Matrix eine Orthonormalbasis des IRn aus Eigenvektoren von A existiert. Daraus ergibt sich folgendes: A ist positiv definit (bzw. positiv semidefinit) genau dann, wenn alle ihre Eigenwerte positiv (bzw. ≥ 0) sind. A ist genau dann negativ definit (bzw. negativ semidefinit), wenn alle ihre Eigenwerte negativ (bzw. ≤ 0) sind. Dagegen ist die Matrix indefinit genau dann, wenn sie Eigenwerte beiderlei Vorzeichens besitzt. ab gilt speziell: Im Fall reeller symmetrischer (2 × 2)-Matrizen A = bc A indefinit ⇐⇒ det A = ac − b2 < 0 , A positiv definit ⇐⇒ det A > 0 und a > 0 , A negativ definit ⇐⇒ det A > 0 und a < 0 , A semidefinit, aber nicht definit ⇐⇒ det A = 0 . F¨ur den Beweis sei auf Lehrb¨ucher zur Linearen Algebra verwiesen, z.B. [5]. Ist f : U → IR eine differenzierbare Funktion (U ⊆ IRn ), so bezeichnet man a ∈ U als station¨aren oder kritischen Punkt, wenn grad f (a) = 0 gilt. Satz 14.8 besagt, dass Extremalstellen notwendigerweise kritische Punkte sind. Das Beispiel direkt im Anschluss an Satz 14.8 zeigt weiter, dass nicht jeder kritische Punkt ein Extremum zu sein braucht, vgl. auch Aufgabe 3. Der nachfolgende Satz liefert f¨ur zwei Mal stetig differenzierbare Funktionen eine Charakterisierung gewisser kritischer Punkte mit Hilfe der Hessematrix. In diesem Zusammenhang bezeichnen wir a ∈ U als ein isoliertes lokales Extremum von f , wenn a ein lokales Extremum ist und ein > 0 existiert derart, dass U (a) kein weiteres lokales Extremum enth¨alt.
208
14 Totale Differenzierbarkeit
Satz 14.14. Seien U ⊆ IRn offen und f : U → IR zwei Mal stetig differenzierbar. Weiter seien a ∈ U ein kritischer Punkt von f und H f (a) die Hessematrix von f im Punkt a. Es gilt: (1)
Ist H f (a) indefinit, so ist a kein lokales Extremum von f .
(2)
Ist H f (a) positiv definit, so ist a ein isoliertes lokales Minimum von f .
(3)
Ist H f (a) negativ definit, so ist a ein isoliertes lokales Maximum von f .
Beweis. Mit grad f (a) = 0 vereinfacht sich die Taylorformel (Satz 14.12) zu 1 f (a + h) − (a) = H f (a) h , h + R2(h) 2 R2 (h) 2 h→0 h
f¨ur h mit hinreichend kleiner Norm und es gilt lim
= 0.
(1) Es gibt zwei Vektoren h+ und h− (mit Norm 1) im IRn sowie Skalare a+ > 0, a− < 0 mit H f (a) h± , h± = a± . F¨ur alle hinreichend kleinen t ∈ IR \ {0} gilt deshalb 1 t −2 ( f (a + th±) − f (a) ) = a± + t −2R2 (th± ) , 2 also nimmt die Differenz f (a + h) − f (a) in jeder Umgebung von a sowohl positive als auch negative Werte an. (2),(3) Ist auf der kompakten Sph¨are Sn−1 := {h ∈ IRn : h = 1} der Wert H f (a) h , h von festem Vorzeichen = 1 oder = −1, dann finden wir (siehe Korollar 12.9) ein m > 0 mit
H f (a) h , h ≥ m ,
falls h = 1 .
Daraus folgt f¨ur alle x ∈ IRn \ {0} von hinreichend kleiner Norm die Absch¨atzung
x−2 ( f (a + x) − f (a) ) =
m H f (a) x−1 x , x−1x + x−2R2 (x) > . 2 4
Folglich ist a ein isoliertes Minimum oder Maximum von f , je nachdem, ob = 1 oder = −1 ist.
Beispiel: Wir suchen alle lokalen Extrema der Funktion f : IR2 → IR, f (x, y) := 2x3 − 3x2 + 6xy2 + 4y3 . Mit grad f (x, y) = 6(x2 − x + y2, 2y(x + y) ) gilt grad f (x, y) = (0, 0) ⇐⇒ (y = 0 und x ∈ {0, 1}) oder (y = −x und x(2x − 1) = 0) .
Es gibt also drei kritische Punkte a1 = (0, 0), a2 = (1, 0) und a3 = 12 , − 12 .
14.5 Aufgaben
209
Nun bestimmen wir die Hessematrix. Wir haben H f (x, y) = und damit H f (a1 ) =
−6 0 0
0
,
H f (a2 ) =
6
0
0
12
12y
12y
12x + 24y
,
12x − 6
H f (a3 ) =
0
−6
−6 −6
.
Da H f (a2 ) positiv definit ist, handelt es sich bei a2 um ein lokales Minimum. Weiter ist H f (a3 ) indefinit, folglich ist a3 kein Extremum. Schließlich ist H f (a1 ) negativ semidefinit. In diesem Fall liefert Satz 14.14 keine Aussage. Wir m¨ussen auf anderem Wege feststellen, ob es sich hier um ein Extremum handelt. In der Tat nimmt f wegen f (0, y) = 4y3 in jeder Umgebung des Nullpunkts sowohl positive als auch negative Werte an. Demnach liegt hier kein Extremum vor.
14.5 Aufgaben 1. Zeigen Sie, dass die folgenden Funktionen differenzierbar sind und bestimmen Sie deren Jacobimatrix. ⎛ ⎞ 3x2 ⎜ sin(3x) ⎟ ⎟ a. f : IR → IR4 , f (x) := ⎜ ⎝ 42 ⎠ cos(x2 ) 4x2 y3 b. g : IR3 → IR2 , g(x, y, z) := xyez + exy c.
h : ]0, [ ×IR2 → IR ,
h(x, y, z) := sin(zx) ln(x + y2 )
2. Bestimmen Sie die kritischen Punkte der Funktionen
und
f : IR2 → IR ,
f (x, y) := 2x3 − 3x2 + 2y3 + 3y2 ,
g : IR2 → IR ,
g(x, y) := y2 ex +
h : IR2 → IR ,
h(x, y) := x3 − 3xy2 .
1 3 x −x+5, 3
Untersuchen Sie jeweils, ob es sich um ein lokales Maximum, ein lokales Minimum oder kein lokales Extremum handelt. 3. Gegeben sei die Funktion f : IR2 → IR, f (x, y) := sin(xy). a. Skizzieren Sie die Niveaumengen von f . b. Bestimmen Sie die Hessematrix von f und untersuchen Sie diese an den kritischen Stellen auf Definitheit.
210
14 Totale Differenzierbarkeit
4. Gegeben sei die Funktion f : IR2 → IR ,
f (x, y) :=
x2 + y2 .
Zeigen Sie: a. Die Funktion f ist in IR2 \{(0, 0)} differenzierbar; bestimmen Sie D f (x, y). b. Im Nullpunkt existieren keine Richtungsableitungen von f ; somit ist f dort auch nicht differenzierbar. 5. Bestimmen Sie alle lokalen Extrema der Funktion f : IR2 → IR ,
f (x, y) := (x2 − 1) sin y
und untersuchen Sie jeweils, ob ein Maximum oder ein Minimum vorliegt. 6. Zeigen Sie: Es gibt keine differenzierbare Funktion f : IR3 → IR mit grad f (x, y, z) = (yz, xz, xy2 ) . Hinweis: Die Annahme, es g¨abe eine derartige Funktion, k¨onnen Sie mit Hilfe des Satzes von Schwarz (Satz 14.11) zum Widerspruch f¨uhren. 7. Seien U ⊆ IRn offen und f ∈ C2 (U). Wir definieren den so genannten LaplaceOperator mittels
f (x) :=
n
Dk Dk f (x) .
k=1
Eine Funktion f mit f = 0 nennt man eine harmonische Funktion. a. Zeigen Sie, dass die Funktionen g : IR2 \ (0, 0) → IR , und
h : ]0, [ ×IR → IR ,
1 ln(x21 + x22 ) , 2 x2 , h(x1 , x2 ) := arctan x1
g(x1 , x2 ) :=
harmonisch sind. b. Zeigen Sie: Das Paar g, h erf¨ullt die Cauchy-Riemannschen Differentialgleichungen g h g h = und =− . x y y x c. Bestimmen Sie die Jacobimatrix von 2
F : ]0, [ ×IR → IR ,
F(x1 , x2 ) :=
g(x1 , x2 ) h(x1 , x2 )
.
14.5 Aufgaben
211
8. Seien g : ]0, [ → IR zwei Mal stetig differenzierbar und f : IRn \ {0} → IR, f (x) := g(x2 ). Zeigen Sie
f (x) = g (x2 ) +
n−1 g (x2 ) ; x2
dabei bezeichnet den Laplace-Operator, siehe Aufgabe 7. n
9. Seien n ∈ IN, a0 , . . . , an ∈ C, an = 0, und p : C → C, p(z) := ak zk . k=0
Fassen Sie p als Funktion IR2 → IR2 auf: Setzen Sie u(x, y) := Re (p(x + iy) ), v(x, y) := Im (p(x + iy) ) und u(x, y) 2 2 f : IR → IR , f (x, y) := . v(x, y) Zeigen Sie, dass f die Cauchy-Riemannschen Differentialgleichungen
u(x, y) = v(x, y) x y
und
u(x, y) = − v(x, y) y x
erf¨ullt. Hinweis: Zeigen Sie zun¨achst mittels vollst¨andiger Induktion, dass die Behauptung f¨ur pn (z) := zn , n ∈ IN0 , gilt. Wenn Sie un , vn sinngem¨aß definieren, dann gilt un+1 = x un − y vn und vn+1 = y un + x vn .
This page intentionally left blank
Kapitel 15
Umkehrsatz und implizite Funktionen
In diesem Kapitel werden wir uns unter anderem mit der Frage nach Existenz und Differenzierbarkeit der Umkehrfunktion f −1 zu einer gegebenen differenzierbaren Funktion f in normierten Vektorr¨aumen auseinandersetzen. An die Stelle der Bedingung f (x) = 0 im eindimensionalen Fall (vgl. Satz 7.17) tritt hier die Invertierbarkeit von D f (x). Die Invertierbarkeit von linearen Abbildungen spielt in diesem Zusammenhang also eine wichtige Rolle. Ist V ein normierter IR-Vektorraum, so ist auch L (V ) mit der Operatornorm ein normierter Raum, wie wir aus Satz 13.3 wissen. Viele der folgenden Resultate bleiben auch f¨ur unendlich-dimensionale Banachr¨aume g¨ultig; f¨ur unsere Zwecke reicht es aus, V als endlich-dimensional vorauszusetzen. Dann ist auch L (V ) endlich-dimensional und nach Satz 13.7 vollst¨andig, also ein Banachraum. Lineare Abbildungen in unendlich-dimensionalen R¨aumen spielen in der Funktionalanalysis eine zentrale Rolle. Zu diesem Gebiet existiert eine große Menge an weiterf¨uhrender Literatur, wie z.B. von H.W. Alt [1] oder D. Werner [22].
15.1 Invertierbare lineare Abbildungen und Diffeomorphismen Satz 15.1. Sei V ein endlich-dimensionaler normierter Raum. (a)
Ist A ∈ L (V ) mit A − idV < 1, so ist A invertierbar in L (V ) und es gilt A−1 =
(idV − A)n
n=0
(Konvergenz der Reihe in L (V ), wobei B0 := idV f¨ur B ∈ L (V ) sei). (b)
Die Menge G := {A ∈ L (V ) : A invertierbar} ist offen und A → A−1 ist eine stetige Abbildung G → G.
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_15, © Springer-Verlag Berlin Heidelberg 2012
213
214
15 Umkehrsatz und implizite Funktionen
Beweis. (a) Auf Grund der Submultiplikativit¨at der Operatornorm, siehe Bemerkung (2) in Kapitel 13.1, gilt (A − idV )n ≤ A − idV n f¨ur alle n. Die Konvergenz der Reihe in L (V ) folgt mit Hilfe von Satz 5.1 wegen A − idV < 1 (Geometrische Reihe). m
F¨ur m ∈ IN bezeichne Sm := (idV − A)n . Wir erhalten n=0
ASm = Sm A = Sm (idV − (idV − A) ) = m+1
= idV − (idV − A)
m
m+1
n=0
n=1
(idV − A)n − (idV − A)n
.
Mit m → gilt (idV − A)m+1 → 0 und damit folgt schließlich die Behauptung. (b) F¨ur beliebiges A0 ∈ G und alle A ∈ L (V ) mit A − A0 <
1 A−1 0
gilt
−1 −1 idV − A−1 0 A = A0 (A0 − A) ≤ A0 A0 − A < 1
und daher A−1 0 A ∈ G.
n −1 −1 = n Es folgt (A−1 (id − A−1 0 A) 0 A) = A0 (A0 − A) und damit n=0
n=0
A
−1
=
n=0
n A−1 0 (A0 − A)
Insbesondere ist A invertierbar. Damit ist gezeigt, dass G offen ist. n −1 −1 −1 Aus A − A0 = A0 (A0 − A) A−1 0
A−1 0 .
erhalten wir weiter
n=1
A
−1
− A−1 0
≤
n=1
n A−1 0 A0 − A
−1 A−1 0 = A0
A−1 0 A0 − A
1 − A−1 0 A0 − A
.
Zu > 0 k¨onnen wir also ein > 0 finden derart, dass aus A0 − A < stets A−1 − A−1
0 < folgt. Daher ist die Inversenbildung stetig. Den eben bewiesenen Satz werden wir speziell in Situationen benutzen, wenn die betrachteten linearen Abbildungen als Ableitung differenzierbarer Funktionen auftreten. Wir beginnen mit einem einfachen Beispiel. Die so genannten Polarkoordinaten im IR2 erh¨alt man durch die Abbildung : ]0, [ × ]0, 2 [ → IR2 ,
(r, ) := (r cos , r sin ) . cos −r sin . Diese ist differenzierbar mit D (r, ) = sin r cos
15.1 Invertierbare lineare Abbildungen und Diffeomorphismen
215
Weiter ist D (r, ) invertierbar als Element von L (IR2 , IR2 ). Mit (x, y) := (r cos , r sin ) gilt sin cos x/r −1 = (D (r, )) = 1 1 −y/r2 − r sin r cos
y/r x/r2
,
r=
x2 + y2 .
Wir erwarten, dass (D (r, ))−1 die Ableitung der Abbildung −1 : S → U ist, wobei S := (U) = IR2 \ {(t, 0) : t ≥ 0} die an der positiven x-Achse geschlitzte Ebene bezeichne, −1 (x, y) = (r , sign (y) arccos(x/r) ), r = x2 + y2 . Falls −1 differenzierbar ist, braucht man nur die Kettenregel auf ◦ −1 = idS oder −1 ◦ = idU anzuwenden. Dies war ein Spezialfall folgender allgemeiner Situation. Definition 15.2. Seien V und W endlich-dimensionale, normierte IR-Vektorr¨aume. Eine bijektive Abbildung : U1 → U2 , wobei U1 ⊆ V und U2 ⊆ W offene Mengen seien, heißt Diffeomorphismus, falls sowohl als auch −1 stetig differenzierbar sind. Beispiel: Sei f : IRn \ {0} → IRn \ {0}, f (x) :=
1 x. x2
Wir bezeichnen die Komponentenfunktionen von f wie u¨ blich mit f j , f j (x1 , . . . , xn ) =
xj 2 x1 + · · · + x2n
( j = 1, . . . , n) .
F¨ur i = j gilt 2xi x j fj −2xi (x1 , . . . , xn ) = x j 2 =− 2 2 xi x4 (x1 + · · · + xn ) und f¨ur i = j erhalten wir (x2 + · · · + x2n ) − 2x2i fi 1 2x2i (x1 , . . . , xn ) = 1 2 = − . xi x2 x4 (x1 + · · · + x2n )2 Insbesondere existieren alle partiellen Ableitungen und sind stetig; nach Satz 14.10 ist f stetig differenzierbar. Weiter gilt f (x) = 1/x und damit f ( f (x) ) = x, also existiert die Umkehrabbildung f −1 ; hier ist f = f −1 . Diese ist stetig differenzierbar; folglich ist f ein Diffeomorphismus.
216
15 Umkehrsatz und implizite Funktionen
Bemerkungen: Ist : U1 → U2 ein Diffeomorphismus von U1 ⊆ V auf U2 ⊆ W , dann gilt: (1)
dimV = dimW ,
(2)
F¨ur jedes a ∈ U1 und b = (a) ist D −1 (b) = (D (a))−1 .
Dies folgt mit der Kettenregel aus −1 ◦ = idU1 und ◦ −1 = idU2 , denn damit haben wir D −1 (b) D (a) = idV und D (a) D −1 (b) = idW . Insbesondere ist f¨ur einen Diffeomorphismus : U1 → U2 jede Ableitung D (a) invertierbar in L (V,W ). Satz 15.3. Seien V,W endlich-dimensionale, normierte IR-Vektorr¨aume, U1 ⊆ V und U2 ⊆ W offen sowie : U1 → U2 eine bijektive Abbildung. Ferner seien stetig differenzierbar und −1 : U2 → U1 stetig. Wenn die Ableitungen D (a) f¨ur jedes a ∈ U1 invertierbar in L (V,W ) sind, dann ist auch −1 stetig differenzierbar, d.h. ist ein Diffeomorphismus. Beweis. F¨ur den Nachweis der Differenzierbarkeit in b = (a) d¨urfen wir a = 0 und b = (a) = 0 annehmen, denn sonst betrachte man an Stelle von die Abbildung x → (x + a) − (a). ¨ Eine weitere Reduktion des Problems erhalten wir durch folgende Uberlegung. Die Abbildung := (D (0) )−1 ◦ ist stetig differenzierbar, injektiv und −1 ist stetig. Sie bildet U1 auf eine offene (das Urbild der offenen Menge U1 unter der stetigen Abbildung −1 ) Teilmenge von V ab. Mit der Kettenregel erhalten wir D (0) = idV . Die Ableitungen D (a) sind invertierbar, da nach Voraussetzung alle D (a) invertierbar sind. Hat man gezeigt, dass −1 in 0 differenzierbar ist, so ist auch −1 in 0 differenzierbar wegen −1 = −1 ◦ (D (0) )−1 . Wir k¨onnen also annehmen, dass (0) = 0 und D (0) = idV gilt. Dies bedeutet
(h) − idV h = R(h) ,
wobei
R(h) =0. h→0 h lim
(15.1)
Sei k ∈ V . Wir setzen h = −1 (k) ein und erhalten
Wir zeigen, dass
−1 (k) − k = −( (h) − h) = −R( −1 (k)) .
(15.2)
−R( −1 (k)) =0 k→0 k
(15.3)
lim
gilt, was a¨ quivalent zur Differenzierbarkeit von −1 in 0 mit D −1 (0) = idV ist. mit R(h) ≤ 12 h Da −1 stetig ist, gibt es wegen (15.1) positive Zahlen " r,−1 " −1 " f¨ur h ≤ r und (k) ≤ r f¨ur k < . Damit gilt R (k) " ≤ 12 −1 (k) f¨ur k < und mit (15.2) erhalten wir 1 −1 (k) − k ≤ −1 (k) 2
f¨ur k < .
15.1 Invertierbare lineare Abbildungen und Diffeomorphismen
217
Folglich haben wir −1 (k) ≤ 2k f¨ur k < und deshalb R( −1 (k)) 2R( −1 (k)) ≤ −→ 0 k −1 (k) mit k → 0, da hiermit auch h = −1 (k) → 0 gilt. Daraus folgt (15.3). Zu zeigen bleibt die stetige Differenzierbarkeit, dass D −1 : U2 → L (W,V ) eine stetige Abbildung ist. Wie eben k¨onnen wir V = W annehmen. Sei b ∈ U2 , b = (a). Aus der Kettenregel erhalten wir D −1 (b) = (D (a) )−1 . Wir betrachten eine Folge (bn )n∈IN in U2 mit bn → b. F¨ur an := −1 (bn ) gilt dann an → a in U1 und, da stetig differenzierbar ist, folgt D (an ) → D (a) in L (V ). Mit der Stetigkeit der Inversenbildung in L (V ), Satz 15.1, folgt schließlich (D (an ) )−1 → (D (a) )−1 , also D −1 (bn ) → D −1 (b). Damit ist die Stetigkeit von b → D −1 (b) gezeigt.
Beispiel: Sei f : IR3 → IR3 ,
Die Jacobimatrix von f lautet
⎛
⎞ x1 + ex2 f (x) := ⎝ x2 + ex3 ⎠ . x3 + ex1 ⎛
1 D f (x) = ⎝ 0 ex1
ex2 1 0
⎞ 0 ex2 ⎠ ; 1
ihre Determinante hat den Wert 1 + ex1 ex2 ex3 , ist also stets = 0. Daher ist D f (x) f¨ur alle x ∈ IR3 invertierbar. Seien x, y ∈ IR3 mit f (x) = f (y). Dann gilt x1 − y1 = ey2 − ex2 , x2 − y2 = ey3 − ex3 , x3 − y3 = ey1 − ex1 . Nehmen wir einmal an, es sei x1 > y1 . Dann folgt aus der dritten Gleichung x3 < y3 ; daraus folgt mit der zweiten Gleichung nun x2 > y2 und, wenn wir nun die erste Gleichung heranziehen, folgt x1 < y1 im Widerspruch zur Annahme. Mit der selben Argumentation, jeweils auch f¨ur das umgekehrte Vorzeichen, f¨ur alle drei Komponenten bleibt schließlich nur x1 = y1 , x2 = y2 und auch x3 = y3 . Folglich ist f injektiv. Bezeichnet U1 := IR3 und U2 := f (IR3 ), so ist f : U1 → U2 bijektiv. Um nun mit Satz 15.3 zu folgern, dass f ein Diffeomorphismus ist, ist es nicht n¨otig, die Bildmenge U2 oder die Umkehrabbildung f −1 explizit zu bestimmen. Es gen¨ugt zu wissen, dass f −1 stetig und U2 offen ist. Dies ist in der Tat der Fall, wie wir noch sehen werden, vgl. die Bemerkung im Anschluss an Satz 15.5 und Aufgabe 6.
218
15 Umkehrsatz und implizite Funktionen
15.2 Lokale Invertierbarkeit Zu Beginn dieses Abschnitts notieren wir einen wichtigen Fixpunktsatz. Dieser hat vielf¨altige Anwendungen; wir werden ihn benutzen als Hilfsmittel zum Beweis der Existenz von Umkehrabbildungen. Seien (M, d) ein metrischer Raum und : M → M eine Abbildung. Man sagt, ist kontrahierend, wenn eine Zahl q < 1 existiert derart, dass d( (x), (y) ) ≤ q d(x, y) f¨ur alle x, y ∈ M gilt. Satz 15.4 (Fixpunktsatz von Banach). Seien (M, d) ein vollst¨andiger metrischer Raum und : M → M eine kontrahierende Abbildung. Dann besitzt genau einen Fixpunkt, d.h. es existiert genau ein Punkt x∗ ∈ M mit (x∗ ) = x∗ . Beweis. Wir beginnen mit einem beliebigen y0 ∈ M und setzen yn := (yn−1 ) f¨ur n ∈ IN. Es gilt d(y1 , y2 ) = d( (y0 ), (y1 ) ) ≤ q d(y0 , y1 ) = q d(y0 , (y0 ) ) und mit Induktion folgt d(yn , yn+1 ) ≤ qn d(y0 , (y0 ) ) f¨ur alle n ∈ IN. F¨ur n, k ∈ IN erhalten wir damit d(yn , yn+k ) ≤
n+k−1
j=n
d(y j , y j+1 ) ≤ (qn + qn+1 + . . . + qn+k−1) d(y0 , (y0 ) ) ≤
qn d(y0 , (y0 ) ) 1−q
(Absch¨atzung durch die Geometrische Reihe). Wegen q < 1 folgt daraus weiter, dass (yn )n∈IN eine Cauchyfolge ist. Da (M, d) vollst¨andig ist, ist diese Folge konvergent, also existiert x∗ := lim yn . Wir erhalten n→
x∗ = lim yn = lim yn+1 = lim (yn ) = (x∗ ) , n→
n→
n→
wobei wir benutzt haben, dass stetig ist ( ist sogar Lipschitz-stetig). Demnach ist x∗ ein Fixpunkt. Zu zeigen bleibt noch die Eindeutigkeit. Seien x∗ , y∗ ∈ M mit (x∗ ) = x∗ und (y∗ ) = y∗ . Dann folgt d(x∗ , y∗ ) = d( (x∗ ), (y∗ ) ) ≤ q d(x∗ , y∗ ). Wegen q < 1 ist dies nur m¨oglich, wenn d(x∗ , y∗ ) = 0, also x∗ = y∗ , gilt.
Satz 15.5 (Satz von der lokalen Umkehrbarkeit). Seien V und W endlich-dimensionale normierte IR-Vektorr¨aume, U ⊆ V offen, f : U → W stetig differenzierbar und D f (a) ∈ L (V,W ) invertierbar f¨ur ein a ∈ U. Bezeichne b := f (a). (a)
Es existieren offene Mengen Ua in V und Wb in W mit a ∈ Ua , b ∈ Wb derart, dass f die Menge Ua bijektiv auf die Menge Wb abbildet.
(b)
Ist g : Wb → Ua die inverse Abbildung von f |Ua , so ist g stetig differenzierbar.
15.2 Lokale Invertierbarkeit
219
Beweis. Da D f (a) invertierbar vorausgesetzt ist, gilt dimV = dimW . Daher k¨onnen wir V = W = IRn annehmen und dort die Norm · 2 zu Grunde legen. Wir schreiben A := D f (a) und setzen :=
1 2A−1
> 0.
Da D f (a) als lineare Abbildung stetig ist, existiert eine offene Kugel Ua um a mit D f (x) − A < f¨ur alle x ∈ Ua . Zu festem y ∈ IRn definieren wir
y (x) := x + A−1(y − f (x) ) .
y : U → IRn ,
Damit ist x ein Fixpunkt von y genau dann, wenn f (x) = y ist. Nun gilt Dy (x) = id − A−1 D f (x) = A−1 (A − D f (x) ), also Dy (x) ≤ A−1 A − D f (x) <
1 2
f¨ur alle x ∈ Ua
und mit dem Schrankensatz (Korollar 13.14) erhalten wir 1 y (x1 ) − y (x2 )2 ≤ x1 − x22 2
f¨ur alle x1 , x2 ∈ Ua .
(15.4)
Folglich hat y |Ua h¨ochstens einen Fixpunkt x ∈ Ua , denn aus y (x1 ) = x1 und y (x2 ) = x2 folgt x1 − x2 2 ≤ 12 x1 − x2 2 . Somit existiert h¨ochstens ein x ∈ Ua mit f (x) = y. Insbesondere ist f |Ua injektiv. Setzt man Wb := f (Ua ), so ist f |Ua : Ua → Wb bijektiv. Zu zeigen bleibt, dass Wb offen ist. Dazu halten wir y0 ∈ Wb fest. Es gibt genau ein x0 ∈ Ua mit f (x0 ) = y0 . Weiter finden wir r > 0 mit Kr (x0 ) ⊆ Ua . Wir wollen sehen, dass f¨ur y − y0 < r stets y ∈ Wb gilt. Daraus folgt dann, dass Wb offen ist. Sei also y ∈ U r (y0 ). Mit entsprechendem y erhalten wir y (x0 ) − x0 2 ≤ A−1 (y − f (x0 ) )2 ≤ A−1 y − y02 <
1 r r = . 2 2
F¨ur x ∈ Kr (x0 ) gilt mit (15.4) weiter y (x) − x0 2 ≤ y (x) − y (x0 )2 + y (x0 ) − x02 ≤
r r 1 r x − x02 + ≤ + = r , 2 2 2 2
also y (x) ∈ Kr (x0 ). Demnach ist y |Kr (x0 ) eine Abbildung von Kr (x0 ) in Kr (x0 ) und wegen (15.4) ist y kontrahierend. Als abgeschlossene Teilmenge eines Banachraumes ist Kr (x0 ) ein vollst¨andiger metrischer Raum (siehe auch Kapitel 12.3, Aufgabe 9). Mit dem Fixpunktsatz von Banach (Satz 15.4) folgt schließlich, dass y |Kr (x0 ) genau einen Fixpunkt x ∈ Kr (x0 ) hat. F¨ur dieses x gilt f (x) = y, also y ∈ Wb wie gew¨unscht. Damit ist die Aussage (a) bewiesen.
220
15 Umkehrsatz und implizite Funktionen
Wir m¨ussen noch nachweisen, dass g := ( f |Ua )−1 stetig differenzierbar ist. Um Satz 15.3 anzuwenden, haben wir zu zeigen, dass g : Wb → Ua stetig und D f (x) f¨ur alle x ∈ Ua invertierbar ist. Dazu seien y1 , y2 ∈ Wb und x1 := g(y1 ) sowie x2 := g(y2 ). Wir betrachten nun 0 zu 0 ∈ IRn und erhalten
0 (x2 ) − 0(x1 ) = x2 − x1 − A−1( f (x2 ) − f (x1 ) ) = x2 − x1 − A−1(y2 − y1) . Mit (15.4) folgt x2 − x1 2 ≤ 0 (x2 ) − 0 (x1 )2 + A−1(y2 − y1 )2 ≤
1 x2 − x1 2 + A−1 y2 − y1 2 . 2
Somit gilt g(y2 ) − g(y1)2 x2 − x1 2 ≤ 2A−1 y2 − y1 2 . Demnach ist g stetig. Schließlich zeigen wir noch die Invertierbarkeit von D f (x) f¨ur alle x ∈ Ua . Es ist D f (x) − A < f¨ur alle x ∈ Ua ; damit erhalten wir D f (x) v − Av2 ≤ v2
f¨ur alle x ∈ Ua , v ∈ IRn .
Wenn D f (x)v = 0 f¨ur ein x ∈ Ua und v ∈ IRn gilt, ergibt sich Av2 ≤ Es folgt v2 =
A−1Av
2
≤
A−1
Av2 ≤
1 2 v2
1 2A−1
v2 .
und damit dann v = 0.
Folglich ist D f (x) invertierbar.
Wir wollen die Aussage des Satzes 15.5 einer komponentenweisen Interpretation unterziehen. Hat man das System von n Gleichungen y1 = f (x1 , . . . , xn ) .. .. . . yn = f (x1 , . . . , xn ) mit f ∈ C1 (U) und D f (a) invertierbar, so existieren Umgebungen Ua von a und Wb von b = f (a), sodass man dieses Gleichungssystem nach x1 , . . . , xn aufl¨osen kann, wenn x = (x1 , . . . , xn ) ∈ Ua und y = (y1 , . . . , yn ) ∈ Wb gew¨ahlt werden. Man spricht von lokaler Invertierbarkeit. Beispiel: Seien V = W = IR3 und f : IR3 → IR3 , f1 (x1 , x2 , x3 ) := x1 + x2 + x3 , f2 (x1 , x2 , x3 ) := x2 x3 + x3 x1 + x1 x2 , f3 (x1 , x2 , x3 ) := x1 x2 x3 . Damit ist
15.2 Lokale Invertierbarkeit
221
⎛
1 D f (x) = ⎝ x3 + x2 x2 x3
1 x3 + x1 x1 x3
⎞
1 x2 + x1 ⎠ . x1 x2
Man kann direkt nachrechnen, dass det D f (x) = (x1 − x2 )(x1 − x3 )(x2 − x3) gilt. Somit ist D f (a) invertierbar, falls a = (a1 , a2 , a3 ) paarweise verschiedene Komponenten besitzt. Also gibt es f¨ur solche a eine offene Umgebung Ua von a sowie eine offene Umgebung Wb von b = f (a) derart, dass f |Ua : Ua → Wb invertierbar ist. Bemerkung: Ist f : U → W stetig differenzierbar, U ⊆ V offen, mit D f (x) inver: offen f¨ur alle offenen Teilmengen U : ⊆ U. tierbar f¨ur alle x ∈ U, so ist f (U) : existieren offene MenMan erh¨alt dies direkt aus Satz 15.5, denn f¨ur jedes x ∈ U : und W f (x) , sodass f |Ux : Ux → W f (x) bijektiv ist. gen Ux ⊆ U + : = Insbesondere ist f (U) W f (x) offen. : x∈U
Außerdem ist f lokal injektiv, d.h. f |Ux ist injektiv f¨ur alle x ∈ U. Das bedeutet allerdings nicht zwingend, dass auch f injektiv ist. x e cosy 2 2 . Beispiel: Wir betrachten die Funktion f : IR → IR , f (x, y) := ex sin y F¨ur alle (x, y) ∈ IR2 ist die Jacobimatrix x e cos y −ex sin y D f (x, y) = ex sin y ex cos y invertierbar, da ihre Determinante den Wert e2x (cos2 y + sin2 y) = e2x = 0 hat. Weiter gilt f (x, y + 2 ) = f (x, y) f¨ur alle (x, y) ∈ IR2 , daher ist f nicht injektiv. Wir merken noch an, dass f nichts anderes als die komplexe Exponentialfunktion ist, wenn man IR2 mit C identifiziert. Da f nicht injektiv ist, existiert zwar keine & globale ' Umkehrabbildung, aber beispielsweise bildet f die Menge U := IR × − 2 , 2 bijektiv auf W := ]0, [ ×IR ab. Hier k¨onnen wir eine lokale Umkehrabbildung leicht angeben. Aus x e cos y u = ∈W x e sin y v folgt einerseits andererseits
√ u2 + v2 = e2x (cos2 y + sin2 y) = ex , also x = 12 ln(u2 + v2 ) und sin y v = = tan y . u cos y
Es zwar viele y ∈ IR mit tany = uv , allerdings liegt nur eines davon im Intervall ' & gibt − 2 , 2 , n¨amlich y = arctan uv .
222
15 Umkehrsatz und implizite Funktionen
Die gesuchte Umkehrabbildung ( f |U)−1 : W → U ist folglich gegeben durch 1 2 2 2 ln(u + v ) ,
(u, v) → arctan uv vgl. auch Kapitel 14.5, Aufgabe 7. Insbesondere ist f |U ein Diffeomorphismus. Entsprechend kann man zu jedem a ∈ IR2 eine offene Umgebung Ua finden, sodass f |Ua ein Diffeomorphismus ist. Im vorliegenden Fall haben wir, wenn wir hier wieder IR2 mit C identifizieren, lokale Umkehrungen der komplexen Exponentialfunktion gefunden. Man bezeichnet diese auch als die Zweige des (komplexen) Logarithmus.
15.3 Implizit definierte Funktionen Wir beginnen mit einem einfachen Beispiel. Gegeben sei die Funktion f : IR2 → IR, f (x, y) := x2 (1 − x2 ) − y2 . Weiter sei M := {(x, y) ∈ IR2 : f (x, y) = 0} die Menge der Nullstellen von f . 1 2
Die Abbildung zeigt die Nullstellenmenge M der Funktion f . Diese Menge ist nicht der Graph einer Funktion IR → IR.
1
Schr¨anken wir uns auf die Menge U := ]0, [ × ]0, [ ein, so k¨onnen wir die Gleichung f (x, y) = 0 nach y aufl¨osen. F¨ur (x, y) ∈ U gilt x2 (1 − x2) − y2 = 0 ⇐⇒ y2 = x2 (1 − x2 ) ⇐⇒ y = x2 (1 − x2 ) . Setzen wir g : ]0, 1[ → IR, g(x) :=
x2 (1 − x2), so erhalten wir
M ∩U = {(x, y) : y = g(x)} . In V := (x, y) ∈ IR2 : x > 12 k¨onnen wir nach x aufl¨osen. F¨ur (x, y) ∈ V gilt 2
2
2
x (1 − x ) − y = 0 ⇐⇒ x =
1 1 + 1 − 4y2 . 2 2
' & Mit h : − 12 , 12 → IR, h(y) := 12 + 12 1 − 4y2, gilt M ∩V = {(x, y) : x = h(y)}.
15.3 Implizit definierte Funktionen
223
In U kann man die Gleichung f (x, y) = 0 nach y aufl¨osen.
In V kann man die Gleichung f (x, y) = 0 nach x aufl¨osen.
Wir halten noch fest, dass hier sowohl f als auch g und h stetig differenzierbar sind und, dass f¨ur (x, y) ∈ U ∩ M stets yf (x, y) = 0, f¨ur (x, y) ∈ V ∩ M stets xf (x, y) = 0 gilt. Es wird sich zeigen, dass diese Bedingungen an die partiellen Ableitungen eine wichtige Rolle hinsichtlich der Aufl¨osbarkeit von Gleichungen spielen. Bevor wir den Satz u¨ ber implizite Funktionen allgemein formulieren, werden wir den linearen Fall untersuchen. Sind x = (x1 , . . . , xn ) ∈ IRn und y = (y1 , . . . , ym ) ∈ IRm , so schreiben wir nun (x, y) = (x1 , . . . , xn , y1 , . . . , ym ) ∈ IRn+m und mit (x, y) ∈ IRn+m meinen wir stets x ∈ IRn und y ∈ IRm . Eine lineare Abbildung A ∈ L (IRn+m , IRn ) k¨onnen wir in zwei Abbildungen Ax ∈ L (IRn , IRn ) und Ay ∈ L (IRm , IRn ) zerlegen durch Ax h := A(h, 0) Ay k := A(0, k)
mit h ∈ IRn , 0 ∈ IRm , mit 0 ∈ IRn , k ∈ IRm .
Damit gilt A(h, k) = Ax h + Ayk. Mit diesen Bezeichnungen ist die folgende lineare Version des Satzes u¨ ber implizite Funktionen offensichtlich. Satz 15.6. Sei A ∈ L (IRn+m , IRn ). Weiter sei Ax invertierbar. Dann gibt es zu jedem k ∈ IRm ein eindeutig bestimmtes h ∈ IRn derart, dass A(h, k) = 0 gilt. Man erh¨alt dieses als h = −(Ax )−1 Ay k . Bemerkungen: (1)
Satz 15.6 besagt, das die Gleichung A(h, k) = 0 bei vorgegebenem k auf eindeutige Weise nach h aufgel¨ost werden kann, falls Ax invertierbar ist. Weiter ist h ist eine lineare Funktion von k.
(2)
Selbstverst¨andlich k¨onnen IRn durch einen n-dimensionalen normierten Vektorraum V und IRm durch einen m-dimensionalen normierten Raum W sowie dann IRn+m durch V × W ersetzt werden.
224
15 Umkehrsatz und implizite Funktionen
Satz 15.7 (Satz uber ¨ implizite Funktionen). Seien V ein n-dimensionaler und W ein m-dimensionaler normierter Raum. Weiter seien U ⊆ V × W offen, f : U → V stetig differenzierbar und (a, b) ∈ U ein Punkt, f¨ur den f (a, b) = 0 gilt. Bezeichne A := D f (a, b) ∈ L (V × W,V ). Schließlich sei noch vorausgesetzt, dass die durch die Zerlegung A(h, k) = Ax h + Ayk erkl¨arte Abbildung Ax ∈ L (V ) invertierbar ist. Dann gibt es eine offene Umgebung U(a,b) von (a, b) in V × W und eine offene Umgebung Wb von b in W mit den folgenden Eigenschaften: Jedem y ∈ Wb ist genau ein x ∈ V zugeordnet, sodass (x, y) ∈ U(a,b) und f (x, y) = 0 gilt. Wird dieses x als g(y) definiert, so ist g : Wb → V stetig differenzierbar mit g(b) = a sowie f (g(y), y) = 0 f¨ur alle y ∈ Wb und es gilt Dg(b) = −(Ax )−1 Ay . Beweis. Wie in Satz 15.5 k¨onnen wir wieder V = IRn und W = IRm mit der jeweiligen · 2-Norm annehmen. Wir werden den Satz u¨ ber die lokale Umkehrbarkeit auf folgende Funktion anwenden: F : U → IRn+m ,
F(x, y) := ( f (x, y), y) .
Diese ist stetig differenzierbar. Um zu sehen, dass DF(a, b) ∈ L (IRn+m ) invertierbar ist, m¨ussen wir zeigen, dass DF(a, b) injektiv ist. Mit f (a, b) = 0 erhalten wir f (a + h, b + k) = A(h, k) + R(h, k) , wobei R(h, k) das Restglied gem¨aß Definition 14.1 zu D f (a, b) ist. Nun gilt F(a + h, b + k) − F(a, b) = ( f (a + h, b + k), b + k) − ( f (a, b), b) = ( f (a + h, b + k), k) = (A(h, k), k) + (R(h, k), 0) . Mit h → 0, k → 0 sieht man, dass DF(a, b) ∈ L (IRn+m ) nichts anderes als die lineare Abbildung (h, k) → (A(h, k), k) ist. W¨are nun DF(a, b) nicht injektiv, so g¨abe es (h, k) = (0, 0) mit (A(h, k), k) = (0, 0). Daraus folgt aber A(h, k) = 0 und k = 0, also Ax h = A(h, 0) = 0 und, da Ax invertierbar ist, m¨usste auch h = 0 sein. Folglich ist DF(a, b) injektiv. Nun ist der Satz von der lokalen Umkehrbarkeit (Satz 15.5) auf F anwendbar. Wir erhalten damit offene Mengen U(a,b) ⊆ IRn+m mit (a, b) ∈ U(a,b) und W(0,b) mit (0, b) ∈ W(0,b) , sodass F : U(a,b) → W(0,b) bijektiv ist. Weiter setzen wir Wb := {y ∈ IRm : (0, y) ∈ W(0,b) }. Die Menge Wb ist offen, da W(0,b) offen ist. Ist y ∈ Wb , so existiert genau ein (x, y) ∈ U(a,b) mit F(x, y) = (0, y). Laut der Definition von F bedeutet dies, dass f (x, y) = 0 gilt. Ist f¨ur das selbe y auch f (: x, y) = 0, so gilt F(: x, y) = ( f (: x, y), y) = (0, y) = ( f (x, y), y) = F(x, y) und mit der Injektivit¨at von F|U(a,b) folgt x = x:. Somit ist auch die Eindeutigkeit des zugeordneten x bewiesen.
15.3 Implizit definierte Funktionen
225
Bezeichne g(y) = x. Hiermit ist eine Funktion g : Wb → IRn erkl¨art und es gilt (g(y), y) ∈ U(a,b) sowie f (g(y), y) = 0, also F(g(y), y) = (0, y). −1
erh¨alt man daraus (g(y), y) = G(0, y) und, da G stetig Mit G := F|U(a,b) differenzierbar ist, ist auch g stetig differenzierbar. Um schließlich Dg(b) zu berechnen, betrachten wir : Wb → U(a,b) , (y) := (g(y), y). Es gilt f¨ur alle y ∈ Wb , k ∈ IRm
D (y) k = (Dg(y)k, k)
(15.5)
und wegen f ◦ (y) = 0 folgt mit der Kettenregel D f ( (y)) D (y) = 0 .
(15.6)
Aus der Zerlegung A(h, k) = Ax h + Ay k und den Gleichungen (15.5) sowie (15.6) folgt nun Ax Dg(b) k + Ay k = A(Dg(b)k, k) = A D (b) k = 0 f¨ur alle k ∈ IRm . Dies bedeutet Ax Dg(b) = −Ay .
Beispiel: Sei f : IR2+3 → IR2 , f = ( f1 , f2 ), mit f1 (x1 , x2 , y1 , y2 , y3 ) := 2ex1 + x2 y1 − 4y2 + 3 , f2 (x1 , x2 , y1 , y2 , y3 ) := x2 cos x1 − 6x1 + 2y1 − y3 . F¨ur a := (0, 1) und b := (3, 2, 7) haben wir f (a, b) = 0. Die Ableitung hat bez¨uglich der Standardbasis die Darstellung y1 x2 −4 0 2ex1 D f (x1 , x2 , y1 , y2 , y3 ) = . 0 −1 −x2 sin x1 − 6 cosx1 2 Wir zerlegen A := D f (a, b) in 2 3 Ax = −6 1
Ay =
und
1
−4
0
2
0
−1
und erkennen, dass Ax invertierbar ist. Laut Satz 15.7 existieren eine offene Umgebung Wb von b = (3, 2, 7) und eine stetig differenzierbare Abbildung g : Wb → IR2 mit f (g(y), y) = 0 f¨ur alle y ∈ Wb . Um Dg(3, 2, 7) zu bestimmen, ben¨otigen wir A−1 x . Es gilt 1 1 −3 −1 , Ax = 20 6 2 also 1 Dg(3, 2, 7) = − 20
1 −3 6
2
1 −4 2
0
0 −1
=
1 4
1 5
3 − 20
− 12
6 5
1 10
.
226
15 Umkehrsatz und implizite Funktionen
15.4 Extrema unter Nebenbedingungen Wir untersuchen Extremwertaufgaben f¨ur Funktionen f : U → IR, wobei aber die Punkte a ∈ U, die f¨ur die Extremwertsuche zugelassen sind, die Nebenbedingung g(a) = 0 mit einer gegebenen Funktion g : U → IR erf¨ullen m¨ussen (U ⊆ IRn offen). Mit anderen Worten: Wir betrachten die Einschr¨ankung von f auf die Nullstellenmenge S := {x ∈ U : g(x) = 0} von g. Ist a ∈ U ein Punkt, an welchem die Nullstellenmenge S eine Niveaulinie von f schneidet, so gibt es in jeder Umgebung von a sowohl Punkte x+ mit f (x+ ) > f (a) als auch x− mit f (x− ) < f (a).
S
Ein Extremum kann nur dort vorliegen, wo sich S und eine Niveaulinie von f tangential ber¨uhren.
x0
Falls f und g stetig differenzierbar sind, bedeutet dies, dass an einer solchen Stelle x0 dann grad f (x0 ) und grad g(x0 ) die gleiche Richtung haben.
a
Satz 15.8 (Multiplikatorregel von Lagrange). Seien U ⊆ IRn offen, f , g : U → IR stetig differenzierbar und a ∈ U mit g(a) = 0, grad g(a) = 0. Weiter sei S := {x ∈ U : g(x) = 0} . Hat f |S im Punkt a ein lokales Extremum, dann gibt es eine reelle Zahl mit grad f (a) = grad g(a) . Beweis. Nach eventueller Umnummerierung k¨onnen wir wegen grad g(a) = 0 annehmen, dass xgn (a) = 0 ist. Laut dem Satz u¨ ber implizite Funktionen (Satz 15.7) ist in einer Umgebung von a eine Funktion h in n − 1 Variablen (x1 , . . . , xn−1 ) erkl¨art, sodass xn = h(x1 , . . . , xn−1 ) die Bedingung g(x1 , . . . , xn ) = 0 erf¨ullt, und es gilt ; g h g (a1 , . . . , an−1 ) = − (a) (a) xi xi xn
f¨ur i = 1, . . . , n − 1 .
Die Voraussetzung, dass f |S im Punkt a ein lokales Extremum hat, k¨onnen wir wie folgt formulieren: Die Abbildung (x1 , . . . , xn−1 ) → f (x1 , . . . , xn−1 , h(x1 , ..., xn−1 ) ) besitzt in (a1 , . . . , an−1 ) ein lokales Extremum. Damit gilt notwendigerweise
f f h (a) + (a) (a1 , . . . , an−1 ) xi xn xi ; g f f g (a) − (a) (a) (a) = xi xn xi xn
0=
f¨ur i = 1, . . . , n − 1. Mit :=
f g xn (a) / xn (a)
ist die Behauptung gezeigt.
15.4 Extrema unter Nebenbedingungen
227
Beispiel: Wir betrachten die Funktion f : IR2 → IR, f (x, y) := x3 − 3xy2 . Seien r > 0 und Mr := {(x, y) ∈ IR2 : x2 + y2 = r2 }. Mit Hilfe von Satz 15.8 wollen wir die Extrema von f auf Mr bestimmen. Dazu setzen wir g : IR2 → IR, g(x, y) := x2 + y2 − r2 . Damit ist Mr genau die Menge der Nullstellen von g. Es gilt grad g(x, y) = (2x, 2y) und insbesondere grad g(x, y) = (0, 0) f¨ur alle (x, y) ∈ Mr . M¨ogliche Extrema finden wir daher, indem wir L¨osungen der Gleichung grad f (x, y) = grad g(x, y) suchen. Weiter ist grad f (x, y) = (3x2 − 3y2, −6xy). Wir suchen also L¨osungen des Gleichungssystems 3x2 − 3y2 = 2 x , −6xy = 2 y , x2 + y 2 = r 2 . Aus der zweiten Gleichung folgt y = 0 oder = −3x. Im Fall y = 0 erhalten wir aus der dritten Gleichung dann x = ±r und auch die erste Gleichung ist erf¨ullbar mit einem geeigneten . Der genaue Wert von spielt hier gar keine Rolle mehr; wichtig ist nur, dass es ein solches gibt. Im Fall y = 0 folgt wie gesagt = −3x. Setzen wir dies in die erste Gleichung ein, so erhalten wir 3x2 = y2 und mit der dritten Gleichung folgt 4x2 = r2 , also √ x = ± 2r . Damit ergibt sich schließlich y = ± r 2 3 . Wenn f also auf der Menge Mr ein Extremum annimmt, dann kommen nur die folgenden Stellen in Frage: √ √ r r 3 r r 3 a1 = , , a2 = − , , a3 = (−r, 0) , 2 2 2 2 a4 =
√ r 3 r , − ,− 2 2
a5 =
√ r 3 r ,− , 2 2
a6 = (r, 0) .
Nun m¨ussen wir noch u¨ berpr¨ufen, ob es sich auch wirklich um Extrema handelt. Dazu stellen wir fest, dass die stetige Funktion f auf der kompakten Menge Mr Maximum und Minimum annimmt (vgl. Korollar 12.9), d.h. mindestens einer der eben bestimmten Punkte muss ein Maximum sein und mindestens einer muss ein Minimum sein. Vergleichen wir die Funktionswerte an diesen Punkten, so erhalten wir f (a2 ) = f (a4 ) = f (a6 ) = r3
und
f (a1 ) = f (a3 ) = f (a5 ) = −r3 ,
also handelt es sich bei ersteren um Maxima, bei den anderen um Minima.
228
15 Umkehrsatz und implizite Funktionen
15.5 Aufgaben 1. Seien U := ]0, [ × ]0, 2 [ und f : U → IR2 , f (u, v) := (u2 cos v, u2 sin v). a. Zeigen Sie, dass D f (u, v) invertierbar ist f¨ur alle (u, v) ∈ U. b. Weiter sei S := f (U). Zeigen Sie, dass f : U → S ein Diffeomorphismus ist und bestimmen Sie D( f −1 ). 2. Sei f : IR2 → IR2 , f (x, y) := (ex+y cos(x − y), ex+y sin(x − y) ). Zeigen Sie, dass f in allen Punkten (x, y) ∈ IR2 eine lokale Umkehrfunktion besitzt. 3. Sei f : IR2 → IR, f (x, y) := 3x2 + xy4 − yey . Zeigen Sie, dass ein Intervall I mit 0 ∈ I sowie eine differenzierbare Funktion g : I → IR existieren mit f (x, g(x) ) = 0
f¨ur alle x ∈ I
und bestimmen Sie g . 4. Zeigen Sie, dass das Gleichungssystem 2ex1 + x2 x3 − 4x4 = 3 x2 cos x1 − 6x1 + 2x3 − x5 = 0 in einer Umgebung des Punktes (0, 1, 1, 0, 3) nach den Variablen x1 und x2 aufgel¨ost werden kann. Weiter seien b := (1, 0, 3) und g : Wb → IR2 die durch obiges Gleichungssystem implizit erkl¨arte Funktion (mit geeignetem Wb ⊆ IR3 ). Begr¨unden Sie, warum g stetig differenzierbar ist und bestimmen Sie Dg(b). 5. Gegeben ist das Gleichungssystem x2 + sin(xy2 − 2z) = 0 , x2 + sin(y + xz2 ) = 0 . Zeigen Sie: Zu beliebigem > 0 existieren unendlich viele L¨osungen (x, y, z) des Systems mit (x, y, z) < . Hinweis: Zeigen Sie, dass die Menge der L¨osungen in einer offenen Umgebung des Nullpunkts der Graph einer Funktion ist (man kann nach x aufl¨osen). 6. Seien V,W zwei endlich-dimensionale normierte IR-Vektorr¨aume. Weiter seien U ⊆ V offen und f : U → W stetig differenzierbar derart, dass D f (a) f¨ur jedes a ∈ U invertierbar ist. Zeigen Sie: Die Bildmenge f (U) ist offen in W .
15.5 Aufgaben
229
7. Seien U := ]0, [ × ]0, [ und f : U → IR, f (x, y) := x + y. Bestimmen Sie alle lokalen Extrema von f auf der Menge 1 1 M := (x, y) ∈ U : 2 + 2 = 1 . x y 8. Seien K := {(x, y) ∈ IR2 : x2 + y2 = 1} und f : K → IR, f (x, y) := Bestimmen Sie alle lokalen Extrema von f .
x+y . 1 − xy
This page intentionally left blank
Kapitel 16
Elementar l¨osbare Differentialgleichungen
Zahlreiche Ph¨anomene werden mit gew¨ohnlichen Differentialgleichungen beschrieben. Differentialgleichungen sind daher Gegenstand vieler weiterf¨uhrender Vorlesungen. Zu diesem Thema existiert auch ein umfangreiches Angebot an Literatur, wie z.B. Forst/Hoffmann [6]. Wir wollen hier lediglich einige elementare Beispiele betrachten und Aussagen zur Existenz und Eindeutigkeit von L¨osungen herleiten. Bevor wir uns L¨osungsmethoden und Existenzaussagen zuwenden, wollen wir einige Situationen beschreiben, in denen Differentialgleichungen eine Rolle spielen. (1)
Zerfalls- und Wachstumsprozesse x = x ,
∈ IR
(Wachstumsrate proportional zur Gr¨oße).
Dabei ist x : I → IR eine differenzierbare Funktion auf einem Intervall I. Der Wert x(t) beschreibt dabei z.B. die Anzahl der zur Zeit t vorhandenen Atome (radioaktiver Zerfall), oder die Populationsgr¨oße, etwa von Bakterien, zur Zeit t. Eine L¨osung lautet x(t) = x0 e t ,
t ∈ IR ,
mit x0 = x(0) .
Ist > 0 so gilt lim x(t) = (unrealistisch f¨ur Populationen). t→
(2)
Logistisches Wachstum (Verhulst-Pearl-Gleichung) x = (a − bx)x ,
a, b > 0 .
Wieder interpretiert man x(t) als Populationsgr¨oße zum Zeitpunkt t. Hier h¨angt die Rate a − bx von der derzeitigen Gr¨oße der Population ab. Dabei beschreibt a die Wachstumsrate (bei unbegrenzten Ressourcen) und −bx(t) die ¨ Wirkung begrenzter Ressourcen oder einer Uberbev¨ olkerung“. Eine L¨osung ” lautet a 1 x(t) = mit x0 = x(0) . b 1 + e−at a − 1 bx0
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5_16, © Springer-Verlag Berlin Heidelberg 2012
231
232
16 Elementar l¨osbare Differentialgleichungen
Man kann dies durch Einsetzen leicht nachpr¨ufen, siehe auch Kapitel 16.4, Aufgabe 2. Allerdings ist hier anzumerken, dass x(t) nicht f¨ur alle t ∈ IR definiert ist. Neben dem Problem, eine L¨osung zu finden, stellt sich bei vielen Differentialgleichungen die Frage, ob u¨ berhaupt und auf welchem Definitionsbereich L¨osungen existieren. Das logistische Modell findet zahlreiche Anwendungen in der theoretischen Biologie, Demographie etc. (3)
Newtons Gesetz
mx (t) = f (t, x(t), x (t) ) .
Hier beschreibt x(t) die Position eines Teilchens, auf das eine Kraft f wirkt. Dabei ist f eine Funktion der Zeit t, der Lage x(t) und der Geschwindigkeit x (t); m bezeichnet die Masse. Ist z.B. die Kraft die Gravitation, so gilt mx (t) = −mg mit der Gravitationskonstanten g. Eine L¨osung der letzteren Differentialgleichung lautet 1 x(t) = − gt 2 + c1t + c2 2
mit c1 , c2 ∈ IR .
Um c1 und c2 zu bestimmen, muss man x(t0 ) und x (t0 ) zu einem Zeitpunkt t0 kennen. Ist speziell x (t) = −x(t) die (normierte) Gleichung des harmonischen Oszillators, so hat man L¨osungen x(t) = c1 sin t + c2 cost , (4)
c1 , c2 ∈ IR .
R¨auber-Beute-Modell (Lotka-Volterra). In diesem Modell hat man eine Beute-Population x(t) und eine R¨auberPopulation y(t). Die Beute-Population hat unbegrenzte Ressourcen, wird aber durch die R¨auber-Population in Abh¨angigkeit von Begegnungen mit y(t) dezimiert: x (t) = ( − y(t) ) x(t) = x(t) − y(t) x(t)
( > 0, > 0) .
Die R¨auber-Population w¨achst mit Anwesenheit von Beute und Begegnung mit ihr, und wird durch eine Sterberate dezimiert: y (t) = ( x(t) − ) y(t) = x(t) y(t) − y(t)
( > 0, > 0) .
Damit hat man eine 2-dimensionale Differentialgleichung x = ( − y) x , y = ( x − ) y .
16.1 Der Satz von Picard-Lindel¨of
233
L¨osungen sind unter die konstanten Funktionen (x(t), y(t) ) = (0, 0) anderem
und (x(t), y(t) ) =
,
.
Zwei weitere L¨osungen sind leicht zu finden, etwa (x(t), y(t) ) = (0, e− t ) und (x(t), y(t) ) = (e t , 0). Letztere ist wegen lim e t = unrealistisch. t→
16.1 Der Satz von Picard-Lindel¨of Wir betrachten eine allgemeine Differentialgleichung, ein so genanntes Anfangswertproblem (kurz AWP), der Form x (t) = f (t, x(t) ) ,
x(t0 ) = x0 ,
wobei f : D → IRd mit D ⊆ IRd+1 und (t0 , x0 ) ∈ D sind. Wir beschr¨anken uns auf D = Za,b mit Za,b := [t0 − a,t0 + a] × Kb(x0 ) und Kb (x0 ) := {x ∈ IRd : x − x02 ≤ b}. Zun¨achst erweitern wir den Fixpunktsatz von Banach (Satz 15.4) ein wenig. Satz 16.1 (Fixpunktsatz von Banach, Weissinger). Sei (M, d) ein vollst¨andiger
metrischer Raum. Weiter seien ak eine konvergente Reihe mit ak > 0 f¨ur alle k k=1
und : M → M eine Abbildung mit d( k (x), k (y) ) ≤ ak d(x, y)
(16.1)
f¨ur alle x, y ∈ M und k ∈ IN. Dabei bezeichne k = ◦ k−1 und 1 = . Die Abbildung besitzt genau einen Fixpunkt, d.h. es gibt genau ein x∗ ∈ M mit (x∗ ) = x∗ . Dieser Fixpunkt ist Grenzwert der Iterationsfolge ( k (x0 ) )k∈IN bei beliebigem Startwert x0 ∈ M und es gilt die Fehlerabsch¨atzung d(x∗ , n (x0 ) ) ≤
ak
d( (x0 ), x0 ) .
(16.2)
k=n
Beweis. Aus (16.1) erhalten wir d( n+1 (x0 ), n (x0 ) ) = d( n ( (x0 ) ), n (x0 ) ) ≤ an d( (x0 ), x0 ) f¨ur n ∈ IN. Damit folgt d( n+k (x0 ), n (x0 ) ) ≤ d( n+k (x0 ), n+k−1 (x0 ) ) + . . . + d( n+1 (x0 ), n (x0 ) ) ≤ (an+k−1 + . . . + an ) d( (x0 ), x0 ) .
(16.3)
Daher ist ( n (x0 ))n∈IN eine Cauchyfolge in (M, d) und wegen der Vollst¨andigkeit existiert x∗ := lim n (x0 ). Weiter gilt auch (x∗ ) = lim n+1 (x0 ) = x∗ . n→
n→
234
16 Elementar l¨osbare Differentialgleichungen
Ist y ein weiterer Fixpunkt, so gilt d(x∗ , y) = d( n (x∗ ), n (y) ) ≤ an d(x∗ , y). f¨ur alle n ∈ IN. Wegen an → 0 mit n → folgt schließlich x∗ = y. Die Fehlerabsch¨atzung (16.2) folgt aus (16.3) mit k → .
Wir werden diesen Satz anwenden auf Anfangswertprobleme, bei denen f die folgende Bedingung erf¨ullt. Definition 16.2. Seien a, b > 0 und f : Za,b → IRd stetig. Man sagt, dass f eine Lipschitzbedingung bezuglich ¨ x erf¨ullt, falls L ≥ 0 existiert mit f (t, x) − f (t, y)2 ≤ L x − y2 f¨ur alle (t, x), (t, y) ∈ Za,b , und bezeichnet L dann als Lipschitz-Konstante. Ist J ein Intervall, so bezeichnet man mit C(J, IRd ) den Vektorraum aller stetigen Funktionen : J → IRd . Wenn J kompakt ist, so liefert Korollar 9.3 angewendet auf jede Komponentenfunktion, dass C(J, IRd ) mit := sup (t)2 ein Banachraum ist. t∈J
Satz 16.3 (Picard-Lindel¨of). Erf¨ullt die Funktion f : Za,b → IRd eine Lipschitzbedingung bzgl. x mit der Lipschitz-Konstanten L, so hat das Anfangswertproblem x = f (t, x) ,
x(t0 ) = x0
genau eine L¨osung auf dem Intervall J = [t0 − ,t0 + ], wobei := min{a, b/m} mit m = f = sup f (t, x)2 ist. (t,x)∈Za,b
Die L¨osung erh¨alt man, indem man eine beliebige Funktion
0 ∈ M := { ∈ C(J, IRd ) : (t) − x02 ≤ b f¨ur alle t ∈ J} w¨ahlt und
n (t) := x0 +
( t t0
f (s, n−1 (s) ) ds
f¨ur n ∈ IN, t ∈ J setzt. Mit n → konvergiert n gleichm¨aßig auf J gegen die L¨osung und f¨ur alle t ∈ J gilt die Fehlerabsch¨atzung ( L)k (t) − n(t)2 ≤ max 1 (t) − 0(t)2 t∈J k=n k! oder gr¨ober (t) − n(t)2 ≤
( L)n L e max 1 (t) − 0(t)2 . t∈J n!
16.1 Der Satz von Picard-Lindel¨of
235
Beweis. Nach Konstruktion ist M eine abgeschlossene Teilmenge von C(J, IRd ) und folglich mit der von der Norm erzeugten Metrik, d(1 , 2 ) = sup 1 (t) − 2(t)2 , t∈J
ein vollst¨andiger metrischer Raum (vgl. auch Kapitel 12.3, Aufgabe 9). Nun definieren wir : M → M mittels
( )(t) = x0 +
( t t0
f (s, (s) ) ds
f¨ur t ∈ J .
Wir m¨ussen noch verifizieren, dass ( ) ∈ M f¨ur alle ∈ M gilt. Wegen "( t " " " " ≤ m |t − t0| ≤ m ≤ b ( )(t) − x02 = " f (s, (s) ) ds " " t0
2
f¨ur alle t ∈ J ist dies der Fall. F¨ur alle t ∈ J gilt weiter "( t " " " " ( )(t) − ( )(t)2 = " ( f (s, (s) ) − f (s, (s) )) ds" " t 0
2
≤ L |t − t0 | sup (s) − (s)2 ≤ L − . s∈J
n
Induktiv erhalten wir n ( )(t) − n ( )(t)2 ≤ (n!L) − f¨ur alle t ∈ J und n ∈ IN, also ( L)n n ( ) − n ( ) ≤ − . n! Mit Satz 16.1 folgt die Existenz und Eindeutigkeit einer Funktion ∗ : J → IRd mit ( ∗ ) = ∗ , d.h. (
∗ (t) = x0 +
t
t0
f (s, ∗ (s) ) ds .
Durch Einsetzen erkennt man, dass ∗ eine L¨osung des Anfangswertproblems ist. Satz 16.1 liefert auch die behauptete Fehlerabsch¨atzung, welche insbesondere die gleichm¨aßige Konvergenz n → ∗ zur Folge hat.
Beispiel: Wir suchen eine L¨osung des Anfangswertproblems x = −2tx ,
x(0) = 1 .
Dazu setzen wir f (t, x) := −2xt und beginnen etwa mit der konstanten Funktion 0 (t) := 1. ( Wir berechnen 1 (t) = 1 −
t
0
2s ds = 1 − t 2 und weiter
236
16 Elementar l¨osbare Differentialgleichungen
2 (x) = 1 − 3 (x) = 1 −
(t 0
(t 0
2s 1 (s) ds = 1 − 2s 2 (s) ds = 1 −
(t 0
(t 0
1 (2s − 2s3) ds = 1 − t 2 + t 4 , 2 1 1 (2s − 2s3 + s5 ) ds = 1 − t 2 + t 4 − t 6 . 2 6 n
Dies gibt Anlass zur Vermutung, dass n (t) =
Damit w¨are dann ∗ (t) =
k=0
k=0
(−1)k 2k k! t
(−1)k 2k k! t
f¨ur alle n ∈ IN gilt.
= exp(−t 2 ).
In der Tat kann man durch Einsetzen sofort nachpr¨ufen, dass x(t) = exp(−t 2 ) die gesuchte L¨osung ist. Die gefundene L¨osung ist hier sogar auf ganz IR definiert. Es stellt sich die Frage, ob man allgemein f¨ur die gefundene L¨osung das vorliegende L¨osungsintervall vergr¨oßern kann. Mit dem Satz von Picard-Lindel¨of erhalten wir f¨ur das Anfangswertproblem x = f (t, x), x(t0 ) = x0 eine L¨osung , die zun¨achst auf einem Intervall [t0 − ,t0 + ] definiert ist. Wir k¨onnen nun zwei weitere Anfangswertprobleme betrachten mit Anfangsbedingungen an den Stellen t = t0 − oder t = t0 + . Man betrachtet also x = f (t, x), x(t0 + ) = (t0 + ) und wendet Satz 16.3 erneut an, falls f in einem geeigneten Intervall um t0 + ebenfalls eine Lipschitzbedingung erf¨ullt. Auf diese Weise erh¨alt man eine L¨osungsfortsetzung von .
t0 −
t0
t0 +
: (t0 + ) +
Hat man eine L¨osung im Intervall [t0 − ,t0 + ] gefunden, so kann man, falls f auch in einer Umgebung von t0 + eine Lipschitzbedingung erf¨ullt, erneut das Verfahren von PicardLindel¨of anwenden, um eine Fortsetzung der L¨osung auf ein gr¨oßeres Intervall zu erhalten.
Folgendes Beispiel zeigt, dass man allgemein jedoch nicht erwarten kann, eine L¨osung zu finden, die auf ganz IR erkl¨art ist: Die Differentialgleichung x = x2t besitzt die L¨osungen (t) =
2 2− t 2
mit ∈ IR.
Betrachtet man das Anfangswertproblem x = x2t, x(0) = 1, so erh¨alt man als eindeutige L¨osung 2 1 (t) = 2 − t2 √ zun¨achst auf einem Intervall [− , ]. Da 1 in den Punkten t = ± 2 gar nicht definiert √ ist, √ wird auch die durch obiges Vorgehen konstruierte Fortsetzung innerhalb ] − 2, 2[ bleiben.
16.1 Der Satz von Picard-Lindel¨of
237
In Definition 16.2 haben wir eine Lipschitzbedingung auf Mengen Za,b erkl¨art. Wir erweitern diesen Begriff noch ein wenig. Definition 16.4. Seien D ⊆ IRd+1 und f : D → IRd eine stetige Funktion. Wenn wir (t, x) ∈ D schreiben, ist stets t ∈ IR, x ∈ IRd gemeint. Falls eine Konstante L ≥ 0 existiert mit f (t, x) − f (t, y)2 ≤ L x − y2
f¨ur alle (t, x), (t, y) ∈ D ,
so sagt man, dass f auf D eine globale Lipschitzbedingung bez¨uglich x erf¨ullt mit der Lipschitz-Konstanten L. Gibt es zu jedem Punkt in D eine Umgebung U, sodass f |U ∩ D einer LipschitzBedingung bzgl. x gen¨ugt, so heißt f Lipschitz-stetig bez¨uglich x in D. Korollar 16.5. Seien D ⊆ IRd+1 offen und f : D → IRd stetig. Weiter sei f Lipschitzstetig bez¨uglich x. Dann besitzt das Anfangswertproblem x = f (t, x) ,
x(t0 ) = x0 ,
(t0 , x0 ) ∈ D ,
eine eindeutig bestimmte L¨osung , definiert auf einem Intervall [t0 − ,t0 + ] mit einem (von (t0 , x0 ) abh¨angigen) > 0. Beweis. Zu (t0 , x0 ) ∈ D gibt es eine Umgebung U derart, dass f |U ∩ D einer Lipschitz-Bedingung gen¨ugt. Da D offen ist, k¨onnen wir U ⊆ D annehmen. Weiter gibt es eine Menge der Form Za,b mit (t0 , x0 ) ∈ Za,b ⊆ U und Satz 16.3 liefert die Behauptung.
Korollar 16.6. Seien D ⊆ IRd+1 offen und f : D → IRd stetig. Weiter seien f Lipschitz-stetig bez¨uglich x und I1 , I2 zwei Intervalle derart, dass 1 : I1 → IRd sowie 2 : I2 → IRd L¨osungen von x = f (t, x) sind. Wenn ein t∗ ∈ I1 ∩ I2 existiert mit 1 (t∗ ) = 2 (t∗ ), dann folgt 1 (t) = 2 (t) f¨ur alle t ∈ I1 ∩ I2 . Beweis. Da 1 und 2 stetig sind, ist auch s : I1 ∩ I2 → IR, s(t) := 1 (t) − 2 (t)2 , eine stetige Funktion. Wir nehmen an, es gibt t1 ∈ I1 ∩ I2 mit 1 (t1 ) = 2 (t1 ), also s(t1 ) > 0. Dabei k¨onnen wir t1 < t∗ voraussetzen (den Fall t1 > t∗ behandelt man ganz analog). Als Urbild einer abgeschlossenen Menge unter einer stetigen Abbildung ist s−1 ({0}) abgeschlossen (vgl. Satz 12.4). Daher existiert t0 := min{t ∈ [t1 ,t∗ ] : s(t) = 0}. Das Anfangswertproblem x = f (t, x) ,
x(t0 ) = 1 (t0 ) = 2 (t0 )
hat laut Korollar 16.5 eine eindeutige L¨osung auf einem Intervall [t0 − ,t0 + ]. Dies steht im Widerspruch dazu, dass 1 und 2 verschiedene L¨osungen sind.
238
16 Elementar l¨osbare Differentialgleichungen
In anderen Worten l¨asst sich die Aussage von Korollar 16.6 wie folgt formulieren: Unter den gegebenen Voraussetzungen k¨onnen sich verschiedene L¨osungskurven von x = f (t, x) niemals schneiden. Satz 16.7 (Globaler Existenz- und Eindeutigkeitssatz). Seien D ⊆ IRd+1 offen und f : D → IRd stetig. Weiter sei f Lipschitz-stetig bez¨uglich x. Zu jedem (t0 , x0 ) ∈ D gibt es dann ein eindeutig bestimmtes offenes Intervall I mit t0 ∈ I, sodass gilt: (i)
Das Anfangswertproblem x = f (t, x), x(t0 ) = x0 , besitzt genau eine L¨osung : I → IRd .
(ii)
Sind J ein Intervall und : J → IRd eine weitere L¨osung dieses Anfangswertproblems, so folgt J ⊆ I und |J = .
Beweis. Bezeichne t + := sup{ ∈ IR : AWP besitzt L¨osung auf [t0 , ]}
und
−
t := inf{ ∈ IR : AWP besitzt L¨osung auf [ ,t0 ]} , wobei auch t + = und t − = − m¨oglich sind (die Mengen, deren Supremum bzw. Infimum hier betrachtet wird, sind nicht leer laut Korollar 16.5). Wir setzen I := ]t −,t + [ und tn−
:=
−n , falls t − = − ,
tn+
:=
t − + 1n , falls t − = − ,
t + − 1n , falls t + = , n , falls t + = ,
f¨ur n ∈ IN. Ohne Einschr¨ankung k¨onnen wir annehmen, dass n groß genug ist, sodass tn− ≤ tn+ gilt. Schließlich sei In := [tn− ,tn+ ]. Auf jedem In existiert eine L¨osung n des Anfangwertproblems. F¨ur t ∈ I setzen wir nun (t) := n (t), wobei n so gew¨ahlt ist, dass t ∈ In gilt. Wegen Korollar 16.6 ist (t) wohldefiniert und die einzige auf ganz I definierte L¨osung. F¨ur jede auf einem Intervall J definierte L¨osung des Anfangswertproblems gilt nach Konstruktion J ⊆ I sowie, wiederum laut Korollar 16.6, = |J.
Bemerkung: Das maximale Intervall I, auf welchem die L¨osung des Anfangswertproblems definiert ist, h¨angt von den gegebenen Anfangswerten (t0 , x0 ) ab. Es ist m¨oglich, dass man f¨ur gewisse Anfangswerte eine L¨osung erh¨alt, die auf ganz IR definiert ist, wahrend man bei der Wahl anderer Anfangswerte in der selben Differentialgleichung ein beschr¨anktes Intervall als maximalen Definitionsbereich der L¨osung bekommt. Wir werden am Ende des n¨achsten Abschnitts noch ein Beispiel diskutieren.
16.2 Differentialgleichungen mit getrennten Variablen
239
16.2 Differentialgleichungen mit getrennten Variablen Wir wollen Anfangswertprobleme der Form x (t) = f (t)g(x(t) ) ,
x(t0 ) = x0
betrachten, wobei f : I → IR und g : J → IR stetige Funktionen auf Intervallen I bzw. J sind und (t0 , x0 ) ∈ I × J gilt. F¨ur die Vorgehensweise zum Bestimmen einer L¨osung kann folgende Merkregel dienen: Wir schreiben ” dx 1 = f (t)g(x) ⇒ dx = f (t) dt dt g(x) und integrieren.“ Wir wollen hier nicht weiter darauf eingehen, inwiefern obige Schreibweise sinnvoll ist. Allerdings gilt der folgende Satz. Satz 16.8. Seien I, J zwei offene Intervalle, f : I → IR und g : J → IR stetige Funktionen mit g(x) = 0 f¨ur alle x ∈ J. Weiter seien t0 ∈ I und x0 ∈ J. Dann existiert ein offenes Intervall I0 mit t0 ∈ I0 derart, dass das Anfangswertproblem x = f (t) g(x) , x(t0 ) = x0 eine L¨osung x : I0 → J besitzt. Man erh¨alt eine L¨osung, indem man die Gleichung ( x x0
1 d = g( )
( t t0
f (s) ds
nach x aufl¨ost. Beweis. Da g stetig und nullstellenfrei ist, gilt entweder g( ) > 0 f¨ur alle ∈ J oder g( ) < 0 f¨ur alle ∈ J. Weiter ist 1g auf [x0 , x] integrierbar. Damit ist G : J → IR ,
G(x) :=
( x x0
1 d g( )
streng monoton und laut dem Hauptsatz der Differential- und Integralrechnung 1 (Satz 8.7) differenzierbar mit G (x) = g(x) . Die Funktion G bildet J bijektiv auf ein Intervall J ab; nach Satz 7.17 ist die 1 Umkehrfunktion H := G−1 differenzierbar mit H (x) = G (H(x)) = g(H(x) ).
Wegen G(x0 ) = 0 ist 0 ∈ J . Als Urbild des offenen Intervalls J unter der stetigen Abbildung H ist auch J offen, vgl. Satz 12.4. Daher gibt es ein > 0 derart, dass ] − , [ ⊆ J gilt. Da F : I → IR ,
F(t) :=
( t t0
f (s) ds
240
16 Elementar l¨osbare Differentialgleichungen
als Stammfunktion einer stetigen Funktion ebenfalls stetig ist, gibt es ein > 0, sodass |F(t)| = |F(t) − F(t0 )| < f¨ur alle t ∈ I mit |t − t0 | < gilt. Das Intervall I0 := ]t0 − ,t0 + [ ∩ I ist offen und nach Konstruktion gilt F(t) ∈ ] − , [ ⊆ J f¨ur alle t ∈ I0 . Demnach ist die Funktion : I0 → IR, (t) := H(F(t) ), wohldefiniert und differenzierbar. Mit der Kettenregel erhalten wir
(t) = H (F(t)) F (t) =
1
f (t) = f (t) g( (t)) ,
G (H(F(t)))
also l¨ost das Anfangswertproblem. F¨ur x ∈ I0 gilt mit H = G−1 schließlich x = H(F(t)) ⇐⇒ G(x) = F(t) ; folglich erh¨alt man diese L¨osung, indem man die Gleichung G(x) = F(t) nach x aufl¨ost.
Beispiel: Wir wollen das Anfangswertproblem x = x2 t ,
x(t0 ) = x0
mit (t0 , x0 ) ∈ IR2 l¨osen. Dazu halten wir zun¨achst fest, dass im Fall x0 = 0 die Konstante (t) = 0 ∀ t ∈ IR das Anfangswertproblem l¨ost. Ist x0 = 0, so gibt es ein Intervall J mit g(x) := x2 = 0 f¨ur x ∈ J und es gilt ( x x0
Mit f (t) := t haben wir
( t t0
1 d = g( )
( x 1 x0
2
d =
1 1 − . x0 x
1 f (s) ds = (t 2 − t02 ). Wir m¨ussen also die Gleichung 2 1 1 1 2 2 − = (t − t0 ) x0 x 2
nach x aufl¨osen und erhalten x =
2x0 . 2 + x0(t02 − t 2 )
Als L¨osung des Anfangswertproblems haben wir also
(t) =
2x0 = 2 + x0(t02 − t 2)
2 x0
2 , + t02 − t 2
zun¨achst auf einem Intervall I0 mit t0 ∈ I0 . Wir wollen noch anmerken, dass die Funktion (t, x) → x2t Lipschitz-stetig im Sinne von Definition 16.4 ist. Daher ist die gefundene L¨osung des Anfangswertproblems eindeutig. Ihr maximales Definitionsintervall Imax (t0 , x0 ) = ]t − ,t + [, siehe
16.3 Lineare Systeme von Differentialgleichungen
241
Satz 16.7, h¨angt von der Lage der Anfangswerte ab. Entscheidend ist, wo die Nullstellen des Nenners in obiger Darstellung von liegen. F¨ur x0 < 0 und t02 < − x20 ist (t) f¨ur alle t ∈ IR erkl¨art, also ist Imax = IR. Ebenso haben wir Imax = IR auch im Fall x0 = 0, da hier die Nullfunktion die L¨osung des Anfangswertproblems ist. Zu Anfangswerten t02 > − x20 erhalten wir schließlich Imax =
, t02 + x20 ,
f¨ur t0 > 0 und x0 < 0 ,
, Imax = − , − t02 + x20
f¨ur t0 < 0 und x0 < 0 ,
, Imax = − t02 + x20 , t02 + x20
f¨ur t0 > 0 und x0 > 0 .
16.3 Lineare Systeme von Differentialgleichungen In diesem Abschnitt wollen wir zun¨achst Anfangswertprobleme der Form x = Ax ,
x(t0 ) = x0 ∈ IRd
betrachten, wobei A eine (d × d)-Matrix ist. F¨ur x, y ∈ IRd gilt Ax − Ay2 = A(x − y)2 ≤ A x − y2 mit der zur Euklidischen Norm geh¨orenden Operatornorm. Demnach ist die Abbildung (t, x) → Ax Lipschitz-stetig bez¨uglich x im Sinne von Definition 16.4. Folglich besitzt obiges Anfangswertproblem laut Korollar 16.5 f¨ur jedes (t0 , x0 ) ∈ IRd+1 eine eindeutig bestimmte L¨osung. Eine Methode, diese L¨osung zu bestimmen, f¨uhrt u¨ ber die Exponentialfunktion. Sei A eine (d × d)-Matrix. Wegen n Ak Ak Ak ≤ ≤ = exp(A) k=0 k! k=0 k! k=0 k! n
folgt mit dem Majorantenkriterium (Satz 5.6) die Existenz von exp(A) :=
Ak , k=0 k!
wobei die Konvergenz der Reihe hier im Banachraum L (IRd ), ausgestattet mit der Operatornorm, zu verstehen ist. Gelegentlich schreibt man auch eA an Stelle von exp(A). Wir beginnen mit einigen Beispielen im Fall d = 2.
242
16 Elementar l¨osbare Differentialgleichungen
Beispiele: (1)
Sei A =
0 0
mit , ∈ IR. F¨ur k ∈ IN0 ist dann
e 0 0 e
exp(A) = (2)
Sei nun A =
0 −
0
.
mit ∈ IR.
5
A = usw. Damit erhalten wir ⎛ 2k (−1)k (2k)! ⎜ k=0 ⎜ exp(A) = ⎜ ⎝ 2k+1 − (−1)k (2k+1)!
Zu A =
0
1
5
0 1 −1 0
0 1 , A4 = 4 id, −1 0
⎞ 2k+1 (−1)k (2k+1)! ⎟ k=0 cos ⎟ ⎟= − sin 2k ⎠ (−1)k (2k)!
k=0
(3)
=
k 0 , also 0 k
Hier haben wir A0 = id, A2 = − 2 id, A3 = − 3
Ak
sin
cos
.
k=0
mit = 0 wollen wir exp(tA), t ∈ IR, bestimmen.
Eine einfache Rechnung liefert ⎛
⎜ k=0 ⎜ exp(tA) = ⎜ ⎝
(tA)k
(t )k k!
0
=
(t )k
kt k k−1
0
(t )k
t
(t )k k!
(t )k k!
k=0
k=0
⎞ ⎟ ⎟ ⎟= ⎠
f¨ur k ∈ IN und
et
tet
0
et
.
Um einige wichtige Eigenschaften der matrix-wertigen Exponentialfunktion zeigen zu k¨onnen, notieren wir folgende Hilfsaussage. Lemma 16.9. Seien A und B zwei (d × d)-Matrizen. Es gilt n An Bn Ak Bn−k n! n! = k! (n − k)! . n=0 n=0 n=0 k=0 Beweis. Man kann den Beweis von Satz 5.17 w¨ortlich u¨ bernehmen. An die Stelle des Absolutbetrags tritt hier die Operatornorm.
16.3 Lineare Systeme von Differentialgleichungen
243
Satz 16.10. Seien A und B zwei beliebige (d × d)-Matrizen sowie T eine weitere invertierbare (d × d)-Matrix. (a) (b) (c)
Ist B = T −1 AT , so gilt exp(B) = T −1 exp(A) T . Wenn AB = BA gilt, dann ist exp(A + B) = exp(A) exp(B). Es gilt exp(−A) = (exp(A) )−1 ; insbesondere ist also exp(A) invertierbar.
Beweis. (a) Aus (T −1 AT )k = T −1 Ak T erhalten wir n n Ak (T −1 AT )k −1 f¨ur alle n ∈ IN T k! T = k! k=0 k=0 und mit n → dann die Behauptung. (b) Wegen AB = BA ergibt sich mit der Binomialformel n n An Bn−k n n n−k n (A + B) = . A B = n! k=0 k k=0 k! (n − k)! Nun folgt mit Lemma 16.9 die Behauptung. (c) Die Aussage folgt nun unmittelbar, wenn wir B = −A einsetzen.
Bemerkungen: (1)
Die Gleichung exp(A + B) = exp(A) exp(B) gilt im Allgemeinen nicht! 0 0 0 1 . Hier ist ,B= Ein Gegenbeispiel erhalten wir mit A = 1 0 0 0 0 0 A2 = = B2 , 0 0 also exp(A) = id + A, exp(B) = id + B und weiter exp(A) exp(B) =
2 1 . 1 1
Andererseits ist (A+B)2 = id. F¨ur alle k ∈ IN0 haben wir damit (A+B)2k = id sowie (A + B)2k+1 = A + B. Daher gilt ⎛ ⎜ exp(A + B) = ⎜ ⎝
k=0
k=0
(2)
1 (2k)!
1 (2k+1)!
k=0
1 (2k+1)!
k=0
1 (2k)!
⎞ ⎟ ⎟ = ⎠
2 1 1 1
.
Wenn v ∈ IRd ein Eigenvektor von A zum Eigenwert ist, dann folgt n n Ak v k = lim v = e v . exp(A) v = lim n→ n→ k=0 k! k=0 k! Also ist v ein Eigenvektor auch von exp(A), ebenfalls zum Eigenwert .
244
16 Elementar l¨osbare Differentialgleichungen
Satz 16.11. Sei A eine (d × d)-Matrix. Die Funktion t → exp(tA) ist differenzierbar, d.h. der Grenzwert lim
h→0
exp( (t + h)A) − exp(tA) d = exp(tA) h dt
existiert (im Banachraum L (IRd ) mit der Operatornorm). Weiter gilt d exp(tA) = A exp(tA) = exp(tA) A . dt Beweis. Mit Satz 16.10(b) erhalten wir exp(hA) − id exp( (t + h)A) − exp(tA) exp(hA) − id exp(tA) = = exp(tA) h h h und wegen " " " " exp(hA) − id " − A" "= " h
" " " " " k−1 k " " " hk Ak+1 " " exp(hA) − id − hA " " h A " " " " " " = " " = " " " " " " " " h k! (k + 1)! k=2 k=1 hAk = A ehA − 1 → 0 k=1 k!
≤ A gilt
lim
h→0
mit h → 0
exp(hA) − id = A. h
Satz 16.12. Sei A eine (d × d)-Matrix. Das Anfangswertproblem x = Ax ,
x(t0 ) = x0
besitzt eine eindeutige L¨osung y : IR → IRd . Diese ist gegeben durch y(t) = exp( (t − t0 )A) x0 . Beweis. Mit Hilfe von Satz 16.10 und Satz 16.11 erhalten wir d d y (t) = (exp(−t0 A) exp(tA) x0 ) = exp(−t0 A) exp(tA) x0 dt dt = exp(−t0 A) A exp(tA) x0 = A exp( (t − t0 )A) x0 = Ay(t) . Die Anfangsbedingung y(t0 ) = x0 ist offensichtlich. Die Eindeutigkeit der L¨osung folgt mit Korollar 16.5, da die Abbildung (t, x) → Ax Lipschitz-stetig bez¨uglich x ist mit Lipschitz-Konstante L = A, wie wir ganz zu Beginn dieses Abschnitts schon festgestellt haben.
Um die L¨osung des Anfangswertproblems zu finden, muss man exp(tA) gar nicht explizit bestimmen, wenn man weitere Kenntnisse aus der Linearen Algebra hinzu-
16.4 Aufgaben
245
zieht. Ist etwa J eine Jordan-Normalform von A, so gibt es eine invertierbare Matrix S mit A = S−1 JS, also tA = S−1 (tJ)S, und laut Satz 16.10(a) brauchen wir nur exp(tJ) zu bestimmen. Wenn A diagonalisierbar ist, d.h. wenn J Diagonalgestalt hat, dann f¨allt dies besonders leicht: Sei A eine (d × d)-Matrix, die d linear unabh¨angige Eigenvektoren v1 , . . . , vd besitzt. Bezeichne 1 , . . . , d die zugeh¨origen Eigenwerte. Dann kann man ⎛ ⎞ 1 ⎜ ⎟ J = ⎝ ... und S−1 = (v1 , . . . , vd ) ⎠
d
w¨ahlen, also S−1 exp(tJ) = e1t v1 , . . . , ed t vt und mit S exp(−t0 A)x0 =: c ∈ IRd erhalten wir y(t) = exp( (t − t0 )A) x0 = exp(tA) exp(−t0 A) x0 = S−1 exp(tJ) S exp(−t0 A) x0 =
d
ck e k t vk
k=1
als L¨osung des Anfangswertproblems.
⎞ ⎛ ⎛ ⎞ 0 0 1 1 Beispiel: Das Anfangswertproblem x = Ax, x(0) = ⎝ 2 ⎠ mit A = ⎝ 0 −2 0 ⎠. 1 0 0 3 Wegen det(A − id) = 2 (−2 − ) − (−2 − ) = −( 2 − 1)( + 2) hat A die Eigenwerte 1 = 1, 2 = −1 und 3 = −2. Zugeh¨orige Eigenvektoren k¨onnen wir auch leicht bestimmen, etwa ⎞ ⎛ ⎞ ⎛ ⎛ ⎞ 1 1 0 v2 = ⎝ 0 ⎠ und v3 = ⎝ 1 ⎠ . v1 = ⎝ 0 ⎠ , 1 −1 0 Damit hat die L¨osung y die Form y(t) = c1 et v1 + c2 e−t v2 + c3 e−2t v3 und mit der Anfangsbedingung erhalten wir c1 = 2, c2 = −1 sowie c3 = 2.
16.4 Aufgaben 1. Sei f : [0, [ → IR stetig. Wir betrachten das Anfangswertproblem x = f (t) ,
x(0) = x0
mit x0 ∈ IR, d.h. die rechte Seite der Differentialgleichung h¨angt nur von t ab. Zeigen Sie, dass das Verfahren von Picard-Lindel¨of (Satz 16.3) in diesem Fall bereits im ersten Schritt die L¨osung liefert.
246
16 Elementar l¨osbare Differentialgleichungen
2. Bestimmen Sie die L¨osungen folgender Anfangswertprobleme mit dem Verfahren aus Satz 16.8. a.
x = (a − bx)x ,
b.
x = ax + b ,
x(0) = x0
c.
x
,
x(0) = x0
d.
x = x2 − 1 ,
x(0) = x0
e.
x =
=
cos2 x
2t x, t2 + 1
x(0) = x0 > 0
(a, b > 0)
(a, b ∈ IR)
x(0) = x0
3. L¨osen Sie das Anfangswertproblem x = (t + x)2 ,
x(0) =
. 4
Hinweis: Betrachten Sie z(t) := x(t) + t. 4. Gegeben ist das Anfangswertproblem t x (t) = 2x(t) ,
x(t0 ) = x0 .
a. Bestimmen Sie im Fall t0 = 0 eine L¨osung mit dem Verfahren aus Satz 16.8. b. Zeigen Sie, dass das Anfangswertproblem auch f¨ur t0 = 0 und x0 = 0 L¨osungen besitzt. c. Was k¨onnen Sie u¨ ber die lokale Eindeutigkeit der L¨osungen aussagen ? 5. Bestimmen Sie die L¨osung des Anfangswertproblems x = ex sint ,
x(t0 ) = x0
in Abh¨angigkeit der Anfangswerte (x0 ,t0 ) ∈ IR2 sowie jeweils das zugeh¨orige maximale Definitionsintervall. 6. Bestimmen Sie die L¨osungen der Anfangswertprobleme x = Ax, x(0) = x0 mit 3 1 2 , x0 = a. A = 0 2 1 0 1 b. A = , ∈ IR, vgl. Kapitel 16.3, Beispiel (2) , x0 = 0 − 0 c.
A=
0
1
1 , = 0, , x0 = 1
vgl. Kapitel 16.3, Beispiel (3)
16.4 Aufgaben
247
7. Bestimmen Sie L¨osungen der Differentialgleichung m x + d x + k x = 0
(16.4)
mit m > 0, d 2 − 4mk = 0. Gehen Sie dabei wie folgt vor. a. Nehmen Sie an, es existieren zwei L¨osungen x1 und x2 . Setzen Sie W := x1 x2 − x1 x2 und zeigen Sie W = − md W . d . Folgern Sie, dass W (t) = ce2 t gilt mit einem c ∈ IR. b. Sei := − 2m
c. Verifizieren Sie, dass x1 (t) := e t eine L¨osung von (16.4) ist. d. Setzen Sie y(t) := e− t x2 (t). Zeigen Sie, dass y (t) = c gilt und bestimmen Sie damit x2 . 8. Allgemeine Differentialgleichung h¨oherer Ordnung. Gegeben ist die Differentialgleichung y(d) + ad−1y(d−1) + . . . + a1y + a0 y = 0
(16.5)
mit a0 , . . . , ad−1 ∈ IR. a. Schreiben Sie die Gleichung (16.5) als eine Differentialgleichung der Form x = A x mit einer reellen (d × d)-Matrix A und ⎛ ⎜ ⎜ ⎜ x := ⎜ ⎜ ⎝
y y y .. .
⎞ ⎟ ⎟ ⎟ ⎟. ⎟ ⎠
y(d−1) b. Zeigen Sie, dass eine Zahl ∈ C genau dann Eigenwert von A ist, wenn eine L¨osung der so genannten charakteristischen Gleichung
d + ad−1 d−1 + . . . + a0 = 0 zu (16.5) ist. Hinweis: Entwickeln Sie det(A − id) nach der letzten Zeile. c. Bestimmen Sie f¨ur jeden Eigenwert von A einen zugeh¨origen Eigenvektor von A.
This page intentionally left blank
Literaturverzeichnis
[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22]
H.W. Alt, Lineare Funktionalanalysis, 5. Auflage (Springer, Berlin Heidelberg, 2006) R. Beals, Analysis, An Introduction (Cambridge University Press, 2004) O. Deiser, Reelle Zahlen, 2. Auflage (Springer, Berlin Heidelberg, 2008) J. Dieudonn´e, Foundations of Modern Analysis (Academinc Press, New York, 1960) G. Fischer, Lineare Algebra, 17. Auflage (Vieweg+Teubner, Wiesbaden, 2010) W. Forst, D. Hoffmann, Gew¨ohnliche Differentialgleichungen, Theorie und Praxis (Springer, Berlin Heidelberg, 2005) O. Forster, Analysis 1, 10. Auflage (Vieweg+Teubner, Wiesbaden, 2011) O. Forster, Analysis 2, 9. Auflage (Vieweg+Teubner, Wiesbaden, 2011) H. Heuser, Lehrbuch der Analysis, Band 1 (Teubner, Stuttgart, 1980) K. J¨anich, Topologie, 8. Auflage (Springer, Berlin Heidelberg, 2005) C. Karpfinger, K. Meyberg, Algebra (Spektrum Akademischer Verlag, Heidelberg, 2009) H. Koch, Einf¨uhrung in die Mathematik (Springer, Berlin Heidelberg, 2002) K. K¨onigsberger, Analysis 1, 6. Auflage (Springer, Berlin Heidelberg, 2003) K. K¨onigsberger, Analysis 2, 5. Auflage (Springer, Berlin Heidelberg, 2003) J. Matouˇsek, J. Neˇsetˇril, Diskrete Mathematik, 2. Auflage (Springer, Berlin Heidelberg, 2007) A.M. Ostrowski, Vorlesungen u¨ ber Differential- und Integralrechnung, Band 1 (Birkh¨auser, Basel, 1945) R. Remmert, G. Schumacher, Funktionentheorie 1, 5. Auflage (Springer, Berlin Heidelberg, 2002) B. von Querenburg, Mengentheoretische Topologie, 3. Auflage (Springer, Berlin Heidelberg, 2001) W. Rudin, Principles of Mathemtical Analysis, 3rd edition (McGraw Hill, London et.al., 1976) A. Taraz, Diskrete Mathematik (Birkh¨auser, Basel, 2010) D. Werner, Einf¨uhrung in die h¨ohere Analysis (Springer, Berlin Heidelberg, 2006) D. Werner, Funktionalanalysis, 5. Auflage (Springer, Berlin Heidelberg, 2005)
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, DOI 10.1007/978-3-642-28644-5, © Springer-Verlag Berlin Heidelberg 2012
249
This page intentionally left blank
Sachverzeichnis
A Abelsche partielle Summation 64 Abelscher Grenzwertsatz 148 abgeschlossen 10, 166, 173 abgeschlossene H¨ulle 173 Ableitung 97, 182 partielle 193, 195 totale 192 zweite 101, 203 Abschluss 173 absolut konvergent 58 Absolutbetrag 8, 17 Abstand 37 Additionstheoreme f¨ur Sinus und Cosinus 72 Alternierende Harmonische Reihe 149 alternierende Reihe 65 Anfangswertproblem 233 Approximation durch Polynome 137 durch Treppenfunktionen 115 durch trigonometrische Polynome 157 ¨ Aquivalenz von Normen 54, 179 Archimedisches Axiom 7 Arcus-Sinus 109 Arcus-Tangens 110 Potenzreihendarstellung 135 Arithmetisch-geometrisches Mittel 36 Arithmetrisches Mittel 16 Astroide 189 asymptotisch gleich 30 B Banachraum
42
Banachscher Fixpunktsatz 218, 233 Bernoulli-Ungleichung 7 Bernsteinpolynom 136 Ber¨uhrpunkt 173 beschr¨ankt 12, 19, 45, 48 nach oben 12 nach unten 12 Besselsche Ungleichung 46 Betrag 8, 17 Binomialformel 8, 15 Binomialkoeffizient 8, 69 Binomialreihe 70 Bolzano-Weierstraß 49 C Cauchyfolge 42 Cauchy-Produkt 67 Cauchy-Riemannsche Differentialgleichungen 210, 211 Cauchy-Schwarz-Ungleichung 40, 46, 73 Cosinus Hyperbolicus 112 Cosinusreihe 69 D Diffeomorphismus 215 Differentialquotient 97 differenzierbar 97, 191 differenzierbare Kurve 182 Dirichlet-Kern 154 Dirichletsche Reihe 77 diskrete Metrik 37, 95 divergent gegen 50 Dreiecksungleichung 8, 18, 37, 38 dritte Einheitswurzeln 19 251
252
Sachverzeichnis konvergent 130 stetig 92 globale Lipschitzbedingung 237 globaler Existenz- und Eindeutigkeitssatz 238 Gradient 193 Grenzwert 24 rechts-/linksseitiger 88 gr¨oßte untere Schranke 12
E Einheitskugel 41 Endomorphismus 178 -Netz 166 Entwicklungspunkt 68, 142, 147 Euklidischer Raum 41 Eulersche Formel 71 Eulersche Zahl 10, 56 Irrationalit¨at 143 -Umgebung 166 Existenz- und Eindeutigkeitssatz 238 Exponentialfunktion 71 Exponentialreihe 69, 71 f¨ur Matrizen 241 Extremum isoliertes 207 lokales 102
H halboffen 10 Hamming-Abstand 38 harmonische Funktion 210 Harmonische Reihe 56 Harmonisches Mittel 16 H¨aufungswert 49 Hauptsatz der Differential- und Integralrechnung 119 Hessematrix 207 Hilbertraum 46
F Fakult¨at 8 Feinheit 113 Fej´er-Kern 154 Fibonacci-Zahlen 76 Fixpunktsatz f¨ur stetige reellwertige Funktionen von Banach 218, 233 Folge 23 beschr¨ankte 41 rekursiv definierte 31 folgenkompakt 165 Folgenkriterium 81 Fourierkoeffizient 152 Fourierreihe 152 Fundamentalsatz der Algebra 19 Funktionalgleichung der Exponentialfunktion 71 des Logarithmus 34 Funktionalmatrix 196
I
86
Identit¨atssatz f¨ur Potenzreihen 147 imagin¨are Einheit 17 Imagin¨arteil 17 indefinit 207 Induktion 5 Infimum 12 Integral 113, 115 unbestimmtes 121 uneigentliches 124 von Treppenfunktionen 113 Integralsinus 140 integrierbar 115 Intervall 10 Intervallschachtelung 10 J
G
Jacobimatrix
Gammafunktion 127 Gaußklammer 15 Geometrische Reihe 25, 55, 58 Geometrisches Mittel 16 gerade Funktion 149 geschlossener Weg 182 gleichm¨aßig approximierbar durch Polynome 137 durch Treppenfunktionen 115 durch trigonometrische Polynome
K
157
196
Kardioide 189 Kettenregel 99, 194 kleinste obere Schranke 12 kompakt 167 in IKd 173 komplexe Zahlen 17 komplexer Logarithmus 222 konjugiert komplexe Zahl 18 kontrahierend 218
Sachverzeichnis konvergent 24, 42 absolut 58 gleichm¨aßig 130 im quadratischen Mittel 139, 160 uneigentlich 50 Konvergenzradius 68, 147 konvexe Funktion 111 konvexe Menge 200 K¨orper archimedisch angeordneter 7 kommutativer 6 kritischer Punkt 207 L Lagrange-Multiplikator 226 Lagrange-Restglied 142 L¨ange der Zykloide 187 einer Kurve 184 eines Funktionsgraphen 187 eines Intervalls 10 Laplace-Operator 210 Leibniz-Kriterium 65 L’Hospitalsche Regeln 106, 107 Limes 24 Limes inferior 50 Limes superior 50 lineare Abbildung 177 lineare Approximation 98, 191 linksseitiger Grenzwert 88 Lipschitzbedingung 234 globale 237 Lipschitz-Konstante 234, 237 Lipschitz-stetig 94 bez¨uglich x 237 logarithmische Spirale 190 Logarithmus 34, 89 komplexer 222 Potenzreihendarstellung 148 Logistische Gleichung 231 lokal injektiv 221 lokales Extremum 102, 207 Lotka-Volterra-Gleichung 232 M Majorantenkriterium 59 Maximum 12 lokales 102 Metrik 37 metrischer Raum 37 Minimum 12 lokales 102
253 Minkowski-Ungleichung 40 Minorantenkriterium 59 Mittelwertsatz 104 monoton fallend 26, 87 monoton wachsend 26, 87 Multiplikatorregel von Lagrange
226
N Nabla 193 nat¨urliche Metrik 37 nat¨urlicher Logarithmus 34, 89 negativ definit 207 Neilsche Parabel 183, 189 Newtons Gesetz 232 Niveaumenge 198 Norm 38 auf IKd 39 normierter Raum 38 Nullfolge 24 Nullstellensatz 84 O obere Schranke 12 offen 10, 166, 175 ¨ offene Uberdeckung 167 Operatornorm 178 orientierungstreu 187 orthogonal 45 orthonormal 45 P Parametertransformation 187 parametrisiert nach der L¨ange 188 Parsevalsche Gleichung 161 Partialsumme 25, 55 partielle Ableitung 193, 195 partielle Integration 121 Partition 113 periodische Funktion 151 Polarkoordinaten 214 positiv definit 207 Potenzfunktion 91 Potenzreihe 68 Ableitung 134, 147 absolute Konvergenz 134 Entwicklungspunkt 147 gleichm¨aßige Konvergenz 134 Identit¨atssatz 147 Stammfunktion 135, 148 Stetigkeit 83, 147 Pr¨ahilbertraum 45 Produktregel 98
254 Q Quotientenkriterium 60 f¨ur Potenzreihen 68 Quotientenregel 98 R rationale Funktion 82 rationale Zahlen 5 R¨auber-Beute-Modell 232 Realteil 17 rechtsseitiger Grenzwert 88 reelle Zahlen 10 Regelfunktion 115 regul¨are Kurve 182 Reihe 25, 55 absolut konvergente 58 alternierende 65 Geometrische 25, 55, 58 Harmonische 56 rekursiv definierte Folge 31 Richtungsableitung 197 Riemann-Lebesgue-Lemma 158 S Satz u¨ ber implizite Funktionen 224 linearer Fall 223 von Bolzano-Weierstraß 49 von Darboux 105 von der lokalen Umkehrbarkeit 218 von Fej´er 157 von Picard-Lindel¨of 234 von Pythagoras 46 von Rolle 103 von Schwarz 204 von Taylor 141 Schrankensatz 186 singul¨arer Punkt einer Kurve 182 Sinus Hyperbolicus 112 Sinus Integralis 140 Sinusreihe 69 Skalarprodukt 45 Stammfunktion 105 station¨arer Punkt 207 stetig 79 gleichm¨aßig 92 stetig differenzierbar 101, 201, 205 streng konvex 111 streng monoton fallend 87 streng monoton wachsend 87 st¨uckweise stetig differenzierbare Kurve 182 Submultiplikativit¨at der Operatornorm 178 Substitutionsregel 123
Sachverzeichnis Supremum 12 Supremumseigenschaft
12
T Tangens 110 Tangente 182 Taylorentwicklung in IRn 206 Taylorpolynom 142 Taylorreihe 142 Teilfolge 48 Teilung 113 Topologie 175 total beschr¨ankt 166 totale Ableitung 192 Treppenfunktion 113 trigonometrisches Polynom 151 U ¨ Uberdeckung 167 Umgebung 166 Umordnung 66 Umparametrisierung 187 unbestimmtes Integral 121 uneigentlich integrierbar 124 konvergent 50 ungerade Funktion 149 untere Schranke 12 V Verdichtungskriterium 62 Verhulst-Pearl-Gleichung 231 vollst¨andig 10, 42 vollst¨andige Induktion 5 Volterra-Lotka-Gleichung 232 W Wallissches Produkt 31, 122 Weg 182 Weierstraßscher Approximationssatz f¨ur periodische Funktionen 157 Wurzel 10 Wurzelkriterium 61 f¨ur Potenzreihen 68
137
Z Zerfallsprozess 231 Zweig des komplexen Logarithmus zweite Ableitung 101, 203 Zwischenwertsatz 85 Zykloide 187
222
Bezeichnungen und Symbole
· 38 39, 41 · · 1 , · 2 39, 73, 160 · M 82 ·, · 45, 74, 160 b f (x) dx 113, 115 a f (x) dx 121 193 210 ∀ 2 A 173 [a, b], ]a, b[, ]a, b], [a, b[ 9 23 (an )n∈IN (ank )k∈IN 48 24 an → a arcosh 112 arcsin 109 arsinh 112 arctan 110 B(M) 45 C 17 cos 69 85 cos2 x cosh 112 C(X), C(X,Y ) 79 201 C1 (U, IRm ), C1 (U) Ck (U, IRm ), Ck (U) 205 Cn (I), C (I) 101 160 Cp Df 192, 196
Dk f Du f df dt f x
195 197 97 193, 195
∃ 2 e 10, 56 exp 69, 71, 241 f)(k) 152 97, 192 f f (n) 101 f −1 87, 108 f ◦g 81 f |J 117 121 F(x)|ba grad f 193 Hf 207 i 17 Im z 17 inf 12 IK 37 18, 41 Kr (a) √ k x 10 41 1 , 2 73 184 l( ) lim an 24 n→
lim sup an , lim inf an n→
lim f (x)
x→p
n→
50
81
255
256
Bezeichnungen und Symbole
lim f (x), lim f (x)
x→p+0
x↓0
ln 34, 90 L (V ), L (V,W ) 37 (M, d) IN 5 IN0 5 n! 8
n 8, 69 k 85 n
ak
k=1
31
Q 5 IR 10 R([a, b]) 115 Rp 152 Re z 17 n
ak
8
an
25
k=1
n=1
88
ck zk
k=0
178
68
Si 140 sin 69 85 sin2 x sinh 112 Sn ( f ), n ( f ) 155 41 Sr (a) sup 12 T ([a, b]) 114 tan 110 T f (t) 142 Tn (t; f ) 141 18, 41 Ur (a) [x] 15 91 xz ZZ 5 z 18