eXamen.press
eXamen.press ist eine Reihe, die Theorie und Praxis aus allen Bereichen der Informatik für die Hochschulausbildung vermittelt.
Michael Oberguggenberger · Alexander Ostermann
Analysis für Informatiker Grundlagen, Methoden, Algorithmen
Zweite Auflage
123
Prof. Dr. Michael Oberguggenberger Institut für Grundlagen der Bauingenieurwissenschaften Universität Innsbruck Technikerstraße 13 6020 Innsbruck Österreich
[email protected]
ISBN 978-3-540-89822-1
Prof. Dr. Alexander Ostermann Institut für Mathematik Universität Innsbruck Technikerstraße 13 6020 Innsbruck Österreich
[email protected]
e-ISBN 978-3-540-89823-8
DOI 10.1007/978-3-540-89823-8 eXamen.press ISSN 1614-5216 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. c 2009, 2005 Springer-Verlag Berlin Heidelberg Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Einbandgestaltung: KünkelLopka, Heidelberg Gedruckt auf säurefreiem Papier 987654321 springer.de
Vorwort zur 2. Auflage
Am Anliegen des Buchs hat sich seit seinem Erscheinen nichts ge¨andert. Dementsprechend haben wir uns in erster Linie darauf beschr¨ankt, Druck¨ fehler zu korrigieren, kleine Anderungen anzubringen und einige Abbildungen zu verbessern. Weiters wurden die Daten f¨ ur einige statistische Beispiele aktualisiert und Abschnitt 5.4 durch zus¨atzliches Material erweitert.
Innsbruck, Oktober 2008
Michael Oberguggenberger Alexander Ostermann
Vorwort zur 1. Auflage
Mathematik und mathematisches Denken bilden Grundpfeiler der Informatik. Gerade deswegen muss sich die Mathematiklehre im Informatikstudium der Frage des Lehrkonzepts, der Stoffauswahl und der Motivation immer neu stellen. Dies trifft insbesondere auf die Analysis zu, deren Bedeutung in einem Umfeld vermittelt werden muss, das vom Denken in diskreten Strukturen gepr¨agt ist. Eine Analysisvorlesung im Informatikstudium muss einerseits die unbedingt ben¨otigten Grundkenntnisse vermitteln, andererseits aber auch die Bedeutung der Analysis in Anwendungen betonen, speziell in solchen, mit denen Informatikerinnen und Informatiker in ihrem Berufsfeld zu tun haben. Wir sehen einen Bedarf, die Mathematiklehre in der Informatikausbildung unter neue didaktische Prinzipien zu stellen und zeitgem¨aß zu strukturieren. Eine Antwort geben wir mit diesem Lehrbuch, das wir aus den folgenden Konzepten heraus entwickelt haben: 1. 2. 3. 4.
Algorithmischer Zugang; Schlanke Darstellung; Verwendung und Erstellung von Software als integraler Bestandteil; Betonung von Modellbildung und Anwendungen der Analysis.
Der Inhalt des Buchs bewegt sich im Spannungsfeld zwischen Mathematik, Informatik und Anwendungen. Hier kommt dem algorithmischen Denken ein hoher Stellenwert zu. Der von uns gew¨ahlte algorithmische Zugang beinhaltet: a. Entwicklung der Konzepte der Analysis aus algorithmischer Sichtweise; b. Erl¨auterungen und Erkl¨arungen unter Zuhilfenahme von MATLAB- und maple -Programmen sowie von Java-Applets; c. Computerexperimente und Programmieraufgaben als Anregung zur aktiven Erarbeitung des Lehrstoffs; d. Behandlung von grundlegenden Konzepten und Verfahren der numerischen Analysis im unmittelbaren Anschluss an die Theorie.
VIII
Vorwort zur 1. Auflage
In diesem Sinn greifen wir mit dem Buch das von Bruno Buchberger vertretene Konzept einer algorithmischen Vermittlung von Mathematik auf. Unter schlanker Darstellung verstehen wir, dass wir den Lehrstoff an jeder Stelle bewusst auf die essentiellen Ideen reduziert haben. Zum Beispiel behandeln wir die allgemeine Konvergenztheorie von Potenzreihen nicht, wohl aber die Taylorentwicklung mit Absch¨ atzung des Restglieds (die Taylorentwicklung ist f¨ ur Modellbildung und Numerik ein unerl¨assliches Werkzeug und wurde deshalb ins Buch aufgenommen). Um einen z¨ ugigen Lesefluss zu erreichen, werden Beweise im Haupttext nur ausgef¨ uhrt, wenn sie wesentliche Ideen einf¨ uhren und zum Verst¨ andnis der Konzepte beitragen. Um im Beispiel oben fortzufahren, wird etwa die Integraldarstellung des Restglieds der Taylorentwicklung mittels partieller Integration hergeleitet, dagegen die Lagrange’sche Form des Restglieds, welche den Mittelwertsatz der Integralrechnung ben¨otigt, nur erw¨ ahnt. Um dennoch zu gew¨ ahrleisten, dass die Grundlagen der Analysis l¨ uckenlos hergeleitet werden, haben wir tiefer gehende Werkzeuge in Erg¨anzungsabschnitten und in Anh¨ angen aufgenommen. Der geometrischen Anschauung weisen wir eine hohe Bedeutung zu, was sich in der großen Anzahl von Abbildungen widerspiegelt. Durch diese schlanke Darstellung ist es uns m¨oglich, von den Grundlagen bis hin zu interessanten Anwendungen der Analysis zu gelangen (wiederum ausgew¨ahlt aus dem Blickwinkel des Informatikstudiums mit Querverbindungen), darunter Fraktale, L-Systeme, Kurven und Fl¨ achen, lineare Regression, Differentialgleichungen und dynamische Systeme. Diese Themen geben ausreichend Gelegenheit, auf die Aspekte der mathematischen Modellierung einzugehen. Zur Struktur des Lehrwerks: Die Kapitel 1–8, 10–12 und 14–17 geh¨oren zum Grundlehrstoff aus Analysis, die Kapitel 9, 13 sowie 18–21 sind wichtigen Anwendungen und weiter f¨ uhrenden Themen gewidmet. Die Anh¨ange A und B fassen Hilfsmittel aus der linearen Algebra und Vektorrechnung kurz zusammen, Anhang C vervollst¨ andigt im Haupttext beiseite gelassene Werkzeuge der Analysis, w¨ahrend Anhang D die bereitgestellte Software erl¨autert. Jedem Kapitel ist eine kurze Einleitung zur Orientierung vorangestellt. Der Text wird durch Computerexperimente aufgelockert, die die Leserinnen und Leser ermuntern sollen, sich mit dem Lehrstoff aktiv zu besch¨aftigen. Schließlich ¨ werden zu jedem Kapitel Ubungsaufgaben gestellt, die zur H¨alfte mit Computerprogrammen zu bearbeiten sind. Das Buch kann ab dem ersten Semester des Informatikstudiums als Vorlesungsgrundlage, als Begleitung zu einer Vorlesung oder im Selbststudium verwendet werden. Es entspricht vom Umfang her einer vierst¨ undigen Vorlesung u ¨ber ein Semester. Die auf der mitgelieferten CD-ROM zusammengestellte Software ist wesentlicher Bestandteil unseres Lehrkonzepts. Die CD-ROM enth¨alt von uns verfasste MATLAB- und maple -Programme sowie Java-Applets. Die Entwicklung der Applets wurde vom ¨ osterreichischen Bundesministerium f¨ ur Bildung, Wissenschaft und Kultur als Teil des Projekts Neue Medien in der Mathematik-
Vorwort zur 1. Auflage
IX
Ausbildung im Rahmen der Web-Plattform mathe online gef¨ordert. Die f¨ ur uns relevanten Teile von mathe online werden auf der CD-ROM mitgeliefert. Wir danken den Initiatoren und Leitern von mathe online, Franz Embacher und Petra Oberhuemer, f¨ ur die Genehmigung, dieses unter der Adresse http://www.mathe-online.at frei zug¨ angliche Material auch auf der CDROM zur Verf¨ ugung stellen zu d¨ urfen. Besonders danken wir Markus Unterweger, der die von uns konzipierten Applets in Java umgesetzt hat, sowie Reinhard Stix f¨ ur die Beratung beim Erstellen der CD-ROM. Norbert Ortner und Gerhard Wanner haben das Buchmanuskript ausf¨ uhrlich gelesen und mit uns diskutiert; wir danken ihnen f¨ ur zahlreiche kritische Bemerkungen und wertvolle Anregungen. Schließlich danken wir dem Springer-Verlag, vor allem Frank Schmidt, f¨ ur die ausgezeichnete Betreuung und Beratung bei der Entwicklung des Buchs.
Innsbruck, J¨ anner 2005
Michael Oberguggenberger Alexander Ostermann
Inhaltsverzeichnis
1
Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Ordnungsrelation und Arithmetik auf R . . . . . . . . . . . . . . . . . . . . 5 1.3 Maschinenzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.4 Rundung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 ¨ 1.5 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2
Reellwertige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Einige elementare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 2.3 Ubungen ...............................................
13 13 17 22
3
Trigonometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Winkelfunktionen am Dreieck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Fortsetzung der Winkelfunktionen auf R . . . . . . . . . . . . . . . . . . . . 3.3 Zyklometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 3.4 Ubungen ...............................................
25 25 28 30 33
4
Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Der komplexe Zahlbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Die komplexe Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Abbildungseigenschaften komplexer Funktionen . . . . . . . . . . . . . ¨ 4.4 Ubungen ...............................................
35 35 38 39 41
5
Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Der Begriff einer unendlichen Folge . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Die Vollst¨andigkeit der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . 5.3 Unendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Erg¨anzung: H¨aufungswerte von Folgen . . . . . . . . . . . . . . . . . . . . . ¨ 5.5 Ubungen ...............................................
43 43 49 51 55 58
XII
Inhaltsverzeichnis
6
Grenzwerte und Stetigkeit von Funktionen . . . . . . . . . . . . . . . . 6.1 Der Begriff der Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Trigonometrische Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Nullstellen stetiger Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 6.4 Ubungen ...............................................
61 61 65 67 69
7
Die 7.1 7.2 7.3 7.4 7.5 7.6
71 71 73 77 79 84 89
8
Anwendungen der Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 8.1 Kurvendiskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 8.2 Das Newtonverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 8.3 Regressionsgerade durch den Ursprung . . . . . . . . . . . . . . . . . . . . . 101 ¨ 8.4 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
9
Fraktale und L-Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 9.1 Fraktale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 9.2 Mandelbrot-Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 9.3 Julia-Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 9.4 Das Newtonverfahren in C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 9.5 L-Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 ¨ 9.6 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Ableitung einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interpretationen der Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Numerische Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ Ubungen ...............................................
10 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 10.1 Unbestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 10.2 Integrationsformeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 ¨ 10.3 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 11 Bestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 11.1 Das Riemannintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 11.2 Haupts¨ atze der Differential- und Integralrechnung . . . . . . . . . . . 137 11.3 Anwendungen des bestimmten Integrals . . . . . . . . . . . . . . . . . . . . 139 ¨ 11.4 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 12 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 12.1 Die Formel von Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 12.2 Der Satz von Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 12.3 Anwendungen der Taylorformel . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 ¨ 12.4 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
Inhaltsverzeichnis
XIII
13 Numerische Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 13.1 Quadraturformeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 13.2 Genauigkeit und Aufwand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 ¨ 13.3 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 14 Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 14.1 Parametrisierte Kurven in der Ebene . . . . . . . . . . . . . . . . . . . . . . . 161 14.2 Bogenl¨ange und Kr¨ ummung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 14.3 Ebene Kurven in Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . 174 14.4 Parametrisierte Kurven im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . 176 ¨ 14.5 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 15 Skalarwertige Funktionen in zwei Ver¨ anderlichen . . . . . . . . . . 181 15.1 Graph und Schnittkurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 15.2 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 15.3 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 15.4 Die totale Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 15.5 Richtungsableitung und Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . 192 15.6 Die Taylorformel in zwei Ver¨ anderlichen . . . . . . . . . . . . . . . . . . . . 194 15.7 Lokale Maxima und Minima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 ¨ 15.8 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 16 Vektorwertige Funktionen in zwei Ver¨ anderlichen . . . . . . . . . . 201 16.1 Vektorfelder und Jacobimatrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 16.2 Das Newtonverfahren in zwei Variablen . . . . . . . . . . . . . . . . . . . . 203 16.3 Parametrisierte Fl¨ achenst¨ ucke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 ¨ 16.4 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 17 Integralrechnung in zwei Ver¨ anderlichen . . . . . . . . . . . . . . . . . . . 209 17.1 Das Bereichsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 17.2 Anwendungen des Bereichsintegrals . . . . . . . . . . . . . . . . . . . . . . . . 215 17.3 Die Transformationsformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 ¨ 17.4 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 18 Lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 18.1 Einfache lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 18.2 Rudimente der Varianzanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 18.3 Multiple lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 18.4 Modellanpassung und Variablenwahl . . . . . . . . . . . . . . . . . . . . . . . 235 ¨ 18.5 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 19 Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 19.1 Anfangswertprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 19.2 Lineare Differentialgleichungen erster Ordnung . . . . . . . . . . . . . . 243
XIV
Inhaltsverzeichnis
19.3 19.4 19.5 19.6
Existenz und Eindeutigkeit der L¨ osung . . . . . . . . . . . . . . . . . . . . . 249 Potenzreihenansatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 Qualitative Theorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
20 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . 257 20.1 Systeme linearer Differentialgleichungen . . . . . . . . . . . . . . . . . . . . 257 20.2 Systeme nichtlinearer Differentialgleichungen . . . . . . . . . . . . . . . . 267 ¨ 20.3 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273 21 Numerik von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . 275 21.1 Das explizite Eulerverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 21.2 Stabilit¨ at und steife Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 21.3 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . 280 ¨ 21.4 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282 A
Anhang: Vektorrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 A.1 Kartesische Koordinatensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 A.2 Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284 A.3 Vektoren im kartesischen Koordinatensystem . . . . . . . . . . . . . . . . 284 A.4 Das innere Produkt (Skalarprodukt) . . . . . . . . . . . . . . . . . . . . . . . 286 A.5 Das ¨außere Produkt (Kreuzprodukt) . . . . . . . . . . . . . . . . . . . . . . . 288 A.6 Geraden in der Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 A.7 Ebenen im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 A.8 Geraden im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
B
Anhang: Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293 B.1 Matrizenrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293 B.2 Kanonische Form von Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
C
Anhang: Erg¨ anzungen zur Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . 303 C.1 Stetigkeit der Umkehrfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 C.2 Grenzfunktionen von Funktionenfolgen . . . . . . . . . . . . . . . . . . . . . 304 C.3 Die Exponentialreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 C.4 Lipschitz- und gleichm¨ aßige Stetigkeit . . . . . . . . . . . . . . . . . . . . . . 310
D
Beschreibung der beiliegenden CD-ROM . . . . . . . . . . . . . . . . . . 315 D.1 Java-Applets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 D.2 Source codes in MATLAB und maple . . . . . . . . . . . . . . . . . . . . . . . . 316 D.3 Die Galerie von mathe-online . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 D.4 Kurzanleitung zur Installation der Java-Plugins . . . . . . . . . . . . . 317
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
1 Zahlen
Die aus dem Alltagsleben bekannten rationalen Zahlen (Bruchzahlen) reichen nicht aus, um Analysis rigoros betreiben zu k¨ onnen. Die historische Entwicklung zeigt vielmehr, dass f¨ ur die Belange der Analysis der Zahlenbereich der rationalen Zahlen zum Bereich der reellen Zahlen erweitert werden muss. Der Anschaulichkeit halber f¨ uhren wir die reellen Zahlen als Dezimalzahlen mit unendlich vielen Stellen ein. Wir illustrieren exemplarisch, wie sich Rechenregeln und die Ordnungsrelation in nat¨ urlicher Weise von den rationalen auf die reellen Zahlen u ¨bertragen. Ein weiterer Abschnitt ist den Gleitpunktzahlen gewidmet, welche als praktikable Approximation an die reellen Zahlen in den meisten Programmiersprachen implementiert sind. Insbesondere besprechen wir die optimale Rundung und die damit zusammenh¨ angende relative Maschinengenauigkeit.
1.1 Die reellen Zahlen In diesem Buch setzen wir die folgenden Zahlensysteme als bekannt voraus: N = {1, 2, 3, 4, . . .} die Menge der nat¨ urlichen Zahlen; N0 = N ∪ {0} die Menge der nat¨ urlichen Zahlen mit Null; Z = {. . . , −3, −2, −1, 0, 1, 2, 3, . . .} die Menge der ganzen Zahlen; k Q = n ; k ∈ Z und n ∈ N die Menge der rationalen Zahlen.
ℓ sind genau dann gleich, wenn km = ℓn gilt. Zwei rationale Zahlen nk und m Weiters identifiziert man eine ganze Zahl k ∈ Z mit der Bruchzahl k1 ∈ Q. Offensichtlich gelten dann die Inklusionen N ⊂ Z ⊂ Q.
Seien M und N beliebige Mengen. Eine Abbildung von M nach N ist eine Vorschrift, die jedem Element von M genau ein Element von N zuordnet1 .
1 In dieser Allgemeinheit werden wir den Begriff der Abbildung selten verwenden. Der f¨ ur uns wichtige Spezialfall reellwertiger Funktionen wird im Kapitel 2 ausf¨ uhrlich besprochen werden.
2
1 Zahlen
Eine Abbildung heißt bijektiv, falls umgekehrt zu jedem Element n ∈ N genau ein Element in M existiert, das n zugeordnet wird. Definition 1.1 Zwei Mengen M und N werden gleich m¨ achtig genannt, wenn es eine bijektive Abbildung zwischen diesen Mengen gibt. Eine Menge M heißt abz¨ ahlbar unendlich, wenn sie gleich m¨achtig wie N ist. Die Mengen N, Z und Q sind gleich m¨ achtig, in einem gewissen Sinn also gleich groß. Alle drei Mengen haben unendlich viele Elemente, die abgez¨ahlt werden k¨ onnen. Jede Abz¨ ahlung stellt eine bijektive Abbildung zu N her. Die Abz¨ahlbarkeit von Z sieht man aus der Darstellung Z = {0, 1, −1, 2, −2, 3, −3, . . .}. F¨ ur den Beweis der Abz¨ ahlbarkeit von Q verwendet man das Diagonalverfahren nach Cantor2 : 1 2 4 3 1 → 1 1 → 1 ... ւ ր ւ 2 3 4 1 2 2 2 2 ... ↓ ր ւ 1 2 3 4 3 3 3 3 ... ւ 2 3 4 1 4 4 4 4 ... .. .. .. .. . . . . Man z¨ahlt hier in Richtung der Pfeile ab, wobei jede rationale Zahl nur bei ihrem ersten Auftreten ber¨ ucksichtigt wird. Damit ist die Abz¨ahlbarkeit der positiven rationalen Zahlen (und damit aller rationalen Zahlen) nachgewiesen. Zur Veranschaulichung der rationalen Zahlen verwenden wir die Zahlengerade, welche man sich als (unendlich langes) Lineal vorstellen kann, bei dem ein (beliebiger) Punkt als Null ausgezeichnet ist. Die ganzen Zahlen sind ¨aquidistant von Null ausgehend aufgetragen. Ebenso findet jede rationale Zahl entsprechend ihrer Gr¨oße einen eindeutigen Platz auf der Zahlengeraden, vgl. Abb. 1.1.
−2
− 12
−1
0
1 3
1 2
1
a
2
Abb. 1.1. Die Zahlengerade.
Die Zahlengerade besitzt aber auch Punkte, die nicht rationalen Zahlen zuordenbar sind. (Man sagt, dass Q nicht vollst¨ andig ist.) Beispielsweise ist die L¨ange der Diagonale d im Einheitsquadrat (vgl. Abb. 1.2) mit dem Lineal ab√ messbar. Bereits den Pythagoreern war bekannt, dass d2 = 2 gilt, aber d = 2 keine rationale Zahl ist. 2
G. Cantor, 1845–1918.
1.1 Die reellen Zahlen
Satz 1.2
√
2∈ / Q.
√
3
2
1 Beweis: Der Beweis dieser √ Aussage wird indirekt gef¨ uhrt. Angenommen, 2 w¨ a re rational. Dann √ √ k¨onnte man 2 als gek¨ urzten Bruch 2 = nk ∈ Q 1 schreiben. Quadrieren ergibt k 2 = 2n2 und somit Abb. 1.2. Diagonale w¨are k 2 eine gerade Zahl. Das ist nur m¨oglich, wenn im Einheitsquadrat. k selbst gerade ist, also k = 2l. Dies oben eingesetzt 2 2 2 2 ergibt 4l = 2n und nach K¨ urzen 2l = n . Somit w¨are n ebenfalls gerade, was im Widerspruch zur Annahme steht, dass der Bruch nk gek¨ urzt war. ⊓ ⊔ √ 2 Bekanntlich ist 2 die eindeutige positive Nullstelle des Polynoms x − 2. Die nahe liegende Vermutung, dass alle nicht rationalen Zahlen Nullstellen von Polynomen mit ganzzahligen Koeffizienten sind, erweist sich jedoch als falsch. Es gibt weitere nicht rationale Zahlen (die so genannten transzendenten Zahlen), welche sich nicht so darstellen lassen. Beispielsweise ist die Kreiszahl
π = 3.141592653589793... ∈ /Q transzendent, kann aber auf der Zahlengeraden dargestellt werden als der halbe Umfang des Kreises mit Radius 1 (z.B. durch Abrollen). Wir nehmen im Folgenden einen pragmatischen Standpunkt ein und konstruieren die fehlenden Zahlen als Dezimalzahlen. Definition 1.3 Eine endliche Dezimalzahl x mit l Stellen hat die Form x = ± d0 .d1 d2 d3 . . . dl mit d0 ∈ N0 und den Ziffern di ∈ {0, 1, ..., 9}, 1 ≤ i ≤ l, wobei dl 6= 0 gilt. Satz 1.4 (Darstellung rationaler Zahlen als Dezimalzahlen) Jede rationale Zahl l¨asst sich als endliche oder periodische Dezimalzahl schreiben. Beweis: Sei q ∈ Q, folglich q = nk mit k ∈ Z und n ∈ N. Man erh¨alt die Darstellung von q als Dezimalzahl durch sukzessive Division mit Rest. Da der Rest r ∈ N jeweils die Bedingung 0 ≤ r < n erf¨ ullt, wird der Rest sp¨atestens nach n Schritten Null oder periodisch. ⊓ ⊔ Beispiel 1.5 Nehmen wir beispielsweise q = − 75 ∈ Q. Fortgesetzte Division mit Rest zeigt, dass q = −0.71428571428571... mit Divisionsresten 5, 1, 3, 2, 6, 4, 5, 1, 3, 2, 6, 4, 5, 1, 3, . . . gilt. Die Periode dieser Dezimalzahl ist sechs. Jede von Null verschiedene Dezimalzahl mit endlich vielen Stellen l¨asst sich als periodische Dezimalzahl (mit unendlich vielen Stellen) schreiben. Dazu vermindert man die letzte Dezimalstelle, die ja verschieden von Null ist, um eins und erg¨anzt als weitere Dezimalen unendlich oft die Ziffer 9. Beispielsweise ist dann − 17 50 = −0.34 = −0.3399999... ab der dritten Stelle periodisch. Damit kann Q als Menge jener Dezimalzahlen aufgefasst werden, deren Dezimalentwicklung ab einer bestimmten Stelle periodisch wird.
4
1 Zahlen
Definition 1.6 Als Menge der reellen Zahlen R bezeichnet man alle Dezimalzahlen der Form ± d0 .d1 d2 d3 ... mit d0 ∈ N0 und den Ziffern di ∈ {0, ..., 9}, d.h. Dezimalzahlen mit unendlich vielen Stellen. Die Menge R \ Q heißt Menge der irrationalen Zahlen. Offensichtlich gilt Q ⊂ R. Nach dem bisher Gesagten sind die Zahlen √ 0.1010010001000010... und 2 irrational. Es gibt aber sehr viel mehr irrationale als rationale Zahlen, wie der folgende Satz zeigt. Satz 1.7 R kann nicht abgez¨ahlt werden, ist also m¨achtiger als Q. Beweis: Der Beweis wird indirekt gef¨ uhrt. Wir nehmen an, man k¨onnte die reellen Zahlen zwischen 0 und 1 abz¨ahlen und schreiben eine Aufz¨ahlung an: 1 2
0. d11 d12 d13 d14 ... 0. d21 d22 d23 d24 ...
3 4 .
0. d31 d32 d33 d34 ... 0. d41 d42 d43 d44 ... ...
.
...
Mit Hilfe dieser Liste definieren wir nun die Dezimalstellen 1 falls dii = 2, di = 2 sonst. Dann ist x = 0.d1 d2 d3 d4 ... nicht in obiger Aufz¨ahlung enthalten im Widerspruch zur Annahme der Abz¨ahlbarkeit. ⊓ ⊔
Obwohl R also bedeutend mehr Zahlen als Q enth¨alt, l¨asst sich jede reelle Zahl beliebig genau durch rationale Zahlen approximieren, z.B. π auf 9 Stellen π≈
314159265 ∈ Q. 100000000
F¨ ur praktische ugen gute Approximationen an die reellen √ Anwendungen gen¨ Zahlen. F¨ ur 2 waren solche bereits den Babyloniern bekannt √
2 ≈ 1; 24, 51, 10 = 1 +
51 10 24 + 2 + 3 = 1.41421296... , 60 60 60
vgl. Abb. 1.3. Die etwas ungewohnte Schreibweise kommt daher, dass die Babylonier in einem Zahlensystem zur Basis 60 rechneten.
1.2 Ordnungsrelation und Arithmetik auf R
5
30 1;24,51,10 5 42;25,3
Abb. 1.3. Babylonische Keilschrifttafel YBC 7289 (Yale Babylonian Collection, mit ¨ Genehmigung) von 1900 vor unserer Zeit mit Ubersetzung der Inschrift, nach [1]. Es ist ein Quadrat√mit Seitenl¨ ange 30 und Diagonale 42; 25, 35 dargestellt. Das Verh¨ altnis betr¨ agt 2 ≈ 1; 24, 51, 10.
1.2 Ordnungsrelation und Arithmetik auf R Im Folgenden schreiben wir reelle Zahlen (eindeutig) als Dezimalzahlen mit unendlich vielen Stellen, beispielsweise also 0.2999... statt 0.3. Definition 1.8 (Ordnungsrelation) Seien a = a0 .a1 a2 ... und b = b0 .b1 b2 ... nichtnegative reelle Zahlen in Dezimaldarstellung, d.h. a0 , b0 ∈ N0 . (a) Man nennt a kleiner gleich b (und schreibt a ≤ b), falls a = b ist oder es einen Index j ∈ N0 gibt mit aj < bj und ai = bi f¨ ur i = 0, . . . , j − 1. (b) Weiters legt man fest, dass −a ≤ b gilt und schreibt −a ≤ −b, falls b ≤ a. Diese Definition setzt die bekannte Ordnung von N und Q auf R fort. Die Ordnungsrelation ≤ besitzt folgende Interpretation auf der Zahlengeraden: Es gilt a ≤ b, falls a auf der Zahlengeraden links von b liegt, wobei a = b m¨oglich ist. Die Relation ≤ hat offenbar folgende Eigenschaften: F¨ ur alle a, b, c ∈ R gilt a ≤ a (reflexiv), a ≤ b und b ≤ c
a≤b
und b ≤ a
⇒
⇒
a≤c
a=b
(transitiv), (antisymmetrisch).
Im Fall a ≤ b und a 6= b schreibt man a < b und nennt a kleiner b. Weiters definiert man a ≥ b, falls b ≤ a ist (in Worten: a gr¨ oßer gleich b), und a > b, falls b < a ist (in Worten: a gr¨ oßer b). In ¨ahnlicher Weise wie die Ordnung k¨onnen Addition und Multiplikation von Q auf R fortgesetzt werden. Anschaulich verwendet man, dass jeder reellen Zahl eine Strecke auf der Zahlengeraden entspricht. Man definiert die Addition reeller Zahlen dann als Addition der entsprechenden Strecken.
6
1 Zahlen
Eine rigorose und gleichzeitig algorithmische Definition der Addition geht von der Beobachtung aus, dass reelle Zahlen beliebig genau durch rationale Zahlen approximiert werden k¨ onnen. Seien a = a0 .a1 a2 ... und b = b0 .b1 b2 ... zwei nichtnegative reelle Zahlen. Durch Abschneiden nach der k-ten Dezimale erhalten wir zwei rationale Approximationen a(k) = a0 .a1 a2 ...ak ≈ a und b(k) = b0 .b1 b2 ...bk ≈ b. Dann ist a(k) + b(k) eine monoton wachsende Approximation an die zu definierende Zahl a + b. Das erlaubt, a + b als Supremum dieser Approximationen zu definieren. Zur rigorosen Rechtfertigung dieser Vorgangsweise verweisen wir auf Kap. 5. In gleicher Weise wird auch die Multiplikation reeller Zahlen definiert. Es zeigt sich, dass die reellen Zahlen mit der Addition und der Multiplikation (R, +, ·) einen K¨orper bilden. Es gelten somit die u ¨blichen Rechenregeln, z.B. das Distributivgesetz (a + b)c = ac + bc. Der folgende Satz fasst einige wichtige Rechenregeln f¨ ur ≤ zusammen. Die Behauptungen k¨ onnen leicht mit Hilfe der Zahlengeraden verifiziert werden. Satz 1.9 F¨ ur alle a, b, c ∈ R gilt a≤b a≤b
a≤b
⇒
und c ≥ 0 und c ≤ 0
⇒ ⇒
a + c ≤ b + c,
ac ≤ bc, ac ≥ bc.
Man beachte, dass a < b nicht a2 < b2 impliziert. Beispielsweise ist −2 < 1, aber trotzdem gilt 4 > 1. F¨ ur a, b ≥ 0 gilt jedoch stets a < b ⇔ a2 < b2 . Definition 1.10 (Intervalle) Die folgenden Teilmengen von R bezeichnet man als Intervalle: [a, b] = {x ∈ R ; a ≤ x ≤ b}
abgeschlossenes Intervall;
(a, b) = {x ∈ R ; a < x < b}
offenes Intervall.
(a, b] = {x ∈ R ; a < x ≤ b} [a, b) = {x ∈ R ; a ≤ x < b}
links halboffenes Intervall; rechts halboffenes Intervall;
Intervalle lassen sich, wie durch Abb. 1.4 illustriert wird, anschaulich auf der Zahlengeraden darstellen.
a
b
c
d
e
f
Abb. 1.4. Die Intervalle (a, b), [c, d] und (e, f ] auf der Zahlengeraden.
Bemerkung 1.11 Es erweist sich als praktisch, die Symbole −∞ (minus Unendlich) und ∞ (Unendlich) einzuf¨ uhren, mittels der Eigenschaft
1.2 Ordnungsrelation und Arithmetik auf R
7
∀a ∈ R : −∞ < a < ∞. Man definiert damit beispielsweise die uneigentlichen Intervalle [a, ∞) = {x ∈ R ; x ≥ a}
(−∞, b) = {x ∈ R ; x < b}
und weiters (−∞, ∞) = R. Man beachte aber, dass −∞ und ∞ nur Symbole und keine reellen Zahlen sind. Als Anwendung der in Satz 1.9 gegebenen Eigenschaften der Ordnungsrelation l¨ osen wir exemplarisch einige Ungleichungen. Beispiel 1.12 Man bestimme alle x ∈ R mit −3x − 2 ≤ 5 < −3x + 4. In diesem Beispiel sind zwei Ungleichungen enthalten, n¨amlich −3x − 2 ≤ 5
und
5 < −3x + 4.
Die erste Ungleichung wird umgeformt zu −3x ≤ 7
⇔
7 x≥− . 3
Das ergibt eine erste Bedingung an x. Die zweite Ungleichung lautet 3x < −1
⇔
x<−
1 3
und ergibt eine zweite Bedingung an x. Die L¨osung des urspr¨ unglichen Problems muss beide Bedingungen erf¨ ullen. Daher lautet die L¨osungsmenge 7 1 1 7 = − ,− . L= x∈R; − ≤x<− 3 3 3 3 Beispiel 1.13 Man bestimme alle x ∈ R mit x2 − 2x ≥ 3. Durch quadratisches Erg¨anzen formt man die Ungleichung um zu (x − 1)2 = x2 − 2x + 1 ≥ 4. Durch Wurzelziehen ergeben sich die zwei F¨alle x−1≥2
oder
x − 1 ≤ −2.
Die Vereinigung beider F¨alle ergibt die L¨osungsmenge L = {x ∈ R ; x ≥ 3 oder x ≤ −1} = (−∞, −1] ∪ [3, ∞).
8
1 Zahlen
1.3 Maschinenzahlen Die reellen Zahlen k¨ onnen nur unvollst¨ andig am Computer realisiert werden. In exakter Arithmetik wie beispielsweise √ in maple sind reelle Zahlen durch symbolische Ausdr¨ ucke gegeben, z.B. 2 = RootOf( Z^2-2). Mit Hilfe des Befehls evalf k¨onnen diese auf sehr viele Stellen genau ausgewertet werden. Die in Programmiersprachen u ur die reellen Zahlen ¨blicherweise als Modell f¨ verwendeten Gleitpunktzahlen (floating point numbers) haben feste relative Genauigkeit, z.B. double precision mit 52 Bit Mantissenl¨ange. F¨ ur diese Maschinenzahlen gelten die Rechenregeln von R nicht, z.B. ist 1 + 10−20 = 1 in double precision. Gleitpunktzahlen sind normiert durch das Institute of Electrical and Electronics Engineers IEEE 754-1985 sowie durch die International Electrotechnical Commission IEC 559:1989. Im Folgenden geben wir einen kurzen Abriss dieser Maschinenzahlen. Weiter gehende Informationen findet man in [20, 27]. Man unterscheidet zwischen einfach langem und doppelt langem Format. Das einfach lange Format (einfache Genauigkeit, single precision) ben¨otigt 32 Bit Speicherplatz V
e
1
8
M 23
Das doppelt lange Format (doppelte Genauigkeit, double precision) ben¨otigt 64 Bit Speicherplatz V
e
1
11
M 52
Hier bezeichnet V ∈ {0, 1} das Vorzeichen, emin ≤ e ≤ emax ist der Exponent (eine ganze Zahl mit Vorzeichen); schließlich ist M die Mantisse der L¨ange p M = d1 2−1 + d2 2−2 + . . . + dp 2−p ∼ = d1 d2 . . . dp ,
dj ∈ {0, 1}.
Diese Darstellung entspricht der folgenden Zahl x: x = (−1)V 2e
p X
dj 2−j .
j=1
Normalisierte Gleitpunktzahlen in der Basis 2 haben stets d1 = 1. Deshalb muss man d1 nicht speichern und enth¨alt f¨ ur die Mantissenl¨angen einfach genau doppelt genau
p = 24 ; p = 53 .
1.4 Rundung
9
Der Einfachheit halber betrachten wir nur normalisierte Gleitpunktzahlen. Dabei kommt es uns weniger auf die hardwarem¨aßige Codierung der Zahlen an, siehe beispielsweise [20], sondern auf ihre Lage auf der Zahlengeraden. In unserer Darstellung gilt f¨ ur die Exponenten der Bereich: einfach genau doppelt genau
emin
emax
− 125 − 1021
128 1024
Mit M = Mmax und e = emax erh¨ alt man die gr¨oßte Gleitpunktzahl xmax = 1 − 2−p 2emax .
Mit M = Mmin und e = emin ergibt sich die kleinste positive (normalisierte) Gleitpunktzahl xmin = 2emin −1 . Die Gleitpunktzahlen liegen nicht gleichm¨ aßig auf der Zahlengeraden verteilt, ihre relative Dichte ist aber ann¨ ahernd konstant, vgl. Abb. 1.5.
2emin −1
0
2emin
2emin +1
Abb. 1.5. Gleitpunktzahlen auf der Zahlengerade, nach [27].
Im IEEE Standard gelten n¨ aherungsweise folgende Werte: xmin einfach genau doppelt genau
xmax −38
1.18 · 10
2.23 · 10−308
3.40 · 1038
1.80 · 10308
Weiters gibt es noch spezielle Symbole wie z.B. ±INF NaN
... ...
±∞
not a number; z.B. bei Null dividiert durch Null.
Mit diesen Symbolen kann auch ohne Programmabbruch weitergerechnet werden.
1.4 Rundung Sei x = a·2e ∈ R mit 1/2 ≤ a < 1 und xmin ≤ x ≤ xmax . Weiters bezeichne u, v zwei Gleitpunktzahlen, welche x einschließen, d.h. u und v seien benachbarte Maschinenzahlen mit u ≤ x ≤ v. Dann ist
10
1 Zahlen
u= 0
e
b1 . . . bp
und v =u+ 0
e
00 . . . 01 = u + 0
e − (p − 1)
10 . . . 00
Somit gilt v − u = 2e−p . F¨ ur die optimale Rundung rd(x) von x ist daher |rd(x) − x| ≤
1 (v − u) = 2e−p−1 . 2
Damit l¨asst sich der relative Fehler der Rundung angeben. Wegen
1 a
≤ 2 gilt
2e−p−1 |rd(x) − x| ≤ ≤ 2 · 2−p−1 = 2−p . x a · 2e ¨ Dieselben Uberlegungen gelten f¨ ur negative x (indem man den Betrag nimmt). Definition 1.14 Die Zahl eps = 2−p heißt relative Maschinengenauigkeit. Eine wichtige Anwendung dieses Konzepts ist der folgende Satz. Satz 1.15 Sei x ∈ R mit xmin ≤ |x| ≤ xmax . Dann existiert ε ∈ R mit rd(x) = x(1 + ε) und |ε| ≤ eps. Beweis: Wir definieren
rd(x) − x . x Nach der obigen Rechnung gilt |ε| ≤ eps. ε=
⊓ ⊔
Experiment 1.16 (Experimentelle Bestimmung von eps) Sei z die kleinste positive Maschinenzahl, f¨ ur die 1 + z > 1 gilt. 1= 0
1
100 . . . 00
,
z= 0
1
000 . . . 01 = 2 · 2−p .
Somit folgt z = 2 eps. Die Zahl z l¨ asst sich experimentell bestimmen, und damit auch eps. (Man beachte, dass in MATLAB die Zahl z als eps bezeichnet wird.)
Im IEC/IEEE Standard gilt: einfach genau : doppelt genau :
eps = 2−24 ≈ 5.96 · 10−8 ,
eps = 2−53 ≈ 1.11 · 10−16 .
Bei doppelt genauer Arithmetik hat man in etwa 16 Stellen Genauigkeit zur Verf¨ ugung.
¨ 1.5 Ubungen
11
¨ 1.5 Ubungen 1. Zeigen Sie, dass
√
3 irrational ist.
2. Beweisen Sie f¨ ur alle a, b ∈ R die Dreiecksungleichung |a + b| ≤ |a| + |b|. Hinweis: Unterscheiden Sie die F¨ alle, dass a und b entweder dasselbe oder verschiedenes Vorzeichen haben. 3. L¨ osen Sie die folgenden Ungleichungen sowohl h¨ andisch als auch mit maple (mittels solve). Geben Sie die L¨ osungsmenge in Intervallschreibweise an. (a) (c)
4x2 ≤ 8x + 1,
2 − x2 ≥ x2 ,
(e)
x2 < 6 + x,
(g)
|1 − x2 | ≤ 2x + 2,
1 > 3 + x, 3−x 1+x (d) > 1, 1−x (f) |x| − x ≥ 1,
(b)
(h)
4x2 − 13x + 4 < 1.
4. Berechnen Sie die Bin¨ ardarstellung der Gleitpunktzahl x = 0.1 in einfach genauer IEEE-Arithmetik (32 Bit Speicherplatz). 5. Bestimmen Sie experimentell die relative Maschinengenauigkeit eps. Hinweis: Schreiben Sie in der Programmiersprache Ihrer Wahl ein Computerprogramm, das Ihnen die kleinste Maschinenzahl z mit 1 + z > 1 berechnet.
2 Reellwertige Funktionen
Der Funktionsbegriff ist die mathematische Formalisierung der Idee, dass einer oder mehreren unabh¨ angigen Gr¨ oßen eine oder mehrere abh¨ angige Gr¨ oßen zugeordnet werden. Funktionen und ihr Studium stehen im Zentrum der Analysis. Sie dienen zur Modellierung von Abh¨ angigkeiten variabler Gr¨ oßen, von einfachen Graphen in der Ebene u achen im Raum bis zu L¨ osungen von Differential¨ber Kurven und Fl¨ gleichungen oder der algorithmischen Konstruktion von Fraktalen. Dieser Abschnitt dient einerseits dazu, die grundlegenden Konzepte einzuf¨ uhren, andererseits werden die wichtigsten Beispiele reellwertiger, elementarer Funktionen in informeller Weise besprochen. Dazu geh¨ oren die Potenz- und Exponentialfunktionen und ihre Umkehrfunktionen. Trigonometrische Funktionen werden im Kapitel 3, komplexwertige Funktion im Kapitel 4 behandelt.
2.1 Grundbegriffe Der einfachste Fall einer reellwertigen Funktion ist eine zweireihige Zahlenliste, bestehend aus den Werten einer unabh¨ angigen Gr¨oße x und zugeordneten Werten einer abh¨ angigen Gr¨oße y. Experiment 2.1 Es soll die Zuordnung y = x2 mit Hilfe von MATLAB dargestellt werden. Zun¨ achst ist ein Bereich D zu w¨ ahlen, in dem die x-Werte variieren sollen, etwa D = {x ∈ R : −1 ≤ x ≤ 1}. Der Befehl x = -1:0.01:1; erzeugt eine Liste von x-Werten, den Zeilenvektor x = [x1 , x2 , . . . , xn ] = [−1.00, −0.99, −0.98, . . . , 0.99, 1.00]. Mittels y = x.^2; wird ein gleich langer Zeilenvektor von zugeordneten y-Werten erzeugt. Schließlich zeichnet plot(x,y) die Punkte (x1 , y1 ), . . . , (xn , yn ) in der Zahlenebene und verbindet diese mit Geradenst¨ ucken. Das Ergebnis ist in Abb. 2.1 ersichtlich.
14
2 Reellwertige Funktionen
In der allgemeinen mathematischen Fassung wollen wir nicht nur endliche Listen von Werten zuordnen k¨ onnen, sondern beliebige. F¨ ur den allgemeinen mengentheoretischen Funktionsbegriff verweisen wir auf die Literatur, etwa [2, Kap. 1.1]. Der vorliegende Abschnitt ist den reellwertigen Funktionen gewidmet.
1
0.5
0 −1
0
1
Abb. 2.1. Zum Funktionsbegriff.
Definition 2.2 Eine reellwertige Funktion f ist eine Vorschrift, die jedem x ∈ D (des Definitionsbereichs) eine reelle Zahl y ∈ R (der Zielmenge) zuordnet. Dabei ist D eine beliebige Menge, in diesem Abschnitt aber in der Regel eine Teilmenge von R. F¨ ur den Ausdruck Funktion verwenden wir synonym auch das Wort Abbildung. F¨ ur die funktionale Zuordnung schreiben wir f : D → R : x 7→ y = f (x). Der Graph der Funktion f ist die Menge Γ (f ) = {(x, y) ∈ D × R ; y = f (x)}. Im Falle D ⊂ R kann der Graph als Teilmenge der Zahlenebene dargestellt werden. Die Menge der tats¨ achlich auftretenden Werte heißt Bildmenge unter f oder echter Bildbereich: f (D) = {f (x) ; x ∈ D}. Beispiel 2.3 Ein Ausschnitt des Graphen der Quadratfunktion f : D = R → R, f (x) = x2 , ist in Abb. 2.2 dargestellt. W¨ ahlt man als Definitionsbereich D = R, so ist die Bildmenge das Intervall f (D) = [0, ∞). 1.5 y
1 0.5
(x, x2 )
Γ (f )
0
x
D=R −0.5 −1
0
1
Abb. 2.2. Quadratfunktion. Experiment 2.4 Gehen Sie in mathe online im Bereich Galerie zu Funktionen 1 und u angigkeiten verstehen und Funktion ¨ben Sie mit den Applets Funktionale Abh¨ und Funktionsgraph.
2.1 Grundbegriffe
15
Ein wichtiges Hilfsmittel ist die Konstruktion von Umkehrfunktionen, sei es zum L¨osen von Gleichungen, sei es zur Gewinnung neuer Funktionentypen. Ob und in welchen Bereichen eine gegebene Funktion eine Umkehrfunktion besitzt, h¨angt von zwei wesentlichen Eigenschaften ab, der Injektivit¨at und der Surjektivit¨at, die wir zun¨ achst herausgel¨ ost untersuchen. Definition 2.5 (a) Eine Funktion f : D → R heißt injektiv, falls verschiedene Argumente stets verschiedene Funktionswerte haben: x1 6= x2
⇒
f (x1 ) 6= f (x2 ).
(b) Eine Funktion f : D → B ⊂ R heißt surjektiv von D nach B, wenn jedes y ∈ B als Funktionswert auftritt: ∀y ∈ B ∃x ∈ D : y = f (x). (c) Eine Funktion f : D → B heißt bijektiv, falls sie sowohl injektiv als auch surjektiv ist. Die Abb. 2.3 und 2.4 erl¨ autern diese Begriffe. 1.5
y = x2
1.5
y = x3
1
1
0.5
0.5
0
x −0.5
0
x nicht injektiv
−0.5 −1
0
−1.5
1
injektiv
−1 −1
0
1
Abb. 2.3. Zur Injektivit¨ at.
1.5
y = x4
1.5
y = 2x3 − x
1 0.5
1
0
0.5
x 0 −0.5 nicht surjektiv auf B = R −1
0
1
x −0.5
surjektiv
−1 −1.5
−1
Abb. 2.4. Zur Surjektivit¨ at.
0
1
16
2 Reellwertige Funktionen
Durch Verkleinerung des Bildbereichs B kann Surjektivit¨at erzeugt werden; zum Beispiel ist f : D → f (D) stets surjektiv. Ebenso kann man durch Einschr¨ankung auf Teilbereiche des Definitionsbereichs Injektivit¨at erhalten. Falls f : D → B bijektiv ist, so gibt es zu jedem y ∈ B genau ein x ∈ D mit y = f (x). Die Zuordnung y 7→ x definiert dann die Umkehrung der Abbildung x 7→ y. Definition 2.6 Ist eine Funktion f : D → B : y = f (x), bijektiv, so heißt die funktionale Zuordnung f −1 : B → D : x = f −1 (y), die jedem y ∈ B das eindeutige x ∈ D mit y = f (x) zuweist, die Umkehrfunktion zur Funktion f . Beispiel 2.7 Die Quadratfunktion f (x) = x2 ist bijektiv von D = [0, ∞) nach B = [0, ∞). In diesem Bereich (x ≥ 0, y ≥ 0) gilt: √ y = x2 ⇔ x = y, √ wobei y die positive Quadratwurzel bezeichnet. Somit ist die Umkehrfunkti√ on der Quadratfunktion in diesem Bereich durch f −1 (y) = y gegeben; siehe dazu Abb. 2.5. Hat man die Umkehrfunktion f −1 gefunden, so schreibt man sie u ¨blicherweise mit Variablen y = f −1 (x). Dies entspricht einer Spiegelung des Graphen von y = f (x) an der Diagonale y = x, wie in Abb. 2.6 dargestellt. y
y
y = f −1 (x)
y = f (x) = x2
x = f −1 (y) =
√
y
x
Abb. 2.5. Bijektivit¨ at und Umkehrfunktion.
y = f (x) x
Abb. 2.6. Umkehrfunktion und Spiegelung an der Diagonalen.
Experiment 2.8 Der Begriff der Umkehrfunktion wird durch den MATLAB -Plotbefehl klar veranschaulicht. Den Graphen der Umkehrfunktion plottet man einfach durch Variablentausch, was eben der umgekehrten Listenzuordnung y 7→ x entspricht. Zum Beispiel erzielt man die Graphen in Abb. 2.6 mittels
2.2 Einige elementare Funktionen
17
x = 0:0.01:1; y = x.^2; plot(x,y) hold on plot(y,x) Wie man die Formatierung, die strichlierte Diagonale und die Beschriftung erh¨ alt, ist dem m-File mat02 1.m zu entnehmen.
2.2 Einige elementare Funktionen Die elementaren Funktionen sind die Potenzen und Wurzeln, Exponentialfunktion und Logarithmus, die Winkelfunktionen und ihre Umkehrfunktionen, sowie alle Funktionen, die man durch Kombination daraus erhalten kann. Es folgt eine Liste der wichtigsten Grundtypen, die sich historisch als bedeutend f¨ ur die Anwendungen ergeben haben. Die Winkelfunktionen werden in Kapitel 3 behandelt, die Hyperbelfunktionen in Kapitel 14. Lineare Funktionen (Geraden). Eine lineare Funktion R → R ordnet jedem x-Wert ein festes Vielfaches als y-Wert zu, also y = kx. Dabei ist k=
H¨ohenzuwachs ∆y = L¨angenzuwachs ∆x
der Anstieg des Graphen, der eine Gerade durch den Ursprung darstellt. Der Zusammenhang des Anstiegs mit dem Winkel zwischen Geraden und x-Achse wird in Abschnitt 3.1 besprochen. Addition eines Achsenabschnitts d ∈ R verschiebt die Gerade um d Einheiten in der y-Richtung (Abb. 2.7). Die Gleichung ist dann y = kx + d.
2
2
y = kx
1
y = kx + d k
1
1
∆y
d
∆x
0
x 0
1
2
0
x 0
Abb. 2.7. Zur Geradengleichung.
1
2
18
2 Reellwertige Funktionen
Quadratische Parabeln. In ihrer Grundform lautet die Zuordnung mit Definitionsbereich D = R: y = x2 . Stauchung/Streckung, horizontale und vertikale Verschiebung erreicht man mittels y = αx2 , y = (x − β)2 , y = x2 + γ. Die Wirkung dieser Transformationen auf den Graphen ist aus Abb. 2.8 ersichtlich. α > 1 . . . Stauchung in x-Richtung 0 < α < 1 . . . Streckung in x-Richtung α < 0 . . . Spiegelung an x-Achse β > 0 . . . Rechtsverschiebung γ > 0 . . . Hebung β < 0 . . . Linksverschiebung γ < 0 . . . Senkung
4
4
4
y = x2
y = 2 x2
2
2
0
0 −2
0
2
0 −2
2
0
2
4
y = −0.5 x2
0 −2 −2
0
2
y = 0.5 x2 2
−2
0
2
3
y = (x−1)2 2
1
0
−1 −1
1
3
y = x2 −1
−2
0
2
Abb. 2.8. Quadratische Parabeln.
Die allgemeine quadratische Funktion l¨ asst sich durch quadratisches Erg¨ anzen auf diese F¨alle zur¨ uckf¨ uhren: y = ax2 + bx + c b2 b 2 +c− = a x+ 2a 4a = α(x − β)2 + γ. Potenzfunktionen. Im Falle eines ganzzahligen Exponenten n ∈ N ist xn = x · x · x · . . . · x (n Faktoren), 1 x0 = 1, x−n = n (x 6= 0). x
x1 = x,
2.2 Einige elementare Funktionen
19
Der Verlauf f¨ ur y = x3 ist im rechten Bild von Abb. 2.3, jener von y = x4 im linken Bild von Abb. 2.4 dargestellt. Analog sieht der Graph f¨ ur ungerade und gerade Potenzen aus. Experiment 2.9 Gehen Sie in mathe online zu Galerie – Funktionen 1 und experimentieren Sie mit den Applets Graphen einfacher Potenzfunktionen, Polynom h¨ ochstens dritter Ordnung und dem Excel-Spreadsheet Koeffizienten und Graphen der Polynome dritter Ordnung.
Als Beispiele f¨ ur gebrochene Hochzahlen nehmen wir die Wurzelfunktionen √ y = √n x = x1/n f¨ ur n ∈ N mit Definitionsbereich D = [0, ∞). Dabei ist y = n x als Umkehrfunktion der n-ten Potenz definiert, vgl. Abb. 2.9 links. Der Graph von y = x−1 mit Definitionsbereich D = R \ {0} ist in Abb. 2.9 rechts dargestellt. 2 10
y = x1/7 y = x1/4
1.5
5
y = 1/x
1 0
x
y = x1/3
0.5
−5
y = x1/2
0
x 0
0.5
1
1.5
−10
2
−10
−5
0
5
10
Abb. 2.9. Potenzfunktionen mit gebrochenen und negativen Hochzahlen.
Betrags-, Vorzeichen- und Indikatorfunktion. Der Graph der Betragsfunktion x, x ≥ 0 y = |x| = −x, x < 0 hat einen Knick an der Stelle x = 0 (Abb. 2.10 links).
1
1.5
y = | x|
1
0.5
y = sign x
0
x
0.5 −0.5 0
x −1
−0.5
0
0.5
1
−1 −1
−0.5
0
Abb. 2.10. Betrag und Vorzeichen.
0.5
1
20
2 Reellwertige Funktionen
Der Graph der Vorzeichen- oder Signumfunktion 1, x > 0 0, x = 0 y = sign x = −1, x < 0
besitzt bei x = 0 eine Sprungstelle (Abb. 2.10 rechts). Die Indikatorfunktion einer Teilmenge A ⊂ R ist definiert als 1, x ∈ A 11A (x) = 0, x ∈ / A. Exponentialfunktionen und Logarithmen. Ganzzahlige Potenzen einer Basiszahl a > 0 wurden eben definiert. Gebrochene, rationale Hochzahlen ergeben √ √ √ a1/n = n a, am/n = ( n a)m = n am . Ist r eine beliebige reelle Zahl, so wird ar durch seine Approximationen am/n definiert, wobei m n die durch die Dezimalentwicklung gegebene rationale Approximation an r ist. Beispiel 2.10 2π ist definiert durch die Zahlenfolge 23 , 23.1 , 23.14 , 23.141 , 23.1415 , . . . Dabei bedeutet 23.1 = 231/10 =
√
10
231 ;
23.14 = 2314/100 =
√
100
2314 ; . . . usw.
Diese etwas informelle Einf¨ uhrung der Exponentialfunktion m¨oge gen¨ ugen, um erste Anwendungsbeispiele in den folgenden Abschnitten zur Verf¨ ugung zu haben. Mit den bisherigen Hilfsmitteln k¨onnen wir noch nicht zeigen, dass dieser Approximationsprozess tats¨achlich zu einem wohldefinierten mathematischen Objekt f¨ uhrt. Der Erfolg des Verfahrens beruht auf der Vollst¨ andigkeit der reellen Zahlen. Dies wird im Kapitel 5 ausf¨ uhrlich behandelt werden. F¨ ur rationale Hochzahlen ergeben sich die folgenden Rechenregeln aus den obigen Definitionen: ar as = ar+s (ar )s = ars = (as )r ar br = (ab)r f¨ ur a, b > 0 und beliebige r, s ∈ Q. Dass die Regeln auch f¨ ur reelle Hochzahlen r, s ∈ R gelten, kann mit Hilfe einer Grenzwert¨ uberlegung gezeigt werden.
Der Graph der Exponentialfunktion zur Basis a, y = ax , steigt f¨ ur a > 1 und f¨allt f¨ ur a < 1 (Abb. 2.11). Der echte Bildbereich ist B = (0, ∞); die Exponentialfunktion ist bijektiv von R nach (0, ∞). Ihre Umkehrfunktion ist der
2.2 Einige elementare Funktionen
21
Logarithmus zur Basis a (mit Definitionsbereich (0, ∞) und echtem Bildbereich R): y = ax ⇔ x = loga y.
Zum Beispiel ist log10 2 jene Zahl, mit der 10 potenziert werden muss, um 2 zu erhalten: 2 = 10log10 2 .
Andere Beispiele sind etwa: 2 = log10 (102 ), log10 10 = 1, log10 1 = 0, log10 0.001 = −3. 8 6
8 6
y = 2x
4
4
2
2
x
0 −2
0
y = (1/2)x
x
0
2
−2
0
2
Abb. 2.11. Exponentialfunktionen.
Die Euler’sche1 Zahl e ist definiert durch 1 1 1 1 + + + + ... 1 2 6 24 ∞ X 1 1 1 1 1 = 1 + + + + + ··· = 1! 2! 3! 4! j! j=0
e = 1+
≈ 2.7182818 . . .
Dass dieses Addieren von unendlich vielen Zahlen sinnvoll definiert werden kann, werden wir im Kapitel 5 durch R¨ uckf¨ uhrung auf die Vollst¨andigkeit der reellen Zahlen beweisen. Der Logarithmus zur Basis e heißt nat¨ urlicher Logarithmus und wird einfach mit log bezeichnet: log x = loge x Vorsicht – in manchen B¨ uchern bezeichnet log x den Zehnerlogarithmus und ln x den nat¨ urlichen Logarithmus. Wir halten uns an die in MATLAB und der englischsprachigen Literatur u ¨bliche Bezeichnung. Die folgenden Rechenregeln ergeben sich unmittelbar durch Umformulierung aus den Regeln f¨ ur die Exponentialfunktion. 1
L. Euler, 1707–1783.
22
2 Reellwertige Funktionen
u = elog u = log(eu ) log(uv) = log u + log v log(uz ) = z log u f¨ ur u, v > 0 und beliebiges z ∈ R. Insbesondere folgt aus der letzten Zeile f¨ ur z = −1 : 1 v log = − log u, log = log v − log u. u u Die Graphen von y = log x und y = log10 x sind in Abb. 2.12 dargestellt. 3
y = log x
2 1 0
1
−1
e
x
−2 0
2
4
6
8
10
3
y = log10 x
2 1 0
1
−1
10
x
−2 0
2
4
6
8
10
Abb. 2.12. Logarithmen zur Basis e und zur Basis 10.
¨ 2.3 Ubungen 1. Wie ¨ andert sich der Graph einer beliebigen Funktion y = f (x) : R → R unter den Transformationen y = f (ax),
y = f (x − b),
y = cf (x),
y = f (x) + d
mit a, b, c, d ∈ R? Unterscheiden Sie f¨ ur a die F¨ alle a < −1,
−1 ≤ a < 0,
0 < a ≤ 1,
a > 1,
und f¨ ur b, c, d die F¨ alle b, c, d > 0,
b, c, d < 0
und machen Sie Skizzen. 2. Gegeben sei die Funktion f : D → R : x 7→ 3x4 − 2x3 − 3x2 + 1. Plotten Sie mittels MATLAB den Graphen von f f¨ ur
¨ 2.3 Ubungen D = [−1, 1.5],
D = [−0.5, 0.5],
23
D = [0.5, 1.5].
Erl¨ autern Sie den Funktionsverlauf f¨ ur D = R und ermitteln Sie f ([−1, 1.5]),
f ((−0.5, 0.5)),
f ((−∞, 1]).
3. Welche der folgenden Funktionen sind injektiv/surjektiv/bijektiv? f : N → N : n 7→ n2 − 6n + 10; g : R → R : x 7→ |x + 1| − 3;
h : R → R : x 7→ x3 .
Hinweis: Falls Sie MATLAB verwenden wollen, finden Sie Hilfe zum Plotten im m-File mat02 2.m. ¨ 4. Uberpr¨ ufen Sie, dass die folgenden Funktionen D → B auf den angegebenen Bereichen bijektiv sind und berechnen Sie jeweils die Umkehrfunktion: y = −2x + 3, y = x2 + 1, y = x2 − 2x − 1,
D = R, B = R; D = (−∞, 0] , B = [1, ∞) ; D = [1, ∞) , B = [−2, ∞) .
5. Gehen Sie in mathe online zu Galerie – Funktionen 1 und l¨ osen Sie die unter den Applets Funktionen erkennen 1 und Graphen erkennen 1 gestellten Aufgaben. Erl¨ autern Sie Ihre Ergebnisse. Gehen Sie zu Interaktive Tests – Funktionen 1 und machen Sie Das große Graphenpuzzle. 6. Gehen sie in mathe online zu Galerie – Funktionen 2 und l¨ osen Sie die unter den Applets Funktionen erkennen 2 und Graphen erkennen 2 gestellten Aufgaben. Erl¨ autern Sie Ihre Ergebnisse. 7. Ermitteln Sie die Gleichung der Geraden durch die Punkte (1, 1) und (4, 3) sowie die Gleichung der quadratischen Parabel durch die Punkte (−1, 6), (0, 5) und (2, 21). 8. Sind von einer radioaktiven Substanz zum Zeitpunkt t = 0 A Gramm vorhanden, so nach t Tagen A · q t Gramm. Berechnen Sie q f¨ ur radioaktives Jod 131 aus 1 der urseiner Halbwertszeit (8 Tage) und ermitteln Sie, nach wie vielen Tagen 100 spr¨ unglichen Menge Jod 131 vorhanden ist. Hinweis: Die Halbwertszeit ist jene Zeitspanne, nach der nur mehr die H¨ alfte der Anfangsmenge der radioaktiven Substanz vorhanden ist. 9. Aus der Schallintensit¨ at I [Watt/cm2 ] einer auf einer Messfl¨ ache auftreffenden Schallwelle ergibt sich nach dem Weber-Fechnerschen Gesetz ihre Lautst¨ arke zu L = 10 log10 1016 I [Phon] . Wenn die Intensit¨ at I eines Lautsprechers eine Lautst¨ arke von 80 Phon bewirkt, wie viel bewirkt dann die Intensit¨ at 2I von zwei Lautsprechern? 10. F¨ ur x ∈ R bezeichne ⌊x⌋ das gr¨ oßte Ganze in x, das heißt ⌊x⌋ = max {n ∈ N ; n ≤ x}. Plotten Sie die folgenden Funktionen auf dem Definitionsbereich D = [0, 10] mittels MATLAB (Befehl floor):
24
2 Reellwertige Funktionen y = ⌊x⌋,
y = x − ⌊x⌋,
y = (x − ⌊x⌋)3 ,
y = (⌊x⌋)3 .
Versuchen Sie auch, korrekte Plots zu programmieren, in denen die senkrechten Verbindungslinien nicht erscheinen. 11. Zeichnen Sie den Graphen der Funktion f : R → R : y = ax + sign x f¨ ur verschiedene Werte von a; unterscheiden Sie jedenfalls die F¨ alle a > 0, a = 0, a < 0. F¨ ur welche Werte von a ist die Funktion f injektiv bzw. surjektiv? 12. Eine Funktion f : D = {1, 2, . . . , N } → B = {1, 2, . . . , N } sei durch die Liste ihrer Funktionswerte y = (y1 , . . . , yN ), yi = f (i) gegeben. Schreiben Sie ein MATLAB Programm, das feststellt, ob f bijektiv ist. Testen Sie Ihr Programm, indem Sie mittels (a) y = unirnd(N, 1, N), (b) y = randperm(N) zuf¨ allige y-Werte erzeugen. Hinweis: Vgl. die beiden m-Files mat02 ueb12a.m und mat02 ueb12b.m.
3 Trigonometrie
¨ Die Winkelfunktionen spielen bei geometrischen Uberlegungen sowie bei der Modellierung von Schwingungsvorg¨ angen eine große Rolle. Wir f¨ uhren diese Funktionen anschaulich durch Relationen am rechtwinkeligen Dreieck ein und setzen sie u ¨ber den Einheitskreis periodisch auf R fort. Außerdem besprechen wir in diesem Abschnitt die Umkehrfunktionen der Winkelfunktionen. Als Anwendung behandeln wir die Umrechnung zwischen kartesischen Koordinaten und Polarkoordinaten.
3.1 Winkelfunktionen am Dreieck Die Definition der Winkelfunktionen (trigonometrische Funktionen) beruht auf elementaren Eigenschaften des rechtwinkeligen Dreiecks. In Abb. 3.1 ist ein rechtwinkeliges Dreieck dargestellt. Die dem rechten Winkel anliegenden Seiten werden als Katheten bezeichnet, die gegen¨ uberliegende Seite als Hypotenuse. a b α
b
c c
c
a
b β a Abb. 3.1. Ein rechtwinkeliges Dreieck mit Katheten a, b und Hypotenuse c.
Abb. 3.2. Beweisidee des Satzes von Pythagoras.
Eine der Grundeigenschaften des rechtwinkeligen Dreiecks ist Inhalt des Satzes von Pythagoras1 . 1
Pythagoras, etwa 570–501 v.u.Z.
26
3 Trigonometrie
Satz 3.1 (Pythagoras) In einem rechtwinkeligen Dreieck ist die Summe der Quadrate der Katheten gleich dem Quadrat der Hypotenuse. In den Bezeichnungen von Abb. 3.1 gilt also a2 + b2 = c2 . Beweis: An Hand von Abb. 3.2 u ¨berlegt man sich leicht, dass gilt: (a + b)2 − c2 = Fl¨ ache der grauen Dreiecke = 2ab. Daraus folgt a2 + b2 − c2 = 0.
⊓ ⊔ ¨ Fundamental f¨ ur die folgenden Uberlegungen ist der Strahlensatz, der besagt, dass die Seitenverh¨ altnisse in einem Dreieck maßstabsinvariant sind, d.h. nicht von der Gr¨oße des Dreiecks abh¨ angen.
c′
α α
c
b
b′
β a a′ Abb. 3.3. Der Strahlensatz.
Offensichtlich gelten in Abb. 3.3 die Beziehungen a a′ = ′, c c
b b′ = ′, c c
a a′ = ′, b b
da bei einer Ver¨anderung das Maßstabs (Vergr¨oßerung oder Verkleinerung des Dreiecks) alle Seiten mit dem gleichen Faktor ver¨andert werden. Man schließt daraus, dass die Verh¨altnisse der Seiten nur vom Winkel α (beziehungsweise von β = 90◦ − α) abh¨angen. Das gibt Anlass zu folgender Definition. Definition 3.2 (Winkelfunktionen) a c b cos α = c a tan α = b b cot α = a sin α =
F¨ ur 0 ≤ α < 90◦ definiert man
Gegenkathete Hypotenuse Ankathete = Hypotenuse Gegenkathete = Ankathete Ankathete = Gegenkathete =
(Sinus), (Cosinus), (Tangens), (Cotangens).
3.1 Winkelfunktionen am Dreieck
27
F¨ ur α = 0 ist cot α nicht definiert (da in diesem Fall a = 0). Die Identit¨aten sin α cos α , cot α = , sin α = cos β = cos (90◦ − α) cos α sin α folgen direkt aus der Definition, die Beziehung tan α =
sin2 α + cos2 α = 1 ist eine Folge des Satzes von Pythagoras. Die Winkelfunktionen haben zahlreiche Anwendungen in der Mathematik. Als erstes Beispiel leiten wir die Formel f¨ ur die Fl¨ache eines allgemeinen Dreiecks her, vgl. Abb. 3.4. Die Seiten in einem Dreieck werden u ¨blicherweise im Gegenuhrzeigersinn mit lateinischen Kleinbuchstaben bezeichnet, die den Seiten gegen¨ uberliegende Winkel mit den entsprechenden griechischen Buchstaben. ur die Fl¨ache die Formel Wegen F = 21 ch und h = b sin α gilt f¨ 1 1 1 bc sin α = ac sin β = ab sin γ, 2 2 2 also halbes Produkt von zwei Seiten mal Sinus des eingeschlossenen Winkels. Die letzte Gleichheit in obiger Formel gilt aus Symmetriegr¨ unden, wobei γ den der Seite c gegen¨ uberliegenden Winkel bezeichnet, also γ = 180◦ − α − β. F =
y b
a
h
α
y = kx + d k
α 1
β
x
c Abb. 3.4. Ein allgemeines Dreieck.
Als zweites Beispiel berechnen wir die Steigung einer Geraden. Abb. 3.5 zeigt die Gerade y = kx + d. Ihre Steigung ¨ k, d.h. die Anderung des y-Wertes bei ¨ einer Anderung von x um eine Einheit, berechnet sich aus dem Steigungsdreieck zu k = tan α.
Abb. 3.5. Gerade mit Steigung k.
ℓ α 1
Damit sp¨ater f¨ ur das Differenzieren einfache Formeln gelten wie z.B. Abb. 3.6. Zusammenhang zwi-
d schen Grad- und Bogenmaß. sin x = cos x, dx muss der Winkel im Bogenmaß gemessen werden. Der Zusammenhang zwischen Gradmaß und Bogenmaß ergibt sich am Einheitskreis (das ist der Kreis mit Mittelpunkt 0 und Radius 1), vgl. Abb. 3.6.
28
3 Trigonometrie
Das Bogenmaß des Winkels α (in Grad) ist die L¨ange des zugeh¨origen Einheitskreisbogens ℓ mit dem Vorzeichen von α. Das Bogenst¨ uck ℓ am Einheitskreis hat keine physikalische Einheit. Man spricht aber manchmal von Radianten (rad), um den Unterschied zu Grad hervorzuheben. Bekanntlich betr¨ agt der Umfang des Einheitskreisbogens 2π mit der Kreiszahl π = 3.141592653589793... ≈
22 . 7
Somit gilt f¨ ur die Umrechnung 360◦ ↔ 2π [rad], beziehungsweise ◦ π 180 ◦ α ↔ α [rad] und ℓ [rad] ↔ ℓ . 180 π Beispielsweise entsprechen 90◦ ↔ wir Winkel stets im Bogenmaß.
π 2
und −270◦ ↔ − 3π 2 . In Zukunft messen
3.2 Fortsetzung der Winkelfunktionen auf R F¨ ur 0 ≤ α ≤ π2 besitzen die Werte sin α, cos α, tan α und cot α eine einfache Interpretation am Einheitskreis, vgl. Abb. 3.7. Diese Darstellung folgt aus der Tatsache, dass die Hypotenuse des definierenden Dreiecks im Einheitskreis die L¨ange 1 hat.
cot α
1
1
cos α tan α
sin α
α 1
sin α P
α cos α
1
Abb. 3.7. Definition der Winkelfunktionen am Einheitskreis.
Abb. 3.8. Fortsetzung der Winkelfunktionen am Einheitskreis.
Man erweitert nun die Definition der Winkelfunktionen f¨ ur 0 ≤ α ≤ 2π durch Fortsetzung mit Hilfe des Einheitskreises. Einem beliebigen Punkt P auf dem Einheitskreis, definiert durch den Winkel α, werden die Koordinaten P = (cos α, sin α) zugesprochen, vgl. Abb. 3.8. F¨ ur 0 ≤ α ≤ π2 ist das vertr¨aglich mit der fr¨ uheren Definition, f¨ ur gr¨oßere Winkel werden durch diese Zuordnung die
3.2 Fortsetzung der Winkelfunktionen auf R
29
Funktionen Sinus und Cosinus auf das Intervall [0, 2π] erweitert. Es ergibt sich damit beispielsweise f¨ ur π ≤ α ≤ 3π 2 sin α = − sin(α − π),
cos α = − cos(α − π),
vgl. Abb. 3.8. F¨ ur beliebige Werte α ∈ R definiert man schließlich sin α und cos α durch periodische Fortsetzung mit der Periode 2π. Dazu schreibt man zun¨achst α = x + 2kπ mit eindeutigem x ∈ [0, 2π) und k ∈ Z. Anschließend setzt man sin α = sin (x + 2kπ) = sin x,
cos α = cos (x + 2kπ) = cos x.
Die Funktionen Tangens und Cotangens werden mit Hilfe der Formeln sin α cos α , cot α = cos α sin α ebenfalls fortgesetzt. Da die Funktion Sinus bei den ganzzahligen Vielfachen von π eine Nullstelle hat, ist dort Cotangens nicht definiert. Ebenso ist Tangens bei den ungeraden Vielfachen von π2 nicht definiert. tan α =
Die Graphen der Funktionen y = sin x, y = cos x sind in den Abb. 3.9 angegeben. Der Definitionsbereich beider Funktionen ist D = R.
y
y = sin x
1
− π2
0 −1
−2π
− 3π 2
−6
3π 2 π 2
−π −4
−2
0
x
π
2
2π
4
y
6
y = cos x
1
−1
π
−π
0
−2π −6
− π2
− 3π 2 −4
−2
x
π 2
0
3π 2
2
4
2π
6
Abb. 3.9. Die Graphen der Funktionen Sinus und Cosinus im Intervall [0, 2π].
Die Graphen der Funktionen y = tan x und y = cot x sind in den Abb. 3.10 angegeben. Der Definitionsbereich D von Tangens ist wie oben erl¨autert gegeben durch D = {x ∈ R ; x 6= π2 + kπ, k ∈ Z}, jener von Cotangens ist D = {x ∈ R ; x 6= kπ, k ∈ Z}.
30
3 Trigonometrie
4
y = tan x
y
y
y = cot x
4
2
2
0
π 2
−π
π
x
0
−2
−2
−4
−4 −4
−2
0
2
4
π 2
− π2
−4
−2
0
π
2
x
4
Abb. 3.10. Die Graphen der Funktionen Tangens (links) und Cotangens (rechts).
Die Winkelfunktionen erf¨ ullen eine Unzahl von Beziehungen untereinander. Beispielsweise gilt das folgende Additionstheorem, welches sich mittels ele¨ ¨ mentargeometrischer Uberlegungen beweisen l¨asst, vgl. Ubung 2. Die maple Befehle expand und combine verwenden solche Identit¨aten zur Vereinfachung trigonometrischer Ausdr¨ ucke. Satz 3.3 (Additionstheorem) F¨ ur alle x, y ∈ R gilt sin (x + y) = sin x cos y + cos x sin y, cos (x + y) = cos x cos y − sin x sin y. In mathe online gibt es ausf¨ uhrliche Materialien zu den Winkelfunktionen. Wir verweisen auf die Galerie, wo Sie unter Winkelfunktionen das Applet Definition der Winkelfunktionen und unter Funktionen 2 das Applet Die Graphen von sin, cos und tan finden.
3.3 Zyklometrische Funktionen Die zyklometrischen Funktionen sind die Umkehrfunktionen der Winkelfunktionen in den entsprechenden Bijektivit¨atsbereichen. Sinus und Arcussinus. Die Funktion Sinus ist bijektiv vom Intervall [− π2 , π2 ] in den Wertebereich [−1, 1], vgl. Abb. 3.9. Dieser Teil des Graphen wird Hauptzweig des Sinus genannt. Seine Umkehrfunktion heißt Arcussinus h π πi arcsin : [−1, 1] → − , . 2 2 Nach Definition der Umkehrfunktion gilt
3.3 Zyklometrische Funktionen
sin(arcsin y) = y
31
f¨ ur alle y ∈ [−1, 1].
Die umgekehrte Formel gilt jedoch nur f¨ ur den Hauptzweig, d.h. arcsin(sin x) = x
gilt nur f¨ ur −
π π ≤x≤ . 2 2
Beispielsweise ist arcsin(sin 4) = −0.8584073... 6= 4. 2
2
π 2
y = sin x 1
−
0
1
π 2
1
−1
−1 −2
−2
−1
0
0
π 2
y = arcsin x −1
1
−1
1
2
−2
− −2
−1
0
π 2 1
2
Abb. 3.11. Die Hauptzweige der Funktionen Sinus (links) und Arcussinus (rechts).
Cosinus und Arcuscosinus. Entsprechend ist der Hauptzweig des Cosinus als Einschr¨ankung von Cosinus auf das Intervall [0, π] mit Wertebereich [−1, 1] definiert. Der Hauptzweig ist bijektiv, seine Umkehrfunktion heißt Arcuscosinus arccos : [−1, 1] → [0, π]. 2
π
3
y = cos x
1
y = arccos x π
0
π 2
2
π 2
1
−1 0 −2
0
1
2
3
−2
−1
0
1
2
Abb. 3.12. Die Hauptzweige der Funktionen Cosinus (links) und Arcuscosinus (rechts).
Tangens und Arcustangens. Wie aus Abb. 3.10 ersichtlich ist die Einschr¨ankung von Tangens auf das Intervall (− π2 , π2 ) bijektiv. Seine Umkehrfunktion heißt Arcustangens
32
3 Trigonometrie
π π arctan : R → − , . 2 2
Genauer handelt es sich wieder um den Hauptzweig des Arcustangens. 2 1
π 2
y = arctan x
0
x
−1
− π2
−2 −6
−4
−2
0
2
4
6
Abb. 3.13. Der Hauptzweig von Arcustangens.
Anwendung 3.4 (Polarkoordinaten in der Ebene) Die Polarkoordinaten (r, ϕ) eines Punktes P = (x, y) in der Ebene erh¨alt man durch Angabe seines Abstandes r vom Ursprung und des Winkels ϕ mit der positiven x-Achse (im Gegenuhrzeigersinn), vgl. Abb. 3.14. Der Zusammenhang von kartesischen und Polarkoordinaten wird somit beschrieben durch x = r cos ϕ , y = r sin ϕ , wobei 0 ≤ ϕ < 2π und r ≥ 0 gilt. Oft verwendet man auch den Bereich −π < ϕ ≤ π.
y
r sin ϕ
P = (x, y) r ϕ r cos ϕ
x
Abb. 3.14. Ebene PolarkoIn der umgekehrten Richtung gelten die Umordinaten. rechnungsformeln p r = x2 + y 2 , y ϕ = arctan (im Bereich x > 0; − π2 < ϕ < π2 ), x x ϕ = sign y · arccos p (falls y 6= 0 oder x > 0; −π < ϕ < π). 2 x + y2
¨ Uberzeugen Sie sich mit Hilfe von maple von der Richtigkeit dieser Formeln.
¨ 3.4 Ubungen
33
¨ 3.4 Ubungen 1. Schreiben Sie in MATLAB eine Funktion degrad.m, die das Gradmaß in das Bogenmaß umrechnet. Der Aufruf degrad(180) sollte π als Ergebnis liefern. Schreiben Sie weiters eine Funktion mysin.m, welche unter Zuhilfenahme von degrad.m den Sinus eines Winkels im Gradmaß berechnet.
1 x cos x sin y
2. Beweisen Sie das Additionstheorem der Sinusfunktion
sin y
sin(x + y) = sin x cos y + cos x sin y. Hinweis: Falls die Winkel x, y und deren Summe x + y zwischen 0 und π/2 liegen, k¨ onnen Sie direkt mit Hilfe von Abb. 3.15 schließen; die restlichen F¨ alle lassen sich auf diesen Fall reduzieren.
sin x cos y
y x
Abb. 3.15. Beweis von Satz 3.3.
3. Beweisen Sie den Cosinus-Satz a2 = b2 + c2 − 2bc cos α f¨ ur das allgemeine Dreieck aus Abb. 3.4. Hinweis: Die Stecke c wird durch die H¨ ohe h in zwei Strecken c1 (links) und c2 (rechts) geteilt. Es gelten die Identit¨ aten b2 = h2 + c21 ,
a2 = h2 + c22 , 2
2
c = c1 + c2 .
2
Elimination von h ergibt a = b + c − 2cc1 .
4. Berechnen Sie die Winkel α, β, γ des Dreiecks mit den Seiten a = 3, b = 4, c = 2 und zeichnen Sie das Dreieck in maple . Hinweis: Verwenden Sie den Cosinus-Satz aus Aufgabe 3. 5. Beweisen Sie den Sinus-Satz a b c = = sin α sin β sin γ f¨ ur das allgemeine Dreieck aus Abb. 3.4. Hinweis: Die erste Gleichheit folgt aus sin α =
h , b
sin β =
h . a
6. Berechnen Sie die fehlenden Seiten und Winkel des Dreiecks mit den Daten b = 5, α = 43◦ , γ = 62◦ und zeichnen Sie Ihre L¨ osung mit MATLAB . Hinweis: Verwenden Sie den Sinus-Satz aus Aufgabe 5.
34
3 Trigonometrie
7. Plotten Sie mit Hilfe von MATLAB die folgenden Funktionen y = cos(arccos x), y = arccos(cos x), y = arccos(cos x),
x ∈ [−1, 1]; x ∈ [0, π];
x ∈ [0, 4π].
Wieso ist im letzten Fall arccos(cos x) 6= x?
8. Plotten Sie die Funktionen y = sin x, y = |sin x|, y = sin2 x, y = sin3 x, y = 21 (|sin x| − sin x) und y = arcsin 12 (|sin x| − sin x) auf dem Intervall [0, 6π]. Erl¨ autern Sie das Ergebnis. Hinweis: Verwenden Sie den MATLAB -Befehl axis equal. 9. Zeichnen Sie den Graphen der Funktion f : R → R : x 7→ ax+sin x f¨ ur verschiedene Werte von a. F¨ ur welche Werte von a ist die Funktion f injektiv beziehungsweise surjektiv? Argumentieren Sie anschaulich-geometrisch und u ¨berlegen Sie, ob Ihr Argument analytisch-logische L¨ ucken hat. 10. Gehen sie in mathe online in der Galerie zu Funktionen 2 und l¨ osen Sie die unter den Applets Funktionen erkennen 3 und Graphen erkennen 3 gestellten Aufgaben. Erl¨ autern Sie Ihre Ergebnisse. 11. Zeigen Sie, dass f¨ ur die Mantellinie s und die Mantelfl¨ ache M eines geraden Kreiskegelstumpfs (vgl. Abb. 3.16, links) die folgenden Formeln gelten p s = h2 + (R − r)2 , M = π(r + R)s. Hinweis: Durch Abrollen des Kegelstumpfs entsteht ein Sektor eines Kreisrings mit ¨ Offnungswinkel α, vgl. Abb. 3.16, rechts. Damit gelten die folgenden Beziehungen: αt = 2πr, α(s + t) = 2πR und M = 21 α (s + t)2 − t2 . α
r
t s
h
2πr s
R 2πR
Abb. 3.16. Gerader Kreiskegelstumpf mit abgerolltem Mantel.
4 Komplexe Zahlen
Komplexe Zahlen finden nicht nur beim L¨ osen polynomialer Gleichungen Verwendung, sondern spielen allgemein eine wichtige Rolle in der Analysis. So lassen sich mittels komplexer Funktionen Transformationen der Ebene darstellen, L¨ osungsformeln f¨ ur Differentialgleichungen gewinnen und Matrizen klassifizieren. Nicht zuletzt k¨ onnen Fraktale mittels Eigenschaften komplexer Iterationsverfahren definiert werden. In diesem Abschnitt werden die komplexen Zahlen eingef¨ uhrt und anschließend einige elementare komplexe Funktionen, wie die komplexe Exponentialfunktion, diskutiert. Anwendungen finden sich in den Kapiteln 9 (Fraktale), 20 (Systeme von Differentialgleichungen) und im Anhang B (Normalform von Matrizen).
4.1 Der komplexe Zahlbegriff Die komplexen Zahlen C stellen eine Erweiterung der reellen Zahlen dar, in der das Polynom z 2 +1 eine Nullstelle besitzt. Man kann sie als Paare (a, b) reeller Zahlen einf¨ uhren, auf denen Addition und Multiplikation wie folgt definiert sind: (a, b) + (c, d) = (a + c, b + d), (a, b) · (c, d) = (ac − bd, ad + bc). Die reellen Zahlen werden als die Teilmenge aller Paare der Form (a, 0), a ∈ R aufgefasst. Offenbar gilt f¨ ur das Paar (0, 1), dass (0, 1) · (0, 1) = (−1, 0) ist, also sein Quadrat der reellen Zahl −1 entspricht und somit eine Nullstelle des Polynoms z 2 + 1 liefert. Bezeichnet man diese Nullstelle mit i, also i2 = −1,
36
4 Komplexe Zahlen
so kann man eine rechnerisch g¨ unstigere Darstellung der Menge der komplexen Zahlen erhalten, indem man die Paare (a, b) in der Form a + ib schreibt: C = {a + ib ; a ∈ R, b ∈ R}. Den oben definierten Rechenoperationen mit Paaren (a, b) entspricht dann einfach das gewohnte Rechnen mit den Ausdr¨ ucken a + ib wie mit Termen unter Ber¨ ucksichtigung der Beziehung i2 = −1: (a + ib) + (c + id) = a + c + i(b + d), (a + ib)(c + id) = ac + ibc + iad + i2 bd = ac − bd + i(ad + bc). Es ist zum Beispiel (2 + 3i)(−1 + i) = −5 − i.
Definition 4.1 F¨ ur eine komplexe Zahl z = x + iy bezeichnet x = Re z, y = Im z den Realteil bzw. den Imagin¨ arteil von z, p |z| = x2 + y 2
den Betrag von z und
z¯ = x − iy
die zu z konjugiert komplexe Zahl. Es gilt
z z¯ = (x + iy)(x − iy) = x2 + y 2 = |z|2 .
Das heißt, z z¯ ist stets eine reelle Zahl. Daraus erh¨alt man die Regel f¨ ur das Bruchrechnen u + iv x − iy (u + iv)(x − iy) ux + vy vx − uy u + iv = = = 2 +i 2 , x + iy x + iy x − iy x2 + y 2 x + y2 x + y2 die im Erweitern mit der konjugiert komplexen Zahl des Nenners besteht. Offensichtlich kann also durch jede komplexe Zahl ungleich Null dividiert werden – die Zahlenmenge C bildet einen K¨orper. Experiment 4.2 Geben Sie in MATLAB ein: z = complex(2,3) (oder z = 2 + 3 *i, z = 2 + 3 *j) sowie w = complex(-1,1) und testen Sie die Befehle z * w, z/w sowie real(z), imag(z), conj(z), abs(z).
Klarerweise p besitzt jede p negative reelle Zahl x zwei Quadratwurzeln in C, n¨amlich i |x| und −i |x|. Mehr noch, der Fundamentalsatz der Algebra besagt, dass C algebraisch abgeschlossen ist, also jede polynomiale Gleichung αn z n + αn−1 z n−1 . . . + α1 z + α0 = 0 mit Koeffizienten αj ∈ C, αn 6= 0, n komplexe L¨osungen besitzt (mit Vielfachheit gez¨ahlt).
4.1 Der komplexe Zahlbegriff
37
Beispiel 4.3 (Wurzelziehen im Komplexen) Die Gleichung z 2 = a + ib wird mittels Ansatz (x + iy)2 = a + ib gel¨ost, also x2 − y 2 = a, 2xy = b. Dr¨ uckt man mit Hilfe der zweiten Gleichung y durch x aus und setzt in die erste Gleichung ein, so erh¨ alt man die biquadratische Gleichung x4 − ax2 − b2 /4 = 0. Man gewinnt daraus durch Substitution t = x2 die beiden reellen L¨osungen. Im Fall b = 0 ist je nach Vorzeichen von a entweder x oder y Null. Die komplexe Zahlenebene. Eine geometrische Darstellung der komplexen Zahlen erh¨ alt man, indem man z = x + iy ∈ C mit dem Punkt (x, y) ∈ R2 der Koordinatenebene identifiziert (Abb. p 4.1). Geometrisch ist dann |z| = x2 + y 2 der Abstand des Punkts (x, y) vom Ursprung; die konjugiert komplexe Zahl z¯ = x − iy erh¨alt man durch Spiegelung an der x-Achse.
iy z = x + iy y = Im z
x = Re z
x
Abb. 4.1. Komplexe Zahlenebene.
Die Polardarstellung einer komplexen Zahl z = x + iy erh¨alt man wie in Anwendung 3.4 durch r = |z|, ϕ = argH z. Der Winkel ϕ zur positiven x-Achse wird als Argument der komplexen Zahl bezeichnet, wobei die Wahl des Bereichs −π < ϕ ≤ π den Hauptwert argH z des Arguments definiert. Somit gilt: z = x + iy = r(cos ϕ + i sin ϕ). Die Multiplikation zweier komplexer Zahlen z = r(cos ϕ + i sin ϕ), w = s(cos ψ + i sin ψ) in Polardarstellung entspricht dem Produkt der Betr¨age und der Summe der Winkel: zw = rs cos(ϕ + ψ) + i sin(ϕ + ψ) ,
was aus den Summenformeln f¨ ur Sinus und Cosinus folgt: sin(ϕ + ψ) = sin ϕ cos ψ + cos ϕ sin ψ, cos(ϕ + ψ) = cos ϕ cos ψ − sin ϕ sin ψ, vgl. Satz 3.3.
38
4 Komplexe Zahlen
4.2 Die komplexe Exponentialfunktion Ein wichtiges Hilfsmittel zur Darstellung komplexer Zahlen und Funktionen, aber auch der reellen Winkelfunktionen, bildet die komplexe Exponentialfunktion. F¨ ur z = x + iy wird sie definiert durch ez = ex (cos y + i sin y). Die komplexe Exponentialfunktion bildet C nach C (ohne Null) ab. Ihr genaues Abbildungsverhalten werden wir unten studieren. Sie ist eine Erweiterung der reellen Exponentialfunktion, das heißt, ist z = x ∈ R, so ergibt ez = ex das fr¨ uher schon eingef¨ uhrte reelle Ergebnis. Wir ben¨ utzen auch die Notation exp(z) f¨ ur ez . Aus den Summenformeln f¨ ur Sinus und Cosinus folgen die u ¨blichen Rechenregeln ez+w = ez ew , e0 = 1, (ez )n = enz , g¨ ultig f¨ ur z, w ∈ C und n ∈ Z. Im Gegensatz zum Reellen gilt die zweite Regel (f¨ ur das Potenzieren) im Allgemeinen nicht, wenn n keine nat¨ urliche Zahl ist. Exponentialfunktion und Polarkoordinaten. Nach Definition ist die Exponentialfunktion einer rein imagin¨ aren Zahl iϕ gleich eiϕ = cos ϕ + i sin ϕ, |eiϕ | = cos2 ϕ + sin2 ϕ = 1. Somit durchlaufen die komplexen Zahlen {eiϕ ; −π < ϕ ≤ π} den Einheitskreis (Abb. 4.2). iy eiϕ = cos ϕ + i sin ϕ 1 ϕ
x
Abb. 4.2. Der Einheitskreis im Komplexen.
Es gilt zum Beispiel: eiπ/2 = i,
eiπ = −1,
e2iπ = 1,
e2kiπ = 1 (k ∈ Z).
4.3 Abbildungseigenschaften komplexer Funktionen
39
Mit r = |z|, ϕ = argH z ergibt sich die besonders einfache Form der Polardarstellung z = reiϕ . Das Wurzelziehen wird auch entsprechend einfach. Beispiel 4.4 (Wurzelziehen in komplexen √ Polarkoordinaten) Ist z 2 = reiϕ , so erh¨alt man f¨ ur z die beiden L¨ osungen ± r eiϕ/2 . Ein Beispiel: z 2 = 2i = 2 eiπ/2 hat die beiden L¨osungen z= und
√
2 eiπ/4 = 1 + i
√ z = − 2 eiπ/4 = −1 − i.
Euler’sche Formeln. Diese erm¨oglichen eine Darstellung der reellen Winkelfunktionen durch die komplexe Exponentialfunktion. Sie besagen, dass 1 iϕ e + e−iϕ 2 1 iϕ e − e−iϕ sin ϕ = 2i
cos ϕ =
ist, was sich durch Addition bzw. Subtraktion der Beziehungen eiϕ = cos ϕ + i sin ϕ e−iϕ = cos ϕ − i sin ϕ sofort herleiten l¨asst.
4.3 Abbildungseigenschaften komplexer Funktionen In diesem Abschnitt werfen wir einen Blick auf Abbildungseigenschaften komplexer Funktionen, das heißt, wie ihre Wirkung geometrisch beschrieben werden kann. Es sei f : D ⊂ C → C : z 7→ w = f (z) eine komplexe Funktion, definiert auf einer Teilmenge D der komplexen Zahlen. Die Wirkungsweise der Funktion f kann am besten visualisiert werden, indem man zwei komplexe Zahlenebenen nebeneinander zeichnet, die z-Ebene und die w-Ebene, und die Bilder von Strahlen und Kreisen unter f eintr¨agt. Beispiel 4.5 Die komplexe Quadratfunktion bildet D = C auf C ab: w = z 2 . Unter Verwendung von Polarkoordinaten ergibt sich z = x + iy = r eiϕ
⇒
w = u + iv = r2 e2iϕ .
40
4 Komplexe Zahlen
Daraus ist ersichtlich, dass die komplexe Quadratfunktion Kreise vom Radius r in der z-Ebene auf Kreise vom Radius r2 in der w-Ebene sowie Halbstrahlen {z = reiψ : r > 0} mit Neigungswinkel ψ auf Halbstrahlen mit Neigungswinkel 2ψ abbildet (Abb. 4.3). iy
iv w = z2 z r
ψ
r2 2ψ
x
u
Abb. 4.3. Die komplexe Quadratfunktion.
Besonders wichtig sind die Abbildungseigenschaften der komplexen Exponentialfunktion, w = ez , liegen diese doch der Definition des komplexen Logarithmus und der Wurzelfunktionen zu Grunde. Ist z = x + iy, so ist ez = ex (cos y + i sin y). Es ist immer ex > 0; weiters definiert cos y + i sin y einen Punkt auf dem komplexen Einheitskreis, welcher f¨ ur −π < y ≤ π eindeutig ist. Durchl¨auft x die reellen Zahlen, so bilden die Punkte ex (cos y + i sin y) einen Halbstrahl mit Winkel y, wie aus Abb. 4.4 ersichtlich. H¨alt man umgekehrt x fest und l¨ asst y zwischen −π und π laufen, so ergibt sich der Kreis mit Radius ex in der w-Ebene. Zum Beispiel ist der punktierte Kreis (rechte Abbildung) die Bildmenge der punktierten Geraden (linke Abbildung) unter der Exponentialfunktion. Aus dem eben Gesagten ergibt sich, dass die Exponentialfunktion auf den Bereichen D = {z = x + iy ; x ∈ R, −π < y ≤ π} → B = C \ {0} bijektiv ist, also den Streifen der Breite 2π auf die komplexe Zahlenebene ohne die Null abbildet. Der Graph der Exponentialfunktion weist l¨angs der negativen u-Achse einen Sprung auf, was in Abb. 4.4 (rechts) angedeutet ist. Im Bereich D besitzt die Exponentialfunktion eine Umkehrfunktion, den Hauptwert oder Hauptzweig des komplexen Logarithmus. Aus der Darstellung w = ez = ex eiy ersieht man den Zusammenhang x = log |w|, y = argH w. Somit ist der Hauptwert des komplexen Logarithmus der komplexen Zahl w gegeben durch
¨ 4.4 Ubungen
41
z = logH w = log |w| + i argH w bzw. in Polarkoordinaten logH r eiϕ = log r + iϕ,
−π < ϕ ≤ π.
Vertikale Verschiebung des Streifens B, auf dem die Exponentialfunktion bijektiv ist, ergibt die Nebenzweige des Logarithmus. iy
iv
w = ez
iπ ex
z
y
y
x
x
u
−iπ
Abb. 4.4. Die komplexe Exponentialfunktion.
Mit Hilfe des Hauptwerts des komplexen Logarithmus √ lassen sich die Haupt- werte der n-ten komplexen Wurzelfunktionen durch n z = exp n1 logH (z) definieren.
¨ Experiment 4.6 Offnen Sie das Applet 2D Visualisierung komplexer Funktionen und untersuchen Sie, wie die Potenzfunktionen w = z n , n ∈ N, Kreise und Strahlen der komplexen Zahlenebene abbilden. Stellen Sie dazu das Muster Polarkoordinaten ein und experimentieren Sie mit verschiedenen Sektoren (Intervall des Arguments [α, β] mit 0 ≤ α < β ≤ 2π). ¨ Experiment 4.7 Offnen Sie das Applet 2D Visualisierung komplexer Funktionen und untersuchen Sie, wie die Exponentialfunktion w = ez horizontale und vertikale Geraden der komplexen Zahlenebene abbildet. Stellen Sie dazu das Muster Gitter ein und experimentieren Sie mit verschiedenen Streifen, zum Beispiel 1 ≤ Re z ≤ 2, −2 ≤ Im z ≤ 2.
¨ 4.4 Ubungen 1. Ermitteln Sie f¨ ur die folgenden komplexen Zahlen z jeweils Re z, Im z, z¯ und |z|: z = 3 + 2i,
z = −i,
z=
1+i , 2−i
z =3−i+
1 . 3−i
F¨ uhren Sie diese Berechnungen auch in MATLAB durch. 2. Stellen Sie die folgenden komplexen Zahlen in der Form z = reiϕ dar und skizzieren Sie sie in der komplexen Zahlenebene:
42
4 Komplexe Zahlen z = −1 − i,
z = −5,
z = 3i,
z = 2 − 2i.
3. Berechnen Sie die beiden komplexen L¨ osungen der Gleichung z 2 = 2 + 2i mit Hilfe des Ansatzes z = x + iy und Gleichsetzen von Real- und Imagin¨ arteil. Testen und erkl¨ aren Sie die MATLAB -Befehle roots([2,0,-2 - 2 *i]) sqrt(2 + 2 *i) 4. Berechnen Sie die beiden komplexen L¨ osungen der Gleichung z 2 = 2 + 2i in der Form z = reiϕ aus der Polardarstellung von 2 + 2i. 5. Berechnen Sie die vier komplexen L¨ osungen der biquadratischen Gleichung z 4 − 2z 2 + 2 = 0 h¨ andisch und in MATLAB (Befehl roots). ¨ 6. Sei z = x+iy, w = u+iv. Uberpr¨ ufen Sie die Formel ez+w = ez ew durch Einsetzen in die Definition und Anwendung der Summens¨ atze f¨ ur die Winkelfunktionen. 7. Berechnen Sie z = logH w f¨ ur w = 1 + i,
w = −5i,
w = −1.
Skizzieren Sie w und z in der komplexen Zahlenebene und u ufen Sie Ihr Er¨berpr¨ gebnis an Hand der Beziehung w = ez sowie in MATLAB (Befehl log).
5 Folgen und Reihen
Das Konzept eines Grenz¨ ubergangs im Unendlichen ist die zentrale Idee der Analysis, die allen ihren wesentlichen Begriffen, wie der Stetigkeit, der Differenzierbarkeit, der Entwicklung von Funktionen in Reihen, dem Integral usw. zu Grunde liegt. Der Grenz¨ ubergang vom Diskreten zum Kontinuierlichen macht die Modellierungskraft der Analysis aus. Auch diskrete Modelle physikalischer, technischer oder wirtschaftlicher Vorg¨ ange lassen sich, soferne die Anzahl ihrer Atome – ihrer diskreten Grundbausteine – hinreichend groß ist, oft besser und einfacher verstehen, wenn man sie mittels Grenz¨ ubergang durch ein kontinuierliches Modell approximiert. Der ¨ Ubergang von Differenzengleichungen f¨ ur biologische Wachstumsvorg¨ ange in diskreten Zeitschritten zu Differentialgleichungen in kontinuierlichen Zeitschritten oder die Beschreibung von Aktienkursen durch stochastische Prozesse in kontinuierlicher Zeit sind Beispiele daf¨ ur. Die meisten Modelle der Physik sind Feldmodelle, also in einer kontinuierlichen Raum- und Zeitstruktur formuliert. Auch wenn die Modelle bei der numerischen n¨ aherungsweisen Berechnung wieder diskretisiert werden, ist das kontinuierliche Modell als Hintergrund hilfreich, zum Beispiel f¨ ur die Fehlerabsch¨ atzung. Die folgenden Abschnitte sind der Pr¨ azisierung der Idee des Grenz¨ ubergangs gewidmet. Dieses Kapitel beginnt mit dem Studium von unendlichen Folgen und Reihen, f¨ uhrt einige Anwendungen vor und behandelt den zugeh¨ origen Grenzwertbegriff. Eine der Errungenschaften, die wir besonders betonen, ist die Vollst¨ andigkeit der reellen Zahlen. Sie garantiert die Existenz von Grenzwerten beliebiger monoton wachsender, beschr¨ ankter Zahlenfolgen, von Nullstellen stetiger Funktionen, Maximalund Minimalstellen differenzierbarer Funktionen, Integralen usw. und ist daher ein unverzichtbarer konzeptioneller Baustein der Analysis. Die folgenden Kapitel bauen auf dem Grenzwertbegriff f¨ ur Folgen auf.
5.1 Der Begriff einer unendlichen Folge Definition 5.1 Es sei X eine Menge. Eine (unendliche) Folge mit Werten in X ist eine Abbildung von N nach X. Es wird also jeder nat¨ urlichen Zahl n (dem Index) ein Element an aus X zugeordnet (das n-te Folgenglied). Wir dr¨ ucken das durch die Schreibweise
44
5 Folgen und Reihen
(an )n≥1 = (a1 , a2 , a3 , . . .) aus. Im Falle X = R spricht man von reellwertigen Folgen, bei X = C von komplexwertigen, bei X = Rm von vektorwertigen Folgen. In diesem Abschnitt diskutieren wir nur reellwertige Folgen. Man kann Folgen addieren (an )n≥1 + (bn )n≥1 = (an + bn )n≥1 und mit einem skalaren Faktor multiplizieren λ(an )n≥1 = (λan )n≥1 . Diese Operationen werden gliedweise ausgef¨ uhrt und geben der Menge aller reellwertigen Folgen die Struktur eines Vektorraums. Den Graphen einer Folge erh¨alt man durch Auftragen der Punkte (n, an ), n = 1, 2, 3, . . . in einem Koordinatensystem, siehe Abb. 5.1.
an
4 3 2 1
n
0 0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15
Abb. 5.1. Graph einer Folge.
Experiment 5.2 Rufen Sie das m-File mat05 1a.m auf. Es zeigt einige m¨ ogliche Verl¨ aufe von Folgen: wachsend/fallend, beschr¨ ankt/unbeschr¨ ankt, oszillierend, konvergent. Zur besseren Visualisierung verbindet man oft die diskreten Folgenwerte mit Geradenst¨ ucken (denen ausschließlich graphische Bedeutung zukommt) – dies ist im ¨ Sie das Applet Folgen und versuchen Sie, m-File mat05 1b.m implementiert. Offnen die im m-File mat05 1a.m angegebenen Folgen dort einzugeben und darzustellen.
Folgen k¨onnen entweder explizit durch eine Formel definiert werden, etwa an = 2n , oder rekursiv durch Angabe eines Startwerts und einer Vorschrift, wie aus dem n-ten Folgenglied der Nachfolger zu berechnen ist, etwa a1 = 1, an+1 = 2an . Die Rekursion kann auch jeweils mehrere Vorg¨anger involvieren.
5.1 Der Begriff einer unendlichen Folge
45
Beispiel 5.3 Ein auf Verhulst1 zur¨ uckgehendes diskretes Bev¨olkerungsmodell (begrenztes Wachstum) beschreibt die Bev¨olkerungszahl xn zum Zeitpunkt n (Zeitschritte der L¨ ange 1) durch die rekursive Beziehung xn+1 = xn + βxn (L − xn ). Dabei ist β ein Wachstumsfaktor und L die Grenzbev¨olkerung. L ist jene Bev¨olkerungszahl, die im langzeitigen Verlauf nicht u ¨berschritten wird (kurz¨ fristige Uberschreitungen sind m¨ oglich, f¨ uhren jedoch unmittelbar zu negativem Bev¨olkerungswachstum). Zus¨ atzlich ist die Anfangsbev¨olkerung x1 = A anzugeben. Der Bev¨ olkerungszuwachs xn+1 − xn w¨ahrend eines Zeitschritts ist dem Modell nach proportional zur vorhandenen Bev¨olkerung und der Differenz zur Grenzbev¨ olkerung. Das m-File mat05 2.m enth¨alt eine MATLABFunktion, Aufrufsyntax x = mat05 2(A,beta,N); welche die ersten N Folgenglieder x = (x1 , . . . , xN ) ausgibt und plottet. Der Anfangswert ist A, die Wachstumsrate β; es wurde L = 1 gesetzt. Experimente mit A = 0.1, N = 50 und β = 0.5, β = 1, β = 2, β = 2.5, β = 3 zeigen konvergentes, oszillierendes bzw. chaotisches Folgenverhalten. Im Folgenden entwickeln wir einige Begriffsbildungen, die das Verhalten von Folgen beschreiben helfen. Definition 5.4 Eine Folge (an )n≥1 heißt monoton wachsend, wenn gilt: n≤m
⇒
an ≤ am ;
(an )n≥1 heißt monoton fallend, wenn gilt n≤m
⇒
an ≥ am ;
(an )n≥1 heißt nach oben beschr¨ ankt oder von oben beschr¨ ankt, falls gilt ∃T ∈ R ∀n ∈ N : an ≤ T. Die kleinste obere Schranke heißt Supremum. Das Supremum ist jene reelle Zahl T0 = sup an n∈N
welche die beiden Bedingungen erf¨ ullt: (a) f¨ ur alle n ∈ N ist an ≤ T0 ; (b) ist T eine reelle Zahl und an ≤ T f¨ ur alle n ∈ N, so muss T ≥ T0 sein. 1
P.F. Verhulst, 1804–1849.
46
5 Folgen und Reihen
Wir werden unten zeigen, dass jede nach oben beschr¨ankte reellwertige Folge tats¨achlich ein Supremum besitzt. Dieses Supremum muss nicht selbst schon als Folgenglied auftreten. Ist dies jedoch der Fall, so spricht man vom Maximum der Folge. Es ist T0 = max an n∈N
falls die beiden Bedingungen erf¨ ullt sind: (a) f¨ ur alle n ∈ N ist an ≤ T0 ; (b) es gibt ein m ∈ N, sodass am = T0 ist. Analog heißt eine Folge (an )n≥1 nach unten beschr¨ ankt, falls gilt: ∃S ∈ R ∀n ∈ N : S ≤ an . Die gr¨oßte untere Schranke heißt Infimum; im Falle der Annahme durch ein Folgenglied wird sie zum Minimum. Experiment 5.5 Untersuchen Sie die durch das File mat05 1a.m erzeugten Folgen im Hinblick auf obige Begriffsbildungen.
Wie in der Einf¨ uhrung zu diesem Kapitel erw¨ahnt, ist das Konzept der Konvergenz der zentrale Begriff der Analysis. Anschaulich besagt er, dass sich die Folgenglieder an mit wachsendem Index n an einen Grenzwert a beliebig n¨ahern. Zum Beispiel ist in Abb. 5.2 mit a = 0.8: |a − an | < 0.2 ab n = 6,
|a − an | < 0.05 ab n = 21.
an
1.6 1.2 0.8 0.4
n
0 0
5
10
15
20
25
30
Abb. 5.2. Zur Folgenkonvergenz.
Zur Pr¨azisierung des Konvergenzbegriffs f¨ uhren wir zun¨achst den Begriff der ε-Umgebung eines Punkts a ∈ R ein (ε > 0): Uε (a) = {x ∈ R ; |a − x| < ε} = (a − ε, a + ε). Wir sagen, dass eine Folge (an )n≥1 in einer Umgebung Uε (a) sesshaft wird, wenn alle Folgenglieder an ab einem gewissen Index n(ε) in Uε (a) liegen.
5.1 Der Begriff einer unendlichen Folge
47
Definition 5.6 Die Folge (an )n≥1 konvergiert gegen einen Grenzwert oder Limes a, falls sie in jeder ε-Umgebung von a sesshaft wird. In Quantorenschreibweise kann dieser Sachverhalt wie folgt ausgedr¨ uckt werden: ∀ε > 0 ∃n(ε) ∈ N ∀n ≥ n(ε) : |a − an | < ε. Falls eine Folge (an )n≥1 gegen den Grenzwert a konvergiert, so schreibt man a = lim an n→∞
oder
an → a f¨ ur n → ∞.
Im Beispiel von Abb. 5.2 ist der Grenzwert a als punktierte Linie gekennzeichnet, die Umgebung U0.2 (a) als Streifen mit strichlierter Begrenzung und die Umgebung U0.05 (a) als Streifen mit durchgezogenen Begrenzungslinien. Im Falle der Konvergenz lassen sich Addition, Vervielfachung, Multiplikation und Division (unter Vermeidung der Null) mit der Grenzwertbildung erwartungsgem¨aß vertauschen: Satz 5.7 (Rechenregeln f¨ ur Grenzwerte) Falls die Folgen (an )n≥1 und (bn )n≥1 konvergent sind, so gilt: lim (an + bn ) = lim an + lim bn
n→∞
n→∞
n→∞
lim (λan ) = λ lim an
n→∞
(f¨ ur λ ∈ R)
n→∞
lim (an bn ) = ( lim an )( lim bn )
n→∞
n→∞
n→∞
lim (an /bn ) = ( lim an )/( lim bn )
n→∞
n→∞
n→∞
(falls alle bn 6= 0 und lim bn 6= 0 ist) n→∞
Beweis: Den Nachweis dieser Selbstverst¨ andlichkeiten u ¨berlassen wir den Le¨ sern als Ubungsaufgabe. Die Beweise sind nicht tief liegend, doch muss man geschickt die richtige Herangehensweise w¨ ahlen, um zum Nachweis der Bedingungen von Def. 5.6 zu gelangen. Um wenigstens einmal zu erl¨autern, wie solche Beweise gemacht werden, sei etwa die Aussage u ¨ber die Multiplikation vorgef¨ uhrt. Nehmen wir also an, dass lim an = a und
n→∞
lim bn = b
n→∞
ist. Sei ε > 0. Wir m¨ ussen nach Def. 5.6 ein n(ε) ∈ N finden, sodass |ab − an bn | < ε
(5.1)
f¨ ur alle n ≥ n(ε) erf¨ ullt ist. Auf Grund der Konvergenz der Folge (an )n≥1 k¨ onnen wir zun¨achst ein n1 (ε) ∈ N finden, sodass |a − an | ≤ 1 ist f¨ ur alle n ≥ n1 (ε). F¨ ur diese n gilt dann auch |an | = |an − a + a| ≤ 1 + |a|.
48
5 Folgen und Reihen
Weiters k¨onnen wir n2 (ε) ∈ N und n3 (ε) ∈ N finden, sodass |a − an | <
ε 2 max(|b|, 1)
und |b − bn | <
ε 2(1 + |a|)
f¨ ur alle n ≥ n2 (ε) bzw. n ≥ n3 (ε) erf¨ ullt ist. Damit folgt |ab − an bn | = |(a − an )b + an (b − bn )| ≤ |a − an ||b| + |an ||b − bn | ε ε ≤ |a − an ||b| + (|a| + 1)|b − bn | ≤ + ≤ ε 2 2 f¨ ur alle n ≥ n(ε), falls wir n(ε) = max(n1 (ε), n2 (ε), n3 (ε)) w¨ahlen, und das ist die zu beweisende Aussage. ⊓ ⊔
Die entscheidenden Beweisideen waren: Aufspaltung in zwei Summanden mit¨ tels Dreiecksungleichung (vgl. Ubung 2 aus Kapitel 1); Absch¨atzung von |an | durch 1 + |a| unter Verwendung der Konvergenz; Absch¨atzung der Terme |a − an | und |b − bn | durch Bruchteile von ε (wieder m¨oglich wegen der Konvergenz), sodass die Summanden zusammen unter ε bleiben. Alle elementaren Konvergenzbeweise der Analysis laufen in ¨ahnlicher Weise ab.
Reellwertige Folgen, deren Glieder mit wachsendem Index n ins Unendliche wachsen, haben keinen Grenzwert im Sinne der oben gegebenen Definition. Es ist jedoch praktisch, ihnen das Symbol ∞ als uneigentlichen Grenzwert zuzuordnen. Definition 5.8 Eine Folge (an )n≥1 hat den uneigentlichen Grenzwert ∞, falls sie die Eigenschaft unbegrenzten Wachstums ∀T ∈ R ∃n(T ) ∈ N ∀n ≥ n(T ) : an ≥ T besitzt. Man schreibt dann lim an = ∞.
n→∞
Analog setzt man lim bn = −∞,
n→∞
falls gilt:
lim (−bn ) = ∞.
n→∞
Beispiel 5.9 Die geometrische Folge (q n )n≥1 . Es ist lim q n = 0,
n→∞
lim q
n→∞
n
= ∞,
lim q n = 1,
n→∞
falls |q| < 1, falls q > 1, falls q = 1 ist.
F¨ ur q ≤ −1 besitzt die Folge keinen Grenzwert (weder eigentlich noch uneigentlich).
5.2 Die Vollst¨ andigkeit der reellen Zahlen
49
5.2 Die Vollst¨ andigkeit der reellen Zahlen Wie im Vorspann zu diesem Kapitel ausgef¨ uhrt, ist die Vollst¨andigkeit der reellen Zahlen einer der Grundpfeiler der reellen Analysis. Die Vollst¨andigkeitseigenschaft kann auf verschiedene Weise ausgedr¨ uckt werden. Wir verwenden eine einfache und in den Anwendungen unmittelbar einsetzbare Formulierung. Satz 5.10 (Vollst¨ andigkeit der reellen Zahlen) Jede nach oben beschr¨ankte, monoton wachsende Folge reeller Zahlen besitzt einen Grenzwert (in R). Beweis: Wir beweisen den Satz zun¨ achst f¨ ur den Fall, dass s¨amtliche Glieder der monoton wachsenden, beschr¨ ankten Folge (an )n≥1 positiv sind. Wir schreiben die Glieder als Dezimalzahlen (n) (n) (n)
an = A(n).α1 α2 α3 . . . (n)
mit A(n) ∈ N0 , αj ∈ {0, 1, . . . , 9}. Es existiert ein T ≥ 0, sodass f¨ ur alle n gilt: an ≤ T . Somit ist auch A(n) ≤ T f¨ ur alle n. Die Folge (A(n) )n≥1 ist aber eine monoton wachsende, beschr¨ ankte Folge nat¨ urlicher Zahlen und muss daher ihre kleinste obere Schranke A letztlich erreichen (und dort bleiben). Es gilt daher ab einem gewissen n0 ∈ N: A(n) = A
f¨ ur alle n ≥ n0 .
Wir haben damit die Ziffern vor dem Komma f¨ ur einen Grenzwert a konstruiert: a = A. . . . (n)
Sei nun α1 ∈ {0, . . . , 9} die kleinste obere Schranke f¨ ur α1 . Wegen des monotonen Wachstums gibt es wieder ein n1 ∈ N mit (n)
α1
= α1
f¨ ur alle n ≥ n1 .
Also ist a = A.α1 . . . (n)
Sei weiter α2 ∈ {0, . . . , 9} die kleinste obere Schranke f¨ ur α2 . Es gibt n2 ∈ N mit (n) α2 = α2 f¨ ur alle n ≥ n2 . Also ist a = A.α1 α2 . . . Sukzessive wird damit eine reelle Zahl a = A.α1 α2 α3 α4 . . . definiert. Es bleibt noch zu zeigen, dass a = limn→∞ an ist. Sei dazu ε > 0. Wir suchen zun¨achst ein j ∈ N, sodass 10−j < ε ist. F¨ ur n ≥ nj ist
50
5 Folgen und Reihen (n)
(n)
a − an = 0.000 . . . 0 αj+1 αj+2 . . . , da die ersten j Stellen nach dem Komma in a mit jenen von an u ¨bereinstimmen, sofern n ≥ nj ist. Somit gilt |a − an | ≤ 10−j < ε
f¨ ur n ≥ nj .
Mit n(ε) = nj wird damit die in Def. 5.6 geforderte Bedingung erf¨ ullt. Falls die Folge (an )n≥1 auch negative Glieder besitzt, kann sie durch Addition des Absolutbetrags des ersten Glieds zu einer Folge mit positiven Gliedern (|a1 | + an )n≥1 transformiert werden, auf die dann der erste Teil des Beweises angewendet werden kann. ⊓ ⊔ Bemerkung 5.11 Die rationalen √ Zahlen sind nicht vollst¨andig. Zum Beispiel ist die Dezimalentwicklung von 2, (1, 1.4, 1.41, 1.414, 1.4142, . . .) eine monoton wachsende, beschr¨ankte Folge rationaler Zahlen (eine obere Schranke ist zum Beispiel T = 1.5, da 1.52 > 2 ist), aber der Grenzwert √ 2 liegt nicht in Q (ist aber eine reelle Zahl ∈ R). Beispiel 5.12 (Arithmetik reeller Zahlen) Satz 5.10 u ¨ber die Vollst¨andigkeit der reellen Zahlen erlaubt es, die im Abschnitt 1.2 eingef¨ uhrten arithmetischen Operationen auf den reellen Zahlen nachtr¨aglich zu legitimieren. Betrachten wir etwa die Addition zweier nichtnegativer reeller Zahlen a = A.α1 α2 . . . und b = B.β1 β2 . . . mit A, B ∈ N0 , αj , βj ∈ {0, 1, . . . , 9}. Durch Abschneiden nach der n-ten Dezimale erhalten wir zwei approximierende Folgen rationaler Zahlen an = A.α1 α2 . . . αn und bn = B.β1 β2 . . . βn mit a = lim an , n→∞
b = lim bn . n→∞
Die Summe zweier Approximationen an + bn ist durch die Addition rationaler Zahlen elementar definiert. Die Folge (an + bn )n≥1 ist offenbar monoton wachsend und nach oben beschr¨ankt, etwa durch A + B + 2. Nach dem Satz 5.10 besitzt diese Folge einen Grenzwert, und dieser Grenzwert definiert die Summe der reellen Zahlen a + b = lim (an + bn ). n→∞
In dieser Weise wird die Addition reeller Zahlen rigoros gerechtfertigt. In ¨ahnlicher Weise kann man bei der Multiplikation vorgehen. Schließlich erlaubt Satz 5.7 die u ur Addition und Multiplikation nachzu¨blichen Rechenregeln f¨ weisen. Jede nach oben beschr¨ankte Folge besitzt definitionsgem¨aß eine obere Schranke T . Jede reelle Zahl T1 > T ist ebenfalls eine obere Schranke. Wir k¨onnen nun zeigen, dass es eine kleinste obere Schranke gibt, eine beschr¨ankte Folge also tats¨achlich einen Supremum besitzt, wie eingangs behauptet.
5.3 Unendliche Reihen
51
Satz 5.13 Jede nach oben beschr¨ ankte Folge (an )n≥1 reeller Zahlen besitzt ein Supremum. Beweis: Sei Tn = max{a1 , . . . , an } das Maximum der ersten n Folgenglieder. Diese Maxima definieren ihrerseits eine Folge (Tn )n≥1 , die durch dieselben Schranken wie (an )n≥1 von oben beschr¨ ankt ist, aber zus¨atzlich monoton wachsend ist. Nach dem vorigen Satz besitzt sie einen Grenzwert T0 . Dieser Grenzwert ist das Supremum der urspr¨ unglichen Folge. In der Tat ist Tn ≤ T0 f¨ ur alle n, daher auch an ≤ T0 f¨ ur alle n. G¨ abe es eine kleinere obere Schranke T < T0 der Folge (an )n≥1 , so m¨ ussten mit ε = T0 − T ja ab einem n(ε) alle Tn in der ε-Umgebung Uε (T0 ) liegen, also insbesondere gr¨oßer als T sein. Somit g¨abe es aber ein aj ∈ {a1 , . . . , an(ε) }, das gr¨oßer als T ist. Dies steht im Widerspruch zur Annahme, dass T eine obere Schranke war. Somit ist T0 die kleinste obere Schranke. ⊓ ⊔ Anwendung 5.14 Wir sind nunmehr in der Lage zu zeigen, dass die im Abschnitt 2.2 informell gegebene Definition der Exponentialfunktion f¨ ur reelle Hochzahlen korrekt ist. Sei a > 0 eine Basis f¨ ur die zu definierende Potenz ar mit reeller Hochzahl r ∈ R. Es gen¨ ugt, den Fall r > 0 zu behandeln (f¨ ur negatives r wird ar durch den Kehrwert von a|r| definiert). Wir stellen r als Grenzwert einer monoton wachsenden Folge (rn )n≥1 rationaler Zahlen dar, indem wir f¨ ur rn die an der n-ten Dezimalstelle abgebrochene Dezimaldarstellung von r w¨ahlen. Aus den Rechenregeln f¨ ur rationale Hochzahlen folgt die Ungleichung: arn+1 − arn = arn (arn+1 −rn − 1) ≥ 0. Dies zeigt, dass die Folge (arn )n≥1 monoton wachsend ist. Sie ist auch nach oben beschr¨ankt, etwa durch aq , wenn q eine rationale Zahl gr¨ oßer als r ist. Nach dem Vollst¨andigkeitssatz besitzt diese Folge einen Grenzwert. Dieser Grenzwert definiert ar . √ Anwendung 5.15 F¨ ur a > 0 ist limn→∞ n a = 1. Zum Beweis k¨onnen wir uns auf den Fall 0 < a < 1 beschr¨anken, da sonst das Argument auf 1/a ¨berlegt sich leicht, dass √ angewendet werden kann. Man u dann die Folge ( n a)n≥1 monoton wachsend ist; sie ist auch durch 1 von oben beschr¨ankt. Daher besitzt sie einen √ Grenzwert b. W¨are b < 1, so g¨abe es zu ur alle n ≥ n(ε) in der Umgebung Uε (b) ε = (1 − b)/2 ein n(ε), sodass n a f¨ zu liegen kommt und damit kleiner gleich b + ε = (1 + b)/2 < 1 w¨are. Damit n folgt aber a ≤ ((1 + b)/2) f¨ ur alle n ≥ n(ε), was wegen (1 + b)/2 < 1 zur Folge h¨atte, dass a = 0 ist. Folglich muss b = 1 sein.
5.3 Unendliche Reihen Summen der Form
∞ X
ak = a1 + a2 + a3 + . . .
k=1
aus unendlich vielen Summanden kann unter gewissen Bedingungen eine Bedeutung gegeben werden. Ausgangspunkt ist eine Koeffizientenfolge (ak )k≥1
52
5 Folgen und Reihen
reeller Zahlen. Die n-te Partialsumme ist Sn =
n X
ak = a1 + a2 + a3 + . . . + an ,
k=1
also S1 = a1 S2 = a1 + a2 S3 = a1 + a2 + a3
usw.
Pn Bei Bedarf verwenden wir auch ohne Kommentar die Notation Sn = k=0 ak , falls die Indizierung der Koeffizientenfolge mit k = 0 beginnt: a0 , a1 , a2 , a3 , . . . Definition 5.16 Die Folge der Partialsummen (Sn )n≥1 heißt Reihe. Falls S = limn→∞ Sn existiert, so heißt die Reihe konvergent, andernfalls divergent. Im Falle der Konvergenz schreibt man S=
∞ X
ak = lim
k=1
n→∞
n X
ak
k=1
!
.
Somit ist das Summationsproblem auf die Frage der Konvergenz der Folge der Partialsummen zur¨ uckgef¨ uhrt. Experiment 5.17 Das m-File mat05 3.m erzeugt (Aufruf: mat05 3(N,Z)) die ersten N Partialsummen mit Zeitverz¨ ogerung Z [Sekunden] von f¨ unf Reihen, also jeweils Sn f¨ ur 1 ≤ n ≤ N : Reihe 1 : Reihe 3 : Reihe 5 :
Sn = Sn = Sn =
n X
k=1 n X
k=1 n X
k=1
k−0.99 k−1.01
Reihe 2 : Reihe 4 :
Sn = Sn =
n X
k=1 n X
k−1 k−2
k=1
1 k!
Experimentieren Sie mit wachsenden Werten von N und versuchen Sie zu ersehen, bei welchen Reihen Konvergenz oder Divergenz vorliegt.
Im Experiment scheint die Konvergenz von Reihe 5 offensichtlich zu sein, w¨ahrend die Beobachtungen f¨ ur die anderen Reihen eher nicht schl¨ ussig sind. Tats¨achlich divergieren die Reihen 1 und 2, w¨ahrend die anderen konvergiere. Man braucht also schon analytische Werkzeuge, um die Konvergenzfrage entscheiden zu k¨onnen. Zun¨achst aber ein paar Beispiele. P∞ Beispiel 5.18 (Geometrische Reihe) Es handelt sich um die Reihe k=0 q k mit reellem Faktor q ∈ R. F¨ ur die Partialsummen gilt:
5.3 Unendliche Reihen
Sn =
n X
k=0
qk =
53
1 − q n+1 . 1−q
In der Tat ergibt Subtraktion der beiden Zeilen Sn = 1 + q + q 2 + . . . + q n , qSn = q + q 2 + q 3 + . . . + q n+1 . die Formel (1 − q)Sn = 1 − q n+1 , woraus das Resultat folgt.
Der Fall |q| < 1: Wegen q n+1 → 0 ergibt sich die Konvergenz der Reihe mit Wert 1 − q n+1 1 S = lim = . n→∞ 1−q 1−q
Der Fall |q| > 1: F¨ ur q > 1 geht Sn = (q n+1 − 1)/(q − 1) → ∞ und die Reihe divergiert. Im Falle q < −1 ist Sn = (1 − (−1)n+1 |q|n+1 )/(1 − q) unbeschr¨ankt oszillierend, also ebenfalls divergent. Der Fall |q| = 1: F¨ ur q = 1 ist Sn = 1 + 1 + . . . + 1 = n + 1 und strebt gegen unendlich; f¨ ur q = −1 oszilliert Sn zwischen 1 und 0. In beiden F¨allen divergiert die Reihe. P∞ 1 ist Beispiel 5.19 Die n-te Partialsumme der Reihe k=1 k(k+1) Sn =
n X
k=1
n
X 1 = k(k + 1)
k=1
1 1 − k k+1
1 1 1 1 1 1 1 1 1 = 1 − + − + − + ... − + − =1− . 2 2 3 3 4 n n n+1 n+1 Es handelt sich um eine so genannte Teleskopsumme. Die Reihe konvergiert zu ∞ X 1 1 S= = lim 1 − = 1. k(k + 1) n→∞ n+1 k=1 P∞ Beispiel 5.20 (Harmonische Reihe) Es handelt sich um die Reihe k=1 k1 . Durch Zusammenfassen in Zweier-, Vierer-, Achter-, Sechzehnerbl¨ocken usw. sieht man, dass gilt: 1 1 + 17 + ... + ... 1 + 12 + 31 + 41 + 15 + 16 + 17 + 81 + 19 + . . . + 16 1 1 1 ≥ 1 + 12 + 14 + 14 + 81 + 18 + 18 + 18 + 16 + 32 + . . . + 16 + ... + ... = 1 + 12 + 12 + 12 + 12 + 12 + . . . → ∞. Die Partialsummen gehen gegen Unendlich, die Reihe divergiert daher. Es gibt eine Reihe von Kriterien, die zu entscheiden gestatten, ob eine Reihe konvergiert oder divergiert. Wir behandeln hier nur die beiden einfachsten Konvergenzkriterien, das Majoranten- und das Minorantenkriterium, mit denen die f¨ ur uns wichtigen Reihen untersucht werden k¨onnen. F¨ ur weiter ¨ f¨ uhrende Uberlegungen verweisen wir auf die Literatur, etwa [2, Kap. 5.1].
54
5 Folgen und Reihen
Satz 5.21 (Vergleichskriterien) Es sei 0 ≤ ak ≤ bk f¨ ur alle k ∈ N, oder zumindest f¨ ur alle k gr¨ oßer gleich einem k0 . Dann gilt: P∞ P∞ (a) Ist die Reihe k=1 bk konvergent, so konvergiert auch die Reihe k=1 ak (Majorantenkriterium). P∞ P∞ (b) Ist die Reihe k=1 ak divergent, so divergiert auch die Reihe k=1 bk (Minorantenkriterium). Pn P∞ Beweis: (a) Die Partialsummen erf¨ ullen Sn = k=1 ak ≤ k=1 bk = T und Sn ≤ Sn+1 , sind also beschr¨ ankt und monoton wachsend. Nach dem Satz u ¨ber die Vollst¨andigkeit der reellen Zahlen existiert S = lim Sn = n→∞
∞ X
ak .
k=1
(b) F¨ ur die Partialsummen gilt nun Tn =
n X
k=1
bk ≥
n X
k=1
ak → ∞,
da letztere positiv sind und divergieren.
P∞
⊓ ⊔
Unter der Voraussetzung 0 ≤ man k=1 bk eine P∞ Pa∞k ≤ bk des Satzes nennt P ∞ Majorante zu k=1 ak und k=1 ak eine Minorante zu k=1 bk . Demnach konvergiert eine Reihe, wenn sie eine konvergente Majorante besitzt, und divergiert, wenn sie eine divergente Minorante besitzt. P∞ Beispiel 5.22 Die Reihe k=1 k12 ist konvergent. Es ist n−1 n X X 1 1 = 1 + k2 (j + 1)2 j=1
k=1
und aj =
1 1 ≤ = bj . (j + 1)2 j(j + 1)
P∞ Wir wenden das Majorantenkriterium und Beispiel 5.19 an, wonach j=1 bj konvergiert. P∞ Beispiel 5.23 Die Reihe k=1 k −0.99 divergiert. Dies folgt aus der Divergenz der harmonischen Reihe (Beispiel 5.20), welche wegen k −1 ≤ k −0.99 eine Minorante ist. Beispiel 5.24 Im Kapitel 2 wurde die Euler’sche Zahl e=
∞ X 1 1 1 1 1 =1+1+ + + + + ... j! 2 6 24 120 j=0
eingef¨ uhrt. Wir k¨onnen nun zeigen, dass diese Definition sinnvoll ist, das heißt, dass die Reihe konvergiert. F¨ ur j ≥ 4 ist offenbar j! = 1 · 2 · 3 · 4 · 5 · . . . · j ≥ 2 · 2 · 2 · 2 · 2 · . . . · 2 = 2j . P∞ Also stellt die geometrische Reihe j=0 ( 12 )j eine konvergente Majorante dar.
5.4 Erg¨ anzung: H¨ aufungswerte von Folgen
55
Beispiel 5.25 Die Dezimaldarstellung einer positiven reellen Zahl a = A.α1 α2 α3 . . . mit A ∈ N0 , αk ∈ {0, . . . , 9} kann als Reihendarstellung aufgefasst werden: a=A+
∞ X
αk 10−k
k=1
Die Reihe konvergiert, da sie mit A+ 9 besitzt.
P∞
k=1
10−k eine konvergente Majorante
5.4 Erg¨ anzung: H¨ aufungswerte von Folgen Gelegentlich ben¨otigen wir Folgen, die zwar selbst nicht konvergieren, aber konvergente Teilfolgen besitzen. Im Zusammenhang damit stehen die Begriffe des Limes superior und Limes inferior. Definition 5.26 Eine Zahl b heißt H¨ aufungswert der Folge (an )n≥1 , wenn in jeder Umgebung Uε (b) von b unendlich viele Glieder der Folge liegen: ∀ε > 0 ∀n ∈ N ∃m = m(n, ε) ≥ n :
|b − am | < ε.
Die Abb. 5.3 zeigt die Folge an = arctan n + cos(nπ/2) +
1 n
sin(nπ/2).
Sie besitzt drei H¨ aufungswerte, n¨amlich b1 = π/2 + 1 ≈ 2.57, b2 = π/2 ≈ 1.57 und b3 = π/2 − 1 ≈ 0.57. an 3 2 1
n
0 0
5
10
15
20
25
30
Abb. 5.3. H¨ aufungswerte einer Folge.
Ist eine Folge konvergent mit Limes a, so ist a der einzige H¨aufungswert. H¨aufungswerte einer Folge k¨onnen auch mit Hilfe des Begriffs von Teilfolgen charakterisiert werden.
56
5 Folgen und Reihen
Definition 5.27 Ist 1 ≤ n1 < n2 < n3 < . . . eine streng monoton wachsende Folge nat¨ urlicher Zahlen (Indizes), so heißt (anj )j≥1 eine Teilfolge der Folge (an )n≥1 . Beispiel 5.28 Wir gehen von der Folge an = n1 aus. Setzen wir etwa nj = j 2 , so erhalten wir die Folge anj = j12 als Teilfolge: 1 , . . . ); (an )n≥1 = (1, 21 , 31 , 41 , 15 , 61 , 71 , 81 , 19 , 10 1 1 (anj )j≥1 = (1, 4 , 9 , . . . ).
Satz 5.29 Eine Zahl b ist genau dann ein H¨aufungswert der Folge (an )n≥0 , wenn b Grenzwert einer konvergenten Teilfolge (anj )j≥1 ist. Beweis: Sei b ein H¨aufungswert der Folge (an )n≥0 . Wir konstruieren schrittweise eine streng monoton wachsende Folge von Indizes (nj )j≥1 , sodass |b − anj | <
1 j
(5.2)
f¨ ur alle j ∈ N erf¨ ullt ist. Nach Def. 5.26 gilt f¨ ur ε 1 = 1 ∀n ∈ N ∃m ≥ n : |b − am | < ε1 . Wir w¨ahlen n = 1 und bezeichnen das kleinste m ≥ n, das diese Bedingung erf¨ ullt, mit n1 . Damit gilt |b − an1 | < ε1 = 1. F¨ ur ε2 =
1 2
hat man wieder nach Nach Def. 5.26: ∀n ∈ N ∃m ≥ n : |b − am | < ε2 .
Nun w¨ahlen wir n = n1 + 1 und bezeichnen das kleinste m ≥ n1 + 1, das die Bedingung erf¨ ullt, mit n2 . Damit gilt |b − an2 | < ε2 =
1 . 2
Es ist klar, wie fortzusetzen ist. Hat man nj konstruiert, so setzt man εj+1 = 1/(j + 1) und verwendet Def. 5.26, wonach gilt: ∀n ∈ N ∃m ≥ n : |b − am | < εj+1 . Wir w¨ahlen n = nj + 1 und bezeichnen das kleinste m ≥ nj + 1, das die Bedingung erf¨ ullt, mit nj+1 . Damit gilt
5.4 Erg¨ anzung: H¨ aufungswerte von Folgen
|b − anj+1 | < εj+1 =
57
1 . j+1
Das Verfahren garantiert einerseits, dass die Folge der Indizes (nj )j≥1 streng monoton wachsend ist, und andererseits, dass die Ungleichung (5.2) f¨ ur alle j ∈ N erf¨ ullt ist. Insbesondere ist (anj )j≥1 eine gegen b konvergente Teilfolge. Dass umgekehrt der Limes einer Teilfolge ein H¨ aufungswert der urspr¨ unglichen ist, ist offensichtlich. ⊓ ⊔ Im Beweis des Satzes haben wir die Methode der rekursiven Definition einer Folge verwendet, n¨ amlich der Teilfolge (anj )j≥1 .
Wir wollen nun zeigen, dass jede beschr¨ ankte Folge mindestens einen H¨aufungswert – oder ¨aquivalent dazu – eine konvergente Teilfolge besitzt. Dieses Resultat tr¨agt die Namen von Bolzano2 und Weierstraß3 und ist ein wichtiges beweistechnisches Hilfsmittel an vielen Stellen der Analysis. Satz 5.30 (Satz von Bolzano-Weierstraß) Jede beschr¨ankte Folge (an )n≥1 besitzt (wenigstens) einen H¨ aufungswert. Beweis: Wegen der Beschr¨ anktheit der Folge gibt es Schranken b < c, sodass alle Folgenglieder an zwischen b und c liegen. Wir halbieren das Intervall [b, c]. Dann m¨ ussen in mindestens einem der beiden Halbintervalle [b, (b + c)/2] oder [(b + c)/2, c] unendlich viele Folgenglieder liegen. Wir w¨ahlen ein solches Halbintervall und nennen es [b1 , c1 ]. Auch dieses Intervall halbieren wir; in einer der beiden H¨alften m¨ ussen wieder unendlich viele Folgenglieder liegen. Dieses Viertelintervall nennen wir [b2 , c2 ]. So fortfahrend erhalten wir eine Folge von Intervallen [bn , cn ] der L¨ ange 2−n (c − b), in denen jeweils unendlich viele Folgenglieder liegen. Offenbar sind die bn monoton wachsend und beschr¨ankt, konvergieren daher gegen einen Grenzwert d. Da nach Konstruktion in jedem der Intervalle [d − 2−n , d + 2−n ] unendlich viele Folgenglieder liegen, ist d ein H¨ aufungswert der Folge. ⊓ ⊔
Ist die Folge (an )n≥1 beschr¨ ankt, so ist auch die Menge ihrer H¨aufungswerte beschr¨ankt und besitzt somit ein Supremum. Dieses Supremum ist selbst H¨ aufungswert der Folge (wie man durch Konstruktion einer geeigneten konvergenten Teilfolge zeigen kann) und stellt somit den gr¨oßten H¨aufungswert dar. Definition 5.31 Der gr¨ oßte H¨ aufungswert einer beschr¨ankten Folge heißt Limes superior und wird mit lim n→∞ an oder lim supn→∞ an bezeichnet. Der kleinste H¨aufungswert heißt Limes inferior mit den entsprechenden Bezeichnungen lim n→∞ an oder lim inf n→∞ an . Die Beziehungen lim sup an = lim n→∞
2 3
n→∞
sup am ,
m≥n
B. Bolzano, 1781–1848 K. Weierstraß, 1815–1897
lim inf an = lim n→∞
n→∞
inf am
m≥n
58
5 Folgen und Reihen
folgen leicht aus den Definitionen und erl¨ autern die Notation. Im Beispiel der Folge (an )n≥1 aus Abb. 5.3 ist lim supn→∞ an = π/2 + 1, lim inf n→∞ an = π/2 − 1.
¨ 5.5 Ubungen 1. Suchen Sie ein Bildungsgesetz der nachstehenden Folgen, pr¨ ufen Sie auf Monotonie, Beschr¨ anktheit und Konvergenz: −3, −2, −1, 0, 0, −1,
1 , 2
−2,
1 3 , , 5 , 7 , 9 ,...; 4 9 16 25 36 1 1 , −3, 18 , −4, 16 ,.... 4 2
n 2. Verifizieren Sie, dass die Folge an = 1+n 2 gegen 1 konvergiert, indem Sie zu gegebenem ε > 0 ein n(ε) angeben, sodass n2 <ε − 1 1 + n2
ist f¨ ur alle n ≥ n(ε).
3. Ermitteln Sie eine Rekursionsformel, mit der die Glieder der geometrischen Folge an = q n , n ≥ 0, sukzessive berechnet werden k¨ onnen. Schreiben Sie damit ein MATLAB -Programm, das die ersten N Glieder der geometrischen Folge zu beliebigem ¨ q ∈ R berechnet. Uberpr¨ ufen Sie das Konvergenzverhalten f¨ ur verschiedene Werte von q und plotten Sie die Ergebnisse. Machen Sie dasselbe mit Hilfe des Applets Folgen. 4. Untersuchen Sie, ob folgende Folgen konvergieren oder nicht, und geben Sie im Falle der Konvergenz den Grenzwert an: n n+1 1 1 n , − , bn = −n + , cn = − an = n+1 n n n n2 + 3n + 1 1 n fn = cos(nπ). e + e−n , dn = n − , en = n 2
5. Untersuchen Sie, ob folgende Folgen einen Grenzwert oder H¨ aufungswerte besitzen. Geben Sie, falls vorhanden, lim, lim inf, lim sup, inf, sup an: an =
n3
n+7 , +n+1
dn = 1 + (−1)n ,
1 − 3n2 , 7n + 5 1 + (−1)n , en = n bn =
cn =
en − e−n , en + e−n
fn = 1 + (−1)n (−1)n/2 .
¨ ¨ 6. Offnen Sie das Applet Folgen, visualisieren Sie die Folgen aus den Ubungsaufgaben 4 und 5 und diskutieren Sie deren Verhalten an Hand ihrer Graphen. 7. Das Bev¨ olkerungsmodell von Verhulst aus Beispiel 5.3 kann in geeigneten Einheiten in vereinfachter Form durch die rekursive Beziehung xn+1 = rxn (1 − xn ),
n = 0, 1, 2, 3, ...
¨ 5.5 Ubungen
59
mit einem Anfangswert x0 und einem Parameter r beschrieben werden. Wir setzen in der Folge 0 ≤ x ≤ 1 und 0 ≤ r ≤ 4 voraus (da dann alle xn jedenfalls im Intervall [0, 1] verbleiben). Schreiben Sie ein MATLAB -Programm, das zu gegebenem r, x0 , N ¨ die ersten N Glieder der Folge (xn )n≥1 berechnet. Uberpr¨ ufen Sie mit Hilfe Ihres Programmes (und einiger Zahlenwerte f¨ ur r, x0 , N ) die folgenden Behauptungen: (a) F¨ ur 0 ≤ r ≤ 1 strebt xn gegen 0; √ (b) f¨ ur 1 < r < 2 2 strebt xn gegen ein positives Gleichgewicht; √ (c) f¨ ur 3 < r < 1 + 6 pendelt xn schließlich zwischen zwei verschiedenen positiven Werten; (d) f¨ ur 3.75 < r ≤ 4 verh¨ alt sich die Folge der xn chaotisch.
¨ Uberpr¨ ufen Sie die Behauptungen auch mit dem Applet Folgen. 8. Die Folge (an )n≥1 sei rekursiv gegeben durch a1 = A,
an+1 =
1 1 2 an − . 2 2
Welche Startwerte A ∈ R sind Fixpunkte der Rekursion (A = a1 = a2 = . . . )? Untersuchen Sie, f¨ ur welche Startwerte A ∈ R die Folge konvergiert bzw. divergiert. Sie k¨ onnen dazu das Applet Folgen verwenden. Versuchen Sie, die Konvergenz- bzw. Divergenzbereiche m¨ oglichst genau einzugrenzen. 9. Schreiben Sie ein MATLAB -Programm, das zu gegebenem α ∈ [0, 1] und N ∈ N die ersten N Glieder der Folge xn = nα − ⌊nα⌋,
n = 1, 2, 3, ..., N
berechnet (⌊nα⌋ bezeichnet die gr¨ oßte ganze Zahl kleiner gleich nα). Untersuchen Sie mit Hilfe Ihres Programms das Verhalten der Folge f¨ ur rationales α = pq und f¨ ur irrationales α (oder jedenfalls eine sehr genaue rationale N¨ aherung an irrationales α) durch Plotten der Folgenglieder und durch Visualisierung ihrer Verteilung in einem Histogramm. Verwenden Sie die MATLAB -Befehle floor und hist. 10. Geben Sie formale Beweise f¨ ur die verbleibenden Rechenregeln aus Satz 5.7, also f¨ ur die Regeln f¨ ur Addition, Vervielfachung und Division, indem Sie den Beweis f¨ ur die Multiplikationsregel modifizieren. 11. Untersuchen Sie die folgenden Reihen mit Hilfe des Majoranten/MinorantenKriteriums auf Konvergenz: ∞ X
k=1
∞ X 1 √ , k k=1
1 , k(k + 2)
∞ X 1 . k3 k=1
12. Untersuchen Sie die folgenden Reihen auf Konvergenz: ∞ ∞ 2k ∞ X X X 1 2 2 + k2 , , . k4 2 k! k=1
k=1
k=1
¨ ¨ 13. Uberlegen Sie, wie die Partialsummen Sn der Reihen aus den Ubungsaufgaben 11 und 12 mit Hilfe einer Rekursion berechnet werden k¨ onnen und studieren Sie deren Verhalten sodann mit dem Applet Folgen. 14. Beweisen Sie die Konvergenz der Reihe
60
5 Folgen und Reihen ∞ X 2k . k!
k=0
¨ Hinweis: Verwenden Sie die Uberlegung, dass j! ≥ 4j f¨ ur j ≥ 9 erf¨ ullt ist (warum)? Damit folgt 2j /j! ≤ 1/2j . Wenden Sie nun das Majorantenkriterium an.
15. Beweisen Sie das Quotientenkriterium f¨ ur Reihen mit positiven Gliedern ak > 0: Falls ein q, 0 < q < 1 existiert, sodass f¨ ur die Quotienten gilt: ak+1 ≤q ak P f¨ ur alle k ∈ N0 , so konvergiert die Reihe ∞ k=0 ak . Hinweis: Aus der Voraussetzung folgt a1 ≤ a0 q, a2 ≤ a1 q ≤ a0 q 2 und damit sukzessive ak ≤ a0 q k f¨ ur alle k. Verwenden Sie nun das Majorantenkriterium und die Konvergenz der geometrischen Reihe mit q < 1.
6 Grenzwerte und Stetigkeit von Funktionen
In diesem Abschnitt erweitern wir den Begriff des Grenzwerts von Folgen zum Begriff des Grenzwerts von Funktionen. Damit erhalten wir einerseits ein Hilfsmittel zur feinen Untersuchung des Verhaltens von Funktionsgraphen in der N¨ ahe ausgew¨ ahlter Punkte, andererseits sind Grenzwerte von Funktionen die Grundlage des zentralen Themas der Analysis, der Differentiation (Kap. 7). F¨ ur die Herleitung von Ableitungsformeln werden einige elementare Grenzwerte ben¨ otigt, wie etwa Grenzwerte trigonometrischer Funktionen. Die Eigenschaft der Stetigkeit einer Funktion hat weit reichende Konsequenzen, wie etwa den Zwischenwertsatz, wonach eine stetige Funktion, die auf einem Intervall das Vorzeichen wechselt, eine Nullstelle besitzt. Dieser Satz erlaubt nicht nur die L¨ osbarkeit von Gleichungen zu zeigen, sondern liefert auch numerische Verfahren zur n¨ aherungsweisen Berechnung der L¨ osungen. Vertiefende Untersuchungen zur Stetigkeit finden sich im Anhang C.
6.1 Der Begriff der Stetigkeit Wir beginnen mit der Untersuchung des Verhaltens von Graphen reeller Funktionen f : (a, b) → R bei Ann¨aherung an einen Punkt x aus dem offenen Intervall (a, b) oder auch einen Randpunkt des abgeschlossenen Intervalls [a, b]. Wir brauchen dazu den Begriff der Nullfolge: Dies ist eine Folge reeller Zahlen (hn )n≥1 mit limn→∞ hn = 0. Definition 6.1 (Grenzwerte und Stetigkeit) (a) f besitzt einen Grenzwert M in einem Punkt x ∈ (a, b), falls gilt: lim f (x + hn ) = M
n→∞
f¨ ur alle Nullfolgen (hn )n≥1 mit hn 6= 0. In diesem Fall schreibt man
62
6 Grenzwerte und Stetigkeit von Funktionen
M = lim f (x + h) = lim f (ξ) h→0
ξ→x
oder f (x + h) → M f¨ ur h → 0. (b) f besitzt einen rechtsseitigen Grenzwert R im Punkte x ∈ [a, b), falls gilt: lim f (x + hn ) = R
n→∞
f¨ ur alle Nullfolgen (hn )n≥1 mit hn > 0, mit den zugeh¨origen Schreibweisen R = lim f (x + h) = lim f (ξ). h→0+
ξ→x+
(c) f besitzt einen linksseitigen Grenzwert L im Punkte x ∈ (a, b], falls gilt: lim f (x + hn ) = L
n→∞
f¨ ur alle Nullfolgen (hn )n≥1 mit hn < 0. Schreibweisen: L = lim f (x + h) = lim f (ξ). h→0−
ξ→x−
(d) Falls f in x ∈ (a, b) einen Grenzwert M besitzt, der mit dem Funktionswert u ¨bereinstimmt (f (x) = M ), so heißt f stetig im Punkte x. (e) Falls f in jedem x ∈ (a, b) stetig ist, so wird f als stetig auf dem Intervall (a, b) bezeichnet. Abb. 6.1 erl¨autert die Idee der Ann¨ aherung an den Punkt x f¨ ur h → 0 sowie m¨ogliche Unterschiede zwischen links- und rechtsseitigem Grenzwert sowie Funktionswert.
R
f (x+h)
f (x) f (x) = M
L x
x+h
x
Abb. 6.1. Grenzwert und Stetigkeit; links- und rechtsseitige Grenzwerte.
Die Stetigkeit einer Funktion im Punkt x besagt, dass Grenz¨ ubergang und Funktionsauswertung vertauscht werden k¨ onnen: lim f (ξ) = f (x) = f ( lim ξ).
ξ→x
ξ→x
6.1 Der Begriff der Stetigkeit
63
Die nachfolgenden Beispiele zeigen einige weitere M¨oglichkeiten, wie sich eine Funktion in der N¨ ahe eines Punkts verhalten kann: Sprungstelle mit linksund rechtsseitigem Grenzwert, vertikale Asymptote mit Unendlichkeitsstelle, Oszillation mit nicht verschwindender Amplitude und unbegrenzt steigender Frequenz. Beispiel 6.2 Die Quadratfunktion f (x) = x2 ist in jedem x ∈ R stetig. Es gilt n¨amlich f (x + hn ) − f (x) = (x + hn )2 − x2 = 2xhn + h2n → 0 f¨ ur n → ∞ und beliebige Nullfolgen (hn )n≥1 . Daher ist lim f (x + h) = f (x).
h→0
Ebenso zeigt man die Stetigkeit der Potenzfunktionen x 7→ xn f¨ ur n ∈ N. Beispiel 6.3 Die Betragsfunktion f (x) = |x| und die dritte Wurzel g(x) = √ 3 x sind u ¨berall stetig. Erstere Funktion hat einen Knick bei x = 0, zweitere eine vertikale Tangente, siehe Abb. 6.2.
y=
y = | x|
√ 3
x
x
x Abb. 6.2. Stetigkeit und Knick oder vertikale Tangente.
Beispiel 6.4 Die Vorzeichenfunktion f (x) = sign x hat in x = 0 verschiedene links- und rechtsseitige Grenzwerte L = −1, R = 1 und ist dort insbesondere unstetig. In allen anderen Punkten x 6= 0 ist sie stetig, siehe Abb. 6.3. Beispiel 6.5 Das Quadrat der Vorzeichenfunktion 1, x 6= 0 g(x) = (sign x)2 = 0, x = 0 ist unstetig bei x = 0: Es besitzt zwar u ¨bereinstimmende links- und rechtsseitige Grenzwerte, diese sind aber verschieden vom Funktionswert (Abb. 6.3): lim g(ξ) = 1 6= 0 = g(0).
ξ→0
64
6 Grenzwerte und Stetigkeit von Funktionen
1
1 y = sign x 0
0
x
x
y = (sign x)2
−1
Abb. 6.3. Unstetigkeit: Sprungstelle und Ausnahmewert.
Beispiel 6.6 Die Funktionen f (x) = x1 und g(x) = tan x besitzen vertikale Asymptoten in x = 0 bzw. x = π2 + kπ, k ∈ Z, und insbesondere keinen linksoder rechtsseitigen Grenzwert in diesen Punkten. In allen anderen Punkten sind sie jedoch stetig. Wir verweisen dazu auf Abb. 2.9 und Abb. 3.10. Beispiel 6.7 Die Funktion f (x) = sin x1 hat keinen links- oder rechtsseitigen Grenzwert bei x = 0, sondern oszilliert mit nicht verschwindender Amplitude (Abb. 6.4). In der Tat erh¨alt man f¨ ur verschiedene Nullfolgen verschiedene Limites, zum Beispiel ist f¨ ur hn =
1 nπ ,
kn =
1 π/2+2nπ ,
ln =
1 3π/2+2nπ
jeweils lim f (hn ) = 0,
n→∞
lim f (kn ) = 1,
n→∞
lim f (ln ) = −1.
n→∞
Alle anderen Werte im Intervall [−1, 1] k¨onnen ebenfalls mittels geeigneter Nullfolgen als Grenzwerte erhalten werden. y = sin(1/x) 1 0.5 0
x
−0.5 −1 −0.2
−0.1
0
0.1
0.2
Abb. 6.4. Keine Grenzwerte, Oszillation mit nicht verschwindender Amplitude.
Beispiel 6.8 Die Funktion g(x) = x sin x1 ist durch g(0) = 0 stetig erg¨anzbar bei x = 0; sie oszilliert mit verschwindender Amplitude (Abb. 6.5). Es gilt
6.2 Trigonometrische Grenzwerte
65
|g(hn ) − g(0)| = |hn sin h1n − 0| ≤ |hn | → 0 f¨ ur beliebige Nullfolgen (hn )n≥1 , also ist limh→0 h sin h1 = 0. y = x sin(1/x) 0.1 0.05 0
x
−0.05 −0.1 −0.1
0
0.1
Abb. 6.5. Stetigkeit, Oszillation mit verschwindender Amplitude. Experiment 6.9 Rufen Sie die m-Files mat06 1.m und mat06 2.m auf und studieren Sie die Graphen der Funktionen aus Abb. 6.4 und 6.5 mittels Zoomfunktion im Figure-Fenster. Wie k¨ onnen Sie die Genauigkeit der Visualisierung in der N¨ ahe von x = 0 verbessern?
6.2 Trigonometrische Grenzwerte Fl¨achenvergleich in Abb. 6.6 unten zeigt, dass die Fl¨ache des schattierten Dreiecks mit Katheten cos x und sin x kleiner gleich der Fl¨ache des Kreissektors ist, welche wiederum kleiner gleich der Fl¨ache des großen Dreiecks mit Katheten 1 und tan x ist.
1
sin x cos x
tan x
x
1
Abb. 6.6. Trigonometrische Ungleichungen.
Die Fl¨ache eines Kreissektors am Einheitskreis (Winkel x im Bogenmaß) ist bekanntlich x/2. Zusammenfassend erhalten wir somit die Ungleichung
66
6 Grenzwerte und Stetigkeit von Funktionen
1 x 1 sin x cos x ≤ ≤ tan x 2 2 2 bzw. nach Division durch sin x und Kehrwertbildung cos x ≤
sin x 1 ≤ , x cos x
g¨ ultig f¨ ur alle x mit 0 < |x| < π/2.
Mit Hilfe dieser Ungleichung k¨onnen wir einige wichtige Grenzwerte herleiten. Aus einer elementargeometrischen Betrachtung ersieht man zun¨achst, dass gilt: π π 1 f¨ ur − ≤ x ≤ . |cos x| ≥ 2 3 3 F¨ ur jede Nullfolge hn → 0 ergibt sich aus den beiden Ungleichungen oben: |sin hn | ≤
|hn | ≤ 2 |hn | → 0 |cos hn |
f¨ ur n → ∞. Dies heißt aber, dass lim sin h = 0
h→0
ist, die Sinusfunktion also im Nullpunkt stetig ist. Aus der Stetigkeit der Quadrat- und der Wurzelfunktion sowie der Tatsache, das cos h f¨ ur kleine h gleich der positiven Quadratwurzel aus 1 − sin2 h ist, folgt p lim cos h = lim 1 − sin2 h = 1. h→0
h→0
Damit kann nun die Stetigkeit der Sinusfunktion in jedem Punkt x ∈ R nachgewiesen werden: lim sin(x + h) = lim sin x cos h + cos x sin h = sin x. h→0
h→0
Die zu Beginn des Abschnitts erl¨auterte Ungleichung erlaubt es, einen der wichtigsten trigonometrischen Grenzwerte herzuleiten, der den Ableitungsregeln f¨ ur die Winkelfunktionen zu Grunde liegt.
Satz 6.10 lim
x→0
sin x = 1. x
Beweis: Wir kombinieren die Grenzwertaussage limx→0 cos x = 1 mit der anfangs hergeleiteten Ungleichung und erhalten 1 = lim cos x ≤ lim x→0
weswegen limx→0
sin x x
x→0
= 1 sein muss.
sin x 1 ≤ lim = 1, x→0 cos x x ⊓ ⊔
6.3 Nullstellen stetiger Funktionen
67
6.3 Nullstellen stetiger Funktionen Abb. 6.7 zeigt den Graphen einer auf einem abgeschlossenen Intervall [a, b] stetigen Funktion, die im linken Endpunkt kleiner Null, im rechten gr¨oßer Null ist. Anschaulich muss der Graph mindestens einmal die x-Achse kreuzen, da er wegen der Stetigkeit keine Spr¨ unge macht. Das heißt also, f muss wenigstens eine Nullstelle in (a, b) haben. Dies ist ein Kriterium, das die Existenz einer L¨ osung der Gleichung f (x) = 0 garantiert. Ein erster rigoroser Beweis dieser anschaulich klaren Aussage geht auf Bolzano zur¨ uck. f (x)
ξ
a
x
b
Abb. 6.7. Zum Zwischenwertsatz.
Satz 6.11 (Zwischenwertsatz) Es sei f : [a, b] → R stetig und f (a) < 0, f (b) > 0. Dann existiert ein ξ ∈ (a, b) mit f (ξ) = 0. Beweis: Der Beweis beruht auf fortgesetzter Halbierung des Intervalls und der Vollst¨andigkeit der reellen Zahlen. Man beginnt mit dem Startintervall mit Endpunkten a1 = a, b1 = b. Anschließend f¨ahrt man rekursiv fort. 1 Schritt 1: Berechne y1 = f ( a1 +b 2 ).
Falls y1 > 0 : setze a2 = a1 , b2 = a1 +b1 2 , b2 1 ξ = a1 +b 2
a1 +b1 2 .
Falls y1 < 0 : setze a2 =
= b1 .
Falls y1 = 0 : Abbruch,
ist Nullstelle.
Es ist nunmehr f (a2 ) < 0, f (b2 ) > 0 und die Intervalll¨ange halbiert: b2 − a2 =
1 (b1 − a1 ). 2
2 Schritt 2: Berechne y2 = f ( a2 +b 2 ).
Falls y2 > 0 : setze a3 = a2 , b3 = a2 +b2 2 , b3 2 ξ = a2 +b 2
a2 +b2 2 .
Falls y2 < 0 : setze a3 =
= b2 .
Falls y2 = 0 : Abbruch,
ist Nullstelle.
68
6 Grenzwerte und Stetigkeit von Funktionen
Weitere Iteration f¨ uhrt zu einer monoton wachsenden, von oben beschr¨ankten Folge a1 ≤ a2 ≤ a3 ≤ . . . ≤ b. Nach dem Vollst¨ andigkeitssatz (Satz 5.10) existiert daher ξ = lim an . n→∞
Andererseits geht |an − bn | ≤ |a − b|/2n−1 → 0, also ist auch limn→∞ bn = ξ. Falls ξ nicht schon nach endlich vielen Schritten als eines der ak oder bk aufgetreten ist, gilt f¨ ur alle n ∈ N: f (an ) < 0,
f (bn ) > 0.
Aus der Stetigkeit von f folgt f (ξ) = lim f (an ) ≤ 0, n→∞
f (ξ) = lim f (bn ) ≥ 0, n→∞
woraus sich f (ξ) = 0 ergibt, wie behauptet.
⊓ ⊔
Der Beweis liefert gleichzeitig ein numerisches Berechnungsverfahren f¨ ur Nullstellen, das Bisektionsverfahren. Es konvergiert zwar nur langsam, ist aber einfach programmierbar und universell einsetzbar – auch f¨ ur nicht differenzierbare, stetige Funktionen. F¨ ur differenzierbare Funktionen gibt es wesentlich rascher konvergente Verfahren. Das Thema der Konvergenzgeschwindigkeit und die Diskussion schnellerer Verfahren werden wir im Abschnitt 8.2 aufgreifen. √ Beispiel 6.12 Berechnung von 2 als Nullstelle von f (x) = x2 − 2 = 0 im Intervall [1, 2] mittels Bisektionsverfahren: Start: Schritt Schritt Schritt Schritt Schritt usw.
1: 2: 3: 4: 5:
f (1) = −1 < 0, f (2) = 2 > 0; f (1.5) = 0.25 > 0; f (1.25) = −0.4375 < 0; f (1.375) = −0.109375 < 0; f (1.4375) = 0.066406... > 0; f (1.40625) = −0.022461... < 0;
a1 a2 a3 a4 a5 a6
= 1, b1 = 2 = 1, b2 = 1.5 = 1.25, b3 = 1.5 = 1.375, b4 = 1.5 = 1.375, b5 = 1.4375 = 1.40625, b6 = 1.4375
Nach 5 Schritten ist somit die erste Nachkommastelle ermittelt: √ 1.40625 < 2 < 1.4375 Experiment 6.13 Skizzieren Sie den Graphen der Funktion y = x3 + 3x2 − 2 auf dem Intervall [−3, 2] und versuchen Sie zun¨ achst graphisch eine der Nullstellen durch fortgesetzte Intervallhalbierung abzusch¨ atzen. F¨ uhren Sie die Intervallhalbie¨ rung mit Hilfe des Applets Bisektionsverfahren durch. Uberzeugen Sie sich von der Plausibilit¨ at des Zwischenwertsatzes an Hand des Applets Animation zum Zwischenwertsatz.
Als eine wichtige Anwendung des Zwischenwertsatzes zeigen wir nun, dass Bilder von Intervallen unter stetigen Funktionen wieder Intervalle sind. F¨ ur
¨ 6.4 Ubungen
69
die verschiedenen Typen von Intervallen, die im folgenden Satz vorkommen, verweisen wir auf Abschnitt 1.2; zum Begriff des echten Bildbereichs auf Abschnitt 2.1. Satz 6.14 Sei I ⊂ R ein Intervall (offen, halboffen oder abgeschlossen, beschr¨ankt oder uneigentlich) und f : I → R eine stetige Funktion mit echtem Bildbereich J = f (I). Dann ist J ebenfalls ein Intervall. Beweis: Intervalle sind als Teilmengen der reellen Zahlengerade dadurch ausgezeichnet, dass mit je zwei Punkten auch alle dazwischen liegenden Punkte enthalten sind. Seien also y1 , y2 ∈ J, y1 < y2 , und sei η ein Zwischenpunkt, also y1 < η < y2 . Da f : I → J surjektiv ist, gibt es x1 , x2 ∈ I, sodass y1 = f (x1 ) und y2 = f (x2 ) ist. Wir betrachten den Fall x1 < x2 . Da f (x1 ) − η < 0 und f (x2 ) − η > 0 ist, ergibt der Zwischenwertsatz, angewendet auf das Intervall [x1 , x2 ], dass es ein ξ ∈ (x1 , x2 ) gibt mit f (ξ) − η = 0, also f (ξ) = η. Somit wird η als Funktionswert angenommen und liegt daher in J = f (I). ⊓ ⊔ Satz 6.15 Sei I = [a, b] ein abgeschlossenes, beschr¨anktes Intervall und f : I → R eine stetige Funktion. Dann ist der echte Bildbereich J = f (I) ebenfalls ein abgeschlossenes, beschr¨ anktes Intervall. Beweis: Nach Satz 6.14 ist J ein Intervall. Sei d seine kleinste obere Schranke (m¨oglicherweise ist d = ∞). Wir nehmen eine Folge von Werten yn ∈ J, die gegen d konvergiert. Die Werte yn sind Funktionswerte gewisser xn ∈ I = [a, b]. Die Folge (xn )n≥1 ist beschr¨ ankt und besitzt daher nach Satz 5.30 einen H¨aufungspunkt x0 , a ≤ x0 ≤ b. Es gibt somit eine Teilfolge (xnj )j≥1 , die gegen x0 konvergiert (vgl. Abschnitt 5.4). Aus der Stetigkeit der Funktion f folgt, dass d = lim ynj = lim f (xnj ) = f (x0 ) j→∞
j→∞
ist. Damit ist gezeigt, dass der obere Endpunkt des Intervalls J endlich ist und als Funktionswert angenommen wird. Ebenso verf¨ahrt man mit der unteren Begrenzung c; der Bildbereich J ist somit von der Form eines abgeschlossenen, beschr¨ankten Intervalls [c, d]. ⊓ ⊔ Aus dem Beweis des Satzes ist klar, dass d der gr¨oßte und c der kleinste Funktionswert von f auf dem Intervall [a, b] ist. Daraus folgt:
Folgerung 6.16 Jede auf einem abgeschlossenen Intervall I = [a, b] definierte, stetige Funktion nimmt dort ihr Maximum und Minimum an.
¨ 6.4 Ubungen 1. (a) Untersuchen Sie das Verhalten der Funktionen √ x + x2 1+x−1 x2 + sin x √ , , |x| x 1 − cos2 x
70
6 Grenzwerte und Stetigkeit von Funktionen
1 1 in der N¨ ahe von x = 0, indem Sie deren Graphen auf dem Bereich [−2, − 100 )∪( 100 , 2] mittels MATLAB plotten.
(b) Stellen Sie durch Inspektion der Graphen fest, ob links- oder rechtsseitige Grenzwerte in x = 0 vorliegen und welchen Wert diese besitzen. Begr¨ unden Sie Ihr Ergebnis durch Umformen der Ausdr¨ ucke. Hinweis: Eine Anleitung zu Teil (a) findet sich im √ m-File mat06 ueb1.m. Zu (b), Behandlung des mittleren Terms: Erweitern Sie mit 1 + x + 1. 2. Besitzen die folgenden Funktionen an den angegebenen Stellen einen Grenzwert? Wenn ja, welchen? (a) y (b) y (c) y (d) y (e) y
= x3 + 5x + 10, x = 1; 2 −1 = xx2 +x , x = 0, x = 1, x = −1; 1−cos x = x2 , x = 0; Hinweis: Erweitern mit (1 + cos x); = sign x · sin x, x = 0; = sign x · cos x, x = 0.
3. Es sei fn (x) = arctan nx, gn (x) = (1 + x2 )−n . Berechnen Sie f¨ ur jedes x ∈ R die Grenzwerte f (x) = lim fn (x), g(x) = lim gn (x) n→∞
n→∞
und skizzieren Sie die Graphen der so definierten Funktionen f und g. Sind diese stetig? Plotten Sie fn und gn in MATLAB und untersuchen Sie das Verhalten der Graphen f¨ ur n → ∞. Hinweis: Ein L¨ osungshinweis findet sich im m-File mat06 ueb3.m. 4. F¨ uhren Sie einen formalen Nachweis mittels Nullfolgen, dass die Betragsfunktion und die dritte Wurzel aus Beispiel 6.3 stetig sind. 5. Begr¨ unden Sie mittels Zwischenwertsatz, dass das Polynom x3 + 5 x + 10 im Intervall [−2, 1] eine Nullstelle besitzt. Berechnen Sie diese mit Hilfe des Applets Bisektionsverfahren auf vier Nachkommastellen genau 6. Berechnen Sie unter Verwendung des Applets Bisektionsverfahren s¨ amtliche Nullstellen der folgenden Funktionen auf dem angegebenen Intervall (Genauigkeit 10−3 ): f (x) = x4 − 2, I = R g(x) = x − cos x, I = R 1 1 h(x) = sin x1 , I = 20 , 10 .
7. Schreiben Sie ein MATLAB -Programm, das mit Hilfe des Bisektionsverfahrens eine Nullstelle eines beliebigen Polynoms dritten Grades der Form p(x) = x3 + c1 x2 + c2 x + c3 auffindet. Ihr Programm soll auch selbst¨ andig Startwerte a, b mit p(a) < 0, p(b) > 0 finden (warum gibt es stets solche?). Testen Sie Ihr Programm, indem Sie den Koeffizientenvektor (c1 , c2 , c3 ) zuf¨ allig w¨ ahlen, zum Beispiel mittels c = 1000*rand(1,3). Hinweis: Ein L¨ osungsvorschlag ist im m-File mat06 ueb7a.m angegeben. Im m-File mat06 ueb7b.m findet sich eine Alternative, in der die Vektorfunktionen von MATLAB besser ausgen¨ utzt werden.
7 Die Ableitung einer Funktion
Ausgehend vom Problem, die Tangente an einen Funktionsgraphen zu bestimmen, f¨ uhren wir die Ableitung einer Funktion ein. Dabei wird in einem Grenz¨ ubergang das diskrete Modell der Sekante durch das kontinuierliche Modell der Tangente ersetzt. Die auf diesem Grenz¨ ubergang beruhende Differentialrechnung wurde zu einem der bedeutendsten Bausteine der mathematischen Modellbildung. Wir besprechen in diesem Abschnitt die Ableitung wichtiger elementarer Funktionen sowie allgemeine Ableitungsregeln. Die sorgf¨ altige Implementierung dieser Regeln hat Expertensysteme wie maple zu m¨ achtigen Werkzeugen in der Analysis werden lassen. Weiters besprechen wir die Deutung der Ableitung als lineare Approximati¨ on und als Anderungsrate. Diese Interpretationen bilden die Grundlage unz¨ ahliger Anwendungen in Naturwissenschaften und Technik. Das Konzept der numerischen Ableitung geht im Grunde den umgekehrten Weg und approximiert die Ableitung durch einen Differenzenquotienten. Damit wird das kontinuierliche Modell letztlich wieder diskretisiert. Wir f¨ uhren eine detaillierte Fehleranalyse durch, die es uns erlaubt, eine optimale Approximation zu bestimmen. Weiters illustrieren wir die Bedeutung der Symmetrie in numerischen Verfahren.
7.1 Motivation Beispiel 7.1 (Der freie Fall nach Galilei1 ) Denken wir uns einen K¨orper, der zum Zeitpunkt t = 0 losgelassen unter dem Einfluss der Schwerkraft nach unten f¨allt. Wir interessieren uns dabei f¨ ur den Ort des K¨orpers s(t) zum Zeitpunkt t ≥ 0 sowie f¨ ur seine Geschwindigkeit v(t), vgl. Abb. 7.1. Wegen der Definition der Geschwindigkeit als Wegdifferenz durch Zeitdifferenz hat der K¨orper im Zeitintervall [t, t + ∆t] die Durchschnittsgeschwindigkeit vmittel = 1
G. Galilei, 1564–1642.
s(t + ∆t) − s(t) . ∆t
72
7 Die Ableitung einer Funktion
Um daraus die Momentangeschwindigkeit v = v(t) zu erhalten, bilden wir den Grenzwert ∆t → 0 in obiger Formel, also
s(t + ∆t) − s(t) . ∆t→0 ∆t Galilei entdeckte durch seine Experimente, dass beim freien Fall der zur¨ uckgelegte Weg quadratisch mit der verstrichenen Zeit zunimmt, dass also das Gesetz g s(t) = t2 2 mit g ≈ 9.81 gilt. Somit erhalten wir f¨ ur die Momentangeschwindigkeit den Ausdruck g (t + ∆t)2 − g2 t2 g = lim 2t + ∆t = gt, v(t) = lim 2 ∆t→0 ∆t 2 ∆t→0 die Geschwindigkeit ist also proportional zur verstrichenen Zeit. v(t) = lim
s=0
y = f (x) f (x)
s(t) f (x0 )
s
P
ϕ ∆x
x0
Abb. 7.1. Der freie Fall.
Q ∆y
x
Abb. 7.2. Steigung der Sekante.
Beispiel 7.2 (Das Tangentenproblem) Gegeben sei eine reelle Funktion f und zwei verschiedene Punkte P = (x0 , f (x0 )) und Q = (x, f (x)) auf ihrem Graphen. Die eindeutig bestimmte Gerade durch diese beiden Punkte heißt Sekante der Funktion f durch P und Q, vgl. Abb. 7.2. Die Steigung der Sekante ist durch den Differenzenquotienten gegeben tan ϕ =
f (x) − f (x0 ) ∆y = . ∆x x − x0
L¨asst man hier x gegen x0 gehen, so entsteht aus der Sekante anschaulich die Tangente, sofern der Grenz¨ ubergang existiert. Motiviert durch diese ¨ Uberlegungen definieren wir den Anstieg k = lim
x→x0
f (x) − f (x0 ) f (x0 + h) − f (x0 ) = lim . h→0 x − x0 h
Falls dieser Grenzwert existiert, nennen wir die Gerade y = k · (x − x0 ) + f (x0 )
Tangente an den Funktionsgraphen im Punkt (x0 , f (x0 )).
7.2 Die Ableitung
73
Experiment 7.3 Gehen Sie in mathe online im Bereich Galerie zu Differenzieren 1 und visualisieren Sie den Grenz¨ ubergang von Sekante zu Tangente mit dem Applet Die Ableitung als Grenzwert.
7.2 Die Ableitung Durch obige Anwendungen motiviert definieren wir nun die Ableitung einer reellen Funktion. Definition 7.4 (Ableitung) reelle Funktion und x0 ∈ I.
Sei I ⊂ R ein offenes Intervall, f : I → R eine
(a) Man nennt f in x0 differenzierbar , falls der Differenzenquotient ∆y f (x) − f (x0 ) = ∆x x − x0 einen (endlichen Grenzwert) f¨ ur x → x0 besitzt. In diesem Fall schreibt man f (x) − f (x0 ) f (x0 + h) − f (x0 ) f ′ (x0 ) = lim = lim x→x0 h→0 x − x0 h
und bezeichnet den Grenzwert als Ableitung von f im Punkt x0 . (b) Man nennt f (auf ganz I) differenzierbar , falls f ′ (x) f¨ ur alle x ∈ I existiert. In diesem Fall bezeichnet man die Funktion f ′ : I → R : x 7→ f ′ (x)
als Ableitung von f . Das Berechnen von f ′ aus f nennt man differenzieren oder ableiten. d df (x) bzw. f (x). Die folgenden BeispieStatt f ′ (x) schreibt man oft auch dx dx le zeigen, wie man die Ableitung einer Funktion durch obigen Grenzprozess erh¨alt. Beispiel 7.5 Die konstante Funktion f (x) = c. f ′ (x) = lim
h→0
f (x + h) − f (x) c−c 0 = lim = lim = 0. h→0 h→0 h h h
Die Ableitung einer konstanten Funktion ist Null. Beispiel 7.6 Die linear-affine Funktion g(x) = ax + b. g ′ (x) = lim
h→0
g(x + h) − g(x) ax + ah + b − ax − b = lim = lim a = a. h→0 h→0 h h
Die Ableitung ist gerade die Steigung a der Geraden y = ax + b.
74
7 Die Ableitung einer Funktion
Beispiel 7.7 Die Ableitung der quadratischen Funktion y = x2 . (x + h)2 − x2 2hx + h2 = lim = lim (2x + h) = 2x. h→0 h→0 h→0 h h
y ′ = lim
Ebenso zeigt man f¨ ur die Potenzfunktion (mit n ∈ N): f (x) = xn
f ′ (x) = n · xn−1 . √ ur x > 0. Beispiel 7.8 Die Ableitung der Wurzelfunktion y = x f¨ √ √ √ √ ξ− x ξ− x 1 1 ′ y = lim = lim √ √ √ √ = lim √ √ = √ . ξ→x ξ→x ( ξ − ξ−x 2 x x)( ξ + x) ξ→x ξ + x ⇒
Beispiel 7.9 (Ableitung der Winkelfunktionen) Laut Satz 6.10 gilt lim
t→0
sin t = 1. t
Wegen (cos t − 1)(cos t + 1) = − sin2 t gilt weiters
also
cos t − 1 1 sin t · = − |{z} sin t · →0 t t cos t +1 → 0 |{z} | {z } →1 →2
f¨ ur t → 0,
cos t − 1 = 0. t Mit diesen Vorbereitungen ist wegen des Additionstheorems (Satz 3.3) lim
t→0
sin x cos h + cos x sin h − sin x sin(x + h) − sin x = lim h→0 h→0 h h cos h − 1 sin h = lim sin x · + lim cos x · h→0 h→0 h h sin h cos h − 1 + cos x · lim = sin x · lim h→0 h→0 {z h } | | {z h }
sin′ x = lim
=0
=1
= cos x.
Somit gilt also die Formel sin′ x = cos x. Ebenso zeigt man: cos′ x = − sin x. Beispiel 7.10 (Die Ableitung der Exponentialfunktion zur Basis e) Ausgehend von der Reihendarstellung der Exponentialfunktion (Satz C.12) erhalten wir durch elementare Umformungen
7.2 Die Ableitung
75
∞
e h − 1 X hk h h2 h3 = =1+ + + + ... h (k + 1)! 2 6 24 k=0
Daraus gewinnt man h 3 e − 1 ≤ |h| 1 + |h| + |h| + . . . ≤ |h|e|h| . − 1 h 2 6 24 F¨ ur h → 0 ergibt sich somit der wichtige Grenzwert eh − 1 = 1. h→0 h lim
Wegen ex+h − ex eh − 1 = ex · lim = ex h→0 h→0 h h ist die Exponentialfunktion somit differenzierbar und es gilt (ex )′ = ex . lim
Beispiel 7.11 (Neue Darstellung der Euler’schen Zahl) Mittels Substitution y = eh − 1, h = log(y + 1) im obigen Grenzwert erh¨alt man lim
y→0
y =1 log(y + 1)
und damit 1/y
lim log(1 + αy)
y→0
log(1 + αy) log(1 + αy) = α lim = α. y→0 y→0 y αy
= lim
Auf Grund der Stetigkeit der Exponentialfunktion folgt weiters 1/y
lim (1 + αy)
y→0
= eα
und speziell f¨ ur y = 1/n eine neue Darstellung der Exponentialfunktion α n . eα = lim 1 + n→∞ n
Insbesondere ergibt sich f¨ ur α = 1 die Identit¨at n X ∞ 1 1 e = lim 1 + = = 2.718281828459... n→∞ n k! k=0
Beispiel 7.12 Nicht jede stetige Funktion ist differenzierbar. So ist etwa die Funktion f (x) = |x| in der Spitze x = 0 nicht differenzierbar, vgl. Abb. 7.3, linkes Bild. Wegen ( x, x≥0 |x| = −x, x≤0
76
7 Die Ableitung einer Funktion
ist die Funktion jedoch f¨ ur x 6= 0 differenzierbar, und es gilt ( 1, falls x > 0 ′ (|x|) = −1, falls x < 0. √ Die Funktion g(x) = 3 x ist ebenfalls bei x = 0 nicht differenzierbar. Der Grund daf¨ ur ist die senkrechte Tangente, vgl. Abb. 7.3, rechtes Bild.
y=
√ 3
x
y = |x|
Abb. 7.3. Funktionen, die bei x = 0 nicht differenzierbar sind.
Es gibt sogar stetige Funktionen, die nirgends differenzierbar sind. Experiment 7.13 Gehen Sie in mathe online im Bereich Galerie zu Differenzieren 2 und sehen Sie sich im Applet Nirgends differenzierbare Funktionen Beispiele stetiger Funktionen an, die nirgends differenzierbar sind.
Definition 7.14 Falls die Funktion f ′ wieder differenzierbar ist, bezeichnet man mit f ′′ (x) =
d2 d2 f f ′ (x + h) − f ′ (x) f (x) = (x) = lim 2 2 h→0 dx dx h
die zweite Ableitung von f nach x. Ebenso definiert man h¨ohere Ableitungen 2 ′ d d d3 ′′′ ′′ f (x) = f (x) , usw. f (x) = f (x) bzw. dx3 dx dx2 Differenzieren mit maple . Mit maple kann man sowohl Ausdr¨ ucke (expressions) als auch Funktionen differenzieren. Hat der Ausdruck g beispielsweise die Form g := x^2 - a*x; so ist die entsprechende Funktion f durch f := x -> x^2 - a*x; definiert. Die Auswertung von Funktionen ergibt Ausdr¨ ucke, beispielsweise wertet f(t) zum Ausdruck t2 − at aus. Umgekehrt kann man Ausdr¨ ucke mittels unapply in Funktionen umwandeln h := unapply(g,x); Die Ableitung von Ausdr¨ ucken erh¨alt man mit diff, jene von Funktionen mittels D. Beispiele dazu finden Sie im maple -Arbeitsblatt mp07_1.mws.
7.3 Interpretationen der Ableitung
77
7.3 Interpretationen der Ableitung Wir hatten die Ableitung geometrisch als Steigung der Tangente eingef¨ uhrt. Wie wir sahen, ist die Tangente an den Graphen einer differenzierbaren Funktion f im Punkt (x0 , f (x0 )) gegeben durch y = f ′ (x0 )(x − x0 ) + f (x0 ). Beispiel 7.15 Sei f (x) = x4 + 1 mit Ableitung f ′ (x) = 4x3 . (i) Die Tangente an den Graphen von f im Punkt (0, 1) lautet y = f ′ (0) · (x − 0) + f (0) = 1, ist also waagrecht. (ii) Die Tangente an den Graphen von f im Punkt (1, 2) lautet y = f ′ (1)(x − 1) + 2 = 4(x − 1) + 2 = 4x − 2. Die Ableitung l¨asst noch weitere Interpretationen zu. Deutung als lineare Approximation. Zun¨achst halten wir fest, dass sich jede differenzierbare Funktion f in der Form f (x) = f (x0 ) + f ′ (x0 )(x − x0 ) + R(x, x0 ) schreiben l¨asst, wobei der Rest R(x, x0 ) die Eigenschaft lim
x→x0
R(x, x0 ) =0 x − x0
besitzt. Das ergibt sich unmittelbar aus R(x, x0 ) = f (x) − f (x0 ) − f ′ (x0 )(x − x0 ) nach Division durch x − x0 , da f (x) − f (x0 ) → f ′ (x0 ) x − x0
f¨ ur x → x0 .
Anwendung 7.16 Wie wir eben sahen, ist eine differenzierbare Funktion f dadurch charakterisiert, dass in die Formel f (x) = f (x0 ) + f ′ (x0 )(x − x0 ) + R(x, x0 ) der Restterm R(x, x0 ) schneller als x − x0 gegen Null strebt. Durch Bilden des Grenzwerts x → x0 folgt daraus insbesondere, dass jede differenzierbare Funktion stetig ist.
78
7 Die Ableitung einer Funktion
Anwendung 7.17 Sei g jene Funktion, deren Graph die Gerade durch den Punkt (x0 , f (x0 )) mit Anstieg k ist, also g(x) = k · (x − x0 ) + f (x0 ). Da f (x) − g(x) f (x) − f (x0 ) − k · (x − x0 ) R(x, x0 ) = = f ′ (x0 ) − k + x − x0 x − x0 x−x | {z 0 } →0
f¨ ur x → x0 , ist die Tangente (d.h. k = f ′ (x0 )) jene Gerade, die den Graphen am besten approximiert. Man nennt die Tangente g(x) = f (x0 ) + f ′ (x0 ) · (x − x0 ) auch lineare Approximation an f bei x0 . F¨ ur x nahe bei x0 kann man g(x) als gute Approximation an f (x) auffassen. In Anwendungen ersetzt man deshalb oft die (m¨oglicherweise komplizierte) Funktion f durch ihre lineare Approximation g, welche einfach zu handhaben ist. √
1 −1 1 x 2 = √ . 2 2 x Gesucht ist die lineare Approximation an die Funktion f bei x0 = a. Nach obiger Formel gilt √ √ 1 x ≈ g(x) = a + √ (x − a) 2 a Beispiel 7.18 Sei f (x) =
x = x1/2 , folglich f ′ (x) =
f¨ ur x nahe bei a, beziehungsweise mit h = x − a √ √ 1 a+h≈ a+ √ h 2 a
f¨ ur kleines h.
Setzen wir nun a = 1 und h = 0.1, so erhalten wir die Approximation √
1.1 ≈ 1 +
0.1 = 1.05. 2
Die ersten Stellen des wahren Werts lauten 1.0488... ¨ Physikalische Interpretation als Anderungsrate. In physikalischen ¨ Anwendungen spielt die Ableitung oft die Rolle einer Anderungsrate. Ein bekanntes Beispiel aus dem Alltagsleben ist die Geschwindigkeit, vgl. Abschnitt 7.1. Wir betrachten ein sich geradlinig bewegendes Teilchen. Sei s(t) der vom Teilchen zum Zeitpunkt t eingenommene Ort. Die mittlere Geschwindigkeit errechnet sich dann aus dem Quotienten s(t) − s(t0 ) t − t0
(Wegdifferenz durch Zeitdifferenz).
7.4 Ableitungsregeln
79
Im Grenz¨ ubergang t → t0 ergibt sich aus der Durchschnittsgeschwindigkeit die Momentangeschwindigkeit v(t0 ) =
ds s(t) − s(t0 ) (t0 ) = s(t ˙ 0 ) = lim . t→t0 dt t − t0
Wie eben wird statt f ′ (t) oft f˙(t) geschrieben, falls das Argument der Funktion f die Zeit t ist. Insbesondere in der Physik ist die Schreibweise mit Punkt sehr verbreitet. Ebenso ergibt sich durch Ableitung der Geschwindigkeit die Beschleunigung a(t) = v(t) ˙ = s¨(t). Der Geschwindigkeitsbegriff wird auch in der Modellierung anderer zeitlich variabler Prozesse verwendet, z.B. bei Wachstum oder Zerfall.
7.4 Ableitungsregeln In diesem Abschnitt bezeichnet I ⊂ R ein offenes Intervall. Zun¨achst halten wir fest, dass das Ableiten ein linearer Prozess ist. Satz 7.19 (Linearit¨at der Ableitung) Seien f, g : I → R in x ∈ I differenzierbare Funktionen und sei c ∈ R. Dann sind die Funktionen f + g und c · f in x differenzierbar und es gilt ′ f (x) + g(x) = f ′ (x) + g ′ (x), cf (x))′ = cf ′ (x).
Beweis: Das Resultat folgt aus der Rechenregel f¨ ur Grenzwerte. Die erste Aussage gilt wegen f (x + h) − f (x) g(x + h) − g(x) f (x + h) + g(x + h) − (f (x) + g(x)) + = h h h | {z } | {z } ′ → f (x) → g ′ (x)
f¨ ur h → 0. Die zweite Aussage folgt analog. m ′
m−1
⊓ ⊔
Zusammen mit der Ableitungsregel (x ) = m x f¨ ur Potenzen folgt aus der Linearit¨at, dass jedes Polynom differenzierbar ist. Sei p(x) = an xn + an−1 xn−1 + ... + a1 x + a0 . Dann lautet die Ableitung p′ (x) = nan xn−1 + (n − 1)an−1 xn−2 + ... + a1 . Beispielsweise gilt (3x7 − 4x2 + 5x − 1)′ = 21x6 − 8x + 5.
Die folgenden zwei Regeln gestatten es, die Ableitung zusammengesetzter Funktionen aus ihren Faktoren zu bestimmen.
80
7 Die Ableitung einer Funktion
Satz 7.20 (Produktregel) Seien f, g : I → R in x ∈ I differenzierbare Funktionen. Dann ist die Funktion f · g in x differenzierbar und es gilt ′ f (x) · g(x) = f ′ (x) · g(x) + f (x) · g ′ (x). Beweis: Diese Regel folgt wieder aus den Rechenregeln f¨ ur Grenzwerte
f (x + h) · g(x + h) − f (x) · g(x) = h f (x + h) · g(x + h) − f (x) · g(x + h) f (x) · g(x + h) − f (x) · g(x) = + h h g(x + h) − g(x) f (x + h) − f (x) = · g(x + h) + f (x) · h h {z } | {z } {z } | | → g(x) → f ′ (x) → g ′ (x)
f¨ ur h → 0.
⊓ ⊔
Satz 7.21 (Quotientenregel) Seien f, g : I → R in x ∈ I differenzierbare f Funktionen und gelte g(x) 6= 0. Dann ist die Funktion im Punkt x diffeg renzierbar und es gilt ′ f ′ (x) · g(x) − f (x) · g ′ (x) f (x) = . g(x) g(x)2 Insbesondere ist
1 g(x)
′
=−
g ′ (x) . (g(x))2
Der Beweis ist ¨ahnlich jenem der Produktregel und kann beispielsweise in [2, Kap. 3.1] nachgelesen werden. Beispiel 7.22 Wegen tan x = tan′ x =
sin x gilt cos x
cos2 x + sin2 x 1 = = 1 + tan2 x. 2 cos x cos2 x
Man beachte, dass die Abk¨ urzung cos2 x f¨ ur (cos x)2 und nicht f¨ ur cos(cos x) steht. Komplizierte Funktionen lassen sich oft als Hintereinanderausf¨ uhrung einfacherer Funktionen schreiben. Beispielsweise kann die Funktion p h : [1, ∞) → R : x 7→ h(x) = log(x − 1)
aufgefasst werden als h(x) = f (g(x)) mit √ g : [1, ∞) → [0, ∞) : x 7→ log(x − 1). f : [0, ∞) → R : y 7→ y,
Man bezeichnet diese Hintereinanderausf¨ uhrung auch als Verkettung, Schachtelung oder Komposition von Funktionen. Der folgende Satz sagt, wie solche Verkettungen zu differenzieren sind.
7.4 Ableitungsregeln
81
Satz 7.23 (Kettenregel) Die Hintereinanderausf¨ uhrung zweier differenzierbarer Funktionen g : I → B und f : B → R ist ebenfalls differenzierbar und es gilt d f (g(x)) = f ′ (g(x)) · g ′ (x). dx In Kurzschreibweise lautet die Regel (f ◦ g)′ = (f ′ ◦ g) · g ′ . Beweis: Wir schreiben f (g(x + h)) − f (g(x)) 1 f (g(x + h)) − f (g(x)) = h g(x + h) − g(x) f (g(x) + k) − f (g(x)) = k
g(x + h) − g(x) h g(x + h) − g(x) · , h ·
wobei der Ausdruck k = g(x + h) − g(x) wegen der Deutung als lineare Approximation (vgl. Kap. 7.3) von der Form k = g ′ (x)h + R(x + h, x) ist und daher mit h → 0 selbst gegen Null geht. Es folgt 1 d f (g(x + h)) − f (g(x)) f (g(x)) = lim h→0 h dx f (g(x) + k) − f (g(x)) g(x + h) − g(x) = lim · h→0 k h = f ′ (g(x)) · g ′ (x)
und damit die Behauptung des Satzes.
⊓ ⊔
Die Differentiation einer geschachtelten Funktion h(x) = f (g(x)) geschieht demnach in drei Schritten: 1. Identifikation der ¨ außeren Funktion f und der inneren Funktion g mit h(x) = f (g(x)). 2. Ableiten der ¨ außeren Funktion f an der Stelle g(x), das heißt, man berechnet f ′ (y) und setzt y = g(x) ein. Das Ergebnis ist f ′ (g(x)). 3. Nachdifferenzieren: Ableiten der inneren Funktion g und Multiplikation mit dem Ergebnis aus Schritt 2. Man erh¨alt h′ (x) = f ′ (g(x)) · g ′ (x). Bei mehrfacher Schachtelung ist entsprechend oft nachzudifferenzieren. Beispiel 7.24 (a) Sei h(x) = (sin x)3 . Wir identifizieren als ¨außere Funktion f (y) = y 3 und als innere Funktion g(x) = sin x. Damit ist h′ (x) = 3 (sin x)2 · cos x.
82
7 Die Ableitung einer Funktion 2
(b) Sei h(x) = e−x . Wir identifizieren f (y) = ey , g(x) = −x2 . Damit ist 2
h′ (x) = e−x · (−2x). Als letzte Ableitungsregel besprechen wir die Differentiation der Umkehrfunktion einer differenzierbaren Funktion. Satz 7.25 (Umkehrregel) Es sei f : I → J bijektiv, differenzierbar und es gelte f ′ (y) 6= 0 f¨ ur alle y ∈ I. Dann ist f −1 : J → I ebenfalls differenzierbar und es gilt d −1 1 f (x) = ′ −1 . dx f (f (x)) In Kurzschreibweise lautet die Umkehrregel ′ 1 f −1 = ′ . f ◦ f −1
Beweis: Wir setzen y = f −1 (x) und η = f −1 (ξ). Wegen der Stetigkeit der Umkehrfunktion (vgl. Satz C.3) gilt η → y mit ξ → x. Somit folgt η−y f −1 (ξ) − f −1 (x) d −1 f (x) = lim = lim η→y f (η) − f (y) ξ→x dx ξ−x −1 f (η) − f (y) 1 1 = lim = ′ −1 = ′ η→y η−y f (y) f (f (x))
und damit die Behauptung des Satzes.
⊓ ⊔
Abb. 7.4 zeigt den geometrischen Hintergrund der Umkehrregel: Der Anstieg einer Geraden in x-Richtung ist der Kehrwert des Anstiegs in y-Richtung. y = f −1 (x)
1 = f ′ (y) k
1/k 1 y
k
1
k = (f −1 )′ (x)
1 x
x = f (y)
1
Abb. 7.4. Ableitung der Umkehrfunktion mit Detailansicht der Steigungsdreiecke.
Wenn man bereits weiß, dass die Umkehrfunktion differenzierbar ist, kann man auch die Identit¨at x = f (f −1 (x)) mittels Kettenregel nach x ableiten. Das liefert 1 = f ′ (f −1 (x)) · (f −1 )′ (x)
und man erh¨alt die Umkehrregel nach Division durch f ′ (f −1 (x)).
7.4 Ableitungsregeln
83
Beispiel 7.26 (Ableitung des Logarithmus) Da y = log x die Umkehrfunktion zu x = ey ist, folgt aus der Umkehrregel: ′ log x =
f¨ ur x > 0. Ferner ist
log |x| =
(
1 1 = elog x x
log x, log (−x) ,
x>0 x<0
und damit ′ 1 ′ log x = x , log |x| = ′ log (−x) =
x>0 1 1 · (−1) = , (−x) x
x < 0.
Insgesamt gilt also
′ 1 log |x| = x F¨ ur Logarithmen zur Basis a gilt: loga x =
log x , log a
also
f¨ ur x 6= 0. ′ loga x =
1 . x log a
Beispiel 7.27 (Ableitung der allgemeinen Potenzfunktion) Wegen xa = ea log x ist nach der Kettenregel xa
′
= ea log x ·
a a = xa · = a xa−1 . x x
Beispiel 7.28 (Ableitung der allgemeinen Exponentialfunktion) F¨ ur a > 0 gilt ax = ex log a und daher nach der Kettenregel ′ ′ ax = ex log a = ex log a · log a = ax log a.
Beispiel 7.29 F¨ ur x > 0 ist xx = ex log x und daher ′ x = xx (log x + 1) . xx = ex log x log x + x
Beispiel 7.30 (Ableitungen der zyklometrischen Funktionen) Wir erinnern, dass auf den entsprechenden Definitionsbereichen der Hauptzweige gilt: p π π (sin x)′ = cos x = 1 − sin2 x, − ≤x≤ , 2 2 p ′ 2 0 ≤ x ≤ π, (cos x) = − sin x = − 1 − cos x, π π ′ 2 (tan x) = 1 + tan x, − <x< . 2 2
84
7 Die Ableitung einer Funktion
Somit folgt aus der Umkehrregel: (arcsin x)′ = q
1 1 − sin2 (arcsin x)
=√
1 , 1 − x2
−1 < x < 1,
−1 1 , = −√ 1 − x2 1 − cos2 (arccos x) 1 1 (arctan x)′ = , = 1 + x2 1 + tan2 (arctan x) (arccos x)′ = p
−1 < x < 1, −∞ < x < ∞.
Die Ableitungen der wichtigsten elementaren Funktionen sind in Tabelle 7.1 zusammengefasst. Die Formeln gelten auf den jeweiligen Definitionsbereichen. Tabelle 7.1. Die Ableitung der elementaren Funktionen.
f (x)
a
xa
ex
ax
log |x|
loga x
f ′ (x)
0
a xa−1
ex
ax log a
1 x
1 x log a
f (x)
sin x
cos x
tan x
arcsin x
arccos x
arctan x
f ′ (x)
cos x
− sin x 1 + tan2 x √
1 −1 √ 2 1−x 1 − x2
1 1 + x2
7.5 Numerische Ableitung In den Anwendungen kommt es oft vor, dass eine Funktion zwar f¨ ur beliebige Argumente ausgewertet werden kann, aber keine analytische Formel bekannt ist, welche die Funktionsvorschrift beschreibt. Diese Situation tritt beispielsweise ein, wenn die abh¨angige Gr¨oße mit einem Messger¨at bestimmt wird, z.B. die Helligkeit an einem Ort als Funktion der Zeit. Die Definition der Ableitung als Grenzwert von Differenzenquotienten legt nahe, die Ableitung solcher Funktionen durch einen geeigneten Differenzenquotienten f (a + h) − f (a) f ′ (a) ≈ h zu approximieren. Die Frage ist nun, wie klein man h dabei w¨ahlen soll. Um das zu entscheiden, machen wir zun¨achst einen numerischer Versuch.
7.5 Numerische Ableitung
85
Tabelle 7.2. Numerische Differentiation der Exponentialfunktion bei a = 1 mittels einseitigem Differenzenquotienten. Die numerischen Ergebnisse und Fehler sind als Funktion von h angegeben. h
Wert
Fehler
1.000E-000 1.000E-001 1.000E-002 1.000E-003 1.000E-004 1.000E-005 1.000E-006 1.000E-007 1.000E-008 1.000E-009 1.000E-010 1.000E-011 1.000E-012 1.000E-013 1.000E-014 1.000E-015 1.000E-016
4.67077427047160 2.85884195487388 2.73191865578714 2.71964142253338 2.71841774708220 2.71829541994577 2.71828318752147 2.71828196740610 2.71828183998415 2.71828219937549 2.71828349976758 2.71829650802524 2.71866817252997 2.71755491373926 2.73058485544819 3.16240089670572 1.44632569809566
1.95249244201256E-000 1.40560126414838E-001 1.36368273280976E-002 1.35959407433051E-003 1.35918623152431E-004 1.35914867218645E-005 1.35906242526573E-006 1.38947053418548E-007 1.15251088672608E-008 3.70916445113778E-007 1.67130853068187E-006 1.46795661959409E-005 3.86344070924416E-004 -7.26914719783700E-004 1.23030269891471E-002 4.44119068246674E-001 -1.27195613036338E-000
Experiment 7.31 Gegeben sei f (x) = ex und der Punkt a = 1. Berechnen Sie mit Hilfe der obiger N¨ aherungsformel Approximationen an die Ableitung f ′ (a) f¨ ur verschiedenes h, beispielsweise f¨ ur h = 10−j mit j = 0, 1, . . . , 16. Man erwartet als Resultat einen Wert nahe bei e = 2.71828... Typische Ergebnisse des Versuchs sind in Tabelle 7.2 zusammengefasst.
Man erkennt, dass der Fehler mit h zun¨ achst kleiner wird, f¨ ur kleines h schließlich wieder gr¨oßer. Der Grund daf¨ ur liegt in der endlichen Stellenzahl des Computers. Der Versuch wurde in IEEE double precision durchgef¨ uhrt, was einer relativen Maschinengenauigkeit von eps ≈ 10−16 entspricht. Der Versuch zeigt, dass man das beste Resultat f¨ ur √ h ≈ eps ≈ 10−8 erh¨alt. Man kann dieses Verhalten mittels Taylorreihenentwicklung erkl¨aren. Wir werden im Kap. 12 folgende Formel herleiten h2 ′′ f (ξ), 2 wobei ξ eine unbekannte Stelle zwischen a und a + h bezeichnet. Somit gilt nach Umformung f (a + h) = f (a) + hf ′ (a) +
f (a + h) − f (a) h ′′ − f (ξ). h 2 Der Verfahrensfehler , d.h. der Fehler der durch Ersetzen der Ableitung durch den Differenzenquotienten entsteht, ist proportional zu h und nimmt linear f ′ (a) =
86
7 Die Ableitung einer Funktion
mit h ab. Dieses Verhalten sieht man auch im numerischen Versuch f¨ ur h zwischen 10−2 und 10−8 . F¨ ur sehr kleines h kommen zus¨ atzlich noch die Rundungsfehler ins Spiel. Wie wir im Abschnitt 1.4 sahen, wird an Stelle von f (a) am Computer der Ausdruck rd(f (a)) = f (a) · (1 + ε) = f (a) + εf (a) mit |ε| ≤ eps berechnet. Der am Computer berechnete Differenzenquotient unterscheidet sich vom exakten daher durch einen Term der Gr¨oßenordnung eps/h. Der Rundungsfehler ist also proportional zu eps/h und nimmt f¨ ur kleine h dramatisch zu. Dieses Verhalten sieht man im numerischen Versuch f¨ ur h zwischen 10−8 und 10−16 . Das Resultat der numerischen Ableitung mittels einseitigem Differenzenquotienten f (a + h) − f (a) f ′ (a) ≈ h ist dann am genauesten, wenn Verfahrensfehler und Rundungsfehler ungef¨ahr gleich groß sind, wenn also h≈
eps h
bzw.
h≈
√ eps ≈ 10−8 .
Um die Ableitung von f ′ (a) zu berechnen, k¨onnte man auch eine symmetrisch um a gelegene Sekante verwenden y = f (x)
f (a + h) − f (a − h) h→0 2h
f ′ (a) = lim
Das legt die symmetrische Formel f ′ (a) ≈
f (a + h) − f (a − h) 2h
a−h
a
a+h
nahe. Diese Approximation heißt symAbb. 7.5. Approximation der Tanmetrischer Differenzenquotient. Um die gente durch symmetrische Sekante. Genauigkeit der N¨aherung zu analysieren, ben¨otigen wir wieder die Taylorreihe aus Kap. 12: f (a + h) = f (a) + hf ′ (a) +
h2 ′′ h3 f (a) + f ′′′ (a) + ... 2 6
Ersetzt man in dieser Formel h durch −h f (a − h) = f (a) − hf ′ (a) +
h3 h2 ′′ f (a) − f ′′′ (a) + ... 2 6
und bildet die Differenz, so erh¨alt man f (a + h) − f (a − h) = 2hf ′ (a) + 2
h3 ′′′ f (a) + ... 6
7.5 Numerische Ableitung
87
und weiters f ′ (a) =
f (a + h) − f (a − h) h2 ′′′ − f (a) + ... 2h 6
Der Verfahrensfehler ist in diesem Fall also proportional zu h2 , w¨ahrend der Rundungsfehler nach wie vor proportional zu eps/h ist. Das symmetrische Verfahren liefert somit die besten Resultate f¨ ur h2 ≈
eps h
bzw.
h≈
√ 3
eps.
Wir wiederholen Experiment 7.31 mit f (x) = ex , a = 1 und h = 10−j f¨ ur j = 0, ..., 12. Die Ergebnisse sind in Tabelle 7.5 zusammengefasst. Tabelle 7.3. Numerische Differentiation der Exponentialfunktion bei a = 1 mittels symmetrischem Differenzenquotienten. Die numerischen Ergebnisse und Fehler sind als Funktion von h angegeben. h
Wert
Fehler
1.000E-000 1.000E-001 1.000E-002 1.000E-003 1.000E-004 1.000E-005 1.000E-006 1.000E-007 1.000E-008 1.000E-009 1.000E-010 1.000E-011 1.000E-012
3.19452804946533 2.72281456394742 2.71832713338270 2.71828228150582 2.71828183298958 2.71828182851255 2.71828182834134 2.71828182903696 2.71828181795317 2.71828182478364 2.71828199164235 2.71829103280427 2.71839560410381
4.76246221006280E-001 4.53273548837307E-003 4.53049236583958E-005 4.53046770765297E-007 4.53053283777649E-009 5.35020916458961E-011 -1.17704512803130E-010 5.77919490041268E-010 -1.05058792776447E-008 -3.67540575751946E-009 1.63183308643511E-007 9.20434522511116E-006 1.13775644761560E-004
Erwartungsgem¨aß erh¨alt man das beste Resultat f¨ ur h ≈ 10−5 . Der erhaltene N¨aherungswert ist auch genauer als vorher. Da symmetrische Verfahren im Allgemeinen bessere Resultate liefern, ist Symmetrie ein wichtiges Konzept der numerischen Mathematik. Numerische Ableitung verrauschter Funktionen. In der Praxis tritt oft der Fall ein, dass die zu differenzierende Funktion aus diskreten Daten besteht, die zudem mit einem Rauschen u ¨berlagert sind. Das Rauschen repr¨asentiert kleine Messfehler und verh¨alt sich statistisch wie Zufallszahlen. Beispiel 7.32 Digitalisierung einer Zeile eines Bilds durch J + 1 Pixel ergibt eine Funktion f : {0, 1, ..., J} → R : j 7→ f (j) = fj = Helligkeit des j-ten Pixels.
88
7 Die Ableitung einer Funktion
Um eine Kante im Bild zu finden, an der sich die Helligkeit lokal stark ¨andert, wird diese Funktion differenziert. Betrachten wir ein konkretes Beispiel. Die Bildinformation bestehe aus der Funktion g : [a, b] → R : x 7→ g(x) = −2x3 + 4x mit a = −2 und b = 2. Sei ∆x der Abstand zweier Pixel und bezeichne J=
b−a ∆x
die gesamte Pixelzahl weniger 1. Wir w¨ahlen ∆x = 1/200 und erhalten somit J = 800. Die wahre Helligkeit des j-ten Pixels w¨are dann gj = g(a + j∆x),
0 ≤ j ≤ J.
Das Messger¨at liefert auf Grund von Messfehlern jedoch fj = gj + εj , wobei εj Zufallszahlen sind. Wir w¨ahlen f¨ ur εj normalverteilte Zufallszahlen mit Erwartungswert 0 und Varianz 2.5 · 10−5 , vgl. Abb. 7.6. F¨ ur eine genaue Definition der Begriffe Erwartungswert und Varianz verweisen wir auf die weiter f¨ uhrende Literatur, beispielsweise [18]. 0.02
120
0.01
90
0
60
−0.01
30
−0.02 −2
−1
0
1
2
0 −0.02
0
0.02
Abb. 7.6. Das linke Bild zeigt zuf¨ alliges Rauschen, welches u ¨ber den Daten liegt. Das Rauschen wird durch 801 normalverteilte Zufallszahlen modelliert. Die H¨ aufigkeiten der gew¨ ahlten Zufallszahlen sind dem rechten Bild zu entnehmen. Zum Vergleich ist dort die (skalierte) Dichte der entsprechenden Normalverteilung eingetragen.
Diese Zufallszahlen k¨onnen in MATLAB mit dem Befehl randn(1,801)*sqrt(2.5e-5) erzeugt werden. Wenn wir nun f mit Hilfe der vorigen Regel differenzieren, also gj − gj−1 εj − εj−1 fj − fj−1 = + fj′ ≈ ∆x ∆x ∆x
¨ 7.6 Ubungen
89
bilden, so liefert der Anteil mit g den gew¨ unschten Wert der Ableitung, n¨ amlich gj − gj−1 g(a + j∆x) − g(a + j∆x − ∆x) = ∆x ∆x
≈ g ′ (a + j∆x).
Die Folge der Zufallszahlen ergibt einen nicht differenzierbaren Graphen. Der Ausdruck εj − εj−1 ∆x ist proportional zu J ·max0≤j≤J |εj |. Die Fehler werden f¨ ur großes J dominant, siehe Abb. 7.7, linkes Bild. 10 5
10
f
0 −5 −10 −2
5
0
0
−5
f′ 0
2
10
5 f
−10 −2
−5
f′ 0
2
f
f′
−10 −2
0
2
Abb. 7.7. Numerische Ableitung einer verrauschten Funktion f , bestehend aus 801 Datenpunkten (links); Ableitung derselben Funktion nach Filterung mit einem Gauß-Filter (Mitte) und nach Gl¨ attung mit Splines (rechts).
Um dennoch zu brauchbaren Ergebnissen zu kommen, m¨ ussen die Daten vor der Ableitung gegl¨attet werden. Die einfachste Methode ist eine so genannte Faltung mit einem Gauß-Filter, was einer gewichteten Mittelwertbildung der Daten entspricht (Abb. 7.7, Mitte). Alternativ k¨onnen auch Splines zum Gl¨atten verwendet werden, beispielsweise die Routine csaps von MATLAB. F¨ ur das rechte Bild von Abb. 7.7 wurde diese Methode verwendet. Experiment 7.33 Erzeugen Sie mit dem MATLAB -Programm mat07_1.m obige Abb. 7.7 und untersuchen Sie den Einfluss der Zufallszahlen und des Gl¨ attungsparameters in csaps auf das Ergebnis.
¨ 7.6 Ubungen 1. Berechnen Sie die erste Ableitung der Funktionen 1 1 , h(x) = cos x, k(x) = √ , t2 x mit Hilfe der Definition der Ableitung als Grenzwert. f (x) = x3 ,
g(t) =
ℓ(t) = tan t
90
7 Die Ableitung einer Funktion
2. Berechnen Sie die erste Ableitung der Funktionen a(x) =
x2
x2 − 1 , + 2x + 1
2
b(t) = t2 ecos(t +1) , p d(s) = log s + 1 + s2 .
c(x) = x2 sin x ,
¨ Uberpr¨ ufen Sie Ihre Resultate mit maple . √ √ 3. Berechnen Sie eine N¨ aherung an 34, indem Sie die Funktion f (x) = x bei x = 36 durch ihre lineare Approximation ersetzen. Wie genau ist Ihr Resultat? 1+x unterscheiden 4. Zeigen Sie: Die Funktionen f (x) = arctan x und g(x) = arctan 1−x sich auf (−∞, 1) und auf (1, ∞) nur durch jeweils eine Konstante. Berechnen Sie diese Konstanten.
5. Von einem F¨ orderband fließt mit der Geschwindigkeit 2m3 /min Sand auf eine Halde. Der Sand bildet einen kegelf¨ ormigen Haufen, dessen H¨ ohe gleich 34 des Radius ist. Mit welcher Geschwindigkeit w¨ achst der Radius, wenn der Sandkegel einen Durchmesser von 6m hat? Hinweis: Bestimmen Sie das Volumen V als Funktion des Radius r, fassen Sie V und r als Funktionen der Zeit t auf und differenzieren Sie die Gleichung nach t. Gesucht ist r. ˙ 6. Leiten Sie aus der Taylorreihe y(x + h) = y(x) + hy ′ (x) +
h2 ′′ h3 ′′′ h4 (4) y (x) + y (x) + y (x) + ... 2 6 24
die Formel y ′′ (x) =
y(x + h) − 2y(x) + y(x − h) h2 (4) − y (x) + ... 2 h 12
her und lesen Sie daraus ein numerisches Verfahren zur Berechnung der zweiten Ableitung ab. Der Verfahrensfehler ist proportional zu h2 , der Rundungsfehler ist proportional zu eps/h2 . Folgern Sie aus Verfahrensfehler ≈ Rundungsfehler die op¨ timale Schrittweite h und u ufen Sie Ihre Uberlegungen durch ein numerisches ¨berpr¨ Experiment in MATLAB , indem Sie die zweite Ableitung von y(x) = e2x an der Stelle x = 1 berechnen. 7. Schreiben Sie ein MATLAB -Programm, das eine gegebene Funktion auf einem gegebenen Intervall numerisch differenziert und das die Funktion und ihre erste Ableitung zeichnet. Testen Sie Ihr Programm an den Funktionen f (x) = cos x, und
g(x) = e− cos(3x) ,
0 ≤ x ≤ 6π 0 ≤ x ≤ 2.
8 Anwendungen der Ableitung
Dieses Kapitel ist einigen Anwendungen der Ableitung gewidmet, deren Kenntnis zu den Grundfertigkeiten der Modellbildung geh¨ oren. Wir beginnen mit der Kurvendiskussion. Gemeint ist damit die Beschreibung von geometrischen Eigenschaften von Funktionsgraphen mit Hilfe der Ableitung. Wenn auch das Plotten von Funktionen mit MATLAB oder maple einfach ist, so ist doch das Verst¨ andnis des Zusammenhangs mit Ableitungskonzepten wichtig, zum Beispiel, wenn zur Modellierung eine Funktion mit vorgegebenen Eigenschaften aus einer Funktionenklasse ausgew¨ ahlt werden soll. Im darauf folgenden Abschnitt besprechen wir das Newtonverfahren und das Konzept der Konvergenzordnung. Das Newtonverfahren stellt eine der wichtigsten N¨ aherungsmethoden zur numerischen Berechnung von Nullstellen dar und ist nahezu universell in Verwendung. Im letzten Abschnitt werfen wir einen ersten Blick auf Methoden der Datenanalyse. Wir leiten die Berechnung der Regressionsgeraden durch den Ursprung her. Das in zahlreichen Anwendungsgebieten ben¨ otigte Thema der linearen Regression behandeln wir ausf¨ uhrlich in Kap. 18.
8.1 Kurvendiskussion Im Folgenden untersuchen wir einige geometrische Eigenschaften von Funktionsgraphen mit Hilfe der Ableitung: Maxima/Minima, Monotoniebereiche, Konvexit¨at und formulieren den beweistechnisch wichtigen Mittelwertsatz. Definition 8.1 Eine Funktion f : [a, b] → R hat in x0 ∈ [a, b]
(a) ein globales Maximum, falls gilt
f (x) ≤ f (x0 ) f¨ ur alle x ∈ [a, b]; (b) ein lokales Maximum, falls es eine Umgebung Uε (x0 ) gibt, sodass gilt f (x) ≤ f (x0 ) f¨ ur alle x ∈ Uε (x0 ) ∩ [a, b].
92
8 Anwendungen der Ableitung
Das Maximum heißt strikt, wenn sogar f (x) < f (x0 ) ist f¨ ur x 6= x0 . Der Punkt x0 wird auch als Maximalstelle von f bezeichnet. Die Definition f¨ ur Minimum und Minimalstelle ist analog unter Umkehrung der Ungleichungen. Abb. 8.1 zeigt einige der m¨oglichen Situationen. y
glob.Max. lok.Max. lok.Max. lok.Min.
x
glob.Min.
a
b
Abb. 8.1. Minima und Maxima einer Funktion (nach [2]).
F¨ ur Punkte x0 im Inneren von [a, b] hat man im Falle differenzierbarer Funktionen ein einfaches notwendiges Kriterium: Satz 8.2 Es sei x0 ∈ (a, b) und f differenzierbar in x0 . Falls f in x0 ein lokales Maximum oder Minimum besitzt, so ist f ′ (x0 ) = 0. Beweis: Wegen der Differenzierbarkeit von f ist f ′ (x0 ) = lim
h→0+
f (x0 + h) − f (x0 ) f (x0 + h) − f (x0 ) = lim . h→0− h h
Im Falle des Maximums gilt f¨ ur die Sekantensteigung f (x0 + h) − f (x0 ) < 0, h f (x0 + h) − f (x0 ) > 0, h
falls h > 0 ist, falls h < 0 ist.
Folglich muss der Grenzwert f ′ (x0 ) sowohl gr¨oßer gleich als auch kleiner gleich Null sein, also ist notwendigerweise f ′ (x0 ) = 0. ⊓ ⊔
Die Funktion f (x) = x3 , deren Ableitung in x = 0 verschwindet, zeigt, dass die Bedingung des Satzes nicht hinreichend f¨ ur das Vorliegen eines Maximums oder Minimums ist.
Die geometrische Aussage des Satzes ist, dass im Falle der Differenzierbarkeit der Funktionsgraph bei einem Maximum oder Minimum eine horizontale Tangente besitzt. Ein Punkt x0 ∈ (a, b) mit f ′ (x0 ) = 0 wird als station¨ arer Punkt bezeichnet.
8.1 Kurvendiskussion
93
Bemerkung 8.3 Der Satz zeigt, dass zur Bestimmung der Maxima und Minima einer Funktion f : [a, b] → R folgende Punktmengen abzusuchen sind: (a) Die Randpunkte x0 = a, x0 = b; (b) Punkte x0 ∈ (a, b), in denen f nicht differenzierbar ist; (c) Punkte x0 ∈ (a, b), in denen f differenzierbar ist und f ′ (x0 ) = 0 gilt. Der folgende Satz ist ein n¨ utzliches beweistechnisches Hilfsmittel. Eine seiner bedeutenden Anwendungen liegt in der Fehlerabsch¨atzung numerischer Verfahren. Da der Beweis in ¨ ahnlicher Weise wie beim Zwischenwertsatz auf der Vollst¨andigkeit der reellen Zahlen beruht, geben wir ihn hier nicht an, sondern verweisen auf die weiter f¨ uhrende Literatur, etwa [2, Kap. 3.2.2]. Satz 8.4 (Mittelwertsatz) Sei f stetig auf [a, b] und differenzierbar auf (a, b). Dann existiert ein ξ ∈ (a, b), sodass gilt: f (b) − f (a) = f ′ (ξ). b−a Das heißt geometrisch, dass im Punkte ξ die Tangente denselben Anstieg wie die Sekante durch (a, f (a)), (b, f (b)) besitzt. Abb. 8.2 legt diesen Sachverhalt klar. y f (b)
f (a) a
ξ
b
x
Abb. 8.2. Zum Mittelwertsatz.
Wir wenden uns nun der Beschreibung des Steigungsverhaltens von differenzierbaren Funktionen zu. Definition 8.5 Eine Funktion f : I → R heißt monoton wachsend, wenn f¨ ur alle x1 , x2 ∈ I gilt: x1 < x2 ⇒ f (x1 ) ≤ f (x2 ). Die Funktion f heißt streng monoton wachsend, wenn gilt: x1 < x2
⇒
f (x1 ) < f (x2 ).
Eine analoge Definition wird f¨ ur monoton fallend mit Umkehrung der jeweils zweiten Ungleichung vorgenommen. Beispiele f¨ ur streng monoton wachsende Funktionen sind die Potenzfunktionen x 7→ xn mit ungerader Hochzahl
94
8 Anwendungen der Ableitung
n; eine monoton, aber nicht streng monoton wachsende Funktion ist etwa die Vorzeichenfunktion x 7→ sign x. Das Steigungsverhalten einer differenzierbaren Funktion kann mit dem Vorzeichen der ersten Ableitung beschrieben werden. Satz 8.6 F¨ ur differenzierbare Funktionen f : (a, b) → R gilt: (a)
f ′ ≥ 0 auf (a, b) f ′ > 0 auf (a, b)
(b)
f ′ ≤ 0 auf (a, b) f ′ < 0 auf (a, b)
⇔ ⇒
⇔ ⇒
f ist monoton wachsend; f ist streng monoton wachsend. f ist monoton fallend; f ist streng monoton fallend.
Beweis: (a) Nach dem Mittelwertsatz ist f (x2 )−f (x1 ) = f ′ (ξ)(x2 −x1 ) f¨ ur ein ξ ∈ (a, b). Ist x1 < x2 und f ′ (ξ) ≥ 0, so ist f (x2 ) − f (x1 ) ≥ 0. Ist f ′ (ξ) > 0, so ist f (x2 ) − f (x1 ) > 0. Umgekehrt ist f ′ (x) = lim
h→0
f (x + h) − f (x) ≥ 0, h
wenn f wachsend ist. Der Beweis von (b) geht ebenso.
⊓ ⊔
3
Bemerkung 8.7 Das Beispiel f (x) = x zeigt, dass f streng monoton wachsend sein kann, auch wenn in einzelnen Punkten f ′ = 0 ist. Satz 8.8 (Kriterium f¨ ur lokale Extremwerte) Sei f differenzierbar auf (a, b), x0 ∈ (a, b) und f ′ (x0 ) = 0. Dann gilt: f ′ (x) > 0 f¨ ur x < x0 (a) ⇒ f hat lokales Maximum in x0 f ′ (x) < 0 f¨ ur x > x0 f ′ (x) < 0 f¨ ur x < x0 (b) ⇒ f hat lokales Minimum in x0 . f ′ (x) > 0 f¨ ur x > x0 Beweis: Der Beweis ergibt sich aus dem vorigen Satz, der das Monotonieverhalten charakterisierte, wie durch Abb. 8.3 erl¨autert. ⊓ ⊔
y
f ′ (x0 ) = 0 f′ < 0
f′ >0 x0
x
Abb. 8.3. Lokales Maximum.
Bemerkung 8.9 (Das Kr¨ ummungsverhalten eines Funktionsgraphen) Ist in einem Bereich f ′′ > 0, so w¨achst dort f ′ monoton an. Daher ist der Graph von f linksgekr¨ ummt oder konvex. Ist umgekehrt f ′′ < 0, so f¨allt f ′ monoton und der Graph von f ist rechtsgekr¨ ummt oder konkav (vgl. Abb. 8.4). Eine quantitative Beschreibung der Kr¨ ummung eines Funktionsgraphen werden wir im Abschnitt 14.1 vornehmen. Sei x0 ein Punkt, in dem f ′ (x0 ) = 0 ist. Falls f ′ sein Vorzeichen bei x0 nicht ¨andert, so liegt ein Wendepunkt vor; hier wechselt f von positiver zu negativer Kr¨ ummung oder umgekehrt.
8.1 Kurvendiskussion
95
Satz 8.10 (Kriterium f¨ ur lokale Extremwerte mit zweiter Ableitung) Sei f zweimal stetig differenzierbar auf (a, b), x0 ∈ (a, b) und f ′ (x0 ) = 0. (a) Falls f ′′ (x0 ) > 0 ist, so hat f ein lokales Minimum bei x0 . (b) Falls f ′′ (x0 ) < 0 ist, so hat f ein lokales Maximum bei x0 .
Beweis: (a) Da f ′′ stetig ist, ist f ′′ (x) > 0 f¨ ur alle x aus einer Umgebung von x0 . Nach Satz 8.6 ist daher f ′ streng monoton wachsend in dieser Umgebung. Wegen f ′ (x0 ) = 0 heißt das, dass f ′ (x0 ) < 0 ist f¨ ur x < x0 und f ′ (x) > 0 ist f¨ ur x > x0 ; nach dem Kriterium f¨ ur lokale Extremwerte liegt ein Minimum vor. (b) zeigt man ebenso. ⊓ ⊔
f ′′ (x0 ) = 0 f
′′
f ′′ > 0
<0
f ′′ > 0 f
x0
x
′′
<0 x0
x
Abb. 8.4. Kr¨ ummungsverhalten und zweite Ableitung.
Bemerkung 8.11 Falls f ′′ (x0 ) = 0 ist, kann sowohl ein Wendepunkt als auch ein Minimum oder Maximum vorliegen. Die Funktionen f (x) = xn , n = 2, 3, 4... zeigen, dass es darauf ankommt, f¨ ur welches n die n-te Ableitung erstmals verschieden von Null ist – n gerade oder n ungerade. Dies kann sehr einfach mit Hilfe der Taylorentwicklung entschieden werden. Das darauf beruhende Extremwertkriterium besprechen wir in Anwendung 12.14. Eine der Anwendungen der vorigen S¨ atze ist die Kurvendiskussion, das ist die Feinuntersuchung des Verlaufes des Graphen einer Funktion mit Mitteln der Differentialrechnung. Wenn Kurven auch leicht in MATLAB oder maple geplottet werden k¨ onnen, so ist es doch h¨ aufig n¨otig, den graphischen Output an kritischen Stellen mit analytischen Methoden zu u ufen. ¨berpr¨ Experiment 8.12 Plotten Sie die Funktion y = x(sign x − 1)(x + 1)3 + sign(x − 1) + 1 (x − 2)4 − 1/2
auf dem Intervall −2 ≤ x ≤ 3 und versuchen Sie, die lokalen und globalen Ex¨ tremwerte, die Wendepunkte und das Monotonieverhalten abzulesen. Uberpr¨ ufen Sie Ihre Beobachtungen mit Hilfe der oben diskutierten Kriterien.
Eine weitere Anwendung der vorigen S¨ atze ist die L¨osung von Extremwertaufgaben oder eindimensionalen Optimierungsaufgaben. Wir illustrieren dieses Thema mit einem Standardbeispiel. Beispiel 8.13 Welches Rechteck gegebenen Umfangs besitzt den gr¨oßten Fl¨acheninhalt? Zur L¨ osung bezeichnen wir die L¨angen der Rechteckseiten mit x und y. Dann gilt f¨ ur den Umfang und den Fl¨acheninhalt
96
8 Anwendungen der Ableitung
U = 2x + 2y,
F = xy.
Da U vorgegeben ist, erhalten wir y = U/2 − x, also F = x(U/2 − x), wobei x im Bereich 0 ≤ x ≤ U/2 variieren kann. Gesucht ist also das Maximum der Funktion F auf dem Intervall [0, U/2]. Da F differenzierbar ist, m¨ ussen wir nur die Randpunkte und die station¨aren Punkte untersuchen. In den Randpunkten x = 0 und x = U/2 ist jeweils F (0) = 0 und F (U/2) = 0. Die station¨aren Punkte erhalten wir durch Nullsetzen der Ableitung F ′ (x) = U/2 − 2x = 0, was auf x = U/4 f¨ uhrt mit Funktionswert F (U/4) = U 2 /16. Als Ergebnis erkennen wir, dass das Fl¨ achenmaximum bei x = U/4 vorliegt, also im Falle eines Quadrates. Experiment 8.14 Gehen Sie in mathe online zu Galerie – Anwendungen der Differentialrechnung und ¨ offnen Sie das Applet Schema einer Extremwertaufgabe. Es geht hier um die Maximierung des Fl¨ acheninhaltes eines einem Dreieck eingeschrie¨ benen Rechtecks. Studieren Sie die Ubersetzung der geometrischen Fragestellung in eine Aufgabe der Differentialrechnung und Kurvendiskussion. Skizzieren Sie den Zusammenhang Geometrie – Analysis in analoger Weise f¨ ur Beispiel 8.13 oben.
8.2 Das Newtonverfahren Mit Hilfe der Methoden der Differentialrechnung k¨onnen effiziente numerische Verfahren zur Berechnung von Nullstellen differenzierbarer Funktionen konstruiert werden. Eines der grundlegenden Verfahren ist das Newtonverfahren1 , das in diesem Abschnitt f¨ ur den Fall reellwertiger Funktionen f : D ⊂ R → R diskutiert werden soll. Erinnern wir uns zun¨ achst an das im Abschnitt 6.3 diskutierte Bisektionsverfahren. Hat man f¨ ur eine stetige, reellwertige Funktion f ein Intervall [a, b] gefunden mit f (a) < 0, f (b) > 0 oder
f (a) > 0, f (b) < 0
so erreicht man durch fortgesetzte Halbierung des Intervalls eine Nullstelle ξ von f : a = a1 ≤ a2 ≤ a3 ≤ . . . ≤ ξ ≤ . . . ≤ b3 ≤ b2 ≤ b1 = b, wobei gilt: |bn+1 − an+1 | = 1
1 1 1 |bn − an | = |bn−1 − an−1 | = . . . = n |b1 − a1 |. 2 4 2
I. Newton, 1642–1727.
8.2 Das Newtonverfahren
97
Bricht man also das Verfahren nach n Schritten ab und w¨ahlt an oder bn als N¨ aherung f¨ ur ξ, so erh¨ alt man als garantierte Fehlerschranke |Fehler| ≤ ϕ(n) = |bn − an |. Insbesondere ist hier
1 ϕ(n) 2 erf¨ ullt, der Fehler reduziert sich also bei jedem Schritt (wenigstens) um den konstanten Faktor 12 . Man bezeichnet so ein Verfahren als linear konvergent. Allgemeiner heißt ein iteratives Verfahren konvergent von der Ordnung α, wenn Fehlerschranken (ϕ(n))n≥1 und eine Konstante C angegeben werden k¨onnen, sodass gilt: ϕ(n + 1) lim = C. n→∞ (ϕ(n))α ϕ(n + 1) =
F¨ ur hinreichend große n, etwa ab einem gewissen n0 , gilt also n¨aherungsweise ϕ(n + 1) ≈ C(ϕ(n))α . Lineare Konvergenz impliziert ϕ(n + 1) ≈ Cϕ(n) ≈ C 2 ϕ(n − 1) ≈ . . . ≈ C k+1 ϕ(n − k) . . . ≈ C n−n0 +1 ϕ(n0 ). Tr¨agt man den Logarithmus von ϕ(n) gegen n auf (halblogarithmische Darstellung, wie zum Beispiel in Abb. 8.6 verwendet), so erh¨alt man eine Gerade: log ϕ(n + 1) ≈ n log C + log C 1−n0 ϕ(n0 ) . Ist C < 1, so geht die Fehlerschranke ϕ(n + 1) gegen 0 und die Anzahl der korrekten Dezimalstellen erh¨oht sich in jedem Iterationsschritt um eine Konstante. Quadratische Konvergenz w¨ urde bedeuten, dass sich die Anzahl der korrekten Dezimalstellen mit jedem Iterationsschritt n¨aherungsweise verdoppelt.
Konstruktion des Newtonverfahrens. Ziel der Konstruktion ist es, ein Verfahren zu erhalten, das quadratische Konvergenz liefert (α = 2), zumindest wenn man nahe genug bei der Nullstelle ξ startet und diese eine einfache Nullstelle einer differenzierbaren Funktion ist. Die geometrische Idee hinter dem Newtonverfahren ist einfach: Hat man eine N¨aherung xn gew¨ahlt, so berechnet man xn+1 als Schnittpunkt der Tangente an den Graphen von f durch (xn , f (xn )) mit der x-Achse. Die Tangentengleichung ist y = f (xn ) + f ′ (xn )(x − xn ). Den Schnittpunkt xn+1 mit der x-Achse erh¨alt man aus 0 = f (xn ) + f ′ (xn )(xn+1 − xn ),
98
8 Anwendungen der Ableitung y
ξ
xn+2 xn+1
xn
x
Abb. 8.5. Zum Newtonverfahren.
also xn+1 = xn −
f (xn ) f ′ (xn )
wobei nat¨ urlich f ′ (xn ) 6= 0 vorauszusetzen ist. Diese Bedingung ist erf¨ ullt, wenn xn nahe genug an der Nullstelle ξ liegt. Ist n¨amlich f ′ stetig und ξ eine einfache Nullstelle von f , so ist nicht nur f ′ (ξ) 6= 0, sondern f ′ in einer ganzen Umgebung von ξ verschieden von Null. Satz 8.15 (Konvergenz des Newtonverfahrens) Sei f eine zweimal differenzierbare, reellwertige Funktion mit stetiger zweiter Ableitung und gelte f (ξ) = 0 sowie f ′ (ξ) 6= 0. Dann gibt es eine Umgebung Uε (ξ), sodass das Newtonverfahren f¨ ur jeden Startwert x0 ∈ Uε (ξ) quadratisch gegen ξ konvergiert. Beweis: Da f ′ (ξ) 6= 0 ist und f ′ stetig ist, gibt es eine Umgebung Uδ (ξ) und ein m > 0, sodass |f ′ (x)| ≥ m ist f¨ ur alle x ∈ Uδ (ξ). Zweimalige Anwendung des Mittelwertsatzes ergibt f (xn ) − f (ξ) |xn+1 − ξ| = xn − ξ − f ′ (xn ) ′ |f ′ (xn ) − f ′ (η)| f (η) = |x − ξ| ≤ |xn − ξ| 1 − ′ n f (xn ) |f ′ (xn )| ′′ |f (ζ)| ≤ |xn − ξ|2 ′ |f (xn )| mit η zwischen xn und ξ und ζ zwischen xn und η. Es bezeichne M das Maximum von |f ′′ | auf Uδ (ξ). Falls alle N¨aherungswerte xn in der Umgebung Uδ (ξ) liegen, so ergibt sich f¨ ur den Fehler ϕ(n) = |xn − ξ| die quadratische Fehlerabsch¨atzung ϕ(n + 1) = |xn+1 − ξ| ≤ |xn − ξ|2
M M = (ϕ(n))2 m m
8.2 Das Newtonverfahren
99
und die Aussage des Satzes ist mit der Umgebung Uδ (ξ) erf¨ ullt. Andernfalls m¨ ussen wir die Umgebung verkleinern, indem wir etwa ein ε < δ w¨ahlen, mit dem die Ungleichung ε M ullt ist. Dann gilt m ≤ 1 erf¨ |xn − ξ| ≤ ε
⇒
|xn+1 − ξ| ≤ ε2
M ≤ ε. m
Das heißt, liegt ein N¨aherungswert xn in Uε (ξ), so auch der Nachfolger xn+1 . Da Uε (ξ) ⊂ Uδ (ξ) ist, gilt die quadratische Fehlerabsch¨atzung oben nach wie vor. Somit ist die Aussage des Satzes mit der kleineren Umgebung Uε (ξ) g¨ ultig. ⊓ ⊔ √ Beispiel 8.16 Zur Berechnung der Nullstelle ξ = 3 2 von x3 − 2 = 0 wurde das Bisektionsverfahren und das Newtonverfahren mit Startwert x0 = 2 verwendet. Die N¨ aherungswerte xn sowie die Intervallgrenzen [an , bn ] sind in Tabelle 8.1 und Tabelle 8.2 angef¨ uhrt. Das Newtonverfahren erreicht den Wert √ 3 2 = 1.25992104989487 auf 14 Nachkommastellen genau bereits bei der siebten Iteration. Tabelle 8.1. Bisektionsverfahren zur Berechnung der dritten Wurzel aus zwei. n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
an -2.00000000000000 0.00000000000000 1.00000000000000 1.00000000000000 1.25000000000000 1.25000000000000 1.25000000000000 1.25000000000000 1.25000000000000 1.25781250000000 1.25781250000000 1.25976562500000 1.25976562500000 1.25976562500000 1.25976562500000 1.25988769531250 1.25988769531250 1.25991821289063
bn 2.00000000000000 2.00000000000000 2.00000000000000 1.50000000000000 1.50000000000000 1.37500000000000 1.31250000000000 1.28125000000000 1.26562500000000 1.26562500000000 1.26171875000000 1.26171875000000 1.26074218750000 1.26025390625000 1.26000976562500 1.26000976562500 1.25994873046875 1.25994873046875
Fehler 4.00000000000000 2.00000000000000 1.00000000000000 0.50000000000000 0.25000000000000 0.12500000000000 0.06250000000000 0.03125000000000 0.01562500000000 0.00781250000000 0.00390625000000 0.00195312500000 0.00097656250000 0.00048828125000 0.00024414062500 0.00012207031250 0.00006103515625 0.00003051757813
Die Fehlerkurve f¨ ur das Bisektions- und das Newtonverfahren in halblogarithmischer Darstellung (MATLAB-Befehl semilogy) ist in Abb. 8.6 abzulesen. Bemerkung 8.17 Das Konvergenzverhalten des Newtonverfahrens h¨angt davon ab, ob die Bedingungen von Satz 8.15 erf¨ ullt sind. Ist der Startwert
100
8 Anwendungen der Ableitung
Tabelle 8.2. Newtonverfahren zur Berechnung der dritten Wurzel aus zwei. n 1 2 3 4 5 6 7
xn 2.00000000000000 1.50000000000000 1.29629629629630 1.26093222474175 1.25992186056593 1.25992104989539 1.25992104989487
Fehler 0.74007895010513 0.24007895010513 0.03637524640142 0.00101117484688 0.00000081067105 0.00000000000052 0.00000000000000
x0 zu weit von der Nullstelle ξ entfernt, so kann es zu Divergenz, Oszillationen oder Konvergenz zu einer anderen Nullstelle kommen. Ist f ′ (ξ) = 0, besitzt die Nullstelle ξ also eine Vielfachheit > 1, so reduziert sich die Konvergenzordnung des Newtonverfahrens.
2
Fehler
10
0
10
−2
10
−4
10
−6
Bisektion
−8
Newton
10 10
−10
10
−12
10
1
2
3
4
5
6
7
8
9 10
n
Abb. 8.6. Fehler des Bisektions- und Newtonverfahrens bei Berechnung von
√ 3
2.
¨ Experiment 8.18 Offnen Sie das Applet Newtonverfahren und testen Sie an Hand der Sinusfunktion, wie sich die Wahl des Startwerts auf das Ergebnis auswirkt (im Applet ist der Startwert die rechte Intervallgrenze). Experimentieren Sie mit den Intervallen [−2, x0 ] f¨ ur x0 = 1, 1.1, 1.2, 1.3, 1.5, 1.57, 1.5707, 1.57079 und interpretieren Sie Ihre Beobachtungen. F¨ uhren Sie die Berechnungen mit denselben Startwerten auch mit Hilfe des m-Files mat08 2.m durch. Experiment 8.19 Studieren Sie mit Hilfe des Applets Newtonverfahren, wie sich die Konvergenzordnung bei Vorliegen einer mehrfachen Nullstelle reduziert. Verwenden Sie dazu die beiden im Applet vorgegebenen Polynomfunktionen.
Bemerkung 8.20 Varianten des Newtonverfahrens erh¨alt man, wenn man die Ableitung f ′ (xn ) numerisch auswertet. Zum Beispiel liefert die N¨aherung f ′ (xn ) ≈
f (xn ) − f (xn−1 ) xn − xn−1
8.3 Regressionsgerade durch den Ursprung
101
das Sekantenverfahren xn+1 = xn −
(xn − xn−1 )f (xn ) , f (xn ) − f (xn−1 )
das xn+1 als Schnittpunkt der Sekante durch (xn , f (xn )) und (xn−1 , f (xn−1 )) mit der x-Achse berechnet. Es besitzt eine gebrochene Ordnung kleiner als 2, vgl. [25, Kap. 5.3.1].
8.3 Regressionsgerade durch den Ursprung Dieser Abschnitt ist ein erster Exkurs in die Datenanalyse: das Anpassen einer besten Gerade (Regressionsgeraden) durch den Ursprung an eine Punktwolke in der Ebene. Wir werden diese Aufgabe hier als Anwendung der Differentialrechnung behandeln; sie kann auch mit Mitteln der linearen Algebra gel¨ost werden. Dem allgemeinen Problem der linearen Regression mit mehreren Variablen wenden wir uns im Kapitel 18 zu. Abb. 8.7 zeigt als Beispiel das Ergebnis einer Stichprobe vom Umfang n = 70, in der die Gr¨oße x [cm] und das Gewicht y [kg] von 70 Informatikstudenten an der Universit¨at Innsbruck im Jahr 2002 erhoben wurden. Die Daten sind dem m-File mat08 3.m zu entnehmen. 140
140
120
120
100
100
80
80
60
60
40 160
170
180
190
200
Abb. 8.7. Streudiagramm Gr¨ oße/Gewicht.
40 160
170
180
190
200
Abb. 8.8. Beste Gerade y = kx.
Die Messwerte (xi , yi ), i = 1, . . . , n von Gr¨oße und Gewicht bilden eine Punktwolke in der Ebene. Unter der Annahme, dass zwischen Gr¨oße und Gewicht ein linearer Zusammenhang der Form y = kx besteht, soll k so bestimmt werden, dass die Gerade y = kx das Verhalten der Punktwolke m¨ oglichst gut wiedergibt (Abb. 8.8). Der Ansatz, den wir unten besprechen, geht auf Gauß2 zur¨ uck und versteht die Anpassungsg¨ ute im Sinne der Minimierung der Summe der Fehlerquadrate. Anwendung 8.21 (Beste Gerade durch den Ursprung) An eine Punktwolke (xi , yi ), i = 1, . . . , n soll eine Gerade durch den Ursprung 2
C.F. Gauß, 1777–1855.
102
8 Anwendungen der Ableitung
y = kx angepasst werden. W¨ are k bekannt, so k¨ onnte man das Quadrat der Abweichung des Messwerts yi vom durch die Geradengleichung gegebenen Sch¨atzwert kxi (das Fehlerquadrat) durch (yi − kxi )2 berechnen. Wir suchen jenes k, das die Summe der Fehlerquadrate minimiert, also: n X (yi − kxi )2 → min! F (k) = i=1
Offensichtlich ist F (k) eine quadratische Funktion von k. Zun¨achst berechnen wir die Ableitungen F ′ (k) =
n X i=1
F ′′ (k) =
(−2xi )(yi − kxi ),
n X
2x2i .
i=1
′
′′
Dann setzen wir F (k) = 0 und erhalten, da offenbar F > 0 ist, ein globales Minimum: n n X X F ′ (k) = −2 xi yi + 2k x2i = 0. i=1
i=1
Die L¨osung, der Anstieg der besten Geraden, ist P xi yi k= P 2 . xi
Beispiel 8.22 Zur Illustration einer Regressionsgerade durch den Ursprung nehmen wir den ¨osterreichischen Verbraucherpreisindex 2000 – 2006 (die Daten stammen aus [26]): Jahr
2000
2001
2002
2003
2004
2005
2006
Index
100.0
102.7
104.5
105.9
108.1
110.6
112.2
Zur Berechnung ist es g¨ unstig, neue Variable einzuf¨ uhren, in denen x = 0 dem Jahr 2000 entspricht und y = 0 dem Index 100. Das heißt, x = (Jahr − 2000) und y = (Index − 100); y stellt die prozentuelle Teuerung im Vergleich zu den Preisen von 2000 dar. Die umskalierten Daten sind xi yi
0 0.0
1 2.7
2 4.5
3 5.9
4 8.1
5 10.6
6 12.2
und wir suchen die beste Gerade an diese Daten durch den Ursprung. In diesem Fall ist F (k) = (2.7−k·1)2 +(4.5−k·2)2 +(5.9−k·3)2 +(8.1−k·4)2 +(10.6−k·5)2 +(12.2−k·6)2
und der beste Anstieg ergibt sich aus der Formel
¨ 8.4 Ubungen
k=
103
1 · 2.7 + 2 · 4.5 + 3 · 5.9 + 4 · 8.1 + 5 · 10.6 + 6 · 12.2 188.0 = = 2.0659. 1·1+2·2+3·3+4·4+5·5+6·6 91
Die beste Gerade lautet also y = 2.0659 x bzw. r¨ ucktransformiert Index = 100 + (Jahr − 2000) · 2.0659. Das Ergebnis ist in Abb. 8.9 dargestellt, sowohl in der Jahr/Index-Skala als auch in der auf (0, 0) transformierten Skala. Extrapolation l¨angs der Regressionsgeraden w¨ urde f¨ ur 2007 die Prognose Index(2007) = 100 + 7 · 2.0659 = 114.5 ergeben (der tats¨ achliche Verbraucherpreisindex von 2007 hatte den Wert 114.6). 2000 2002 2004 2006
2000 2002 2004 2006
12
112
12
112
10
110
10
110
8
108
8
108
6
106
6
106
4
104
4
104
2
102
2
102
100
0
0 0
2
4
6
100
0
2
4
6
Abb. 8.9. Verbraucherpreisindex und Regressionsgerade.
¨ 8.4 Ubungen 1. (a) Gehen Sie in mathe online zu Galerie – Differenzieren 1 und machen Sie Ableitungspuzzle 2 und 3. (b) Gehen Sie in mathe online zu Interaktive Tests – Differenzieren 2 und beantworten Sie die unter Funktionen mit Absolutbetrag – differenzierbar oder nicht? gestellten Fragen. Skizzieren Sie dazu die Graphen der zu untersuchenden Funktionen (mittels Kurvendiskussion oder mit MATLAB ). 2. Ermitteln Sie alle Maxima und Minima auf R der Funktionen 2 x f (x) = 2 und g(x) = x2 e−x . x +1
104
8 Anwendungen der Ableitung
3. Ermitteln Sie das Maximum der Funktionen y=
1 −(log x)2 /2 e , x>0 x
und
y = e−x e−(e
−x
)
, x∈R
(Dichte der Standardlognormalverteilung bzw. der Gumbelverteilung). 4. Ermitteln Sie die Proportionen eines Zylinders, der bei gegebenem Volumen V die kleinste Oberfl¨ ache F besitzt. Hinweis: F = 2rπh+2r2 π → min! Berechnen Sie die H¨ ohe h als Funktion des Radius r aus V = r2 πh, setzen Sie ein und minimieren Sie F (r). 5. (Aus der Festigkeitslehre) Das Fl¨ achentr¨ agheitsmoment bez¨ uglich der horizon1 bh3 (b talen Mittelachse eines Balkens mit rechteckigem Querschnitt ist I = 12 die Breite, h die H¨ ohe). Ermitteln Sie die Proportionen eines Balkens maximalen Fl¨ achenmoments, der aus einem Baumstamm mit kreisf¨ ormigem Querschnitt von vorgegebenem Radius r geschnitten werden kann. Hinweis: b als Funktion von h darstellen, I(h) → max!
6. (Aus der Bodenmechanik) Die mobilisierte Koh¨ asion cm (θ) eines Erdkeils mit Gleitfugenneigung θ betr¨ agt cm (θ) =
γh sin(θ − ϕm ) cos θ . 2 cos ϕm
Dabei sind h die H¨ ohe des Erdkeils, ϕm der mobilisierte Reibungswinkel, γ das spezifische Gewicht des Bodens (siehe dazu Abb. 8.10). Zeigen Sie, dass die mobilisierte Koh¨ asion cm bei gegebenem h, ϕm , γ beim Neigungswinkel θ = ϕm /2 + 45◦ ihr Maximum annimmt.
h θ
Abb. 8.10. Erdkeil mit Gleitfuge.
7. Diese Aufgabe dient der Untersuchung der Konvergenz des Newtonverfahrens zur L¨ osung der Gleichungen x3 − 3x2 + 3x − 1 = 0 x3 − 3x2 + 3x − 2 = 0
auf dem Intervall [0, 3]. ¨ (a) Offnen Sie das Applet Newtonverfahren und f¨ uhren Sie das Newtonverfahren mit den beiden Gleichungen mit einer Genauigkeit von 0.0001 durch. Erkl¨ aren Sie, warum Sie unterschiedlich viele Iterationen ben¨ otigen. (b) Erzeugen Sie mit Hilfe des m-Files mat08 1.m jeweils eine Liste der N¨ aherungen (Anfangswert x0 = 1.5, tol = 100*eps, maxk = 100) und plotten Sie jeweils die Fehler |xn − ξ| mittels semilogy. Diskutieren Sie das Ergebnis.
¨ 8.4 Ubungen
105
8. Wenden Sie das MATLAB -Programm mat08 2.m auf die Funktionen an, die durch die m-Files mat08 f1.m und mat08 f2.m definiert sind (mit zugeh¨ origen Ableitungen ahlen Sie x0 = 2, maxk = 250. Wie erkl¨ aren Sie mat08 df1.m und mat08 df2.m). W¨ die Ergebnisse? 9. Schreiben Sie das MATLAB -Programm mat08 2.m so um, dass der Abbruch erfolgt, wenn entweder eine vorgegebene Iterationszahl maxk oder eine vorgegebene Fehlerschranke tol erreicht ist (Abbruch bei n-ter Iteration, wenn entweder n > maxk oder |f (xn )| < tol ist). Geben Sie xn , n und den Fehler |f (xn )| aus. Testen Sie ¨ Ihr Programm mit den Funktionen aus Ubung 8.8 und erl¨ autern Sie die Ergebnisse. Hinweis: L¨ osungsvorschlag im m-File mat08 ueb9.m. 10. Schreiben Sie ein MATLAB -Programm, welches das Sekantenverfahren f¨ ur kubische Polynome durchf¨ uhrt. 11. (a) Leiten Sie mittels der Methode der kleinsten Fehlerquadrate eine Formel f¨ ur den Koeffizienten c der Regressionsparabel y = cx2 durch eine Punktwolke (x1 , y1 ), ..., (xn , yn ) her. (b) Bei der Messung des reinen Bremswegs s [m] (ohne Reaktionsweg) eines bestimmten PKW-Typs in Abh¨ angigkeit von der Geschwindigkeit v [km/h] erhielt man folgende Messwerte: vi
10
20
40
50
60
70
80
100
120
si
1
3
8
13
18
23
31
47
63
Berechnen Sie den Koeffizienten c der Regressionsparabel s = cv 2 und plotten Sie das Ergebnis. 12. Zeigen Sie: die beste horizontale Gerade y = d durch eine Punktwolke (xi , yi ), i = 1, . . . , n ist durch das arithmetische Mittel der y-Werte gegeben: d=
n 1X yi . n i=1
P 2 Hinweis: Minimieren Sie G(d) = n i=1 (yi − d) . ¨ 13. (a) Uberzeugen Sie sich durch Anwendung des Mittelwertsatzes, dass die Funktion f (x) = cos x auf dem Intervall [0, 1] eine Kontraktion ist (vgl. Def. C.17), und berechnen Sie den Fixpunkt x∗ = cos x∗ n¨ aherungsweise mit Hilfe des Iterationsverfahrens aus Satz C.18 auf zwei Kommastellen. (b) Schreiben Sie ein MATLAB -Programm, das zu gegebenem Startwert x1 ∈ [0, 1] die ersten N Iterationsschritte zur Berechnung von x∗ = cos(x∗ ) vornimmt und x1 , x2 , . . . , xN als Spalte ausgibt.
9 Fraktale und L-Systeme
In der Geometrie werden Objekte u ¨blicherweise durch explizite Regeln und Transformationen bestimmt, die einfach in mathematische Formeln u onnen. ¨bersetzt werden k¨ Beispielsweise ist ein Kreis die Menge aller Punkte, die von einem Mittelpunkt (a, b) den festen Abstand r haben: K = {(x, y) ∈ R2 ; (x − a)2 + (y − b)2 = r2 } oder
K = {(x, y) ∈ R2 ; x = a + r cos ϕ, y = b + r sin ϕ, 0 ≤ ϕ < 2π}.
Im Gegensatz dazu sind die Objekte der fraktalen Geometrie meist durch eine rekursive Vorschrift gegeben. Diese fraktalen Mengen (Fraktale) haben in letzter Zeit viele interessante Anwendungen erfahren, z.B. in der Computergrafik (Darstellung von Wolken, Pflanzen, B¨ aumen, Landschaften), in der Bildkompression und in der Datenanalyse. Dar¨ uberhinaus besitzen Fraktale eine gewisse Bedeutung in der Modellierung von Wachstumsprozessen. Kennzeichnende Merkmale von Fraktalen sind oft ihre nicht ganzzahlige Dimension und die Selbst¨ ahnlichkeit der gesamten Menge mit ihren Teilen. Letzteres Ph¨ anomen findet man auch h¨ aufig in der Natur, z.B. in der Geologie. Dort ist es anhand eines Fotos ohne Kenntnis des Maßstabs oft schwierig zu entscheiden, ob das abgebildete Objekt ein Sandkorn, ein kleiner Kiesel oder ein grosses St¨ uck Fels ist. Aus diesem Grund wird die fraktale Geometrie u anglich auch als Geometrie der Natur ¨berschw¨ bezeichnet. Wir betrachten in diesem Kapitel exemplarisch Fraktale in R2 und C. Des Weiteren geben wir eine kurze Einf¨ uhrung in L-Systeme und besprechen als Anwendung ein einfaches Konzept zur Modellierung des Wachstums von Pflanzen. F¨ ur eine weiter f¨ uhrende Darstellung verweisen wir auf die Lehrb¨ ucher [21, 22].
9.1 Fraktale Zun¨achst verallgemeinern wir die Begriffe offenes und abgeschlossenes Intervall auf Teilmengen von R2 . Zu festem a = (a, b) ∈ R2 und ε > 0 heißt die
108
Menge
9 Fraktale und L-Systeme
n o p B(a, ε) = (x, y) ∈ R2 ; (x − a)2 + (y − b)2 < ε
ε-Umgebung von a. Man beachte, dass die Menge B(a, ε) eine Kreisscheibe mit Mittelpunkt a und Radius ε ist, bei der die Berandung fehlt. Definition 9.1 Sei A ⊆ R2 . (a) Ein Punkt a ∈ A heißt innerer Punkt von A, wenn es eine ε-Umgebung von a gibt, welche selbst ganz in A liegt. (b) A heißt offen, wenn jeder Punkt von A ein innerer Punkt ist. (c) Ein Punkt c ∈ R2 heißt Randpunkt von A, wenn jede ε-Umgebung von c sowohl zumindest einen Punkt aus A als auch einen Punkt von R2 \ A enth¨alt. Die Randpunkte von A bezeichnen wir mit ∂A (Rand von A). (d) Eine Menge heißt abgeschlossen, wenn sie alle ihre Randpunkte enth¨alt. (e) A heißt beschr¨ ankt, wenn es eine Zahl r > 0 gibt mit A ⊆ B(0, r). Beispiel 9.2 Das Quadrat Q = {(x, y) ∈ R2 ; 0 < x < 1 und 0 < y < 1} ist offen, da jeder Punkt von Q eine ε-Umgebung besitzt, die ganz in Q liegt, vgl. Abb. 9.1, linkes Bild. Der Rand von Q besteht aus den vier Strecken {0, 1} × [0, 1] ∪ [0, 1] × {0, 1}. Jede ε-Umgebung eines Randpunkts enth¨alt auch Punkte, die außerhalb von Q liegen, vgl. Abb. 9.1, mittleres Bild. Das in Abb. 9.1 rechts angegebene Quadrat {(x, y) ∈ R2 ; 0 < x ≤ 1 und 0 < y ≤ 1} ist weder abgeschlossen noch offen, da der Randpunkt (x, y) = (0, 0) nicht Element der Menge ist und die Menge andererseits den Punkt (x, y) = (1, 1) enth¨alt, der kein innerer Punkt ist. Alle drei Mengen sind beschr¨ankt, da sie beispielsweise in B(0, 2) enthalten sind. (1, 1)
(0, 0) Abb. 9.1. Offenes (links), abgeschlossenes (Mitte) und weder offen noch abgeschlossenes (rechts) Quadrat mit Seitenl¨ ange 1.
9.1 Fraktale
109
Fraktale Dimension. Grob gesprochen haben Punkte die Dimension 0, Linienst¨ ucke die Dimension 1 und Fl¨ achenst¨ ucke die Dimension 2. Das Konzept der fraktalen Dimension dient dazu, feinere Unterscheidungen zu treffen. Wenn beispielsweise eine Kurve eine Fl¨ ache dicht ausf¨ ullt, ist man geneigt, ihr eine h¨ohere Dimension als 1 zuzusprechen. Haben umgekehrt Linienst¨ ucke sehr viele L¨ocher, k¨ onnte ihre Dimension zwischen 0 und 1 sein. Sei A ⊆ R2 beschr¨ ankt (und nicht leer) und sei N (A, ε) die kleinste Zahl von abgeschlossenen Kreisen mit Radius ε, die man ben¨otigt, um A zu u ¨berdecken, vgl. Abb. 9.2.
¨ Abb. 9.2. Uberdeckung einer Kurve mit Kreisen.
Hinter der Definition der fraktalen Dimension d von A steht folgende intuitive Idee: Bei Kurvenst¨ ucken ist die Zahl N (A, ε) umgekehrt proportional zu ε, bei Fl¨achenst¨ ucken umgekehrt proportional zu ε2 , also N (A, ε) ≈ C · ε−d , wobei d die Dimension bezeichnet. Durch Logarithmieren dieser Beziehung erh¨alt man log N (A, ε) ≈ log C − d log ε, beziehungsweise d ≈ −
log N (A, ε) − log C . log ε
Diese Approximation wird umso genauer, je kleiner wir ε > 0 w¨ahlen. Wegen lim+
ε→0
log C =0 log ε
f¨ uhrt das auf folgende Definition. Definition 9.3 Sei A ⊆ R2 nicht leer, beschr¨ankt und N (A, ε) wie oben. Falls der Grenzwert d = d(A) = − lim
ε→0+
log N (A, ε) log ε
existiert, so heißt d fraktale Dimension von A.
110
9 Fraktale und L-Systeme
Bemerkung 9.4 In obiger Definition ist es ausreichend, f¨ ur ε eine Nullfolge der Form εn = C · q n , 0
¨ zu w¨ahlen. Zudem ist es nicht wesentlich, dass man zur Uberdeckung Kreisscheiben verwendet. Man kann z.B. genauso gut Quadrate ben¨ utzen, vgl. [7, Kap. 5]. Deshalb nennt man die durch Definition 9.3 gegebene Zahl auch BoxDimension von A.
Experimentell l¨asst sich die Dimension eines Fraktals bestimmen, indem man zu verschiedenen Rasterungen der Ebene mit Maschenweite εn die Anzahl der K¨astchen bestimmt, die mit dem Fraktal nichtleeren Durchschnitt haben, vgl. Abb. 9.3. Nennen wir diese Zahl wieder N (A, εn ). Man tr¨agt dann in einem doppellogarithmischen Diagramm log N (A, εn ) als Funktion von log εn auf und passt die beste Gerade an diesen Graphen an, vgl. Abschnitt 18.1. Dann gilt d(A) ≈ − Steigung der Geraden. Mit dieser Vorgangsweise kann beispielsweise die fraktale Dimension der ¨ K¨ ustenlinie von Großbritannien bestimmt werden, vgl. Ubung 1.
Abb. 9.3. Rasterung der Ebene mittels Quadraten der Seitenl¨ ange ε. Jene K¨ astchen, die mit dem Fraktal nichtleeren Durchschnitt haben, sind grau gef¨ arbt. Im Bild gilt N (A, ε) = 27.
Beispiel 9.5 Das Geradenst¨ uck A = {(x, y) ∈ R2 ; a ≤ x ≤ b, y = c} hat fraktale Dimension d = 1.
b
a
¨ Abb. 9.4. Uberdeckung einer Geraden mit Kreisen.
Wir w¨ahlen εn = (b − a) · 2−n ,
q = 1/2.
9.1 Fraktale
111
Wegen N (A, εn ) = 2n−1 gilt −
log N (A, εn ) (n − 1) log 2 =− →1 log εn log(b − a) − n log 2
f¨ ur n → ∞.
Ebenso zeigt man leicht: Jede Menge, die aus endlich vielen Punkten besteht, hat fraktale Dimension 0. Fl¨achenst¨ ucke im R2 haben fraktale Dimension 2. Die fraktale Dimension ist somit eine Verallgemeinerung des intuitiven Dimensionsbegriffs. Dennoch ist hier etwas Vorsicht angebracht, wie folgendes Beispiel zeigt.
Abb. 9.5. Eine Punktmenge mit der Box-Dimension d = 21 .
Beispiel 9.6 Die Menge F = 0, 1, 12 , 31 , 41 , . . . aus Abb. 9.5 hat Box-Dimension d = 1/2. Wir u ufen diese Behauptung mit nachfolgendem MATLAB¨berpr¨ Experiment. Experiment 9.7 Um die Dimension von F n¨ aherungsweise mit MATLAB zu bestimmen, gehen wir wie folgt vor. Wir zerlegen f¨ ur j = 1, 2, 3 . . . das Intervall [0, 1] in 4j gleich große Teilintervalle, setzen εj = 4−j und bestimmen die Anzahl Nj = N (F, εj ) jener Teilintervalle, die mit F nichtleeren Durchschnitt haben. Wir tragen dann in einem doppellogarithmischen Diagramm log Nj als Funktion von log εj auf. Die Sekantensteigung log Nj+1 − log Nj dj = − log εj+1 − log εj ist eine Approximation an d, die mit wachsendem j immer besser wird. Die mit dem Programm mat09_1.m erzielten Werte sind in der folgenden Tabelle angegeben: 4j
4
16
64
256
1024
dj 0.79 0.61 0.55 0.52 0.512
4096
16384
65536
0.5057 0.5028 0.5014
262144 1048576 0.5007
0.50035
Pr¨ ufen Sie die angegebenen Werte nach und stellen Sie fest, dass die durch Definition 9.3 motivierten Approximationen log Nj dej = − log εj
viel schlechter sind. Erkl¨ aren Sie dieses Verhalten.
Beispiel 9.8 (Cantor-Menge) tels
Wir konstruieren diese Menge rekursiv mit-
A0 = [0, 1] A1 = 0, 13 ∪ 32 , 1 1 2 1 2 7 8 A2 = 0, 9 ∪ 9 , 3 ∪ 3 , 9 ∪ 9 , 1 .. .
112
9 Fraktale und L-Systeme
Man erh¨alt An+1 aus An , indem man aus jedem Geradenst¨ uck von An das mittlere Drittel entfernt, vgl. Abb. 9.6. A0 A1 A2 A3
Abb. 9.6. Die Entstehung der Cantor-Menge.
Der Durchschnitt aller dieser Mengen A=
∞ \
An
n=0
heißt Cantor-Menge. Bezeichne |An | die L¨ ange von An . Offensichtlich gilt |A0 | = 1, |A1 | = 2/3, |A2 | = (2/3)2 und |An | = (2/3)n . Somit ist |A| = lim |An | = lim (2/3)n = 0, n→∞
n→∞
das heißt A hat die L¨ ange 0. Trotzdem besteht A nicht einfach aus diskreten Punkten. Mehr Aufschluss u ¨ber die Struktur von A gibt die fraktale Dimension d. Zur Bestimmung w¨ ahlen wir εn =
1 −n ·3 , 2
d.h. q = 1/3
und erhalten (laut Abb. 9.6) den Wert N (A, εn ) = 2n . Somit gilt log 2 n log 2 log 2n = lim = = 0.6309... n→∞ n log 3 + log 2 n→∞ log 3−n − log 2 log 3
d = − lim
Die Cantor-Menge ist somit ein Objekt, welches zwischen Punkten und Geraden angesiedelt ist. Beachtenswert ist auch die Selbst¨ahnlichkeit von A. Gewisse Teile von A ergeben herausvergr¨oßert exakte Kopien von A. Dies zusammen mit der nicht ganzzahligen Dimension ist ein typisches Merkmal von Fraktalen.
Abb. 9.7. Eisblumen der Tiefe 0, 1, 2, 3 und 4.
9.1 Fraktale
113
Beispiel 9.9 (Koch’sche Eisblume1 ) Es handelt sich hierbei um eine Figur von endlicher Fl¨ache, deren Rand ein Fraktal mit unendlicher L¨ange ist. Aus Abb. 9.7 kann man die ersten f¨ unf Konstruktionsschritte dieses Fraktals ersehen. Ausgangsfigur A0 ist ein gleichseitiges Dreieck mit Seitenl¨ange a. Das ¨ Bildungsgesetz f¨ ur den Ubergang von An auf An+1 lautet: Man ersetzt jedes geradlinige Berandungsst¨ uck durch vier Strecken, indem man u ¨ber dem mittleren Drittel ein gleichseitiges Dreieck aufsetzt, vgl. Abb. 9.8.
Abb. 9.8. Bildungsgesetz der Eisblume.
Der Umfang Un der Figur An berechnet sich zu 4 Un = Un−1 = 3
n n 2 4 4 4 Un−2 = . . . = U0 = 3a . 3 3 3
Somit gilt f¨ ur den Umfang U∞ der Koch’schen Eisblume A∞ U∞ = lim Un = ∞. n→∞
Als N¨achstes berechnen wir die fraktale Dimension von ∂A∞ . Wir setzen dazu εn =
a −n ·3 , 2
d.h. q = 1/3.
Da man mit einem Kreis vom Radius εn jeweils ein geradliniges Berandungsst¨ uck u ¨berdecken kann, ist N (∂A∞ , εn ) ≤ 3 · 4n und somit d = d(∂A∞ ) ≤
log 4 ≈ 1.262. log 3
¨ Eine Uberdeckung mit gleichseitigen Dreiecken der Seitenl¨ange εn zeigt, dass N (∂A∞ , εn ) proportional zu 4n ist und damit d=
log 4 log 3
gilt. Der Rand der Eisblume ∂A∞ ist somit ein geometrisches Objekt zwischen Kurve und Fl¨ache. 1
H. von Koch, 1870–1924.
114
9 Fraktale und L-Systeme
9.2 Mandelbrot-Mengen Eine interessante Klasse von Fraktalen erh¨ alt man durch Iterationsverfahren. Wir betrachten als Beispiel in C die Iteration zn+1 = zn2 + c. Indem man z = x + iy und c = a + ib setzt, erh¨alt man durch Trennung von Real- und Imagin¨ arteil die ¨ aquivalente reelle Form der Iteration xn+1 = x2n − yn2 + a, yn+1 = 2xn yn + b. Die reelle Darstellung ist wichtig, wenn man mit einer Programmiersprache arbeitet, die keine komplexe Arithmetik unterst¨ utzt. Wir untersuchen zun¨ achst, f¨ ur welche Werte von c ∈ C die Iteration zn+1 = zn2 + c,
z0 = 0
beschr¨ ankt bleibt. Dies ist im vorliegenden Fall ¨aquivalent zu |zn | 6→ ∞ f¨ ur n → ∞. Die Menge aller c mit dieser Eigenschaft ist offenbar nicht leer, da c = 0 in ihr liegt; andererseits ist sie selbst beschr¨ankt, da f¨ ur |c| > 2 die Iteration stets divergiert. Probieren Sie es am Computer aus. Definition 9.10 Die Menge M = {c ∈ C ; |zn | 6→ ∞ f¨ ur n → ∞} heißt Mandelbrot-Menge 2 der Iteration zn+1 = zn2 + c, z0 = 0. Um einen Eindruck von M zu erhalten, machen wir ein numerisches Experiment in MATLAB.
1
0.03 0.02
0.5
0.01
0
0 −0.01
−0.5
−0.02 −0.03
−1 −2
−1
0
1
−1.8 −1.78 −1.76 −1.74 −1.72
Abb. 9.9. Die Mandelbrot-Menge der Iteration zn+1 = zn2 + c, z0 = 0 und eine Ausschnittsvergr¨ oßerung. 2
B. Mandelbrot, geb. 1924.
9.3 Julia-Mengen
115
Experiment 9.11 Um die Mandelbrot-Menge M zu visualisieren, w¨ ahlt man sich zun¨ achst eine Rasterung eines gew¨ ahlten Gebiets, beispielsweise von −2 ≤ Re c ≤ 1,
−1.15 ≤ Im c ≤ 1.15.
Anschließend f¨ uhrt man f¨ ur jeden Rasterpunkt eine große Anzahl von Iterationen durch (z.B. 80) und entscheidet dann, ob die Iterationen beschr¨ ankt bleiben (beispielsweise |zn | ≤ 2). Ist dies der Fall, f¨ arbt man den Punkt schwarz. Damit erh¨ alt man sukzessive ein Bild von M . Ben¨ utzen Sie f¨ ur ihre Experimente das MATLAB Programm mat09_2.m und modifizieren Sie es nach Bedarf. Erzeugen Sie damit insbesondere die Bilder von Abb. 9.9 in hoher Aufl¨ osung.
Abb. 9.9 zeigt als Ergebnis ein Apfelm¨ annchen, dem kleinere Apfelm¨annchen aufgesetzt sind, die schließlich in eine Antenne u ¨bergehen. Man erkennt hier bereits die Selbst¨ahnlichkeit. Macht man eine Ausschnittsvergr¨oßerung eines Details auf der Antenne (−1.8 ≤ Re c ≤ −1.72, −0.03 ≤ Im c ≤ 0.03) erkennt man darin eine fast perfekte Kopie des großen Apfelm¨annchens. Die Mandelbrot-Menge ist eines der popul¨ arsten Fraktale und eines der komplexesten mathematischen Objekte, welches man visualisieren kann.
9.3 Julia-Mengen Wir betrachten wieder das Iterationsverfahren zn+1 = zn2 + c, vertauschen nun aber die Rollen von z0 und c. Definition 9.12 Sei c ∈ C fest gew¨ ahlt. Die Menge Jc = {z0 ∈ C ; |zn | 6→ ∞ f¨ ur n → ∞} heißt Julia-Menge 3 der Iteration zn+1 = zn2 + c. Die Julia-Menge zum Parameterwert c besteht somit aus jenen Anfangswerten, f¨ ur die die Iteration beschr¨ ankt bleibt. F¨ ur einige Werte von c finden Sie die Bilder von Jc in Abb. 9.10. Man kann viele interessante Eigenschaften aus den Bildern ablesen, beispielsweise gilt Jc ist zusammenh¨ angend ⇔ c ∈ M. Man k¨onnte die Mandelbrot-Menge M daher alternativ definieren als M = {c ∈ C ; Jc ist zusammenh¨angend}. Weiters ist der Rand einer Julia-Menge selbst¨ ahnlich und somit ein Fraktal. Experiment 9.13 Zeichnen Sie die Julia-Mengen Jc von Abb. 9.10 mit dem MATLAB -Programm mat09_3.m in hoher Aufl¨ osung. Probieren Sie auch andere Werte von c aus. 3
G. Julia, 1893–1978.
116
9 Fraktale und L-Systeme 1.5
1.5
1
1
0.5
0.5
0
0
−0.5
−0.5
−1
−1
−1.5 −2
−1
0
1
2
−1.5 −2
1.5
1.5
1
1
0.5
0.5
0
0
−0.5
−0.5
−1
−1
−1.5 −2
−1
0
1
2
−1.5 −2
−1
0
1
2
−1
0
1
2
ur die Parameterwerte c = Abb. 9.10. Julia-Mengen der Iteration zn+1 = zn2 + c f¨ −0.75 (links oben), c = 0.35 + 0.35 i (rechts oben), c = −0.03 + 0.655 i (links unten) und −0.12 + 0.74 i (rechts unten).
9.4 Das Newtonverfahren in C Da man in C ¨ahnlich wie in R rechnen kann, lassen sich viele Konzepte der reellen Analysis direkt auf C u ¨bertragen. Beispielsweise nennt man eine Funktion f : C → C : z 7→ f (z) komplex differenzierbar in z, falls der Differenzenquotient f (z + ∆z) − f (z) ∆z einen Grenzwert f¨ ur ∆z → 0 besitzt. Diesen Grenzwert bezeichnet man wieder mit f (z + ∆z) − f (z) f ′ (z) = lim ∆z→0 ∆z und nennt ihn komplexe Ableitung von f in Punkt z. Da das Differenzieren in C in derselben Weise wie das Differenzieren in R erkl¨art ist, gelten dieselben Ableitungsregeln. Insbesondere sind Polynome f (z) = an z n + . . . + a1 z + a0 komplex differenzierbar und besitzen die Ableitung f ′ (z) = nan z n−1 + . . . + a1 .
9.4 Das Newtonverfahren in C
117
Die komplexe Ableitung besitzt wie die reelle Ableitung (vgl. Kapitel 7.3) die Interpretation als lineare N¨ aherung f (z) ≈ f (z0 ) + f ′ (z0 )(z − z0 ) f¨ ur z nahe bei z0 . Sei f : C → C : z 7→ f (z) eine komplex differenzierbare Funktion mit f (ζ) = 0 und f ′ (ζ) 6= 0. Um die Nullstelle ζ der Funktion f zu berechnen, wird ausgehend vom Startwert z0 zun¨ achst eine Nullstelle der linearen N¨aherung berechnet, also f (z0 ) z1 = z0 − ′ . f (z0 ) Anschließend wird z1 als neuer Startwert verwendet und das Verfahren iteriert. Auf diese Weise erh¨alt man das Newtonverfahren in C: zn+1 = zn −
f (zn ) . f ′ (zn )
F¨ ur Startwerte z0 nahe bei ζ konvergiert das Verfahren (wie in R) quadratisch. Anderenfalls kann die Situation jedoch sehr kompliziert werden. Im Jahre 1983 untersuchte Eckmann [11] das Newtonverfahren f¨ ur die Funktion f (z) = z 3 − 1 = (z − 1)(z 2 + z + 1). Diese Funktion besitzt drei Nullstellen in C ζ1 = 1,
ζ2,3
√ 3 1 =− ±i . 2 2
Naiverweise k¨onnte man glauben, dass die komplexe Ebene C in drei gleich große Sektoren zerf¨allt, wobei die Iteration mit Startwerten im Sektor S1 zu ζ1 konvergiert, jene in S2 zu ζ2 , etc., vgl. Abb. 9.11. Dass dem nicht so ist, zeigt ein numeriS2 scher Versuch. F¨ arbt man die Startwerζ2 te entsprechend ihrer Konvergenz, so erS1 gibt sich ein sehr komplexes Bild. Man ζ1 kann beweisen (sich aber nur schwer vorζ3 stellen), dass an jeder Stelle, an der zwei Farben zusammentreffen, auch die S3 dritte Farbe vorhanden ist. Die GrenAbb. 9.11. M¨ ogliche Einzugsgezen der Einzugsgebiete der Nullstellen biete der Newtoniteration zur Bewerden von krebsscherenartigen Motistimmung der Nullstellen von z 3 −1. ven beherrscht, die bei fortw¨ahrender Vergr¨oßerung immer wieder auftauchen, vgl. Abb. 9.12. Diese Grenzen der Einzugsgebiete sind Julia-Mengen. Wir sind also wieder auf Fraktale gestoßen.
118
9 Fraktale und L-Systeme 0.3 1
0.2 0.1
0
0 −0.1 −0.2
−1
−0.3 −2
−1
0
1
2
−0.8
−0.6
−0.4
−0.2
0
Abb. 9.12. Einzugsgebiete der Newtoniteration zur Bestimmung der Nullstellen von z 3 − 1 und Ausschnittsvergr¨ oßerung. Experiment 9.14 Machen Sie Versuche mit dem MATLAB -Programm mat09_4.m. Vergewissern Sie sich von der Selbst¨ ahnlichkeit der auftretenden Julia-Mengen, indem Sie aussagekr¨ aftige Ausschnittsvergr¨ oßerungen der R¨ ander des Einzugsgebiets anfertigen.
9.5 L-Systeme Der Formalismus von L-Systemen wurde von Lindenmayer4 um 1968 entwickelt, um das Wachstum von Pflanzen zu modellieren. Es zeigt sich, dass man damit auch viele Fraktale erzeugen kann. In diesen Abschnitt geben wir eine knappe Einf¨ uhrung in L-Systeme und besprechen eine m¨ogliche Implementierung in maple . Definition 9.15 Ein L-System besteht aus den folgenden f¨ unf Komponenten: (a) Einer endlichen Menge B von Symbolen, dem so genannten Alphabet. Die Elemente von B heißen auch Buchstaben. (b) Gewissen Substitutionsregeln. Diese Vorschriften geben an, wodurch die Buchstaben des jeweils aktuellen Worts in den einzelnen Schritten der Iteration zu ersetzen sind. (c) Dem Anfangswort w ∈ W . Das Anfangswort heißt auch Axiom oder Same. (d) Der Anzahl von Schritten, welche man durchf¨ uhren will. Dabei wird in jedem Schritt jeder Buchstabe des aktuellen Worts entsprechend der Substitutionsregeln ersetzt. (e) Einer grafischen Interpretation des Worts (¨ ublicherweise am Bildschirm). Sei W die Menge aller Zeichenketten (W¨ orter), die mit Symbolen aus B gebildet werden k¨onnen. Die Substitutionsregeln lassen sich als Abbildung von B nach W auffassen: 4
A. Lindenmayer, 1925–1989.
9.5 L-Systeme
119
S : B → W : b 7→ S(b). Beispiel 9.16 Gegeben sei das Alphabet B = {f,p,m}, bestehend aus den drei Buchstaben f, p und m. Zu diesem Alphabet betrachten wir die Substitutionsregeln S(f) = fpfmfmffpfpfmf,
S(p) = p,
S(m) = m
und das Axiom w = fpfpfpf. Die Anwendung der Substitutionsregeln zeigt, dass beispielsweise aus dem Wort fpf nach einer Substitution das neue Wort fpfmfmffpfpfmfpfpfmfmffpfpfmf wird. Wendet man auf das Axiom die Substitutionsregeln an, so ergibt sich ein neues Wort. Darauf die Substitutionsregeln angewandt ergibt wieder ein neues Wort, und so fort. Jedes dieser W¨orter kann als Polygonzug interpretiert werden, indem man den einzelnen Buchstaben die folgende Bedeutung zuordnet: f bedeutet vorw¨ arts (forward) um eine Einheit; p steht f¨ ur eine Drehung von α Radianten (plus); m steht f¨ ur eine Drehung von −α Radianten (minus). Dabei ist 0 ≤ α ≤ π ein fest gew¨ ahlter Winkel. Man zeichnet den Polygonzug, indem man einen beliebigen Startpunkt und eine beliebige Anfangsrichtung w¨ ahlt. Dann arbeitet man der Reihe nach die Buchstaben des darzustellenden Worts nach obigen Regeln ab. Zur Implementierung von L-Systemen in maple bieten sich Listen und der Substitutionsbefehl subs an. In obigem Beispiel w¨ urde man also das Axiom durch a := [f,p,f,p,f,p,f] definieren, die Substitutionsregeln lauten a -> subs(f=(f,p,f,m,f,m,f,f,p,f,p,f,m,f),a). Die Buchstaben p und m ¨ andern sich im Beispiel nicht, sie sind Fixpunkte in der Konstruktion. Zur Visualisierung kann man in maple Polygonz¨ uge verwenden, also Listen von Punkten (in der Ebene). Diese Listen kann man mit dem plot Befehl einfach zeichnen. Konstruktion von Fraktalen. Mit der obigen grafischen Interpretation und α = π/2 ist das Axiom fpfpfpf ein Quadrat, welches im Gegenuhrzeigersinn durchlaufen wird. Die Substitutionsregel macht aus Geradenst¨ ucken eine Zickzacklinie. Durch iterative Anwendung der Substitutionsregel entsteht aus dem Axiom ein Fraktal. Experiment 9.17 Erzeugen Sie mit dem maple -Arbeitsblatt mp09_1.mws verschiedene Fraktale. Versuchen Sie weiters, die Prozedur fractal im Detail zu verstehen.
120
9 Fraktale und L-Systeme
Beispiel 9.18 Die Substitutionsregel f¨ ur die Koch’sche Kurve lautet a -> subs(f=(f,p,f,m,m,f,p,f),a). Je nachdem, welches Axiom man verwendet, kann man daraus fraktale Kurven und Eisblumen bauen, vgl. das maple -Arbeitsblatt mp09_1.mws. Simulation von Pflanzenwachstum. Als neues Element kommen hier Verzweigungen (Ver¨ astelungen) hinzu. Mathematisch kann man das durch zwei neue Symbole beschreiben: v steht f¨ ur eine Ver¨ astelung; e steht f¨ ur das Ende des Astes. Betrachten wir beispielsweise das in maple als Liste definierte Wort [f,p,f,v,p,p,f,p,f,e,v,m,f,m,f,e,f,p,f,v,p,f,p,f,e,f,m,f]. Entfernt man alle Verzweigungen, die mit v beginnen und mit e enden, aus der Liste, erh¨alt man den Stamm der Pflanze stamm := [f,p,f,f,p,f,f,m,f]. Nach dem zweiten f im Stamm findet offenbar eine doppelte Verzweigung ¨ statt, es sprießen die Aste ast1 := [p,p,f,p,f]
und
ast2 := [m,f,m,f].
Weiter oben verzweigt der Stamm noch einmal mit dem Ast [p,f,p,f]. F¨ ur eine realistischere Modellierung kann man zus¨atzliche Parameter einf¨ uhren. Beispielsweise kann man Asymmetrie dadurch einbauen, dass man bei p um den positiven Winkel α dreht, und bei m um den negativen Winkel −β. Im Programm mp09_2.mws wurde das gemacht, vgl. Abb. 9.13. Experiment 9.19 Erzeugen Sie mit dem maple -Arbeitsblatt mp09_2.mws verschiedene k¨ unstliche Pflanzen. Versuchen Sie zudem, die Prozedur wachse im Detail zu verstehen.
Zur Visualisierung der erzeugten Pflanzen kann man in maple Listen von Polygonz¨ ugen verwenden, also Listen von Listen von Punkten (in der Ebene). Zur Implementierung der Verzweigungen verwendet man g¨ unstigerweise einen rekursiven Stapel (stack ). Immer dann, wenn man den Befehl v f¨ ur eine Verzweigung antrifft, speichert man den aktuellen Zustand als obersten Wert in den stack. Ein Zustand ist durch drei Zahlen (x, y, t) beschrieben, wobei x und y die Position in der x-y-Ebene bezeichnen, und t den mit der positiven x-Achse eingeschlossenen Winkel. Umgekehrt entfernt man, wenn man ein Astende e antrifft, den obersten Zustand aus dem stack und begibt sich in diesen Zustand, von wo aus man weiterzeichnet. Am Anfang ist der stack leer (am Ende sollte er es auch sein).
¨ 9.6 Ubungen
121
Abb. 9.13. Mit dem maple -Arbeitsblatt mp09 2.mws erzeugte Pflanzen.
Erweiterungen. Im Rahmen von L-Systemen sind viele Verallgemeinerungen m¨oglich, welche die entstehenden Strukturen noch realistischer machen. Beispielsweise k¨onnte man: (a) Den Buchstaben f durch k¨ urzere Strecken darstellen, je weiter man von der Wurzel der Pflanze entfernt ist. Dazu muss man den Abstand von der Wurzel als weiteren Zustandsparameter im stack abspeichern. (b) Den Zufall einbauen, indem man verschiedene Substitutionsregeln f¨ ur ein und denselben Buchstaben verwendet, und in jedem Schritt zuf¨allig eine ausw¨ahlt. Beispielsweise k¨onnten die Substitutionsregeln f¨ ur zuf¨alliges Unkraut wie folgt lauten: f -> (f,v,p,f,e,f,v,m,f,e,f) f -> (f,v,p,f,e,f) f -> (f,v,m,f,e,f)
mit Wahrscheinlichkeit 1/3; mit Wahrscheinlichkeit 1/3; mit Wahrscheinlichkeit 1/3.
Mittels Zufallszahlen w¨ahlt man in jedem Schritt die entsprechende Regel aus. Experiment 9.20 Erzeugen Sie mit dem maple -Arbeitsblatt mp09_3.mws zuf¨ allige Pflanzen. Versuchen Sie weiters, die implementierte Substitutionsregel im Detail zu verstehen.
¨ 9.6 Ubungen 1. Bestimmen Sie experimentell die fraktale Dimension der K¨ uste von Großbritannien. Nehmen Sie dazu eine Karte von Großbritannien zur Hand (beispielsweise eine Kopie aus einem Atlas) und rastern Sie die Karte mit verschiedenen Maschenweiten (zum Beispiel mit 1/64, 1/32, 1/16, 1/8 und 1/4 der Nord-S¨ ud Ausdehnung). Z¨ ahlen Sie die K¨ astchen, welche K¨ ustenlinien enthalten und tragen sie diese Zahl in einem doppellogarithmischen Diagramm als Funktion der Maschenweite ein. Legen Sie dann die beste Gerade durch diese Punkte und bestimmen Sie aus dem Anstieg der Geraden die gesuchte fraktale Dimension.
122
9 Fraktale und L-Systeme
2. Visualisieren Sie mit dem Programm mat09_3.mws die Julia-Mengen von zn+1 = zn2 + c f¨ ur c = −1.25 und c = 0.365 − 0.3 i. Suchen Sie interessante Details.
3. Sei f (z) = z 3 − 1 mit z = x + iy. Schreiben Sie das Newtonverfahren zur L¨ osung von f (z) = 0 an und trennen Sie Real- und Imagin¨ arteil, d.h. finden Sie Funktionen g1 und g2 mit xn+1 = g1 (xn , yn ), yn+1 = g2 (xn , yn ). 4. Modifizieren Sie im Programm mp09_2.mws die Prozedur wachse, indem Sie den Buchstaben f durch k¨ urzere Strecken darstellen, je nachdem, wie weit er von der Wurzel entfernt ist. Zeichnen Sie damit die Dolde aus Experiment 9.19 neu. 5. Modifizieren Sie das Programm mp09_3.mws, indem Sie die bestehenden Substitutionsregeln mit anderen Wahrscheinlichkeiten versehen (bzw. neue Substitutionsregeln erfinden). Zeichnen Sie mit dem so modifizierten Programm einige Pflanzen.
10 Stammfunktionen
¨ Die Ableitung einer Funktion y = F (x) beschreibt deren lokale Anderungsrate, al¨ ¨ so die Anderung ∆y des y-Werts bezogen auf die Anderung ∆x des x-Werts im Grenz¨ ubergang ∆x → 0, genauer f (x) = F ′ (x) = lim
∆x→0
F (x + ∆x) − F (x) ∆y = lim . ∆x→0 ∆x ∆x
Umgekehrt f¨ uhrt die Frage nach der Rekonstruktion einer Funktion aus ihrer loka¨ len Anderungsrate auf den Begriff des unbestimmten Integrals, welches die Gesamtheit aller Funktionen bezeichnet, die f als Ableitung besitzen, die Stammfunktionen von f . Kap. 10 wendet sich diesem Begriff, seinen Eigenschaften, einigen grundlegen¨ den Beispielen und Anwendungen zu. Multipliziert man die Anderungsrate f mit der ¨ ¨ Anderung ∆x, so erh¨ alt man eine N¨ aherung an die Anderung der Funktionswerte der Stammfunktion F u uck der L¨ ange ∆x: ¨ber dem Teilst¨ ∆y = F (x + ∆x) − F (x) ≈ f (x)∆x. ¨ Summiert man diese lokalen Anderungen u ¨ber ein Intervall, etwa zwischen x = a und x = b in Schritten der L¨ ange ∆x, so erh¨ alt man eine N¨ aherung an die Gesamt¨ anderung F (b) − F (a). Der Grenz¨ ubergang ∆x → 0 (unter entsprechender Erh¨ ohung der Summandenzahl) f¨ uhrt auf den Begriff des bestimmten Integrals von f u ¨ber dem Intervall [a, b], der Gegenstand von Kap. 11 ist.
10.1 Unbestimmte Integrale In Abschnitt 7.2 wurde gezeigt, dass die Ableitung einer Konstanten gleich Null ist. Dass die Umkehrung ebenfalls gilt, ist der Inhalt des folgenden Satzes. Satz 10.1 (Konstantentheorem) Ist f eine auf (a, b) differenzierbare Funktion und f ′ (x) = 0 f¨ ur alle x ∈ (a, b), so ist f konstant, das heißt, f (x) = c f¨ ur ein c ∈ R und alle x ∈ (a, b).
124
10 Stammfunktionen
Beweis: Wir w¨ahlen ein beliebiges x0 ∈ (a, b) und setzen c = f (x0 ). Ist nun x ∈ (a, b), so gilt nach dem Mittelwertsatz (Satz 8.4) f (x) − f (x0 ) = f ′ (ξ)(x − x0 ) f¨ ur ein ξ zwischen x und x0 . Da f ′ (ξ) = 0 ist, folgt f (x) = f (x0 ) = c. Dies gilt f¨ ur alle x ∈ (a, b), daher muss f gleich der konstanten Funktion mit Wert c sein. ⊓ ⊔ Definition 10.2 (Stammfunktionen) Sei f eine reellwertige Funktion auf einem Intervall (a, b). Eine Stammfunktion von f ist eine differenzierbare Funktion F : (a, b) → R, deren Ableitung F ′ gleich f ist. Beispiel 10.3 F (x) = 3 G(x) = x3 + 5.
x3 3
ist Stammfunktion von f (x) = x2 , ebenso auch
Das Konstantentheorem zeigt, dass Stammfunktionen bis auf eine additive Konstante eindeutig sind. Satz 10.4 Seien F und G Stammfunktionen von f auf (a, b). Dann gilt: F (x) = G(x) + c f¨ ur ein c ∈ R und alle x ∈ (a, b).
Beweis: F ′ (x)−G′ (x) = f (x)−f (x) = 0, also ist (F −G)′ = 0, daher F −G = c f¨ ur ein c ∈ R, das heißt, es ist F (x) = G(x) + c f¨ ur alle x ∈ (a, b). ⊓ ⊔ Definition 10.5 (Unbestimmte Integrale) Das unbestimmte Integral Z f (x) dx
bezeichnet die Gesamtheit aller Stammfunktionen von f . Hat man eine spezielle Stammfunktion F ermittelt, so schreibt man entsprechend Z f (x) dx = F (x) + c. Beispiel 10.6 Das unbestimmte Integral der Quadratfunktion (Beispiel 10.3) R 3 ist x2 dx = x3 + c. Beispiel 10.7 (a) Anwendung der unbestimmten Integration auf die Differentialgleichung des senkrechten Wurfs. Es bezeichne w(t) die H¨ohe (in Metern [m]) zum Zeitpunkt t (in Sekunden [s]) eines K¨orpers u ¨ber der Erdoberfl¨ache (w = 0), wobei die positive w-Richtung nach oben weise. Dann ist w′ (t) = v(t) die Geschwindigkeit des K¨orpers (positiv – nach oben) und v ′ (t) = a(t)
10.1 Unbestimmte Integrale
125
die Beschleunigung (positiv bei aufw¨ arts zunehmender Geschwindigkeit). Die Erdbeschleunigung g = 9.81 [m/s2 ] wirkt in diesem Koordinatensystem mit negativem Vorzeichen. Demnach ist a(t) = −g. Geschwindigkeit und Weg erhalten wir durch Umkehrung des Ableitungsvorgangs Z v(t) = a(t) dt + c1 = −gt + c1 Z Z g w(t) = v(t) dt + c2 = (−gt + c1 ) dt + c2 = − t2 + c1 t + c2 . 2 Die Konstanten c1 , c2 sind aus den Anfangsbedingungen ermittelbar: c1 = v(0)
...
Startgeschwindigkeit,
c2 = w(0)
...
Starth¨ohe.
(b) Ein konkretes Beispiel – der Fall aus hundert Meter H¨ohe. Hier ist w(0) = 100,
v(0) = 0
also
1 w(t) = − 9.81t2 + 100. 2 Das Weg-Zeit-Diagramm (Abb. 10.1) zeigt parabolischen Verlauf.
100
c2
w(t)
50
0
t
t0 0
2
4
6
Abb. 10.1. Freier Fall: Weg-Zeit-Diagramm.
Den Aufprallzeitpunkt t0 erhalten wir aus p 1 0 = − 9.81t20 + 100, t0 = 200/9.81 ≈ 4.5 [s], 2 die Aufprallgeschwindigkeit zu v(t0 ) = −gt0 ≈ 44.3 [m/s] ≈ 160 [km/h].
126
10 Stammfunktionen
10.2 Integrationsformeln Aus Definition 10.5 folgt unmittelbar, dass die unbestimmte Integration als Umkehrung der Differentiation betrachtet werden kann, allerdings nur bis auf eine Konstante eindeutig: ′ Z f (x) dx = f (x), Z g ′ (x) dx = g(x) + c. ¨ Mit dieser Uberlegung und den Formeln aus Abschnitt 7.4 erh¨alt man leicht die grundlegenden Integrationsformeln der folgenden Tabelle. Die Formeln gelten auf den jeweiligen Definitionsbereichen. Tabelle 10.1. Integrale einiger elementarer Funktionen
f (x) Z
f (x) dx
f (x) Z
f (x) dx
xα , α 6= −1
1 x
ex
ax
xα+1 +c α+1
log |x| + c
ex + c
1 ax + c log a
sin x
cos x
− cos x + c
sin x + c
√
1 1 − x2
arcsin x + c
1 1 + x2 arctan x + c
Der Beweis der Formeln in Tabelle 10.1 ergibt sich unmittelbar aus Tabelle 7.1. Experiment 10.8 Stammfunktionen k¨ onnen in maple mit dem Befehl int berechnet werden. Erl¨ auterungen zu diesem und weiteren Integrationsbefehlen finden Sie im maple -Worksheet mp10 1.mws. Experimentieren Sie mit diesen maple -Befehlen, indem Sie sie auf die Beispiele aus Tabelle 10.1 und andere von Ihnen gew¨ ahlte Funktionen anwenden. Experiment 10.9 Lassen Sie maple die folgenden Ausdr¨ ucke integrieren: 2
xe−x ,
2
e−x ,
sin(x2 ) .
Funktionen, die sich aus Kombinationen von Potenz-, Exponential- und Winkelfunktionen sowie deren Umkehrfunktionen ergeben, nennt man elementar.
10.2 Integrationsformeln
127
Die Ableitung einer elementaren Funktion ist wieder eine elementare Funktion und kann mit den Regeln aus Kapitel 7 gewonnen werden. Im Gegensatz zur Differentiation elementarer Funktionen gibt es kein allgemeines Verfahren zur Berechnung von unbestimmten Integralen. Nicht nur, dass sich die Ermittlung eines Integrals oft als schwierige Aufgabe herausstellt, gibt es zahlreiche elementare Funktionen, deren Stammfunktion nicht elementar ist. Ein Algorithmus zur Entscheidung der Frage, welche elementaren Funktionen elementar integrierbar sind und welche nicht, wurde erstmals um 1835 von Liouville1 hergeleitet. Daraus entwickelte sich das Gebiet der symbolischen Integration; wir verweisen etwa auf [9]. Beispiel 10.10 (Integrale nicht elementar integrierbarer Funktionen) Durch die Stammfunktionen nicht elementar integrierbarer Funktionen werden h¨aufig so genannte h¨oher transzendente Funktionen definiert. Wir geben die folgenden Beispiele: Z 2 2 √ e−x dx = Erf(x) + c . . . Gauß’sche Fehlerfunktion; π Z x e dx = Ei(x) + c . . . Exponentialintegral; x Z 1 dx = ℓi(x) + c . . . Integrallogarithmus; log x Z sin x dx = Si(x) + c . . . Integralsinus; x Z π x2 dx = S(x) + c . . . Fresnel’sches2 Integral. sin 2 Satz 10.11 (Integrationsregeln zum unbestimmten Integrieren) R R R (a) Summe: f (x) + g(x) dx = f (x) dx + g(x) dx R R (b) Konstanter Faktor: λf (x) dx = λ f (x) dx (λ ∈ R) (c) Partielle Integration: Z Z f (x)g ′ (x) dx = f (x)g(x) − f ′ (x)g(x) dx (d) Substitution:
Z
′
f (g(x))g (x) dx =
Z
f (y) dy
y=g(x)
.
Beweis: (a) und (b) sind klar; (c) folgt aus der Produktregel f¨ ur die Ableitung (Abschnitt 7.4) Z Z Z Z f g ′ dx + f ′ g dx = (f g ′ + f ′ g) dx = (f g)′ dx = f g + c. 1 2
J. Liouville, 1809–1882. A.J. Fresnel, 1788–1827.
128
10 Stammfunktionen
Daraus ergibt sich die Formel Z Z ′ f g dx = f g − f ′ g dx in welcher die Integrationskonstante c absorbiert ist, da auf beiden Seiten die Gesamtheit aller entsprechenden Stammfunktionen gemeint ist. Punkt (d) ist eine unmittelbare Folge der Kettenregel, wonach eine Stammfunktion von f (g(x))g ′ (x) eben gerade die Stammfunktion von f (y), ausgewertet an der Stelle y = g(x), ist. ⊓ ⊔ Beispiel 10.12 Wie die Regeln angewendet werden k¨onnen, wird in den folgenden f¨ unf Beispielen vorgef¨ uhrt. Z Z 1 dx 3 x− 3 +1 −1/3 √ (a) + c = x2/3 + c. = x dx = 3 − 31 + 1 2 x (b)
Z
x cos x dx = x sin x −
Z
1 · sin x dx = x sin x + cos x + c,
wie mittels partieller Integration folgt: f (x) = x, g ′ (x) = cos x f ′ (x) = 1, g(x) = sin x (c)
Z
log x dx = x log x −
Z
x dx = x log x − x + c, x
mittels partieller Integration: f (x) = log x, g ′ (x) = 1 f ′ (x) = x1 , g(x) = x (d)
Z
2
x sin(x ) dx =
Z
1 1 1 sin y dy = − cos y +c = − cos(x2 )+c, 2 2 2 y=x2 y=x2
was aus der Substitutionsregel mit y = g(x) = x2 , g ′ (x) = 2x, f (y) = 1 2 sin y folgt. (e)
Z
tan x dx =
Z
sin x dx = − log |y| + c = − log |cos x| + c, cos x y=cos x
wiederum nach Substitution mit y = g(x) = cos x, g ′ (x) = − sin x und f (y) = −1/y.
¨ 10.3 Ubungen
129
¨ 10.3 Ubungen 1. Ein K¨ orper wird mit einer Geschwindigkeit von 10 [m/s] vom Erdboden senkrecht nach oben geworfen. Ermitteln Sie seine Flugh¨ ohe w(t) in Abh¨ angigkeit vom Zeitpunkt t, die maximale Steigh¨ ohe sowie den Zeitpunkt der Wiederkehr. Hinweis: Integrieren Sie w′′ (t) = −g ≈ 9.81 [m/s2 ] zweimal unbestimmt und ermitteln Sie Integrationskonstanten aus den Anfangsbedingungen w(0) = 0, w′ (0) = 10. 2. Berechnen Sie die folgenden unbestimmten Integrale sowohl h¨ andisch als auch mit maple : R (a) (x + 3x2 + 5x4 + 7x6 ) dx R dx √ (b) x R −x2 dx (Substitution) (c) xe R x (d) xe dx (partielle Integration) 3. Berechnen Sie die unbestimmten Integrale R (a) cos2 x dx R√ (b) 1 − x2 dx
h¨ andisch und u ufen Sie die Resultate mit maple . ¨berpr¨ Hinweise: Verwenden Sie in (a) die Identit¨ at cos2 x =
1 (1 + cos 2x) 2
und in (b) die Substitution y = g(x) = arcsin x, f (y) = 1 − sin2 y.
11 Bestimmte Integrale
In der Einleitung zu Kap. 10 wurde erl¨ autert, wie die Summation von Ausdr¨ ucken der Form f (x)∆x im Grenz¨ ubergang zum Begriff des bestimmten Integrals der Funktion f u uhrt. In zahlreichen Anwendungen treten derartige ¨ber einem Intervall [a, b] f¨ Summen in der Modellbildung auf, von der Fl¨ achen-, Oberfl¨ achen- und Volumsberechnung bis zur L¨ angenberechnung von Kurven. Wir ben¨ utzen in diesem Kapitel den Riemann’schen Integralbegriff, um das Konzept der bestimmten Integration zu pr¨ azisieren. Der Riemann’sche Zugang kommt den anschaulichen Vorstellungen vieler Anwendungen sehr entgegen, wie in Beispielen gegen Ende des Kapitels vorgef¨ uhrt wird. Der Hauptteil von Kap. 11 ist den Eigenschaften des Integrals gewidmet. Insbesondere werden die beiden Haupts¨ atze der Differential- und Integralrechnung bewiesen. Der erste Hauptsatz erlaubt die Berechnung eines bestimmten Integrals bei Kenntnis einer Stammfunktion; der zweite Hauptsatz besagt umgekehrt, dass das bestimmte Integral einer Funktion f u ¨ber einem Intervall [a, x] mit variabler oberer Grenze eine Stammfunktion von f liefert. Da das bestimmte Integral stets, zum Beispiel durch Riemannsummen, angen¨ ahert werden kann, ergibt der zweite Hauptsatz eine M¨ oglichkeit, die Stammfunktionen nicht elementar integrierbarer Funktionen numerisch (n¨ aherungsweise) zu berechnen – von großer Bedeutung zum Beispiel in der Statistik bei der Berechnung zahlreicher Verteilungsfunktionen.
11.1 Das Riemannintegral Beispiel 11.1 (Von der Geschwindigkeit zum Weg) Wie kann man den Weg w berechnen, den ein Fahrzeug zwischen den Zeitpunkten a und b zur¨ uckgelegt hat, wenn man seine Geschwindigkeit v(t) f¨ ur a ≤ t ≤ b kennt? Falls v(t) ≡ v konstant ist, einfach zu w = v · (b − a). Falls die Geschwindigkeit v(t) zeitabh¨angig ist, kann man die Zeitachse in kurze Teilintervalle zerlegen (Abb. 11.1): a = t0 < t1 < t2 < ... < tn = b.
132
11 Bestimmte Integrale τ1
τ2
a = t0 t1
τn t2
···
tn−1
t tn = b
Abb. 11.1. Zerlegung der Zeitachse.
W¨ahlt man jeweils Zwischenpunkte τj ∈ [tj−1 , tj ] und ist v eine stetige Funktion der Zeit, so gilt n¨ aherungsweise v(t) ≈ v(τj ) f¨ ur t ∈ [tj−1 , tj ] und zwar umso genauer, je k¨ urzer [tj−1 , tj ]. Der zur¨ uckgelegte Weg im kurzen Zeitintervall ist dann ungef¨ ahr gleich wj ≈ v(τj )(tj − tj−1 ). Der Gesamtweg zwischen Zeitpunkt a und Zeitpunkt b ist dann w=
n X j=1
wj ≈
n X j=1
v(τj )(tj − tj−1 ).
L¨asst man nun die L¨ angen der Zeitintervalle [tj−1 , tj ] gegen Null gehen, so sollte im Grenzwert der tats¨ achliche Wert w f¨ ur den Weg herauskommen. Beispiel 11.2 (Fl¨ ache unter dem Graphen einer nichtnegativen Funktion) In ahnlicher Weise kann man versuchen, die Fl¨ ache unter einem Funktionsgra¨ phen y = f (x) durch feiner und feiner werdende Rechtecke zu approximieren (Abb. 11.2).
y
a = x0 x1 x2 x3 · · · xn−1 xn = b ξ1 ξ2 ξ3 ξn
x
Abb. 11.2. Rechteckssumme als Approximation an die Fl¨ ache.
Der tats¨achliche Fl¨ acheninhalt sollte sich als Grenzwert der Rechtecksfl¨achensummen ergeben: n X F ≈ f (ξj )(xj − xj−1 ). j=1
11.1 Das Riemannintegral
133
Den beiden Beispielen liegt ein gemeinsames Konzept zu Grunde, das Riemannintegral 1 , das wir nun einf¨ uhren. Gegeben sei ein Intervall [a, b] und eine Funktion f = [a, b] → R. Wir nehmen Punkte a = x0 < x1 < x2 < ... < xn−1 < xn = b. Die Intervalle [x0 , x1 ], [x1 , x2 ], . . . , [xn−1 , xn ] bilden eine Zerlegung Z des Intervalls [a, b]. Ihre Feinheit Φ(Z) ist die L¨ ange des gr¨oßten Teilintervalls: Φ(Z) = max |xj − xj−1 |. j=1,...,n
W¨ahlt man beliebige Zwischenpunkte ξj ∈ [xj−1 , xj ], so nennt man S=
n X j=1
f (ξj )(xj − xj−1 )
eine Riemannsumme. Um die Idee des Grenz¨ ubergangs oben zu pr¨azisieren, nehmen wir eine Folge Z1 , Z2 , Z3 , ... von Zerlegungen, deren Feinheit Φ(ZN ) → 0 geht f¨ ur N → ∞, und zugeh¨ orige Riemannsummen SN . Definition 11.3 Eine Funktion f heißt auf [a, b] Riemann-integrierbar, falls f¨ ur beliebige Folgen von Zerlegungen (ZN )N ≥1 mit Φ(ZN ) → 0 die zugeh¨origen Riemannsummen (SN )N ≥1 unabh¨ angig von der Wahl der Zwischenpunkte gegen denselben Grenzwert I(f ) streben. Dieser Grenzwert I(f ) =
Z
b
f (x) dx
a
heißt das bestimmte Integral von f auf [a, b]. Die einleitenden Beispiele 11.1 und 11.2 k¨ onnen wir im Falle der RiemannIntegrierbarkeit der beteiligten Funktionen f bzw. v so interpretieren, dass das Integral Z b F = f (x) dx a
den Fl¨acheninhalt zwischen x-Achse und der Kurve darstellt und Z b w= v(t) dt a
den zur¨ uckgelegten Gesamtweg. Experiment 11.4 Rufen Sie das MATLAB -File mat11 1.m auf, studieren Sie die dort gegebene Hilfe und experimentieren Sie mit verschiedenen zuf¨ allig gew¨ ahlten Riemannsummen f¨ ur die Funktion f (x) = 3x2 auf dem Intervall [0, 1]. Was passiert, wenn Sie die Anzahl der Zerlegungspunkte n gr¨ oßer und gr¨ oßer w¨ ahlen? 1
B. Riemann, 1826–1866.
134
11 Bestimmte Integrale
¨ Experiment 11.5 Offnen Sie das Applet Riemann-Summen und studieren Sie die Auswirkungen der Feinheit der Zerlegung, der Wahl der Zwischenpunkte sowie des Vorzeichens der zu integrierenden Funktion auf das Ergebnis.
Die folgenden Beispiele m¨ ogen den Begriff der Riemann-Integrierbarkeit erl¨ autern und eingrenzen. Beispiel 11.6 (a) Sei f (x) = c = konstant. Dann ist die Fl¨ache unter dem Funktionsgraphen die Rechtecksfl¨ ache c(b − a). Vergleichen wir mit einer Riemannsumme f (ξ1 )(x1 − x0 ) + f (ξ2 )(x2 − x1 ) + . . . + f (ξn )(xn − xn−1 ) = c(x1 − x0 + x2 − x1 + . . . + xn − xn−1 ) = c(xn − x0 ) = c(b − a).
Alle Riemannsummen sind gleich und es gilt tats¨achlich Z b c dx = c(b − a). a
1 x
(b) Sei f (x) = f¨ ur x ∈ (0, 1], f (0) = 0. Diese Funktion ist auf [0, 1] nicht integrierbar. Die Riemannsummen sind von der Form 1 1 1 (x1 − 0) + (x2 − x1 ) + . . . + (xn − xn−1 ). ξ1 ξ2 ξn Indem man ξ1 nahe bei 0 w¨ahlt, kann jede solche Riemannsumme beliebig groß gemacht werden, also existiert der Grenzwert der Riemannsummen nicht. (c) Die Dirichlet’sche Sprungfunktion 2 ( 1, f (x) = 0,
x∈Q x 6∈ Q
ist auf [0, 1] nicht integrierbar: Die Riemannsummen sind von der Form SN = f (ξ1 )(x1 − x0 ) + . . . + f (ξn )(xn − xn−1 ). Falls alle ξj ∈ Q sind, so ist SN = 1. Nimmt man alle ξj 6∈ Q, so ist SN = 0, der Grenzwert also nicht unabh¨angig von der Wahl der Zwischenpunkte ξj . Bemerkung 11.7 Riemann-integrierbare Funktionen f : [a, b] → R sind notwendigerweise beschr¨ankt. Diese Tatsache kann unschwer durch Verallgemeinerung des Arguments aus Beispiel 11.6(b) gezeigt werden. Die wichtigsten Kriterien f¨ ur Riemann-Integrierbarkeit fassen wir im folgenden Satz zusammen. Sein Beweis ist einfach, ben¨otigt aber einige technische Betrachtungen u ¨ber Verfeinerungen von Zerlegungen; wir verweisen daher auf die weiter f¨ uhrende Literatur, etwa [4, Kap. 9.6]. 2
P.G. Dirichlet Lejeune, 1805–1859.
11.1 Das Riemannintegral
135
Satz 11.8 (a) Jede auf dem Intervall [a, b] beschr¨ankte und monoton wachsende oder monoton fallende Funktion f ist Riemann-integrierbar auf [a, b]. (b) Jede auf dem Intervall [a, b] st¨ uckweise stetige Funktion f ist Riemannintegrierbar auf [a, b]. ⊓ ⊔ Dabei heißt eine Funktion st¨ uckweise stetig, wenn sie stetig ist bis auf endlich viele Sprungstellen und u ¨berdies ihr Graph in jeder Sprungstelle einen linksseitigen und einen rechtsseitigen Grenzwert besitzt (Abb. 11.3). y
a
b c
d
x
Abb. 11.3. Eine st¨ uckweise stetige Funktion.
Bemerkung 11.9 Nimmt man ¨ aquidistante St¨ utzstellen a = x0 < x1 < ... < xn−1 < xn = b f¨ ur die Zerlegungen, also xj − xj−1 =: ∆x =
b−a , n
so schreiben sich die Riemannsummen als SN =
n X
f (ξj )∆x.
j=1
¨ Der Ubergang ∆x → 0 bei gleichzeitiger Vergr¨oßerung der Anzahl der Summanden ins Kontinuierliche legt die Schreibweise Z
b
f (x) dx
a
nahe. Urspr¨ unglich wurde sie von Leibniz3 durchaus mit der Interpretation einer unendlichen Summe u ¨ber unendlich schmale Rechtecke der Breite dx eingef¨ uhrt. Diese Interpretation kann heute im Rahmen der NichtstandardAnalysis pr¨azise gerechtfertigt werden (siehe etwa [23, Kap. III.2]). Die Integrationsvariable x ist beim bestimmten Integral u ¨brigens eine gebundene Variable und kann durch jeden beliebigen Buchstaben ersetzt werden: 3
G. Leibniz, 1646–1716.
136
11 Bestimmte Integrale
Z
b
f (x) dx =
Z
b
f (t) dt =
b
f (ξ) dξ = . . .
a
a
a
Z
¨ Dies kann mit Vorteil verwendet werden, um eine Uberschneidung der Bezeichnung mit anderweitig gebundenen Variablen zu vermeiden. Satz 11.10 (Eigenschaften des Integrals) Im Folgenden sei a < b und f, g Riemann-integrierbar auf [a, b]. (a) Positivit¨at: f ≥ 0 auf [a, b]
⇒
f ≤ 0 auf [a, b]
⇒
Z
b
f (x) dx ≥ 0,
a
Z
a
b
f (x) dx ≤ 0.
(b) Monotonie: f ≤ g auf [a, b]
Z
⇒
b
f (x) dx ≤
a
Z
b
g(x) dx.
a
Insbesondere gilt mit m = inf f (x),
M = sup f (x)
x∈[a,b]
x∈[a,b]
die Ungleichung m(b − a) ≤
Z
b
a
f (x) dx ≤ M (b − a).
(c) Summe und konstanter Faktor (Linearit¨ at): Z b Z b Z f (x) + g(x) dx = f (x) dx + a
Z
a
b
λf (x) dx = λ
a
Z
b
g(x) dx
a
b
f (x) dx
(λ ∈ R).
a
(d) Zerlegung des Integrationsbereichs: Es sei zun¨achst a < b < c und f integrierbar auf [a, c]. Dann gilt Z b Z c Z c f (x) dx + f (x) dx = f (x) dx. a
Definiert man Z a a
f (x) dx = 0,
b
a
Z
b
a
f (x) dx = −
Z
b
f (x) dx, a
so erh¨alt man die G¨ ultigkeit der Summenformel sogar f¨ ur beliebige a, b, c ∈ R, wenn f auf den jeweiligen Bereichen integrierbar ist.
11.2 Haupts¨ atze der Differential- und Integralrechnung
137
Beweis: Alle Begr¨ undungen ergeben sich leicht durch Hinschreiben der Riemannsummen. ⊓ ⊔
Punkt (a) aus Satz 11.10 zeigt, dass die Interpretation als Fl¨ache unter dem Funktionsgraphen nur zutreffend ist, wenn f ≥ 0 ist. Die Interpretation mittels Weg als Integral der Geschwindigkeit ist auch f¨ ur negative Geschwindigkeiten bzw. Wege sinnvoll (Richtungs¨ anderung). Punkt (d) ist vor allem wichtig f¨ ur die Integration st¨ uckweise stetiger Funktionen (vgl. Abb. 11.3): Das Integral ergibt sich als Summe u ¨ber die Teilintegrale.
11.2 Haupts¨ atze der Differential- und Integralrechnung Definition 11.11 (Summenfunktion) Die Funktion Z x F (x) = f (t) dt a
heißt Summenfunktion zu f (x). Die Summenfunktion ergibt sich also, wenn man die obere Grenze des Integrationsbereichs als Variable auffasst. In der Fl¨ acheninterpretation (bei positivem f (x)) ist F (x) die Fl¨ ache unter dem Funktionsgraphen u ¨ber dem Intervall [a, x], siehe Abb. 11.4.
y = f (x)
F (x) a
x
b
x
Abb. 11.4. Summenfunktion. Experiment 11.12 Gehen Sie in mathe online zu Galerie – Integrieren, ¨ offnen Sie das Applet Das Integral intuitiv verstehen und testen Sie, wie die Summenfunktion zu verschiedenen Grundfunktionen verl¨ auft.
Satz 11.13 (Haupts¨ atze der Differential- und Integralrechnung) Sei f stetig auf [a, b]. Dann gilt: (a) Erster Hauptsatz: Ist G eine Stammfunktion von f , so ist Z
a
b
f (x) dx = G(b) − G(a).
138
11 Bestimmte Integrale
(b) Zweiter Hauptsatz: Die Summenfunktion F ist eine Stammfunktion von f , das heißt Z x ′ f (t) dt = f (x). a
Beweis: Zuerst beweisen wir den zweiten Hauptsatz. Sei dazu x ∈ (a, b), h > 0 und x + h ∈ (a, b). Nach Satz 6.15 nimmt die Funktion f im Intervall [x, x + h] Minimum und Maximum an: m(h) =
min
t∈[x,x+h]
f (t),
M (h) =
max f (t).
t∈[x,x+h]
Wegen der Stetigkeit von f konvergieren m(h) → f (x), M (h) → f (x) f¨ ur h → 0. Nach Punkt (b) von Satz 11.10 ist m(h) · h ≤ F (x + h) − F (x) =
Z
x+h
x
f (t) dt ≤ M (h) · h.
Es folgt F (x + h) − F (x) = f (x). h Der erste Hauptsatz folgt aus dem zweiten Hauptsatz: F ′ (x) = lim
h→0
Z
a
b
f (t) dt = F (b) = F (b) − F (a),
da F (a) = 0 ist. Ist G eine andere Stammfunktion, so ist nach dem Konstantentheorem (Satz 10.1) G = F + c, somit G(b) − G(a) = F (b) + c − (F (a) + c) = F (b) − F (a),
also gleich
Rb a
f (x) dx.
⊓ ⊔
Anwendungen des ersten Hauptsatzes. Die wichtigste Anwendung beRb steht in der Berechnung von a f (x) dx. Man ermittle dazu eine Stammfunktion F (x), etwa als unbestimmtes Integral, und setze ein: Z
a
b
x=b f (x) dx = F (x) = F (b) − F (a). x=a
Beispiel 11.14 Es gilt: x=3 Z 3 27 1 26 x3 2 = − = . (a) x dx = 3 x=1 3 3 3 1 x=π/2 Z π/2 π (b) cos x dx = sin x = sin − sin 0 = 1. 2 0
x=0
11.3 Anwendungen des bestimmten Integrals
(c)
139
x=1 1 1 1 1 2 2 x sin(x ) dx = − cos(x ) = − cos 1 − − cos 0 2 2 2 0 x=0 1 1 = − cos 1 + (siehe dazu Beispiel 10.12). 2 2
Z
Bemerkung 11.15 Die Integration von Ausdr¨ ucken und Funktionen erfolgt in maple mit Hilfe des Befehls int unter Angabe des Bereiches, etwa int(x^2, x = 1..3); Anwendungen des zweiten Hauptsatzes. Diese sind meist theoretischer Natur, wie die Beschreibung des Zusammenhangs Weg-Geschwindigkeit, Z t w(t) = w(0) + v(s) ds, w′ (t) = v(t), 0
wobei w(t) den bis zum Zeitpunkt t zur¨ uckgelegten Weg und v(t) die Momentangeschwindigkeit bezeichnet; oder aber numerischer Natur: Z x 2 2 e−y dy ist eine Stammfunktion von e−x . 0
Die Auswertung eines derartigen Integrals kann n¨aherungsweise mittels Taylorpolynomen (siehe Anwendung 12.18) oder numerischen Integrationsmethoden erfolgen (siehe Abschnitt 13.1); dies auch dann, wenn die Stammfunktion keine elementare Funktion ist, wie bei der Gauß’schen Fehlerfunktion aus Beispiel 10.10.
11.3 Anwendungen des bestimmten Integrals Wir wenden uns nun weiteren Anwendungen des bestimmten Integrals zu, die die modellbildende Kraft des Riemann’schen Integralbegriffs belegen. Das Volumen von Rotationsk¨ orpern. Von einem dreidimensionalen K¨orper sei (nach Wahl eines geeigneten kartesischen Koordinatensystems) f¨ ur jedes x ∈ [a, b] der Fl¨acheninhalt F = F (x) des Querschnitts bekannt (Abb. 11.5). Das Volumen einer d¨ unnen Scheibe der Dicke ∆x betr¨agt n¨aherungsweise F (x)∆x. Anschreiben der Riemannsummen und Grenz¨ ubergang ergibt f¨ ur das Volumen V des K¨orpers Z b F (x) dx. V = a
Speziell gilt im Falle eines Rotationsk¨orpers, der durch Drehung einer Kurve y = f (x), a ≤ x ≤ b, um die x-Achse entsteht, Z b f (x)2 dx. V =π a
140
11 Bestimmte Integrale
Beispiel 11.16 (Volumen eines Kreiskegels) Nach passender Wahl des Koordinatensystems erh¨ alt man durch Rotation der Geraden y = hr x um die x-Achse einen Kegel vom Radius r und der H¨ohe h (Abb. 11.6). Sein Volumen ist x=h Z r2 x3 r2 h 2 h x dx = π 2 · V =π 2 = πr2 . h 0 h 3 x=0 3 y
y
z
r
z
F (x)
h
∆x
x
x Abb. 11.5. Drehk¨ orper, Volumen.
Abb. 11.6. Kreiskegel.
Bogenl¨ ange eines Funktionsgraphen. Wir nehmen zun¨achst eine Zerlegung des Intervalls [a, b] vor, a = x0 < x1 < x2 < ... < xn = b, und ersetzen den Graphen y = f (x) u ¨ber [a, b] durch einen Streckenzug durch die Punkte (x0 , f (x0 )), (x1 , f (x1 )), . . . , (xn , f (xn )). Die L¨ange des Streckenzugs ist n q X sn = (xj − xj−1 )2 + (f (xj ) − f (xj−1 ))2 j=1
und einfach durch die Summen der L¨angen der einzelnen Teilstrecken gegeben (Abb. 11.7). Nach dem Mittelwertsatz (Satz 8.4) ist sn =
n q X j=1
=
n q X j=1
(xj − xj−1 )2 + f ′ (ξj )2 (xj − xj−1 )2 1 + f ′ (ξj )2 (xj − xj−1 )
mit Punkten ξj ∈ [xj−1 , xj ]. Dies sind aber gerade Riemannsummen. Deren Grenzwert lautet im Falle der stetigen Differenzierbarkeit von f : s=
Z
a
b
p 1 + f ′ (x)2 dx.
11.3 Anwendungen des bestimmten Integrals
141
y = f (x)
f (x3 ) f (x2 )
a = x0
x1 x2
x3 x4
x5 = b
x
Abb. 11.7. Bogenl¨ ange.
Mantelfl¨ ache eines Drehk¨ orpers. Die Mantelfl¨ache entstehe wieder durch Drehung der Kurve y = f (x), a ≤ x ≤ b, um die x-Achse. Wir zerteilen den K¨ orper in schmale Scheiben der Dicke ∆x. Jede dieser y Scheiben ist n¨aherungsweise ein Kegelstumpf mit Mantellinie der L¨ ange ∆s und mittlerem Radius f (x), sief (x) ¨ he Abb. 11.8. Nach Ubung 11 aus z Kapitel 3 ist die Mantelfl¨ ache dieses Kegelstumpfs n¨aherungsweise gleich ∆s 2πf (x)∆s.p Nach dem vorher Gesagten ′ 2 ist ∆s ≈ 1 + f (x) ∆x und damit x betr¨agt die Mantelfl¨ache der schmalen Scheibe etwa Abb. 11.8. Drehk¨ orper, Mantelfl¨ ache. p 2πf (x) 1 + f ′ (x)2 ∆x.
Anschreiben der Riemannsummen und Grenz¨ ubergang ergibt f¨ ur die gesamte Mantelfl¨ache Z b p M = 2π f (x) 1 + f ′ (x)2 dx. a
Beispiel 11.17 (Mantelfl¨ache eines Kreiskegels) Im Falle des Kegels aus Beispiel 11.16 ist f (x) = hr x, f ′ (x) = hr , also M = 2π
Z
0
h
r r p r2 r h2 r2 r x 1 + 2 dx = 2π · 1 + 2 = πr h2 + r2 h h h 2 h
¨ ¨ in Ubereinstimmung mit der in Ubung 11 aus Kapitel 3 mit geometrischen Mitteln hergeleiteten Formel.
142
11 Bestimmte Integrale
¨ 11.4 Ubungen 1. Modifizieren Sie das MATLAB -Programm mat11 1.m so, dass es Riemannsummen vorgegebener L¨ ange n von Polynomen vom Grad k u ¨ber beliebigen Intervallen [a, b] auswertet (MATLAB -Befehl polyval). 2. Beweisen Sie mittels Def. 11.3, dass jede st¨ uckweise konstante Funktion auf einem Intervall [a, b] Riemann-integrierbar ist. √ 3. Berechnen Sie die Fl¨ ache zwischen den Graphen von y = sin x und y = x u ¨ber dem Intervall [0, 2π]. 4. Gehen Sie in mathe online zu Interaktive Tests – Integrieren und l¨ osen Sie die unter Bestimmte Integrale u ¨ben – Sinusfunktion gestellten Aufgaben. 5. (Aus der technischen Mechanik) F¨ ur die Querkraft Q(x) und das Biegemoment M (x) eines Tr¨ agers der L¨ ange L unter einer Streckenlast p(x) gelten die Beziehungen M ′ (x) = Q(x), Q′ (x) = −p(x), 0 ≤ x ≤ L. Berechnen Sie und skizzieren Sie in einem Diagramm Q(x) und M (x) f¨ ur (a) einen frei gelagerten Tr¨ ager unter Gleichlast: p(x) = p0 , Q(0) = p0 L/2, M (0) = 0; (b) einen Kragtr¨ ager unter Dreieckslast: p(x) = q0 (1 − x/L), Q(L) = 0, M (L) = 0.
q0
p0 x 0
0
L
L
x
Abb. 11.9. Freier Tr¨ ager unter Gleichlast, Kragtr¨ ager unter Dreieckslast.
6. Schreiben Sie ein MATLAB -Programm, das eine numerische N¨ aherung an das Integral Z 1
2
e−x dx
0
liefert. Verwenden Sie dazu Riemannsummen der Form U=
n X
j=1
2
e−xj ∆x,
O=
n X
2
e−xj−1 ∆x
j=1
mit xj = j∆x, ∆x = 1/n und versuchen Sie ∆x bzw. n so zu bestimmen, dass O − U ≤ 0.01 ist, das Ergebnis also auf 2 Stellen genau ist. Vergleichen Sie auch mit dem MATLAB -Befehl sqrt(pi)/2*erf(1). Ra 2 Zusatzaufgabe: Erg¨ anzen Sie Ihr Programm, sodass es 0 e−x dx f¨ ur beliebiges a > 0 berechnen kann.
¨ 11.4 Ubungen
143
7. Analysieren Sie, warum in Aufgabe 6 tats¨ achlich Z 1 2 U≤ e−x dx ≤ O 0
gilt, U und O also Unter- und Obersummen bilden und warum die Abweichung zum Wert des Integrals kleiner als O − U ist. Verwenden Sie das Applet Integration zur Veranschaulichung. √ 8. Durch Rotation des Parabelst¨ ucks y = 2 x, 0 ≤ x ≤ 1 um die x-Achse entsteht ein Paraboloid. Skizzieren Sie es und berechnen Sie (a) sein Volumen, (b) seine Mantelfl¨ ache.
12 Taylorreihen
Approximationen komplizierter Funktionen durch einfachere Funktionen spielen in der angewandten Mathematik einen große Rolle. Ausgehend von der linearen Approximation besprechen wir in diesem Kapitel die Approximation einer Funktion durch Taylorpolynome sowie durch die Taylorreihe. Als wichtige Anwendungen behandeln wir unter anderem die Bestimmung von Grenzwerten einer Funktion sowie die Analyse von N¨ aherungsformeln der numerischen Mathematik.
12.1 Die Formel von Taylor In diesem Abschnitt befassen wir uns mit der Approximation von hinreichend oft differenzierbaren Funktionen durch Polynome und mit Anwendungen dieser Approximationen. Eine erste N¨aherungsformel haben wir bereits in Kapitel 7 kennen gelernt: Sei f eine im Punkt a differenzierbare Funktion. Dann gilt f¨ ur alle x nahe bei a f (x) ≈ g(x) = f (a) + f ′ (a) · (x − a). Die lineare Approximation g ist ein Polynom vom Grad 1 in x, ihr Graph ist gerade die Tangente an f im Punkt a. Dieses Approximationsresultat wollen wir nun verallgemeinern. Satz 12.1 (Formel von Taylor1 ) Sei I ⊆ R ein offenes Intervall und f : I → R eine (n + 1)-mal stetig differenzierbare Funktion (d.h. die (n + 1)-te Ableitung von f ist stetig). Dann gilt f¨ ur alle x, a ∈ I f (x) = f (a)+f ′ (a)·(x−a)+
f ′′ (a) f (n) (a) (x−a)2 +...+ (x−a)n +Rn+1 (x, a) 2! n!
mit dem Restglied (in Integralform) 1
B. Taylor, 1685–1731.
146
12 Taylorreihen
Rn+1 (x, a) =
1 n!
Z
a
x
(x − t)n f (n+1) (t) dt.
Alternativ ist das Restglied durch die Formel Rn+1 (x, a) =
f (n+1) (ξ) (x − a)n+1 (n + 1)!
mit einem ξ zwischen x und a
gegeben (Lagrange’sche2 Form des Restglieds). Beweis: Nach dem Hauptsatz der Differential- und Integralrechnung gilt Z x f ′ (t) dt = f (x) − f (a), a
also f (x) = f (a) +
Z
x
f ′ (t) dt.
a
Diese Formel wird nun partiell integriert. Wegen Z x x Z x ′ u(t)v ′ (t) dt u (t)v(t) dt = u(t)v(t) − a
a
a
′
gilt mit u(t) = t − x und v(t) = f (t)
x Z x f (x) = f (a) + (t − x)f ′ (t) − (t − x)f ′′ (t) dt a a Z x ′ = f (a) + f (a) · (x − a) + (x − t)f ′′ (t) dt. a
Eine weitere partielle Integration ergibt Z x Z x (x − t)2 ′′ x (x − t)2 ′′′ (x − t)f ′′ (t) dt = − f (t) + f (t) dt 2 2 a a a Z f ′′ (a) 1 x = (x − t)2 f ′′′ (t) dt, (x − a)2 + 2 2 a und man erkennt, dass fortgesetzte partielle Integration zur gew¨ unschten Formel f¨ uhrt (mit dem Restglied in Integralform). Die andere Darstellung des Restglieds folgt aus dem Mittelwertsatz der Integralrechnung [2, Kapitel 4.1, Satz 1.2]. ⊓ ⊔ Beispiel 12.2 (Wichtiger Spezialfall) Setzt man zun¨achst x = a + h und ersetzt anschließend in der gesamten Formel a durch x, so erh¨alt man f (x + h) = f (x) + h f ′ (x) +
h2 ′′ hn (n) hn+1 f (x) + ... + f (x) + f (n+1) (ξ) 2 n! (n + 1)!
mit einem ξ zwischen x und x + h. F¨ ur kleines h beschreibt diese Formel, wie sich die Funktion f in der N¨ahe von x verh¨alt. 2
J.L. Lagrange, 1736–1813.
12.1 Die Formel von Taylor
147
Bemerkung 12.3 Oft kennt man das Restglied Rn+1 (x, a) =
f (n+1) (ξ) (x − a)n+1 (n + 1)!
nicht explizit, da man ξ nicht kennt. Sei M das Supremum von f (n+1) auf dem betrachteten Intervall um a. F¨ ur x aus diesem Intervall erhalten wir die Schranke M Rn+1 (x, a) ≤ (x − a)n+1 . (n + 1)!
Das Restglied ist somit f¨ ur h = x − a durch eine Konstante mal hn+1 beschr¨ankt. Man schreibt daf¨ ur kurz Rn+1 (a + h, a) = O(hn+1 ) f¨ ur h → 0 und spricht von einem Term der Ordnung n + 1. Diese Notation verwendet auch maple . Definition 12.4 Das Polynom Tn (x, a) = f (a) + f ′ (a) · (x − a) + ... +
f (n) (a) (x − a)n n!
heißt n-tes Taylorpolynom von f um den Entwicklungspunkt a. Die Graphen der Funktionen y = Tn (x, a) und y = f (x) gehen beide durch den Punkt (a, f (a)). Die Tangenten haben dort dieselbe Steigung Tn′ (x, a) = f ′ (a), die Graphen dieselbe Kr¨ ummung (wegen Tn′′ (x, a) = f ′′ (a), vgl. Kapitel 14). Wie genau das Taylorpolynom die Funktion approximiert, h¨angt von der Gr¨oße des Restglieds ab. Beispiel 12.5 (Taylorpolynom der Exponentialfunktion) Sei f (x) = ex und a = 0. Wegen (ex )′ = ex gilt f (k) (0) = e0 = 1 f¨ ur alle k ≥ 0 und somit ex = 1 + x +
x2 xn eξ + ... + + xn+1 2 n! (n + 1)!
f¨ ur ein ξ zwischen 0 und x. Wir fragen uns, welchen Grad das Taylorpolynom zumindest haben muss, damit es die Funktion am Intervall [0, 1] auf 5 Stellen genau approximiert. Dazu gehen wir von der Absch¨atzung n x eξ e − 1 − x − ... − x = xn+1 ≤ 10−5 n! (n + 1)!
aus. Man beachte hier, dass sowohl x ∈ [0, 1] als auch eξ nicht negativ sind. Die rechte Seite wird f¨ ur x = ξ = 1 maximal. Wir bestimmen n somit aus der Ungleichung e/(n + 1)! ≤ 10−5 . Wegen e ≈ 3 ist diese Ungleichung ab n = 8 erf¨ ullt. Insbesondere gilt somit
148
12 Taylorreihen
e=1+1+
1 1 + ... + ± 10−5 . 2 8!
Man muss also mindestens bis n = 8 gehen, um e auf 5 Stellen genau zu bestimmen. Experiment 12.6 Wiederholen Sie die obigen Berechnungen mit dem maple -Arbeitsblatt mp12_1.mws. In diesem Arbeitsblatt werden an Hand des Beispiels die entsprechenden maple -Befehle f¨ ur die Taylorformel erkl¨ art.
Beispiel 12.7 (Taylorpolynom der Sinusfunktion) Sei f (x) = sin x und a = 0. Wegen (sin x)′ = cos x und (cos x)′ = − sin x sowie sin 0 = 0 und cos 0 = 1 gilt sin x =
2n+1 X
sin(k) (0) k x + R2n+2 (x, 0) = k!
k=0
= x−
x3 x5 x7 x2n+1 + − + ... + (−1)n + R2n+2 (x, 0). 3! 5! 7! (2n + 1)!
Man beachte, dass das Taylorpolynom nur aus ungeraden Potenzen von x besteht. Nach der Formel von Taylor ist R2n+2 (x, 0) =
sin(2n+2) (ξ) 2n+2 x . (2n + 2)!
Da alle Ableitungen der Sinusfunktion durch 1 beschr¨ankt sind, gilt weiters |R2n+2 (x, 0)| ≤
x2n+2 . (2n + 2)!
F¨ ur festes x geht f¨ ur n → ∞ das Restglied gegen Null, da der Ausdruck x2n+2 /(2n + 2)! ein Summand der Reihe der Exponentialfunktion ist, welche f¨ ur alle x ∈ R konvergiert. Somit gibt es zu jedem x ∈ R ein n ∈ N, f¨ ur welches das Taylorpolynom von Grad n die Funktion im Intervall [−x, x] gut approximiert. Experiment 12.8 Berechnen Sie mit dem maple -Arbeitsblatt mp12_2.mws die Taylorpolynome von sin x mit Entwicklungspunkt 0. Damit diese Polynome f¨ ur große x die Funktion darstellen, muss der Grad der Polynome entsprechend hoch gew¨ ahlt werden. Auf Grund der Rundungsfehler st¨ oßt diese Vorgangsweise jedoch bald an Grenzen (außer man erh¨ oht die Zahl der signifikanten Stellen).
Beispiel 12.9 Das Taylorpolynom der Funktion ( x x 6= 0, f (x) = ex − 1 1 x = 0, vom Grad 4 lautet 1−
x 1 2 1 4 + x − x . 2 12 720
12.2 Der Satz von Taylor
149
Experiment 12.10 Das maple -Arbeitsblatt mp12_3.mws zeigt, dass f¨ ur hinreichend großes n das Taylorpolynom von Grad n eine gute Approximation an die Funktion aus Beispiel 12.9 auf abgeschlossenen Teilintervallen von (−2π, 2π) darstellt. F¨ ur x ≥ 2π (sowie f¨ ur x ≤ −2π) ist das Taylorpolynom jedoch unbrauchbar!
12.2 Der Satz von Taylor Das letzte Beispiel gibt Anlass zur Frage, f¨ ur welche Punkte das Taylorpolynom f¨ ur n → ∞ gegen die Funktion konvergiert. Definition 12.11 Sei I ⊆ R ein offenes Intervall und f : I → R beliebig oft differenzierbar. F¨ ur a ∈ I heißt die Reihe ∞ X f (k) (a) T (x, a, f ) = (x − a)k k! k=0
Taylorreihe von f um den Entwicklungspunkt a.
Satz 12.12 (Satz von Taylor) Sei f : I → R eine beliebig oft differenzierbare Funktion und T (x, a, f ) ihre Taylorreihe um den Entwicklungspunkt a. Dann stimmen Funktion und Taylorreihe genau f¨ ur jene x ∈ I u ¨berein f (x) = T (x, a, f ) =
∞ X f (k) (a) (x − a)k , k!
k=0
f¨ ur die das Restglied Rn (x, a) =
f (n) (ξ) (x − a)n n!
f¨ ur n → ∞ gegen 0 geht. Beweis: Nach der Formel von Taylor (Satz 12.1) gilt f (x) − Tn (x, a) = Rn+1 (x, a) und somit f (x) = lim Tn (x, a) = T (x, a, f ) n→∞
⇔
lim Rn (x, a) = 0,
n→∞
was zu zeigen war. Beispiel 12.13 Sei f (x) = sin x und a = 0. Wegen Rn (x, 0) = gilt |x|n |Rn (x, 0)| ≤ →0 n! f¨ ur x fest und n → ∞. Somit gilt f¨ ur alle x ∈ R sin x =
∞ X
(−1)k
k=0
sin
x2k+1 x3 x5 x7 x9 =x− + − + ∓ ... (2k + 1)! 3! 5! 7! 9!
(n)
n!
⊓ ⊔ (ξ)
xn
150
12 Taylorreihen
12.3 Anwendungen der Taylorformel Zum Abschluss des Kapitels besprechen wir ein paar typische Anwendungen der Taylorformel. Anwendung 12.14 (Extremwerttest) Die Funktion f : I → R sei im Intervall I n-mal stetig differenzierbar und erf¨ ulle f ′ (a) = f ′′ (a) = ... = f (n−1) (a) = 0 und f (n) (a) 6= 0. Dann gilt folgender Satz: (a) f besitzt in a ein Extremum ⇔ n ist gerade; (b) n ist gerade und es gilt f (n) (a) > 0 ⇒ a ist lokale Minimalstelle von f ; n ist gerade und es gilt f (n) (a) < 0 ⇒ a ist lokale Maximalstelle von f . Beweis: Auf Grund der Taylorformel gilt f¨ ur x ∈ I f (x) − f (a) =
f (n) (ξ) (x − a)n . n!
F¨ ur x nahe bei a haben f (n) (ξ) und f (n) (a) dasselbe Vorzeichen (da f (n) stetig ist). F¨ ur n ungerade wechselt die rechte Seite bei x = a wegen des Terms (x − a)n das Vorzeichen. Somit kann ein Extremum nur f¨ ur n gerade auftreten. Falls nun n gerade ist und f (n) (a) > 0, so gilt f (x) > f (a) f¨ ur alle x nahe bei a mit x 6= a. Damit ist a eine lokale Minimalstelle. ⊓ ⊔
Beispiel 12.15 Das Polynom f (x) = 6 + 4x + 6x2 + 4x3 + x4 besitzt im Punkt x = −1 die Ableitungen f ′ (−1) = f ′′ (−1) = f ′′′ (−1) = 0, f (4) (−1) = 24.
Somit ist x = −1 eine lokale Minimalstelle von f . Anwendung 12.16 (Berechnung von Funktionsgrenzwerten) Wir untersuchen die Funktion x2 log(1 + x) g(x) = (1 − cos x) sin x in der N¨ahe von x = 0. F¨ ur x = 0 erhalten wir den unbestimmten Ausdruck 0 ur x gegen 0 zu bestimmen, entwickeln wir alle auftre0 . Um den Grenzwert f¨ ¨ tenden Funktionen um den Punkt a = 0 in Taylorpolynome. Laut Ubung 1 x2 4 gilt cos x = 1 − 2 + O(x ). Die Taylorformel f¨ ur log(1 + x) um den Entwicklungspunkt a = 0 lautet wegen log 1 = 0 und log(1 + x)′ |x=0 = 1 log(1 + x) = x + O(x2 ).
Somit erhalten wir
x2 x + O(x2 ) x3 + O(x4 ) 1 + O(x) g(x) = = = 1 2 x x3 2 4 3 5 1 − 1 + 2 + O(x ) x + O(x ) 2 + O(x ) 2 + O(x )
und daraus sofort lim g(x) = 2. x→0
12.3 Anwendungen der Taylorformel
151
Anwendung 12.17 (Analyse von N¨ aherungsformeln) Beim numerischen Differenzieren in Kapitel 7 betrachteten wir den symmetrischen Differenzenquotienten f (x + h) − 2f (x) + f (x − h) f ′′ (x) ≈ h2 als Approximation an die zweite Ableitung f ′′ (x). Wir sind nun in der Lage zu untersuchen, wie genau diese Formel ist. Wegen h2 ′′ f (x) + 2 h2 f (x − h) = f (x) − hf ′ (x) + f ′′ (x) − 2 f (x + h) = f (x) + hf ′ (x) +
h3 ′′′ f (x) + O(h4 ), 6 h3 ′′′ f (x) + O(h4 ) 6
gilt f (x + h) + f (x − h) = 2f (x) + h2 f ′′ (x) + O(h4 ) und somit
f (x + h) − 2f (x) + f (x − h) = f ′′ (x) + O(h2 ). h2 Man spricht von einer Formel der Ordnung 2. Verkleinert man h um den Faktor F , so wird der Fehler um den Faktor F 2 kleiner, solange Rundungsfehler noch keine Rolle spielen. Anwendung 12.18 (Integration nicht elementar integrierbarer Funktionen) Wie bereits in Abschnitt 10.2 erw¨ahnt, gibt es Funktionen, deren Stammfunktion sich nicht als Kombination elementarer Funktionen ausdr¨ ucken l¨asst. Solche Funktionen heißen nicht elementar integrierbar. Beispielsweise ist die 2 Funktion f (x) = e−x nicht elementar integrierbar. Um das bestimmte Integral Z 1
2
e−x dx
0
2
zu berechnen, approximieren wir e−x durch das Taylorpolynom von Grad 8 2
e−x
≈ 1 − x2 +
x4 x6 x8 − + 2 6 24
und n¨ahern das gesuchte Integral durch Z 1 x4 5651 x6 x8 2 1−x + dx = − + 2 6 24 7560 0 an. Der Fehler dieser Approximation ist 6.63 · 10−4 . F¨ ur genauere Resultate w¨ahlt man beim Taylorpolynom einen h¨oheren Grad. Experiment 12.19 Wiederholen Sie die Rechnungen von Anwendung 12.18 mit dem maple -Arbeitsblatt mp12_4.mws. Modifizieren Sie anschließend das Programm derart, dass Sie damit g(x) = cos x2 integrieren k¨ onnen.
152
12 Taylorreihen
¨ 12.4 Ubungen 1. Berechnen Sie die Taylorpolynome vom Grad 0, 1, 2, 3 und 4 der Funktion g(x) = cos x mit Entwicklungspunkt a = 0. F¨ ur welche x ∈ R konvergiert die Taylorreihe von cos x? 2. Berechnen Sie die Taylorpolynome vom Grad 1, 3 und 5 der Funktion sin x mit Entwicklungspunkt a = 9π. Berechnen Sie weiters mit maple das Taylorpolynom vom Grad 39 und zeichnen Sie seinen Graphen gemeinsam mit jenem der Funktion am Intervall [0, 18π]. Zur besseren Unterscheidung sollten Sie die beiden Graphen in unterschiedlicher Farbe und Linienst¨ arke zeichnen. 3. Berechnen Sie die Taylorpolynome vom Grad 1, 2 und 3 der Funktion f (t) = √ 1 + t mit Entwicklungspunkt a = 0. Berechnen Sie mit maple das Taylorpolynom vom Grad 10. 4. Berechnen Sie die folgenden Grenzwerte mittels Taylorreihenentwicklung lim
x→0
x sin x − x2 , 2 cos x − 2 + x2
e2x − 1 − 2x , x→0 sin2 x 2 x2 log(1 − 2x) lim . x→0 1 − cos(x2 ) lim
2
lim
x→0
e−x − 1 , sin2 (3x)
¨ Uberpr¨ ufen Sie Ihre Ergebnisse mit maple . 5. Zur n¨ aherungsweisen Berechnung des Integrals Z 1 sin(t2 ) dt t 0 ersetzen Sie den Integranden durch sein Taylorpolynom vom Grad 9 und integrieren Sie dieses Polynom. Verifizieren Sie die Rechnung in maple . 6. Beweisen Sie die Formel
eiϕ = cos ϕ + i sin ϕ,
indem Sie in die Reihe der Exponentialfunktion ex =
∞ X xk k!
k=0
f¨ ur x den Wert iϕ einsetzen und Real- und Imagin¨ arteil trennen.
13 Numerische Integration
Motiviert durch den Hauptsatz der Differential- und Integralrechnung bietet sich folgende Vorgangsweise zur Berechnung von bestimmten Integralen an: Man sucht zun¨ achst eine Stammfunktion F des Integranden f und bestimmt daraus den Wert des Integrals Z b
a
f (x) dx = F (b) − F (a).
In der Praxis ist es aber oft unm¨ oglich, eine betreffende Stammfunktion F als Kombination einfacher Funktionen zu finden. Abgesehen davon k¨ onnen Stammfunktionen R auch recht komplex sein, wie beispielsweise x100 sin x dx. Schließlich ist in konkreten Anwendungen der Integrand oft nur numerisch und nicht durch eine explizite Formel gegeben. In all diesen F¨ allen greift man auf numerische Verfahren zur¨ uck. In diesem Kapitel werden die grundlegenden Konzepte der numerischen Integration (Quadraturformeln, Ordnung) eingef¨ uhrt und erl¨ autert. Anhand instruktiver Beispiele wird f¨ ur die Gauß’schen Quadraturformeln die erreichbare Genauigkeit und der daf¨ ur n¨ otige Aufwand analysiert.
13.1 Quadraturformeln Rb Zur numerischen Berechnung von a f (x) dx zerlegen wir das Integrationsintervall [a, b] zun¨achst in Teilintervalle mit den St¨ utzstellen (Gitterpunkten) a = x0 < x1 < x2 < . . . < xN −1 < xN = b, vgl. Abb. 13.1. Auf Grund der Additivit¨at des Integrals (Satz 11.10d) gilt Z
a
b
f (x) dx =
N −1 Z xj+1 X
f (x) dx.
j=0
xj
Somit ist es ausreichend, eine N¨aherungsformel f¨ ur ein (kleines) Teilintervall der L¨ange hj = xj+1 − xj zu finden. Ein Beispiel so einer N¨aherungsformel ist die Trapezregel, bei welcher die Fl¨ache unter dem Funktionsgraphen durch die Fl¨ache des entsprechenden Trapezes approximiert wird
154
13 Numerische Integration
y = f (x)
x0 = a
x1
x2
···
xj
xj+1
···
xN = b
Abb. 13.1. Zerlegung des Integrationsintervalls in Teilintervalle.
Z
xj+1
xj
f (x) dx ≈ hj
1 f (xj ) + f (xj+1 ) . 2
F¨ ur die Herleitung und Analyse solcher N¨aherungsformeln ist es zweckm¨aßig, eine Transformation auf das Intervall [0, 1] durchzuf¨ uhren. Setzt man x = xj + τ hj , so erh¨alt man wegen dx = hj dτ Z 1 Z xj+1 Z 1 g(τ ) dτ f (xj + τ hj )hj dτ = hj f (x) dx = xj
0
mit g(τ ) = f (xj + τ hj ). Somit ist es ausreiR1 chend, N¨aherungsformeln f¨ ur 0 g(τ ) dτ zu finden. Die Trapezregel lautet in diesem Fall Z 1 1 g(τ ) dτ ≈ g(0) + g(1) . 2 0 Sie ist offensichtlich exakt, falls g(τ ) ein Polynom von Grad 0 oder 1 ist.
0
g(0) g(1)
0
1
Abb. 13.2. Trapezregel.
Um eine genauere Formel zu erhalten, fordern wir, dass auch quadratische Polynome exakt integriert werden. Sei f¨ ur einen Moment g(τ ) = α + βτ + γτ 2 ein allgemeines Polynom von Grad 2. Wegen g(0) = α, g 12 = α + 21 β + 14 γ und g(1) = α + β + γ gilt Z 1 1 1 1 α + βτ + γτ 2 dτ = α + β + γ = g(0) + 4g 21 + g(1) . 2 3 6 0 Die f¨ ur allgemeines g daraus folgende N¨aherungsformel Z 1 1 g(τ ) dτ ≈ g(0) + 4g 21 + g(1) 6 0
ist somit exakt f¨ ur Polynome vom Grad kleiner oder gleich 2; sie heißt Simpsonregel.1 1
T. Simpson, 1710–1761.
13.1 Quadraturformeln
155
Die spezielle Form der Trapez- und Simpsonregel motiviert nun folgende Definition. Definition 13.1 Die N¨ aherungsformel Z 1 s X bi g(ci ) g(τ ) dτ ≈ 0
i=1
bezeichnet man als Quadraturformel. Die Zahlen b1 , . . . , bs heißen Gewichte, die Zahlen c1 , . . . , cs heißen Knoten der Quadraturformel; s nennt man Anzahl der Stufen. Eine Quadraturformel ist durch Angabe der Gewichte und Knoten festgelegt. Wir schreiben f¨ ur eine Quadraturformel deshalb kurz {(bi , ci ), i = 1, ..., s}. Ohne Einschr¨ankung der Allgemeinheit sind die Gewichte bi nicht Null und die Knoten paarweise verschieden (ci 6= ck f¨ ur i 6= k). Beispiel 13.2 (a) Die Trapezregel hat s = 2 Stufen und ist gegeben durch b1 = b2 =
1 , 2
c1 = 0,
c2 = 1.
(b) Die Simpsonregel hat s = 3 Stufen und ist gegeben durch b1 =
1 , 6
b2 =
2 , 3
b3 =
1 , 6
c1 = 0,
c2 =
1 , 2
c3 = 1.
Rb Um Quadraturformeln zur Berechnung des urspr¨ unglichen Integrals a f (x) dx zu verwenden, macht man die Transformation von f nach g wieder r¨ uckg¨angig. Wegen g(τ ) = f (xj + τ hj ) gilt Z
xj+1
f (x) dx = hj
Z
1
0
xj
g(τ ) dt ≈ hj
s X
bi g(ci ) = hj
i=1
s X
bi f (xj + ci hj ).
i=1
Somit erh¨alt man die N¨aherungsformel Z
a
b
f (x) dx =
N −1 Z xj+1 X j=0
xj
f (x) dx ≈
N −1 X j=0
hj
s X
bi f (xj + ci hj ).
i=1
Wir suchen nun Quadraturformeln, die m¨oglichst genau sind. Nachdem der Integrand auf kleinen Intervallen typischerweise gut durch Taylorpolynome approximiert wird, zeichnet sich eine gute Quadraturformel dadurch aus, dass sie m¨oglichst viele Polynome exakt integriert. Dieser Gedanke motiviert folgende Definition. Definition 13.3 (Ordnung) Die Quadraturformel {(bi , ci ), i = 1, . . . , s} besitzt Ordnung p, falls alle Polynome g vom Grad kleiner oder gleich p − 1 von der Quadraturformel exakt integriert werden, d.h. falls gilt
156
13 Numerische Integration
Z
1
g(τ ) dτ =
0
s X
bi g(ci )
i=1
f¨ ur alle Polynome g vom Grad kleiner gleich p − 1. Beispiel 13.4 (a) Die Trapezregel hat Ordnung 2. (b) Die Simpsonregel hat (nach Konstruktion) zumindest Ordnung 3. Der folgende Satz liefert eine algebraische Charakterisierung der Ordnung von Quadraturformeln. Satz 13.5 Eine Quadraturformel {(bi , ci ), i = 1, . . . , s} hat Ordnung p ⇔ s X
bi cq−1 = i
i=1
1 q
f¨ ur
1 ≤ q ≤ p.
Beweis: Man verwendet, dass ein Polynom g vom Grad p − 1 g(τ ) = α0 + α1 τ + . . . + αp−1 τ p−1 eine Linearkombination von Monomen ist, und dass Integration und Anwendung einer Quadraturformel lineare Prozesse sind. Somit gen¨ ugt es, die Monome g(τ ) = τ q−1 , 1≤q≤p zu betrachten. Die Behauptung folgt nun sofort aus der Identit¨at 1 = q
Z
1
τ q−1 dτ =
0
s X i=1
bi g(ci ) =
s X
bi cq−1 . i
i=1
⊓ ⊔
Die Bedingungen des Satzes b1 + b2 + . . . + b s = 1 b1 c1 + b2 c2 + . . . + bs cs =
1 2
b1 c21 + b2 c22 + . . . + bs c2s = .. .
1 3
b1 cp−1 + b2 cp−1 + . . . + bs cp−1 = s 1 2
1 p
heißen Ordnungsbedingungen f¨ ur Ordnung p. Gibt man s Knoten c1 , . . . , cs vor, so stellen die Ordnungsbedingungen ein lineares Gleichungssystem f¨ ur die unbekannten Gewichte bi dar. Falls die Knoten paarweise verschieden sind, lassen sich die Gewichte daraus eindeutig bestimmen. Das zeigt, dass zu s verschiedenen Knoten stets eine eindeutige Quadraturformel der Ordnung p ≥ s existiert.
13.2 Genauigkeit und Aufwand
157
Beispiel 13.6 Wir berechnen nochmals die Ordnung der Simpsonregel. Wegen b1 + b2 + b3 =
1 6
+
b1 c1 + b2 c2 + b3 c3 =
2 3
b1 c21 + b2 c22 + b3 c23 =
2 3
· ·
2 3
+
1 6
=1
1 2
+
1 6
=
1 2
1 4
+
1 6
=
1 3
ist die Ordnung zumindest 3 (wie wir bereits auf Grund der Konstruktion wissen). Es gilt jedoch zus¨atzlich b1 c31 + b2 c32 + b3 c33 =
4 6
·
1 8
+
1 6
=
3 12
= 41 ,
d.h. die Simpsonregel hat sogar Ordnung 4. Die besten Quadraturformeln (optimale Genauigkeit bei m¨oglichst wenig Aufwand) sind die Gauß’schen Quadraturformeln. Wir formulieren dazu das folgende Resultat, dessen Beweis in [25, Kap. 8.3.2] nachgelesen werden kann. Satz 13.7 Es gibt keine Quadraturformel mit s Stufen der Ordnung p > 2s. Andererseits gibt es zu jedem s ∈ N eine (eindeutige) Quadraturformel der Ordnung p = 2s. Diese Formel heißt Gauß’sche Quadraturformel mit s Stufen. Die Gauß’schen Quadraturformeln f¨ ur s ≤ 3 lauten s = 1 : c1 =
1 , 2
s = 2 : c1 =
1 − 2
1 − 2 5 , b1 = 18
s = 3 : c1 =
b1 = 1, Ordnung 2 (Mittelpunktsregel); √ √ 1 1 3 3 , c2 = + , b1 = b2 = , Ordnung 4; 6 2 6 2 √ √ 1 1 15 15 , c2 = , c3 = + , 10 2 2 10 8 5 b2 = , b3 = , Ordnung 6. 18 18
13.2 Genauigkeit und Aufwand Im folgenden numerischen Versuch soll die Genauigkeit von Quadraturformeln illustriert werden. Wir berechnen mit Hilfe der Gauß’schen Quadraturformeln der Ordnung 2, 4 und 6 die beiden Integrale Z 3 Z 1 2 cos x dx = sin 3 und x5/2 dx = . 7 0 0 Wir w¨ahlen dazu ¨aqudistante Gitterpunkte xj = a + jh,
j = 0, . . . , N
158
13 Numerische Integration 4
4
10
10
fe
fe
3
3
10
10
2
2
10
10
1
10
1
10
f (x) = cos x
0
10 −20 10
f (x) = x2.5
0
−15
10
−10
10
−5
10
10 −20 10
err
−15
10
−10
10
−5
10
err
Abb. 13.3. Genauigkeit-Aufwands-Diagramm der Gauß’schen Quadraturformeln. Die Kreuze sind die Resultate des einstufigen Gaußverfahrens der Ordnung 2, die Quadrate des zweistufigen Verfahrens der Ordnung 4 und die Kreise des dreistufigen Verfahrens der Ordnung 6.
mit h = (b − a)/N und N = 1, 2, 4, 8, 16, . . . , 512. Schließlich tragen wir in einem doppellogarithmischen Diagramm den Aufwand der Berechnung als Funktion der erreichten Genauigkeit auf. Ein Maß f¨ ur den numerischen Aufwand einer Quadraturformel ist die Anzahl der ben¨otigten Funktionsauswertungen, bei einer s-stufigen Quadraturformel also die Zahl fe = s · N. Die Abk¨ urzung fe steht dabei f¨ ur function evaluations. Die erreichte Genauigkeit err ist der Absolutbetrag des Fehlers. Die entsprechenden Ergebnisse sind in Abb. 13.3 dargestellt. Man macht folgende Beobachtungen: (a) Die Kurven sind Geraden (solange man nicht in den Bereich der Rundungsfehler kommt, wie beim dreistufigen Verfahren im linken Bild). (b) Im linken Bild haben die Geraden Anstieg −1/p, wobei p die Ordnung der Quadraturformel bezeichnet. Im rechten Bild stimmt das nur f¨ ur das Verfahren der Ordnung 2, die beiden anderen Verfahren ergeben Geraden mit Anstieg −2/7. (c) Bei gegebenem Aufwand sind Formeln von h¨oherer Ordnung genauer. Um dieses Verhalten zu verstehen, entwickeln wir den Integranden in eine Taylorreihe. Am Teilintervall [α, α + h] der L¨ ange h gilt f (α + τ h) =
p−1 q X h q=0
q!
f (q) (α)τ q + O(hp ).
Da eine Quadraturformel der Ordnung p Polynome vom Grad kleiner gleich p − 1 exakt integriert, wird das Taylorpolynom von f vom Grad p − 1 exakt
¨ 13.3 Ubungen
159
integriert. Der Fehler der Quadraturformel auf diesem Teilintervall ist proportional zur L¨ange des Intervalls mal der Gr¨ oße des Restterms des Integranden, also h · O(hp ) = O(hp+1 ).
Insgesamt haben wir N Teilintervalle, der Gesamtfehler der Quadraturformel ist damit N · O(hp+1 ) = N h · O(hp ) = (b − a) · O(hp ) = O(hp ). Wir haben also gezeigt, dass sich (f¨ ur kleines h) der Fehler err verh¨alt wie err ≈ c1 · hp . Da weiters fe = sN = s · N h · h−1 = s · (b − a) · h−1 = c2 · h−1 gilt, erhalten wir log(fe) = log c2 − log h
und
log(err) ≈ log c1 + p · log h,
also insgesamt
1 · log(err). p Das erkl¨art, warum im linken Bild Geraden mit der Steigung −1/p auftreten. log(fe) ≈ c3 −
Beim rechten Bild ist zu beachten, dass die zweite Ableitung des Integran¨ den bei 0 unstetig ist. Somit sind obige Uberlegungen mit der Taylorreihe nicht mehr zul¨assig. Auch die Quadraturformel bemerkt diese Unstetigkeit der hohen Ableitungen und reagiert mit einer so genannten Ordnungsreduktion, d.h. die Verfahren zeigen eine niedrigere Ordnung (in unserem Fall p = 7/2). Experiment 13.8 Berechnen Sie die Integrale Z 3 Z √ x dx und 0
2 1
dx x
mit den Gauß’schen Quadraturformeln und erstellen Sie ein Genauigkeits-AufwandDiagramm. Modifizieren Sie dazu die Programme mat13_1.m, mat13_2.m, mat13_3.m, mat13_4.m und mat13_5.m, mit denen Abb. 13.3 erstellt wurde.
Kommerzielle Programme zur numerischen Integration bestimmen die St¨ utzstellen adaptiv auf Grund von automatischen Fehlersch¨atzungen. Der Benutzer kann u unschte Genauigkeit vorschreiben. In MATLAB ¨blicherweise die gew¨ dienen dazu die Routinen quad.m und quadl.m.
¨ 13.3 Ubungen R1 1. Bestimmen Sie zur Berechnung von 0 x100 sin x dx zun¨ achst eine Stammfunktion F des Integranden f mit maple . Werten Sie anschließend F (1) − F (0) auf 10, 50, 100, 200 und 400 Stellen aus und erkl¨ aren Sie die u ¨berraschenden Ergebnisse.
160
13 Numerische Integration
2. Bestimmen Sie die Ordnung der Quadraturformel b1 = b4 =
1 , 8
b 2 = b3 =
3 , 8
c1 = 0,
c2 =
1 , 3
c3 =
2 , 3
c4 = 1.
3. Bestimmen Sie die eindeutige Quadraturformel der Ordnung 3 mit den Knoten c1 =
1 , 3
c2 =
2 , 3
c3 = 1.
4. Bestimmen Sie die eindeutige Quadraturformel mit den Knoten c1 =
1 , 4
c2 =
1 , 2
c3 =
3 . 4
Welche Ordnung hat sie? 5. Machen Sie sich mit den MATLAB -Programmen quad.m und quadl.m zur Berechnung bestimmter Integrale vertraut und testen Sie die Programme an Z 1 Z 1 √ 2 3 e−x dx und x dx. 0
6. Begr¨ unden Sie die Formeln Z 1 dx π=4 2 0 1+x
0
und
π=4
Z 1p 0
1 − x2 dx
und verwenden Sie sie, um mittels numerischer Integration π zu berechnen. Teilen Sie dazu das Intervall [0, 1] in N gleich große Teile (N = 10, 100, . . .) und benutzen Sie die Simpsonregel auf den Teilintervallen. Warum sind die mit der ersten Formel erzielten Ergebnisse stets genauer?
14 Kurven
Der Graph einer Funktion y = f (x) stellt eine Kurve in der Ebene dar. Dieses Konzept ist jedoch zu eng, um komplexere Kurvenverl¨ aufe darzustellen, etwa Schleifen, ¨ Uberschneidungen oder gar Kurven fraktaler Dimension. Ziel dieses Kapitels ist es, das Konzept parametrisierter Kurven einzuf¨ uhren und speziell den Fall differenzierbarer Kurven zu studieren. F¨ ur die Visualisierung des Kurvenverlaufs sind die Begriffe des Geschwindigkeitsvektors, des begleitenden Zweibeins und der Kr¨ ummung wichtig. Das Kapitel beinhaltet eine kleine Sammlung geometrisch interessanter Kurvenbeispiele und etliche ihrer Konstruktionsprinzipien; ferner die Berechnung der Bogenl¨ ange von differenzierbaren Kurven und ein Beispiel einer stetigen, beschr¨ ankten Kurve unendlicher L¨ ange. Das Kapitel endet mit einem kurzen Ausblick auf Raumkurven. F¨ ur die in diesem Kapitel verwendete Vektorrechnung verweisen wir auf Anhang A.
14.1 Parametrisierte Kurven in der Ebene Definition 14.1 Eine parametrisierte ebene Kurve ist eine stetige Abbildung x(t) t 7→ x(t) = y(t) eines Intervalls [a, b] nach R2 . Dabei heißt t ∈ [a, b] der Kurvenparameter. Wir verlangen also, dass beide Komponentenabbildungen t 7→ x(t) und t 7→ y(t) stetig sind1 . Beispiel 14.2 Ein in H¨ohe h mit Horizontalgeschwindigkeit vH und Vertikalgeschwindigkeit vV geworfener K¨orper besitzt die Bahnkurve 1 Zur Notation ist zu bemerken, dass x(t), y(t) eigentlich die Koordinaten eines Punkts im R2 als Punktraum darstellen. Es ist jedoch g¨ unstig und u ¨blich, die Bezeichnung als Ortsvektor, also die Spaltenschreibweise, zu ben¨ utzen.
162
14 Kurven
x(t) = vH t, y(t) = h + vV t −
g 2 t , 2
0 ≤ t ≤ t0 , wobei t0 die positive L¨osung der Gleichung h + vV t0 − g2 t20 = 0 ist (Aufprallzeitpunkt, siehe Abb. 14.1). In diesem Beispiel k¨onnen wir t eliminieren und die Bahnkurve als Funktionsgraph (Wurfparabel) darstellen. Es ist t = x/vH und damit y =h+
vV g x − 2 x2 . vH 2vH
Beispiel 14.3 Ein Kreis mit Mittelpunkt im Ursprung und Radius R besitzt die Parameterdarstellung x(t) = R cos t, y(t) = R sin t,
0 ≤ t ≤ 2π.
In diesem Fall ist t als Winkel zwischen dem Ortsvektor und der x-Achse interpretierbar (Abb. 14.1). Die Komponenten x = x(t), y = y(t) erf¨ ullen die Kreisgleichung x2 + y 2 = R2 , jedoch kann man die Kreislinie nicht in ihrer Gesamtheit als Funktionsgraphen darstellen. y
y [x(t), y(t)]T
t=0
[x(t), y(t)]T
t h
0
R
x
x t = t0
Abb. 14.1. Wurfparabel und Kreislinie.
Experiment 14.4 Rufen Sie das MATLAB -File mat14 1.m auf und u ¨berlegen Sie, welche Kurve (diskret – punktweise) dargestellt wird. Vergleichen Sie mit den MATLAB -Files mat14 2.m bis mat14 4.m . Handelt es sich um dieselben Kurven?
Experiment 14.4 legt nahe, dass man Kurven statisch als Punktmenge in der Ebene oder dynamisch als Verlauf der Bewegung eines Punkts sehen kann. Beide Sichtweisen sind in den Anwendungen von Bedeutung.
14.1 Parametrisierte Kurven in der Ebene
163
Der kinematische Standpunkt. Hier fasst man den Kurvenparameter t als Zeit auf, die Kurve als Bahnkurve. Verschiedene Parametrisierungen desselben geometrischen Objekts sind dann verschiedene Kurven. Der geometrische Standpunkt. Hier will man den geometrischen Ort, die Durchlaufrichtung und die Anzahl der Durchl¨ aufe als Grundeigenschaften einer Kurve festhalten, nicht jedoch die Parametrisierung. Eine streng monoton wachsende, stetige Abbildung eines Intervalls [α, β] nach [a, b], ϕ : [α, β] → [a, b] heißt Parameterwechsel. Die Kurve τ 7→ ξ(τ ),
α≤τ ≤β
heißt Umparametrisierung der Kurve t 7→ x(t),
a ≤ t ≤ b,
wenn sie aus dieser durch einen Parameterwechsel t = ϕ(τ ) hervorgeht, also ξ(τ ) = x(ϕ(τ )) ist. Beim geometrischen Standpunkt werden die parametrisierten Kurven τ 7→ ξ(τ ) und t 7→ x(t) identifiziert. Eine ebene Kurve Γ ist demnach ei¨ ne Aquivalenzklasse parametrisierter Kurven, die durch Umparametrisierung ineinander u uhrt werden k¨ onnen. ¨bergef¨ Beispiel 14.5 Das Parabelst¨ uck Γ : x(t) =
t , t2
−1 ≤ t ≤ 1.
Umparametrisierungen sind etwa ϕ : [− 21 , 21 ] → [−1, 1], sodass also
ϕ e : [−1, 1] → [−1, 1], ξ(τ ) =
und
2τ , 4τ 2
3 τ η(τ ) = 6 , τ
ϕ(τ ) = 2τ, ϕ(t) e = τ 3,
− 21 ≤ τ ≤
1 2
−1 ≤ τ ≤ 1
geometrisch dieselbe Kurve darstellt. Jedoch sind ψ : [−1, 1] → [−1, 1], ψe : [0, 1] → [−1, 1],
ψ(τ ) = −τ, e ) = −1 + 8τ (1 − τ ) ψ(τ
164
14 Kurven
keine Umparametrisierungen und ergeben andere Kurven, n¨amlich −τ y(τ ) = , −1 ≤ τ ≤ 1; τ2 −1 + 8τ (1 − τ ) z(τ ) = , 0 ≤ τ ≤ 1. (−1 + 8τ (1 − τ ))2 Im ersten Fall wird Γ umgekehrt durchlaufen, im zweiten Fall zweimal. Experiment 14.6 Modifizieren Sie die MATLAB -Files aus Experiment 14.4, sodass die Kurven aus Beispiel 14.5 dargestellt werden.
Algebraische Kurven. Diese erh¨ alt man als Nullstellengebilde von Polynomen in zwei Variablen. Wir hatten als Beispiele bereits Parabel und Kreis y − x2 = 0,
x2 + y 2 − R2 = 0.
Man kann auf diese Weise auch Spitzen und Schleifen erzeugen. Beispiel 14.7 Die Neil’sche2 Parabel y 2 − x3 = 0 besitzt einen Spitzpunkt in x = y = 0 (Abb. 14.2). Allgemein erh¨alt man mittels y 2 − (x + p)x2 = 0, p∈R algebraische Kurven, die f¨ ur p > 0 eine Schleife besitzen. Eine Parameterdarstellung ist etwa x(t) = t2 − p, y(t) = t(t2 − p), 2
2
y
1
2
y
1
0
x
−1 −2 −1
− ∞ < t < ∞.
1
0
0
x
−1 0
1
2
3
−2 −2
y
x
−1 −1
0
1
2
−2 −1
0
1
2
3
Abb. 14.2. Neil’sche Parabel, die α-Kurve und eine elliptische Kurve.
Wir werden uns im Folgenden vor allem mit Kurven befassen, die durch differenzierbare Parametrisierungen gegeben sind. 2
W. Neil, 1637–1670.
14.1 Parametrisierte Kurven in der Ebene
165
Definition 14.8 Wenn eine ebene Kurve Γ : t 7→ x(t) eine Parametrisierung besitzt, deren Komponentenabbildungen t 7→ x(t), t 7→ y(t) differenzierbar sind, so heißt Γ eine differenzierbare Kurve. Sind die Komponentenabbildungen k-mal differenzierbar, so wird Γ als k-mal differenzierbare Kurve bezeichnet. Das Bild einer differenzierbaren Kurve muss nicht glatt im anschaulichen Sinne sein, sondern kann durchaus Spitzen oder Ecken besitzen, wie etwa Beispiel 14.7 zeigt. Beispiel 14.9 (Gerade und Halbstrahl) Die Parameterdarstellung r x t 7→ x(t) = 0 + t 1 , −∞ < t < ∞ r2 y0 beschreibt eine Gerade durch den Punkt x0 = [x0 , y0 ]T mit Richtungsvektor r = [r1 , r2 ]T . Schr¨ ankt man den Parameter t auf den Bereich 0 ≤ t < ∞ ein, so erh¨alt man einen Halbstrahl. Die Darstellung x0 2 r1 xH (t) = +t , −∞ < t < ∞ y0 r2 bewirkt zweimaliges Durchlaufen des Halbstrahls. Beispiel 14.10 (Parameterdarstellung der Ellipse) Die Gleichung einer Ellipse ist y
y2 x2 + 2 = 1. 2 a b Eine Parameterdarstellung (einmaliges Durchlaufen im Gegenuhrzeigersinn) erh¨alt man mittels x(t) = a cos t, y(t) = b sin t,
[x(t), y(t)]T b
t a
x
0 ≤ t ≤ 2π,
wie durch Einsetzen in die Ellipsengleichung folgt. Die Bedeutung des Parameters t ist aus Abb. 14.3 ersichtlich.
Abb. 14.3. der Ellipse.
Parameterdarstellung
Beispiel 14.11 (Parameterdarstellung der Hyperbel) Wir f¨ uhren zun¨achst die Hyperbelfunktionen Sinus hyperbolicus und Cosinus hyperbolicus ein: 1 t 1 t sinh t = e − e−t , cosh t = e + e−t . 2 2
Ihr Graph ist in Abb. 14.4 ersichtlich; ihre f¨ ur uns wichtige Eigenschaft ist die Identit¨at
166
14 Kurven
cosh2 t − sinh2 t = 1, was durch Einsetzen der definierenden Ausdr¨ ucke leicht nachzurechnen ist. Daraus ersieht man, dass durch x(t) = a cosh t, y(t) = b sinh t,
−∞
eine Parameterdarstellung des rechten Astes der Hyperbel x2 y2 − 2 =1 2 a b gegeben ist (Abb. 14.5). y
y
y = cosh x 1
b
x
0
a
x
y = sinh x
Abb. 14.4. Sinus und Cosinus hyperbolicus.
Abb. 14.5. Parameterdarstellung des rechten Hyperbelastes.
Beispiel 14.12 (Die Zykloiden) Ein Kreis von Radius R rolle (ohne zu gleiten) entlang der x-Achse. Ist die Ausgangslage des Mittelpunkts M anfangs M = (0, R), so nach Zur¨ ucklegen des Rollwinkels t dann Mt = (Rt, R). Ein Punkt P mit Anfangslage P = (0, R − A), A > 0, bewegt sich dabei nach Pt = Mt − (A sin t, A cos t). y
M
Mt Pt
A cos t A sin t R
P x
Abb. 14.6. Herleitung der Zykloide.
14.1 Parametrisierte Kurven in der Ebene
167
Diese Bahnkurve ist eine Zykloide x(t) = Rt − A sin t, y(t) = R − A cos t,
− ∞ < t < ∞.
Man vergleiche Abb. 14.6 zur Herleitung und Abb. 14.7 f¨ ur einige m¨ogliche Formen von Zykloiden.
y
x
Abb. 14.7. Zykloiden f¨ ur A = R/2, R, 3R/2.
Definition 14.13 Es sei Γ : t 7→ x(t) eine differenzierbare Kurve. Die ¨ Anderungsrate des Ortsvektors in Bezug auf den Kurvenparameter x(t) 1 ˙ ˙ x(t) = lim x(t + h) − x(t) = y(t) ˙ h→0 h heißt der Geschwindigkeitsvektor im Kurvenpunkt wird mit ˙ 1 x(t) =p T(t) = ˙ kx(t)k x(t) ˙ 2 + y(t) ˙ 2
˙ x(t). Falls x(t) 6= 0 ist, x(t) ˙ y(t) ˙
der Tangentenvektor und mit
N(t) = p
−y(t) ˙ ˙ x(t) ˙ 2 + y(t) ˙ 2 x(t) 1
der Normalvektor der Kurve definiert. Das Paar (T(t), N(t)) wird als begleitendes Zweibein bezeichnet. Ist die Kurve Γ zweimal differenzierbar, so ist der Beschleunigungsvektor durch x ¨(t) ¨ (t) = x y¨(t) gegeben. ˙ In der kinematischen Interpretation ist t die Zeit und x(t) der Geschwindigkeitsvektor im physikalischen Sinne. Ist er von Null verschieden, so weist er in die positive Tangentenrichtung (als Grenzwert von Sekantenvektoren). Der Tangentenvektor ist nichts anderes als der Einheitsvektor derselben Richtung. Durch Drehung um 90◦ im Gegenuhrzeigersinn erhalten wir den Normalvektor der Kurve, vergleiche dazu Abb. 14.8.
168
14 Kurven y
y
˙ x(t)
N(t)
T(t)
¨ (t) x
x
x
Abb. 14.8. Geschwindigkeit, Beschleunigung, Tangente, Normale. ¨ Experiment 14.14 Offnen Sie das Java-Applet Parametrische Kurven in der Ebene. Plotten Sie die Kurven aus Beispiel 14.5 sowie die zugeh¨ origen Geschwindigkeitsund Beschleunigungsvektoren. Nutzen Sie das begleitende Zweibein, um den kinematischen Kurvenverlauf zu erkennen.
Beispiel 14.15 F¨ ur die Wurfparabel aus Beispiel 14.2 gilt x(t) ˙ = vH ,
x ¨(t) = 0,
y(t) ˙ = vV − gt,
y¨(t) = −g, 1 vH T(t) = p 2 , vH + (vV − gt)2 vV − gt 1 gt − vV p . N(t) = 2 + (v − gt)2 vH vH V
14.2 Bogenl¨ ange und Kru ¨ mmung Wir beginnen mit der Frage, ob und wie einem Kurvenst¨ uck eine L¨ange zugeordnet werden kann. Gegeben sei eine stetige Kurve x(t) Γ : t 7→ x(t) = , a ≤ t ≤ b. y(t) Zu einer Zerlegung Z : a = t0 < t1 < · · · < tn = b des Parameterintervalls betrachten wir den Streckenzug durch die Punkte x(t0 ), x(t1 ), . . . , x(tn ). Dessen L¨ange ist n p X Ln = (x(ti ) − x(ti−1 ))2 + (y(ti ) − y(ti−1 ))2 . i=1
14.2 Bogenl¨ ange und Kr¨ ummung
169
Definition 14.16 (Kurven endlicher L¨ ange) Eine ebene Kurve Γ heißt rektifizierbar oder von endlicher L¨ ange, wenn die L¨angen Ln beliebiger eingeschriebener Streckenz¨ uge gegen einen (und denselben) Grenzwert konvergieren, soferne nur die Feinheit der Zerlegung gegen Null geht. Beispiel 14.17 (Die Koch’sche Eisblume) Die Koch’sche Eisblume wurde im Abschnitt 9.1 als Beispiel einer endlichen Fl¨ ache vorgef¨ uhrt, deren Rand die fraktale Dimension d = log 4/ log 3 und unendliche L¨ange besitzt. Dies wurde gerade dadurch nachgewiesen, dass sich der Rand als Grenzwert von Streckenz¨ ugen konstruieren l¨ asst, deren L¨ ange gegen unendlich strebt. Es bleibt zu u ¨berlegen, ob es sich beim Rand der Koch’schen Eisblume tats¨achlich um eine stetige, parametrisierte Kurve handelt. Dies kann man wie folgt sehen. Die Eisblume der Tiefe 0 ist ein gleichseitiges Dreieck, etwa mit Eckpunkten p1 , p2 , p3 ∈ R2 . Mit Hilfe des Einheitsintervalls [0, 1] erhalten wir eine stetige Parametrisierung 0 ≤ t ≤ 13 p1 + 3t(p2 − p1 ), 1 x0 (t) = p2 + (3t − 1)(p3 − p2 ), 3 ≤ t ≤ 32 p3 + (3t − 2)(p1 − p3 ), 23 ≤ t ≤ 1.
Abb. 14.9. Parametrisierung des Rands der Koch’schen Eisblume.
Die Eisblume der Tiefe 1 parametrisieren wir, indem wir die drei Intervaluck le [0, 13 ], [ 13 , 32 ], [ 23 , 1] jeweils in drei Teile teilen und das jeweilige Mittelst¨ zur Parametrisierung des eingesetzten n¨achstkleineren Dreiecks verwenden (Abb. 14.9). In gleicher Weise fortfahrend erhalten wir eine Folge von Parametrisierungen t 7→ x0 (t), t 7→ x1 (t), . . . , t 7→ xn (t), . . . Dies ist eine Folge stetiger Funktionen [0, 1] → R2 , welche nach Konstruktion gleichm¨aßig konvergiert (siehe Def. C.5). Nach Satz C.6 ist die Grenzfunktion x(t) = lim xn (t), n→∞
t ∈ [0, 1]
stetig (und parametrisiert nat¨ urlich den Rand der Koch’schen Eisblume).
170
14 Kurven
Dieses Beispiel zeigt, dass stetige Kurven unendlich lang sein k¨onnen, auch wenn der Kurvenparameter nur ein beschr¨ anktes Intervall [a, b] durchl¨auft. Dass so ein Verhalten bei differenzierbaren Kurven nicht auftritt, zeigt der n¨ achste Satz. Satz 14.18 (L¨ange differenzierbarer Kurven) Jede stetig differenzierbare Kurve t 7→ x(t), t ∈ [a, b] ist rektifizierbar. Ihre L¨ ange ist L=
Z
a
b
˙ kx(t)k dt =
Z
b
a
p x(t) ˙ 2 + y(t) ˙ 2 dt.
Beweis: Wir geben den Beweis hier nur f¨ ur den etwas einfacheren Fall, dass ˙ die Komponenten des Geschwindigkeitsvektors x(t) Lipschitz-stetig (vergleiche Anhang C.4) sind, etwa mit einer Lipschitz-Konstanten C. Wir gehen von einer Zerlegung Z: a = t0 < t1 < · · · < tn = b der Feinheit Φ(Z) des Parameterintervalls aus. Das L definierende Integral ist Grenzwert von Riemannsummen Z bp n p X x(t) ˙ 2 + y(t) ˙ 2 dt = lim x(τ ˙ i )2 + y(τ ˙ i )2 (ti − ti−1 ) n→∞,Φ(Z)→0
a
i=1
wobei τi ∈ [ti−1 , ti ] ist. Andererseits ist nach dem Mittelwertsatz, Satz 8.4, die L¨ange des eingeschriebenen Streckenzugs durch x(t0 ), x(t1 ), . . . , x(tn ) gleich n p X i=1
(x(ti ) − x(ti−1 ))2 + (y(ti ) − y(ti−1 ))2 =
n p X i=1
x(ρ ˙ i )2 + y(σ ˙ i )2 (ti − ti−1 )
f¨ ur gewisse ρi , σi ∈ [ti−1 , ti ]. Um die Differenz der Riemannsummen und der L¨angen der eingeschriebenen Streckenz¨ uge absch¨atzen zu k¨onnen, verwenden wir die Ungleichung (Dreiecksungleichung f¨ ur Vektoren in der Ebene) p p p a2 + b2 − c2 + d2 ≤ (a − c)2 + (b − d)2 , welche man durch Ausquadrieren unmittelbar nachpr¨ uft. Demnach gilt p p ˙ i )2 + y(τ ˙ i )2 − x(ρ ˙ i )2 + y(σ ˙ i )2 x(τ p ≤ (x(τ ˙ i ) − x(ρ ˙ i ))2 + (y(τ ˙ i ) − y(σ ˙ i ))2 p ≤ C 2 (τi − ρi )2 + C 2 (τi − σi )2 √ ≤ 2CΦ(Z).
F¨ ur die Differenz der Riemannsummen und der Streckenzugl¨angen erh¨alt man damit die Absch¨atzung
14.2 Bogenl¨ ange und Kr¨ ummung
171
n p X p x(τ ˙ i )2 + y(τ ˙ i )2 − x(ρ ˙ i )2 + y(σ ˙ i )2 (ti − ti−1 ) i=1
≤
n X √ √ (ti − ti−1 ) = 2CΦ(Z)(b − a). 2CΦ(Z) i=1
Geht Φ(Z) → 0, so strebt diese Differenz gegen Null. Somit haben die Riemannsummen und die L¨angen der eingeschriebenen Streckenz¨ uge denselben Grenzwert, eben L. Der Beweis im allgemeinen Fall, wenn die Komponenten des Geschwindigkeitsvektors nicht Lipschitz-stetig sind, verl¨auft ¨ahnlich. Jedoch ben¨otigt man dazu die den weiter f¨ uhrenden Satz, dass stetige Funktionen auf beschr¨ankten, abgeschlossenen Intervallen gleichm¨aßig stetig sind. Dies wird am Ende von Anhang C.4 kurz mit einem Literaturhinweis angesprochen. ⊓ ⊔ Beispiel 14.19 (L¨ange eines Kreisbogens) Die Parameterdarstellung eines Kreises vom Radius R und ihre Ableitung ist x(t) = R cos t, y(t) = R sin t,
x(t) ˙ = −R sin t, y(t) ˙ = R cos t,
0 ≤ t ≤ 2π.
Die L¨ange des Kreisbogens (Umfang) ist somit Z 2πp Z L= (−R sin t)2 + (R cos t)2 dt = 0
2π
R dt = 2Rπ.
0
Experiment 14.20 Verwenden Sie das MATLAB -Programm mat14 5.m, um den Umfang des Einheitskreises mittels eingeschriebener Streckenz¨ uge zu approximieren. Modifizieren Sie das MATLAB -Programm, sodass es die L¨ angen beliebiger differenzierbarer Kurven approximiert.
Definition 14.21 (Bogenl¨ange) Sei t 7→ x(t) eine differenzierbare Kurve. Die L¨ange des Kurvenst¨ ucks vom Anfangsparameterwert a bis zum aktuellen Parameterwert t bezeichnet man als Bogenl¨ ange, Z tp s = L(t) = x(τ ˙ )2 + y(τ ˙ )2 dτ. a
Die Bogenl¨ange s ist eine streng monoton wachsende, stetige (sogar stetig differenzierbare) Funktion und eignet sich daher zu einer Umparametrisierung t = L−1 (s). Man nennt dann die Kurve s 7→ ξ(s) = x(L−1 (s)) nach der Bogenl¨ ange parametrisiert.
Im Folgenden sei t 7→ x(t) eine differenzierbare Kurve (in der Ebene). Es bezeichne ϕ(t) den Winkel des Tangentenvektors mit der positiven x-Achse, das heißt, y(t) ˙ . tan ϕ(t) = x(t) ˙
172
14 Kurven
Definition 14.22 (Kr¨ ummung einer ebenen Kurve) Die Kr¨ ummung einer ¨ differenzierbaren Kurve in der Ebene ist die Anderungsrate des Winkels ϕ in Bezug auf die Bogenl¨ ange, dϕ d = ϕ(L−1 (s)). ds ds Abb. 14.10 veranschaulicht die Definition: Ist ϕ der Winkel beim Wert s der Bogenl¨ange und ϕ + ∆ϕ beim Wert s + ∆s, so ist κ = lim∆s→0 ∆ϕ ∆s . Dies zeigt, dass die Gr¨oße von κ tats¨achlich dem geometrischanschaulichen Kr¨ ummungsverhalten entspricht. Man beachte, dass die Kr¨ ummung einer ebenen Kurve mit einem Vorzeichen behaftet ist; bei Umkehrung der Durchlaufrichtung wechselt sie das Vorzeichen. κ=
∆ϕ ϕ ∆s ϕ Abb. 14.10. Kr¨ ummung.
Satz 14.23 Die Kr¨ ummung einer zweimal stetig differenzierbaren Kurve im Kurvenpunkt (x(t), y(t)) betr¨agt κ(t) =
x(t)¨ ˙ y (t) − y(t)¨ ˙ x(t) 3/2 . 2 x(t) ˙ + y(t) ˙ 2
Beweis: Nach der Kettenregel und der Regel f¨ ur die Umkehrfunktion gilt κ=
d d −1 1 . ϕ(L−1 (s)) = ϕ(L ˙ −1 (s)) · L (s) = ϕ(L ˙ −1 (s)) · −1 ˙ ds ds L(L (s))
Differenzieren der Bogenl¨ange s = L(t) =
Z tp
x(τ ˙ )2 + y(τ ˙ )2 dτ
a
nach t ergibt
p ds ˙ = L(t) = x(t) ˙ 2 + y(t) ˙ 2. dt Ableiten der Beziehung tan ϕ(t) = y(t)/ ˙ x(t) ˙ f¨ uhrt auf x(t)¨ ˙ y (t) − y(t)¨ ˙ x(t) , ϕ(t) ˙ 1 + tan2 ϕ(t) = x(t) ˙ 2
was nach Einsetzen des eben verwendeten Ausdrucks f¨ ur tan ϕ(t) und K¨ urzen ϕ(t) ˙ =
x(t)¨ ˙ y (t) − y(t)¨ ˙ x(t) x(t) ˙ 2 + y(t) ˙ 2
liefert. Beachtet man die Beziehung t = L−1 (s) und setzt die gewonnenen ˙ Ausdr¨ ucke f¨ ur ϕ(t) ˙ und L(t) in der am Anfang hergeleiteten Formel f¨ ur κ ein, so erh¨alt man
14.2 Bogenl¨ ange und Kr¨ ummung
κ(t) = was zu beweisen war.
ϕ(t) ˙ x(t)¨ ˙ y (t) − y(t)¨ ˙ x(t) = 3/2 , ˙ L(t) x(t) ˙ 2 + y(t) ˙ 2
173
⊓ ⊔
Bemerkung 14.24 Die Kr¨ ummung des Graphen einer zweimal differenzierbaren Funktion y = f (x) erh¨alt man daraus zu κ(x) =
f ′′ (x) 1 + f ′ (x)2
3/2 ,
was man mittels Parametrisierung x = t, y = f (t) leicht herleitet. Beispiel 14.25 Die Kr¨ ummung eines positiv durchlaufenen Kreises vom Radius R ist konstant gleich κ = R1 . Es ist ja x(t) = R cos t, x(t) ˙ = −R sin t, y(t) = R sin t, y(t) ˙ = R cos t, daher κ=
x ¨(t) = −R cos t, y¨(t) = −R sin t,
1 R2 sin2 t + R2 cos2 t = . R (R2 sin2 t + R2 cos2 t)3/2
¨ Man erh¨alt dasselbe Ergebnis aus der geometrischen Uberlegung, dass s = Rt und der Winkel ϕ des Tangentenvektors mit der positiven x-Achse gleich t + π/2 ist. Daraus ergibt sich ϕ = s/R + π/2, nach s abgeleitet also κ = 1/R. Definition 14.26 Der Kr¨ ummungskreis in einem Kurvenpunkt einer differenzierbaren Kurve ist jener Kreis, der dieselbe Tangente und dieselbe Kr¨ ummung besitzt. 1 Nach Beispiel 14.25 folgt, dass der Kr¨ ummungskreis den Radius |κ(t)| besitzt 1 und sein Mittelpunkt im Abstand κ(t) l¨angs der Normalenrichtung N(t) vom Kurvenpunkt liegt.
Beispiel 14.27 (Klothoide) Die Klothoide ist eine Kurve, deren Kr¨ ummung ¨ proportional zur Bogenl¨ange ist. Sie eignet sich daher als Ubergangsst¨ uck von einer Geraden (Kr¨ ummung 0) zu einem Kreisbogen (Kr¨ ummung R1 ) und findet im Eisenbahn- und Straßenbau Verwendung. Ihre definierende Eigenschaft ist κ(s) =
dϕ = c ·s ds
f¨ ur ein c ∈ R. Beginnt man mit Kr¨ ummung 0 bei s = 0, so folgt f¨ ur den Winkel c ϕ(s) = s2 . 2 Wir verwenden s als Kurvenparameter.
174
14 Kurven
Ableiten der Beziehung s=
Z sp
2 + y(σ) x(σ) ˙ ˙ 2 dσ
0
zeigt, dass
1=
p x(s) ˙ 2 + y(s) ˙ 2
ist, der Geschwindigkeitsvektor einer nach der Bogenl¨ange parametrisierten Kurve also L¨ange 1 hat. Daraus folgt insbesondere dy = sin ϕ(s). ds
dx = cos ϕ(s), ds
Wir k¨onnen daraus den Kurvenverlauf ermitteln: Z s Z s Z s c dx x(s) = (σ) dσ = cos ϕ(σ) dσ = cos σ 2 dσ, 2 0 ds 0 0 Z s Z s Z s c dy y(s) = sin sin ϕ(σ) dσ = (σ) dσ = σ 2 dσ. 2 0 ds 0 0 Die Kurvenpunkte sind somit durch Fresnel’sche Integrale gegeben. F¨ ur den Kurvenverlauf siehe Abb. 14.11. Die numerische Berechnung ist aus dem MATLAB-Programm mat14 6.m ersichtlich. 1
y 0.5 0
x −0.5 −1 −1
−0.5
0
0.5
1
Abb. 14.11. Klothoide.
14.3 Ebene Kurven in Polarkoordinaten Durch Ansetzen der Parameterdarstellung in der Form x(t) = r(t) cos t, y(t) = r(t) sin t, t als Winkel, r(t) als Radius in Polarkoordinaten, erh¨alt man eine Vielzahl von Kurven. Es ist dabei die Konvention in Kraft, negative Radien in Gegenrichtung des Strahls mit Winkel t aufzutragen.
14.3 Ebene Kurven in Polarkoordinaten
175
Beispiel 14.28 (Spiralen) Die Archimedische3 Spirale ist definiert durch r(t) = t,
0 ≤ t < ∞,
die logarithmische Spirale durch r(t) = et ,
−∞ < t < ∞,
die hyperbolische Spirale durch 1 , 0 < t < ∞. t Typische derartige Spiralen sind in Abbildung 14.12 zu sehen. r(t) =
y
10
y
y
0.6
300
0.3
0
x
0
−10
x
0
x
−300
−10
0
10
0
300
600
−0.3
0
0.3
Abb. 14.12. Archimedische, logarithmische und hyperbolische Spirale. Experiment 14.29 Sehen Sie sich das Verhalten der logarithmischen Spirale in der N¨ ahe des Ursprungs mittels Zoom an (Verwendung des MATLAB -Files mat14 7.m).
Beispiel 14.30 (Schleifen) Diese erh¨alt man mittels r(t) = cos nt, n ∈ N. In kartesischen Koordinaten lautet die Parameterdarstellung also x(t) = cos nt cos t, y(t) = cos nt sin t. F¨ ur n = 1 ergibt sich ein Kreis vom Radius 21 um ( 12 , 0), f¨ ur ungerades n erh¨alt man n Bl¨atter, f¨ ur gerades n erh¨alt man 2n Bl¨atter, siehe Abb. 14.13 und 14.14. y
1
y
1
0.5
0.5
0
x
0
−0.5
−0.5
−1
−1 −1
0
1
x
−1
0
1
Abb. 14.13. Schleifen mit r = cos t und r = cos 2t. 3
Archimedes von Syrakus, 287–212 v.u.Z.
176
14 Kurven y
1
y
1
0.5
0.5
0
x
0
−0.5
−0.5
−1
−1 −1
0
1
x
−1
0
1
√
Abb. 14.14. Schleifen mit r = cos 3t und r = ± cos 2t.
√ Die Figur√eines Achters aus Abb. 14.14 erh¨alt man durch r(t) = cos 2t bzw. r(t) = − cos 2t f¨ ur − π4 < t < π4 , wobei die positive Wurzel das rechte Blatt, die negative Wurzel das linke Blatt ergibt. Diese Kurve wird als Lemniskate bezeichnet. Beispiel 14.31 (Kardioide; Herzlinie) Die Kardioide oder Herzlinie ist eine spezielle Epizykloide, bei der ein Kreis auf einem anderen Kreis vom selben Radius A abrollt. Ihre Parameterdarstellung ist x(t) = 2A cos t + A cos 2t, y(t) = 2A sin t + A sin 2t,
y 2
0
−2 −2
f¨ ur 0 ≤ t ≤ 2π, siehe dazu auch Abb. 14.15.
x
0
2
4
Abb. 14.15. Kardioide mit A = 1.
14.4 Parametrisierte Kurven im Raum In Analogie zu einer ebenen Kurve ist eine parametrisierte Raumkurve definiert als stetige Abbildung eines Intervalls [a, b] in den R3 , x(t) t 7→ x(t) = y(t) , a ≤ t ≤ b. z(t) Die Kurve heißt differenzierbar, wenn alle drei Komponentenfunktionen t 7→ x(t), t 7→ y(t), t 7→ z(t) differenzierbare reellwertige Funktionen sind.
Geschwindigkeitsvektor und Tangentenvektor einer differenzierbaren Raumkurve sind ebenfalls analog zum ebenen Fall definiert als x(t) ˙ x(t) ˙ ˙ x(t) 1 y(t) ˙ ˙ , T(t) = ˙ . x(t) = y(t) =p 2 ˙ kx(t)k x(t) ˙ + y(t) ˙ 2 + z(t) ˙ 2 z(t) z(t) ˙ ˙
14.4 Parametrisierte Kurven im Raum
177
¨ (t). Im r¨ Der Beschleunigungsvektor ist x aumlichen Fall gibt es eine Normalebene zur Kurve, die durch den Hauptnormalenvektor 1 ˙ T(t) ˙ kT(t)k
N(t) = und den Binormalenvektor
B(t) = T(t) × N(t) ˙ ˙ ˙ aufgespannt werden (jeweils x(t) 6= 0, T(t) 6= 0 vorausgesetzt). Dass T(t) orthogonal zu T(t) ist, ersieht man aus der Formel 0=
d d ˙ 1= kT(t)k2 = 2hT(t), T(t)i, dt dt
wie man durch komponentenweises Ableiten leicht nachvollzieht. Man bezeichnet (T(t), N(t), B(t)) als begleitendes Dreibein der Raumkurve.
2
B(t)
1.5
z
T(t)
N(t)
1 0.5 0 1
1
y
0
0 −1
x
−1
Abb. 14.16. Schraubenlinie mit Tangenten-, Normalen- und Binormalenvektor.
Beispiel 14.32 (Schraubenlinie) Ihre Parameterdarstellung ist cos t x(t) = sin t , −∞ < t < ∞. t
Es ist
− sin t ˙ x(t) = cos t , 1 − cos t 1 ˙ T(t) = √ − sin t , 2 0
− sin t 1 T(t) = √ cos t , 2 1 − cos t N(t) = − sin t 0
178
14 Kurven
mit Binormalenvektor − sin t − cos t sin t 1 1 cos t × − sin t = √ − cos t . B(t) = √ 2 2 1 0 1
Abb. 14.16 wurde mit Hilfe des MATLAB-Befehls
t=0 : pi/100 : 6 * pi; plot3(cos(t), sin(t), t/10) erzeugt. Das Java-Applet Parametrische Kurven im Raum bietet dynamische Visualisierungsm¨oglichkeiten dieser und anderer Raumkurven und ihrer begleitenden Dreibeine.
¨ 14.5 Ubungen 1. Finden Sie heraus, um welches geometrische Gebilde es sich bei der Nullstellenmenge des Polynoms y 2 −x(x2 −1) = 0 handelt. Visualisieren die Kurve in maple mit Hilfe des Befehls implicitplot. K¨ onnen Sie sie als stetige Kurve parametrisieren? ¨ 2. (a) Uberpr¨ ufen Sie, dass f¨ ur die Hyperbelfunktionen (Beispiel 14.11) folgende Beziehungen gelten: (sinh t)′ = cosh t, (cosh t)′ = sinh t, cosh2 t − sinh2 t = 1. (b) Berechnen Sie die Kr¨ ummung κ(t) des Hyperbelastes x(t) = cosh t, y(t) = sinh t,
− ∞ < t < ∞.
3. Untersuchen Sie mit Hilfe von MATLAB oder maple den Verlauf der LissajousFiguren4 x(t) = sin(w1 t), y(t) = cos(w2 t) und
π , x(t) = sin(w1 t), y(t) = cos w2 t + 2 jeweils f¨ ur w2 = w1 , w2 = 2w1 , w2 = 32 w1 . Erkl¨ aren Sie die Ergebnisse. Die folgenden Aufgaben verwenden die Java-Applets Parametrische Kurven in der Ebene und Parametrische Kurven im Raum. 4. (a) Analysieren Sie mittels Java-Applet, wo die Zykloide x(t) = t − 2 sin t,
y(t) = 1 − 2 cos t,
− 2π ≤ t ≤ 2π
˙ ein Geschwindigkeitsmaximum (kx(t)k → max!) besitzt und u ufen Sie das Er¨berpr¨ gebnis rechnerisch. 4
J.A. Lissajous, 1822–1880.
¨ 14.5 Ubungen
179
(b) Diskutieren und erkl¨ aren Sie den Verlauf der Schleifen x(t) = cos nt cos t, y(t) = cos nt sin t,
0 ≤ t ≤ 2π
f¨ ur n = 1, 2, 3, 4, 5 mit Hilfe des Java-Applets (Zweibein einzeichnen!). 5. Untersuchen Sie den Verlauf der Geschwindigkeit und der Beschleunigung der folgenden Kurven zun¨ achst mit dem Java-Applet und u ufen Sie dann rechnerisch, ¨berpr¨ welche Kurvenpunkte eine horizontale Tangente (x(t) ˙ 6= 0, y(t) ˙ = 0), eine vertikale Tangente (x(t) ˙ = 0, y(t) ˙ 6= 0) besitzen oder singul¨ ar sind (x(t) ˙ = 0, y(t) ˙ = 0):
(a) Zykloide:
x(t) = t − sin t, (b) Kardioide:
y(t) = 1 − cos t,
x(t) = 2 cos t + cos 2t, y(t) = 2 sin t + sin 2t,
− 2π ≤ t ≤ 2π;
0 ≤ t ≤ 2π.
6. Analysieren und erkl¨ aren Sie den (kinematischen) Verlauf der Kurven 1 − 2t2 x(t) = , −1 ≤ t ≤ 1; (1 − 2t2 )2 cos t y(t) = , 0 ≤ t ≤ 2π; 2 cos t t cos t , 6 − 2 ≤ t ≤ 2. z(t) = 2 t cos2 t Sind diese Kurven (geometrisch) ¨ aquivalent? 7. (a) Analysieren Sie die Raumkurve cos t x(t) = sin t , 2 sin 2t
0 ≤ t ≤ 4π
mittels Applet.
(b) Rechnen Sie nach, dass die Kurve die Schnittlinie des Drehzylinders x2 + y 2 = 1 mit der Kugel (x + 1)2 + y 2 + z 2 = 4 ist. Hinweis: sin2
t 2
= 21 (1 − cos t).
8. Skizzieren und diskutieren Sie mittels MATLAB , maple oder dem Applet die Raumkurven t cos t x(t) = t sin t , 0 ≤ t < ∞; 2t
und
cos t y(t) = sin t , 0
0 ≤ t ≤ 4π.
15 Skalarwertige Funktionen in zwei Ver¨ anderlichen
In diesem Abschnitt untersuchen wir Funktionen in zwei Ver¨ anderlichen mit Hilfe der Differentialrechnung. Insbesondere bestimmen wir geometrische Objekte wie Tangenten und Tangentialebenen an den Graphen, Maxima und Minima, sowie lineare und quadratische Approximationen. Die Einschr¨ ankung auf zwei Ver¨ anderliche tref¨ fen wir aus rein didaktischen Gr¨ unden. Alle Uberlegungen dieses sowie des n¨ achsten Abschnitts lassen sich (mit etwas h¨ oherem Notationsaufwand) leicht auf den Fall von n Ver¨ anderlichen erweitern. Wir studieren hier zun¨ achst den Graphen einer Funktion mittels Schnittkurven und Niveaulinien. Als weitere Hilfsmittel betrachten wir die partielle Ableitungen, welche ¨ die Anderung der Funktion in Richtung der Koordinatenachsen beschreiben. Der Begriff der totalen Ableitung erlaubt uns schließlich, die Tangentialebene an den Graphen zu definieren. Wie bei Funktionen in einer Ver¨ anderlichen hat auch hier die Taylorformel eine zentrale Bedeutung. Wir verwenden sie, um Extrema von Funktionen in zwei Ver¨ anderlichen zu untersuchen. Im ganzen Kapitel bezeichnet D eine Teilmenge des R2 und f : D ⊂ R2 → R : (x, y) 7→ z = f (x, y) eine skalarwertige Funktion in zwei Ver¨ anderlichen. Details zu der in diesem Abschnitt verwendeten Vektor- und Matrizenrechnung findet man in den Anh¨ angen A und B.
15.1 Graph und Schnittkurven Der Graph
G = (x, y, z) ∈ D × R ; z = f (x, y) ⊂ R3
einer Funktion f : D → R stellt – zumindest wenn f hinreichend regul¨ar ist – eine Fl¨ache im Raum dar. Zur Diskussion des Fl¨achenverlaufs werden gewisse Kurven auf der Fl¨ache betrachtet.
182
15 Skalarwertige Funktionen in zwei Ver¨ anderlichen
z
1
f (x, b)
0.75 0.5
z
1
f (x, y) = c
0.75 0.5
0.25
0.25
f (a, y)
0 2.5
0 2.5
y
2 1.5
b
1 0.5
0.5
1
a
1.5
2
2.5
x
y
Nc 2 1.5 1 0.5
0.5
1
1.5
2
2.5
x
Abb. 15.1. Graph einer Funktion als Fl¨ ache im Raum mit Parameterlinien (links) und Niveaulinie Nc (rechts).
Die Parameterlinien sind die Graphen der partiellen Abbildungen, die man durch Festhalten einer der beiden Variablen y = b oder x = a erh¨alt. Man nennt die durch die partiellen Abbildungen definierten Kurven x 7→ x, b, f (x, b) . . . x-Schnittkurve ; y 7→ a, y, f (a, y) . . . y-Schnittkurve . Geometrisch ergibt sich deren Graph als Schnitt von G mit der senkrechten Ebene y = b bzw. x = a, siehe Abb. 15.1, links.
Die Niveaulinien sind die Projektionen der Schnitte des Graphen G mit den horizontalen Ebenen z = c in die (x, y)-Ebene, also
4
z
4
2
2
0
y
−2
0
−4 4
−2 2
y
0 −2 −4
−4
−2
0
2
x
4
−4 −4
−2
0
x
2
4
Abb. 15.2. Das linke Bild zeigt den Graphen der Funktion z = x2 /4 − y 2 /5 mit Parameterlinien. Weiters zeigt das Bild Schnittkurven mit den Ebenen z = c f¨ ur ausgew¨ ahlte Werte von c. Im rechten Bild sind f¨ ur dieselben Werte von c die Niveaulinien der Funktion dargestellt. Dabei wurden die Linien umso dicker gezeichnet, je kleiner der Wert des Niveaus ist. Die sich kreuzenden Geraden sind die Niveaulinien zum Niveau c = 0.
15.2 Stetigkeit
183
Nc = (x, y) ∈ D ; f (x, y) = c ,
siehe dazu Abb. 15.1, rechts. Die Menge Nc heißt Niveaulinie zum Niveau c. Beispiel 15.1 Die durch den Graphen der quadratischen Funktion f : R2 → R : (x, y) 7→ z =
x2 y2 − a2 b2
beschriebene Fl¨ache wird Sattelfl¨ache oder auch hyperbolisches Paraboloid genannt. Abbildung 15.2 zeigt den Graphen von z = x2 /4 − y 2 /5 mit Parameterlinien (links) sowie einige Niveaulinien (rechts). Experiment 15.2 Visualisieren Sie mit Hilfe des MATLAB -Programms mat15_1.m das elliptischen Paraboloid z = x2 + 2y 2 − 4x + 1. W¨ ahlen Sie einen aussagekr¨ aftigen Definitionsbereich D und zeichnen Sie den Graphen sowie einige Niveaulinien.
15.2 Stetigkeit Wie bei Funktionen in einer Ver¨anderlichen (vgl. Kap. 6) wird die Stetigkeit von Funktionen in zwei Ver¨anderlichen mittels Folgen charakterisiert. Wir ben¨otigen daher den Begriff der Konvergenz von Folgen in zwei Ver¨anderlichen. Sei (an )n≥1 = (a1 , a2 , a3 , ...) eine Folge von Punkten in D mit Elementen an = (an , bn ) ∈ D ⊂ R2 . Man sagt, die Folge (an )n≥1 konvergiert f¨ ur n → ∞ gegen a ∈ D, in Zeichen: (an , bn ) = an → a = (a, b)
f¨ ur n → ∞
bzw.
lim an = a,
n→∞
genau dann wenn die beiden Komponenten der Folge konvergieren, also wenn Folgendes gilt: lim an = a und lim bn = b. n→∞
n→∞
Sonst nennt man die Folge divergent. Beispielsweise gilt 2n lim n1 , 3n+4 = 0, 32 . n→∞
Definition 15.3 Die Funktion f : D → R heißt stetig im Punkt a ∈ D, falls f¨ ur alle Folgen (an )n≥1 , die in D gegen a konvergieren, gilt lim f (an ) = f (a),
n→∞
d.h. das Funktions- und das lim-Zeichen sind vertauschbar. Abb. 15.3 zeigt eine Funktion, welche entlang einer Geraden Unstetigkeitsstellen besitzt, in allen anderen Punkten jedoch stetig ist.
184
15 Skalarwertige Funktionen in zwei Ver¨ anderlichen
f (a) f (b) a b
Abb. 15.3. Eine Funktion mit Unstetigkeitsstellen entlang einer Geraden. F¨ ur jede Folge (an ), die gegen a konvergiert, konvergiert die Bildfolge f (an ) gegen f (a). F¨ ur den Punkt b stimmt das jedoch nicht; dort ist f unstetig.
15.3 Partielle Ableitungen Die partiellen Ableitungen einer Funktion in zwei Ver¨anderlichen sind die Ableitungen der partiellen Abbildungen, d.h. der Abbildungen, die man durch Festhalten einer der beiden Variablen x = a oder y = b erh¨alt. Definition 15.4 Sei D ⊂ R2 offen, f : D → R und a = (a, b) ∈ D. Die Funktion f heißt im Punkt a partiell nach x differenzierbar, falls der Grenzwert ∂f f (x, b) − f (a, b) (a, b) = lim x→a ∂x x−a existiert. Weiters heißt f im Punkt a partiell nach y differenzierbar, falls der Grenzwert f (a, y) − f (a, b) ∂f (a, b) = lim y→b ∂y y−b existiert. Die Gr¨oßen
∂f (a, b) ∂x
bzw.
∂f (a, b) ∂y
nennt man partielle Ableitung von f nach x (bzw. y) an der Stelle (a, b). Weiters heißt f partiell differenzierbar in a, wenn beide partiellen Ableitungen existieren. Man schreibt f¨ ur die partiellen Ableitungen im Punkt (x, y) auch ∂ ∂f (x, y) = f (x, y) = ∂1 f (x, y) ∂x ∂x und analog
∂f ∂ (x, y) = f (x, y) = ∂2 f (x, y). ∂y ∂y
15.3 Partielle Ableitungen
Geometrisch interpretiert man die partiellen Ableitungen als Steigung der Tangenten der beiden Schnittkurven x 7→ (x, b, f (x, b)) und y 7→ (a, y, f (a, y)), vgl. Abb. 15.4. F¨ ur die beiden Tangentenvektoren v und w an den Graphen der Funktion im Punkt (a, b, f (a, b)) erh¨ alt man damit die Darstellung
v=
1 0 ∂f (a, b) ∂x
,
w=
0 1
. ∂f (a, b) ∂y
185
z f (a) w v
b a x
y
a
Abb. 15.4. Geometrische Interpretation der partiellen Ableitungen.
Da partielles Differenzieren nichts anderes als gew¨ohnliches Differenzieren nach einer Variablen (bei Festhalten der anderen) ist, gelten die u ¨blichen Ableitungsregeln, z.B. die Produktregel ∂f ∂g ∂ f (x, y) · g(x, y) = (x, y) · g(x, y) + f (x, y) · (x, y). ∂y ∂y ∂y p Beispiel 15.5 Sei r : R2 → R : (x, y) 7→ x2 + y 2 . Diese Funktion ist außer bei (x, y) = (0, 0) u ¨berall partiell differenzierbar. Die partiellen Ableitungen lauten x ∂r 1 2x = (x, y) = p , ∂x 2 x2 + y 2 r(x, y)
y ∂r 1 2y = (x, y) = p . ∂y 2 x2 + y 2 r(x, y)
In Maple kann man die Befehle diff und Diff zur Berechnung partieller Ableitungen verwenden, beispielsweise in obigem Fall: r:=sqrt(x^2+y^2); diff(r,x); Bemerkung 15.6 Anders als bei Funktionen in einer Ver¨anderlichen (vgl. Anwendung 7.16) folgt aus der partiellen Differenzierbarkeit nicht die Stetigkeit f partiell differenzierbar 6⇒ f stetig. Ein Beispiel dazu ist die Funktion (vgl. Abb. 15.5) xy , (x, y) 6= (0, 0), 2 x + y2 f (x, y) = 0, (x, y) = (0, 0).
Die Funktion ist u ¨berall partiell differenzierbar, insbesondere gilt
186
15 Skalarwertige Funktionen in zwei Ver¨ anderlichen z
y
x Abb. 15.5. Partiell differenzierbare, unstetige Funktion.
∂f f (x, 0) − f (0, 0) f (0, y) − f (0, 0) ∂f (0, 0) = lim = 0 = lim = (0, 0). x→0 y→0 ∂x x y ∂y Die Funktion ist bei (0, 0) aber unstetig. Um das zu sehen, w¨ahlen wir zwei Folgen, die gegen (0, 0) konvergieren: an = n1 , n1 und cn = n1 , − n1 .
Nun gilt
1/n2 1 = , n→∞ 2/n2 2
lim f (an ) = lim
n→∞
hingegen
−1/n2 1 =− . n→∞ 2/n2 2
lim f (cn ) = lim
n→∞
Die Grenzwerte stimmen nicht u ¨berein, insbesondere sind sie von f (0, 0) = 0 verschieden. Experiment 15.7 Visualisieren Sie die in Bemerkung 15.6 angegebene Funktion mittels MATLAB und maple . Mit dem Befehl plot3d(-x*y/(x^2+y^2), x=-1..1, y=-1..1, shading=zhue); erh¨ alt man den entsprechenden plot in maple .
H¨ ohere partielle Ableitungen. Sei D ⊂ R2 offen und f : D → R partiell differenzierbar. Somit sind ∂f :D→R ∂x
und
∂f :D→R ∂y
selbst wieder skalarwertige Funktionen in zwei Ver¨anderlichen. Falls diese Funktionen ebenfalls partiell differenzierbar sind, so heißt f zweimal partiell differenzierbar. Man schreibt in diesem Fall
15.4 Die totale Ableitung
∂2f ∂ = ∂x2 ∂x
∂f ∂x
,
∂2f ∂ = ∂y∂x ∂y
∂f ∂x
,
187
etc.
Es gibt somit insgesamt vier partielle Ableitungen zweiter Ordnung. Definition 15.8 Eine Funktion f : D → R ist k-mal stetig (partiell) differenzierbar, in Zeichen f ∈ C k (D), falls f k-mal partiell differenzierbar ist und alle partiellen Ableitungen bis zur Ordnung k stetig sind. 2
Beispiel 15.9 Die Funktion f (x, y) = exy ist unendlich oft partiell differenzierbar, f ∈ C ∞ (D), und es gilt 2 ∂f (x, y) = exy y 2 , ∂x
2 ∂f (x, y) = exy 2xy, ∂y 2 ∂2f (x, y) = exy y 4 , 2 ∂x 2 ∂2f (x, y) = exy (4x2 y 2 + 2x), ∂y 2 2 ∂ ∂f ∂2f (x, y) = (x, y) = exy (2xy 3 + 2y), ∂y∂x ∂y ∂x 2 ∂2f ∂ ∂f (x, y) = (x, y) = exy (2xy 3 + 2y). ∂x∂y ∂x ∂y
Die aus diesem Beispiel ersichtliche Identit¨at ∂2f ∂2f (x, y) = (x, y) ∂y∂x ∂x∂y gilt allgemein f¨ ur zweimal stetig differenzierbare Funktionen f . Diese Beobachtung stimmt auch f¨ ur h¨ohere Ableitungen: F¨ ur k-mal stetig differenzierbare Funktionen ist die Ableitungsreihenfolge bei den k-ten partiellen Ableitungen egal (Satz von Schwarz1 ), vgl. [2, Kap. 7.2.3].
15.4 Die totale Ableitung Unser n¨achstes Ziel ist es, beide Variablen der Funktion gleichzeitig zu variieren. Das f¨ uhrt auf den Begriff der totalen Ableitung (auch Fr´echetableitung2 genannt). Bei Funktionen in einer Ver¨anderlichen ϕ : R → R war die Ableitung durch den Grenzwert 1 2
H.A. Schwarz, 1843–1921. M. Fr´echet, 1878–1973.
188
15 Skalarwertige Funktionen in zwei Ver¨ anderlichen
ϕ(x) − ϕ(a) x→a x−a
ϕ′ (a) = lim
definiert. F¨ ur Funktionen in zwei Ver¨anderlichen hat dieser Ausdruck aber keinen Sinn – man kann durch Vektoren nicht dividieren. Die ¨aquivalente Definition der Ableitung als lineare Approximation lautet ϕ(x) = ϕ(a) + A · (x − a) + R(x, a) mit A = ϕ′ (a) und dem Restterm R(x, a) mit der Eigenschaft lim
x→a
R(x, a) = 0. |x − a|
Diese Formel l¨asst sich auf Funktionen in zwei Ver¨anderlichen verallgemeinern. Definition 15.10 Sei D ⊂ R2 offen und f : D → R. Die Funktion f ist im Punkt (a, b) ∈ D (total) differenzierbar (Fr´echet-differenzierbar), falls eine lineare Abbildung A : R2 → R existiert mit f (x, y) = f (a, b) + A(x − a, y − b) + R(x, y; a, b) und der Rest R(x, y; a, b) die Bedingung lim
(x,y)→(a,b)
p
R(x, y; a, b) (x − a)2 + (y − b)2
=0
erf¨ ullt. Die lineare Abbildung A heißt Ableitung von f im Punkt (a, b). Wir schreiben f¨ ur A auch Df (a, b). Die zur linearen Abbildung Df (a, b) geh¨orige (1 × 2)-Matrix heißt Jacobimatrix 3 von f . Wir bezeichnen sie mit f ′ (a, b). Die Frage, ob die totale Ableitung einer Funktion eindeutig ist und wie man sie berechnet, beantwortet der folgende Satz. Satz 15.11 Sei D ⊂ R2 offen und f : D → R. Falls f in (x, y) ∈ D total differenzierbar ist, dann ist f in (x, y) auch partiell differenzierbar, und es gilt ∂f ∂f (x, y), (x, y) . f ′ (x, y) = ∂x ∂y Die Komponenten der Jacobimatrix sind also die partiellen Ableitungen. Insbesondere ist die Jacobimatrix (und damit die totale Ableitung) eindeutig. Beweis: Wir zeigen exemplarisch
3
∂f (x, y). f ′ (x, y) 2 = ∂y
C.G.J. Jacobi, 1804–1851.
15.4 Die totale Ableitung
189
Da f in (x, y) total differenzierbar ist, gilt f (x, y + h) = f (x, y) + f ′ (x, y)
0 + R(x, y + h; x, y). h
Somit ist f (x, y + h) − f (x, y) R(x, y + h; x, y) − f ′ (x, y) 2 = →0 f¨ ur h → 0. h h Damit ist f partiell nach y differenzierbar, und die zweite Komponente der Jacobimatrix ist die partielle Ableitung von f nach y. ⊓ ⊔ Aus der Identit¨at lim
(x,y)→(a,b)
f (x, y) =
lim
(x,y)→(a,b)
= f (a, b)
f (a, b) + Df (a, b)(x − a, y − b) + R(x, y; a, b)
ergibt sich unmittelbar der folgende Satz. Satz 15.12 Falls f total differenzierbar ist, dann ist f stetig. Insbesondere ist die Funktion xy , 2 x + y2 f (x, y) = 0,
⊓ ⊔
(x, y) 6= (0, 0), (x, y) = (0, 0),
im Punkt (0, 0) nicht total differenzierbar. Die totale Differenzierbarkeit folgt aus der partiellen Differenzierbarkeit unter gewissen Regularit¨atsvoraussetzungen. Es gilt n¨amlich (vgl. [2, Kap. 7.4.2]): Falls f stetig partiell differenzierbar ist, dann ist f auch total differenzierbar. Beispiel 15.13 Die Funktion f : R2 → R : (x, y) 7→ x2 e3y ist total differenzierbar, ihre Ableitung lautet f ′ (x, y) = 2xe3y , 3x2 e3y = xe3y [2, 3x]. Beispiel 15.14 Die linear-affine Funktion f : R2 → R mit x +γ f (x, y) = αx + βy + γ = [α, β] y ist total differenzierbar und es gilt f ′ (x, y) = [α, β]. Beispiel 15.15 Die quadratische Funktion f : R2 → R mit αβ x x f (x, y) = αx2 + 2βxy + γy 2 + δx + εy + ζ = [x, y] + [δ, ε] +ζ βγ y y ist total differenzierbar mit Jacobimatrix
αβ f (x, y) = [2αx + 2βy + δ, 2βx + 2γy + ε] = 2[x, y] + [δ, ε]. βγ ′
190
15 Skalarwertige Funktionen in zwei Ver¨ anderlichen
Die Kettenregel. Wir sind nun auch in der Lage, die Verallgemeinerung der Kettenregel auf zwei Ver¨ anderliche zu formulieren. Satz 15.16 Sei D ⊂ R2 offen und f : D → R : (x, y) 7→ f (x, y) total differenzierbar. Sei weiters I ⊂ R ein offenes Intervall und ϕ, ψ : I → R differenzierbar. Dann ist auch die Hintereinanderausf¨ uhrung der Funktionen F : I → R : t 7→ F (t) = f ϕ(t), ψ(t) differenzierbar und es gilt
dϕ dψ dF ∂f ∂f ϕ(t), ψ(t) ϕ(t), ψ(t) (t) = (t) + (t). dt ∂x dt ∂y dt
Beweis: Aus der totalen Differenzierbarkeit von f folgt F (t + h) − F (t) = f ϕ(t + h), ψ(t + h) − f ϕ(t), ψ(t) = ϕ(t + h) − ϕ(t) ′ f ϕ(t), ψ(t) + R ϕ(t + h), ψ(t + h); ϕ(t), ψ(t) . ψ(t + h) − ψ(t)
Wir dividieren diesen Ausdruck durch h und betrachten anschließend 2 den 2 Grenzwert h → 0. Sei g(t, h) = ϕ(t + h) − ϕ(t) + ψ(t + h) − ψ(t) . Dann gilt wegen der Differenzierbarkeit von f , ϕ und ψ p R ϕ(t + h), ψ(t + h); ϕ(t), ψ(t) g(t, h) p = 0. lim · h→0 h g(t, h) Somit ist F differenzierbar und es gilt die im Satz angegebene Formel.
⊓ ⊔
Beispiel 15.17 Die Funktion f : D → R sei differenzierbar, wobei die offene Menge D ⊂ R2 die Kreislinie x2 + y 2 = 1 enthalte. Dann ist auch die Einschr¨ankung F von f auf die Kreislinie F : R → R : t 7→ f (cos t, sin t) als Funktion des Winkels t differenzierbar und es gilt dF ∂f ∂f (t) = − cos t, sin t · sin t + cos t, sin t · cos t. dt ∂x ∂y
Beispielsweise lautet f¨ ur f (x, y) = x2 − y 2 die Ableitung
dF dt
(t) = −4 cos t sin t.
Interpretation der totalen Ableitung. Mit Hilfe der totalen Ableitung erh¨alt man wie im Falle einer Ver¨anderlichen die lineare Approximation g(x, y) an den Funktionsgraphen in der N¨ahe von (a, b) x−a ′ g(x, y) = f (a, b) + f (a, b) ≈ f (x, y). y−b
15.4 Die totale Ableitung
191
Wir wollen nun die Ebene z = f (a, b) + f ′ (a, b)
x−a y−b
geometrisch interpretieren. Dazu ben¨ utzen wir, dass die Komponenten der Jacobimatrix die partiellen Ableitungen sind. Damit l¨asst sich obige Gleichung schreiben als z = f (a, b) +
∂f ∂f (a, b) · (x − a) + (a, b) · (y − b), ∂x ∂y
beziehungsweise in Parameterform (x − a = λ, y − b = µ) 0 1 a x y = b + λ 0 + µ 1 . ∂f ∂f f (a, b) z ∂y (a, b) ∂x (a, b)
Die Ebene trifft den Graphen von f im Punkt (a, b, f (a, b)) und wird von den Tangentenvektoren der Schnittkurven aufgespannt. Die Gleichung z = f (a, b) +
∂f ∂f (a, b) · (x − a) + (a, b) · (y − b), ∂x ∂y
beschreibt daher die Tangentialebene an den Graphen von f im Punkt (a, b). Die Funktion f : D → R ist somit in (x, y) ∈ D total differenzierbar, genau dann wenn der Graph von f in (x, y) eine Tangentialebene besitzt. Wir erinnern in diesem Zusammenhang, dass aus der Existenz der Tangenten an die Schnittkurven nicht die Existenz einer Tangentialebene folgt, vgl. Bemerkung 15.6. Beispiel 15.18 Wir berechnen die Tangentialebene an einen Punkt auf der Nordhalbkugel (mit Radius r) p f (x, y) = z = r2 − x2 − y 2 . √ Sei c = f (a, b) = r2 − a2 − b2 . Die partiellen Ableitungen von f in (a, b) sind ∂f a a (a, b) = − √ =− , 2 2 2 ∂x c r −a −b
b ∂f b =− . (a, b) = − √ 2 2 2 ∂y c r −a −b
Somit lautet die Gleichung der Tangentialebene b a z = c − (x − a) − (y − b), c c beziehungsweise a(x − a) + b(y − b) + c(z − c) = 0.
Letztere Formel gilt sogar f¨ ur alle Punkte auf der Kugeloberfl¨ache.
192
15 Skalarwertige Funktionen in zwei Ver¨ anderlichen
15.5 Richtungsableitung und Gradient Bisher waren Funktionen f : D ⊂ R2 → R stets auf dem Punktraum R2 definiert. F¨ ur die Zwecke der Richtungsableitung ist es g¨ unstig und u ¨blich, die Argumente (x, y) ∈ R2 als entsprechende Ortsvektoren x = [x, y]T zu schreiben. In dieser Weise definiert jede Funktion f : D ⊂ R2 → R auf dem Punktraum eine entsprechende Funktion auf den Spaltenvektoren. Wir identifizieren diese beiden Funktionen und m¨ ussen somit im Folgenden nicht zwischen f (x, y) und f (x) unterscheiden. In Abschnitt 15.3 haben wir partielle Ableitungen entlang Koordinatenachsen berechnet. Jetzt wollen wir in beliebigen Richtungen differenzieren. Definition 15.19 Sei D ⊂ R2 offen, x = [x, y]T ∈ D und f : D → R. Sei weiters v ∈ R2 mit kvk = 1. Der Grenzwert ∂v f (x) =
∂f f (x + hv) − f (x) (x) = lim h→0 ∂v h f (x + hv1 , y + hv2 ) − f (x, y) = lim h→0 h
(falls existent) heißt Richtungsableitung von f bei x in Richtung v. Die partiellen Ableitungen sind Spezialf¨alle der Richtungsableitung, n¨amlich die Ableitung in Richtung der Koordinatenachsen. Die Richtungsableitung ∂v f (x) beschreibt, wie sich die Funktion f im Punkt x ¨ in Richtung v ¨andert. Das sieht man aus folgender Uberlegung: Wir betrachten die Gerade {x + tv | t ∈ R} ⊂ R2 und die Funktion g(t) = f (x + tv)
(f eingeschr¨ankt auf diese Gerade)
mit g(0) = f (x). Dann gilt g(h) − g(0) f (x + hv) − f (x) = lim = ∂v f (x). h→0 h→0 h h
g ′ (0) = lim
Als N¨achstes wollen wir kl¨aren, wie man die Richtungsableitung einfach berechnen kann. Dazu die folgende Definition: Definition 15.20 Sei D ⊂ R2 offen und f : D → R partiell differenzierbar. Der Vektor ∂f (x, y) ∂x = f ′ (x, y)T ∇f (x, y) = ∂f (x, y) ∂y
heißt Gradient von f .
15.5 Richtungsableitung und Gradient
193
Satz 15.21 Sei D ⊂ R2 offen, v = [v1 , v2 ]T ∈ R2 , kvk = 1 und f : D → R total differenzierbar in x = [x, y]T . Dann gilt ∂v f (x) = h∇f (x), vi = f ′ (x, y) v =
∂f ∂f (x, y) v1 + (x, y) v2 . ∂x ∂y
Beweis: Da f in x total differenzierbar ist, gilt f (x + hv) = f (x) + f ′ (x) · hv + R(x + hv1 , y + hv2 ; x, y). Daraus folgt f (x + hv) − f (x) R(x + hv1 , y + hv2 ; x, y) = f ′ (x) · v + , h h und f¨ ur h → 0 die Aussage des Satzes.
⊓ ⊔
Satz 15.22 (Geometrische Interpretation von ∇) Sei D ⊂ R2 offen und f : D → R stetig differenzierbar in x = (x, y) mit f ′ (x) 6= [0, 0]. Dann steht ∇f (x) senkrecht auf die Niveaulinie Nf (x) = {e x ∈ R2 ; f (e x) = f (x)} und zeigt in Richtung des steilsten Anstiegs von f , siehe Abb. 15.6. Beweis: Sei v ein Tangentialvektor an die Niveauline im Punkt x. Aus dem Satz u ¨ ber implizite Funktionen (vgl. [2, Kap. 7.3.3]) folgt, dass die Niveaulinie in einer Umgebung von x durch eine differenzierbare Kurve γ(t) = [x(t), y(t)]T parametri∇f (x) Nf (x) siert werden kann, mit γ(0) = x
und
˙ γ(0) = v.
Damit gilt f¨ ur alle t in der N¨ ahe von t = 0 f γ(t) = f (x) = const.
x
v
Abb. 15.6. Geometrische
Interpretation von ∇f . Da f und γ differenzierbar sind, folgt mit Hilfe ˙ der Kettenregel (Satz 15.16) wegen γ(0) = x und γ(0) =v d ˙ 0 = f γ(t) = f ′ γ(0) γ(0) = h∇f (x), vi . dt t=0
Somit steht ∇f (x) senkrecht auf v. Sei w ∈ R2 ein weiterer Einheitsvektor. Dann gilt ∂w f (x) =
∂f (x) = h∇f (x), wi = k∇f (x)k · kwk · cos ∢, ∂w
wobei ∢ den zwischen ∇f (x) und w eingeschlossenen Winkel bezeichnet. Man sieht aus dieser Formel, dass ∂w f (x) maximal ist, genau dann wenn cos ∢ = 1, d.h. ∇f (x) = λw mit λ > 0. ⊓ ⊔ Beispiel 15.23 Sei f (x, y) = x2 + y 2 . Dann ist ∇f (x, y) = 2[x, y]T .
194
15 Skalarwertige Funktionen in zwei Ver¨ anderlichen
15.6 Die Taylorformel in zwei Ver¨ anderlichen Sei f : D ⊂ R2 → R eine Funktion in zwei Ver¨anderlichen. In den folgenden Rechnungen setzen wir voraus, dass f zumindest dreimal stetig differenzierbar ist. Um f (x + h, y + k) in eine Taylorreihe um (x, y) zu entwickeln, halten wir zun¨achst die zweite Variable fest und entwickeln nach der ersten: f (x + h, y + k) = f (x, y + k) +
∂f 1 ∂2f (x, y + k) · h + (x, y + k) · h2 + O(h3 ) ∂x 2 ∂x2
Schließlich entwickeln wir die Terme auf der rechten Seite noch nach der zweiten Variablen (bei Festhalten der ersten): 1 ∂2f ∂f (x, y) · k + (x, y) · k 2 + O(k 3 ), ∂y 2 ∂y 2 ∂f ∂f ∂2f (x, y + k) = (x, y) + (x, y) · k + O(k 2 ), ∂x ∂x ∂y∂x ∂2f ∂2f (x, y + k) = (x, y) + O(k). ∂x2 ∂x2 f (x, y + k) = f (x, y) +
Setzt man diese Ausdr¨ ucke in der obigen Gleichung ein, so erh¨alt man ∂f ∂f (x, y) · h + (x, y) · k ∂x ∂y 1 ∂2f 1 ∂2f ∂2f 2 2 + (x, y) · h + (x, y) · k + (x, y) · hk 2 ∂x2 2 ∂y 2 ∂y∂x + O(h3 ) + O(h2 k) + O(hk 2 ) + O(k 3 ).
f (x + h, y + k) = f (x, y) +
In Matrix-Vektor-Notation schreibt man diese Gleichung auch als 1 h h ′ f (x + h, y + k) = f (x, y) + f (x, y) + [h, k] · Hf (x, y) + ... k k 2 mit der Hessematrix 4 ∂2f ∂2f ∂x2 (x, y) ∂y∂x (x, y) Hf (x, y) = , 2 ∂2f ∂ f (x, y) (x, y) ∂x∂y ∂y 2
welche die zweiten partiellen Ableitungen enth¨alt. Da diese nach Voraussetzung stetig sind, ist nach dem Satz von Schwarz die Hessematrix symmetrisch. Beispiel 15.24 Man berechne die Approximation 2. Ordnung an die Funktion f : R2 → R : (x, y) 7→ x2 sin y im Entwicklungspunkt (a, b) = (2, 0). Die partiellen Ableitungen lauten 4
L.O. Hesse, 1811–1874.
15.7 Lokale Maxima und Minima
f
∂f ∂x
∂f ∂y
∂2f ∂x2
∂2f ∂y∂x
195
∂2f ∂y 2
allgemein x2 sin y 2x sin y x2 cos y 2 sin y 2x cos y −x2 sin y in (2, 0)
0
0
4
0
4
0
Somit ergibt sich f¨ ur die quadratische Approximation g(x, y) ≈ f (x, y) die Formel 1 x−2 x−2 g(x, y) = f (2, 0) + f ′ (2, 0) + [x − 2, y] · Hf (2, 0) y y 2 1 x−2 x−2 0 4 + [x − 2, y] = 0 + [0, 4] y y 4 0 2 = 4y + 4y(x − 2) = 4y(x − 1).
15.7 Lokale Maxima und Minima Sei D ⊂ R2 offen und f : D → R. Wir untersuchen in diesem Abschnitt den Funktionsgraphen von f auf Maxima und Minima. Definition 15.25 f hat ein lokales Maximum (bzw. Minimum) bei (a, b) ∈ D, wenn f¨ ur alle (x, y) in einer Umgebung von (a, b) gilt f (x, y) ≤ f (a, b)
(bzw. f (x, y) ≥ f (a, b))
Das Maximum (Minimum) heißt isoliert, wenn (a, b) der einzige Punkt der Umgebung mit dieser Eigenschaft ist. Abb. 15.7 zeigt einige typische Bilder. Man erkennt auch, dass f¨ ur differenzierbare Funktionen eine waagrechte Tangentialebene eine notwendige Bedingung f¨ ur Extrema (d.h. Maxima oder Minima) darstellt. Satz 15.26 Sei f differenzierbar. Falls f bei (a, b) ∈ D ein lokales Extremum besitzt, so gilt f ′ (a, b) = [0, 0], d.h. f hat bei (a, b) eine waagrechte Tangentialebene. Beweis: Nach Voraussetzung besitzt die Funktion g(h) = f (a + h, b) an der Stelle h = 0 ein Extremum. Somit gilt nach Satz 8.2 g ′ (0) = Ebenso zeigt man, dass
∂f ∂y (a, b)
∂f (a, b) = 0. ∂x
= 0.
⊓ ⊔
196
15 Skalarwertige Funktionen in zwei Ver¨ anderlichen z
z
z
z = (y − 2)2 +1 z = x2 +y 2 +2
z=
x
y
y
x
x
p
x2 +y 2 +1
y
Abb. 15.7. Lokale und isolierte lokale Minima. Die Funktion im linken Bild besitzt lokale Minima entlang der Geraden y = 2. Die Minima sind nicht isoliert. Die Funktion im mittleren Bild besitzt ein isoliertes Minimum bei (x, y) = (0, 0). Dieses Minimum ist sogar ein globales Minimum. Schließlich hat die Funktion im rechten Bild ebenfalls bei (x, y) = (0, 0) ein isoliertes Minimum. Die Funktion ist dort aber nicht differenzierbar.
Definition 15.27 Ein Punkt (a, b) ∈ D heißt station¨ arer Punkt von f , falls f ′ (a, b) = [0, 0] gilt. Die station¨aren Punkte sind somit Kandidaten f¨ ur Extrema. Umgekehrt sind nicht alle station¨aren Punkte auch Extrema, es k¨onnte beispielsweise auch ein Sattelpunkt vorliegen. Man nennt (a, b) Sattelpunkt von f , wenn es einen Schnitt durch den Graphen gibt, der in (a, b) ein lokales Maximum hat, und einen zweiten Schnitt, der in (a, b) ein Minimum hat, vgl. beispielsweise Abb. 15.2. Um zu entscheiden, was vorliegt, greift man wie im Fall einer Ver¨anderlichen auf die Taylorentwicklung zur¨ uck. Sei a = [a, b]T ein station¨arer Punkt von f und v ∈ R2 ein beliebiger Einheitsvektor. Wir untersuchen das Verhalten von f , eingeschr¨ankt auf die Gerade a + λv, λ ∈ R. Taylorreihenentwicklung zeigt f (a + λv) = f (a) + f ′ (a) · λv + 12 λ2 vT Hf (a) v + O(λ3 ). Da a ein station¨arer Punkt ist, gilt f ′ (a) = [0, 0] und daher f (a + λv) − f (a) = λ2
1 2
vT Hf (a) v + O(λ).
F¨ ur kleines λ ist das Vorzeichen der linken Seite daher durch das Vorzeichen von vT Hf (a) v bestimmt. Wie kann man das durch Bedingungen an Hf (a) ausdr¨ ucken? Sei α β v Hf (a) = und v= . β γ w Dann ist vT Hf (a) v = αv 2 + 2βvw + γw2 . F¨ ur ein isoliertes lokales Minimum muss dieser Ausdruck f¨ ur alle v 6= 0 positiv sein. Falls w = 0 und v 6= 0, folgt αv 2 > 0 und damit notwendigerweise
15.7 Lokale Maxima und Minima
197
α > 0. Falls w 6= 0, setzen wir v = tw mit t ∈ R und erhalten αt2 w2 + 2βtw2 + γw2 > 0, beziehungsweise (Multiplikation mit α > 0 und K¨ urzen von w2 ) t2 α2 + 2tαβ + αγ > 0. Somit gilt f¨ ur alle t ∈ R (tα + β)2 + αγ − β 2 > 0. Die linke Seite ist am kleinsten f¨ ur t = −β/α. Daraus erhalten wir die zweite Bedingung det Hf (a) = αγ − β 2 > 0, die mit Hilfe der Determinante formuliert wurde, vgl. Anhang B.1. Obige Rechnung hat insgesamt Folgendes gezeigt: Satz 15.28 Die Funktion f hat im station¨ aren Punkt a ein isoliertes lokales Minimum, falls die Bedingungen ∂2f (a) > 0 und ∂x2
det Hf (a) > 0
erf¨ ullt sind. ¨ Durch Ubergang von f zu −f erh¨alt man das entsprechende Resultat f¨ ur isolierte Maxima. Satz 15.29 Die Funktion f hat im station¨aren Punkt a ein isoliertes lokales Maximum, falls die Bedingungen ∂2f (a) < 0 und ∂x2
det Hf (a) > 0
erf¨ ullt sind. In ¨ahnlicher Weise zeigt man: Satz 15.30 Die Funktion f hat im station¨aren Punkt a einen Sattelpunkt, falls det Hf (a) < 0. Falls die Determinante der Hessematrix Null ist, untersucht man das Verhalten ¨ der Funktion entlang von Schnitten. Ein Beispiel daf¨ ur findet sich in Ubung 9.
198
15 Skalarwertige Funktionen in zwei Ver¨ anderlichen
Beispiel 15.31 Wir bestimmen Maxima, Minima und Sattelpunkte der Funktion f (x, y) = x6 + y 6 − 3x2 − 3y 2 . Die Bedingung f ′ (x, y) = [6x5 − 6x, 6y 5 − 6y] = [0, 0] liefert die neun kritischen (station¨ aren) Punkte x1 = 0,
x2,3 = ±1,
y1 = 0,
y2,3 = ±1.
Die Hessematrix der Funktion lautet 30x4 − 6 0 Hf (x, y) = . 0 30y 4 − 6 Wendet man die Kriterien der S¨ atze 15.28 – 15.30 an, so erh¨alt man folgendes Ergebnis: Der Punkt (0, 0) ist ein ein isoliertes lokales Maximum von f , die Punkte (−1, −1), (−1, 1), (1, −1) und (1, 1) sind isolierte lokale Minima, und die Punkte (−1, 0), (1, 0), (0, −1) und (0, 1) sind Sattelpunkte. Machen Sie sich mit Hilfe von maple ein Bild dieser Funktion.
¨ 15.8 Ubungen 1. Berechnen Sie die partiellen Ableitungen der Funktionen y 1 f (x, y) = arcsin . , g(x, y) = log p x x2 + y 2 ¨ Uberpr¨ ufen Sie Ihre Resultate mit maple . 2. Zeigen Sie, dass die Funktion 1 v(x, t) = √ exp t
−x2 4t
f¨ ur t > 0 und x ∈ R die W¨ armeleitungsgleichung ∂2v ∂v = ∂t ∂x2
erf¨ ullt. 3. Zeigen Sie, dass die Funktion w(x, t) = g(x − kt) die Transportgleichung ∂w ∂w +k =0 ∂t ∂x erf¨ ullt (falls g differenzierbar ist). 4. Zeigen Sie, dass die Funktion g(x, y) = log(x2 + 2y 2 ) f¨ ur (x, y) 6= (0, 0) die Gleichung ∂2g 1 ∂2g + =0 2 ∂x 2 ∂y 2 erf¨ ullt.
¨ 15.8 Ubungen
199
5. Stellen Sie das Ellipsoid x2 + 2y 2 + z 2 = 1 als Graph einer Funktion (x, y) 7→ f (x, y) dar. Unterscheiden Sie positive bzw. negative z-Koordinaten. Berechnen Sie die partiellen Ableitungen von f und skizzieren Sie die Niveaulinien von f . In welche Richtung zeigt ∇f ? ¨ 6. L¨ osen Sie Ubung 5 f¨ ur das Hyperboloid x2 + 2y 2 − z 2 = 1. 7. Gegeben sei die Funktion f (x, y) = ye2x−y , wobei x = x(t) und y = y(t) selbst differenzierbare Funktionen sind, von denen man die folgenden Daten kennt: x(0) = 2,
y(0) = 4,
x(0) ˙ = −1,
y(0) ˙ = 4. Berechnen Sie daraus die Ableitung von z(t) = f x(t), y(t) an der Stelle t = 0.
8. Berechnen Sie s¨ amtliche station¨ aren Punkte der Funktion f (x, y) = x3 − 3xy 2 + 6y.
Stellen Sie fest, ob es sich um Maxima, Minima oder Sattelpunkte handelt. 9. Untersuchen Sie die Funktion f (x, y) = x4 − 3x2 y + y 3 auf lokale Extremwerte und Sattelpunkte. Visualisieren Sie den Graphen der Funktion. Hinweis: Um das Verhalten der Funktion bei (0, 0) zu untersuchen, betrachten Sie die partiellen Abbildungen f (x, 0) und f (0, y). 10. Bestimmen Sie f¨ ur die Funktion f (x, y) = x2 ey/3 (y − 3) −
1 2 y 2
(a) den Gradienten und die Hessematrix; (b) die Taylorapproximation 2. Ordnung im Punkt (0, 0); (c) s¨ amtliche station¨ aren Punkte. Stellen Sie fest, ob es sich um Maxima, Minima oder Sattelpunkte handelt.
16 Vektorwertige Funktionen in zwei Ver¨ anderlichen
In diesem Abschnitt streifen wir kurz die Theorie vektorwertiger Funktionen in mehreren Ver¨ anderlichen. Dabei beschr¨ anken wir uns der Einfachheit halber wieder auf den Fall von Funktionen in zwei Ver¨ anderlichen. Wir definieren zun¨ achst Vektorfelder in der Ebene und erweitern die Begriffe Stetigkeit und Differenzierbarkeit auf vektorwertige Funktionen. Anschließend besprechen wir das Newtonverfahren in zwei Ver¨ anderlichen. Als Anwendung berechnen wir eine gemeinsame Nullstelle zweier nichtlinearer Funktionen. Als Erweiterung von Abschnitt 15.1 zeigen wir schließlich, wie sich komplizierte Fl¨ achenst¨ ucke mittels geeigneter Parametrisierung mathematisch g¨ unstig beschreiben lassen. F¨ ur die ben¨ otigten Grundbegriffe der Vektor- und Matrizenrechnung verweisen wir wieder auf die Anh¨ ange A und B.
16.1 Vektorfelder und Jacobimatrix Im ganzen Abschnitt bezeichne D eine offene Teilmenge des R2 und f (x, y) u 2 2 = F(x, y) = F : D ⊂ R → R : (x, y) 7→ g(x, y) v eine vektorwertige Funktion in zwei Ver¨anderlichen mit Werten in R2 . Solche Funktionen werden auch Vektorfelder genannt, da sie jedem Punkt in der Ebene einen Vektor zuordnen. Anwendungen daf¨ ur finden sich in der Physik. So werden beispielsweise das Geschwindigkeitsfeld einer str¨omenden Fl¨ ussigkeit oder das Gravitationsfeld als Vektorfelder beschrieben. Im vorigen Kapitel haben wir bereits ein Vektorfeld kennengelernt, n¨amlich den Gradienten einer skalarwertigen Funktion in zwei Ver¨anderlichen f : D → R : (x, y) 7→ f (x, y). F¨ ur partiell differenzierbares f ist der Gradient
202
16 Vektorwertige Funktionen in zwei Ver¨ anderlichen
∂f (x, y) ∂x F = ∇f : D → R2 : (x, y) 7→ ∂f (x, y) ∂y
offenbar ein Vektorfeld.
Stetigkeit und Differenzierbarkeit von Vektorfeldern werden komponentenweise definiert. Definition 16.1 Man nennt die Funktion f (x, y) F : D ⊂ R → R : (x, y) 7→ F(x, y) = g(x, y) 2
2
stetig (bzw. partiell differenzierbar, bzw. total differenzierbar), genau dann wenn ihre beiden Komponenten f : D → R und g : D → R die entsprechende Eigenschaft haben, also stetig (bzw. partiell differenzierbar, bzw. total differenzierbar) sind. Im Falle der totalen Differenzierbarkeit von f und g hat man die Linearisierungen ∂f ∂f x−a f (x, y) = f (a, b) + (a, b), (a, b) + R1 (x, y; a, b), y−b ∂x ∂y ∂g ∂g x−a (a, b), (a, b) + R2 (x, y; a, b) g(x, y) = g(a, b) + y−b ∂x ∂y f¨ ur (x, y) nahe bei (a, b) mit den Resttermen R1 und R2 . Kombiniert man diese beiden Formeln mittels Matrix-Vektorschreibweise zu einer Formel, so ergibt sich ∂f ∂f (a, b) (a, b) x−a ∂x ∂y R1 (x, y; a, b) f (x, y) f (a, b) = + y − b + R2 (x, y; a, b) , g(x, y) g(a, b) ∂g ∂g (a, b) (a, b) ∂x ∂y
beziehungsweise in Kurzschreibweise
F(x, y) = F(a, b) + F′ (a, b)
x−a + R(x, y; a, b) y−b
mit dem Restterm R(x, y; a, b) und der (2×2)-Jacobimatrix ∂f ∂f (a, b) (a, b) ∂x ∂y . F′ (a, b) = ∂g ∂g (a, b) (a, b) ∂x ∂y
16.2 Das Newtonverfahren in zwei Variablen
203
Die durch diese Matrix definierte lineare Abbildung nennt man (totale) Ableitung der Funktion F im Punkt (a, b). Der Restterm R hat die Eigenschaft p R1 (x, y; a, b)2 + R2 (x, y; a, b)2 p lim = 0. (x,y)→(a,b) (x − a)2 + (y − b)2 Beispiel 16.2 (Polarkoordinaten) Die Abbildung x r cos ϕ F : R2 → R2 : (r, ϕ) 7→ = y r sin ϕ
ist (¨ uberall) total differenzierbar mit Ableitung (Jacobimatrix) cos ϕ −r sin ϕ ′ . F (r, ϕ) = sin ϕ r cos ϕ
16.2 Das Newtonverfahren in zwei Variablen Eine in der Praxis wichtige Anwendung der Jacobimatrix findet sich beim L¨osen nichtlinearer Gleichungen in mehreren Unbekannten. Wir wollen in diesem Abschnitt exemplarisch zwei nichtlineare Gleichungen in zwei Unbekannten aufl¨osen, also die Nullstellen der Funktion f (x, y) F(x, y) = g(x, y) bestimmen. Wie bei Funktionen in einer Ver¨anderlichen werden wir dazu die lineare Approximation verwenden. Beispiel 16.3 (Schnitt eines Kreises mit einer Hyperbel) Gegeben seien der Kreis x2 + y 2 = 4 und die Hyperbel xy = 1. Die gesuchten Schnittpunkte erf¨ ullen die Vektorgleichung F(x, y) = 0 mit 2 f (x, y) x + y2 − 4 F : R2 → R2 : F(x, y) = = . g(x, y) xy − 1 Die Kurven f (x, y) = 0 und g(x, y) = 0 sind in Abb. 16.1 skizziert. Das Newtonverfahren zur Bestimmung der Nullstellen beruht auf der folgenden Idee. Zu einem Startwert (x0 , y0 ), der nahe genug bei der L¨osung liegt, berechnet man einen verbesserten Wert, indem man die Funktion durch ihre lineare Approximation bei (x0 , y0 ) ersetzt x − x0 ′ F(x, y) ≈ F(x0 , y0 ) + F (x0 , y0 ) y − y0
y
x
Abb. 16.1. Schnitt eines Kreises mit einer Hyperbel.
204
16 Vektorwertige Funktionen in zwei Ver¨ anderlichen
und die Nullstelle der Linearisierung
x − x0 0 F(x0 , y0 ) + F (x0 , y0 ) = 0 y − y0 ′
als verbesserte Approximation (x1 , y1 ) bestimmt, also x1 − x0 ′ F (x0 , y0 ) = −F(x0 , y0 ), y1 − y0 beziehungsweise −1 x x1 = 0 − F′ (x0 , y0 ) F(x0 , y0 ). y0 y1 Das ist nur durchf¨ uhrbar, wenn die Jacobimatix invertierbar ist, also ihre Determinante nicht Null ist. In obigem Beispiel lautet die Jacobimatix 2x 2y F′ (x, y) = . y x Ihre Determinante ist det F′ (x, y) = 2x2 − 2y 2 und somit auf den Geraden x = ±y singul¨ar. Diese Geraden sind in Abb. 16.1 strichliert eingezeichnet.
Die Idee ist nun, das Verfahren zu iterieren, d.h. man wiederholt mit dem verbesserten Wert als neuen Startwert den Newtonschritt −1 ∂f ∂f (xk , yk ) (xk , yk ) ∂x ∂y xk+1 x f (xk , yk ) = k − ∂g yk+1 yk g(xk , yk ) ∂g (xk , yk ) (xk , yk ) ∂x ∂y
f¨ ur k = 1, 2, 3, . . ., bis man die gew¨ unschte Genauigkeit erreicht hat. Das Verfahren konvergiert im Allgemeinen sehr schnell, wie der folgende Satz zeigt. F¨ ur einen Beweis unter leicht st¨arkeren Voraussetzungen siehe [25, Kap. 5.4.2]. Satz 16.4 Sei F : D → R2 zweimal stetig differenzierbar und gelte F(a, b) = 0 und det F′ (a, b) 6= 0. Falls der Startwert (x0 , y0 ) nahe genug bei der L¨osung (a, b) liegt, so konvergiert das Verfahren quadratisch gegen die L¨osung, d.h. die Norm des Fehlers geht mit Ordnung 2 gegen Null.
Man fasst diesen Sachverhalt oft unter dem Schlagwort lokal quadratische Konvergenz des Newtonverfahrens zusammen. Beispiel 16.5 Die Schnittpunkte zwischen Kreis und Hyperbel kann man auch analytisch berechnen. Wegen xy = 1
⇔
x=
1 y
16.3 Parametrisierte Fl¨ achenst¨ ucke
205
erhalten wir durch Einsetzen in die Kreisgleichung x2 + y 2 = 4 die biquadratische Gleichung y 4 − 4y 2 + 1 = 0.
Mittels Substitution y 2 = u ist diese Gleichung einfach l¨osbar. Der Schnittpunkt mit der gr¨oßten x-Komponente besitzt die Koordinaten q √ x = 2 + 3 = 1.93185165257813657 . . . q √ y = 2 − 3 = 0.51763809020504152 . . .
Die Anwendung des Newtonverfahrens mit Startwerten x0 = 2 und y0 = 1 liefert obige L¨osung in 5 Schritten mit 16 Stellen Genauigkeit. Man beachte insbesondere die quadratische Konvergenz, die man daran erkennt, dass sich die Anzahl der richtigen Stellen in jedem Schritt verdoppelt. x 2.000000000000000 2.000000000000000 1.933333333333333 1.931852741096439 1.931851652578934 1.931851652578136
y 1.000000000000000 5.000000000000000E-001 5.166666666666667E-001 5.176370548219287E-001 5.176380902042443E-001 5.176380902050416E-001
Fehler 4.871521418175E-001 7.039388810410E-002 1.771734052060E-003 1.502295005704E-006 1.127875985998E-012 2.220446049250E-016
Experiment 16.6 Berechnen Sie die Schnittpunkte von Bsp. 16.3 mit den MATLAB Programmen mat16_1.m und mat16_2.m. Experimentieren Sie mit verschiedenen Startwerten und versuchen Sie auf diese Weise, alle vier L¨ osungen des Problems zu bestimmen. Was passiert, wenn Sie als Startwert (x0 , y0 ) = (1, 1) w¨ ahlen?
16.3 Parametrisierte Fl¨ achenstu ¨ cke Im Abschnitt 15.1 untersuchten wir Fl¨achenst¨ ucke als Graphen einer Funktion ¨ f : D ⊂ R2 → R. Ahnlich wie im Fall von Kurven ist dieses Konzept jedoch zu eng, um komplexere Fl¨achen darzustellen. Der Ausweg besteht wie bei Kurven darin, Parametrisierungen zu betrachten. Ausgangspunkt f¨ ur die Konstruktion eines parametrisierten Fl¨achenst¨ ucks ist eine (komponentenweise) stetige Abbildung x(u, v) (u, v) 7→ x(u, v) = y(u, v) z(u, v)
eines Parameterbereichs D ⊂ R2 in den R3 . Durch Festhalten jeweils eines Parameters u = u0 oder v = v0 erh¨alt man Raumkurven u 7→ x(u, v0 ) v 7→ x(u0 , v)
... ...
u-Linie v-Linie
206
16 Vektorwertige Funktionen in zwei Ver¨ anderlichen
Definition 16.7 Ein regul¨ ares parametrisiertes Fl¨achenst¨ uck wird durch eine Abbildung D ⊂ R2 → R3 : (u, v) 7→ x(u, v) definiert, welche die folgenden Bedingungen erf¨ ullt (a) die Abbildung (u, v) 7→ x(u, v) ist injektiv; (b) die u-Linien und die v-Linien sind stetig differenzierbar; (c) die Tangentenvektoren an die u- und v-Linien sind in jedem Punkt linear unabh¨angig (spannen also stets eine Ebene auf). Diese Bedingungen garantieren, dass es sich tats¨achlich um eine zweidimensionale, fl¨achig-glatte Teilmenge des R3 handelt. Beispiel 16.8 (Drehfl¨ achen) Durch Rotation des Graphen einer stetig differenzierbaren, positiven Funktion z 7→ h(z), a < z < b, um die z-Achse ergibt sich eine Drehfl¨ache mit Parametrisierung h(u) cos v D = (a, b) × (0, 2π), x(u, v) = h(u) sin v . u
Die v-Linien sind horizontale Kreise, die u-Linien sind die Mantellinien. Man beachte, dass die Mantellinie zum Winkel v = 0 herausgenommen ist, um Be¨ dingung (a) zu gew¨ ahrleisten. Zum Uberpr¨ ufen der Bedingung (c) berechnen wir das Kreuzprodukt der Tangentenvektoren an die u- und v-Linie ′ −h(u) cos v −h(u) sin v h (u) cos v ∂x ∂x ′ × = h (u) sin v × h(u) cos v = −h(u) sin v 6= 0. ∂u ∂v h(u) h′ (u) 0 1
Dieser Vektor ist wegen h(u) > 0 nicht Null; die beiden Tangentenvektoren sind somit nicht kollinear. Abb. 16.2 zeigt die Drehfl¨ache, die mittels h(u) = 0.4 + cos(4πu)/3, u ∈ (0, 1), erzeugt wird. In MATLAB verwendet man zur Darstellung solcher Fl¨achen vorteilhaft den Befehl cylinder in Kombination mit dem Befehl mesh.
z
1
z
0.75 0.5 0.25 0 0.8
0.4
y
0
−0.4
−0.8
−0.8
−0.4
0
0.4
x
0.8
h(z)
Abb. 16.2. Drehfl¨ ache durch Rotation eines Graphen h(z) um die z-Achse. Der zugrunde liegende Graph h(z) ist rechts dargestellt.
¨ 16.4 Ubungen
z
207
1 0.5
u 0 −0.5 −1 1
0.5
y
0
−0.5
−1
−1
−0.5
0
0.5
1
v
x
Abb. 16.3. Die Oberfl¨ ache der Kugel mit Radius 1 als parametrisierte Fl¨ ache. Die Interpretation der Parameter u, v als Winkel ist im rechten Bild dargestellt.
Beispiel 16.9 (Die Sph¨ are) Die Oberfl¨ ache einer Kugel vom Radius R erh¨alt man durch die Parametrisierung R sin u cos v D = (0, π) × (0, 2π), x(u, v) = R sin u sin v . R cos u
Die v-Linien sind die Breitenkreise, die u-Linien die Meridiane (L¨angenkreise). Die Bedeutung der Parameter u, v als Winkel ist Abb. 16.3 zu entnehmen.
¨ 16.4 Ubungen 1. Berechnen Sie die Jacobimatrix der Abbildung 2 u x + y2 = F(x, y) = 2 2 . v x −y F¨ ur welche Werte von x und y ist die Jacobimatrix invertierbar? 2. Programmieren Sie das Newtonverfahren in mehreren Ver¨ anderlichen und testen Sie das Programm am Problem x2 + sin y = 4 xy = 1 mit den Startwerten x = 2 und y = 1. Wenn Sie in MATLAB arbeiten, k¨ onnen Sie die Aufgabe durch Modifikation von mat16_2.m l¨ osen.
17 Integralrechnung in zwei Ver¨ anderlichen
Wir haben in Abschnitt 11.3 vorgef¨ uhrt, wie man das Volumen von Drehk¨ orpern berechnen kann. Liegt keine Drehsymmetrie vor, ist also zum Beispiel das Volumen des K¨ orpers zu ermitteln, der zwischen einem Bereich D der (x, y)-Ebene und dem Graphen einer nichtnegativen Funktion z = f (x, y) liegt, so ben¨ otigt man eine Erweiterung der Integralrechnung auf zwei Variable. Wir werden in diesem Abschnitt den Begriff des Riemannintegrals aus Kap. 11 auf Funktionen zweier Ver¨ anderlicher u ¨bertragen. Begrifflich und rechnerisch wichtig ist die Darstellung des Bereichsintegrals als Doppelintegral und die Transformationsformel (Wechsel des Koordinatensystems). Die Integration von Funktionen mehrerer Variabler wird naturgem¨ aß – da unsere Welt dreidimensional ist – in zahlreichen Aufgabenstellungen ben¨ otigt, von denen wir einige wenige besprechen werden.
17.1 Das Bereichsintegral Wir beginnen mit der Integration einer reellwertigen Funktion z = f (x, y), die auf einem Rechteck R = [a, b]×[c, d] definiert ist. Allgemeinere Integrationsbereiche D ⊂ R2 werden wir weiter unten besprechen. Da wir aus Abschnitt 11.1 wissen, dass Riemann-integrierbare Funktionen notwendigerweise beschr¨ankt sind, setzen wir in diesem Abschnitt f von vornherein als beschr¨ankt voraus. Falls f nichtnegativ ist, soll das Integral als Volumen des K¨orpers interpretierbar sein, dessen Grundfl¨ache durch das Rechteck R und dessen Deckfl¨ache durch den Graphen von f gebildet wird (vergleiche Abb. 17.2). Dies motiviert die folgende Vorgangsweise, in der wir den K¨orper durch eine Summe von Quadern approximieren werden. Wir legen ein Gitter G aus Teilrechtecken u ¨ber das Grundrechteck R, indem wir die Intervalle [a, b] und [c, d] wie in Abschnitt 11.1 zerlegen: Zx : a = x0 < x1 < x2 < ... < xn−1 < xn = b, Zy : c = y0 < y1 < y2 < ... < ym−1 < ym = d.
210
17 Integralrechnung in zwei Ver¨ anderlichen
Die Rechtecke [xi−1 , xi ] × [yj−1 , yj ],
i = 1, . . . , n, j = 1, . . . , m
bilden ein Gitter aus Teilrechtecken. Die Feinheit Φ(G) ist die L¨ange des gr¨oßten beteiligten Teilintervalls: Φ(G) = max |xi − xi−1 |, |yj − yj−1 | ; i = 1, . . . , n, j = 1, . . . , m .
Schließlich w¨ahlen wir in jedem Teilrechteck einen beliebigen Zwischenpunkt pij = (ξij , ηij ), siehe Abb. 17.1. d ym−1 ηij y1 c
a x1 x2
ξij
xn−1 b
Abb. 17.1. Zerlegung des Rechtecks.
Die Doppelsumme S=
m n X X i=1 j=1
f (ξij , ηij )(xi − xi−1 )(yj − yj−1 )
wird wieder als Riemannsumme bezeichnet. Da das Volumen eines Teilquaders mit Basis [xi−1 , xi ] × [yj−1 , yj ] und H¨ ohe f (ξij , ηij ) das Produkt von Grundfl¨ ache mal H¨ohe ist, entspricht die Riemannsumme in der Volumsinterpretation einer N¨aherung an das Volumen unter dem Graphen von f (Abb. 17.2).
f (ξij , ηij )
d b
∆y c a
∆x
Abb. 17.2. Volumen und Teilquader.
17.1 Das Bereichsintegral
211
Wie in Abschnitt 11.1 wird das Integral nun durch einen Grenz¨ ubergang der Riemannsummen definiert. Wir betrachten eine Folge G1 , G2 , G3 , ... von Gittern, deren Feinheit Φ(GN ) → 0 geht f¨ ur N → ∞, und zugeh¨orige Riemannsummen SN . Definition 17.1 Eine beschr¨ ankte Funktion z = f (x, y) heißt auf R = [a, b] × [c, d] Riemann-integrierbar, falls f¨ ur beliebige Folgen von Gittern (GN )N ≥1 mit Φ(GN ) → 0 die zugeh¨ origen Riemannsummen (SN )N ≥1 gegen denselben Grenzwert I(f ) streben, unabh¨ angig von der Wahl der Zwischenpunkte. Dieser Grenzwert ZZ I(f ) = f (x, y) d(x, y) R
wird als das Bereichsintegral von f auf R bezeichnet. Experiment 17.2 Rufen Sie das MATLAB -File mat17 1.m auf, studieren Sie die dort gegebene Hilfe und experimentieren Sie mit verschiedenen zuf¨ allig gew¨ ahlten Riemannsummen f¨ ur die Funktion z = x2 + y 2 auf dem Rechteck [0, 1] × [0, 1]. Was passiert, wenn Sie die Anzahl der Zerlegungspunkte n gr¨ oßer und gr¨ oßer w¨ ahlen?
Wie beim Riemannintegral einer Funktion einer Variablen kann auch hier die Definition des Bereichsintegrals f¨ ur ein grobes numerisches N¨aherungsverfahren verwendet werden, ist aber zur expliziten Herleitung von Integralformeln wenig geeignet. Hat im Kapitel 11 der Hauptsatz der Differential- und Integralrechnung weiter geholfen, so ist es hier die Darstellung als Doppelintegral oder iteriertes Integral. Damit erreicht man die R¨ uckf¨ uhrung auf die Integration von Funktionen in einer Variablen. Satz 17.3 (Das Bereichsintegral als Doppelintegral) Ist eine beschr¨ankte Funktion f u ¨ber R = [a, b] × [c, d] Riemann-integrierbar und sind es auch die partiellen Funktionen x 7→ f (x, y), y 7→ f (x, y), so sind auch die AbbilRd Rb dungen x 7→ c f (x, y) dy und y 7→ a f (x, y) dx Riemann-integrierbar und es gilt ! ! Z Z Z Z ZZ b
b
f (x, y) dx dy.
f (x, y) dy dx =
a
R
d
d
f (x, y) d(x, y) =
c
c
a
Beweisskizze: W¨ahlt man die Zwischenpunkte in den Riemannsummen von der speziellen Form pij = (ξi , ηj ) mit ξi ∈ [xi−1 , xi ], ηj ∈ [yj−1 , yj ], so ist ZZ m n X X f (ξi , ηj )(yj − yj−1 ) (xi − xi−1 ) f (x, y) d(x, y) ≈ R
≈
i=1
n X i=1
Z
c
d
!
j=1
f (ξi , y) dy (xi − xi−1 ) ≈
Z
a
b
Z
c
d
!
f (x, y) dy dx
212
17 Integralrechnung in zwei Ver¨ anderlichen
und ebenso f¨ ur die zweite Aussage unter Vertauschung der Reihenfolge. Man l¨ asst also die Feinheit des Gitters G derart gegen Null gehen, dass zuerst die Feinheit der Zerlegung Zy gegen Null geht und dann die Feinheit der Zerlegung Zx . Eine schl¨ ussige Begr¨ undung f¨ ur diese Vorgangsweise erfordert ein genaues Studium des Verhaltens der Riemannsummen unter Verfeinerungen von Zerlegungen. Daf¨ ur verweisen wir auf die weiter f¨ uhrende Literatur, etwa [5, Kap. 7.13, Kap. 7.15]. ⊓ ⊔
Der Sachverhalt von Satz 17.3 wird in Abb. 17.3 veranschaulicht. Das Volumen wird anstelle von schmalen Quadern durch Summation u unne ach¨ber d¨ senparallele Schnittk¨ orper angen¨ ahert. Satz 17.3 sagt aus, dass das K¨orpervolumen sich durch Integration u ¨ber die Inhalte der Schnittfl¨achen (senkrecht zur x- oder y − Achse) ergibt. In dieser Form wird Satz 17.3 als Prinzip von Cavalieri1 bezeichnet. In einer f¨ ur allgemeinere Integralbegriffe g¨ ultigen Form spricht man oft auch vom Satz von Fubini2 . Da im Falle der Integrierbarkeit die Integrationsreihenfolge keine Rolle spielt, l¨asst man oft die Klammern weg und schreibt ZZ ZZ Z bZ d f (x, y) d(x, y) = f (x, y) dx dy = f (x, y) dy dx. R
R
Rd c
a
c
f (x, y) dy
d b c a
∆x
Abb. 17.3. Das Bereichsintegral als Doppelintegral.
Beispiel 17.4 Das Volumen unter der Paraboloidfl¨ache z = x2 + y 2 u ¨ber dem Rechteck R = [0, 1] × [0, 1] erh¨ alt man mit Hilfe von Satz 17.3, siehe auch Abb. 17.4, wie folgt: ZZ Z 1 Z 1 Z 1 y 3 y=1 x2 + y 2 d(x, y) = x2 + y 2 dy dx = x2 y + dx 3 y=0 R 0 0 0 Z 1 x3 1 x x=1 2 x2 + = + dx = = . 3 3 3 3 x=0 0 1 2
B. Cavalieri, 1598–1647. G. Fubini, 1879–1943.
17.1 Das Bereichsintegral
(0, 0)
213
(1, 1) (1, 0)
Abb. 17.4. Ausschnitt des Paraboloids z = x2 + y 2 .
Wir wenden uns nun der Integration u ¨ber allgemeinere beschr¨ankte Bereiche D ⊂ R2 zu. Die Indikatorfunktion des Bereichs D ist 1, (x, y) ∈ D, 11D (x, y) = 0, (x, y) ∈ / D. Wir k¨onnen den beschr¨ ankten Bereich D in ein Rechteck R einschließen (D ⊂ R). Falls das Riemannintegral u ¨ber die Indikatorfunktion von D existiert, so stellt es das Volumen des u ¨ber D errichteten Zylinders der H¨ ohe eins und somit den Fl¨ acheninhalt von D dar (Abb. 17.5). Das Ergebnis h¨ angt offenbar nicht von der Gr¨ oße des einschließenden Rechtecks ab, da die Indikatorfunktion außerhalb des Bereichs D den Wert Null annimmt.
R 1 D
Abb. 17.5. Fl¨ acheninhalt als Volumen des Zylinders der H¨ ohe eins.
Definition 17.5 Es sei D ein beschr¨ ankter Bereich und R ein einschließendes Rechteck. (a) Falls die Indikatorfunktion von D Riemann-integrierbar ist, so heißt der Bereich D messbar und man setzt ZZ ZZ d(x, y) = 11D (x, y) d(x, y). D
R
RR (b) Eine Teilmenge N ⊂ R2 heißt Nullmenge, falls N d(x, y) = 0 ist. (c) F¨ ur eine beschr¨ ankte Funktionen z = f (x, y) wird das Integral u ¨ber einen messbaren Bereich D definiert als ZZ ZZ f (x, y)11D (x, y) d(x, y), f (x, y) d(x, y) = D
R
falls f (x, y)11D (x, y) Riemann-integrierbar ist.
214
17 Integralrechnung in zwei Ver¨ anderlichen
Nullmengen sind zum Beispiel einzelne Punkte, Geradenst¨ ucke oder differenzierbare Kurvenst¨ ucke in der Ebene. Punkt (c) der Definition besagt, dass das Integral einer Funktion f u ¨ber einem Bereich D ermittelt wird, indem man f in einem gr¨oßeren Rechteck R außerhalb D durch Null fortsetzt. Bemerkung 17.6 (a) Ist D ein messbarer Bereich, N eine Nullmenge und f auf den jeweiligen Bereichen integrierbar, so gilt ZZ ZZ f (x, y) d(x, y) = f (x, y) d(x, y). D
D\N
(b) Sei D = D1 ∪ D2 . Falls D1 ∩ D2 eine Nullmenge bildet, so gilt ZZ ZZ ZZ f (x, y) d(x, y) = f (x, y) d(x, y) + f (x, y) d(x, y). D
D1
D2
Das Integral u ¨ber einen Gesamtbereich D erh¨alt man also als Summe der Integrale u ber Teilbereiche. Der Beweis dieser Aussagen kann unschwer durch ¨ Betrachtung der Riemannsummen gewonnen werden. Eine wichtige Klasse von Bereichen D, u ¨ber denen die Integration einfach ist, sind die Normalbereiche. Definition 17.7 (a) Eine Teilmenge D ⊂ R2 heißt Normalbereich vom Typ I, wenn gilt: D = {(x, y) ∈ R2 ; a ≤ x ≤ b, u(x) ≤ y ≤ o(x)} mit gewissen stetig differenzierbaren unteren und oberen Begrenzungsfunktionen x 7→ u(x), x 7→ o(x). (b) Eine Teilmenge D ⊂ R2 heißt Normalbereich vom Typ II, wenn gilt: D = {(x, y) ∈ R2 ; c ≤ y ≤ d, l(y) ≤ x ≤ r(y)} mit gewissen stetig differenzierbaren linken und rechten Begrenzungsfunktionen x 7→ l(x), x 7→ r(x). Abb. 17.6 zeigt Beispiele von Normalbereichen.
y
y
y = o(x) d
x = l(y) y = u(x) a
x = r(y)
c b
x
Abb. 17.6. Normalbereiche vom Typ I und II.
x
17.2 Anwendungen des Bereichsintegrals
215
Satz 17.8 (Integration u ¨ber Normalbereiche) Es sei D ein Normalbereich und f : D → R stetig. Dann gilt f¨ ur Normalbereiche vom Typ I ! Z Z ZZ b
o(x)
f (x, y) dy dx
f (x, y) d(x, y) =
a
D
u(x)
und f¨ ur Normalbereiche vom Typ II ZZ
f (x, y) d(x, y) =
D
Z
Z
d
c
!
r(y)
f (x, y) dx dy.
l(y)
Beweis: Die Aussage folgt aus Satz 17.3 unter Beachtung, dass f außerhalb von D durch Null fortgesetzt werden kann. F¨ ur Details verweisen wir auf [2, Kap. 8, Satz 3.2]. ⊓ ⊔ Beispiel 17.9 Zur Berechnung des Volumens unter der Paraboloidfl¨ache z = x2 + y 2 u ¨ber dem Dreieck D = {(x, y) ; 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x} fassen wir D als Normalbereich vom Typ I mit den Begrenzungen u(x) = 0, o(x) = 1 − x auf. Dann gilt Z 1 Z 1−x ZZ 2 2 2 2 x + y d(x, y) = x + y dy dx =
Z
0
1
D
y 3 y=1−x x2 y + dx = 3 y=0
Z
0
1
0
0
x2 (1 − x) +
1 (1 − x)3 dx = , 3 6
wie man durch Ausmultiplizieren und elementare Integration oder mittels maple sieht.
17.2 Anwendungen des Bereichsintegrals F¨ ur die anwendungsorientierte Modellbildung ist es g¨ unstig, eine vereinfachte Notation f¨ ur die Riemannsummen im Falle ¨aquidistanter Zerlegungen Zx , Zy einzuf¨ uhren. Sind alle Intervalll¨angen gleich, so schreibt man ∆x = xi − xi−1 ,
∆y = yj − yj−1
und bezeichnet ∆A = ∆x ∆y als das Fl¨ achenelement des Gitters G. Nimmt man dann noch die rechte obere Ecke pij = (xi , yj ) des Teilrechtecks [xi−1 , xi ] × [yj−1 , yj ] als Zwischenpunkt, so schreibt sich die zugeh¨orige Riemannsumme als S=
n X m X i=1 j=1
f (xi , yj )∆A =
n X m X i=1 j=1
f (xi , yj )∆x ∆y.
216
17 Integralrechnung in zwei Ver¨ anderlichen
Anwendung 17.10 (Masse als Integral der Dichte) Ein d¨ unner, ebener K¨orper D besitze die Dichte ρ(x, y) [Masse/Fl¨ acheneinheit] im Punkt (x, y). Falls die Dichte ρ u ¨berall konstant ist, so ist die Gesamtmasse einfach das Produkt aus Dichte und Fl¨ acheninhalt. Im Falle variabler Dichte (zum Beispiel auf Grund von Material¨ anderungen von Punkt zu Punkt) unterteilen wir D in kleine Teilrechtecke mit Seiten ∆x, ∆y. Die in einem Teilrechteck um (x, y) befindliche Masse ist n¨ aherungsweise gleich ρ(x, y)∆x ∆y; die Gesamtmasse somit n¨aherungsweise gleich n X m X
ρ(xi , yj )∆x ∆y.
i=1 j=1
Dies ist aber gerade eine Riemannsumme f¨ ur ZZ M= ρ(x, y) dx dy. D
¨ Diese Uberlegung zeigt, dass das Integral u ¨ber die Dichtefunktion ein plausibles Modell f¨ ur die Gesamtmasse eines fl¨ achigen K¨orpers darstellt. Anwendung 17.11 (Schwerpunkt) Wir betrachten einen fl¨achigen K¨orper D wie in Anwendung 17.10. Die beiden statischen Momente eines kleinen, nahe (x, y) befindlichen Teilrechtecks in Bezug auf einen Punkt (x∗ , y ∗ ) sind (x − x∗ )ρ(x, y)∆x ∆y,
(y − y ∗ )ρ(x, y)∆x ∆y,
siehe Abb. 17.7. y ∆x
y
∗
y − y∗
∆y x − x∗
x∗
x
Abb. 17.7. Zum statischen Moment.
Die Bedeutung der statischen Momente ersieht man, wenn man sich den K¨orper unter dem Einfluss der Schwerkraft vorstellt. Multipliziert mit der Erdbeschleunigung g ergeben sich gerade die Drehmomente in Bezug auf die Achsen durch (x∗ , y ∗ ) in Koordinatenrichtung (Kraft mal Kraftarm). Der Schwerpunkt des fl¨ achigen K¨ orpers D ist jener Punkt (xS , yS ), in Bezug auf den die Summe der statischen Momente verschwindet:
17.3 Die Transformationsformel m n X X i=1 j=1
(xi − xS )ρ(xi , yj )∆x ∆y ≈ 0,
m n X X i=1 j=1
217
(yj − yS )ρ(xi , yj )∆x ∆y ≈ 0.
L¨ asst man die Feinheit des unterteilenden Gitters gegen Null gehen, so ergeben sich im Grenz¨ ubergang ZZ ZZ (x − xS )ρ(x, y) dx dy = 0, (y − yS )ρ(x, y) dx dy = 0 D
D
als Bedingungsgleichungen f¨ ur den Schwerpunkt, also ZZ ZZ 1 1 xS = x ρ(x, y) dx dy, yS = y ρ(x, y) dx dy, M M D D wobei M wie in Anwendung 17.10 die Gesamtmasse bezeichnet. F¨ ur den Spezialfall einer Belegung konstanter Dichte ρ(x, y) ≡ 1 erh¨alt man den geometrischen Schwerpunkt des Bereichs D. y
Beispiel 17.12 (Geometrischer Schwer√ punkt eines Viertelkreises) Es sei D der y = r2 − x2 Viertelkreis vom Radius r um (0, 0) im eryS sten Quadranten,√also D = {(x, y) ; 0 ≤ 2 2 x ≤ r, 0 ≤ y ≤ r − x } (Abb. 17.8). x Mit Belegung ρ(x, y) ≡ 1 ergibt sich M xS r 2 als Fl¨acheninhalt zu r π/4. Das erste staAbb. 17.8. Schwerpunkt des Viertelkreises. tische Moment ist √ ZZ Z r Z r2 −x2 Z r y=√r2 −x2 x dx dy = dx x dy dx = xy y=0 D 0 0 0 Z r p 3/2 x=r 1 1 x r2 − x2 dx = − r2 − x2 = = r3 . 3 3 x=0 0 F¨ ur die x-Koordinate des Schwerpunkts ergibt sich somit xS = aus Symmetriegr¨ unden gilt yS = xS .
4 r2 π
· 13 r3 =
4r 3π ;
17.3 Die Transformationsformel ¨ Ahnlich wie die Substitutionsregel f¨ ur einfache Integrale in Abschnitt 10.2 erm¨oglicht die Transformationsformel f¨ ur Bereichsintegrale, im Integrationsgebiet D andere Koordinaten zu verwenden. Es ist f¨ ur die Zwecke dieses Abschnitts g¨ unstig, D als offene Teilmenge des R2 zu nehmen (vgl. Def. 9.1). Definition 17.13 Eine bijektive, differenzierbare Abbildung F : D → B = F(D) zwischen zwei offenen Teilmengen D, B ⊂ R2 heißt Diffeomorphismus, wenn auch ihre Umkehrabbildung F−1 differenzierbar ist.
218
17 Integralrechnung in zwei Ver¨ anderlichen
Wir verwenden folgende Bezeichnungen f¨ ur die Variablen: u x x(u, v) F:D→B: 7→ = . v y y(u, v) Abb. 17.9 zeigt etwa das Bild B des Bereichs D = (0, 1) × (0, 1) unter der Transformation u x u + v/4 F: 7→ = . v y u/4 + v + u2 v 2 v
y F
D
B u
x
Abb. 17.9. Transformation eines ebenen Bereichs.
Ziel ist es, das Integral einer reellwertigen Funktion f auf dem transformierten Bereich B in ein solches auf dem Bereich D zur¨ uckzuf¨ uhren. Wir legen nun u ¨ber den Bereich D in der (u, v)-Ebene ein Gitter G und greifen ein Teilrechteck heraus, etwa mit linkem unteren Eckpunkt in (u, v) und durch die Vektoren ∆u 0 , 0 ∆v
aufgespannten Seiten. Das Bild des Teilrechtecks unter der Transformation F wird im Allgemeinen krummlinig berandet sein. Wir wollen es in erster N¨aherung durch ein Parallelogramm ersetzen. In linearer N¨aherung (siehe Abschnitt 15.4) gilt ∆u ′ F(u + ∆u, v) ≈ F(u, v) + F (u, v) , 0 0 F(u, v + ∆v) ≈ F(u, v) + F′ (u, v) . ∆v
Das N¨aherungsparalellogramm wird also durch die Vektoren ∂x ∂x (u, v) (u, v) ∂u ∆u, ∂v ∆v ∂y ∂y (u, v) (u, v) ∂u ∂v aufgespannt und hat den Fl¨acheninhalt (vgl. Anhang A.5)
17.3 Die Transformationsformel
219
∂x ∂x (u, v) (u, v) ∂u ∂v ∆u ∆v = det F′ (u, v) ∆u ∆v. det ∂y ∂y (u, v) (u, v) ∂u ∂v Das Fl¨achenelement ∆A = ∆u ∆v wird, kurz gesagt, durch die Transformation F in das Fl¨achenelement ∆ F(A) = det F′ (u, v) ∆u ∆v u uhrt (siehe ¨bergef¨ Abb. 17.10). v
y ∆F(A)
∆A
u
x
Abb. 17.10. Transformation eines Fl¨ achenelements.
Satz 17.14 (Transformationsformel f¨ ur Bereichsintegrale) Es seien D, B offene, beschr¨ankte Teilmengen des R2 , F : D → B eine Diffeomorphismus und f : B → R eine beschr¨ankte Abbildung. Dann gilt: ZZ ZZ f (x, y) dx dy = f F(u, v) det F′ (u, v) du dv, B
D
soferne die Funktionen f und f (F) |det F′ | Riemann-integrierbar sind.
Beweisskizze: Wir verwenden Riemannsummen u ¨ber dem transformierten Gitter und erhalten ZZ n X m X f (x, y) dx dy ≈ f (xi , yj )∆ F(A) B
i=1 j=1
≈ ≈
m n X X i=1 j=1
ZZ
D
f x(ui , vj ), y(ui , vj ) det F′ (ui , vj ) ∆u ∆v
f x(u, v), y(u, v) det F′ (u, v) du dv.
Eine genaue Ausf¨ uhrung des Beweises ist anspruchsvoll und aufw¨andig. Man hat entweder die M¨oglichkeit, im Rahmen des Riemann’schen Integralbegriffs zu bleiben und u ¨ber den Rand des Gebiets D und das dortige Verhalten der Transformation F Zusatzvoraussetzungen zu machen (siehe dazu etwa [5, Kap. 7.18]), oder man geht den Umweg u ¨ber die allgemeinere Integrationstheorie von Lebesgue3 und erh¨alt den Satz unter den hier angegebenen Voraussetzungen als Spezialfall (siehe etwa [6, Satz 20.9]). ⊓ ⊔ 3
H. Lebesgue, 1875–1941.
220
17 Integralrechnung in zwei Ver¨ anderlichen
Beispiel 17.15 Der Fl¨ acheninhalt des Bereichs B aus Abb. 17.9 kann mittels Transformationsformel, angewendet auf f (x, y) = 1, wie folgt berechnet werden. Es ist 1 1/4 , F′ (u, v) = 1/4 + 2uv 2 1 + 2u2 v det F′ (u, v) = 15 + 2u2 v − 1 uv 2 16 2 und daher ZZ
B
dx dy =
ZZ
det F′ (u, v) du dv
D 1 Z 1
1 2 = + 2u v − uv dv du 16 2 0 0 Z 1 1 15 1 1 19 15 + u2 − u du = + − = . = 16 6 16 3 12 16 0 Z
15
2
Beispiel 17.16 (Volumen einer Halbkugel in Polarkoordinaten) Wir stellen eine Halbkugel vom Radius R durch den dreidimensionalen Bereich p {(x, y, z) ; 0 ≤ x2 + y 2 ≤ R2 , 0 ≤ z ≤ R2 − x2 − y 2 }
dar. Ihr Volumen erh¨alt man durch Integration der Funktion f (x, y) = p R2 − x2 − y 2 u ¨ber der Grundfl¨ache B = {(x, y) ; 0 ≤ x2 + y 2 ≤ R2 }. In Polarkoordinaten r x r cos ϕ F : R2 → R2 : 7→ = ϕ y r sin ϕ
ist der Bereich B darstellbar als das Bild F(D) des Rechtecks D = [0, R] × [0, 2π]. Um die Voraussetzungen von Satz 17.14 zu erf¨ ullen, m¨ ussen wir allerdings zu offenen Bereichen u bergehen, auf denen F ein Diffeomorphismus ist. ¨ Dies k¨onnen wir erreichen, indem wir etwa aus dem Kreis B die Berandung und den Halbstrahl {(x, y) ; 0 ≤ x ≤ R, y = 0} und aus dem Rechteck D den Rand entfernen. Dann ist F auf den so gewonnenen verkleinerten Bereichen D′ , B ′ ein Diffeomorphismus. Da sich aber B von B ′ und D von D′ nur um Nullmengen unterscheiden, a¨ndert dies wegen Bemerkung 17.6 nichts ¨ an den Integralen und wir k¨onnen ohne Anderung des Ergebnisses u ¨ber die urspr¨ unglichen Bereiche B und D integrieren. Es ist cos ϕ −r sin ϕ F′ (r, ϕ) = , det F′ (r, ϕ) = r. sin ϕ r cos ϕ
Einsetzen von x = r cos ϕ, y = r sin ϕ ergibt x2 + y 2 = r2 und wir erhalten das Volumen aus der Transformationsformel zu
¨ 17.4 Ubungen
ZZ p B
R2 − x2 − y 2 dx dy = =
Z
0
Z
2π
0
R
2π r
0
=−
RZ
221
p R2 − r2 r dϕ dr
p
R2 − r2 dr
3/2 r=R 2π 3 2π 2 R − r2 = R , 3 3 r=0
also das aus der elementaren Geometrie bekannte Ergebnis.
¨ 17.4 Ubungen 1. Berechnen Sie das Volumen der parabolischen Kuppel z = 2 − x2 − y 2 u ¨ber dem quadratischen Bereich D : −1 ≤ x ≤ 1, −1 ≤ y ≤ 1. RR 2. (Aus der Statik) Berechnen Sie das axiale Tr¨ agheitsmoment D y 2 dx dy eines Rechtecksquerschnitts D : 0 ≤ x ≤ b, −h/2 ≤ y ≤ h/2 (b > 0, h > 0).
3. Berechnen Sie das Volumen des von der ache z = x + y begrenzten K¨ orpers √ Fl¨ u ¨ber dem Bereich D : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x2 .
4. Berechnen Sie das Volumen des von der Fl¨ ache z = 6 − x − y begrenzten K¨ orpers u ¨ber dem Bereich D, der von der y-Achse und den Geraden x + y = 6, x + 3y = 6 eingeschlossen wird (x ≥ 0, y ≥ 0).
5. Berechnen Sie den geometrischen Schwerpunkt des Bereichs D : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x2 .
6. Berechnen Sie den Fl¨ acheninhalt und den geometrischen Schwerpunkt der Halbellipse y2 x2 + 2 ≤ 1, y ≥ 0. 2 a b Hinweis: F¨ uhren Sie elliptische Koordinaten x = ar cos ϕ, y = br sin ϕ, 0 ≤ r ≤ 1, 0 ≤ ϕ ≤ π ein, berechnen Sie die Jacobimatrix und verwenden Sie die Transformationsformel. 7. (Aus der Statik) Berechnen Sie das axiale Tr¨ agheitsmoment eines Kreisrings mit innerem Radius R und a ußerem Radius R in Bezug auf diepMittelachse, das heißt, ¨ 1 2 RR das Integral D (x2 + y 2 ) dx dy u ¨ber den Bereich D : R1 ≤ x2 + y 2 ≤ R2 .
8. Modifizieren Sie das MATLAB -Programm mat17 1.m derart, dass es Riemannsummen u ¨ber a ¨quidistante Zerlegungen mit ∆x 6= ∆y auswerten kann.
18 Lineare Regression
Die lineare Regression ist eine der wichtigsten Methoden der Datenanalyse. Sie dient ¨ der Bestimmung von Modellparametern, der Modellanpassung, der Uberpr¨ ufung der St¨ arke von Einflussfaktoren und der Prognose in allen Bereichen der Human-, Natur- und Wirtschaftswissenschaften. Informatiker und Informatikerinnen, die mit Anwendern aus diesen Gebieten zusammenarbeiten, werden mit Sicherheit Regressionsmodellen begegnen. Wir leiten die Formeln f¨ ur die Koeffizienten der Regressionsmodelle mit der Methode der kleinsten Fehlerquadrate als Extremwertaufgabe her. Das Ziel dieses Abschnitts ist eine erste Einf¨ uhrung in das Gebiet; wir werden nur Methoden der deskriptiven Datenanalyse zur Modellbeurteilung verwenden. Die weiter f¨ uhrenden wahrscheinlichkeitstheoretischen Ans¨ atze werden hier ausgeklammert; sie sind Thema der Statistik. Dazu wie auch zur nichtlinearen Regression verweisen wir auf die Spezialliteratur. Wir beginnen mit der einfachen (oder univariaten) linearen Regression – einem Modell mit einer Eingangs- und einer Ausgangsgr¨ oße – und erl¨ autern die Grundideen der Varianzzerlegung zur Modellbeurteilung. Anschließend wenden wir uns der mehrfachen (multiplen oder multivariaten) linearen Regression zu – mit mehreren Eingangsgr¨ oßen. Das Kapitel schließt mit einem deskriptiven Ansatz zur Beurteilung des Einflusses der einzelnen Koeffizienten.
18.1 Einfache lineare Regression Eine erste Einf¨ uhrung in die Grundideen der linearen Regression wurde bereits in Abschnitt 8.3 gegeben. In Erweiterung des dort diskutierten Zugangs werden wir in diesem Abschnitt allgemeinere Modelle zulassen, insbesondere Regressionsgeraden, die nicht notwendigerweise durch den Ursprung gehen. Gegeben seien Paare von Messdaten (xi , yi ), i = 1, . . . , n, geometrisch eine Punktwolke in der Ebene. Dabei k¨onnen die Werte xi und yi durchaus mehrfach auftreten, also auch zu gegebenem xi mehrere Messwerte yi1 , . . . , yip
224
18 Lineare Regression
vorliegen. Die allgemeine lineare Regressionsaufgabe besteht darin, an die n Messpunkte (xi , yi ), i = 1, . . . , n einen Funktionsgraphen y = β0 ϕ0 (x) + β1 ϕ1 (x) + . . . + βm ϕm (x) mit vorgegebenen Formfunktionen ϕj (x) und unbekannten Koeffizienten βj so anzupassen, dass die Summe der Fehlerquadrate minimal wird: n X i=1
2 yi − β0 ϕ0 (xi ) − β1 ϕ1 (xi ) − . . . − βm ϕm (xi ) → min!
Die Regression heißt linear, weil der Graph linear von den unbekannten Koeffizienten βj abh¨angt. Die Wahl der Formfunktionen ergibt sich entweder aus einem etwaigen theoretischen Modell oder aber empirisch, wobei verschiedene M¨oglichkeiten getestet werden (die Auswahl erfolgt zum Beispiel nach dem Anteil der Datenvariabilit¨ at, der durch die Regression erkl¨ art wird – mehr dazu im Abschnitt 18.4). Die Standardaufgabe der (einfachen oder univariaten) linearen Regression ist es, ein lineares Modell y = β0 + β1 x an die Messdaten anzupassen, also eine beste Gerade oder Regressionsgerade durch die Punktwolke zu legen. Beispiel 18.1 Eine Stichprobe von n = 70 Informatikstudenten an der Universit¨at Innsbruck ergab im Jahr 2002 die in Abb. 18.1 dargestellten Werte f¨ ur x = K¨orpergr¨ oße [cm] und y = Gewicht [kg]. Das linke Bild in Abb. 18.1 zeigt die Regressionsgerade y = β0 + β1 x, das rechte die Anpassung einer quadratischen Parabel der Form y = β0 + β1 x + β2 x2 an die Datenpunkte. Man beachte den Unterschied zu Abb. 8.8, wo die beste Gerade durch den Ursprung angepasst wurde, also im linearen Modell β0 = 0 verlangt wurde.
140
140
120
120
100
100
80
80
60
60
40 160
170
180
190
200
40 160
170
180
190
200
Abb. 18.1. Streudiagramm Gr¨ oße/Gewicht, beste Gerade, beste Parabel.
18.1 Einfache lineare Regression
225
Eine Variante der Standardaufgabe erh¨ alt man durch Variablentransformation ξ = ϕ(x), η = ψ(y) und einen linearen Modellansatz η = β0 + β1 ξ. Rechnerisch ist diese Aufgabe identisch mit der Standardaufgabe der linearen Regression, jedoch durch die transformierten Daten (ξi , ηi ) = ϕ(xi ), ψ(yi ) .
Ein typisches Beispiel ist die loglineare Regression mit ξ = log x, η = log y: log y = β0 + β1 log x, was r¨ ucktransformiert dem Ansatz y = eβ0 xβ1
entspricht. Besteht die Variable x ihrerseits aus mehreren Komponenten, die linear kombiniert werden, so spricht man von multipler linearer Regression, die wir im Abschnitt 18.3 behandeln werden. Die Bezeichnung Regression wurde von Galton1 eingef¨ uhrt, der bei Untersuchungen der Gr¨oße von S¨ ohnen/V¨ atern feststellte, dass eine Tendenz zum R¨ uckschritt (Regress) zur durchschnittlichen Gr¨oße vorliegt. Die aus [18] entnommenen Daten in Abb. 18.2 zeigen diesen Effekt. Wie schon in Abschnitt 8.3 erw¨ahnt, geht das Konzept der Minimierung der Summe der Fehlerquadrate auf Gauß zur¨ uck. S¨ ohne [Zoll]
74 72 70 68 66 64
66
68
70
72
74
76
V¨ ater [Zoll]
Abb. 18.2. Regression Gr¨ oße der V¨ ater zur Gr¨ oße der S¨ ohne [Zoll].
Wir beginnen nun mit der Modellbildung des Regressionsansatzes. Das postulierte Modell f¨ ur den Zusammenhang zwischen x und y ist das lineare Modell 1
F. Galton, 1822–1911.
226
18 Lineare Regression
y = β0 + β1 x mit unbekannten Koeffizienten β0 und β1 . Die vorliegenden Daten liegen jedoch nicht exakt auf der entsprechenden Gerade, sondern zeigen Abweichungen εi , i = 1, . . . , n: yi = β0 + β1 xi + εi , wie in Abb. 18.3 dargestellt. y
y = β0 + β1 x εi
yi
xi
x
Abb. 18.3. Lineares Modell und Fehler.
Wir wollen aus den vorliegenden Daten Sch¨ atzwerte βb0 , βb1 f¨ ur β0 , β1 gewinnen. Dies erfolgt durch Minimierung der Summe der Fehlerquadrate L(β0 , β1 ) =
n X i=1
ε2i =
n X i=1
(yi − β0 − β1 xi )2 ,
sodass also βb0 , βb1 L¨ osung des Minimierungsproblems L(βb0 , βb1 ) = min L(β0 , β1 ) ; β0 ∈ R, β1 ∈ R
ist. Wir erhalten βb0 und βb1 , indem wir die partiellen Ableitungen von L nach β0 und nach β1 zu Null setzen: n X ∂L b b β0 , β1 = −2 (yi − βb0 − βb1 xi ) ∂β0 i=1
=0
n X ∂L b b xi (yi − βb0 − βb1 xi )= 0 β0 , β1 = −2 ∂β1 i=1
Dies f¨ uhrt auf ein lineares Gleichungssystem f¨ ur βb0 , βb1 , die so genannten Normalgleichungen P b P n βb0 + xi β1 = yi P b P 2 b P xi β0 + x β1 = xi yi . i
18.1 Einfache lineare Regression
227
Satz 18.2 Sofern im Datensatz (xi , yi ), i = 1, . . . , n nicht alle xi -Werte zusammenfallen, besitzt das System der Normalgleichungen die eindeutige L¨ osung P P P P P b xi yi − 1 xi yi βb0 = n1 yi − n1 xi β1 , βb1 = P 2 n1 P 2 xi − n ( xi ) und (βb0 , βb1 ) minimiert die Summe der Fehlerquadrate L(β0 , β1 ).
Beweis: Mit den Bezeichnungen x = (x1 , . . . , P xn ) und P 1 = (1, . . . , 1) ist die Determinante des Normalgleichungssystems n x2i − ( xi )2 = kxk2 k1k2 − hx, 1i2 . Es ist hx, 1i = kxkk1k · cos ∡(x, 1). Dies wird im Anhang A.4 f¨ ur Vektoren der L¨ange n = 2 und n = 3 gezeigt, gilt aber f¨ ur beliebige Dimension n (siehe etwa [2, Kap. 6.6.3]). Daraus folgt, dass kxkk1k ≥ |hx, 1i| ist, wobei Gleichheit nur vorliegen kann, wenn x parallel zu 1 ist, also alle Komponenten xi gleich sind. Dies wurde aber ausgeschlossen, daher ist die Determinante des Normalgleichungssystems gr¨oßer als Null und die L¨osungsformel ergibt sich aus einer einfachen Rechnung. Um zu zeigen, dass diese L¨osung L(β0 , β1 ) minimiert, berechnen wir die Hessematrix 2 " " # P # ∂2L ∂ L n xi k1k2 hx, 1i ∂β0 ∂β1 ∂β02 =2 P . HL = ∂ 2 L P 2 =2 ∂2L hx, 1i kxk2 xi xi 2 ∂β ∂β ∂β 1
0
1
Die Werte ∂ 2 L/∂β02 = 2n und det HL = 4 kxk2 k1k2 − hx, 1i2 sind positiv. Laut Satz 15.28 besitzt L im Punkt (βb0 , βb1 ) ein isoliertes lokales Minimum, das aber wegen der Eindeutigkeit der L¨osung das einzige Minimum von L ist. ⊓ ⊔
Die Voraussetzung des Satzes – dass es mindestens zwei verschiedene xi -Werte im Datensatz gibt – ist keine Einschr¨ankung, da andernfalls die Regressionsaufgabe nicht sinnvoll gestellt ist. Das Ergebnis der Regression ist die gesch¨ atzte Regressionsgerade y = βb0 + βb1 x.
Die durch das Modell prognostizierten Werte sind dann ybi = βb0 + βb1 xi ,
i = 1, . . . , n.
Deren Abweichungen von den Messwerten yi bezeichnet man als Residuen ei = yi − ybi = yi − βb0 − βb1 xi ,
i = 1, . . . , n.
Die Bedeutung der verschiedenen Werte ist Abb. 18.4 zu entnehmen.
228
18 Lineare Regression
Damit ist das deterministische Regressionsmodell spezifiziert. Im statistischen Regressionsmodell werden die Fehler εi als Zufallsgr¨oßen mit Erwartungswert Null interpretiert. Unter weiteren wahrscheinlichkeitstheoretischen Zusatzannahmen wird das Modell dann statistischen Test- und Diagnoseverfahren zug¨anglich gemacht. Wie in der Einf¨ uhrung erw¨ahnt, verfolgen wir diesen Weg hier nicht und verbleiben auf der Ebene der deskriptiven Datenanalyse. y
y = β 0 + β1 x ybi yi
ei
y = βb0 + βb1 x x
xi
Abb. 18.4. Lineares Modell, Sch¨ atzung, Residuum.
Um eine u ¨bersichtlichere Darstellung zu erreichen, sollen die Normalgleichungen nun umformuliert werden. Wir f¨ uhren die folgenden Vektoren und Matrizen ein: y1 1 x1 ε1 y2 1 x2 ε2 β y = . , X = . . , β = 0 , ε = . . β1 .. .. .. .. yn 1 xn εn
Die Relation Daten-Modell
yi = β0 + β1 xi + εi ,
i = 1, . . . , n,
schreibt sich dann in Matrixform einfacher als y = Xβ + ε. Weiters ist 1 1 1 1 ... 1 XT X = x1 x2 . . . xn ...
x1 P x2 n P xi P .. = xi x2i .
1 xn yi y P 1 1 . . . 1 2 yi XT y = , = P x1 x2 . . . xn ... xi yi yn
18.2 Rudimente der Varianzanalyse
229
sodass die Normalgleichungen sich als b = XT y XT Xβ
darstellen. Die L¨osung ist somit
b = (XT X)−1 XT y; β
die Prognosewerte und Residuen sind b b = Xβ, y
b. e=y−y
Beispiel 18.3 (Fortsetzung von Beispiel 18.1) Die Daten f¨ ur x = K¨orpergr¨oße und y = Gewicht finden sich im m-File mat08 3.m; die Matrix X wird in MATLAB durch X = [ones(size(x)), x]; erzeugt; die Regressionskoeffizienten erh¨alt man mittels beta = inv(X’* X) * X’* y; Der Aufruf beta = X\y erlaubt eine stabilere Berechnung in MATLAB. In unserem Fall ergibt sich βb0 = −85.0209, βb1 = 0.8787
und damit die in Abb. 18.1 links dargestellte Regressionsgerade.
18.2 Rudimente der Varianzanalyse Ein erstes Indiz f¨ ur die Anpassungsqualit¨at des linearen Modells liefert die Varianzanalyse, auf der auch die erw¨ahnten statistischen Testverfahren aufbauen; in diesem Zusammenhang oft als ANOVA bezeichnet, von Analysis of Variance. Das arithmetische Mittel der y-Werte ist n
y¯ =
1X yi . n i=1
Die Abweichung des Messwerts yi vom Mittelwert y¯ ist yi − y¯. Die totale quadratische Abweichung oder Gesamtvariabilit¨ at der Daten ist Syy =
n X i=1
(yi − y¯)2 .
Die Gesamtvariabilit¨at wird in zwei Teilkomponenten zerlegt, und zwar in der folgenden Weise:
230
18 Lineare Regression n X i=1
(yi − y¯)2 =
n n X X (yi − ybi )2 . (b yi − y¯)2 + i=1
i=1
Die G¨ ultigkeit dieser Beziehung werden wir im Satz 18.4 unten beweisen. Dies wird folgendermaßen interpretiert: ybi −¯ y ist die Abweichung des Prognosewerts vom Mittelwert, und n X SSR = (b yi − y¯)2 i=1
die durch die Regression beschriebene Datenvariabilit¨ at (Sum of Squares Regression). Andererseits sind ei = yi − ybi gerade die Residuen, und SSE =
n X i=1
(yi − ybi )2
die Quadratsumme der Residuen, welche als Restvariabilit¨ at interpretiert wird, die durch das lineare Modell unerkl¨art verbleibt (Sum of Squares - Error). Die Sprechweise l¨asst sich am besten durch die beiden Grenzf¨alle erl¨autern: (a) Die Messwerte yi liegen bereits auf einer Geraden. Dann sind alle ybi = yi und somit Syy = SSR , SSE = 0, das Regressionsmodel beschreibt die Datenlage exakt. (b) Die Messwerte stehen in keinerlei linearem Zusammenhang. Dann ist die ¨ beste Gerade die Horizontale auf H¨ohe des Mittelwerts (vgl. Ubung 12 aus Kapitel 8), also ybi = y¯ f¨ ur alle i und damit Syy = SSE , SSR = 0, das heißt, das Regressionsmodell steuert keinerlei Erkl¨arung u ¨ber den Zusammenhang der Messwerte bei. ¨ Grundlage dieser Uberlegungen ist die G¨ ultigkeit der folgenden Formel. Satz 18.4 (Varianzzerlegung) Syy = SSR + SSE . Beweis: Wir verwenden hier Matrix- und Vektornotation, genauer die ur VekP P f¨ toren a,Pb g¨ ultigen Formeln aT b = bT a = ai bi , 1T a = aT 1 = ai = n¯ a, aT a = a2i und die Matrizenbeziehung (AB)T = BT AT . Es ist Syy = (y − y¯1)T (y − y¯1) = yT y − y¯(1T y) − (yT 1)¯ y + n¯ y2 = yT y − n¯ y 2 − n¯ y 2 + n¯ y 2 = yT y − n¯ y2 ; T T b T (y − Xβ) b b ) (y − y b ) = (y − Xβ) SSE = e e = (y − y T T T T T T T b X y − y Xβ b +β b X Xβ b =y y−β b T XT y, = y y−β
b = wobei wir f¨ ur das letzte Gleichheitszeichen die Normalgleichungen XT Xβ T T T T b T T b b X y und die Transpositionsformel β X y = (y Xβ) = y Xβ verwendet b folgt insbesondere XT y b = Xβ b = XT y. Da die haben. Aus der Beziehung y T b = 1T y. erste Zeile von X aus lauter Einsern besteht, folgt daraus weiter 1T y Somit ist
18.2 Rudimente der Varianzanalyse
231
bT y b − y¯(1T y b ) − (b SSR = (b y − y¯1)T (b y − y¯1) = y yT 1)¯ y + n¯ y2 b T (XT Xβ) b − n¯ b T XT y − n¯ bT y b − n¯ =y y 2 − n¯ y 2 + n¯ y2 = β y2 = β y2 .
Addition der erhaltenen Ausdr¨ ucke f¨ ur SSE und SSR ergibt die gesuchte Formel. ⊓ ⊔ Die Varianzzerlegung
Syy = SSR + SSE und ihre oben erl¨auterte Interpretation legen es nahe, die Gr¨oße R2 =
SSR Syy
zur Beurteilung der Anpassungsg¨ ute heranzuziehen. R2 wird als Bestimmtheitsmaß bezeichnet und misst den Anteil der durch die Regression erkl¨arten Variabilit¨at an der Gesamtvariabilit¨at. Im Grenzfall einer exakten Anpassung, wenn die Regressionsgerade genau durch alle Datenpunkte geht, ist SSE = 0 und damit R2 = 1. Ein kleines R2 ist ein Indiz daf¨ ur, dass das lineare Modell weniger gut an die Daten passt. Bemerkung 18.5 Ein wesentlicher Punkt im Beweis von Satz 18.4 war die Eigenschaft von XT , in der ersten Zeile lauter Einser als Eintr¨age zu besitzen, was davon herr¨ uhrte, dass die Konstante β0 ein Modellparameter war. Bei der Regression mittels einer Geraden durch den Ursprung, wie in Abschnitt 8.3 durchgef¨ uhrt, ist dies gerade nicht der Fall. F¨ ur eine derartige Regression, die β0 nicht als Parameter enth¨alt, ist die Varianzzerlegung ung¨ ultig und das Bestimmtheitsmaß aussagelos. Beispiel 18.6 Wir setzen die Untersuchung des Zusammenhangs von K¨orpergr¨oße und K¨orpergewicht aus Beispiel 18.1 fort. Aufruf des MATLAB-Programms mat18 1.m unter Eingabe der Daten aus mat08 3.m ergibt Syy = 9584.9,
SSE = 8094.4,
SSR = 1490.5
und R2 = 0.1555,
R = 0.3943,
also eine schlechte Anpassung. Der niedere Wert von R2 ist ein sehr deutlicher Hinweis darauf, dass K¨orpergr¨oße und Gewicht keinen linearen Zusammenhang haben. Man vergleiche jedoch die etwas bessere Anpassungsg¨ ute im ¨ Datensatz aus Ubung 18.2. Beispiel 18.7 Im Abschnitt 9.1 wurde die fraktale Dimension d = d(A) einer beschr¨ankten Teilmenge A des R2 durch den Grenzwert d = d(A) = − lim+ log N (A, ε)/ log ε ε→0
232
18 Lineare Regression
¨ definiert, wobei N (A, ε) die kleinste Anzahl von zur Uberdeckung von A ben¨otigten Quadraten der Seitenl¨ ange ε war. Zur experimentellen Bestimmung der Dimension eines Fraktals A unterteilt man die Ebene in Raster mit verschiedenen Maschenweiten ε und bestimmt die Anzahl N = N (A, ε) der K¨astchen, die mit dem Fraktal nichtleeren Durchschnitt haben. Wie in Abschnitt 9.1 erl¨ autert, verwendet man nun die n¨aherungsweise g¨ ultige Beziehung N (A, ε) ≈ C · ε−d .
Logarithmieren ergibt
1 log N (A, ε) ≈ log C + d log ; ε dies ist aber gerade ein lineares Modell y ≈ β0 + β1 x f¨ ur die Gr¨oßen x = log 1/ε, y = log N (A, ε), sodass der Regressionskoeffizient βb1 als Sch¨atzung f¨ ur die fraktale Dimension d herangezogen werden kann. ¨ In Ubung 1 aus Abschnitt 9.6 wurde diese Vorgangsweise auf die K¨ ustenlinie Großbritanniens angewendet. Beispielsweise k¨onnten sich die folgenden Datenwerde ergeben haben: 4
1/ε
8
12
16
24
32
N (A, ε) 16 48 90 120 192 283 Eine lineare Regression durch die entsprechenden logarithmierten Werte x = log 1/ε, y = log N (A, ε) mit Hilfe des m-Files mat18 1.m ergibt die Koeffizienten βb0 = 0.9849, d ≈ βb1 = 1.3616 mit dem Bestimmtheitsmaß
R2 = 0.9930,
ein sehr guter Fit, welcher auch durch Abb. 18.5 best¨atigt wird. Aus den gegebenen Daten ist somit eine fraktale Dimension der K¨ uste Großbritanniens von d = 1.36 plausibel ableitbar. y = log N 6 5 4 3 2
1
2
3
4
x = log 1/ε
Abb. 18.5. Fit f¨ ur fraktale Dimension der K¨ uste Großbritanniens.
18.3 Multiple lineare Regression
233
Ein Wort der Vorsicht ist angebracht. Die Datenanalyse kann nur Indizien liefern, aber niemals beweisen, dass ein Modell richtig ist. Auch wenn wir unter lauter falschen Modellen das mit dem gr¨ oßten R2 ausw¨ahlen, wird dieses nicht richtiger. Eine geh¨ orige Skepsis gegen¨ uber rein empirisch gewonnenen Zusammenh¨angen ist angebracht; ebenso sind die Modelle stets kritisch zu hinterfragen! Naturwissenschaftliche Erkenntnis erfolgt im Spannungsfeld zwischen ¨ der Modellerfindung und der Uberpr¨ ufung an Daten.
18.3 Multiple lineare Regression Bei der multiplen (mehrfachen, multivariaten) Regression h¨angt die Variable y nicht nur von einer Regressorvariablen x ab, sondern von mehreren, etwa x1 , x2 , . . . , xk . Wir weisen ausdr¨ ucklich darauf hin, dass damit die Notation im Vergleich zu Abschnitt 18.1 ge¨ andert wird; dort hatte xi den iten Messwert bezeichnet, jetzt bedeutet xi die i-te Regressorvariable. Die Messwerte der i-ten Regressorvariablen werden nun mit zwei Indizes versehen, n¨ amlich xi1 , xi2 , . . . , xin , sodass nunmehr k × n Messwerte vorliegen. Gesucht ist wieder ein lineares Modell y = β0 + β1 x1 + β2 x2 + . . . + βk xk mit noch unbekannten Koeffizienten β0 , β1 , . . . , βk . Beispiel 18.8 Eine Getr¨ ankeautomatenfirma m¨ochte die Servicezeiten analysieren, also die Zeitspanne y, die ein Fahrer ben¨otigt, um einen Automaten nachzuf¨ ullen und kurz zu warten. Als einflussreichste Parameter werden die Anzahl x1 der nachgef¨ ullten Produkteinheiten und die Distanz x2 , die der Fahrer zu Fuß zur¨ ucklegen muss, angesehen. Die Ergebnisse einer Beobachtung von 25 Servicevorg¨ angen sind im File mat18 3.m angegeben (Datenwerte aus [19]). Die Beobachtungen (x11 , x21 ), (x12 , x22 ), (x13 , x23 ), . . . , (x1,25 , x2,25 ) mit den zugeh¨origen Servicezeiten y1 , y2 , y3 , . . . , y25 ergeben eine Punktwolke im Raum, an die eine Ebene der Form y = β0 + β1 x1 + β2 x2 angepasst werden soll (Abb. 18.6; verwenden Sie das m-File mat18 4.m zur Visualisierung).
80 60
y
40 20 0 30 20
x1
0 10 0
1000 1500
500
x2
Abb. 18.6. Multiple lineare Regression durch r¨ aumliche Punktwolke.
234
18 Lineare Regression
Bemerkung 18.9 Das allgemeine multiple lineare Modell y = β0 + β1 x1 + . . . + βk xk beinhaltet als Spezialfall die einfache lineare Regression mit mehreren nichtlinearen Formfunktionen (wie in Abschnitt 18.1 angesprochen), also y = β0 + β1 ϕ1 (x) + β2 ϕ2 (x) + . . . + βk ϕk (x), wobei x1 = ϕ1 (x), x2 = ϕ2 (x), . . . , xk = ϕk (x) als Regressorvariablen betrachtet werden. Insbesondere kann man polynomiale Ans¨atze y = β0 + β1 x + β2 x2 + . . . + βk xk zulassen, oder noch allgemeiner Interaktionen zwischen mehreren Variablen, etwa y = β0 + β1 x1 + β2 x2 + β3 x1 x2 . Alle diese F¨alle werden rechnerisch genauso wie die Standardaufgabe der multiplen linearen Regression behandelt, nach Umbenennung zu den Variablen x1 , x2 , . . . , xk . Die Messdaten (je n St¨ uck) f¨ ur die einzelnen Variablen stellen sich schematisch wie folgt dar: y x1 y1 x11 y2 x12 .. .. . . Messung Nr. n yn x1n
Variable Messung Nr. 1 Messung Nr. 2 .. .
x2 . . . xk x21 . . . xk1 x22 . . . xk2 .. .. . . x2n . . . xkn
Jeder Wert yi ist zu approximieren durch yi = β0 + β1 x1i + β2 x2i + . . . + βk xki + εi , i = 1, . . . , n mit den Abweichungen εi . Die gesch¨atzten Koeffizienten βb0 , βb1 , . . . , βbk werden wieder als L¨osung der Minimierungsaufgabe L(β0 , β1 , . . . , βk ) =
n X i=1
ε2i → min!
gewonnen. Unter Verwendung der Vektor- und Matrixnotation ε1 β0 1 x11 x21 . . . xk1 y1 ε2 β1 1 x12 x22 . . . xk2 y2 y = . , X = . . .. , β = .. , ε = .. .. . .. .. .. . . . εn βk 1 x1n x2n . . . xkn yn
lautet das lineare Modell an die Daten in Kurzform wieder y = Xβ + ε.
18.4 Modellanpassung und Variablenwahl
235
Die bestangepassten Koeffizienten erh¨ alt man wie in Abschnitt 18.1 nach der Formel b = (XT X)−1 XT y β mit den Prognosewerten und Residuen b b = Xβ, y
Die Varianzzerlegung
b. e=y−y
Syy = SSR + SSE
ist weiterhin g¨ ultig; das multiple Bestimmtheitsmaß R2 = SSR /Syy ist ein Indikator der Anpassungsg¨ ute des Modells. Beispiel 18.10 Wir setzen die Analyse der Lieferzeiten aus Beispiel 18.8 fort. Aufruf des MATLAB-Programmes mat18 2.m unter Eingabe der Daten aus mat18 3.m ergibt 2.3412 b = 1.6159 , β 0.0144
also
yb = 2.3412 + 1.6159 x1 + 0.0144 x2
mit einem multiplen Bestimmtheitsmaß von
R2 = 0.9596
und der Varianzzerlegung Syy = 5784.5,
SSR = 5550.8,
SSE = 233.7
Es werden also lediglich (1 − R2 ) · 100% ≈ 4% der Datenvariabilit¨at durch die Regression nicht erkl¨art, eine sehr zufrieden stellende Anpassungsg¨ ute.
18.4 Modellanpassung und Variablenwahl Ein stets schwieriges Problem ist die Entscheidung, welche Variablen im Modell aufgenommen werden sollen. H¨atte man vielleicht besser noch x3 = x22 und x4 = x1 x2 dazu nehmen sollen, also das Modell y = β0 + β1 x1 + β2 x2 + β3 x22 + β4 x1 x2 verwenden sollen, oder vielleicht anschließend den Term β2 x2 wieder streichen sollen? Es w¨are schlecht, zu viele Variablen im Modell zu haben (sind es gleich viele wie Messwerte, so kann man die Regression exakt durch die Messwerte
236
18 Lineare Regression
legen – dann h¨atte das Modell keine prognostische Aussagekraft mehr). Ein Kriterium wird sicher sein, ein m¨ oglichst großes R2 zu erzielen. Ein anderes ist es, Variablen zu streichen, wenn deren Beibehaltung den Erkl¨arungsanteil der Regression an der Gesamtvariabilit¨ at nicht wesentlich ver¨andert. Sequentielle Varianzzerlegung. Wir f¨ ugen schrittweise Variablen hinzu, betrachten also sequentiell die Modelle (mit zugeh¨origem SSR ): y = β0 . . . SSR (β0 ) y = β0 + β1 x1 . . . y = β0 + β1 x1 + β2 x2 . . . .. .
SSR (β0 , β1 ) SSR (β0 , β1 , β2 ) .. .
y = β0 + β1 x1 + β2 x2 + . . . + βk xk . . . SSR (β0 , β1 , . . . , βk ) = SSR . Dabei ist in der ersten Zeile SSR (β0 ) = 0, da im Startmodell β0 = y¯ ist. Der zus¨atzliche Erkl¨arungsanteil der Variablen x1 ist SSR (β1 |β0 ) = SSR (β0 , β1 ) − 0, derjenige der Variablen x2 (wenn x1 im Modell aufgenommen ist) ist SSR (β2 |β0 , β1 ) = SSR (β0 , β1 , β2 ) − SSR (β0 , β1 ), derjenige der Variablen xk (wenn x1 , x2 , . . . , xk−1 im Modell sind) ist SSR (βk |β0 , β1 , . . . , βk−1 ) = SSR (β0 , β1 , . . . , βk ) − SSR (β0 , β1 , . . . , βk−1 ). Offensichtlich gilt SSR (β1 |β0 ) + SSR (β2 |β0 , β1 ) + SSR (β3 |β0 , β1 , β2 ) + . . . + SSR (βk |β0 , β1 , β2 , . . . , βk−1 ) = SSR . Dies zeigt, dass man das sequentielle, partielle Bestimmtheitsmaß SSR (βj |β0 , β1 , . . . , βj−1 ) Syy als Erkl¨arungsanteil der Variablen xj interpretieren kann, unter der Bedingung, dass die Variablen x1 , x2 , . . . , xj−1 bereits im Modell sind. Dieses partielle Bestimmtheitsmaß h¨angt von der Reihenfolge ab, in der man die Variablen dazu nimmt. Diese Abh¨angigkeit kann man eliminieren, indem man u ¨ber alle m¨oglichen Modellfolgen mittelt. Mittlerer Erkl¨ arungsanteil einzelner Koeffizienten. Bildet man alle m¨oglichen sequentiellen, partiellen Bestimmtheitsmaße, die durch Hinzunahme der Variablen xj zu allen m¨oglichen Kombinationen bereits aufgenommener Variablen erzielbar sind, und dividiert durch deren Anzahl, so erh¨alt man ein Maß f¨ ur den Einfluss der Variablen xj auf die Erkl¨arungskraft des Modells.
18.4 Modellanpassung und Variablenwahl
237
Dieses Konzept wurde unter anderem von [17] vorgeschlagen; ein- und weiter ¨ f¨ uhrende Uberlegungen dazu finden sich etwa in [10, 12]. Es verwendet keine wahrscheinlichkeitstheoretisch motivierten Indikatoren, sondern ausschließlich die auf Kombinatorik beruhende empirische Varianzzerlegung, also deskriptive Datenanalyse. Diese Hinwendung zu beschreibenden Methoden, die im Gegensatz zu den weit verbreiteten statistischen Testmethoden keine schwer begr¨ undbaren wahrscheinlichkeitstheoretischen Zusatzannahmen verlangt, wird von einigen Autoren als neodeskriptive Statistik bezeichnet. Beispiel 18.11 Wir berechnen die Erkl¨ arungsanteile der Koeffizienten im Lieferzeitproblem aus Beispiel 18.8. Wir passen zun¨achst die beiden univariaten Modelle y = β0 + β1 x1 , y = β0 + β2 x2 an und erhalten daraus SSR (β0 , β1 ) = 5382.4, SSR (β0 , β2 ) = 4599.1, mit den Regressionskoeffizienten βb0 = 3.3208, βb1 = 2.1762 im ersten, βb0 = 4.9612, βb2 = 0.0426 im zweiten Fall. Mit den bereits berechneten Werten des bivariaten Modells SSR (β0 , β1 , β2 ) = SSR = 5550.8,
Syy = 5784.5
aus Beispiel 18.10 erhalten wir die beiden Sequenzen SSR (β1 |β0 ) = 5382.4 ≈ 93.05% von Syy SSR (β2 |β0 , β1 ) = 168.4 ≈ 2.91% von Syy und
SSR (β2 |β0 ) = 4599.1 ≈ 79.51% von Syy SSR (β1 |β0 , β2 ) = 951.7 ≈ 16.45% von Syy .
Der mittlere Erkl¨arungsanteil der Variable x1 (oder des Koeffizienten β1 ) ist 1 93.05 + 16.45 % = 54.75%, 2 jener der Variablen x2 ist
1 2.91 + 79.51 % = 41.21%; 2
die restlichen 4.04% bleiben unerkl¨art. Das Ergebnis ist in Abb. 18.7 dargestellt. Numerische Berechnung der mittleren Erkl¨ arungsanteile. Im Falle von mehr als zwei unabh¨angigen Variablen ist zu beachten, dass alle m¨oglichen Sequenzen (dargestellt durch Permutationen der Variablennummern) ber¨ ucksichtigt werden. Dies soll beispielhaft mit drei Variablen
238
18 Lineare Regression Anteil β1 Anteil β2 unerkl¨ art
4.0 %
41.2 % 54.8 %
Abb. 18.7. Mittlere Erkl¨ arungsanteile der einzelnen Koeffizienten.
x1 , x2 , x3 vorgef¨ uhrt werden. In der Tabelle finden sich links die 3! = 6 Permutationen von {1, 2, 3}, rechts jeweils die drei sequentiell gewonnenen Erkl¨arungsanteile. 1 1 2 2 3 3
2 3 1 3 1 2
3 2 3 1 2 1
SSR (β1 |β0 ) SSR (β1 |β0 ) SSR (β2 |β0 ) SSR (β2 |β0 ) SSR (β3 |β0 ) SSR (β3 |β0 )
SSR (β2 |β0 , β1 ) SSR (β3 |β0 , β1 ) SSR (β1 |β0 , β2 ) SSR (β3 |β0 , β2 ) SSR (β1 |β0 , β3 ) SSR (β2 |β0 , β3 )
SSR (β3 |β0 , β1 , β2 ) SSR (β2 |β0 , β1 , β3 ) SSR (β3 |β0 , β2 , β1 ) SSR (β1 |β0 , β2 , β3 ) SSR (β2 |β0 , β3 , β1 ) SSR (β1 |β0 , β3 , β2 )
Offensichtlich sind die Zeilensummen jeweils gleich SSR , sodass die Summe aller Eintr¨age gleich 6 · SSR ist. Man beachte, dass unter den 18 SSR -Werten tats¨achlich nur 12 verschiedene sind. Der mittlere Erkl¨arungsanteil der Variablen x1 ist definiert durch 1 SSR (β1 |β0 ) + SSR (β1 |β0 ) + SSR (β1 |β0 , β2 ) + SSR (β1 |β0 , β3 ) M1 = 6 + SSR (β1 |β0 , β2 , β3 ) + SSR (β1 |β0 , β3 , β2 )
und analog f¨ ur die anderen Variablen. Damit ist garantiert, dass M1 + M2 + M3 = SSR
ist, womit die Gesamtzerlegung wie gefordert die Summe Eins hat: M2 M3 SSE M1 + + + = 1. Syy Syy Syy Syy F¨ ur eine genauere Analyse der zu Grunde liegenden Kombinatorik, f¨ ur die n¨otigen Modifikationen im Falle der Kollinearit¨at der Daten (linearer Abh¨angigkeit der Spalten der Matrix X) und f¨ ur eine Diskussion der Aussagekraft des mittleren Erkl¨arungsanteils verweisen wir auf die oben zitierte Literatur. Der Algorithmus ist im Applet Lineare Regression implementiert.
¨ 18.5 Ubungen
239
¨ Experiment 18.12 Offnen Sie das Applet Lineare Regression und laden Sie Datensatz 9. Es handelt sich um die Untersuchung des Einflusses verschiedener Zuschlagsstoffe auf eine Betonmischung. Die Bedeutung der Ausgabevariablen x1 − x4 und der Eingabevariablen x5 − x13 ist in den Erl¨ auterungen zum Applet erkl¨ art. Experimentieren Sie mit verschiedener Auswahl der Modellvariablen. Einen interessanten Start ergibt zum Beispiel die Wahl von x6 , x8 , x9 , x10 , x11 , x12 , x13 als unabh¨ angige und x1 als abh¨ angige Variable; anschließend Entfernung der Variablen mit geringem Erkl¨ arungsanteil.
¨ 18.5 Ubungen ¨ 1. Der Gesamtverbrauch an elektrischer Energie Osterreichs 1975–2005 ist in der Tabelle unten angegeben (aus [26, 22.13]). Die Aufgabe ist, eine lineare Regression der Form y = β0 + β1 x durch diese Daten vorzunehmen. (a) Schreiben Sie die Matrix X explizit an und berechnen Sie die Koeffizienten b = [βb0 , βb1 ]T mit dem MATLAB -Befehl beta = X\y. β ¨ (b) Uberpr¨ ufen Sie die Anpassungsg¨ ute durch Berechnung von R2 . Zeichnen Sie ein Streudiagramm mit der angepassten Geraden. Berechnen Sie die Prognose yb f¨ ur 2010. Jahr xi
Verbrauch yi [GWh]
1975
1980
1985
1990
1995
2000
2005
30.663 37.995 42.815 49.951 54.177 60.502 65.199
2. Eine Stichprobe von n = 44 Bauingenieurstudenten an der Universit¨ at Innsur bruck ergab im Jahr 1998 die im m-File mat18 ueb2.m angegebenen Werte f¨ x = K¨ orpergr¨ oße [cm] und y = Gewicht [kg]. Ermitteln Sie die Regressionsgerade y = β0 + β1 x, zeichnen Sie ein Streudiagramm dazu und berechnen Sie das Bestimmtheitsmaß R2 . 3. Gehen Sie in mathe online zu Galerie – Wahrscheinlichkeitsrechnung und Statistik und ¨ offnen Sie das Applet Regression und Korrelation. Experimentieren Sie mit Hinzu- und Wegnahme von Datenpunkten. Studieren Sie die Reaktion der Regres¨ sionsgerade und des Korrelationskoeffizienten auf Anderung der Daten (der Betrag des Korrelationskoeffizienten entspricht R, der Wurzel des Bestimmtheitsmaßes). 4. (a) L¨ osen Sie Aufgabe 1 mit Hilfe von Excel. Hinweis: Verwenden Sie entweder die Analysefunktion Regression oder den Diagrammassistenten und die Funktion RGP. (b) L¨ osen Sie Aufgabe 1 mit Hilfe des Statistikpakets SPSS. Hinweis: Geben Sie die Daten im Arbeitsblatt Datenansicht ein; Variablennamen und -eigenschaften k¨ onnen Sie im Arbeitsblatt Variablenansicht definieren. Gehen Sie zu Analysieren → Regression → Linear ... ¨ audebestand Osterreichs 1869–2001 angege5. Im m-File mat18 ueb5.m ist der Geb¨ ben (aus [26]). Ermitteln Sie die Regressionsgerade y = β0 + β1 x sowie eine Regressionsparabel y = α0 + α1 (x − 1860)2 durch die Daten und u ufen Sie mittels ¨berpr¨ R2 , welches Modell besser passt.
240
18 Lineare Regression
6. Dem m-File mat18 ueb6.m ist der Aktienindex f¨ ur vier Brauereikonzerne November 1999 – November 2000 sowohl graphisch als auch numerisch zu entnehmen (November 1999 = 100%, aus profil 46/2000). Passen Sie an die vier Datenreihen jeweils ein einfaches lineares Modell y = β0 + β1 x (x . . . Datum, y . . . Aktienindex) an, plotten Sie die Ergebnisse in vier gleichskalierten Fenstern, bewerten Sie die Ergebnisse mit dem jeweiligen R2 und u ufen Sie damit, ob die profil-Bildunterschrift ¨berpr¨ durch die Daten gerechtfertigt ist. Zur Berechnung d¨ urfen Sie das MATLAB -Programm mat18 1.m verwenden. Hinweis: L¨ osungsvorschlag im m-File mat18 uebloes6.m. ¨ 7. Fortsetzung von Aufgabe 5, Geb¨ audebestand in Osterrreich. Passen Sie das Modell y = β0 + β1 x + β2 (x − 1860)2
an und berechnen Sie SSR = SSR (β0 , β1 , β2 ) und Syy . Analysieren Sie ferner den Zuwachs an Erkl¨ arung bei Hinzunahme der jeweils fehlenden Variable in den Modellen aus Aufgabe 5, das heißt, berechnen Sie SSR (β2 |β0 , β1 ) und SSR (β1 |β0 , β2 ) sowie den mittleren Erkl¨ arungsanteil der einzelnen Koeffizienten. Vergleichen Sie mit dem Ergebnis f¨ ur Datensatz 5 im Applet Lineare Regression. 8. Das m-File mat18 ueb8.m enth¨ alt den Benzinverbrauch y von 30 Automobilen in Abh¨ angigkeit vom Hubraum x1 , der PS-Zahl x2 , der Fahrzeugl¨ ange x3 und dem Fahrzeuggewicht x4 (aus: Motor Trend 1975, nach [19]). Passen Sie das lineare Modell y = β0 + β1 x1 + β2 x2 + β3 x3 + β4 x4 an und ermitteln Sie durch eine einfache Sequentialanalyse SSR (β1 |β0 ) + SSR (β2 |β0 , β1 ) + SSR (β3 |β0 , β1 , β2 )
+ SSR (β4 |β0 , β1 , β2 , β3 ) = SSR (β0 , β1 , β2 , β3 , β4 )
eine Absch¨ atzung f¨ ur den Erkl¨ arungsanteil der einzelnen Koeffizienten. Vergleichen Sie mit dem mittleren Erkl¨ arungsanteil der Koeffizienten f¨ ur Datensatz 2 im Applet Lineare Regression. Hinweis: L¨ osungsvorschlag im m-File mat18 uebloes8.m. ¨ ¨ 9. Uberpr¨ ufen Sie die Ergebnisse der Ubungsaufgaben 1, 2 und 6 mit Hilfe des Applets Lineare Regression (Datens¨ atze 6, 1 und 4); ebenso f¨ ur die Beispiele 18.1 und 18.8 mit den Datens¨ atzen 8 und 3. Untersuchen Sie insbesondere im Datensatz 8, ob K¨ orpergr¨ oße, K¨ orpergewicht und das Beinbruchrisiko in irgendeinem Zusammenhang stehen.
19 Differentialgleichungen
In diesem Kapitel besprechen wir die Theorie von Anfangswertproblemen gew¨ ohnlicher Differentialgleichungen. Wir beschr¨ anken uns zun¨ achst auf skalare Gleichungen; Systeme werden im folgenden Kapitel behandelt. Ausgehend von der Definition einer Differentialgleichung und der geometrischen Deutung ihres Richtungsfelds behandeln wir im Detail lineare Differentialgleichungen erster Ordnung. Als wichtige Anwendungen besprechen wir die Modellierung von Wachstums- und Zerfallsprozessen. Daran anschließend untersuchen wir Fragen der Existenz und (lokalen) Eindeutigkeit der L¨ osung allgemeiner Differentialgleichungen und besprechen Potenzreihenans¨ atze. Abschließend untersuchen wir das qualitative Verhalten von L¨ osungen in der N¨ ahe eines Gleichgewichtpunkts.
19.1 Anfangswertprobleme Differentialgleichungen sind Gleichungen zwischen einer (gesuchten) Funktion und deren Ableitung(en). Sie spielen bei der Modellierung von zeitabh¨angigen Prozessen eine bedeutende Rolle. Definition 19.1 Sei D ⊂ R2 offen und f : D ⊂ R2 → R stetig. Die Gleichung y ′ (x) = f x, y(x)
wird (gew¨ohnliche) Differentialgleichung erster Ordnung genannt. Eine L¨ osung ist eine auf einem Intervall I differenzierbare Funktion y = y(x), deren Graph in D liegt und welche die Gleichung f¨ ur alle x ∈ I erf¨ ullt. Meist gibt man bei der gesuchten Funktion y die unabh¨ angige Variable x nicht an und formuliert obige Aufgabe kurz als: L¨ose die Differentialgleichung y ′ = f (x, y). Man nennt die gesuchte Funktion in dieser Gleichung auch abh¨ angige Variable (sie h¨angt n¨amlich von x ab).
242
19 Differentialgleichungen
Bei der Modellierung zeitabh¨ angiger Prozesse bezeichnet man die unabh¨angige Variable meist mit t (f¨ ur tempus = Zeit) und die abh¨angige Variable mit x = x(t). In diesem Fall schreibt man Differentialgleichungen erster Ordnung als x(t) ˙ = f t, x(t)
oder kurz als x˙ = f (t, x).
Beispiel 19.2 (Trennung der Variablen) Wir suchen alle Funktionen y = y(x), welche die Gleichung y ′ (x) = x · y(x)2 erf¨ ullen. In diesem Beispiel findet man die L¨osungen durch Trennen der Variablen. F¨ ur y 6= 0 dividiert man dazu die Differentialgleichung durch y 2 und erh¨alt 1 · y ′ = x. y2 Die linke Seite dieser Gleichung ist von der Form g(y) · y ′ und nach der Kettenregel gerade die Ableitung einer Stammfunktion von g Z G(y) = g(y) dy nach x. Dabei ist y als Funktion von x aufzufassen d d dy G(y) = G(y) · = g(y) · y ′ . dx dy dx Im Beispiel haben wir g(y) = y −2 und G(y) = −y −1 . Somit gilt 1 1 d − = 2 · y ′ = x. dx y y Integration dieser Gleichung nach x ergibt −
1 x2 = + C, y 2
wobei C eine beliebige Integrationskonstante bezeichnet. Daraus erhalten wir durch Umformung 2 1 = . y= −x2 /2 − C K − x2 mit der Konstanten K = −2C.
Die Funktion y = 0 ist ebenso eine L¨osung der Differentialgleichung. Man erh¨alt sie formal aus der obigen L¨osung, indem man K = ∞ setzt. Man hat in diesem Beispiel also nicht nur eine L¨osung gefunden, sondern eine ganze Schar von L¨ osungen. Erst durch Angabe einer zus¨atzlichen Bedingung, beispielsweise y(0) = 1, erh¨alt man eine eindeutige L¨osung y(x) =
2 . 2 − x2
19.2 Lineare Differentialgleichungen erster Ordnung
243
Definition 19.3 Die Differentialgleichung y ′ (x) = f x, y(x) zusammen mit der zus¨atzlichen Bedingung y(x0 ) = y0 heißt Anfangswertproblem (Anfangswertaufgabe). Man schreibt Anfangswertprobleme meist in der Form y ′ (x) = f x, y(x) , y(x0 ) = y0 .
Eine L¨osung eines Anfangswertproblems ist eine (stetig) differenzierbare Funktion y(x), welche die Differentialgleichung erf¨ ullt und der Anfangsbedingung y(x0 ) = y0 gen¨ ugt.
Geometrische Deutung einer Differentialgleichung. Mit einer Differentialgleichung erster Ordnung 2
′
y = f (x, y),
2
(x, y) ∈ D ⊂ R
0
sucht man eine differenzierbare Funktion y = y y(x), deren Graph in D verl¨ auft, und de′ ren Tangentenanstieg tan ϕ = y (x) −2 in jedem Punkt x, y(x) gerade f x, y(x) ist. Durch Einzeichnen von kurzen Pfeilen mit Steigung −4 tan ϕ = f (x, y) in den Punkten (x, y) ∈ D −2 0 x 2 erh¨alt man das Richtungsfeld der DifferentialAbb. 19.1. Das Richtungsgleichung. Das Richtungsfeld liegt tangential feld von y ′ = −2xy/(x2 + 2y). zu den L¨osungen und vermittelt daher einen guten optischen Eindruck von den L¨ osungen der Differentialgleichung. Abb. 19.1 zeigt das Richtungsfeld der Differentialgleichung 2xy . y′ = − 2 x + 2y Man erkennt unter anderem deutlich die Kurve y = −x2 /2, entlang welcher die rechte Seite Singularit¨aten hat. Experiment 19.4 Visualisieren Sie das Richtungsfeld obiger Differentialgleichung mit dem Applet Dynamische Systeme in der Ebene.
19.2 Lineare Differentialgleichungen erster Ordnung Seien a(x) und g(x) auf einem Intervall gegebene Funktionen. Dann nennt man y ′ + a(x) y = g(x) eine lineare Differentialgleichung erster Ordnung. Die Funktion a heißt Koeffizient, die rechte Seite g nennt man Inhomogenit¨ at. Die Differentialgleichung heißt homogen, falls g = 0 gilt, sonst inhomogen. Zun¨achst halten wir folgendes wichtige Resultat fest.
244
19 Differentialgleichungen
Satz 19.5 (Superpositionsprinzip) Falls y und z L¨osungen einer lineare Differentialgleichung mit m¨ oglicherweise verschiedenen Inhomogenit¨aten sind y ′ (x) + a(x) y(x) = g(x), z ′ (x) + a(x) z(x) = h(x), dann l¨ost die Linearkombination w(x) = αy(x) + βz(x),
α, β ∈ R
die lineare Differentialgleichung w′ (x) + a(x) w(x) = αg(x) + βh(x). Beweis: Diese so genannte Superpositionseigenschaft folgt aus der Linearit¨at der Ableitung und der Linearit¨ at der Gleichung. ⊓ ⊔ Wir berechnen zun¨ achst alle L¨ osungen der homogenen Gleichung.
Satz 19.6 Die allgemeine L¨ osung der homogenen Differentialgleichung y ′ + a(x) y = 0 lautet yh (x) = Ke−A(x) mit K ∈ R und einer beliebigen Stammfunktion A(x) von a. Beweis: F¨ ur y 6= 0 trennen wir die Variablen 1 ′ · y = −a(x) y und erhalten wegen
1 d log |y| = dy y
durch Integration die Gleichung log |y| = −A(x) + C. Daraus folgt |y(x)| = e−A(x) eC . Diese Formel zeigt, dass y(x) das Vorzeichen nicht wechseln kann, da die rechte Seite nie Null wird. Deshalb ist K = eC · sign y(x) ebenfalls eine Konstante, und die Formel y(x) = sign y(x) · |y(x)| = Ke−A(x) , liefert alle L¨osungen der homogenen Gleichung.
K∈R ⊓ ⊔
19.2 Lineare Differentialgleichungen erster Ordnung
245
Beispiel 19.7 Die lineare Differentialgleichung x˙ = a x mit konstantem Koeffizienten a besitzt die allgemeine L¨osung x(t) = Keat ,
K ∈ R.
Die Konstante K ist beispielsweise durch x(0) bestimmt. Das Richtungsfeld der Differentialgleichung y ′ = a y (in Abh¨angigkeit vom Vorzeichen des Koeffizienten) zeigt Abb. 19.2
4
4
2
2
y
y
0
0
−2
−2
−4
−4 0
2
4 x
6
8
10
0
2
4 x
6
8
10
Abb. 19.2. Das Richtungsfeld von y ′ = y (links) und y ′ = −y (rechts).
Interpretation. Sei x(t) eine zeitabh¨ angige Funktion, welche einen Wachstums- oder Zerfallsprozess beschreibt (Bev¨ olkerungszunahme, -abnahme, Mas¨ sever¨anderung, oder Ahnliches). Wir betrachten das Zeitintervall [t, t + h] mit ¨ h > 0. F¨ ur x(t) 6= 0 ist die relative Anderung von x in diesem Zeitintervall gegeben durch x(t + h) x(t + h) − x(t) = − 1. x(t) x(t) ¨ ¨ Die relative Anderungsrate (Anderung pro Zeiteinheit) lautet daher x(t + h) − x(t) 1 x(t + h) − x(t) · = . t+h−t x(t) h · x(t) Bei idealen Wachstumsprozessen h¨angt diese Rate nur von der Zeit t ab. Im ¨ Grenzwert h → 0 f¨ uhrt das auf die momentane relative Anderungsrate a(t) = lim
h→0
x(t + h) − x(t) x(t) ˙ = . h · x(t) x(t)
Somit gen¨ ugen ideale Wachstumsprozesse der linearen Differentialgleichung x(t) ˙ = a(t) x(t).
246
19 Differentialgleichungen
Beispiel 19.8 (Radioaktiver Zerfall) Sei x(t) die Konzentration einer radio¨ aktiven Substanz zum Zeitpunkt t. Beim radioaktiven Zerfall ist die Anderungsrate zeitunabh¨ angig und negativ a(t) ≡ a < 0. Die L¨osung der Gleichung x˙ = a x mit Anfangswert x(0) = x0 lautet x(t) = eat x0 . Sie ist exponentiell fallend, und es gilt limt→∞ x(t) = 0, vgl. Abb. 19.3. Die Halbwertszeit T , in der die H¨ alfte der Substanz zerfallen ist, ergibt sich aus x0 = eaT x0 2
zu
T =−
log 2 . a
Die Halbwertszeit f¨ ur a = −2 ist in Abb. 19.3 punktiert eingezeichnet. x 1
x a = −0.5
0.75
Malthus
1
α/β
0.5
0.5 0.25 0
Verhulst
0.25 0
0.5
1
1.5
0
t
Abb. 19.3. Radioaktiver Zerfall mit den Konstanten a = −0.5, a = −1 und a = −2 (von oben nach unten).
0
0.5
1
1.5
t
Abb. 19.4. Bev¨ olkerungswachstum nach Malthus und Verhulst.
Beispiel 19.9 (Bev¨olkerungsmodelle) Sei x(t) die Gr¨oße einer Population zum Zeitpunkt t, modelliert durch x˙ = a x. Wird eine konstante positive Wachstumsrate a > 0 vorausgesetzt, so w¨achst die Population exponentiell an x(t) = eat x0 , lim |x(t)| = ∞. t→∞
Man nennt dieses Verhalten Gesetz von Malthus.1 Verhulst hat 1839 ein verbessertes Modell vorgeschlagen, welches beschr¨ankte Ressourcen mit ber¨ ucksichtigt x(t) ˙ = α − βx(t) · x(t) mit α, β > 0.
Ein entsprechendes diskretes Modell wurde bereits im Beispiel 5.3 besprochen. Im Unterschied zu hier wurde der Quotient α/β dort mit L bezeichnet. 1
T.R. Malthus, 1766–1834.
19.2 Lineare Differentialgleichungen erster Ordnung
247
Die populationsabh¨ angige Wachstumsrate im Modell von Verhulst lautet also a(t) = α − βx(t) und nimmt linear mit zunehmender Bev¨ olkerung ab. Das Modell von Verhulst kann durch Trennen der Variablen (oder mit maple ) gel¨ost werden. Man erh¨alt x(t) =
α β + C α e−αt
und damit unabh¨ angig vom Anfangswert lim x(t) =
t→∞
α , β
vgl. auch Abb. 19.4. Die station¨ are L¨osung x(t) = α/β ist ein asymptotisch stabiler Gleichgewichtspunkt des Verhulst-Modells, vgl. Abschnitt 19.5. Variation der Konstanten. Als N¨achstes suchen wir eine L¨osung der inhomogenen Gleichung y ′ + a(x) y = g(x). Wir kennen bereits die allgemeine L¨osung der homogenen Gleichung yh (x) = c · e−A(x) , mit der Stammfunktion A(x) =
Z
c∈R
x
a(ξ) dξ.
x0
Wir setzen eine partikul¨are (= spezielle) L¨osung der inhomogen Gleichung in der Form yp (x) = c(x) · yh (x) = c(x) · e−A(x)
an, wobei wir die Konstante c = c(x) als Funktion von x auffassen (Variation der Konstanten). Diesen Ansatz in die inhomogene Gleichung eingesetzt und nach der Produktregel differenziert ergibt yp′ (x) + a(x) yp (x) = c′ (x) yh (x) + c(x) yh′ (x) + a(x) yp (x) = c′ (x) yh (x) − a(x) c(x) yh (x) + a(x) yp (x) = c′ (x) yh (x).
Setzt man diesen Ausdruck der Inhomogenit¨at g(x) gleich, so erkennt man, dass c(x) die Differentialgleichung c′ (x) = eA(x) g(x) erf¨ ullt, welche sich durch Integration l¨osen l¨asst Z x eA(ξ) g(ξ) dξ. c(x) = x0
Damit erhalten wir den folgenden Satz.
248
19 Differentialgleichungen
Satz 19.10 Die allgemeine L¨ osung der Differentialgleichung y ′ + a(x) y = g(x) lautet y(x) = e mit A(x) =
Rx
x0
−A(x)
Z
x
e
A(ξ)
g(ξ) dξ + K ,
x0
K∈R
a(ξ) dξ.
Beweis: Die im Satz angegebene Funktion ist nach Konstruktion eine L¨osung der Differentialgleichung y ′ + a(x)y = g(x). Sei umgekehrt z(x) eine weitere L¨osung. Dann ist nach dem Superpositionsprinzip die Differenz z(x) − y(x) eine L¨osung der homogenen Gleichung, also z(x) = y(x) + c e−A(x) und damit hat auch z(x) die im Satz angegebene Form.
⊓ ⊔
Folgerung 19.11 Die allgemeine L¨ osung der linearen Differentialgleichung y ′ + a(x) y = g(x) hat die Form y(x) = yp (x) + yh (x) = yp (x) + K e−A(x) ,
K ∈ R.
Beweis: Diese Aussage folgt aus dem Beweis von Satz 19.10 oder auch direkt aus dem Superpositionsprinzip. ⊓ ⊔ Beispiel 19.12 Wir l¨ osen das Problem y ′ + 2y = e4x + 1. Die L¨osung der homogenen Gleichung lautet yh (x) = c e−2x . Eine partikul¨are L¨osung finden wir mit der Variation der Konstanten. Aus Z x 1 1 2 c(x) = e2ξ e4ξ + 1 dξ = e6x + e2x − 6 2 3 0
folgt
1 4x 2 −2x 1 e − e + . 6 3 2 Die allgemeine L¨osung lautet daher yp (x) =
y(x) = yp (x) + yh (x) = K e−2x +
1 4x 1 e + . 6 2
Dabei haben wir die beiden Terme mit e−2x zusammengefasst. Die neue Konstante K l¨asst sich aus einer zus¨atzlichen Anfangsbedingung y(0) = α bestimmen 2 K =α− . 3
19.3 Existenz und Eindeutigkeit der L¨ osung
249
19.3 Existenz und Eindeutigkeit der L¨ osung Das analytische L¨ osen von Differentialgleichungen ist ein notorisch schwieriges Problem. Abgesehen von einigen Klassen (beispielsweise Gleichungen mit trennbaren Variablen) gibt es f¨ ur Differentialgleichungen kein allgemeines Verfahren zur expliziten Bestimmung der L¨ osung. Deshalb werden h¨aufig numerische Verfahren angewandt (vgl. Kapitel 21). Wir besprechen im Folgenden die Existenz und Eindeutigkeit von L¨ osungen allgemeiner Anfangswertprobleme. Satz 19.13 (Satz von Peano2 ) Falls die Funktion f in einer Umgebung von (x0 , y0 ) stetig ist, besitzt das Anfangswertproblem y ′ = f (x, y),
y(x0 ) = y0
eine L¨osung y(x) f¨ ur x nahe bei x0 . Anstatt eines Beweises (vgl. [3, Kap. 9.4.1]) diskutieren wir die Grenzen dieses Satzes. Zun¨achst garantiert der Satz die Existenz der L¨osung nur lokal in der N¨ ahe des Anfangswerts. Das folgende Beispiel zeigt, dass man im Allgemeinen nicht mehr erwarten darf. Beispiel 19.14 Wir l¨ osen die Differentialgleichung x˙ = x2 , x(0) = 1. Trennung der Variablen gibt Z Z dx = dt = t + C, x2 somit
1 . 1−t Diese Funktion besitzt bei t = 1 eine Singularit¨at, die L¨osung h¨ort dort auf zu existieren. Dieses Verhalten wird als blow up bezeichnet. x(t) =
Weiters macht der Satz von Peano auch keine Aussage, wie viele L¨osungen das Anfangswertproblem hat. Dass die L¨osung nicht immer eindeutig sein muss, zeigt das folgende Beispiel. p Beispiel 19.15 Das Anfangswertproblem y ′ = 2 |y|, y(0) = 0 hat unendlich viele L¨osungen 2 b < x, (x − b) y(x) = 0 a, b ≥ 0 beliebig. −a ≤ x ≤ b, 2 −(x − a) x < −a,
Beispielsweise ist f¨ ur x < −a 2
p p y ′ (x) = −2(x − a) = 2(a − x) = 2|x − a| = 2 (x − a)2 = 2 |y|.
G. Peano, 1858–1932.
250
19 Differentialgleichungen
Die Stetigkeit von f reicht somit nicht aus, um die Eindeutigkeit der L¨osung von Anfangswertproblemen zu garantieren. Man braucht ein wenig mehr Regularit¨at, n¨amlich die Lipschitz-Stetigkeit bez¨ uglich der zweiten Variablen (vgl. auch Def. C.14). Definition 19.16 Sei D ⊂ R2 und f : D → R. Die Funktion f gen¨ ugt einer Lipschitz-Bedingung mit Lipschitz-Konstanten L auf D, wenn f¨ ur alle Punkte (x, y) und (x, z) ∈ D die Absch¨ atzung |f (x, y) − f (x, z)| ≤ L |y − z| gilt. Nach dem Mittelwertsatz (Satz 8.4) gilt f (x, y) − f (x, z) =
∂f (x, ξ)(y − z). ∂y
Somit gen¨ ugen differenzierbare Funktionen mit beschr¨ankter Ableitung einer Lipschitz-Bedingung, denn man kann in diesem Fall ∂f L = sup (x, ξ) ∂y
w¨ahlen.
p ullt wegen Gegenbeispiel 19.17 Die Funktion g(x, y) = |y| erf¨ p |y| 1 |g(x, y) − g(x, 0)| f¨ ur y → 0 = = p →∞ |y − 0| |y| |y| keine Lipschitz-Bedingung bei y = 0.
Satz 19.18 Falls die Funktion f in einer Umgebung von (x0 , y0 ) eine Lipschitz-Bedingung erf¨ ullt, besitzt das Anfangswertproblem y ′ = f (x, y),
y(x0 ) = y0
eine eindeutige L¨osung y(x) f¨ ur x nahe bei x0 . Beweis: Wir zeigen nur die Eindeutigkeit, die Existenz einer L¨osung y(x) auf dem Intervall [x0 , x0 + H] folgt (f¨ ur kleines H) aus dem Satz von Peano. Der Beweis wird indirekt gef¨ uhrt. Angenommen, z w¨are eine auf den Intervall [x0 , x0 + H] von y verschiedene L¨osung der Differentialgleichung mit z(x0 ) = y0 . Die Zahl x1 = inf x ∈ R ; x0 ≤ x ≤ x0 + H und y(x) 6= z(x)
ist somit wohldefiniert. Da y und z stetig sind, muss zudem y(x1 ) = z(x1 ) gelten. Wir w¨ahlen nun h > 0 so klein, dass x1 +h ≤ x0 +H gilt und integrieren die Differentialgleichung y ′ (x) = f x, y(x)
19.4 Potenzreihenansatz
251
von x1 bis x1 + h. Das ergibt y(x1 + h) − y(x1 ) =
Z
x1 +h
y ′ (x) dx =
Z
x1 +h
x1
x1
sowie z(x1 + h) − y(x1 ) =
Z
f x, y(x) dx
x1 +h
f x, z(x) dx.
x1
Nach Bildung der Differenz erhalten wir Z x1 +h f x, z(x) − f x, y(x) dx. z(x1 + h) − y(x1 + h) = x1
Wegen der Lipschitz-Bedingung an f folgt daraus Z x1 +h f x, z(x) − f x, y(x) dx |z(x1 + h) − y(x1 + h)| ≤ x1
≤L
Sei nun
Z
x1 +h
x1
|z(x) − y(x)| dx.
M = max |z(x) − y(x)| ; x1 ≤ x ≤ x1 + h 6= 0.
Dieses Maximum existiert, da y und z stetig sind, vgl. die Diskussion nach Satz 6.15. Nach eventueller Verkleinerung von h wird dieses Maximum bei x1 + h angenommen. Dann ist Z x1 +h M dx ≤ Lh M. M = |z(x1 + h) − y(x1 + h)| ≤ L x1
Die Ungleichung M ≤ Lh M, hat f¨ ur hinreichend kleines h (genauer Lh < 1) offenbar M = 0 zur Folge. Nachdem man h beliebig klein w¨ ahlen kann, gilt somit y(x) = z(x) f¨ ur x1 ≤ x ≤ x1 + h in Widerspruch zur Definition von x1 . Somit existiert keine von y lokal verschiedene L¨ osung. ⊓ ⊔
19.4 Potenzreihenansatz Wir haben bisher mehrfach gesehen, dass sich gewisse Funktionen als Reihen darstellen lassen. Dadurch motiviert suchen wir die L¨osung des Anfangswertproblems y ′ = f (x, y), y(x0 ) = y0 nun in Form einer Reihe
252
19 Differentialgleichungen
y(x) =
∞ X
n=0
an (x − x0 )n .
Wir verwenden dabei die Tatsache, dass konvergente Potenzreihen gliedweise differenziert und umgeordnet werden d¨ urfen. Bez¨ uglich der Details verweisen wir auf die Literatur, beispielsweise [2, Kap. 5.3]. Beispiel 19.19 Wir l¨ osen noch einmal das lineare Anfangswertproblem y ′ = y,
y(0) = 1.
Dazu differenzieren wir den Ansatz y(x) =
∞ X
an xn = a0 + a1 x + a2 x2 + a3 x3 + . . .
n=0
gliedweise nach x ′
y (x) =
∞ X
nan xn−1 = a1 + 2a2 x + 3a3 x2 + 4a4 x3 + . . .
n=1
und setzen in die Differentialgleichung ein a1 + 2a2 x + 3a3 x2 + 4a4 x3 + . . . = a0 + a1 x + a2 x2 + a3 x3 + . . . Da diese Gleichung f¨ ur alle x richtig sein muss, k¨onnen die Koeffizienten an durch Koeffizientenvergleich bestimmt werden a1 = a0 ,
2a2 = a1 ,
3a3 = a2 ,
4a4 = a3 ,
und so fort. Wegen a0 = y(0) = 1 kann dieses unendlich große Gleichungssystem von oben nach unten sukzessive aufgel¨ ost werden. Man erh¨alt a0 = 1,
a1 = 1,
a2 =
1 , 2!
a3 =
1 1 , . . . , an = 3! n!
und damit die (erwartete) L¨osung y(x) =
∞ X xn = ex . n! n=0
Beispiel 19.20 (Eine spezielle Riccati-Differentialgleichung3 ) Zur L¨osung des Anfangswertproblems y ′ = y 2 + x2 , 3
J.F. Riccati, 1676–1754.
y(0) = 1,
19.5 Qualitative Theorie
253
betrachten wir den Ansatz y(x) =
∞ X
an xn = a0 + a1 x + a2 x2 + a3 x3 + . . .
n=0
Aus der Anfangsbedingung y(0) = 1 folgt sofort a0 = 1. Wir berechnen zun¨achst das Produkt (vgl. auch Satz C.10) y(x)2 = (1 + a1 x + a2 x2 + a3 x3 + . . .)2 = 1 + 2a1 x + (a21 + 2a2 )x2 + (2a3 + 2a2 a1 )x3 + . . . und setzen in die Differentialgleichung ein a1 + 2a2 x + 3a3 x2 + 4a4 x3 + . . . = 1 + 2a1 x + (1 + a21 + 2a2 )x2 + (2a3 + 2a2 a1 )x3 + . . . Koeffizientenvergleich ergibt a1 = 1, 2a2 = 2a1 , 3a3 = 1 +
a21
a2 = 1 + 2a2 ,
a3 = 4/3
4a4 = 2a3 + 2a2 a1 ,
a4 = 7/6,
...
Damit erhalten wir eine gute Approximation an die L¨osung f¨ ur kleines x 4 7 y(x) = 1 + x + x2 + x3 + x4 + O(x5 ). 3 6 Der maple -Befehl dsolve({diff(y(x),x)=x^2+y(x)^2, y(0)=1}, y(x), series); macht genau die obigen Rechnungen.
19.5 Qualitative Theorie Oft kann man u ¨ber das qualitative Verhalten der L¨osungen von Differentialgleichungen Aussagen treffen, ohne die Gleichungen selbst zu l¨osen. Wir besprechen hier als einfachsten Fall die Stabilit¨at nichtlinearer Differentialgleichungen in der N¨ahe eines Gleichgewichtpunkts. Eine Differentialgleichung heißt autonom, wenn ihre rechte Seite nicht explizit von der unabh¨angigen Variablen abh¨angt. Definition 19.21 Der Punkt y ⋆ ∈ R heißt Gleichgewichtspunkt oder Equilibrium der autonomen Differentialgleichung y ′ = f (y), falls f (y ⋆ ) = 0.
254
19 Differentialgleichungen
Gleichgewichtspunkte sind spezielle L¨ osungen der Differentialgleichung, so genannte station¨are L¨ osungen. Um zu untersuchen, wie L¨ osungen aussehen, die in der N¨ahe des Gleichgewichtpunkts verlaufen, linearisieren wir die Differentialgleichung um den Gleichgewichtspunkt. Bezeichne w(x) = y(x) − y ⋆ den Abstand der L¨ osung y(x) zum Gleichgewichtspunkt. Taylorreihenentwicklung von f zeigt w′ = y ′ = f (y) = f (y) − f (y ⋆ ) = f ′ (y ⋆ )w + O(w2 ), also
w′ (x) = a + O(w) w
mit
a = f ′ (y ⋆ ).
Entscheidend ist, wie sich die L¨ osungen dieses Problems f¨ ur kleines w verhalten. Offensichtlich ausschlaggebend ist die Gr¨oße des Koeffizienten a + O(w). Falls a < 0 ist, so ist f¨ ur w klein genug auch a + O(w) < 0 und die Funktion |w(x)| f¨allt. Ist umgekehrt a > 0, so w¨ achst f¨ ur kleines w die Funktion |w(x)|. ¨ Mit diesen Uberlegungen hat man den folgenden Satz bewiesen. Satz 19.22 Sei y ⋆ ein Gleichgewichtspunkt der Differentialgleichung y ′ = f (y) und gelte f ′ (y ⋆ ) < 0. Dann erf¨ ullen alle L¨osungen der Differentialgleichung mit Anfangswert w(0) nahe bei y ⋆ die Absch¨atzung |w(x)| ≤ C · ebx · |w(0)| mit Konstanten C > 0 und b < 0. Unter den Voraussetzungen des Satzes nennt man den Gleichgewichtspunkt asymptotisch stabil . Ein asymptotisch stabiler Gleichgewichtspunkt zieht alle L¨osungen in seiner N¨ ahe (exponentiell schnell) an, da wegen b < 0 |w(x)| → 0
f¨ ur x → ∞.
Beispiel 19.23 Das Modell von Verhulst y ′ = (α − βy)y,
α, β > 0
besitzt zwei Gleichgewichtspunkte, n¨ amlich y1⋆ = 0 und y2⋆ = α/β. Wegen f ′ (y1⋆ ) = α − 2βy1⋆ = α,
f ′ (y2⋆ ) = α − 2βy2⋆ = −α
ist y1⋆ = 0 instabil und y2⋆ = α/β asymptotisch stabil.
¨ 19.6 Ubungen
255
¨ 19.6 Ubungen 1. Ermitteln Sie die allgemeine L¨ osung der folgenden Differentialgleichungen und skizzieren Sie einige L¨ osungskurven (a)
x˙ =
x , t
(b)
x˙ =
t , x
(c)
x˙ =
−t . x
Das Richtungsfeld skizzieren Sie am besten mit maple , z.B. mit DEplot. ¨ 2. L¨ osen Sie Ubung 1 mit dem Applet Dynamische Systeme in der Ebene, indem Sie die jeweilige Differentialgleichung durch Hinzuf¨ ugen von t˙ = 1 in ein ¨ aquivalentes autonomes System umschreiben. Hinweis: Die Variablen werden im Applet mit x und y bezeichnet. Beispielsweise w¨ are Aufgabe 1(a) zu schreiben als x′ = x/y und y ′ = 1. 3. Nach dem Newtonschen Abk¨ uhlungsgesetz ist die Abk¨ uhlungsrate eines K¨ orpers proportional zur Differenz seiner Temperatur zur Raumtemperatur x˙ = k(a − x), wobei x die K¨ orpertemperatur, a die umgebende Raumtemperatur und k eine Proportionalit¨ atskonstante ist. L¨ osen Sie die Differentialgleichung allgemein. Wie lange dauert es, bis ein K¨ orper von x(0) = 100◦ auf 40◦ abgek¨ uhlt ist bei einer Raumtemperatur von 20◦ , wenn seine Abk¨ uhlung von 100◦ auf 80◦ in 5 Minuten erfolgte? 4. L¨ osen Sie die Differentialgleichung von Verhulst aus Beispiel 19.9 und berechnen Sie den Grenzwert t → ∞ der L¨ osung.
5. In einem Tank befinden sich 100 l der Fl¨ ussigkeit A. Mit einer Rate von 5 l/s werde Fl¨ ussigkeit B zugeleitet, w¨ ahrend gleichzeitig das entstandene Gemisch mit einer Rate von 10 l/s abgelassen wird. Gesucht ist die Menge x(t) der Fl¨ ussigkeit B im Tank zum Zeitpunkt t. Aus der Bilanzgleichung x(t) ˙ = Rate(ein) − Rate(aus) = Rate(ein) − 10 · x(t)/Gesamtmenge(t) erh¨ alt man die Differentialgleichung x˙ = 5 −
10x , 100 − 5t
x(0) = 0.
Erkl¨ aren Sie diese Herleitung und l¨ osen Sie das Anfangswertproblem mit maple (mit dsolve). Wann ist der Tank leer?
20 Systeme von Differentialgleichungen
Systeme von Differentialgleichungen, oft als differenzierbare dynamische Systeme bezeichnet, spielen eine wichtige Rolle in der Modellierung von zeitabh¨ angigen ¨ Vorg¨ angen in der Mechanik, Meteorologie, Biologie, Medizin, Okonomie und anderen Wissenschaften. Sie eignen sich gut zur Demonstration der Modellbildung mit den Konzepten der Analysis. Wir beschr¨ anken uns auf zweidimensionale Systeme, deren L¨ osungen (Trajektorien) anschaulich als Kurven in der Ebene dargestellt werden k¨ onnen. Der erste Abschnitt f¨ uhrt in das Gebiet der linearen Systeme ein, deren vollst¨ andige L¨ osung wir vorf¨ uhren werden. In den Anwendungen werden allerdings vielfach nichtlineare Systeme ben¨ otigt. Im allgemeinen kann deren L¨ osung nicht explizit angegeben werden. Hier ist es vor allem interessant, das L¨ osungsverhalten qualitativ zu verstehen. Wir geben einige erste Hinweise auf die reichhaltige qualitative Theorie im zweiten Abschnitt dieses Kapitels. Numerische N¨ aherungsverfahren werden im anschließenden Kapitel 21 behandelt.
20.1 Systeme linearer Differentialgleichungen Wir beginnen mit der Beschreibung einiger Situationen, die auf Systeme von Differentialgleichungen f¨ uhren. Im Kapitel 19 wurde das Bev¨olkerungsmodell ¨ von Malthus vorgestellt, wonach die Anderungsrate einer Bev¨olkerung x(t) proportional zum momentanen Bev¨olkerungsstand angenommen wird: x(t) ˙ = ax(t). Betrachtet man eine zweite Population y(t), so k¨onnte sich deren Anwesenheit ¨ positiv oder negativ auf die Anderungsrate von x(t) auswirken, und umgekehrt: x(t) ˙ = ax(t) + by(t) y(t) ˙ = cx(t) + dy(t)
258
20 Systeme von Differentialgleichungen
mit positiven oder negativen Koeffizienten b, c, die die Interaktion der Populationen beschreiben. Dies ist die allgemeine Form eines linearen Differentialgleichungssystems in zwei Unbekannten, kurz geschrieben als x˙ = ax + by y˙ = cx + dy. Verfeinerte Modelle erh¨ alt man, wenn man etwa die Ab¨angigkeit der Wachstumsrate vom Nahrungsvorrat ber¨ ucksichtigt. F¨ ur eine Spezies erg¨abe das eine Gleichung der Form x˙ = (v − n)x wobei v den momentan vorhandenen Nahrungsvorrat bezeichnet und n einen Schwellenwert. Die Bev¨ olkerungszahl nimmt also zu, wenn mehr als n Nahrung vorhanden ist, und sonst ab. Im Falle eines R¨auber-Beute-Verh¨altnisses der Spezies x zur Spezies y, in welchem y die Nahrung f¨ ur x bildet, und unter der Annahme, dass die Anzahl der Begegnungen proportional zu xy ist, erh¨alt man das nichtlineare System x˙ = (ay − n)x
y˙ = dy − cxy.
Dies ist das ber¨ uhmte R¨ auber-Beute-Modell von Lotka1 und Volterra2 (f¨ ur eine detaillierte Herleitung verweisen wir auf [16, Chap. 12.2]). Die allgemeine Form eines Systems nichtlinearer Differentialgleichungen ist x˙ = f (x, y) y˙ = g(x, y). Geometrisch kann dies folgendermaßen interpretiert werden. Die rechte Seite definiert ein Vektorfeld f (x, y) (x, y) 7→ g(x, y) auf R2 ; die linke Seite ist der Geschwindigkeitsvektor einer ebenen Kurve x(t) t 7→ . y(t)
Die L¨osungen sind demnach ebene Kurven, deren Geschwindigkeitsvektoren in jedem Punkt (x, y) ∈ R2 durch das Vektorfeld gegeben sind. Beispiel 20.1 (Rotation der Ebene) Die Vektoren des Vektorfelds −y (x, y) 7→ x 1 2
A.J. Lotka, 1880–1949 V. Volterra, 1860–1940
20.1 Systeme linearer Differentialgleichungen
259
stehen jeweils senkrecht auf die zugeh¨ origen Ortsvektoren (Abb. 20.1). Die L¨ osungen des Differentialgleichungssystems x˙ = −y y˙ = x sind die Kreisbahnen (Abb. 20.1) x(t) = R cos t y(t) = R sin t, wobei der Radius R durch die Anfangswerte gegeben ist, etwa x(0) = R y(0) = 0.
y
y [−y, x]T (x, y)
x
x
Abb. 20.1. Vektorfeld und L¨ osungskurven.
Bemerkung 20.2 Die geometrische, zweidimensionale Deutung (mit festem Vektorfeld) wird dadurch erm¨ oglicht, dass die rechte Seite des Differentialgleichungssystems nicht explizit von der Zeit t abh¨angt. Man nennt solche Systeme autonom. Wollte man eine Darstellung, die die Zeitachse beinhaltet (wie in Kapitel 19), so m¨ usste man zu einer dreidimensionalen Graphik u ¨bergehen, mit einem dreidimensionalen Richtungsfeld f (x, y) (x, y, t) 7→ g(x, y) 1 und der Darstellung der L¨ osung als Raumkurve (siehe Abb. 20.2, Raum-ZeitDiagramm) x(t) t 7→ y(t) . t
260
20 Systeme von Differentialgleichungen
2π t π
0 1
y
1
0 0 −1
x
−1
Abb. 20.2. Richtungsfeld und Raum-Zeit-Diagramm f¨ ur x˙ = −y, y˙ = x.
Beispiel 20.3 Eine weitere Sorte von Beispielen, die die Bedeutung des Vektorfelds und der L¨ osungskurven veranschaulichen, ergibt sich aus der Str¨omung idealer Fl¨ ussigkeiten. Zum Beispiel beschreibt x2 − y 2 (x2 + y 2 )2 −2xy y˙ = 2 (x + y 2 )2
x˙ = 1 −
eine ebene, station¨are Potentialstr¨omung um den Zylinder x2 + y 2 ≤ 1 (Abb. 20.3). Die rechte Seite beschreibt die Str¨omungsgeschwindigkeit im Punkte (x, y). Die L¨osungskurven verlaufen entlang der Stromlinien 1 =C y 1− 2 x + y2 (C konstant), wie man durch Ableiten dieser Beziehung nach t und Einsetzen in das Differentialgleichungssystem nachpr¨ uft. 4 2 0 −2 −4
−4
−2
0
2
4
6
Abb. 20.3. Ebene Potentialstr¨ omung um Zylinder.
20.1 Systeme linearer Differentialgleichungen
261
Experiment 20.4 Untersuchen Sie das Vektorfeld und die L¨ osungskurven der Differentialgleichungssysteme aus den Beispielen 20.1 und 20.3 mit Hilfe des Applets Dynamische Systeme in der Ebene. Machen Sie dasselbe mit den Differentialgleichungssystemen x˙ = y, y˙ = −x,
x˙ = y, y˙ = x,
x˙ = −y, y˙ = −x,
x˙ = x, y˙ = x,
x˙ = y, y˙ = y
und versuchen Sie, das Verhalten der L¨ osungskurven zu erkennen.
Bevor wir uns der vollst¨ andigen L¨ osung ebener linearer Differentialgleichungssysteme zuwenden, ist es g¨ unstig, ein paar Sprechweisen zur qualitativen Beschreibung von L¨osungskurven einzuf¨ uhren. Die Aufgabe, eine L¨osung eines Differentialgleichungssystems x(t) ˙ = f x(t), y(t) y(t) ˙ = g x(t), y(t)
zu finden, welche zum Zeitpunkt t = 0 durch einen vorgegebenen Punkt x(0) = x0 ,
y(0) = y0
geht, bezeichnet man wieder als Anfangswertproblem. Wir setzen die Funktionen f und g in diesem Kapitel zumindest als stetig voraus. Unter einer L¨ osungskurve oder Trajektorie verstehen wir eine stetig differenzierbare Kurve t 7→ [x(t) y(t)]T , deren Komponenten das Differentialgleichungssystem erf¨ ullen. Es folgt dann aus den beiden Gleichungen, dass die Ableitungen x(t), ˙ y(t) ˙ stetige Funktionen der Zeit sind. Der Begriff des Equilibriums wurde im Fall einer Einzeldifferentialgleichung in Def. 19.21 eingef¨ uhrt. F¨ ur Systeme von Differentialgleichungen definiert man in analoger Weise: Definition 20.5 (Gleichgewichtspunkte) Ein Punkt (x∗ , y ∗ ) heißt Gleichgewichtspunkt oder Equilibrium des Differentialgleichungssystems, falls sowohl f (x∗ , y ∗ ) = 0 als auch g(x∗ , y ∗ ) = 0 ist. Die Bezeichnung r¨ uhrt daher, dass eine L¨ osung mit Anfangswert x0 = x∗ , ∗ ∗ ∗ y0 = y f¨ ur alle Zeiten im Punkt (x , y ) verbleibt; mit anderen Worten, ist (x∗ , y ∗ ) Gleichgewichtspunkt, so ist x(t) = x∗ , y(t) = y ∗ L¨osung des Differentialgleichungsystems, da offenbar sowohl die linke als auch die rechte Seite Null wird. Wir wissen aus Kapitel 19, dass L¨ osungen von Differentialgleichungen nicht f¨ ur alle Zeiten existieren m¨ ussen. Tun sie dies jedoch f¨ ur Anfangswerte in der N¨ ahe eines Gleichgewichtspunkts, so sind die folgenden Begriffe sinnvoll. Definition 20.6 Sei (x∗ , y ∗ ) ein Gleichgewichtspunkt. Falls es eine Umgebung U von (x∗ , y ∗ ) gibt, sodass alle Trajektorien mit Anfangswerten x0 , y0 in U f¨ ur t → ∞ gegen den Gleichgewichtspunkt (x∗ , y ∗ ) konvergieren, so heißt
262
20 Systeme von Differentialgleichungen
dieser asymptotisch stabil. Falls es zu jeder Umgebung V von (x∗ , y ∗ ) eine Umgebung W von (x∗ , y ∗ ) gibt, sodass alle Trajektorien mit Anfangswerten x0 , y0 in W zur G¨anze in V bleiben, so heißt der Gleichgewichtspunkt (x∗ , y ∗ ) stabil. Ein Gleichgewichtspunkt, der nicht stabil ist, wird als instabil bezeichnet. Kurz gesagt bedeutet Stabilit¨ at, dass Trajektorien, die nahe des Gleichgewichtspunkts starten, stets in der N¨ ahe des Gleichgewichtspunkts bleiben; asymptotische Stabilit¨ at heißt, dass die Trajektorien vom Gleichgewichtspunkt angezogen werden. Im Falle eines instabilen Gleichgewichtspunkts gibt es Trajektorien, die sich vom Gleichgewichtspunkt entfernen; bei linearen Systemen sind diese Trajektorien unbeschr¨ ankt, im nichtlinearen Fall k¨onnen sie auch gegen einen anderen Gleichgewichtspunkt oder eine periodische L¨osung konvergieren (siehe dazu etwa die Diskussion des mathematischen Pendels im Abschnitt 20.2 oder auch [3, Kap. 9.10]). Im Folgenden leiten wir die L¨ osung des Anfangswertproblems f¨ ur zweidimensionale Systeme linearer Differentialgleichungen x˙ = ax + by,
x(0) = x0
y˙ = cx + dy,
y(0) = y0
her. Dazu diskutieren wir zun¨ achst die drei Grundtypen dieser Systeme und zeigen dann, wie beliebige Systeme in diese Grundtypen transformiert werden k¨ onnen. Bezeichnen wir die Koeffizientenmatrix mit a b A= , c d so wird die entscheidende Frage sein, ob A einer Matrix vom Typ I, II oder III ahnlich ist, wie im Anhang B.2 beschrieben. Eine Matrix vom Typ I hat reelle ¨ Eigenwerte und ist zu einer Diagonalmatrix ¨ahnlich; eine Matrix vom Typ II hat einen doppelten reellen Eigenwert, ihre kanonische Form enth¨alt aber einen nilpotenten Anteil; der Fall zweier konjugiert komplexer Eigenwerte ist schließlich im Typ III erfasst. Typ I – reelle Eigenwerte, diagonalisierbare Matrix. In diesem Fall ist die Standardform des Systems x˙ = αx,
x(0) = x0
y˙ = βy,
y(0) = y0 .
Aus Beispiel 19.7 wissen wir, dass die L¨ osungen gegeben sind durch x(t) = x0 eαt ,
y(t) = y0 eβt
und insbesondere f¨ ur alle Zeiten t ∈ R existieren. Offenbar ist (x∗ , y ∗ ) = (0, 0) ein Gleichgewichtspunkt. Falls α < 0 und β < 0 ist, so n¨ahern sich alle L¨osungskurven f¨ ur t → ∞ dem Gleichgewichtspunkt (0, 0); dieser ist asymptotisch stabil. Falls α ≥ 0, β ≥ 0 (nicht beide gleich Null), so entfernen sich
20.1 Systeme linearer Differentialgleichungen
263
die L¨osungskurven aus jeder Umgehung von (0, 0). Dieser Punkt ist dann ein instabiles Gleichgewicht. Ebenso liegt im Falle α > 0, β < 0 (oder umgekehrt) Instabilit¨at vor, wobei man in diesem Fall von einem Sattelpunkt spricht. Falls α 6= 0 und x0 6= 0 ist, kann man nach t aufl¨ osen und die L¨osungskurven als Funktionsgraphen darstellen: x 1/α x β/α et = , y = y0 . x0 x0 Beispiel 20.7 Die drei Systeme x˙ = x, y˙ = 2y,
x˙ = −x, y˙ = −2y,
x˙ = x, y˙ = −2y
besitzen die jeweiligen L¨osungen x(t) = x0 et , y(t) = y0 e2t ,
x(t) = x0 e−t , y(t) = y0 e−2t ,
x(t) = x0 et , y(t) = y0 e−2t .
Die Vektorfelder und L¨osungskurven sind in den Abbildungen 20.4 - 20.6 dargestellt. Man erkennt, dass alle Koordinatenhalbachsen L¨osungskurven sind. 6
6
y
4
4
2
2
0
x
0
−2
−2
−4
−4
−6
−5
0
−6
5
Abb. 20.4. Reelle Eigenwerte, instabiles Gleichgewicht. y
5
y
x
−5
x
−5
5
Abb. 20.5. Reelle Eigenwerte, asymptotisch stabiles Gleichgewicht. y
5
0
0
0
x
−5 −5
0
5
Abb. 20.6. Reelle Eigenwerte, Sattelpunkt.
−5
0
5
Abb. 20.7. Doppelter reeller Eigenwert, nicht diagonalisierbar.
264
20 Systeme von Differentialgleichungen
Typ II – doppelter reeller Eigenwert, nicht diagonalisierbar. Der Fall eines doppelten reellen Eigenwerts α = β ist einerseits ein Spezialfall von Typ I, wenn die Koeffizientenmatrix diagonalisierbar ist. Es gibt jedoch den Sonderfall des doppelten Eigenwerts und eines nilpotenten Anteils. Dann ist die Standardform des Systems x˙ = αx + y, y˙ = αy,
x(0) = x0 , y(0) = y0 .
Wir berechnen zun¨ achst die L¨ osungskomponente y(t) = y0 eαt , setzen diese in der ersten Zeile ein: x(t) ˙ = αx(t) + y0 eαt ,
x(0) = x0
und wenden die Methode der Variation der Konstanten aus Kapitel 19 an: Z t αt x(t) = e x0 + e−αs y0 eαs ds = eαt x0 + ty0 . 0
Das Vektorfeld und einige L¨ osungskurven f¨ ur den Fall α = −1 sind in Abb. 20.7 dargestellt. Typ III – konjugiert komplexe Eigenwerte. In diesem Fall ist die Standardform des Systems x˙ = αx − βy, y˙ = βx + αy,
x(0) = x0 , y(0) = y0 .
F¨ uhren wir die komplexe Variable z und die komplexen Koeffizienten γ, z0 gem¨aß z = x + iy, γ = α + iβ, z0 = x0 + iy0 ein, so sieht man, dass das obige System Real- und Imagin¨arteil der Gleichung (x˙ + iy) ˙ = (α + iβ)(x + iy),
x(0) + iy(0) = x0 + iy0
darstellt. Geschrieben in rein komplexer Form z˙ = γz,
z(0) = z0 ,
l¨ asst sich die zugeh¨ orige L¨ osung sofort angeben: z(t) = z0 eγt . Spaltet man linke und rechte Seite in Real- und Imagin¨arteil auf, so erh¨alt man
20.1 Systeme linearer Differentialgleichungen
265
x(t) + iy(t) = (x0 + iy0 )e(α+iβ)t = (x0 + iy0 )eαt (cos βt + i sin βt). Daraus ergibt sich (vergleiche Abschnitt 4.2) x(t) = x0 eαt cos βt − y0 eαt sin βt, y(t) = x0 eαt sin βt + y0 eαt cos βt.
Der Punkt (x∗ , y ∗ ) = (0, 0) ist wieder ein Gleichgewichtspunkt, der im Falle α < 0 asymptotisch stabil, im Falle α > 0 instabil ist. Im Falle α = 0 handelt es sich um ein stabiles, aber nicht asymptotisch stabiles Gleichgewicht, da die kreisf¨ormigen L¨osungskurven zwar beschr¨ ankt sind, sich aber dem Ursprung f¨ ur t → ∞ nicht n¨ ahern. y
5
y
5
0
0
x
x
−5
−5 −5
0
−5
5
Abb. 20.8. Komplexe Eigenwerte, instabil.
0
5
Abb. 20.9. Komplexe Eigenwerte, asymptotisch stabil.
Beispiel 20.8 Die Vektorfelder und L¨ osungskurven f¨ ur die zwei Systeme x˙ =
1 10 x
y˙ = x +
− y,
1 10 y,
1 x − y, x˙ = − 10
y˙ = x −
1 10 y
sind Abbildungen 20.8 und 20.9 zu entnehmen. F¨ ur den stabilen Fall x˙ = −y, y˙ = x verweisen wir auf Abb. 20.1. Allgemeine L¨ osung des linearen Differentialgleichungssystems. Die ¨ Ahnlichkeitstransformationen aus Anhang B erlauben es nun, lineare Differentialgleichungssysteme durch R¨ uckf¨ uhrung auf die drei Standardf¨alle allgemein zu l¨osen. Satz 20.9 Das Anfangswertproblem x(t) x(t) ˙ , =A y(t) y(t) ˙
x x(0) = 0 y0 y(0)
besitzt f¨ ur beliebige (2 × 2)-Matrizen A eine eindeutige, f¨ ur alle Zeiten t ∈ R existierende L¨osung. Diese kann explizit durch R¨ uckf¨ uhrung mittels einer
266
20 Systeme von Differentialgleichungen
¨ Ahnlichkeitstransformation auf einen der Typen I, II oder III berechnet werden. Beweis: Nach Anhang B.2 gibt es eine invertierbare Matrix T so, dass T−1 AT = B ist, wobei B einem der Standardtypen I, II, III angeh¨ort. Wir setzen u x = T−1 . v y Dann gilt u˙ ˙ x u u −1 x −1 −1 =T =T A = T AT =B , v˙ y˙ y v v
u(0) −1 x0 =T . v(0) y0
Wir l¨osen dieses Differentialgleichungssystem je nach Typ I, II oder III, wie oben ausgef¨ uhrt. Die L¨ osungen der Systeme in Standardform sind eindeutig und existieren f¨ ur alle Zeiten. Die R¨ ucktransformation x u =T . y v ergibt die L¨osung des urspr¨ unglichen Systems.
⊓ ⊔
Somit beinhalten die Typen I, II, III bis auf einen Basiswechsel tats¨achlich alle F¨alle, die auftreten k¨ onnen. Beispiel 20.10 Wir untersuchen die L¨ osungskurven des Systems x˙ = x + 2y y˙ = 2x + y. Die zugeh¨orige Koeffizientenmatrix 1 2 A= 2 1 hat die Eigenwerte λ1 = 3, λ2 = −1 mit zugeh¨origen Eigenvektoren e1 = [1 1]T , e2 = [−1 1]T . Es handelt sich um Typ I, der Ursprung ist ein Sattelpunkt. Das Vektorfeld und die zugeh¨origen L¨osungen sind Abb. 20.10 zu entnehmen.
y
5
0
x
−5 −5
0
5
Abb. 20.10. L¨ osung zu Beispiel 20.10.
Bemerkung 20.11 Der Beweis von Satz 20.9 zeigt, wie die Struktur der allgemeinen L¨osung eines linearen Differentialgleichungssystems beschaffen ist.
20.2 Systeme nichtlinearer Differentialgleichungen
267
Nehmen wir zum Beispiel an, dass die Wurzeln λ1 , λ2 des charakteristischen Polynoms der Koeffizientenmatrix reell und verschieden sind, also Typ I vorliegt. Die allgemeine L¨ osung in transformierten Koordinaten ist durch u(t) = C1 eλ1 t ,
v(t) = C2 eλ2 t
gegeben. Bezeichnen wir die Spalten der Transformationsmatrix mit t1 , t2 , so ist die L¨osung in den urspr¨ unglichen Koordinaten x(t) t C eλ1 t + t12 C2 eλ2 t , = t1 u(t) + t2 v(t) = 11 1 λ1 t y(t) t21 C1 e + t22 C2 eλ2 t also in jeder Komponente eine spezielle Linearkombination der transformierten L¨osungen u(t), v(t). Im Falle konjugiert komplexer Wurzeln µ ± iν (Typ III) sind die Komponenten der allgemeinen L¨ osung spezielle Linearkombinationen der Funktionen eµt cos νt und eµt sin νt. Entsprechendes gilt im Fall einer doppelten Wurzel und Typ II.
20.2 Systeme nichtlinearer Differentialgleichungen Im Gegensatz zu linearen Differentialgleichungssystemen lassen sich die L¨osungen zu nichtlinearen Systemen in der Regel nicht durch explizite Formeln ausdr¨ ucken. Neben numerischen L¨ osungsverfahren (Kapitel 21) ist die qualitative Theorie von Interesse, die das Verhalten der L¨osungen beschreibt, ohne diese explizit anzugeben. Wir werden dies in diesem Abschnitt an zwei Beispielen vorf¨ uhren. Das Lotka-Volterra-Modell. Im Abschnitt 20.1 wurde das R¨auber-BeuteModell von Lotka und Volterra vorgestellt. Zu Vorf¨ uhrzwecken setzen wir alle Koeffizienten zu Eins. Damit wird das System zu x˙ = x(y − 1)
y˙ = y(1 − x).
Die Gleichgewichtspunkte sind (x∗ , y ∗ ) = (1, 1) und (x∗∗ , y ∗∗ ) = (0, 0). Offenbar sind die Koordinatenhalbachsen L¨ osungskurven mit zugeh¨origen L¨osungen x(t) = x0 e−t ,
x(t) = 0,
y(t) = 0,
y(t) = y0 et .
Der Gleichgewichtspunkt (0, 0) ist somit ein Sattelpunkt (instabil); den Typ des Gleichgewichtspunkts (1, 1) werden wir sp¨ater analysieren. In der Folge betrachten wir nur den im biologischen Modell relevanten ersten Quadranten x ≥ 0, y ≥ 0. Entlang der Geraden x = 1 ist das Vektorfeld waagrecht, entlang der Geraden y = 1 senkrecht. Es sieht also so aus, als ob die L¨osungskurven um den Gleichgewichtspunkt (1, 1) zirkulieren (Abb. 20.11).
268
20 Systeme von Differentialgleichungen y 2
1
0 0
1
2
x
Abb. 20.11. Vektorfeld des Lotka-Volterra-Modells.
Um dies u ufen zu k¨ onnen, suchen wir eine Funktion H(x, y), die l¨angs ¨berpr¨ der L¨osungskurven konstant ist: H(x(t), y(t)) = C. Eine solche Funktion heißt Erstes Integral, Invariante oder Erhaltungsgr¨oße des Differentialgleichungssystems. Demnach muss gelten d H(x(t), y(t)) = 0 dt oder nach der Kettenregel f¨ ur Funktionen zweier Variabler (Satz 15.16) ∂H ∂H x˙ + y˙ = 0. ∂x ∂y Machen wir (versuchsweise) den Ansatz H(x, y) = F (x) + G(y), so muss gelten F ′ (x)x˙ + G′ (y)y˙ = 0. Aus den Differentialgleichungen erhalten wir F ′ (x)x(y − 1) + G′ (y)y(1 − x) = 0. Trennung der Variablen ergibt y G′ (y) x F ′ (x) = . x−1 y−1 Da die Variablen x und y voneinander unabh¨angig sind, geht dies nur, wenn beide Seiten konstant sind:
20.2 Systeme nichtlinearer Differentialgleichungen
x F ′ (x) = C, x−1 Es folgt
1 , F ′ (x) = C 1 − x
269
y G′ (y) = C. y−1 1 G′ (y) = C 1 − y
und damit H(x, y) = C(x − log x + y − log y) + D.
Diese Funktion hat ein absolutes Minimum in (x∗ , y ∗ ) = (1, 1), wie aus Abb. 20.12 ersichtlich.
y 3 4
H(x, y)
2
3 1
2 3 2
y
1 0
0
1
2
x
3 0
0
1
2
3
x
Abb. 20.12. Erstes Integral und Niveaulinien.
Die L¨osungskurven des Lotka-Volterra-Systems liegen auf den Niveaulinien x − log x + y − log y = const. Diese Niveaulinien sind offenbar geschlossene Kurven. Es erhebt sich die Frage, ob die L¨osungskurven auch geschlossen sind, die L¨osungen somit periodisch sind. Wir werden diese Frage im folgenden Satz bejahen. Periodische, geschlossene L¨osungskurven nennt man periodische Orbits. Satz 20.12 Die L¨osungskurven des Lotka-Volterra-Systems f¨ ur Anfangswerte x0 > 0, y0 > 0 sind periodische Orbits und (x∗ , y ∗ ) = (1, 1) ist ein stabiler Gleichgewichtspunkt. Beweisskizze: Der Beweis der Tatsache, dass die L¨osung x(t) x(0) x t 7→ , = 0 y(t) y(0) y0 zum Anfangswert x0 ≥ 0, y0 ≥ 0 f¨ ur alle Zeiten t ∈ R existiert und eindeutig ist, erfordert Methoden, die u ¨ber den Rahmen dieses Buchs hinausgehen. Wir verweisen etwa auf [16, Chap. 8]. Um die Periodizit¨at zu nachzuweisen, nehmen wir Anfangswerte (x0 , y0 ) 6= (1, 1) und zeigen, dass die
270
20 Systeme von Differentialgleichungen
zugeh¨orige L¨osungskurve nach endlicher Zeit τ > 0 wieder in den Anfangspunkt zur¨ uckkehrt. Dazu unterteilen wir den ersten Quadranten x > 0, y > 0 in vier Teilquadranten mit Zentrum (1, 1): Q1 : x > 1, y > 1; Q3 : x < 1, y < 1;
Q2 : x < 1, y > 1; Q4 : x > 1, y < 1
und zeigen, dass jede L¨ osungskurve in endlicher Zeit (im Uhrzeigersinn) durch alle Teilquadranten wandert. Nehmen wir etwa den Fall (x0 , y0 ) ∈ Q3 , also 0 < x0 < 1, 0 < y0 < 1. Wir wollen zeigen, dass die L¨osungskurve in endlicher Zeit den Teilquadranten Q2 erreicht, also y(t) den Wert 1 annimmt. Aus den Differentialgleichungen folgt f¨ ur den Teilquadranten Q3 : x˙ = x(y − 1) < 0,
y˙ = y(1 − x) > 0
und damit x(t) < x0 ,
y(t) > y0 ,
y(t) ˙ > y0 (1 − x0 ),
solange (x(t), y(t)) im Teilquadranten Q3 verbleibt. W¨are y(t) f¨ ur alle Zeiten t > 0 kleiner als 1, so w¨ urde gelten: Z t Z t 1 > y(t) = y0 + y(s) ˙ ds > y0 + y0 (1 − x0 ) ds = y0 + ty0 (1 − x0 ). 0
0
Letzterer Ausdruck divergiert aber gegen unendlich f¨ ur t → ∞, ein Widerspruch. Folglich muss y(t) den Wert 1 und damit den Teilquadranten Q2 in endlicher Zeit erreichen. Ebenso argumentiert man f¨ ur die anderen Teilquadranten. Es existiert somit ein τ > 0, sodass (x(τ ), y(τ )) = (x0 , y0 ) ist. Daraus folgt aber bereits die Periodizit¨ at. Da das Differentialgleichungssystem autonom ist, ist mit t 7→ (x(t), y(t)) auch t 7→ (x(t + τ ), y(t + τ )) eine L¨osung. Wie eben gezeigt, haben aber beide L¨ osungen denselben Anfangswert bei t = 0. Aus der Eindeutigkeit der L¨ osung des Anfangswertproblems folgt, dass die beiden L¨osungen identisch sind, also x(t) = x(t + τ ),
y(t) = y(t + τ )
f¨ ur alle Zeiten t ∈ R erf¨ ullt ist. Dies besagt aber, dass die L¨osung t 7→ (x(t), y(t)) periodisch mit Periode τ ist. S¨ amtliche L¨osungskurven sind somit periodische Orbits. L¨osungskurven, die nahe (x∗ , y ∗ ) = (1, 1) starten, bleiben nahe, vgl. Abb. 20.12. Der Punkt (1, 1) ist folglich ein stabiles Equilibrium. ⊓ ⊔
Abb. 20.13 zeigt die L¨ osungskurven. Die Bev¨ olkerungszahlen von R¨auber und Beute schwanken also periodisch und gegenl¨ aufig. F¨ ur weitere Bev¨olkerungsmodelle verweisen wir auf [8].
Pendel. Als zweites Beispiel betrachten wir das mathematische Pendel. Dabei schwingt ein K¨ orper der Masse m an einem Faden der L¨ange l unter
20.2 Systeme nichtlinearer Differentialgleichungen
271
y 2
1
0 0
1
2
x
Abb. 20.13. L¨ osungskurven des Lotka-Volterra-Modells.
der Schwerkraft −mg um den Ursprung (siehe Abb. 20.14). Bezeichnet x(t) den Auslenkungswinkel (im Gegenuhrzeigersinn) aus der Ruhelage, so ist die Tangentialbeschleunigung des K¨ orpers gleich l¨ x(t). Die Tangentialkomponente der Erdanziehungskraft ist −mg sin x(t). Nach dem Newton’schen Gesetz ist Kraft = Masse × Beschleunigung, daher −mg sin x = ml¨ x oder
g x ¨ = − sin x. l F¨ uhren wir die neue Variable y = x˙ ein und setzen wir den Koeffizienten zu Vorf¨ uhrzwecken gleich Eins, so erhalten wir das System x˙ = y, y˙ = − sin x,
x(0) = x0 , y(0) = y0 ,
wobei nun x den Auslenkungswinkel und y die Winkelgeschwindigkeit des K¨orpers bezeichnet.
x
l m
x
−mg
Abb. 20.14. Herleitung der Pendelgleichung.
272
20 Systeme von Differentialgleichungen
Die Linearisierung sin x = x + O(x3 ) ≈ x
f¨ ur kleine Auslenkungen x f¨ uhrt auf die N¨ aherung x˙ = y y˙ = −x. Dieses Differentialgleichungssystem entspricht bis auf die ge¨anderte Umlaufrichtung genau Beispiel 20.1. Um den L¨osungsverlauf f¨ ur das mathematische Pendel beschreiben zu k¨onnen, suchen wir wieder ein Erstes Integral der Form H(x, y) = F (x) + G(y). Es folgt wie beim Lotka-Volterra-Modell F ′ (x)y − G′ (y) sin x = 0,
F ′ (x) G′ (y) = = C, sin x y
und daraus F ′ (x) = C sin x,
G′ (y) = Cy,
also
y2 + E. 2 Geeignete Wahl der Konstanten (C = 1, D = 1, E = 0) ergibt F (x) = −C cos x + D,
H(x, y) =
G(y) = C
y2 + 1 − cos x, 2
was genau der Gesamtenergie (kinetische plus potentielle) entspricht. Die L¨osungskurven zu den entsprechenden Anfangswerten liegen also auf den Niveaulinien y2 y2 + 1 − cos x = 0 + 1 − cos x0 , 2 2 q
y = ± y02 − 2 cos x0 + 2 cos x ;
Abb. 20.15 zeigt die L¨osungskurven. Es gibt instabile Gleichgewichtspunkte in y = 0, x = . . . , −3π, −π, π, 3π, . . ., welche durch Grenzl¨osungskurven verbunden sind. Eine solche Grenztrajektorie erh¨alt man zum Beispiel aus den Anfangswerten x0 = 0, y0 = 2; f¨ ur t → ∞ n¨ahert sich die L¨osung l¨angs dieser Trajektorie dem Equilibrium (π, 0), f¨ ur t → −∞ dem Equilibrium (−π, 0). Innerhalb der Grenzl¨osungskurven (etwa mit Anfangswerten x0 = 0, |y0 | < 2) liegen periodische L¨osungen - ungebremste kleine Schwingungen. Die außer¨ halb liegenden L¨osungen stellen ungebremste Schwingungen mit Uberschlag des Pendels dar. Wir merken an, dass Reibungseffekte in diesem Modell nicht ber¨ ucksichtigt sind.
¨ 20.3 Ubungen 4
273
y
2 0
x
−2 −4 −5
0
5
Abb. 20.15. L¨ osungskurven, mathematisches Pendel.
¨ 20.3 Ubungen 1. Das Raum-Zeit-Diagramm eines zweidimensionalen Differentialgleichungssystems (Bemerkung 20.2) kann man erhalten, indem man die Zeit als dritte Variable z(t) = t einf¨ uhrt und zu einem dreidimensionalen Differentialgleichungssystem f (x, y) x˙ y˙ = g(x, y) 1 z˙ u ¨bergeht. Wenden Sie diese Beobachtung auf die Systeme aus Beispiel 20.1 und 20.3 an und studieren Sie die zeitabh¨ angigen L¨ osungskurven mit Hilfe des Applets Dynamische Systeme im Raum. 2. Berechnen Sie die allgemeinen L¨ osungen der drei Differentialgleichungssysteme durch Transformation auf Standardform: x˙ = 53 x − 54 y, y˙ = − 45 x − 53 y,
x˙ = −3y, y˙ = x,
x˙ = y˙ =
7 x 4 5 x 4
− 45 y, + 41 y.
Sehen Sie sich die L¨ osungskurven mit Hilfe des Applets Dynamische Systeme in der Ebene an. 3. Kleine, unged¨ ampfte Schwingungen eines K¨ orpers der Masse m unter Einwirkung einer Feder werden durch die Differentialgleichung m¨ x + kx = 0 beschrieben (x = x(t) die Auslenkung aus der Ruhelage, k die Federsteifigkeit). F¨ uhren Sie die Variable y = x˙ ein und schreiben Sie die Differentialgleichung zweiter Ordnung als lineares Differentialgleichungssystem um. Geben Sie die allgemeine L¨ osung an. 4. Ein Unternehmen deponiert seinen Gewinn auf einem Konto mit kontinuierlicher Verzinsung von a% (Kontostand x(t)). Gleichzeitig werde vom Konto laufend der Betrag y(t) entnommen, wobei die Entnahmerate b% des Kontostands betrage. Mit r = a/100, s = b/100 f¨ uhrt dies auf das lineare Differentialgleichungssystem x(t) ˙ = r(x(t) − y(t)), y(t) ˙ = s x(t). Ermitteln Sie die L¨ osung (x(t), y(t)) zum Anfangswert x(0) = 1, y(0) = 0 und analysieren Sie, wie groß s im Vergleich zu r sein darf, damit der Kontostand x(t) stets ohne Oszillationen w¨ achst.
274
20 Systeme von Differentialgleichungen
5. Eine Volkswirtschaft besitze zwei Sektoren (etwa Industrie und Landwirtschaft) mit den Produktionsvolumen x1 (t), x2 (t) zum Zeitpunkt t. Nimmt man an, dass die Investitionen proportional zur jeweiligen Zuwachsrate sind, so gilt nach dem klassischen Modell von Leontief3 [24, Kap. 9.5] x1 (t) = a11 x1 (t) + a12 x2 (t) + b1 x˙ 1 (t) + c1 (t), x2 (t) = a21 x1 (t) + a22 x2 (t) + b2 x˙ 2 (t) + c2 (t). Dabei ist aij die pro Produktionseinheit im Sektor j ben¨ otigte G¨ utermenge aus Sektor i, bi x˙ i (t) sind die Investitionen, ci (t) der Konsum im Sektor i. Unter den vereinfachenden Annahmen a11 = a22 = 0, a12 = a21 = a (0 < a < 1), b1 = b2 = 1, c1 (t) = c2 (t) = 0 (kein Konsum) ergibt sich das Differentialgleichungssystem x˙ 1 (t) = x1 (t) − ax2 (t), x˙ 2 (t) = −ax1 (t) + x2 (t). Ermitteln Sie die allgemeine L¨ osung und diskutieren Sie das Ergebnis. 6. Analysieren Sie die L¨ osungskurven der Differentialgleichungen des mathematischen Pendels mit Hilfe des Applets Dynamische Systeme in der Ebene und u ¨bersetzen Sie die mathematischen Ergebnisse in Aussagen u ¨ber das mechanische Verhalten.
3
W. Leontief, 1906–1999.
21 Numerik von Differentialgleichungen
Wie wir in den letzten beiden Kapiteln sahen, lassen sich nur spezielle Klassen von Differentialgleichungen analytisch l¨ osen. Speziell bei nichtlinearen Problemen ist man oft auf numerische Verfahren angewiesen. Als Prototyp eines numerischen Verfahrens besprechen wir in diesem Kapitel exemplarisch das Eulerverfahren. Motiviert durch die Taylorreihenentwicklung der analytischen L¨ osung leiten wir dieses N¨ aherungsverfahren ab und untersuchen seine Stabilit¨ atseigenschaften. Auf diese Weise machen wir die Leser mit einigen wichtigen Aspekten der Numerik von Differentialgleichungen vertraut. Wir wollen aber gleichzeitig nicht dar¨ uber hinweg t¨ auschen, dass man in den meisten zeitgem¨ aßen Anwendungen auf moderne Verfahren von hoher Ordnung zur¨ uckgreifen muss. F¨ ur deren Beschreibung verweisen wir auf die einschl¨ agige Fachliteratur, beispielsweise [13, 14, 15].
21.1 Das explizite Eulerverfahren Die Differentialgleichung
y ′ (x) = f x, y(x)
definiert die Steigung der Tangente an die L¨osung y(x). Entwickeln wir die L¨osung im Punkt x + h in eine Taylorreihe y(x + h) = y(x) + hy ′ (x) + O(h2 ) und setzen obigen Wert f¨ ur y ′ (x) ein, so ergibt sich y(x + h) = y(x) + hf x, y(x) + O(h2 ) und daraus f¨ ur kleines h die N¨aherungsformel
y(x + h) ≈ y(x) + hf x, y(x) .
Diese Approximation ist Motivation f¨ ur das (explizite) Eulerverfahren.
276
21 Numerik von Differentialgleichungen
Eulerverfahren. Zur numerischen L¨ osung des Anfangswertproblems y ′ (x) = f x, y(x) , y(a) = y0
im Intervall [a, b] unterteilen wir zun¨ achst das Intervall in N Teile der L¨ange h = (b − a)/N und definieren die Gitterpunkte xj = x0 + jh, 0 ≤ j ≤ N , siehe Abb. 21.1.
x0 = a
x1
x2
···
xN = x0 + N h = b
¨ Abb. 21.1. Aquidistante Gitterpunkte xj = x0 + jh.
Den Abstand h zwischen zwei Gitterpunkten nennt man Schrittweite. Wir suchen nun eine numerische Approximation yn an die exakte L¨osung y(xn ) ¨ im Punkt xn , also yn ≈ y(xn ). Nach obigen Uberlegungen ist y(xn+1 ) ≈ y(xn ) + hf xn , y(xn ) .
Ersetzt man hier die exakte L¨ osung durch die numerischen Approximationen und ≈ durch = , so erh¨alt man das explizite Eulerverfahren
2.8
yn+1 = yn + hf (xn , yn ),
2.2
15 Euler-Schritte 5 Euler-Schritte 2 Euler-Schritte
welches die Approximation yn+1 als Funktion von yn definiert. Vom Anfangswert y0 ausgehend berechnet man aus dieser Rekursion der Reihe nach die Approximationen y1 , y2 , ..., yN ≈ y(b). Die Punkte (xi , yi ) bilden einen Polygonzug, der den Graphen der exakten L¨ osung y(x) approximiert. Abb. 21.2 zeigt die exakte L¨ osung der Differentialgleichung y ′ = y, y(0) = 1 und entsprechende Polygonz¨ uge des Eulerverfahrens f¨ ur drei verschiedene Schrittweiten.
1.6
1 0
0.25
0.5
0.75
1
Abb. 21.2. Euler-Approximationen zu y ′ = y, y(0) = 1.
Das Eulerverfahren besitzt Konvergenzordnung 1, vgl. [14, Kap. II.3]. Auf beschr¨ ankten Intervallen [a, b] gilt somit die gleichm¨aßige Fehlerabsch¨ atzung |y(xn ) − yn | ≤ C h f¨ ur alle n ≥ 1 und hinreichend kleines h mit 0 ≤ nh ≤ b − a. Die Konstante C h¨angt von der Intervalll¨ ange und der L¨ osung y(x), nicht aber von n und h ab.
21.1 Das explizite Eulerverfahren
277
Beispiel 21.1 Die L¨ osung des Anfangswertproblems y ′ = y, y(0) = 1 laux tet y(x) = e . F¨ ur nh = 1 bezeichne yn die numerische Approximation des Eulerverfahrens an die exakte L¨ osung bei x = 1. Wegen yn = yn−1 + hyn−1 = (1 + h)yn−1 = ... = (1 + h)n y0 gilt dann n
yn = (1 + h) =
1 1+ n
n
≈e
und wegen der Konvergenz des Eulerverfahrens n 1 . e = lim 1 + n→∞ n Diese Formel f¨ ur e wurde bereits im Beispiel 7.10 abgeleitet. In kommerzieller Software werden zur numerischen Integration Verfahren h¨oherer Ordnung verwendet, beispielsweise Runge-Kutta oder MehrschrittVerfahren. Alle diese Verfahren sind Verfeinerungen des Eulerverfahrens. Insbesondere wird bei zeitgem¨aßen Implementierungen dieser Verfahren der Fehler automatisch gesch¨atzt und die Schrittweite adaptiv dem Problem angepasst. F¨ ur deren Beschreibung verweisen wir auf die einschl¨agige Fachliteratur [14, 15]. Experiment 21.2 In MATLAB finden Sie Information zur numerischen Integration mittels help funfun. Beispielsweise kann man das Anfangswertproblem y′ = y2 ,
y(0) = 0.9
am Intervall [0, 1] mit dem Aufruf [x,y] = ode23(’qfun’, [0,1], 0.9); l¨ osen. Dazu muss in der Datei qfun.m die Funktion function yp = f(x,y) yp = y.^2; definiert sein. Will man die L¨ osung gleich gezeichnet haben, muss man die Option myopt = odeset(’OutputFcn’,’odeplot’) setzen und den Differentialgleichungsl¨ oser mit [x,y] = ode23(’qfun’, [0,1], 0.9, myopt); aufrufen. Starten Sie das Programm mit verschiedenen Anfangswerten und beobachten Sie die blow ups f¨ ur y(0) ≥ 1.
278
21 Numerik von Differentialgleichungen
21.2 Stabilit¨ at und steife Probleme Die lineare Differentialgleichung y ′ = a y,
y(0) = 1
besitzt die L¨osung y(x) = eax . F¨ ur a ≤ 0 hat diese L¨ osung folgende qualitative Eigenschaft, unabh¨angig von der Gr¨oße von a : |y(x)| ≤ 1 f¨ ur alle x ≥ 0. Wir untersuchen nun, ob numerische Verfahren diese Eigenschaft erhalten. Dazu l¨osen wir die obige Differentialgleichung mit dem expliziten Eulerverfahren und erhalten yn = yn−1 + ha yn−1 = (1 + ha) yn−1 = . . . = (1 + ha)n y0 = (1 + ha)n . F¨ ur −2 ≤ ha ≤ 0 erf¨ ullt die numerische L¨ osung dieselbe Schranke n |yn | = |(1 + ha)n | = 1 + ha ≤ 1
wie die exakte L¨ osung. F¨ ur ha < −2 hat man jedoch dramatische Instabilit¨at, obwohl der einfache L¨ osungsverlauf keine Schwierigkeiten erwarten l¨asst. Alle expliziten Verfahren haben in dieser Situation u ¨brigens dieselben Schwierigkeiten: Die L¨osung ist nur unter sehr restriktiven Bedingungen an die Schrittweite stabil. Beim expliziten Eulerverfahren lautet die Stabilit¨atsbedingung −2 ≤ ha ≤ 0. F¨ ur a ≪ 0 bedeutet das eine drastische Schrittweitenbeschr¨ankung, was letztlich das Verfahren in dieser Situation wenig effizient macht. Einen Ausweg bieten hier implizite Verfahren, beispielsweise das implizite Eulerverfahren yn+1 = yn + hf (xn+1 , yn+1 ). Es unterscheidet sich vom expliziten Verfahren dadurch, dass die Steigung der Tangente im Endpunkt genommen wird. Da zur Bestimmung der numerischen L¨osung eine im Allgemeinen nichtlineare Gleichung zu l¨osen ist, heißt das Verfahren implizit. Das implizite Eulerverfahren hat dieselbe Genauigkeit wie das explizite, aber weitaus bessere Stabilit¨atseigenschaften, wie die folgende Analyse zeigt: Wendet man das implizite Eulerverfahren auf das Anfangswertproblem y ′ = a y,
an, so ergibt sich
y(0) = 1,
mit a ≤ 0
21.2 Stabilit¨ at und steife Probleme
279
yn = yn−1 + hf (xn , yn ) = yn−1 + ha yn , also yn =
1 1 1 yn−1 = . . . = y0 = . n 1 − ha (1 − ha) (1 − ha)n
Das Verfahren ist somit stabil, d.h. |yn | ≤ 1, falls |(1 − ha)n | ≥ 1.
F¨ ur a ≤ 0 ist das aber f¨ ur alle h ≥ 0 erf¨ ullt. Daher ist das Verfahren f¨ ur beliebig große Schrittweiten stabil. Definition 21.3 Eine Differentialgleichung wird steif (engl. stiff) genannt, wenn zu ihrer L¨osung das implizite Eulerverfahren effizienter (meist dramatisch effizienter) als das explizite ist. Beispiel 21.4 (aus [15, Kap. IV.1]) Wir integrieren das Anfangswertproblem y ′ = −50(y − cos x),
y(0) = 0.997
mit der exakten L¨osung y(x) =
50 6503 −50x 2500 cos x + sin x − e 2501 2501 250100
≈ cos(x − 0.02) − 0.0026 e−50x . Die L¨osung sieht recht harmlos aus und ¨ahnelt cos x, die Gleichung ist aber steif mit a = −50. Durch obige Analyse gewarnt erwarten wir Schwierigkeiten bei expliziten Verfahren. 2
2
2
n = 250
n = 248
n = 246
1
1
1
0
0
0
−1
−1
−1
−2
0
5
10
−2
0
5
10
−2
0
5
10
Abb. 21.3. Instabilit¨ at des expliziten Eulerverfahrens. Die Bilder zeigen jeweils die exakte L¨ osung und die approximierenden Polygonz¨ uge des Eulerverfahrens mit n Schritten.
Wir integrieren diese Differentialgleichung numerisch auf dem Intervall [0, 10] mit dem expliziten Eulerverfahren und Schrittweiten h = 10/n mit n = 250, 248 und 246. F¨ ur n < 250, also h > 1/25, treten exponentielle Instabilit¨aten
280
21 Numerik von Differentialgleichungen
2
2
2
n=4
n=8
n = 16
1
1
1
0
0
0
−1
−1
−1
−2
0
5
10
−2
0
5
10
−2
0
5
10
Abb. 21.4. Stabilit¨ at des impliziten Eulerverfahrens. Die Bilder zeigen jeweils die exakte L¨ osung und die approximierenden Polygonz¨ uge des Eulerverfahrens mit n Schritten.
¨ auf, siehe Abb. 21.3. Dies ist im Einklang mit obigen Uberlegungen, denn f¨ ur h > 1/25 ist das Produkt ah < −2.
Integriert man die Differentialgleichung hingegen mit dem impliziten Eulerverfahren, so sind selbst bei sehr großen Schrittweiten keine Instabilit¨aten zu erkennen, siehe Abb. 21.4. Das implizite Eulerverfahren ist allerdings aufw¨andiger als das explizite, da zur Berechnung von yn+1 aus yn+1 = yn + hf (xn+1 , yn+1 ). im Allgemeinen eine nichtlineare Gleichung zu l¨osen ist, beispielsweise mit dem Newtonverfahren.
21.3 Systeme von Differentialgleichungen F¨ ur die Herleitung eines einfachen numerischen Verfahrens zur L¨osung von Systemen von Differentialgleichungen x(t) ˙ = f t, x(t), y(t) , x(t0 ) = x0 , y(t) ˙ = g t, x(t), y(t) , y(t0 ) = y0 , geht man wiederum von der Taylorentwicklung der analytischen L¨osung aus x(t + h) = x(t) + hx(t) ˙ + O(h2 ), y(t + h) = y(t) + hy(t) ˙ + O(h2 )
und ersetzt die Ableitungen durch die rechte Seite der Differentialgleichung. Dies motiviert f¨ ur kleine Schrittweiten h das explizite Eulerverfahren xn+1 = xn + hf tn , xn , yn , yn+1 = yn + hg tn , xn , yn .
Dabei interpretiert man xn und yn als numerische Approximationen an die exakte L¨osung x(tn ) und y(tn ) zum Zeitpunkt tn = t0 + nh.
21.3 Systeme von Differentialgleichungen
281
Beispiel 21.5 Im Kapitel 20.2 haben wir das Lotka-Volterra-Modell x˙ = x(y − 1), y˙ = y(1 − x) untersucht. Um den periodischen Orbit durch den Punkt (x0 , y0 ) = (2, 2) numerisch zu berechnen, wenden wir nun das explizite Eulerverfahren an und erhalten die Rekursion xn+1 = xn + hxn (yn − 1), yn+1 = yn + hyn (1 − xn ). Ausgehend von den Anfangswerten x0 = 2 und y0 = 2 findet man f¨ ur n ≥ 0 die numerische L¨ osung. Die Resultate f¨ ur drei verschiedene Schrittweiten sind in Abb. 21.5 dargestellt. Man beachte die lineare Konvergenz der N¨ aherungsl¨osung f¨ ur h → 0. 3
3
2
3
2
2
n = 250
n = 500
1 0
n = 1000
1
0
1
2
3
0
1
0
1
2
3
0
0
1
2
3
Abb. 21.5. Numerische Berechnung eines periodischen Orbits des Lotka-Volterra Modells. Das System wurde am Intervall 0 ≤ t ≤ 14 mit dem Eulerverfahren und konstanter Schrittweite h = 14/n f¨ ur n = 250, 500 und 1000 integriert.
Man folgert aus diesem numerischen Versuch, dass man mit dem Eulerverfahren eine sehr kleine Schrittweite w¨ ahlen muss, damit die numerische L¨ osung die Periodizit¨ at des wahren Orbits wiedergibt. Alternativ kann man ein N¨aherungsverfahren h¨ oherer Ordnung verwenden, oder – im vorliegenden Beispiel – auch folgende Modifikation des Eulerverfahrens xn+1 = xn + hxn (yn − 1), yn+1 = yn + hyn (1 − xn+1 ). Dabei wird zur Berechnung von yn+1 anstatt xn der bereits aktuellere Wert xn+1 verwendet. Die mit diesem modifizierten Eulerverfahren gewonnenen numerischen Resultate sind in Abb. 21.6 dargestellt. Man erkennt deutlich die ¨ Uberlegenheit dieses Verfahrens gegen¨ uber dem urspr¨ unglichen. Offenbar wurde die geometrische Struktur der L¨ osung besser erfasst. F¨ ur eine Beschreibung solcher Verfahren verweisen wir wieder auf die einschl¨agige Fachliteratur [13].
282
21 Numerik von Differentialgleichungen
3
3
2
3
2
2
n = 50
n = 100
1 0
n = 200
1
0
1
2
3
0
1
0
1
2
3
0
0
1
2
3
Abb. 21.6. Numerische Berechnung eines periodischen Orbits des Lotka-Volterra Modells. Das System wurde am Intervall 0 ≤ t ≤ 14 mit dem modifizierten Eulerverfahren mit konstanter Schrittweite h = 14/n f¨ ur n = 50, 100 und 200 integriert.
¨ 21.4 Ubungen 1. L¨ osen Sie die spezielle Riccati-Gleichung y ′ = x2 + y 2 , y(0) = −4 f¨ ur 0 ≤ x ≤ 2 in MATLAB . 2. L¨ osen Sie das lineare Differentialgleichungssystem x˙ = y,
y˙ = −x
mit den Anfangswerten x(0) = 1 und y(0) = 0 in MATLAB auf dem Intervall [0, b] f¨ ur b = 2π, 10π und 200π. Erkl¨ aren Sie die Beobachtungen. Hinweis: Falls Sie das Programm ode23.m verwenden, lautet der entsprechende Aufruf ode23(’mat21_1’,[0 2*pi],[0 1]), wobei mat21_1.m die rechte Seite der Differentialgleichung definiert. 3. L¨ osen Sie das Lotka-Volterra System x˙ = x(y − 1),
y˙ = y(1 − x)
f¨ ur 0 ≤ t ≤ 14 mit den Anfangswerten x(0) = 2 und y(0) = 2 in MATLAB . Vergleichen Sie die Resultate mit Abb. 21.5 und 21.6.
A Anhang: Vektorrechnung
In verschiedenen Abschnitten dieses Buchs haben wir auf den Begriff des Vektors zur¨ uckgegriffen. Wir setzten dabei vom Leser elementare Grundkenntnisse voraus, wie sie zum Standardrepertoire des Schulunterrichts geh¨ oren. In diesem Abschnitt fassen wir einige Grundbegriffe der Vektorrechnung zusammen. F¨ ur eine ausf¨ uhrliche Darstellung verweisen wir auf [2, Kap. 1].
A.1 Kartesische Koordinatensysteme Ein kartesisches Koordinatensystem in der Ebene (im Raum) besteht aus zwei (drei) sich im Punkt O (Ursprung, Nullpunkt) rechtwinkelig schneidenden Zahlengeraden (Koordinatenachsen). Wir betrachten stets Rechtssysteme. In der Ebene bedeutet Rechtssystem, dass in Blickrichtung der positiven x-Achse die positive y-Achse zur Linken liegt; in drei Dimensionen erh¨alt man in einem Rechtssystem durch Drehen der x-Achse in Richtung der y-Achse nach der Rechtsschraubregel die Richtung der positiven z-Achse, siehe Abb. A.2. Die Koordinaten eines Punkts erh¨alt man durch Parallelprojektion des Punkts auf die Koordinatenachsen. Im Fall des R2 hat der Punkt A die Koordinaten a1 und a2 . Wir schreiben A = (a1 , a2 ) ∈ R2 . In analoger Weise legt man im Raum R3 einen Punkt A durch seine drei Koordinaten a1 , a2 und a3 fest. Wieder schreibt man A = (a1 , a2 , a3 ) ∈ R3 . Man hat somit die eindeutige Darstellung von Punkten als Zahlenpaare oder Zahlentripel.
284
A Anhang: Vektorrechnung z y a2
a3 A
A a2
a1 x Abb. A.1. Kartesisches Koordinatensystem in der Ebene.
x
a1
y
Abb. A.2. Kartesisches Koordinatensystem im Raum.
A.2 Vektoren Zu zwei Punkten P und Q in der Ebene (im Raum) gibt es genau eine Parallelverschiebung, die P nach Q verschiebt. Diese Verschiebung wird als Vektor bezeichnet. Vektoren sind somit Gr¨ oßen mit Richtung und L¨ ange. Die Richtung ist jene von P nach Q, die L¨ ange ist der Abstand zwischen den beiden Punkten. Vektoren dienen zur Modellierung von Kr¨aften, Geschwindigkeiten und ¨ahnlichem. Wir bezeichnen Vektoren stets mit Fettbuchstaben. Zu einem Vektor a bezeichnet −a jene Parallelverschiebung, welche die durch a bewirkte r¨ uckg¨ angig macht; der Nullvektor 0 bewirkt keine Verschiebung. Die Hintereinanderausf¨ uhrung von zwei Parallelverschiebungen ist wieder eine Parallelverschiebung. Die entsprechende Operation f¨ ur Vektoren heißt Addition und erfolgt nach der Parallelogrammregel . Zu einer reellen Zahl λ ≥ 0 bezeichnet weiters λ a jenen Vektor, der dieselbe Richtung wie a hat, dessen L¨ange aber λ mal die L¨ ange von a ist. Diese Operation heißt Skalarmultiplikation. F¨ ur Addition und Skalarmultiplikation gelten die u ¨blichen Rechenregeln. Sei a die Parallelverschiebung von P nach Q. Die L¨ange des Vektors a, also der Abstand zwischen P und Q wird als Norm (oder Betrag) des Vektors bezeichnet. Wir schreiben daf¨ ur kak. Ein Vektor e mit kek = 1 heißt Einheitsvektor .
A.3 Vektoren im kartesischen Koordinatensystem Wir zeichnen in einem kartesischen Koordinatensystem mit Ursprung O drei Einheitsvektoren e1 , e2 , e3 in Richtung der Koordinatenachsen aus, siehe Abb. A.3. Diese drei Vektoren nennt man die Standardbasis des R3 . Dabei steht e1 f¨ ur jene Parallelverschiebung, die O nach (1, 0, 0) verschiebt, etc. F¨ ur den Vektor a, der O nach A verschiebt, gilt dann a1 a = a1 e1 + a2 e2 + a3 e3 = a2 , a3
A.3 Vektoren im kartesischen Koordinatensystem
285
z a3 A = (a1 , a2 , a3 )
a
e3
a2 e2
e1
y
a1 x Abb. A.3. Darstellung von a in Komponenten.
wobei der Spalte rechts die so genannten Koordinaten von a bez¨ uglich der Standardbasis e1 , e2 , e3 genannt werden. Der Vektor a wird auch Ortsvektor von A genannt. Da wir hier stets mit der Standardbasis arbeiten, identifizieren wir Vektoren mit ihren Koordinaten (Komponenten), also 1 0 0 e1 = 0 , e2 = 1 , e3 = 0 0 0 1 und
a1 0 0 a1 a = a1 e1 + a2 e2 + a3 e3 = 0 + a2 + 0 = a2 . 0 0 a3 a3
Zur Unterscheidung von Punkten und Vektoren schreiben wir die Koordinaten von Punkten als Zeile, die (Koordinaten von) Vektoren hingegen als Spalte. F¨ ur Spaltenvektoren gelten die u ¨blichen Rechenregeln: a1 b1 a1 + b1 a1 λa1 a2 + b2 = a2 + b2 , λ a2 = λa2 . a3 b3 a3 + b3 a3 λa3
Die Addition und die Skalarmultiplikation sind also komponentenweise definiert. 2
y a2 a α a1 x Abb. A.4. Der Vektor a mit seinen Komponenten a1 und a2 .
Die Norm eines Vektors a ∈ R mit Komponenten a1 und a2 berechnet psich nach dem Satz von Pythagoras zu kak = a21 + a22 . Somit haben die Komponenten des Vektors a die Darstellung a1 = kak · cos α
und
a2 = kak · sin α,
286
A Anhang: Vektorrechnung
beziehungsweise cos α a = kak · = L¨ ange · Richtung, sin α siehe Abb. ur die Norm eines Vektors a ∈ R3 die Formel p A.4. Analog gilt f¨ 2 2 2 kak = a1 + a2 + a3 .
Bemerkung A.1 Die Ebene R2 (ebenso wie der Raum R3 ) kommt in zwei Rollen vor: einerseits als Punktraum – seine Objekte sind Punkte ohne Addition; andererseits als Vektorraum – seine Objekte sind Vektoren, die addiert werden k¨onnen. Durch Parallelverschiebung kann der R2 (als Vektorraum) in jedem Punkt des R2 (als Punktraum) angeheftet werden, siehe Abb. A.5. Im Allgemeinen sind Punkt- und Vektorraum aber verschiedene Mengen, wie das folgende Beispiel zeigt. v F
P
P
Abb. A.5. Kraft F, die im Punkt P angreift.
Abb. A.6. Geschwindigkeitsvektor ist tangential an die Kreislinie.
Beispiel A.2 (Teilchen auf Kreislinie) Sei P der Ort eines Teilchens, welches sich auf einer Kreislinie bewegt und v sein Geschwindigkeitsvektor. Dann ist der Punktraum die Kreislinie und der Vektorraum die Tangente im Punkt P an den Kreis, siehe Abb. A.6.
A.4 Das innere Produkt (Skalarprodukt) Der Winkel ∡(a, b) zwischen zwei Vektoren a, b ist eindeutig bestimmt durch 0 ≤ ∡(a, b) ≤ π. Man nennt einen Vektor a orthogonal (senkrecht) zu b (in Zeichen: a ⊥ b), falls ∡(a, b) = π2 . Der Nullvektor 0 ist definitionsgem¨aß zu allen Vektoren orthogonal. Definition A.3 Seien a, b Vektoren aus der Ebene (dem Raum). Die Zahl ( kak · kbk · cos ∡(a, b) a 6= 0, b 6= 0, ha, bi = 0 sonst, heißt inneres Produkt (Skalarprodukt) von a mit b.
A.4 Das innere Produkt (Skalarprodukt)
287
F¨ ur Vektoren a, b ∈ R2 berechnet sich das Skalarprodukt aus den Komponenten zu a1 b ha, bi = , 1 = a1 b1 + a2 b2 . a2 b2 F¨ ur Vektoren a, b ∈ R3 gilt die analoge Formel ha, bi = a1 b1 + a2 b2 + a3 b3 . Beispiel A.4 Die Standardbasisvektoren ei haben die L¨ange 1 und sind paarweise orthogonal zueinander, d.h. ( 1, i = j, hei , ej i = 0, i= 6 j. F¨ ur Vektoren a, b, c und λ ∈ R erf¨ ullt das Skalarprodukt die folgenden Rechenregeln (a) (b) (c) (d) (e)
ha, bi = hb, ai, ha, ai = kak2 , ha, bi = 0 ⇔ a ⊥ b, hλa, bi = ha, λbi = λha, bi, ha + b, ci = ha, ci + hb, ci.
Beispiel A.5 Gegeben seien die Vektoren 2 6 a = −4 , b = 3 , 0 4 Dann ist
kak2 = 4 + 16 = 20,
1 c = 0 . −1
kbk2 = 36 + 9 + 16 = 61,
kck2 = 1 + 1 = 2,
sowie ha, bi = 12 − 12 = 0,
ha, ci = 2.
Somit steht a senkrecht auf b und cos ∡(a, c) =
ha, ci 2 1 =√ √ =√ . kak · kck 20 2 10
Der Winkel zwischen a und c betr¨agt also 1 ∡(a, c) = arccos √ = 1.249 rad. 10
288
A Anhang: Vektorrechnung
A.5 Das ¨ außere Produkt (Kreuzprodukt) F¨ ur Vektoren a, b im R2 definiert man a b a b a × b = 1 × 1 = det 1 1 = a1 b2 − a2 b1 ∈ R, a2 b2 a2 b2 das Kreuzprodukt von a mit b. Eine elementare Rechnung zeigt weiters |a × b| = kak · kbk · sin ∡(a, b). Somit ist |a × b| die Fl¨ ache des von a und b aufgespannten Parallelogramms.
F¨ ur Vektoren a, b ∈ R3 definieren man das Kreuzprodukt als a1 b1 a2 b3 − a3 b2 a × b = a2 × b2 = a3 b1 − a1 b3 ∈ R3 . a3 b3 a1 b2 − a2 b1
Dieses Produkt hat folgende geometrische Interpretation: Falls a = 0 oder b = 0 oder a = λb, ist a × b = 0. Sonst ist a × b derjenige Vektor,
(a) der senkrecht auf a und b steht: ha × b, ai = ha × b, bi = 0 ; (b) der so orientiert ist, dass a, b, a × b ein Rechtssystem bilden; (c) dessen L¨ange gleich dem Fl¨ acheninhalt F des von a und b aufgespannten Parallelogramms ist: F = ka × bk = kak · kbk · sin ∡(a, b). Beispiel A.6 Sei E die von den beiden Vektoren 1 1 a = −1 und b = 0 2 1 aufgespannte Ebene. Dann ist
1 1 −1 a × b = −1 × 0 = 1 2 1 1
ein Normalvektor auf diese Ebene.
F¨ ur a, b, c ∈ R3 und λ ∈ R gelten die folgenden Rechenregeln (a) (b) (c)
a × a = 0, a × b = −(b × a), λ(a × b) = (λa) × b = a × (λb), (a + b) × c = a × c + b × c.
Das Kreuzprodukt ist im Allgemeinen aber nicht assoziativ, somit a × (b × c) 6= (a × b) × c.
Insbesondere gilt f¨ ur die Standardbasisvektoren des R3 e1 × (e1 × e2 ) = e1 × e3 = −e2 , (e1 × e1 ) × e2 = 0 × e2 = 0.
A.6 Geraden in der Ebene
289
A.6 Geraden in der Ebene Die allgemeine Gleichung einer Geraden in der (x, y)-Ebene lautet ax + by = c, wobei a und b nicht gleichzeitig Null sein d¨ urfen. Die Gerade besteht dann aus allen Punkten (x, y), f¨ ur welche obige Gleichung erf¨ ullt ist g = (x, y) ∈ R2 ; ax + by = c . Falls b = 0 (und damit a 6= 0), lautet obige Gleichung x=
c , a
es handelt sich also um eine Parallele zur y-Achse. Falls b 6= 0, kann man nach y aufl¨osen und erh¨alt die gewohnte Form der Geradengleichung a c y = − x + = kx + d b b mit Anstieg k und Achsenabschnitt d. Die vektorielle Darstellung der Geraden (auch Parameterform genannt) bekommt man, indem man die allgemeine L¨osung der linearen Gleichung ax + by = c sucht. Da diese Gleichung unterbestimmt ist, f¨ uhrt man f¨ ur die unabh¨angige Variable einen Parameter ein. Beispiel A.7 Bei der Gleichung y = kx + d ist x die unabh¨angige Variable. Man setzt x = λ, erh¨alt y = kλ + d und somit x 0 1 = +λ , λ ∈ R. y d k Beispiel A.8 Bei der Gleichung x=4 ist y die unabh¨angige Variable (sie kommt gar nicht vor). Die Gerade in vektorieller Darstellung lautet x 4 0 = +λ . y 0 1
290
A Anhang: Vektorrechnung
Allgemein lautet die vektorielle Darstellung der Geraden x p u = +λ , λ∈R y q v (Ortsvektor zu einem Punkt plus Vielfaches eines Richtungsvektors). Die Normalvektoren auf dieser Geraden sind Vielfache von v u v , da , = 0. −u v −u Die Umrechnung in die parameterfreie Form erfolgt durch Multiplikation der Parameterform mit einem Normalvektor, wodurch der Parameter eliminiert wird. Man erh¨alt in obigem Beispiel vx − uy = pv − qu. Insbesondere sieht man, dass die Koeffizienten von x und y in der parameterfreien Form gerade die Komponenten eines Normalvektors auf die Gerade sind.
A.7 Ebenen im Raum Die allgemeine Form einer Ebene im R3 lautet ax + by + cz = d, wobei a, b, c nicht gleichzeitig Null sein d¨ urfen. Die Ebene besteht aus allen Punkten, welche diese Gleichung erf¨ ullen E = (x, y, z) ∈ R3 ; ax + by + cz = d .
Da nicht alle Koeffizienten gleichzeitig Null sind, kann man die Gleichung nach einer Unbekannten aufl¨ osen, beispielsweise bei c 6= 0 nach z a b d z = − x − y + = kx + ly + e. c c c
Hierbei bedeuten k die Steigung in x-Richtung; l die Steigung in y-Richtung; e der Achsenabschnitt auf der z-Achse (denn f¨ ur x = y = 0 ist z = e). Durch Einf¨ uhrung von Parametern f¨ ur die unabh¨angigen Variablen x und y x = λ,
y = µ,
z = kλ + lµ + e
gewinnt man daraus die vektorielle Form (Parameterform) der Ebene: 0 1 0 x y = 0 + λ 0 + µ 1 , λ, µ ∈ R. l k e z
A.8 Geraden im Raum
291
Allgemein lautet die Parameterform einer Ebene im R3 w1 v1 p x y = q + λ v2 + µ w2 w3 v3 r z
mit v × w 6= 0. Multipliziert man diese Gleichung mit v × w, so erh¨alt man wegen hv, v × wi = hw, v × wi = 0 wieder die parameterfreie Form + + *p *x y , v × w = q , v × w . r z
Beispiel A.9 Man berechne die parameterfreie Form der Ebene 1 1 3 x y = 1 + λ −1 + µ 0 . 1 2 1 z
Ein Normalvektor auf die Ebene lautet −1 1 1 v × w = −1 × 0 = 1 , 1 1 2
und damit die Ebenengleichung
−x + y + z = −1.
A.8 Geraden im Raum Eine Gerade im R3 kann man als Schnitt von zwei Ebenen auffassen: ax + by + cz = d, g: ex + f y + gz = h. In diesem Fall ist die Gerade die Menge aller Punkte (x, y, z), welche dieses Gleichungssystem (2 Gleichungen in 3 Unbekannten) erf¨ ullt. Generisch ist die L¨ osung einparametrig (d.h. eine Gerade), es k¨ onnen aber Sonderf¨alle auftreten (z.B. Ebenen schneiden sich nicht, sondern sind parallel). Eine andere M¨oglichkeit ist die vektorielle Darstellung der Geraden als Ortsvektor eines Punkts und Vielfaches eines Richtungsvektors u p x y = q + λ v , λ ∈ R. w r z
Der Richtungsvektor ergibt sich als Differenz von zwei Punkten auf der Geraden.
292
A Anhang: Vektorrechnung
Beispiel A.10 Wir suchen die Gerade durch die Punkte P = (1, 2, 0) und Q = (3, 1, 2). Ein Richtungsvektor a der Geraden ist gegeben durch 3 1 2 a = 1 − 2 = −1 . 2 0 2 Somit lautet die Gerade in Parameterform x 2 1 g : y = 2 + λ −1 , z 2 0
λ ∈ R.
Die Umrechnung von Parameterform in parameterfreie Form und umgekehrt geschieht durch Elimination beziehungsweise Einf¨ uhren des Parameters λ. In obigem Beispiel berechnet man aus der letzten Gleichung z = 2λ. Dies in die ersten beiden Gleichungen eingesetzt ergibt die parameterfreie Form x − z = 1,
2y + z = 4.
B Anhang: Matrizen
Wir verwenden die Matrizenrechnung in der Differential- und Integralrechnung in mehreren Variablen, bei Differentialgleichungssystemen und der linearen Regression. Dieser Anhang fasst die ben¨ otigten Grundbegriffe kurz zusammen. F¨ ur eine ausf¨ uhrlichere Darstellung verweisen wir etwa auf [2, Kap. 6].
B.1 Matrizenrechnung Eine (m × n)-Matrix A ist ein rechteckiges Zahlenschema der Form a11 a12 . . . a1n a21 a22 . . . a2n A= . .. .. . .. . . am1 am2 . . . amn
Die Eintr¨ age (Komponenten, Elemente) aij , i = 1, . . . , m, j = 1, . . . , n der Matrix A sind reelle oder komplexe Zahlen, wobei wir uns in diesem Abschnitt auf reelle Zahlen beschr¨anken. Eine (m × n)-Matrix hat somit m Zeilen und n Spalten; im Falle m = n spricht man von quadratischen Matrizen. Vektoren der L¨ange m kann man als einspaltige Matrizen, also als (m × 1)-Matrizen auffassen. Insbesondere bezeichnet man die Spalten a1j a2j aj = . , j = 1, . . . , n .. amj
einer Matrix A als Spaltenvektoren und schreibt f¨ ur die Matrix auch . . . A = [a1 .. a2 .. . . . .. an ].
294
B Anhang: Matrizen
In Analogie dazu werden die Zeilen der Matrix gelegentlich als Zeilenvektoren bezeichnet. Das Produkt einer (m × n)-Matrix A mit einem Vektor x der L¨ange n ist definiert als a11 x1 + a12 x2 + . . . + a1n xn y1 y2 a21 x1 + a22 x2 + . . . + a2n xn y = Ax, . = , .. .. . ym
am1 x1 + am2 x2 + . . . + amn xn
also als ein Vektor y der L¨ ange m. Der k-te Eintrag von y ergibt sich, indem das innere Produkt des k-ten Zeilenvektors der Matrix A mit dem Spaltenvektor x gebildet wird. Beispiel B.1 Ein Beispiel des Produkts einer (2 × 3)-Matrix mit einem Vektor der L¨ange 3 ist etwa: 3 3a − b + 2c a b c A= , x = −1 , Ax = 3d − e + 2f d e f 2
Die Zuordnung x 7→ y = Ax ergibt eine lineare Abbildung des Rn in den Rm . Die Linearit¨at bedeutet die G¨ ultigkeit der Beziehungen A(u + v) = Au + Av,
A(λu) = λAu
f¨ ur u, v ∈ Rn , λ ∈ R, welche unmittelbar aus der Definition folgt. Ist ej der j-te Standardbasisvektor des Rn , so gilt offenbar aj = Aej , das heißt, die Spalten der Matrix A sind gerade die Bilder der Standardbasisvektoren unter der durch A definierten linearen Abbildung. Matrizenarithmetik. Matrizen derselben Dimension k¨onnen addiert und subtrahiert werden, indem ihre Komponenten addiert oder subtrahiert werden. Die Multiplikation mit einer Zahl λ ∈ R ist ebenfalls komponentenweise definiert. Die Transponierte AT einer Matrix A erh¨alt man durch Tausch der Zeilen mit den Spalten, das heißt, die i-te Zeile der Matrix AT besteht aus den Elementen der i-ten Spalte von A: a11 a21 . . . am1 a11 a12 . . . a1n a12 a22 . . . am2 a21 a22 . . . a2n , AT = . . A= . .. , . . .. .. .. .. .. . am1 am2 . . . amn
a1n a2n . . . amn
Aus einer (m × n)-Matrix wird durch Transposition eine (n × m)-Matrix. Insbesondere entsteht durch Transposition eines Spaltenvektors ein Zeilenvektor und umgekehrt.
B.1 Matrizenrechnung
295
Beispiel B.2 F¨ ur die Matrix A und den Vektor x aus Beispiel B.1 gilt: a d AT = b e , xT = 3 −1 2 , x = [3 −1 2]T . c f
Sind a, b Vektoren der L¨ ange n, so kann man aT als (1 × n)-Matrix auffassen. Deren Produkt mit dem Vektor b ist wie oben definiert und stimmt offenbar mit dem inneren Produkt u ¨berein: aT b =
n X i=1
ai bi = ha, bi.
Allgemeiner kann das Matrixprodukt einer (m × n)-Matrix A mit einer (n × l)Matrix B definiert werden, indem man die inneren Produkte der Zeilenvektoren von A mit den Spaltenvektoren von B bildet. Das heißt, das Element cij in der i-ten Zeile und j-ten Spalte von C = AB erh¨alt man durch innerliche Multiplikation der i-ten Zeile von A mit der j-ten Spalte von B: cij =
n X
aik bkj .
k=1
Das Ergebnis ist eine (m × l)-Matrix. Das Produkt ist nur definiert, wenn die Dimensionen zusammenpassen, wenn also die Spaltenzahl n von A mit der Zeilenzahl von B u ¨bereinstimmt. Das Matrixprodukt entspricht der Hintereinanderausf¨ uhrung bei linearen Abbildungen. Ist B die Matrix einer linearen Abbildung Rl → Rn und A diejenige einer linearen Abbildung Rn → Rm , so ist AB gerade die Matrix der Hintereinanderausf¨ uhrung der beiden Abbildungen Rl → Rn → Rm . In Bezug auf die Transposition gilt die Formel (AB)T = BT AT , wie aus den Definitionen leicht nachgerechnet werden kann. Quadratische Matrizen. Die Eintr¨ age a11 , a22 , . . . , ann einer (n×n)-Matrix A nennt man die Diagonalelemente. Eine quadratische Matrix D wird als Diagonalmatrix bezeichnet, wenn ihre Eintr¨ age außer den Diagonalelementen alle Null sind. Spezielle Beispiele sind die Null- und die Einheitsmatrix der Dimension n × n: 0 0 ... 0 1 0 ... 0 0 0 . . . 0 0 1 . . . 0 O = . . . , I = . . . . . . . .. . . ... .. .. .. .. 0 0
...
0
0 0
...
1
Die Einheitsmatrix ist offenbar das Einselement bez¨ uglich der Matrixmultiplikation; es ist IA = AI = A f¨ ur alle (n × n)-Matrizen A. Falls es zu einer Matrix A eine Matrix B gibt mit der Eigenschaft
296
B Anhang: Matrizen
BA = AB = I, so nennt man A invertierbar oder regul¨ ar und B die Inverse zu A, Notation B = A−1 . Ist x ∈ Rn , A invertierbar und y = Ax, so folgt x = A−1 y. Es ist also stets A−1 Ax = x und ebenso AA−1 y = y. Dies zeigt, dass die zur Matrix A geh¨orende lineare Abbildung Rn → Rn bijektiv ist und A−1 ihre Umkehrabbildung darstellt. Die Bijektivit¨ at kann noch einmal anders ausgedr¨ uckt werden. Sie bedeutet, dass es zu jedem y ∈ Rn genau ein x ∈ Rn gibt mit
Ax = y,
oder
a11 x1 + a12 x2 + . . . + a1n xn = y1 a21 x1 + a22 x2 + . . . + a2n xn = y2 .. .. .. .. . . . . am1 x1 + am2 x2 + . . . + amn xn = yn .
Letzteres kann aber als lineares Gleichungssystem mit rechter Seite y und L¨osung x = [x1 x2 . . . xn ]T aufgefasst werden. Mit anderen Worten, die Invertierbarkeit einer Matrix A ist ¨ aquivalent mit der Bijektivit¨at der zugeh¨origen linearen Abbildung und ¨ aquivalent mit der eindeutigen L¨osbarkeit des zugeh¨origen linearen Gleichungssystems (f¨ ur beliebige rechte Seiten). Wir wollen die Frage der Invertierbarkeit nun speziell f¨ ur (2 × 2)-Matrizen untersuchen. Wir nehmen eine (2 × 2)-Matrix A mit zugeh¨origem Gleichungssystem: .. a11 a12 a11 x1 + a12 x2 = y1 A = [a1 . a2 ] = , a21 a22 a21 x1 + a22 x2 = y2 . Eine wichtige Rolle spielt die Determinante der Matrix A. Im (2 × 2)-Fall ist diese definiert als das ¨ außere Produkt der Spaltenvektoren: det A = a1 × a2 = a11 a22 − a21 a12 . Da a1 × a2 = ka1 kka2 k sin ∡(a1 , a2 ) ist, sind die Spaltenvektoren a1 , a2 genau dann linear abh¨ angig (also – im R2 – Vielfache voneinander), wenn det A = 0 ist. Der folgende Satz beschreibt die Zusammenh¨ange im (2×2)-Fall vollst¨andig. Satz B.3 F¨ ur (2 × 2)-Matrizen A sind die folgenden Aussagen ¨aquivalent: (a) A ist invertierbar. (b) Die durch A definierte lineare Abbildung R2 → R2 ist bijektiv. (c) Das lineare Gleichungssystem Ax = y besitzt zu beliebiger rechter Seite y ∈ R2 eine eindeutige L¨ osung x ∈ R2 . (d) Die Spaltenvektoren von A sind linear unabh¨angig.
B.2 Kanonische Form von Matrizen
297
(e) Die durch A definierte lineare Abbildung R2 → R2 ist injektiv. (f) Das lineare Gleichungssystem Ax = 0 besitzt nur die Nulll¨osung x = 0. (g) det A 6= 0.
¨ Beweis: Die Aquivalenz der Aussagen (a), (b) und (c) wurde schon weiter ¨ oben festgestellt. Die Aquivalenz von (d), (e) und (f) ist leicht durch Verneinung einzusehen. Sind n¨ amlich die Spaltenvektoren linear abh¨angig, so ist etwa a1 = ca2 f¨ ur ein c ∈ R. Dann wird aber der Vektor x = [1 − c]T , der offenbar verschieden von 0 ist, durch A auf 0 abgebildet, und x ist L¨osung der Gleichung Ax = 0. Ist umgekehrt x = [x1 x2 ]T 6= 0 L¨osung der Gleichung Ax = 0, so bedeutet dies x1 a1 + x2 a2 = 0, das heißt, a1 und a2 sind linear abh¨angig. Somit sind (d), (e) und (f) ¨ aquivalent. Im n¨achsten Schritt u ¨berlegen wir uns, dass (g) aus (d) folgt. Dies ist aber nach der oben angesprochenen geometrischen Deutung der Determinante klar. Dass (a) aus (g) folgt, ergibt sich aus der Tatsache, dass im Falle einer nichtverschwindenden Determinante 1 a22 −a12 −1 A = a11 a22 − a21 a12 −a21 a11 eine Inverse zu A ist, wie direktes Nachrechnen sofort zeigt. Schließlich folgt (e) offenbar aus (b), womit sich der Kreis schließt und alle Aussagen (a)–(g) als ¨aquivalent erkannt sind. ⊓ ⊔
Satz B.3 gilt f¨ ur Matrizen beliebiger Dimension n × n. Der Beweis im Falle n = 3 kann noch geometrisch erfolgen, wobei das ¨außere Produkt durch das Spatprodukt ha1 × a2 , a3 i der drei Spaltenvektoren zu ersetzen ist, welches dann auch die Determinante der (3 × 3)-Matrix A definiert. In h¨oheren Dimensionen verlangt der Beweis Hilfsmittel aus der Kombinatorik, f¨ ur welche wir auf die in der Einleitung erw¨ahnte Literatur verweisen.
B.2 Kanonische Form von Matrizen In diesem Anhangsabschnitt soll gezeigt werden, dass jede (2 × 2)-Matrix A zu einer Matrix B aus einem von drei Standardtypen ¨ahnlich ist, das heißt, durch eine Basistransformation in eine solche u uhrt werden kann. Wir ¨bergef¨ ben¨otigen diese Tatsache vor allem im Abschnitt 20.1 bei der Klassifikation und L¨osung von Differentialgleichungssystemen. Es ist dies ein Spezialfall der f¨ ur (n × n)-Matrizen g¨ ultigen Jordan’schen1 Normalform.
Ist T eine invertierbare (2 × 2)-Matrix, so bilden die Spalten t1 , t2 eine Basis des R2 . Das heißt, jedes Element x ∈ R2 l¨asst sich in eindeutiger Weise als Linearkombination c1 t1 + c2 t2 schreiben; die Koeffizienten c1 , c2 ∈ R sind die Koordinaten von x bez¨ uglich t1 und t2 . Man kann T als Transformation des R2 auffassen, welche die Standardbasis {[1 0]T , [0 1]T } in die Basis {t1 , t2 } u uhrt. ¨berf¨ 1
C. Jordan, 1838–1922.
298
B Anhang: Matrizen
Definition B.4 Zwei Matrizen A, B heißen ¨ ahnlich, wenn es eine invertierbare Matrix T gibt, sodass T−1 AT = B ist. ¨ Die drei Standardtypen, die die Ahnlichkeitsklassen von (2 × 2)-Matrizen definieren werden, sind von der folgenden Form: Typ I λ1 0 0 λ2
Typ II λ 1 0 λ
Typ III µ −ν ν µ
Dabei sind die Koeffizienten λ1 , λ2 , λ, µ, ν reelle Zahlen. Wir ben¨otigen den Begriff des Eigenwertes und Eigenvektors. Besitzt die Gleichung Av = λv zu einem λ ∈ R eine L¨osung v 6= 0 ∈ R2 , also eine vom Nullvektor 0 verschiedene L¨osung, so heißt λ Eigenwert und v Eigenvektor. Bezeichnet I die Einheitsmatrix, so ist v L¨osung der Gleichung (A − λI)v = 0. F¨ ur die Existenz einer vom Nullvektor verschiedenen L¨osung ist notwendig und hinreichend, dass die Matrix A − λI nicht invertierbar ist, also dass det(A − λI) = 0 ist. Schreiben wir A=
a b , c d
so muss λ eine L¨osung der charakteristischen Gleichung a−λ b det = λ2 − (a + d)λ + ad − bc = 0 c d−λ sein. Besitzt die charakteristische Gleichung eine reelle L¨osung λ, so ist das Gleichungssystem (A − λI)v = 0 unterbestimmt und hat daher eine vom Nullvektor verschiedene L¨osung v = [v1 v2 ]T . Man erh¨alt daher die zu λ geh¨orenden Eigenvektoren durch L¨osen des Gleichungssystems (a − λ) v1 + b v2 = 0
c v1 + (d − λ) v2 = 0.
¨ Die Ahnlichkeitsklasse der Matrix A ergibt sich nun daraus, ob die charakteristische Gleichung zwei reelle, eine doppelte reelle oder zwei konjugiert komplexe L¨osungen besitzt. Satz B.5 Jede (2 × 2)-Matrix A ist zu einer Matrix des Typs I, II oder III ¨ahnlich.
B.2 Kanonische Form von Matrizen
299
Beweis: (1) Erster Fall, zwei verschiedene reelle Eigenwerte λ1 6= λ2 . Bezeichnen wir mit v11 v v1 = , v2 = 12 v21 v22 zugeh¨orige Eigenvektoren, so sind diese linear unabh¨angig und bilden damit eine Basis des R2 . Andernfalls w¨ aren sie Vielfache voneinander, also etwa cv1 = v2 f¨ ur ein c ∈ R; Anwendung von A erg¨ abe cλ1 v1 = λ2 v2 = λ2 cv1 und damit λ1 = λ2 im Gegensatz zur Voraussetzung. Nach Satz B.3 ist die Matrix . v v T = [v1 .. v2 ] = 11 12 v21 v22 invertierbar. Es gilt die Beziehung −1
T
λ1 0 AT = Λ = , 0 λ2
das heißt, A ist einer Matrix vom Typ I, einer Diagonalmatrix a¨hnlich. Die Beziehung oben ergibt sich leicht aus der Tatsache, dass Av1 = λ1 v1 ,
Av2 = λ2 v2
ist, und der Rechnung . . T−1 AT = T−1 A [v1 .. v2 ] = T−1 [λ1 v1 .. λ2 v2 ] 1 v22 −v12 λ1 v11 λ2 v12 λ 0 = 1 . = λ1 v21 λ2 v22 0 λ2 v11 v22 − v21 v12 −v21 v11 (2) Zweiter Fall, doppelter reeller Eigenwert λ = λ1 = λ2 . Da die L¨osung der charakteristischen Gleichung p 1 λ= a + d ± (a − d)2 + 4bc 2 ist, liegt dieser Fall vor, wenn gilt
(a − d)2 = −4bc,
λ=
1 (a + d) . 2
Ist b = 0 und c = 0, so folgt a = d und A ist bereits eine Diagonalmatrix der Form a 0 A= , 0 a also schon vom Typ I. Ist b 6= 0, so ist " # " # 1 a−λ b b 2 (a − d) A − λI = = 1 c d−λ (a − d)2 − 12 (a − d) − 4b
300
B Anhang: Matrizen
und es gilt jedenfalls (A − λI)2 = O, also " #" 1 1 b 2 (a − d) 2 (a − d) 1 − 4b (a − d)2 − 12 (a − d)
b
#
1 − 4b (a − d)2 − 12 (a − d)
=
# " 0 0 0 0
,
wie man leicht nachrechnet. Man bezeichnet dann A−λI als nilpotente Matrix. Ebenso ist auf Grund einer a¨hnlichen Rechnung (A − λI)2 = O, wenn c 6= 0 ist. Wir w¨ahlen nun einen Vektor v2 ∈ R2 , f¨ ur den (A − λI)v2 6= 0 ist. Dann ¨ gilt wegen obiger Uberlegungen: (A − λI)2 v2 = 0. Setzen wir v1 = (A − λI)v2 , so gilt offensichtlich Av1 = λv1 ,
Av2 = v1 + λv2 ,
und v1 und v2 sind linear unabh¨angig (w¨are n¨amlich v1 ein Vielfaches von v2 , so w¨are Av2 = λv2 im Widerspruch zur Konstruktion von v2 ). Wir setzen . T = [v1 .. v2 ]. Es folgt dann wie im ersten Fall: . T−1 AT = T−1 [λv1 .. v1 + λv2 ] 1 v22 −v12 λv11 v11 + λv12 λ 1 = . = 0 λ λv21 v21 + λv22 v11 v22 − v21 v12 −v21 v11
Folglich ist A zu einer Matrix vom Typ II a¨hnlich.
(3) Dritter Fall, konjugiert komplexe L¨osungen λ1 = µ+iν, λ2 = µ−iν. Dieser Fall tritt auf, wenn die Diskriminate (a − d)2 + 4bc < 0 ist. Der eleganteste Weg, diesen Fall zu behandeln, ist einfach im komplexen Vektorraum C2 zu rechnen. Wir bestimmen komplexe Vektoren v1 , v2 ∈ C2 so, dass Av1 = λ1 v1 ,
Av2 = λ2 v2
ist. Wir schreiben v1 = f + ig mittels Real- und Imagin¨arteilvektoren aus R2 . Da λ1 = µ + iν, λ2 = µ − iν ist, folgt durch Nachrechnen v2 = f − ig. Da {v1 , v2 } eine Basis des C2 bildet, ist {g, f } eine Basis des R2 . Ferner ist A(f + ig) = (µ + iν)(f + ig) = µf − νg + i(νf + µg),
B.2 Kanonische Form von Matrizen
somit Ag = νf + µg, Setzen wir wieder
Af = µf − νg.
. g f T = [g .. f ] = 1 1 g2 f2
so folgt . T−1 AT = T−1 [νf + µg .. µf − νg] 1 f2 −f1 νf1 + µg1 µf1 − νg1 µ −ν = = . ν µ νf2 + µg2 µf2 − νg2 g1 f2 − g2 f1 −g2 g1
Somit ist A zu einer Matrix vom Typ III ¨ahnlich.
301
C Anhang: Erg¨ anzungen zur Stetigkeit
Dieser Anhang umfasst einige Erg¨ anzungen, die nicht unbedingt zum Grundlehrstoff geh¨ oren, aber als beweistechnische Hilfsmittel in einigen Abschnitten (wie etwa Kurven und Differentialgleichungen) ben¨ otigt werden. Dazu geh¨ oren Aussagen u ¨ber die Stetigkeit der Umkehrfunktion, das Konzept der gleichm¨ aßigen Konvergenz von Funktionenfolgen, die Herleitung der Potenzreihe der Exponentialfunktion und die Begriffe der gleichm¨ aßigen Stetigkeit und der Lipschitz-Stetigkeit.
C.1 Stetigkeit der Umkehrfunktion Wir betrachten eine Funktion f von einem Intervall I ⊂ R nach R. Das Intervall I kann offen, halboffen oder abgeschlossen sein. Es bezeichne J = f (I) den echten Bildbereich von f . Wir zeigen zun¨achst, dass eine stetige Funktion f : I → J genau dann bijektiv ist, wenn sie streng monoton w¨achst oder f¨allt. Anschließend zeigen wir, dass mit f auch die Umkehrfunktion stetig ist und untersuchen die Struktur des Bildbereichs. Die das Steigungsverhalten einer Funktion beschreibenden Begriffe wurden in Def. 8.5 eingef¨ uhrt. Satz C.1 Eine reellwertige, stetige Funktion f : I → J = f (I) ist genau dann bijektiv, wenn sie streng monoton wachsend oder streng monoton fallend ist. Beweis: Wir wissen bereits, dass die Funktion f : I → f (I) surjektiv ist. Sie ist injektiv genau dann, wenn gilt x1 6= x2
⇒
f (x1 ) 6= f (x2 ).
Die strenge Monotonie impliziert daher die Injektivit¨at. Ist umgekehrt f injektiv, so w¨ahlen wir zun¨achst zwei Punkte x1 < x2 ∈ I. Sei nun zum Beispiel f (x1 ) < f (x2 ). Wir werden zeigen, dass f auf dem ganzen Intervall I streng monoton wachsend ist. Zun¨achst halten wir fest, dass f¨ ur jedes x3 ∈ (x1 , x2 ) auch f (x1 ) < f (x3 ) < f (x2 ) gelten muss. W¨are etwa f (x3 ) > f (x2 ), so
304
C Anhang: Erg¨ anzungen zur Stetigkeit
w¨ urde jeder Zwischenpunkt f (x2 ) < η < f (x3 ) wegen Satz 6.14 einmal als Funktionswert eines ξ1 ∈ (x1 , x3 ) und zweites Mal als Funktionswert eines ξ2 ∈ (x3 , x2 ) auftreten, der Injektivit¨ at widersprechend.
W¨ahlt man nun ein x4 ∈ I rechts von x2 , also x2 < x4 , so muss wiederum f (x2 ) < f (x4 ) sein. Andernfalls l¨ age wieder die Situation dreier Punkte x1 < x2 < x4 mit f (x2 ) > f (x4 ) vor; diese M¨ oglichkeit w¨are wie im vorigen Fall der drei Punkte x1 < x3 < x2 auszuscheiden. Schließlich wird der Bereich links von x1 einer ¨ ahnlichen Betrachtung unterzogen. Es folgt, dass f auf dem ganzen Intervall I streng monoton wachsend ist. ¨ H¨atte f¨ ur die Startpunkte der Uberlegung f (x1 ) > f (x2 ) gegolten, so k¨onnte man entsprechend herleiten, dass f auf dem ganzen Intervall I monoton fallend ist. ⊓ ⊔
Die Funktion y = x · 11(−1,0] (x) + (1 − x) · 11(0,1) (x), wobei 11I die Indikatorfunktion der Intervalls I bezeichnet (siehe Abschnitt 2.2), zeigt, dass unstetige Funktionen auf Intervallen bijektiv sein k¨ onnen, ohne streng monoton wachsend oder fallend zu sein.
Bemerkung C.2 Ist eine stetige Funktion f : I → J bijektiv und I ein offenes Intervall, so ist auch J ein offenes Intervall. In der Tat, w¨are etwa J von der Form [a, b), so w¨ urde a als Funktionswert eines x1 ∈ I auftreten, also a = f (x1 ) sein. Da aber I offen ist, gibt es Punkte x2 ∈ I, x2 < x1 und x3 ∈ I, x3 > x1 . Falls f streng monoton steigend ist, w¨are f (x2 ) < f (x1 ) = a, falls f streng monoton fallend ist, w¨ are f (x3 ) < f (x1 ) = a, beides im Widerspruch zur Annahme, dass das echte Bild J den Punkt a als unteren Randpunkt besitzt. Ebenso schließt man die anderen M¨ oglichkeiten (J = (a, b], J = [a, b]) aus. Satz C.3 Sei I ⊂ R ein offenes Intervall und f : I → J stetig und bijektiv. Dann ist auch die Umkehrfunktion f −1 : J → I stetig.
Beweis: Wir nehmen x ∈ I, y ∈ J mit y = f (x), x = f −1 (y). F¨ ur kleine ε > 0 ist die ε-Umgebung Uε (x) von x ganz in I enthalten. Nach Bemerkung C.2 ist f (Uε (x)) ein offenes Intervall, enth¨ alt also jedenfalls eine δ-Umgebung Uδ (y) von y, f¨ ur ein gewisses δ > 0. Nehmen wir nun eine Folge von Werten yn ∈ J, die f¨ ur n → ∞ gegen y konvergieren. Dann gibt es ein n(δ) ∈ N, sodass alle Folgenglieder yn mit Index n ≥ n(δ) in der δ-Umgebung Uδ (y) liegen. Das heißt aber, dass die Funktionswerte f −1 (yn ) ab Index n(δ) in der ε-Umgebung Uε (x) von x = f −1 (y) liegen. Somit ist gezeigt, dass limn→∞ f −1 (yn ) = f −1 (y) ist; das ist die Stetigkeit von f −1 in y. ⊓ ⊔
C.2 Grenzfunktionen von Funktionenfolgen Wir betrachten eine Folge von Funktionen fn : I → R, definiert auf einem Intervall I ⊂ R. Falls die Funktionswerte fn (x) f¨ ur jedes feste x ∈ I konvergieren, so heißt die Funktionenfolge punktweise konvergent. Die punktweisen
C.2 Grenzfunktionen von Funktionenfolgen
305
Grenzwerte definieren eine Funktion f : I → R durch f (x) = limn→∞ fn (x), die so genannte Grenzfunktion. Beispiel C.4 Es sei I = [0, 1] und fn (x) = xn . Dann ist limn→∞ fn (x) = 0, sofern 0 ≤ x < 1 ist und limn→∞ fn (1) = 1. Die Grenzfunktion ist demnach die Funktion 0, 0 ≤ x < 1, f (x) = 1, x = 1. Dies zeigt, dass die Grenzfunktion einer punktweise konvergenten Folge stetiger Funktionen nicht notwendigerweise stetig ist.
Definition C.5 (Gleichm¨ aßige Konvergenz von Funktionenfolgen) Eine auf einem Intervall I definierte Funktionenfolge (fn )n≥1 heißt gleichm¨ aßig konvergent mit Grenzfunktion f , falls gilt: ∀ε > 0 ∃n(ε) ∈ N ∀n ≥ n(ε) ∀x ∈ I : |f (x) − fn (x)| < ε. Gleichm¨aßige Konvergenz liegt also vor, wenn der Index n(ε), ab dem die Folge (fn (x))n≥1 der Funktionswerte in der ε-Umgebung Uε (f (x)) sesshaft wird, f¨ ur alle x ∈ I gleich gew¨ ahlt werden kann. Satz C.6 Die Grenzfunktion f einer auf einem Intervall I gleichm¨aßig konvergenten Funktionenfolge (fn )n≥1 ist stetig. Beweis: Wir nehmen ein x ∈ I und eine Folge von Punkten xk , die f¨ ur k → ∞ gegen x konvergiert. Wir haben zu zeigen, dass f (x) = limk→∞ f (xk ) ist. Wir schreiben f (x) − f (xk ) = f (x) − fn (x) + fn (x) − fn (xk ) + fn (xk ) − f (xk )
und w¨ahlen ε > 0. Wegen der gleichm¨ aßigen Konvergenz ist es m¨oglich, ein n ∈ N zu finden, sodass |f (x) − fn (x)| <
ε 3
und |fn (xk ) − f (xk )| <
ε 3
f¨ ur alle k ∈ N gilt. Da fn stetig ist, gibt es ein k(ε) ∈ N, sodass f¨ ur all k ≥ k(ε) |fn (x) − fn (xk )| <
ε 3
erf¨ ullt ist. F¨ ur diese Indizes k gilt dann |f (x) − f (xk )| <
ε ε ε + + = ε. 3 3 3
Somit konvergiert f (xk ) gegen f (x), woraus die Stetigkeit von f folgt.
⊓ ⊔
Anwendung C.7 Die Exponentialfunktion f (x) = ax ist auf R stetig. In Anwendung 5.14 wurde gezeigt, dass die Exponentialfunktion zur Basis a > 0 f¨ ur jedes x ∈ R durch Grenz¨ ubergang definiert werden kann. Es bezeichne
306
C Anhang: Erg¨ anzungen zur Stetigkeit
dazu rn (x) die an der n-ten Dezimalstelle abgebrochene Dezimaldarstellung von x. Dann gilt offenbar rn (x) ≤ x < rn (x) + 10−n . Der Wert von rn (x) ist derselbe f¨ ur alle reellen Zahlen x, die bis zur n-ten Nachkommastelle u ¨bereinstimmen. Daher ist die Zuordnung x 7→ rn (x) eine Stufenfunktion mit Spr¨ ungen in Abst¨ anden von 10−n . Wir definieren die Funktion fn (x), indem wir zwischen den Punkten rn (x), arn (x)
und
rn (x) + 10−n , arn (x)+10
linear interpolieren, das heißt, fn (x) = arn (x) +
−n
x − rn (x) rn (x)+10−n rn (x) a − a . 10−n
Die Funktion fn (x) ist ein Streckenzug (mit Knickpunkten in Abst¨anden von 10−n ) und daher stetig. Wir zeigen, dass die Funktionenfolge (fn )n≥1 auf jedem Intervall [−T, T ], 0 < T ∈ Q, gleichm¨aßig gegen f konvergiert. Da x − rn (x) ≤ 10−n ist, folgt −n |f (x) − fn (x)| ≤ ax − arn (x) + arn (x)+10 − arn (x) .
Nun ist f¨ ur x ∈ [−T, T ]
und ebenso
−n ax − arn (x) = arn (x) ax−rn (x) − 1 ≤ aT a10 − 1 arn (x)+10
−n
− arn (x) ≤ aT a10
Somit folgt |f (x) − fn (x)| ≤ 2aT
−n
−1 .
√ a−1 ,
10n
und letzterer Ausdruck konvergiert unabh¨angig von x gegen Null, wie in Anwendung 5.15 bewiesen wurde. Die Rechenregeln f¨ ur reelle Hochzahlen k¨onnen nunmehr ebenfalls durch Grenz¨ ubergang hergeleitet werden. Sind zum Beispiel r, s ∈ R mit Dezimalapproximationen (rn )n≥1 , (sn )n≥1 , so ergibt Satz 5.7 und die Stetigkeit der Exponentialfunktion: ar as = lim (arn asn ) = lim arn +sn = ar+s . n→∞
n→∞
Gemeinsam mit Satz C.3 ergibt sich auch die Stetigkeit des Logarithmus.
C.3 Die Exponentialreihe
307
C.3 Die Exponentialreihe Ziel dieses Abschnitts ist es, die Reihendarstellung der Exponentialfunktion ex =
∞ X xm m! m=0
herzuleiten, und zwar ausschließlich mit Mitteln der Theorie der konvergenten Reihen ohne Vorgriff auf die Differentialrechnung. Dies ist f¨ ur unsere Darstellung deshalb wichtig, weil die Differenzierbarkeit der Exponentialfunktion im Abschnitt 7.2 mit Hilfe der Reihendarstellung bewiesen wird. Als Hilfsmittel ben¨otigen wir zwei Erg¨anzungen zur Theorie der Reihen: die absolute Konvergenz und die Cauchy’sche Formel f¨ ur das Produkt zweier Reihen. P∞ Definition C.8 Eine Reihe k=0 ak heißt absolut konvergent, wenn die ReiP∞ he k=0 |ak | der Absolutbetr¨age ihrer Glieder konvergiert. Satz C.9 Jede absolut konvergente Reihe ist konvergent.
Beweis: Wir definieren den positiven bzw. negativen Anteil des Koeffizienten ak durch ak , ak ≥ 0, 0, ak ≥ 0, − a+ = a = k k 0, ak < 0; |ak |, ak < 0. Offenbar gilt 0P≤ a+ und 0 ≤ a− k ≤ |ak |P k ≤ |ak |, daher konvergieren die ∞ ∞ + beiden Reihen k=0 ak und k=0 a− k auf Grund des Majorantenkriteriums (Satz 5.21). Es folgt die Existenz des Grenzwerts lim
n→∞
n X
k=0
ak = lim
n→∞
n X
k=0
a+ k − lim
n→∞
und das bedeutet die Konvergenz der Reihe
P∞
k=0
n X
a− k
k=0
ak .
P∞
P∞
⊓ ⊔
Wir betrachten nun zwei absolut konvergente Reihen i=0 ai und j=0 bj und wollen u ¨berlegen, wie ihr Produkt berechnet werden kann. Gliedweises Ausmultiplizieren der n-ten Partialsummen legt nahe, folgendes Schema zu betrachten: a0 b0 a0 b1 ... a0 bn−1 a0 bn a1 b0 a1 b1 ... a1 bn−1 a1 bn . .. ... .. . an−1 b0 an−1 b1 an b0 an b1
... ...
an−1 bn−1 an−1 bn an bn−1 an bn
Summiert man u ¨ber s¨amtliche Eintr¨age des quadratischen Schemas, so erh¨alt man das Produkt der Partialsummen
308
C Anhang: Erg¨ anzungen zur Stetigkeit
Pn =
n X
ai
n X
bj .
j=0
i=0
Summiert man dagegen nur u ¨ber das obere Dreieck der fettgedruckten Eintr¨age (sukzessive den Diagonalen nach), so erh¨alt man die so genannte Cauchy’sche Produktformel ! n m X X Sn = ak bm−k . m=0
k=0
Wir wollen nun zeigen, dass f¨ ur absolut konvergente Reihen im Grenzwert gilt: lim Pn = lim Sn . n→∞ n→∞ P∞ P∞ Satz C.10 (Cauchyprodukt) Falls die Reihen i=0 ai und j=0 bj absolut konvergieren, so gilt ! ∞ ∞ ∞ m X X X X ai bj = ak bm−k , i=0
m=0
j=0
k=0
wobei auch die durch die Cauchy’sche Produktformel definierte Reihe absolut konvergiert. Beweis: Wir setzen cm =
m X
ak bm−k
k=0
und erhalten, dass die Partialsummen Tn =
n X
m=0
|cm | ≤
n X i=0
|ai |
n X j=0
|bj | ≤
∞ X i=0
|ai |
∞ X j=0
|bj |
beschr¨ankt bleiben, da das Dreieck im Schema oben weniger Eintr¨age als das Quadrat besitzt und die urspr¨ unglichen Reihen absolut konvergieren. Offenbar ist die Folge der Tn auch monoton wachsend; siePbesitzt daher nach Satz 5.10 ∞ einen Grenzwert. Dies bedeutet, dass die Reihe m=0 cm absolut konvergiert, das Cauchyprodukt also existiert. Es bleibt zu zeigen, dass es mit dem Produkt der Reihen u ur die Partialsummen gilt ¨bereinstimmt. F¨ ∞ n n n X X X X cm , cm ≤ bj − ai Pn − Sn = i=0
j=0
m=0
m=n+1
da die Differenz offenbar durch die Summe der Terme ab Diagonale mit Nummer n + 1 abgesch¨ atzt werden kann. Letztere Summe ist allerdings P∞ nichts anderes als die Differenz der Partialsumme Sn zum Reihenwert m=0 cm und konvergiert daher gegen Null. Damit ist die Aussage des Satzes bewiesen. ⊓ ⊔
C.3 Die Exponentialreihe
309
Wir definieren nun ∞ X xm E(x) = , m! m=0
n X xm En (x) = . m! m=0
Die Konvergenz der Reihe wurde f¨ ur x = 1 in Beispiel 5.24 und f¨ ur x = 2 in ¨ Ubung 14 aus Kapitel 5 gezeigt. Die absolute Konvergenz f¨ ur beliebige x ∈ R kann entweder analog oder unter Zuhilfenahme des Quotientenkriteriums ¨ gezeigt werden (Ubung 15 aus Kapitel 5). Variiert x in einem beschr¨ankten Intervall I = [−R, R], so konvergiert die Folge der Partialsummen En (x) dort gleichm¨aßig gegen E(x), da die im Intervall [−R, R] gleichm¨aßige Absch¨atzung ∞ ∞ X X xm Rm →0 E(x) − En (x) = ≤ m! m=n+1 m! m=n+1 vorliegt. Aus Satz C.6 folgt daher, dass die Summenfunktion x 7→ E(x) stetig ist.
Zur Herleitung der Produktformel E(x)E(y) = E(x + y) erinnern wir an die binomische Formel: m X m! m k m−k m m , x y mit (x + y) = = k k k!(m − k)! k=0
g¨ ultig f¨ ur beliebige x, y ∈ R und n ∈ N, siehe etwa [2, Kap. 1.2.7]. Satz C.11 F¨ ur beliebige x, y ∈ R gilt ∞ ∞ ∞ X X xi X y j (x + y)m = . i! j=0 j! m! m=0 i=0
Beweis: Wegen der absoluten Konvergenz der beteiligten Reihen gilt nach Satz C.10: m ∞ ∞ X ∞ X X xk y m−k xi X y j = . i! j=0 j! k! (m − k)! m=0 i=0 k=0
Nach der binomischen Formel ist
m m X xk y m−k 1 X m k m−k 1 = (x + y)m , x y = k k! (m − k)! m! m!
k=0
k=0
womit alles bewiesen ist.
⊓ ⊔
Satz C.12 (Reihendarstellung der Exponentialfunktion) Die Exponentialfunktion besitzt die f¨ ur beliebige x ∈ R g¨ ultige Reihendarstellung ex =
∞ X xm . m! m=0
310
C Anhang: Erg¨ anzungen zur Stetigkeit
Beweis: Offenbar gilt nach Definition der Zahl e (Beispiel 5.24) e0 = 1 = E(0),
e1 = e = E(1).
Aus Satz C.11 folgt insbesondere e2 = e1+1 = e1 e1 = E(1)E(1) = E(1 + 1) = E(2) und weiter schrittweise em = E(m)
f¨ ur m ∈ N.
Aus E(m)E(−m) = E(m − m) = E(0) = 1 folgt weiter
1 1 = = E(−m). m e E(m) n Ebenso schließt man aus der Beziehung E(1/n) = E(1), dass gilt: p √ e1/n = n e = n E(1) = E(1/n). e−m =
Zusammenfassend ergibt sich aus dem Bisherigen, dass ex = E(x) f¨ ur alle rationalen x = m/n erf¨ ullt ist. Wir wissen aus Anwendung C.7, dass die Exponentialfunktion x 7→ ex stetig ist. Die Stetigkeit der Funktion x 7→ E(x) wurde oben gezeigt. Zwei stetige Funktionen, die auf allen rationalen Zahlen u ¨bereinstimmen, sind aber u ¨berall gleich. Ist genauer x ∈ R und xj die an der j-ten Stelle abgeschnittene Dezimalentwicklung von x, so folgt aus der Stetigkeit: ex = lim exj = lim E(xj ) = E(x), j→∞
j→∞
und dies ist das gew¨ unschte Ergebnis.
⊓ ⊔
Bemerkung C.13 Die l¨ uckenlose Einf¨ uhrung der Exponentialfunktion ist erstaunlich aufw¨andig und wird in verschiedenen Lehrb¨ uchern unterschiedlich gehandhabt, wobei der Gesamtaufwand in allen Zug¨angen ungef¨ahr gleich ist. Wir beschreiten folgenden Weg: Definition der Euler’schen Zahl e als konvergente Reihe (Beispiel 5.24); Definition der Exponentialfunktion x 7→ ex f¨ ur x ∈ R unter Ausnutzung der Vollst¨andigkeit der reellen Zahlen (Anwendung 5.14); Stetigkeit der Exponentialfunktion mittels gleichm¨aßiger Konvergenz (Anwendung C.7); Reihendarstellung (Satz C.12); Differenzierbarkeit und Berechnung der Ableitung (Abschnitt 7.2). Schließlich ergibt sich im Zuge n der Berechnung der Ableitung die bekannte Formel e = limn→∞ (1 + 1/n) , die Euler selbst zur Definition der Zahl e verwendet hat.
C.4 Lipschitz- und gleichm¨ aßige Stetigkeit In den Anwendungen auf Kurven und Differentialgleichungen werden Verfeinerungen der Stetigkeitseigenschaft ben¨otigt, genauer, Methoden der Quantifizierung, wie sich die Funktionswerte in Abh¨angigkeit von den Eingangswerten ¨andern.
C.4 Lipschitz- und gleichm¨ aßige Stetigkeit
311
Definition C.14 Eine Funktion f : D ⊂ R → R heißt Lipschitz-stetig, wenn es eine Konstante L > 0 gibt, sodass f¨ ur alle x1 , x2 ∈ D die Ungleichung |f (x1 ) − f (x2 )| ≤ L|x1 − x2 | erf¨ ullt ist. Man nennt L eine Lipschitz-Konstante der Funktion f . Ist x ∈ D und (xn )n≥1 eine Folge von Punkten in D, die gegen x konvergiert, so folgt |f (x) − f (xn )| ≤ L|x − xn |, das heißt f (xn ) → f (x) f¨ ur n → ∞. Jede Lipschitz-stetige Funktion ist somit stetig. F¨ ur Lipschitz-stetige Funktionen ¨ kann quantifiziert werden, wie groß die Anderung der x-Werte sein darf, um ¨ eine Anderung der Funktionswerte von h¨ ochstens ε > 0 zu erzielen: |x1 − x2 | < ε/L
⇒
|f (x1 ) − f (x2 )| < ε.
Gelegentlich wird die folgende schw¨ achere Quantifizierung ben¨otigt. Definition C.15 Eine Funktion f : D ⊂ R → R heißt gleichm¨ aßig stetig, wenn es eine Abbildung ω : (0, 1] → (0, 1] : ε 7→ ω(ε) gibt, sodass f¨ ur alle x1 , x2 ∈ D gilt: |x1 − x2 | < ω(ε)
⇒
|f (x1 ) − f (x2 )| < ε.
Man nennt die Abbildung ω einen Stetigkeitsmodul der Funktion f . Jede Lipschitz-stetige Funktion ist gleichm¨ aßig stetig (mit ω(ε) = ε/L), jede gleichm¨aßig stetige Funktion ist stetig. Beispiel C.16 (a) Die Quadratfunktion f (x) = x2 ist auf jedem beschr¨ankten Intervall [a, b] Lipschitz-stetig. F¨ ur x1 ∈ [a, b] ist n¨amlich |x1 | ≤ M = max(|a|, |b|) und ebenso f¨ ur x2 . Somit gilt |f (x1 ) − f (x2 )| = |x21 − x22 | = |x1 + x2 ||x1 − x2 | ≤ 2M |x1 − x2 | f¨ ur alle x1 , x2 ∈ [a, b].
(b) Die Betragsfunktion f (x) = |x| ist auf D = R Lipschitz-stetig (mit Lipschitz-Konstante L = 1). Es gilt n¨ amlich f¨ ur alle x1 , x2 ∈ R: |x1 | − |x2 | ≤ |x1 − x2 |. √ (c) Die Wurzelfunktion f (x) = x ist auf dem Intervall [0, 1] gleichm¨aßig stetig, aber nicht Lipschitz-stetig. Es ist n¨amlich f¨ ur alle x1 , x2 ∈ [0, 1] p √ x1 − √x2 ≤ |x1 − x2 |,
wie man durch Ausquadrieren sofort sieht. Somit ist ω(ε) = ε2 ein Stetigkeitsmodul der Wurzelfunktion auf dem Intervall [0, 1]. Lipschitz-Stetigkeit liegt nicht vor, da sonst (mit x2 = 0) die Beziehung
312
C Anhang: Erg¨ anzungen zur Stetigkeit
√
x1 ≤ L|x1 |,
also
1 √ ≤L x1
f¨ ur ein gewisses festes L > 0 und alle x1 ∈ (0, 1] erf¨ ullt sein m¨ usste, was offensichtlich f¨ ur x1 → 0 unm¨oglich ist.
(d) Die Funktion f (x) = x1 ist auf dem Intervall (0, 1) stetig, aber nicht gleichm¨aßig stetig. Nehmen wir an, es g¨abe einen Stetigkeitsmodul ε 7→ ω(ε) auf (0, 1). F¨ ur x1 = 2εω(ε), x2 = εω(ε) und ε < 1 gilt dann |x1 − x2 | < ω(ε), aber 1 1 − 1 = x2 − x1 = εω(ε) = x1 2 2 x2 x1 x2 2ε ω(ε) 2εω(ε)
und dies wird f¨ ur ε → 0 sogar beliebig groß, kann also insbesondere nicht durch ε von oben abgesch¨atzt werden.
Es folgt aus dem Mittelwertsatz der Differentialrechnung (Satz 8.4), dass differenzierbare Funktionen mit beschr¨ankter Ableitung Lipschitz-stetig sind. Ferner kann gezeigt werden, dass jede auf einem abgeschlossenen, beschr¨ankten Intervall [a, b] stetige Funktion dort gleichm¨aßig stetig ist. Zum Beweis ben¨otigt man weiter f¨ uhrende Hilfsmittel, f¨ ur die wir etwa auf [2, Kap. 2.6.4, Satz 6.5] verweisen. Neben dem Zwischenwertsatz ist der Fixpunktsatz ein wichtiges Hilfsmittel, um die Existenz von L¨osungen von Gleichungen zu beweisen. Zudem erh¨alt man eine algorithmische Methode, den Fixpunkt mit Hilfe eines Iterationsverfahrens n¨aherungsweise zu berechnen. Definition C.17 Eine Lipschitz-stetige Abbildung f eines Intervalls I nach R heißt Kontraktion, wenn f (I) ⊂ I gilt und sie eine Lipschitz-Konstante L < 1 besitzt. Ein x∗ ∈ I mit x∗ = f (x∗ ) heißt Fixpunkt der Funktion f . Satz C.18 (Fixpunktsatz) Eine Kontraktion f eines abgeschlossenen Intervalls [a, b] besitzt genau einen Fixpunkt. Die durch das Iterationsverfahren xn+1 = f (xn ) rekursiv definierte Folge konvergiert f¨ ur beliebige Startwerte x1 ∈ [a, b] stets gegen den Fixpunkt x∗ . Beweis: Wegen f ([a, b]) ⊂ [a, b] muss gelten: a ≤ f (a)
und f (b) ≤ b.
Falls nicht schon a = f (a) oder b = f (b) ist, ergibt der Zwischenwertsatz, angewendet auf die Funktion g(x) = x−f (x), dass ein x∗ ∈ (a, b) existiert mit g(x∗ ) = 0. Dies ist ein Fixpunkt der Funktion f . Die Existenz eines weiteren Fixpunkts y ∗ h¨atte wegen der Kontraktionseigenschaft zur Folge, dass
C.4 Lipschitz- und gleichm¨ aßige Stetigkeit
313
|x∗ − y ∗ | = |f (x∗ ) − f (y ∗ )| ≤ L|x∗ − y ∗ | < |x∗ − y ∗ |
w¨ are, was f¨ ur x∗ 6= y ∗ unm¨ oglich ist. Also ist der Fixpunkt eindeutig.
Die Konvergenz des Iterationsverfahrens folgt aus der G¨ ultigkeit der Ungleichungen |x∗ − xn+1 | = |f (x∗ ) − f (xn )| ≤ L|x∗ − xn | ≤ . . . ≤ Ln |x∗ − x1 |, da |x∗ − x1 | ≤ b − a und limn→∞ Ln = 0 ist.
⊓ ⊔
D Beschreibung der beiliegenden CD-ROM
F¨ ur uns stellt das Verwenden und Erstellen von Software einen integralen Bestandteil einer Analysisvorlesung im Informatikstudium dar. Die dem Buch beiliegende CD-ROM enth¨ alt die von uns f¨ ur das Buch erstellte Software. Es handelt sich dabei um die im Text besprochenen Java-Applets sowie um einige Quelldateien in den Programmiersprachen maple und MATLAB. Weiters enth¨ alt die CD-ROM die im Buch verwendeten Teile der Web-Plattform mathe online. Zur Ausf¨ uhrung der maple und MATLAB -Programme sind entsprechende Lizenzen n¨ otig. Die Verwendung der Java-Applets erfordert einen Java-f¨ ahigen Browser. Wir stellen dazu auf der CD-ROM Java-Plugins von Sun Microsystems f¨ ur einige g¨ angige Betriebssysteme (Linux, Mac OS X, Solaris, Windows) zur Verf¨ ugung.
D.1 Java-Applets In den Jahren 2002–2004 entwickelten wir zusammen mit Markus Unterweger eine Reihe von Java-Applets mit Bezug zur Analysis. Das Projekt fand im Rahmen von mathe online statt und wurde vom ¨osterreichischen Bundesministerium f¨ ur Bildung, Wissenschaft und Kultur gef¨ordert. Die aktuelle Version der Applets befindet sich auf der CD-ROM, die jeweils neueste Version und weitere Applets finden Sie im Internet unter http://www.uibk.ac.at/mathematik/applets Als Einstieg f¨ ur unsere Applets empfehlen wir auf der CD-ROM die Seite index.html im Unterverzeichnis applets. Eine Aufstellung der verf¨ ugbaren Applets gibt Tabelle D.1. Diese befinden sich in den entsprechenden Unterverzeichnissen. Wir verwenden JavaScript sowohl zum Aufbau unserer Web-Seiten als auch zum Starten der Applets in einem eigenen Fenster. Um unsere Seiten sinnvoll benutzen zu k¨onnen, muss in Ihrem Browser JavaScript aktiviert sein. Zum Ausf¨ uhren der Applets brauchen Sie zudem ein Java-Plugin von Sun Microsystems der Mindestversion 1.3.1, vgl. auch Abschnitt D.4.
316
D Beschreibung der beiliegenden CD-ROM Tabelle D.1. Liste der verf¨ ugbaren Java-Applets. Dateiname
Name des Applets
folgen.jar komplex2d.jar komplex3d.jar bisektion.jar zwsatz.jar newton.jar riemann.jar integration.jar kurven2d.jar kurven3d.jar flaechen3d.jar dgl2d.jar ode3d.jar regression.jar
Folgen 2D-Visualisierung komplexer Funktionen 3D-Visualisierung komplexer Funktionen Bisektionsverfahren Animation zum Zwischenwertsatz Newtonverfahren Riemann-Summen Integration Parametrische Kurven in der Ebene Parametrische Kurven im Raum Fl¨ achen im Raum Dynamische Systeme in der Ebene Dynamische Systeme im Raum Lineare Regression
D.2 Source codes in MATLAB und maple Im Verzeichnis eigene Programme finden Sie die im Text besprochenen maple und MATLAB-Programme, aufgeteilt auf die Unterverzeichnisse maple und matlab. Die Programme sind den einzelnen Kapiteln entsprechend numme¨ riert und finden vor allem bei Experimenten und Ubungsaufgaben Verwendung. Zum Ausf¨ uhren der Programme ben¨otigen Sie die entsprechende kostenpflichtige Software.
D.3 Die Galerie von mathe-online Die Galerie in mathe online besteht aus interaktiven multimedialen Lernhilfen zu verschiedenen Themenbereichen. Technisch gesehen handelt es sich vielfach um Java-Applets. Die Galerie befindet sich seit M¨arz 1998 im Aufbau und ist u ur uns ¨ber die Adresse http://www.mathe-online.at zu erreichen. Die f¨ relevanten Teile finden Sie auf der CD-ROM im Verzeichnis galerie. Wir danken den Initiatoren und Leitern von mathe online, Franz Embacher und Petra Oberhuemer, f¨ ur die Genehmigung, dieses im Internet frei zug¨angliche Material auch auf der CD-ROM zur Verf¨ ugung stellen zu d¨ urfen. Wir verwenden die Elemente der Galerie vor allem in Experimenten und ¨ Ubungen.
D.4 Kurzanleitung zur Installation der Java-Plugins
317
D.4 Kurzanleitung zur Installation der Java-Plugins Bevor Sie die Applets starten k¨ onnen, m¨ ussen Sie auf Ihrem Rechner eine aktuelle Version (mindestens 1.3.1) des Java-Runtime-Environments installieren. In Windows f¨ uhren sie die Exe-Datei mit Administratorrechten aus. Unter Solaris und Linux starten sie das f¨ ur Ihr System vorgesehene Installationsskript mit dem Befehl sh skriptname. Je nach verwendetem Betriebssystem und Web-Browser ist die Java-Unterst¨ utzung in den Browser-Einstellungen zu aktivieren. Die entsprechenden Plugins finden Sie im Verzeichnis source unserer CD-ROM, neuere Versionen auf der Web-Seite von Sun Microsystems.
Literaturverzeichnis
Lehrb¨ ucher [1] E. Hairer, G. Wanner: Analysis by Its History. Springer-Verlag, New York 1996. [2] K. Meyberg, P. Vachenauer: H¨ohere Mathematik I. Springer-Verlag, Berlin 1998 (4. Auflage). [3] K. Meyberg, P. Vachenauer: H¨ohere Mathematik II. SpringerVerlag, Berlin 1995 (3. Auflage). [4] W. Walter: Analysis 1. Springer-Verlag, Berlin 2001 (6. Auflage). [5] W. Walter: Analysis 2. Springer-Verlag, Berlin 2002 (5. Auflage).
Weiterf¨ uhrende Literatur [6] B. Anger, H. Bauer: Mehrdimensionale Integration. Walter de Gruyter, Berlin 1975. [7] M. Barnsley: Fractals everywhere, Academic Press, Boston 1988. [8] M. Braun, C.C. Coleman, D.A. Drew (Eds.): Differential Equation Models. Springer-Verlag, Berlin 1983. [9] M. Bronstein: Symbolic Integration I: Transcendental Functions. Springer-Verlag, Berlin 1997. [10] A. Chevan, M. Sutherland: Hierarchical partitioning. The American Statistician 45 (1991), 90–96. [11] J.P. Eckmann: Savez-vous r´esoudre z 3 = 1? La Recherche 14 (1983), 260–262. [12] N. Fickel: Partition of the coefficient of determination in multiple regression. In: K. Inderfurth (Ed.), Operations Research Proceedings 1999. Springer-Verlag, Berlin 2000, 154–159.
320
Literaturverzeichnis
[13] E. Hairer, Ch. Lubich, G. Wanner: Geometric Numerical Integration. Structure Preserving Algorithms for Ordinary Differential Equations. Springer-Verlag, Berlin 2002. [14] E. Hairer, S.P. Nørsett, G. Wanner: Solving Ordinary Differential Equations I. Nonstiff Problems. Springer-Verlag, Berlin 1993 (2. Auflage). [15] E. Hairer, G. Wanner: Solving Ordinary Differential Equations II. Stiff and Differential-Algebraic Problems. Springer-Verlag, Berlin 1996 (2. Auflage). [16] M.W. Hirsch, S. Smale: Differential Equations, Dynamical Systems, and Linear Algebra. Academic Press, New York 1974. [17] W. Kruskal: Relative importance by averaging over orderings. The American Statistician 41 (1987), 6–10. [18] E. Kreyszig: Statistische Methoden und ihre Anwendungen. Vandenhoeck & Ruprecht, G¨ ottingen 1968 (3. Auflage). [19] D.C. Montgomery, E.A. Peck, G.G. Vining: Introduction to Linear Regression Analysis. John Wiley & Sons, New York 2001 (3. Auflage). [20] M.L. Overton: Numerical Computing with IEEE Floating Point Arithmetic. SIAM, Philadelphia 2001. [21] H.-O. Peitgen, H. J¨ urgens, D. Saupe: Bausteine des Chaos, Fraktale. Springer-Verlag, Berlin 1992. [22] H.-O. Peitgen, H. J¨ urgens, D. Saupe: Chaos, Bausteine der Ordnung. Springer-Verlag, Berlin 1994. [23] M. Richter: Ideale Punkte, Monaden und Nichtstandard-Methoden. Vieweg, Braunschweig/Wiesbaden 1982. [24] H. Rommelfanger: Differenzen- und Differentialgleichungen. Bibliographisches Institut, Mannheim 1977. [25] H.R. Schwarz: Numerische Mathematik. Teubner, Stuttgart 1993 (3. Auflage). ¨ [26] STATISTIK AUSTRIA: Statistisches Jahrbuch Osterreichs. Verlag ¨ Osterreich GmbH, Wien 2007. (http://www.statistik.at) ¨ [27] Ch. Uberhuber: Computer-Numerik 1. Springer-Verlag, Berlin 1995.
Sachverzeichnis
Abbildung lineare, 294 partielle, 182 Ableitung einer reellen Funktion, 73 Fr´echet-, 188 h¨ ohere, 76 h¨ ohere partielle, 186 numerische, 84 partielle, 184 Richtungs-, 192 Tabelle, 84 totale, 188, 203 zweite, 76 Ableitungsregeln, 79 Kettenregel, 81 Linearit¨ at, 79 Produktregel, 80 Quotientenregel, 80 Umkehrregel, 82 Achter, 176 ¨ Anderungsrate, 78, 245 Anfangswertaufgabe, 243 Anfangswertproblem, 243 Differentialgleichungssystem, 261 ANOVA, 229 Anstieg steilster, 193 Approximation lineare, 78, 190 quadratische, 194 Arcuscosinus, 31 Ableitung, 83
Arcussinus, 30 Ableitung, 83 Arcustangens, 31 Ableitung, 83 Arithmetik reeller Zahlen, 50 Bereichsintegral, 211 Transformationsformel, 219 Beschleunigung, 79 Beschleunigungsvektor, 167, 177 beste Gerade, 224 durch Ursprung, 101 Bestimmtheitsmaß, 231 multiples, 235 partielles, 236 Betragsfunktion, 19 Bev¨ olkerungsmodell, 246 Malthus’sches, 246 Verhulst’sches, 45, 246 Bildbereich echter, 14 Bildmenge, 14 Binomialformel, 309 Binormalenvektor, 177 Bisektionsverfahren, 68 Bogenl¨ ange, 171 Funktionsgraph, 140 Kurve, 171 Parametrisierung, 171 Bogenmaß, 28 Bolzano-Weierstraß Satz von, 57 Breitenkreis, 207
322
Sachverzeichnis
Cantor-Menge, 111 Cauchyprodukt, 308 Cavalieri Prinzip von, 212 Cosinus, 26 Ableitung, 74 Cosinus hyperbolicus, 165 Cotangens, 26 Darstellung halblogarithmische, 97 Definitionsbereich, 14 Determinante, 296 Diagonalmatrix, 295 Dichte, 216 Diffeomorphismus, 217 Differentialgleichung abh¨ angige Variable, 241 Anfangsbedingung, 243 autonome, 253 blow up, 249 Eindeutigkeit der L¨ osung, 250 Equilibrium, 253 Existenz der L¨ osung, 249 Gleichgewichtspunkt, 253 homogene, 243 inhomogene, 243 lineare, 243 L¨ osung, 241 partikul¨ are L¨ osung, 247 Potenzreihenansatz, 251 Richtungsfeld, 243 station¨ are L¨ osung, 247, 254 steife, 279 Trennung der Variablen, 242 unabh¨ angige Variable, 241 Differentialgleichungssystem autonomes, 259 Erhaltungsgr¨ oße, 268 Erstes Integral, 268 Invariante, 268 lineares, 258 L¨ osungskurve, 261 Lotka-Volterra, 258 nichtlineares, 258 Trajektorie, 261 Differenzenquotient, 72 einseitiger, 86 Genauigkeit, 151
symmetrischer, 86 differenzierbar, 73 komponentenweise, 202 nirgends, 76 partiell, 184 stetig partiell, 187 total, 188 Dimension Box-, 110 experimentelle Bestimmung, 110 fraktale, 109 Dirichlet’sche Sprungfunktion, 134 Doppelintegral, 211 Drehfl¨ ache, 206 Dreibein begleitendes, 177 Dreieck Fl¨ ache, 27 Hypotenuse, 25 Kathete, 25 Ebene Achsenabschnitt, 290 Anstiege, 290 Normalvektor, 291 Parameterform, 290 Ebenengleichung, 290 Eigenvektor, 298 Eigenwert, 298 Einheitskreis, 27 Einheitsmatrix, 295 Einheitsvektor, 284 Eisblume, 113 Ellipse, 165 Ellipsoid, 199 Entwicklungspunkt, 147, 149 eps, 10 Equilibrium, 261 asymptotisch stabiles, 254, 262 instabiles, 262 stabiles, 262 Erkl¨ arungsanteil mittlerer, 236 Euler’sche Formeln, 39 Euler’sche Zahl, 21, 54, 75, 147, 277 Eulerverfahren explizites, 276, 280 implizites, 278 modifiziertes, 281
Sachverzeichnis Stabilit¨ at, 278 Exponentialfunktion, 20, 51 Ableitung, 74, 83 komplexe, 38 Reihendarstellung, 309 Taylorpolynom, 147 Exponentialintegral, 127 Extremum, 195 Extremwertaufgabe, 95 Extremwerttest, 150 Fehlerquadrat, 102 Fixpunkt, 312 Fl¨ ache Dreh-, 206 im Raum, 181 Tangentenvektor, 185 Fl¨ achenelement, 215 Fl¨ achenst¨ uck regul¨ ares, 206 Folge beschr¨ ankte, 45 geometrische, 48 gleichm¨ aßig konvergente, 305 Grenzwert, 47 H¨ aufungswert, 55 in zwei Ver¨ anderlichen, 183 komplexwertige, 44 konvergente, 47 Limes, 47 monoton fallende, 45 monoton wachsende, 45 reellwertige, 44 sesshafte, 46 unendliche, 43 Formel binomische, 309 Formfunktion, 224 Fraktal, 107 Fubini Satz von, 212 Funktion Ableitung, 73 bijektive, 15 differenzierbare, 73 elementare, 126 Graph, 14 Hintereinanderausf¨ uhrung, 80 injektive, 15
Komposition, 80 konkave, 94 konvexe, 94 Kr¨ ummungsverhalten, 94 lineare, 17 lineare Approximation, 78 monoton fallende, 93 monoton wachsende, 93 nirgends differenzierbare, 76 reellwertige, 14 Schachtelung, 80 Steigungsverhalten, 94 stetige, 62 streng monoton wachsende, 93 st¨ uckweise stetige, 135 surjektive, 15 Tangente, 77 trigonometrische, 25 vektorwertige, 201 Verkettung, 80 zyklometrische, 30 Funktionenfolge gleichm¨ aßig konvergente, 305 punktweise konvergente, 304 Gauß’sche Fehlerfunktion, 127 Gerade Achsenabschnitt, 17, 289 Anstieg, 17, 289 im Raum, 291 Normalvektor, 290 Parameterform, 289 Steigung, 27 Geradengleichung, 289 Gesamtvariabilit¨ at, 229 Geschwindigkeit, 78 Durchschnitts-, 71 Momentan-, 72, 79 Geschwindigkeitsvektor, 167, 176 Gitter, 209 Feinheit, 210 Gitterpunkte, 153 Gleichgewichtspunkt, 261 asymptotisch stabiler, 254, 262 instabiler, 262 stabiler, 262 gleichm¨ aßig konvergent, 305 gleichm¨ aßig stetig, 311 Gleichung
323
324
Sachverzeichnis
charakteristische, 298 Gleitpunktzahlen, 8 gr¨ oßte, 9 kleinste, 9 normalisierte, 8 Gradient, 192, 201 geometrische Interpretation, 193 Graph, 181 Tangentialebene, 191 Grenzfunktion, 305 Grenzwert Berechnung mit Taylorformel, 150 einer Folge, 47 einer Funktion, 61 einer Funktionenfolge, 305 linksseitiger, 62 rechtsseitiger, 62 uneigentlicher, 48 H¨ aufungswert einer Folge, 55 Halbstrahl, 165 Halbwertszeit, 246 Hauptnormalenvektor, 177 Hauptwert Argument, 37 Logarithmus, 40 Wurzel, 41 Herzlinie, 176 Hessematrix, 194 Hyperbel, 165 Hyperbelfunktion, 165 Hyperboloid, 199 Indikatorfunktion, 20, 213 Infimum, 46 Integral Bereichs-, 211 bestimmtes, 133 Doppel-, 211 Erstes, 268 Fresnel’sches, 127 iteriertes, 211 unbestimmtes, 124 Integrallogarithmus, 127 Integralsinus, 127 Integration mittels Substitution, 127 partielle, 127
symbolische, 127 Integrationsregeln, 127 Integrationsvariable, 135 integrierbar nicht elementar, 127, 151 Riemann-, 133, 211 Intervall, 6 uneigentliches, 7 Inverse einer Matrix, 296 Iterationsverfahren, 312 Jacobimatrix, 188, 202 Julia-Menge, 115 Kardioide, 176 Kettenregel, 190 Klothoide, 173 Koch’sche Eisblume, 113, 120, 169 Koeffizientenvergleich, 252 komplexe Funktion, 39 komplexe Zahl, 35 Argument, 37 Betrag, 36 Imagin¨ arteil, 36 konjugierte, 36 Polardarstellung, 37 Realteil, 36 Wurzel, 37, 39 Konstantentheorem, 123 Kontraktion, 312 Konvergenz lineare, 97 Newtonverfahren, 98 quadratische, 97 Konvergenzordnung, 97 Koordinaten eines Punkts, 283 eines Vektors, 285 Koordinatensystem kartesisches, 283 Kreuzprodukt, 288 Kr¨ ummung differenzierbare Kurve, 172 Funktionsgraph, 173 Kurve, 161 algebraische, 164 Bogenl¨ ange, 171 differenzierbare, 165, 176
Sachverzeichnis ebene, 163 Kr¨ ummung, 172 L¨ angenmessung, 169 Parameterwechsel, 163 parametrisierte, 161 r¨ aumliche, 176 rektifizierbare, 169 Umparametrisierung, 163 Kurvendiskussion, 95 Kurvenparameter, 161 L-System, 118 L¨ ange differenzierbare Kurve, 170 Kreisbogen, 171 rektifizierbare Kurve, 169 L¨ angenkreis, 207 Lebesgueintegral, 219 Lemniskate, 176 Limes, 47 inferior, 57 superior, 57 Lipschitz-Bedingung, 250 Lipschitz-Konstante, 250, 311 Lipschitz-Stetigkeit, 311 Lissajous-Figur, 178 Logarithmus, 21 komplexer, 40 nat¨ urlicher, 21 Logarithmusfunktion Ableitung, 83 Lotka-Volterra-Modell, 267, 281 Majorante, 54 Majorantenkriterium, 54 Mandelbrot-Menge, 114 Mantelfl¨ ache Drehk¨ orper, 141 Kreiskegel, 141 Maschinengenauigkeit, 10 Masse, 216 Matrix, 293 ahnliche, 298 ¨ Determinante, 296 Diagonalelemente, 295 Eintrag, 293 Element, 293 inverse, 296 invertierbare, 296
325
Jordan’sche Normalform, 297 Koeffizient, 293 nilpotente, 300 Produkt mit Matrix, 295 Produkt mit Vektor, 294 quadratische, 293 regul¨ are, 296 transponierte, 294 Matrixprodukt, 295 Maximalstelle, 92, 150 Maximum, 46, 195, 197 globales, 91 lokales, 91 striktes, 92 Menge abgeschlossene, 108 beschr¨ ankte, 108 Cantor-, 111 innerer Punkt, 108 Julia-, 115 M¨ achtigkeit, 2 Mandelbrot-, 114 offene, 108 Rand, 108 Randpunkt, 108 ¨ Uberdeckung, 109 messbar, 213 Minimalstelle, 92, 150 Minimum, 46, 92, 195, 197 Minorante, 54 Minorantenkriterium, 54 Mittelwertsatz, 93 Modell lineares, 224, 233 Moment statisches, 216 Monotonie Folge, 45 Funktion, 93 Newtonverfahren, 97 in C, 117 lokal quadratische Konvergenz, 98, 204 mehrere Ver¨ anderliche, 203 Nichtstandard-Analysis, 135 Niveaulinie, 182 Normalbereich, 214 Normalgleichungen, 226
326
Sachverzeichnis
Normalvektor Kurven-, 167 Nullfolge, 61 Nullmatrix, 295 Nullmenge, 213 Optimierungsaufgabe, 95 Orbit periodischer, 269 Ordnungsrelation, 5 Eigenschaften, 5 Rechenregeln, 6 Ortsvektor, 285 Parabel Neil’sche, 164 quadratische, 18 Paraboloid elliptisches, 183 hyperbolisches, 183 Parallelogrammregel, 284 Parameterdarstellung Ellipse, 165 Gerade, 165 Halbstrahl, 165 Hyperbel, 165 in Polarkoordinaten, 174 Kardioide, 176 Klothoide, 173 Kreis, 162 Lemniskate, 176 Schleifen, 175 Schraubenlinie, 177 Spiralen, 175 Zykloide, 166 Parameterlinie, 182, 205 Partialsumme, 52 Pendel mathematisches, 270 Pflanzen Wachstum, 120 zuf¨ allige, 121 Polarkoordinaten, 32, 203 Potenzfunktion, 18 Ableitung, 83 Produktformel Cauchy-, 308 Punktraum, 286
Quadratfunktion, 14 Ableitung, 74 komplexe, 39 Quadraturformel, 155 Aufwand, 158 Fehler, 159 Gauß’sche, 157 Gewichte, 155 Knoten, 155 Ordnung, 155 Ordnungsbedingungen, 156 Ordnungsreduktion, 159 Simpsonregel, 154 Stufen, 155 Trapezregel, 153 Quotientenkriterium, 60 Radioaktiver Zerfall, 246 Raum-Zeit-Diagramm, 259 Raumkurve, 176 Normalebene, 177 parametrisierte, 176 Rauschen, 87 Rechtsschraubregel, 283 Rechtssystem, 283 Regression einfache lineare, 224 lineare, 224 loglineare, 225 mehrfache lineare, 233 multiple lineare, 233 multivariate lineare, 233 univariate lineare, 224 Regressionsgerade, 224 durch Ursprung, 101 gesch¨ atzte, 227 Reihe, 52 absolut konvergente, 307 Cauchyprodukt, 308 divergente, 52 geometrische, 52 harmonische, 53 konvergente, 52 Partialsumme, 52 rektifizierbar, 169 Residuum, 227 Restglied, 145 Richtungsableitung, 192 Richtungsfeld, 243
Sachverzeichnis Riemannintegral, 133, 212 Riemannsumme, 133, 210 Rundung, 10 Rundungsfehler, 86 Sattelfl¨ ache, 183 Sattelpunkt, 197 Differentialgleichungssystem, 263 Schleife, 175 Schnittkurve, 182 Schraubenlinie, 177 Schrittweite, 276 Schwerpunkt, 216 geometrischer, 217 Sekante, 72 Sekantenverfahren, 101 Signumfunktion, 20 Simpsonregel, 154 Sinus, 26 Sinus hyperbolicus, 165 Sinusfunktion Ableitung, 74 Taylorpolynom, 148 Taylorreihe, 149 Skalarmultiplikation, 284 Skalarprodukt, 286 Spaltenvektoren, 293 Spatprodukt, 297 Spirale, 175 Archimedische, 175 hyperbolische, 175 logarithmische, 175 Spitzpunkt, 164 Stammfunktion, 124 Standardbasis, 284 station¨ arer Punkt, 92, 196 Stetigkeit, 62, 183 gleichm¨ aßige, 311 komponentenweise, 202 Lipschitz-, 311 Stetigkeitsmodul, 311 Strahlensatz, 26 St¨ utzstellen, 153 aquidistante, 135 ¨ Substitutionsregel, 127 Summenfunktion, 137 Superpositionsprinzip, 244 Supremum, 45
Tangens, 26 Ableitung, 80 Tangente, 72 Tangentenvektor, 167, 176 Tangentialebene, 191 Taylor Formel von, 145, 194 Satz von, 149 Taylorpolynom, 147 Taylorreihe, 149 Teilfolge, 56 Teleskopsumme, 53 Transformationsformel, 219 Transponierte einer Matrix, 294 Transportgleichung, 198 Trapezregel, 153 Umgebung, 46, 108 Umkehrfunktion, 16 Unendlich, 6 Ungleichung, 7 Variabilit¨ at durch Regression erkl¨ arte, 230 Gesamt-, 229 Rest-, 230 Varianzanalyse, 229 Varianzzerlegung, 230 sequentielle, 236 Variation der Konstanten, 247 Vektor, 284 außeres Produkt, 288 ¨ Betrag, 284 inneres Produkt, 286 Kreuzprodukt, 288 Norm, 284 orthogonaler, 286 Skalarprodukt, 286 Vektorfeld, 201 Vektorraum, 286 Verfahrensfehler, 85 Vollst¨ andigkeit, 2, 49 Volumen Kreiskegel, 140 Rotationsk¨ orper, 139 Vorzeichenfunktion, 20 W¨ armeleitungsgleichung, 198
327
328
Sachverzeichnis
Weg-Zeit-Diagramm, 125 Wendepunkt, 94 Winkel zwischen Vektoren, 286 Winkelfunktionen, 25 Additionstheorem, 30, 33 Wurzelfunktion, 19 Ableitung, 74 Zahlen ganze, 1 irrationale, 4 komplexe, 35
nat¨ urliche, 1 rationale, 1 reelle, 4 transzendente, 3 Zahlengerade, 2 Zeilenvektoren, 294 Zerlegung, 133 Feinheit, 133 Zweibein begleitendes, 167 Zwischenwertsatz, 67 Zykloide, 166